人工智能发展的三大因素
这节课我们来讲解人工智能的三大基础设施,数据、算法和算力。
在之前的文章中我们给大家科普了一个知识点,人工智能它在1956年的时候就出现了,到现在应该有七八十年的时间了。那为什么在这七八十年的时间里面,人工智能一直没有大火起来,直在2022年chat GPT3.5才立马火了起来。
在这人工智能发展的这几十年当中,有三个主要因素促使人工智能不断发展壮大。
第一个因素是数据。随着我们的传统互联网的发展,我们很多的数据行为被记录到了线上。比如说原有我们的生产行为,之前基本上都是在线下的,随着近些年的工业互联网的发展,我们可以把这些工业制造业的数据搬到线上来记录。这给机器学习提供了大量的养料。
第二个是算力。在这几年当中,随着从我们的个人电脑这种大规模计算的芯片到集成芯片中,这些集成芯片每年都有着非常大的突破和进步。集成芯片可以支持我们大数据的模型开发以及训练。
第三个就是算法。这些年当中不断的有数据科学家突破着我们对原有算法的认知,在进行新的算法迭代和改革。
通过数据、算力和算法三个最关键的因素,人工智能才能发展到现在这个非常让人惊讶的,让人惊奇的这个时代。
今天我们就站在PM的角度上来看一下关于人工智能领域下面的数据、算力和算法对于我们来说都需要了解哪些知识。
人工智能发展壮大,很多人可能会说算法。但是大家其实往往忽略了,算法不管是现在还是以前,都是一个有成熟的公式,是比较好突破的一件事情。相反的数据才是机器学习或人工智能最原始最基础的养料。
在未来的人工智能领域当中,比较有发展前途的有百度、阿里、字节等拥有大量数据的公司,他们这些大型公司才能够在这个领域下长期发展下去。
因为他们在用户数据上有过非常大的累积,这些数据可以被用于模型训练。而反观那些中小型的创业公司,为什么很多人都不看好?是因为他们拿不到更多的数据量,也就没有办法进行更好的模型训练。
所以我们才可以说在AI领域下,技术已经不是一个有很高门槛的事情。而数据却需要我们每一个公司长期去积累和挖掘。换句话说,在人工智能时代,掌握了数据的公司才能够在这个赛道当中脱颖而出。
我们先来深入的了解一下数据。数据对于一个人工智能产品来讲,我认为大的来看可以分为两个阶段。第一个就是数据收集和存储的阶段。第二个就是数据可以准备用于人工智能训练的阶段。
具体来看,其实又分为七个小的环节。
第一个我们要先将数据采集下来。
第二个我们将数据要进行评估,评估这个采集的数据是否真的可以被使用。
第三个,我们当评估了这个数据可用之后,我们要将这个数据进行清洗。清洗后的数据我们要将它进行存储。这几步我认为完成了一个数据的准备工作。
具体对于模型训练的准备工作,我们要针对存储上来的数据,根据我们训练的要求要对数据进行标注。标注好的数据,我们要去验证这个数据是否可用。然后验证之后我们要将数据分为训练集、测试集。
AI产品的数据采集
第一个,对于AI产品的数据采集来讲,软件产品的数据我们是直接通过数据库的接口来去读取数据,或者是通过爬虫来去读取一些数据。
而AI产品除了软件上的数据,还会涉及硬件产品的数据采集的工作。
所以我们来讲一下关于硬件产品跟软件产品有一个非常大的在数据上的区别。就是它具备一个传感器,传感器可以去收集硬件中的信息,并按照一定规律变换为电信号,这种电信号可以满足信息传输、处理、存储、显示、记录和控制。现有的采集器包括以下四种。
第一种就是生物感知器,可以固定生化成分或者生物体作为敏感元件的传感器,我们叫做生物传感器。比如说我们日常用的血糖检测仪,或者是我们的心率检测仪,或者是环境污染物当中的一些生物微生物检测仪,它都属于生物传感器。
第二个就是光敏传感器,用来感受周边的光线的,比较常见的如我们的手机摄像头的红外线,或者是我们现在的屏幕会根据周边的环境变亮或者是变暗,这种手机屏幕里面也会有光敏传感器。
第三个是声音传感器,就像我们手机里面的麦克风,它是用来接受声波,并且显示声音的振动图像并传输到我们的电脑当中,这就类似于我们人体器官中的耳朵。
第四个是我们的化学传感器,他可对我们的一些敏感的化学物质检测,它可以把浓度转化为电信号给我们的计算机、电脑。比如说像酒精传感器,我们开车的时候测酒驾的那个棒子,还有天然气、甲烷、氢气、空气质量检测仪,这些都大量应用了这种传感器。像我们现在用到的很多智能型产品,这些都大量的应用了这种传感器。
如果大家以后去做这种智能硬件跟AI相结合的产品,一定要实时的去调研现在市面上的各种传感器,如辅助驾驶里面的摄像头,它其实就用了视觉传感器,光传感器,还有我们的这个健康检测,它就是生物传感器,还有工业控制里面也大量用到了视觉传感器。
综上所述数据、算法和算力是推动人工智能发展的三大基础设施。理由是随着互联网的普及,大量数据被记录下来,为机器学习提供了丰富的养料。同时,不断突破和改进的算法为人工智能提供了更精确和高效的处理能力。而算力的提升则支持了大规模数据的处理和模型的训练。这三个因素相互关联、相互作用,共同推动了人工智能的快速发展,为我们带来了更多的创新和应用。
联系客服