打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
为什么要学数学?看完这篇,觉得智商都提高了!

本文是干货系列第二期,华为技术专家库俊国撰文,一起《聊聊AI和数学》,希望能给同学们启发。

一、前言

我大学本科学的是数学专业,工作后切换到计算机软件行业,最近又开始从事人工智能应用领域,深感做技术之难。借此文聊聊AI和数学的话题,分享一些感悟和体会,希望对学子们有些帮助。

我在从事互联网的中间件研发,屡屡在算法、架构设计和建模中体会到数学抽象思维的重要性2016年AlphaGo的横空出世,震惊世人。才发现数学基础不牢,概率论根本没有吃透,数学的重要性不言而喻。如何在有限的时间里掌握好数学中最有用的部分,有更多的运用呢?

二、AI与数学

AI的基础是算法,算法的基础是数学。目前火热的深度学习,离不开大学数学的三门基础学科:微积分、线性代数和概率统计。从数学角度看,神经网络是一种多层非线性变换。深度学习就是学习如何利用矩阵的线性变换加激活函数的非线性变换,来逐层提取我们需要的特征信息。将原始输入空间映射到线性可分/稀疏的空间去分类/回归。 通过增加网络的节点数来增加线性转换能力,通过增加层数即增加激活函数的次数,来增加非线性转换能力。数学对AI的意义可见一斑。

数学通常分为基础数学和应用数学。基础数学有几大分支:如代数、分析、几何和拓扑。它们有一个公共的基础: 集合论。集合的元素可以是数(实数、复数、四元数等),还可以是矩阵和函数。在上面赋予运算和距离后,就变成群、空间和流形。代数就是研究这些集合的结构和之间的映射,它不关心里面元素的类型,定义的是哪种运算。它研究不同集合的同态、同构和同胚。在这些结构上我们可以采用微分手段进行分析。这是数学家建立的第一层抽象,也是最基本的符号系统,学会使用字母和符号系统表达思维是做数学的基本功。

这里面有无数的概念和定理,无数的习题,我们无需深入钻研,知道哪些东西在哪里即可。推荐看一下伽罗瓦理论和群表示论因为它们深入到了现代科学的方方面面。如群表示论可以用来分析神经网络里参数的对称性。杨振宁从数学里得到的主要启发也是来自群论。

微积分作为最基本的数学工具,渗透到了数学各个分支中,无微积分不成数学。AI工程师不一定要会求解微分方程,能看懂常见的推导即可。深度学习会用到一些泛函和逼近论的知识。

矩阵也是一个基本工具,了解它的基本运算和数值计算,和一些适当的矩阵分解知识应该就能应对日常所需了。矩阵是一种具体数学,是向高维和抽象进攻的工具。AI的基本运算对象就是张量,其理论基础也在矩阵中。华罗庚把矩阵玩得炉火纯青,成为他解剖其它数学分支的解牛刀。如随机矩阵理论来刻画神经网络权值的谱分布。

几何和拓扑相对来说离AI远一点,但也是有关联的。利用微分几何流形来分析手写识别的数据,研究它从输入到输出之间的关系。还有专门研究对抗网络与流形关系也是一个方向。时不时翻一翻这方面的基础知识也是有帮助的。

再就是应用数学,包括概率统计、运筹优化、计算数学、控制论等,这是搞AI必备的理论知识,值得AI工程师反复品味。

三、华为与数学

华为非常重视对数学对各项ICT技术的推动作用。未来的数字世界流的数据大得不可想象,需要用数学的办法来解决这样一个大流量下的管理。在物理器件的性能越来越逼近极限的情况下,物理方法来解决问题已趋近饱和,需要借助于软件方法来实现性能的优化,要重视数学方法的突起。数据管道变粗、变快以后,关键是数学、物理等基础科学的能力。数学,是华为继续前行指路灯,也是华为真正的“硬核”实力。三流器件做一流产品,核心也是算法和数学上要有突破。

华为自研的Flex Erasure Coding编解码算法,在保持数据重构效率的基础上,重构带宽需求大幅度降低,极大地提升了故障时数据重构性能,有效地缩短了重构用时,保证数据的持久度和系统吞吐量。

此外,华为自研的数学优化求解器,通过并行计算、LU分解加速、预处理等核心关键技术突破,在供应链供需模拟等场景上,极大提升了性能,商用在机场和其它交通项目。这样的例子在华为各个产品线中还有很多,成为华为对数学投入的信心源泉。

四、学习建议

01

先面后点

先观其大略,再追寻细节。了解一下数学和AI的发展简史,如《古今数学思想》。数学学科之间是交叉的,互相印证的。多看看每个分支要解决哪些主要问题,从中也能发现自己的兴趣所在。数学和AI的理论学习很容易耗费大量的光阴。

一个省事的方法,只读结论和使用案例,略过繁琐的证明过程。在必要时再回过头来看细节。研究好的问题,阅读经典的论文,一个领域经典论文也就三五篇,可以参照着读。感觉费解时,把这个领域的同类著作找到,对照理解,常常能豁然开朗。

02

连点成线

乔布斯2005年在斯坦福大学演讲时,讲了三个故事,其中一个叫“Connecting the dots”,我很有同感,延伸一下:

👉你曾经学过的某个知识,当时看起来无用,日后在某个时间点突然派上用场,生发威力

👉将不同学科分支中的离散的问题连缀起来,可能就是一门新的理论

👉攻破一个系统靠一个漏洞还不行,通常需要挖掘到多个漏洞,把他们关联起来,才能成为一把完整的钥匙。解决一个问题通常是多个工具的组合,所以善于把看似不相关的东西连接起来,才能有所创新

03

问题驱动

中国人的学习方式是自下向上,外国人的学习方式是自顶向下。我们学习讲究先打好基础,一层层往上垒。老外则直接从问题出发,根据需要再去补基础。二者各有优劣,脱离学校后,问题驱动是一种有效的学习方式。

数学家也需要通过问题去驱动数学研究,太脱离实际就容易走错方向。希尔伯特抛出二十一个数学问题,养活了数学界一百多年。丘成桐做数学也不敢太抽象,他喜欢从实际物理应用中找问题。不求全面,先围绕某个问题展开研究,从而带动对相关知识的了解。

学习AI,可以用以点带面的方式展开,例如把维特比算法,快速傅里叶变换,分支定界算法,期望最大化算法(EM算法),Dijkstra算法,梯度下降,牛顿方法/LLL算法这些点一个个先啃下来,再把它们系统化。

五、十大数学问题

最后,给出华为发布的在后香农时代,信息产业面向数学的十大挑战问题,作为大家的思考课题。

1️⃣ 有损压缩的极限问题(语义信息论)

2️⃣ 突破信源编码理论,挑战无损信源压缩极限

3️⃣ 网络基本业务模型问题

4️⃣ Massive MIMO 容量域问题

5️⃣ 非线性信道补偿问题

6️⃣ 大规模通信网络的最优控制问题

7️⃣ 反问题高精度快速求解问题

8️⃣ 高性能的纠错码——代数几何(AG)码

9️⃣ 深度神经网络(DNN)的可解释性

🔟 网络级流量矩阵近似计算

六、结语

华为昇腾Atlas系列产品结合华为自研AI芯片,为AI提供算力支撑,提供了三种维度的计算能力(矩阵、向量、标量计算),为人工智能应用提供了全栈的解决方案。昇腾计算从下到上打造全场景Atlas(硬件)+CANN(算子库)&MindSpore(AI框架)+MindX(昇腾应用使能)产品,面向智能边缘和数据中心两大场景,同时依托MindStudio开发工具和昇腾开发者社区,构建和繁荣开发者生态。 

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
学习大数据,需要掌握哪些数学基础
计算机科学数学理论浅谈 www.ExamLink.com
零基础学AI,看完你就get了
人工智能的数学基础|AI基础
踏入AI领域,这些数学基础一定要打好
程序员转行人工智能的最大障碍是什么?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服