打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
黄铁军——电脑前传(4):控制

从生命起源开始控制就是其核心特征,工业革命开启了机器控制的广泛实践,但直到二战结束,控制论才正式登上历史舞台。维纳认为控制是系统与环境通过信息交换实现反馈从而调节自身行为的过程,阿什比把系统视为环境不可分割的一部分,适应环境导致学习发生和目的产生。作为探索复杂系统的基础学科,未来发展空间巨大。


编者按:《电脑前传》前三篇分别刊登于CCCF 2018年第12期(黄铁军:电脑前传(1):信息)、2019年第1期(黄铁军:电脑前传(2):计算)和第3期(黄铁军:电脑前传(3):逻辑),从思想史角度介绍了信息与信息论、计算与图灵机、逻辑与哥德尔定理,本篇主题是控制和控制论。

防空

1940年8月1日,希特勒命令纳粹空军“集中一切力量战胜英国空军”;9月,伦敦成为首要攻击目标;10月15~16日,德军派出235驾轰炸机,英军还击了8326枚高射炮弹,才取得击落两架、损伤两架德军轰炸机的战绩;整个12月,德军几乎每天狂轰乱炸,英军总共才击落14驾德军飞机,几乎纯粹靠运气。

不列颠空战让全世界意识到自动防空的重要性,大洋彼岸刚成立的美国国防研究委员会(National Defense Research Committee, NDRC)紧急寻找对策。1940年9月,麻省理工学院(MIT)的诺伯特·维纳(Norbert Wiener,1894—1964)写信表示希望“在紧急的情况下发挥自己的作用”,11月提出了一份4页的研究计划——“使用一种装置来探索预测在纯数学上的可能性”,该项研究将根据飞机前10秒的运动轨迹预测20秒后的位置。圣诞节前夕,NDRC批准了该项目,经费只有2325美元[1]。 

维纳聘任MIT电气工程与数学专业27岁的研究生朱利安·毕格罗(Julian Bigelow,1913—2003)为项目总工程师,而自己则从数学和统计的角度开展研究。1942年2月,维纳完成了题为“稳态时间序列的外插、内插和平滑”的研究报告,长达124页,用到了布朗运动、切萨罗部分求和、傅里叶积分、埃尔米特形式、勒贝格测度、帕塞瓦尔定理、泊松分布、施瓦尔兹不等式、斯蒂尔吉斯积分、外尔引理等,提出了稳态时间序列的预测模型,却没触及防空的基本需求:飞行轨迹是飞机和飞行员共同作用的结果,这个模型如何预测战斗中飞行员的行为?

毕格罗的工程实践也不顺利,“不管是飞行器实际空间中的轨迹,还是追踪装置的观测数据,我们所能获得的信息都非常少”。为了搜集相关数据,维纳和毕格罗开始频繁地拜访相关军事基地,这让本来就认为维纳纸上谈兵的NDRC大为光火[1]:“(维纳和毕格罗)兴高采烈地开始了一系列的军事基地拜访之旅,没有行程安排,没有任何授权……24小时内,我的办公室开始接到电报,想要知道这两个蠢人到底从哪儿冒出来的。”维纳的项目就此戛然而止。

在战争中真正发挥作用的是NDRC资助的工程项目,包括雷达、计算机和近发引信。特别是装在弹头上的近发引信,能够以1707赫兹的频率发射和接收信号,当炮弹接近敌机时,根据从敌机反射回来的信号判断距离,接近敌机时才爆炸——这实际上是一种具有反馈特性的闭环控制系统。凭借这些技术,盟军防空一改颓势,1944年7月,德军喷射推进式炸弹(世界上第一代巡航导弹)飞过英吉利海峡时,80%都被击落了。

纯粹从技术上讲,维纳的数学模型对付不了有人驾驶的飞机,却能对付无人驾驶的导弹,可惜的是,直到二战结束,维纳也未能对防空作出任何实际贡献。这让维纳非常失望,但他坚称他基于“良好行为主义思想”的装置是“有史以来最接近飞行员生理行为的机械化方法之一”,他的贡献在于通过研究一个“有机体”的过去行为(而非它的结构),来预测它的未来行为。维纳后来在著作中多次暗示反馈控制概念是他在战时提出的,凭他一己之力就改善了防空火力,但到底是理论指导了实践,还是实践启发了理论,已是罗生门。

行为与目的

1942年5月,也就是维纳被防空问题逼得团团转的时候,纽约的梅西基金会组织了六位专家研讨“大脑抑制”问题,会议的两个主题是催眠术和条件反射,最引人瞩目的是阿图罗·罗森布鲁斯(Arturo Rosenblueth,1900—1970)的报告“机器和目标导向的生物之间的行为相似性”。1930年,罗森布鲁斯作为哈佛医学院访问学者,研究神经系统中的化学传递,并从“动态平衡”角度研究应激反应,还领导哈佛医学院青年学者每月举行一次科学方法研讨会,维纳也被吸引来参加。罗森布鲁斯这次报告的内容正是和维纳及毕格罗合作研究的成果。

根据维纳的回忆,他和毕格罗在研究防空问题时特别关注高射炮手和飞行员的行为,意识到[2]“随意活动(生理学术语,指经过大脑皮层反射的、有意识的活动)的一个极端重要的因素是控制工程师们所谓的‘反馈’作用。”他们猜想反馈是人类正常活动的关键,运动失调则是反馈回路被破坏的结果。两人就此求教于罗森布鲁斯,罗森布鲁斯立刻回答说:的确有一种叫做“目的震颤”的常见病例,由小脑受伤引起。三人意识到他们开启了神经生理学的新天地:传统观点认为大脑接收感知器官的输入,做出推理决策,再驱动肌肉执行动作,决策是在大脑内完成的;他们的新观点是决策是神经系统的整体行为,反馈机制在其中发挥着关键作用,大脑即便不可或缺,也并非决定性环节。很快,三人就把这个发现写成了论文,1943年1月以“行为、目的和目的论”之名在《科学哲学》发表[3]

这篇后来被追认为控制论开篇之作的文章对反馈概念进行了明确界定,区分了正反馈和负反馈,指出严格意义上的反馈是指负反馈,“一切有目的的行为,都可以看作需要负反馈的行为”。文章从这一角度对各种行为进行了分类,得出了神经系统和自动机之间的一致性:自动机的负反馈调节与生命系统的神经控制过程本质上是一致的,都是目的论性质的,并且从功效上看没有多大差别。

梅西会议

罗森布鲁斯的报告深深地吸引了伊利诺伊大学芝加哥分校精神病学系的神经生理学家沃伦·麦卡洛克(Warren Sturgis McCulloch,1898—1969),他认为这个跨学科会议很好,建议办成系列会议,梅西基金委非常认同,但表示战争期间很难按期举办。

1946年3月,战争刚结束不久,首次会议就在纽约召开,主题是“生物和社会系统中的反馈机制和循环因果系统”,麦卡洛克担任会议主席,后来赫赫有名的“控制论核心组”(Cybernetics Core Group)就此成立。梅西基金会表示会议的基本目标是“为一门关于大脑思维运行的通用科学奠定基础”。会议特邀冯·诺伊曼和洛伦特·德诺(Lorente de Nó, 1902-1990)分别报告数字计算机和神经生理学的最新进展,接着是维纳报告自控制(self-regulation)的机制。首次会议的一个重要争议是大脑运行是“数字”的还是“模拟”的,模拟派主要是生理学家,数字派主要是数学家,这个争论在后续会议中反复出现。

前五次会议差不多每半年举行一次。第二次会议主题是“目的论机制与循环因果系统”,花了不少时间讨论格式塔学派三大创始人之一沃尔夫冈·柯勒(Wolfgang Kohler,1887—1967)的“场(field)论”。第三次会议上,冯·诺伊曼基于他个人当时的研究兴趣(元胞自动机),建议邀请遗传学家参会。第四次会议上,沃尔夫冈·柯勒报告了他的“场论”,引起激烈争论,麦卡洛克和皮茨(Walter Pitts)认为这是缺乏实证的空谈。第五次会议第一天的主题是语言,第二天维纳报告了混沌和有序,基因学家麦克斯·德布瑞克(Max Delbrück,1906—1981)应邀作报告,他对会议的印象是空洞无物。

第六次会议1949年3月举行,自此会议周期变成一年。此次会议前,维纳的《控制论》已经出版,海因茨·冯·福斯特(Heinz von Foerster)提议将会议名称改为“控制论:生物和社会系统中的循环因果与反馈机制”并固定下来,全会欢呼通过。

第七次会议上,香农(Claude E. Shannon)报告了他对书面英语语义冗余的形式分析。会议也讨论了控制论被媒体炒得过热的问题:似乎人和机器很快就能融合,而核心组被描绘成了先遣队。第八次会议上,物理学家唐纳德·麦凯(Donald Mackay)提出“信息”本身是应该包含“意义”的,维纳表示认同,但这与香农的观念相左,引起争论。第九次会议很多核心成员没有参加。

1953年4月,第十次会议为就冯·诺伊曼之便,易地普林斯顿举办,但冯·诺伊曼仍没能参加。会议内容发散,争论头绪不清。麦卡洛克受命起草会议共识,但核心组显然已经四分五裂,麦卡洛克写到:“我们最值得记下的共识是我们稍稍学会了理解对方,以及依礼相争。” 麦卡洛克担任了10次会议的主席,当然希望梅西会议能够产生一个统一理论或者元学科,但是并没有。

控制论

1948年,维纳的《控制论:或关于在动物和机器中控制和通信的科学》[2]出版,标志着这个跨学科方向正式诞生。维纳在序言中回忆,其基本思想是在1943年那篇文章提出的,但缺乏一个概念来表述,直到1947年夏天,他才想出“控制论”(Cybernetics)这个词来表征这个领域,其希腊文原意是“掌舵人”,维纳希望以此来纪念有关反馈的第一篇文章,即物理学家麦克斯韦(James C. Maxwell)在1868年发表的一篇关于调速器的论文。

当时,瓦特(James Watt)发明的离心式调速器已经被大规模应用,这种装置采用闭合环路,将输出信息反馈到输入端,以调节和控制系统,但很多这种装置出现剧烈振荡,寻找故障原因成为了当时的重大理论问题。麦克斯韦的这篇文章从数学上证明了一个反馈控制系统在平衡点附近的行为可以用一个线性微分方程近似,开辟了系统稳定性研究这一方向。

从瓦特、麦克斯韦到二战结束,有关反馈的工程实践和理论研究已经广泛展开,控制、稳定、计算等词已经出现在工程师的辞典中。同时,生物系统内存在的信息传递和调节控制过程则成为生命科学的中心问题,反射、调节、稳态成为神经生理学家的常用术语,神经科学家用兴奋和抑制描述神经系统,行为心理学将人与动物的行为视为刺激-反应过程,协调心理学把调节视为生命系统内部及与外部相互作用的核心,所有这些都为控制论的提出准备了强大的思想基础[4]。梅西会议的历史功绩是在恰当的时间为这些思想的汇聚激荡提供了一个场所。

除反馈外,控制论的另一个核心思想是“通信在宇宙中的普遍作用”,即控制必然涉及到信息交换,反馈则意味着多轮信息交换,也因此,《控制论》这本书的副标题确定为“或关于在动物和机器中控制和通信的科学”。当然,控制论不是信息论,它是从理论上研究一切控制系统的信息传输和处理的特点和规律,研究用不同的控制方式达到不同的控制目的,而不关心信息本身是如何传递和处理的。控制论也不关心系统结构,而是关心系统行为,内部无从得知不重要,重要的是输入输出之间的关系。

控制论意义下的动物和机器无本质区别,维纳倾向于将机器拟人化:“很久以来我就明白,现代超速计算机在原理上就是自动控制装置的理想的中枢神经系统;并且它的输入输出不是必须采用数字和图的形式,也可以分别利用像光电池和温度计这样的人造感觉器官的读数,以及马达或螺线管的运动情况。利用应力计或类似的仪器读出这些运动器官的运动情况,并把它当作人造的运动感觉去报告,去‘反馈’给中枢神经系统,这样我们就能制造出具有几乎是任何精巧程度的性能的人工机器了。”1948年12月的《纽约时报》声称[5]:“大脑的行为和机器十分类似,构建和操作越来越复杂的机器将帮助科学家理解大脑本身是如何运作的,没有理由阻止控制论适用于所有的复杂系统。”

同态调节器

1949年1月12日,《纽约时报》再次刊发对《控制论》的狂热评论。当月的《时代》杂志不甘落后,宣布世界上第一台“思考机器”已经研制成功[6],只不过是在英格兰西部巴恩伍德的一家精神病院里,发明者罗斯·阿什比(W. Rose Ashby,1903—1972)声称他的机器是“迄今为止人类所设计出的最接近人工大脑的事物”。

这台机器的名字叫做“同态调节器”(homeostat)。“用4个英国皇家空军二战剩余的炸弹控制开关齿轮装置为底座,并套有4个立方铝盒”。4个铝盒顶部的4个小磁针是这台机器唯一可见的运动部件,像指南针一样在小水槽内摆动。机器的设计目的是使4个磁针保持在中心位置,这个状态称为机器的“舒适”状态。机器内部用到了磁力驱动电位器、电线、阀门、开关等,阿什比尝试了各种让机器“不舒适”的方法,例如颠倒电线连接的极性、颠倒磁针方向等等,但机器总能找到适应新状态的方法,并重新将磁针摇摆到中心位置,按阿什比的说法:机器“主动地”抵御了任何扰乱其平衡的尝试,进行“协同活动”以重新获得平衡。

阿什比设计这台机器花费了15年,又花费了2年进行制造,为什么如此执着?其实看看他的职业就明白了——他是精神疗养院的首席研究员,设计这台机器的目的是解释有机体如何保持自我平衡,以维持体温、血压、血糖等处于平衡状态。

同态调节器的自适应特性源于负反馈机制,阿什比坚信,“任何机器,不管多么了无生机,都可以用负反馈来展现其生命特征”。有机体实现这个目标,并不是靠大脑“运筹帷幄”,“大脑不是一台思考机器,而是一台执行机器”,“它获得某些信息并据此做出相关行为”,以使有机体“与环境适应”。

1952年,阿什比受邀参加了第九次梅西会议,毕格罗和皮茨拼命质问同态调节器到底是如何实现学习的,阿什比没有正面回答,而是强调他的机器适应了环境,这就是学习。同年出版的《大脑的设计》[7]中,阿什比对于同态调节器如何实现学习的回答更为经典:同态调节器具有“目标-寻找”行为,但是没有具体目标,它的行为只是为了适应环境,大脑也是如此。大脑和它所要适应的环境是一个整体,毕格罗那样的工程师想当然地把大脑与环境截然分开,追问学习模型,前提就是错的。

维纳很赞赏阿什比的观点,“我认为阿什比关于没有意图的随机机制通过学习过程寻找其意图的远见卓识,不仅是当今最伟大的哲学贡献之一,也会在自动化任务中引发极为有用的科技发展。”因为需要引用阿什比的工作,维纳专门修改再版了自己的畅销书《人有人的用处——控制论与社会》[8]。伯特兰·罗素(Bertrand Russell)深以为然,特发评论“人类还有必要存在吗?”

1956年,阿什比出版《控制论导论》[9],对控制论这个学科进行了更具一般性的总结和发展,明确提出控制论“本质上是关于机器的功能和行为”,“控制论将‘所有可能的机器’视为自己的研究题材”,正如几何学将所有可能的形状作为研究题材,而不是特定的圆球或方块。

工程控制论

1950年,准备回国的钱学森被美国政府软禁,被剥夺了做本行研究的权利,他转而研究控制论,憋着气写出了《工程控制论》[10],该书于1954年出版。

钱老在序言中开宗明义,认为维纳的控制论是关于怎样把机械元件与电气元件组合成稳定且具有特定性能的系统的科学,讨论的主要问题是一个系统的不同部分之间相互作用的定性性质,以及整个系统的总体运动状态,完全不考虑能量、热量和效率等因素。工程控制论的目的是研究控制论这门科学中,能够直接用在工程上设计被控系统或被操纵系统的那些部分。工程控制论是一门技术科学,介于控制论和伺服系统工程实践之间,目的是把工程实际中所用的许多设计原则加以整理与总结,使之成为理论。工程控制论可能使我们有更广阔的眼界,用更系统的方法来观察有关的问题,往往可以得到更有效的解决旧问题的新方法,而且工程控制论还可能揭示出新的以前没有看到过的前景。

《工程控制论》内容丰富,行文精炼,这从其十八章的标题就能看出:引言(线性系统与非线性系统),拉氏变换法,输入、输出和传递函数,反馈伺服系统,不互相影响的控制,交流伺服系统与振荡控制伺服系统,采样伺服系统,有时滞的线性系统,平稳随机输入下的线性系统,继电器伺服系统,非线性系统,变系数线性系统,利用摄动理论的控制设计,满足指定积分条件的控制设计,自动寻求最优运转点的控制系统,噪声过滤的设计原理,自行镇定和适应环境的系统,误差的控制。

由于《工程控制论》应用性极强,蕴含的学术思想超前于当时的国际前沿,因而迅速引发力学和自动控制等领域专家的兴趣。钱老1955年回国,《工程控制论》1956年获中国科学院一等科学奖,1957年被翻译成俄文和德文出版,1958年中文版出版,对我国航天技术和自动控制学科的发展产生了重大影响,培养了一代中国控制理论与应用人才。


占星术

尽管维纳在《控制论》序言中明确说“人文科学并不是这种新数学技术的很好的试验场所”,但控制论经过十多年的发展,还是在维纳有意无意的推动下演变成了一个无所不包的“科学哲学”。

1964年,维纳去世。同年,他的学生米歇尔·阿尔贝勃(Michael A. Arbib)出版《大脑、机器和数学》[11],记录了当时控制论的状况。该书分五章,第一章“神经网络、有限自动机和图灵机”,通过自动机模型把神经网络和图灵机打通;第二章“结构和随机性”主题是生物控制论;第三章“通讯和计算中的误差校正”,主题是稳态自动机的柯伐-维诺格拉德理论,这是信息论的一个推论,这一章大部分篇幅其实是信息论;第四章是“控制论”,核心概念是反馈和振荡,案例是神经网络和假肢,也提到了几十年前心理学的格式塔学说;第五章“哥德尔不完全定理”,除了定理本身外,还讨论了“哥德尔理论并不是机器不可能有思维的证明”。

除了第四章,估计其他大部分内容都不情愿归到控制论麾下,阿尔贝勃当然也察觉到了这一点,他在简短的跋里袒露了自己的心机:“控制论、仿生学、神经动力学、自组织系统理论、人工智能等各门新学科如雨后春笋般地成长起来。在这个小小的跋中,我想在这些五光十色的学科中专门谈谈控制论。它的领域并不只限于第四章谈的内容。广义上说,本书谈的都是属于控制论范围的。正因为它的内容如此广阔,便容易使人过于自信,因此我想给读者几点忠告。”

这些忠告与其说是给读者的,不如说是给突然去世的导师和无所不在的控制论拥趸的,是他们过于乐观的预言(如1960年左右就能完成机器翻译、人造脑等)激起了大量反对意见,正如阿尔贝勃所引用的:“最突出的例子是陶勃的《计算机和一般意义……》一书……竟把控制论的科学地位和占星术相比。”

这就是控制论的困境,看起来无所不包,无所不能,实际上却并不像哥德尔定理、信息论和计算机那样确定无疑,还时不时要和系统论争辩是谁包含谁。当然,这并不是要抹杀控制论的重大意义,而是因为理解和控制复杂系统这个问题太大、太难,说我们还处在牛顿之前的中世纪也不为过,在这个意义上,把控制论比喻成占星术,还真不算贬低。

失控

是维纳不如牛顿?还是生命、大脑、生态、社会等复杂系统背后不存在万有引力定律那样的基本定律?

维纳的回答应该是“不”,因为生命系统与自然系统遵循完全不同的规律。在《人有人的用处》[8]中,维纳从熵和信息(负熵)的角度分析了生命、人和社会不同于自然的特殊之处。生命成长是熵减过程,要不断对抗自然熵增,就必须通过反馈机制不断与环境交换信息,以保持和增强自身的组织性,因此生命必然是开放系统。开放系统是不断演化发展的,物理学家寻找的那种决定性的基本定律,并不适合生命、生态、社会这种可能性无限展开的开放系统,哥德尔定理已经从根本上否定了这种决定性。

生命的本质在于能够通过反馈增强自身的组织性,机器也可以做到:通过感觉接收器搜集外界信息,提高自己的组织程度,通过不断反馈,实现迭代发展。就像人类是从猿进化而来一样,机器进化的起点是人类,先制造拥有类似人类大脑和身体结构的机器人,再以更高的效率与环境进行反馈和信息交换,生命因此而跨入新的阶段。

机器复杂程度超过人类,人类还能有效控制它们吗?阿什比在《控制论导论》[9]第11章中提出了必需变异度定律,直白地说,简单系统不能有效控制复杂系统,任何有效的控制系统都必须至少与它所控制的系统一样复杂。因此,人类控制不了复杂度超过人类的系统,而这种复杂度更高的系统可以控制人类。

这里的“控制”不应褊狭解读,至少应理解到人类和地球生态关系的层次。

这正是:

大海航行靠舵手,系统控制靠平衡;

平衡源于负反馈,目的全在行为中。

动物哪里异机器?个体岂能离环境?

天人损益各有道,化简为繁创新生。 

 

作者简介


黄铁军

CCF会士。北京大学教授。北京智源人工智能研究院院长。主要研究方向为视觉信息处理与类脑智能。

tjhuang@pku.edu.cn



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
机器的崛起:隐藏的控制论历史
“黑箱”简史:“封装大脑”还是未知的混沌?
控制论,计算机设计和思想会议
本杰明·彼得斯:《控制论的全球史》(2016)
科学大家:控制论的创立者维纳
化学研究中的控制论方法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服