图灵笔记中的独家内容展现了他亲力亲为的工作方法。
2023年11月,一批文件以近50万美元的价格在拍卖会上售出。这些文件详细描述了一项由艾伦?图灵主持的绝密语音加密计划,该计划的最终成果是一台名为“大利拉”的机器
唐纳德 · 贝利(1921—2020)毕业于电气工程专业,并在皇家电气和机械工程师团服役。在那里,他被选中与艾伦? 图灵合作开展大利拉计划。晚年,他设计了基于电传打字机的“短笛”系统(Piccolo),用于秘密外交无线电通信,该系统被英国外交和联邦事务部采用,并在世界各地使用了数十年
那一天是1945年5月8日,欧洲胜利日。随着德国军队无条件投降,第二次世界大战的欧洲战事画上了句号。艾伦?图灵和他的助手唐纳德?贝利(Donald Bayley)一同散了一场长步,以这种沉静的英国方式庆祝胜利。此前的一年多里,他们一直在英国乡村深处的一间秘密电子实验室里并肩工作。但是,年轻的电气工程师贝利对自己上司作为密码破译员的另一面知之甚少,他只知道,图灵时不时会骑着自行车,沿着乡间小路前往16公里外的另一处机要单位——布莱切利庄园。直到后来,贝利和世界上的其他人才知晓,布莱切利庄园是一场前所未有的大规模密码破译行动的总部。
当他们在一片林中空地坐下休息时,贝利说:“好了,战争已经结束了,现在是和平时期了,你可以告诉我们一切了。”
“别傻了。”图灵回他。
“那场对话就这样结束了。”67年后,贝利回忆道。
如今,图灵在密码破译领域的惊人成果已经为众人所熟知。不仅如此,他还是计算机科学的奠基人,以及人工智能领域的先驱。然而,他在电气工程领域的成就却少有人知。不过,这种情况或许即将改变。
2023年11月,一大批图灵在第二次世界大战期间的文件在伦敦拍出,成交价格近50万美元(约合364万元人民币),这批文件被称为“贝利文件”(Bayley papers)。在这批此前不为人知的资料中,有许多是图灵亲笔书写的内容,记录了他在1943年到1945年间主持的绝密工程计划“大利拉”(Delilah)。这是图灵的便携式语音加密系统,得名于《圣经》中“出卖男人的大利拉”。资料中还有一部分由贝利撰写,大多是他在图灵讲话时做的笔记。多亏了贝利,这些文件才得以留存下来:他一直保存它们直到2020年逝世,彼时已是图灵去世的66年后。
英国政府在得知这些文件将被拍卖后,迅速下令禁止其出口,并宣布它们是 “我们国家故事的重要组成部分”,还表示“要让英国买家有机会购买这些文件”。我本人有幸在11月的拍卖会之前接触了这些藏品,并受拍卖行委托,协助鉴定其中的一部分技术材料。“贝利文件”让我们认识了一位全新的工程师图灵。
在那段时间里,图灵的关注点正在从抽象走向具体。这些文件展现了他从第二次世界大战前聚焦于数学逻辑和数论,到转而投身于电路、电子和工程数学的新世界这一转型之旅的有趣缩影。
艾伦?图灵的大利拉计划
在第二次世界大战期间,图灵意识到密码学的新前沿在于语音加密。当时的战时密码机——例如日军的“紫色”密码机、英军的“X型”密码机(Typex)以及德国著名的恩尼格玛密码机(Enigma)和基于电传打字机的洛伦兹密码机(SZ42)——都是用于加密文本的。然而,对于军方指挥官们而言,文本并不是最方便的交流方式,他们更期待安全的语音交流。
1942年至1943年间,根据美国陆军的合同,贝尔实验室在纽约市首创并建造了SIGSALY语音加密系统。该系统极为庞大,重达50多吨,占满了一整个房间。图灵对SIGSALY很熟悉,他想要将语音加密系统缩小。他的成果就是大利拉:该系统由三个小单位组成,每个单位仅一个鞋盒大小,总质量只有39千克(包括电源在内),可以轻易安放在卡车、战壕或大型背包中。
贝尔实验室绝密安装的SIGSALY语音加密系统是一个房间大小的机器,质量超过50吨
1943年,图灵在一座小屋内搭起工作台,秘密开发大利拉。这间小屋位于英格兰荒无人烟的汉斯洛普园(Hanslope Park)内,这是一处军方机构。时至今日,汉斯洛普园仍然是一间高度保密的情报机构,被称为“国王陛下的政府通信中心”(HMGCC)。通信中心的工程师们秉承图灵的传统,为如今的英国情报人员提供专门的软硬件。
图灵似乎很享受在汉斯洛普园研究大利拉的那两年时光。他住在一间旧农舍里,在军队食堂用餐。据机构指挥官回忆,他“很快就安定下来,成为我们的一员”。1944年,图灵手下多了个年轻的助手贝利,后者刚从伯明翰大学毕业,获得了电气工程学士学位。两人成了好朋友,一起钻研大利拉,直到1945年秋天。贝利对图灵的称呼只是简简单单的“教授”,就像布莱切利庄园和汉斯洛普园里的每个人一样。
“我钦佩他思想的独创性,”贝利在20世纪90年代接受采访时告诉我,“他教会了我很多,对此我一直心怀感激。”
作为回报,贝利教会了图灵如何提升实操能力。当贝利第一次来到汉斯洛普园时,他发现图灵把电路接得一团糟,用他的原话说,就像“蜘蛛网”一样。他带着图灵进行了“面包板集训”,让他的布线更规范。
随着欧洲战场的战事接近尾声,图灵和贝利得到了一个能正常启动和运行的原型系统。贝利说,它“完成了预期的所有任务”。他将大利拉系统描述为“首批基于严格密码学原理的系统之一”。
图灵的语音加密系统是如何运作的
图灵在设计语音加密系统时,从现有的文本加密机中汲取了灵感。基于电传打字机的密码机,例如德国人那精密复杂的SZ42密码机(图灵和他在布莱切利庄园的同事破解过该机),其工作原理与更为知名的恩尼格玛密码机有所不同。恩尼格玛通常用来加密以无线电传输的莫尔斯电码信息。它通过点亮一块名为灯板的面板上的相应字母加密从A到Z的字符,而灯板与键盘之间的电路连接会不断变化,从而实现加密。相比之下,SZ42则是连接到一台采用五单位电码的普通电传打字机,不仅可以处理字母,还可以处理数字和一系列标点符号,它的运作完全不涉及莫尔斯电码。(这种五单位电码是ASCII和Unicode的前身,至今仍被部分业余无线电爱好者使用。)
SZ42通过向电传打字机的明文输出添加一串用于遮蔽信息的电报码——称为“密钥”(key)——来加密信息。在密码破译人员和加密人员之间,“密钥”是个集体名词,就像“footwear”(鞋类)或“output”(输出)一样。例如,如果德军的明文信息是“ANGREIFEN UM NUL NUL UHR”(意为“零时整发动攻击”),而用于加密这三个单词以及其间空格的密钥序列是“Y/RABV8WOUJL/H9VF3JX/D5Z”,那么加密机会按照以下方式进行操作:首先,将“Y”加到“A”上——也就是说,将密钥第一个字母的五单位电码加到明文第一个字母的五单位电码上;然后将“/”加到“N”上,再将“R”加到“G”上,以此类推。按照SZ42密码机硬件内置的字符相加规则,这24次运算最终会生成密文“PNTDOOLLHANC9OAND9NK9CK5”。这种先生成密钥、再将其与明文相加的原理被图灵拓展到了语音加密领域。
在SZ42密码机内部,密钥则由一个包含12个转子的密钥发生器生成。当转子环转动时,它们会输出一连串看似随机的字符。接收机中的转子与发送机中的转子同步,因此生成的密钥字符也是相同的,以上一段的例子来讲,也就是“Y/RABV8WOUJL/H9VF3JX/D5Z”。接收机从收到的密文“PNTDOOLLH ANC9OAND9NK9CK5”中减去密钥,从而还原明文“ANGREIFEN9UM9NUL9NUL9UHR”(在SZ42密码机里,空格用“9”来表示)。
大利拉采用了类似的原理,为口述语言加上了遮蔽密钥——该机器的密钥是一串伪随机数,也就是看似随机而非真随机的数字。大利拉的密钥发生器包含五个转子和一些图灵设计的高级电子设备。与SZ42密码机一样,接收端的密钥发生器必须与发送端完全同步,以确保两台机器生成相同的密钥。在一份曾经属于高度机密、现已解密的报告中,图灵和贝利提到,同步两台密钥发生器是一个“极具挑战性的问题”。然而,他们成功克服了这一难题和其他困难,并最终用温斯顿 · 丘吉尔的一段演讲录音成功演示了大利拉的加密、传输和解密功能。
大利拉加密-解密过程的第一步是将音频信号离散化,如今我们称之为模拟-数字转换。这生成了一串独立的数字,每个数字都与某个特定时间点的信号电压相对应。随后,大利拉密钥中的数字被加到这些数字上。在加法过程中,任何需要进位的数字都会被排除在计算之外,这种“无进位相加”的方式可以进一步打乱信息,使其更难破解。最终生成的数字序列就是语音信号的加密形式,它会被自动传输到接收端的第二台大利拉机器。接收端的大利拉从收到的加密信号中减去密钥,并将所得数字转换回电压,从而重现原始语音信号。
图灵和贝利兴高采烈地报告说,尽管解密后的语音听起来“呜呜”的,而且充满了背景噪音,但大多可以听懂——不过,如果系统运行出错,可能会发出“步枪射击一般的突兀巨响”。
然而,当时第二次世界大战已接近尾声,军方并未对该系统产生兴趣。战后不久,大利拉计划的工作便宣告终止,图灵也受英国国家物理实验室聘请,负责电子计算机的设计与开发。据贝利回忆,大利拉“几乎没有进一步的发展潜力”,于是“很快就被遗忘了”。尽管如此,它具有极高的安全性,并且是首个成功演示的便携式语音加密设备。
更重要的是,图灵在电气工程领域浸淫两年的经验为他日后设计电子计算机打下了坚实的基础。
图灵的实验笔记
图灵开发大利拉的两年里的研究成果留存下来,成了如今的“贝利文件”。这批文件包括一本实验笔记、相当数量的散页(部分整理成捆),以及其中最珍贵的部分——一本满满的活页夹。
在这本四开大小的绿灰色实验笔记中,大部分都是图灵的亲笔,详细记录了他数月间的工作。他所记录的第一项实验是测量多谐振荡器产生的脉冲信号。多谐振荡器是一种可以触发产生单个电压脉冲或一连串脉冲的电路。在实验中,脉冲被输入示波器,以检查其波形。多谐振荡器是大利拉加密机最重要的密钥发生器的关键组成部分。笔记的下一页则标注着“‘赫维赛德函数’之测量”,记录了在同一个多谐振荡器电路中某些部分的电压测量结果。
如今,多谐振荡器在密码学中的应用受到了极大的关注。而在大利拉加密机中,图灵设计的密钥发生器正是最具原创性的部分,其中包含了八个多谐振荡器电路,以及前文提到的五转子组件。实际上,这些多谐振荡器可以视为另外八个极其复杂的“转子”,此外,发生器中还有额外的电路来增加多谐振荡器所生成数字的随机性。
实验笔记中记录的后续实验测试了大利拉各主要组件的性能,包括脉冲调制器、谐波分析仪、密钥发生器、信号和振荡器电路,以及射频和天线电路。在项目初期,图灵独自工作了六个月左右,直到贝利于1944年3月加入研究。在前六个月里,笔记中的所有实验记录均为图灵亲手撰写,其中包括密钥发生器的测试记录。之后,贝利接手了实验记录的工作。
带宽定理
在一沓布满图灵潦草笔迹的散页中,有一页的标题是“带宽定理”(Bandwidth Theorem)。实际上,大利拉加密机正是对这一定理的应用,如今我们将该定理称为“奈奎斯特-香农采样定理”(Nyquist-Shannon sampling theorem)。图灵对该定理的推导过程潦草地写了两页纸,很可能是写来给贝利讲解用的。这一定理确定了准确再现声波所需的采样率标准,大利拉便是依照该定理,通过每秒对语音频率进行数千次采样,将声波转换为数字。
克劳德 · 香农曾在贝尔实验室工作时撰写过一篇论文,概述了这一定理的早期研究,并给出了自己对该定理的数学表述和证明。香农于1940年完成了该论文,但直到1949年才正式发表。1943年,图灵在贝尔实验室工作过一段时间(工作内容与SIGSALY有关),此后才返回英国,开展对大利拉的研究。因此,他很可能和香农交流过采样率的问题。
图灵的“红表”笔记
第二次世界大战期间,汉斯洛普园设有一个大型的无线电监听部门,操作员日夜轮班,在电波中搜寻敌方的通信。恩尼格玛密码机所传输的莫尔斯电码信息有着典型的军事格式,很容易识别,而SZ42密码机的无线电传信号则具有独特的震颤声,一听就能认出。在截获敌方信号后,操作员会填写一张军方发放的、用鲜红墨水预先印好的表格,记录信号频率、截获时间以及密文内容。随后,这份“红表”会被迅速送往布莱切利庄园的密码破译员处。
战时的英国纸张短缺,图灵显然是拿了一大堆红表,在空白的反面潦草地写下了许多关于大利拉的研究。贝利文件中有这样一捆红表(图灵在每页角落记了页码),图灵在其中分析了一个电阻-电容网络,该网络输入了一个“在时间0时面积为A的脉冲信号”,并计算了该脉冲通过网络时的电荷变化,以及“该面积脉冲的输出电压”。接下来的几页写满了有关时间、电阻和电荷的积分方程,随后是一张草绘的图表,其中将波状脉冲分析为离散的“阶梯”——接下来就是数页傅立叶分析。图灵在最后附上了一份他称之为“傅立叶定理”(Fourier theorem)的证明,表明这一沓笔记可能是为贝利编写的教程。
这些文件的存在,反映了大利拉计划的特点和挑战性。通常属于最高机密的军方红表、战时物资短缺的证据、草草写下的公式、数学的复杂性、为贝利编写的教程——所有的一切都让人联想到这样一幅画面:教授和他的年轻助手在一座秘密军事机构中紧密合作,研发一个推动工程学前沿技术的装置。
图灵的电气工程师讲座
活页夹的封面上压印有“沃尔索尔玛丽女王学校”(Queen Mary's School, Walsall)的烫金字样,贝利曾在该校就读。活页夹里塞满了贝利在图灵于汉斯洛普园主讲的系列夜间讲座上所做的手写笔记。这些讲座的听众规模不得而知,但汉斯洛普园内有许多像贝利这样的年轻工程师。
这本笔记可以合理地命名为《图灵的高等数学讲义——面向电气工程师》。笔记长达180页,是目前已知的、图灵最详尽的非密码学著作,与他在1940年撰写的关于恩尼格玛密码机和“炸弹”解密机的文章篇幅相当,后者在布莱切利庄园内被亲切地称为“教授之书”。
当我们稍稍放宽视野,有助于将这一重要发现与时代背景联系起来。图灵的传统形象总将他描绘成远离实际工程的纯粹数学家。例如,1966 年,《科学美国人》刊登了传奇计算机科学家和人工智能先驱约翰 · 麦卡锡(John McCarthy)撰写的一篇文章,他在文章中指出,图灵的研究并未“在计算机的实际制造和落地中发挥任何直接作用”。这在当时是一种普遍的观点。
然而,我们现在知道,图灵在战后亲自设计了一台电子计算机,名为“自动计算引擎”(ACE)。此外,他还为曼彻斯特大学的“婴儿”计算机设计了编程系统,及其穿孔纸带输入/输出的硬件设备。“婴儿”于1948年年中正式降生,它体积虽小,却是第一台真正意义上的存储程序电子计算机。两年后,图灵的ACE原型机运行了它的首个程序,后来,该原型机得到英国电气公司的商业化,商业机型名为“数字电子通用计算引擎”(DEUCE)。DEUCE机售出了数十台——这在当年是相当可观的销量——图灵的计算机也成了数字时代头几十年里的主要工具。
尽管如此,人们仍然倾向于认为图灵的贡献只集中在基础但抽象的理论方面,而看不到他有时是个从实践电子学到工程理论什么都干的人。贝利文件让我们看到了图灵的另一面——一位富有创造力的电气工程师,鞋子上还沾满了焊锡(尽管就像贝利喜欢说的那样,图灵的焊点确实容易脱落)。
图灵的讲座笔记实际上是一本面向电路工程师的高等数学教科书,简明扼要、精挑细选,当然,现在看来,它已经非常过时了。
讲义中关于电子学的具体内容很少,只偶尔有所提及,比如某处提到了阴极跟随器。在谈到大利拉计划时,贝利喜欢说图灵是在1943年3月从纽约横跨大西洋返回利物浦的途中,通过学习美国无线电公司的真空管手册,才初次自学了基础电子学。不过,这种说法并不完全准确,因为早在1940年,图灵就在“教授之书”中描述了某些电子器件的使用方法。他详细介绍了一种由26相电源供电、26根闸流管组成的装置设计,每根闸流管控制一个双线圈继电器,“(继电器)只有在闸流管无法点火时才会启动”。
图灵在实用电子学方面的知识很可能不如他的助手(至少在最初是这样),因为贝利曾在大学学习过这门学科,在调到汉斯洛普园之前还从事过雷达方面的工作。然而,当涉及数学方面的问题时,情况就大不相同了。贝利的论文展示了图灵在电路设计数学方面的深厚造诣,而这些知识对于大利拉计划的成功至关重要。
图灵非同寻常的广博学识早已成为他公众形象的重要组成部分:他是数学家、逻辑学家、密码破译员、哲学家,也是计算机理论家、人工智能先驱和计算生物学家。如今,我们还必须将他在电气工程方面的独特才能也加入其中。
资料来源 IEEE
————————
本文作者杰克·科普兰(Jack Copeland)是新西兰坎特伯雷大学哲学教授,同时也是研究艾伦·图灵的国际顶尖学者