阴谋、情书与疗方:人工智慧揭示的中世纪祕密

博格密码

图像来源,Beáta Megyesi

    • Author, 桑德琳.瑟斯特蒙(Sandrine Ceurstemont)
  • Published
  • 阅读时间: 4 分钟

“被难以理解的密码遮掩的历史讯息与文件,散落在世界各地的图书馆与档案馆。人工智慧正协助历史学家打开这些神祕文本。”

在梵蒂冈图书馆的深处,一本充满奇怪符号的神祕手写书籍,沉睡了四百多年未被阅读。据封面上的文字显示,书中隐藏着“人体疾病的祕方”。由于这些疗法在当时可能引来怀疑甚至被指控为巫术,因此被秘密保存。

这本名为 “博格密码” 的手稿长达 408 页,主要以 34 个晦涩符号编码,夹杂少量罗马字母,封面则以阿拉伯文书写。由于没有已知的解码钥匙,加上部分页面因年代久远而受损,使得破解难度更高。

然而,透过 机器学习(人工智慧的一种形式),研究人员成功解开密码。他们发现书中充斥着数千种奇特疗法,例如喝数杯高品质红酒,或将肉豆蔻发酵在面团中来治疗痢疾。

斯德哥尔摩大学计算语言学教授 贝娅塔·梅杰西(Beáta Megyesi )表示:“这就像侦探工作,每一个符号、模式与部分解答,都可能让我们更接近某人的祕密与失落的历史世界。”即使有 AI 协助,破解密码的过程仍然十分艰辛。

如今,梅杰西与她的同事正领导一项计画,利用人工智慧的力量更有效率地破解历史密码,这有望解锁过去大量原本无法解读的加密资讯。

据估计,全球各地的档案馆与图书馆中约有 1% 的资料是完全或部分加密的。一些最早的密码可追溯至古希腊与罗马。

伪装、死语与潦草字迹

这些加密的历史文件共同隐藏了外交情报、秘密社团的仪式、医学知识、恋爱往事,甚至是人们想要保密的日常细节。这些资讯目前缺席于我们的历史叙事中。在某些情况下,解码这些文件甚至可能改写我们对某位知名人物或整个历史时期的理解。

(例如,最近的一份密码文件是一批由苏格兰女王玛丽在她长期被囚禁于英格兰期间所写的加密信件。这些信件揭示了她参与夺回王位的阴谋,以及她与儿子——苏格兰国王詹姆士六世、未来的英格兰国王詹姆士一世——之间紧张的关系。)

历史密码有时相对简单:例如 博格密码,它采用的是简单的替换密码,也就是每个符号都对应一个罗马字母,用来隐藏原本的文字。然而,其他密码则可能难以破解。在某些情况下,甚至无法确定原始文本所使用的语言。加密者还可能插入额外且无意义的符号作为诱饵,以混淆任何试图窥探文本的人。在其他情况下,则可能用多个符号来代表同一个字母。

这意味着即使是解读少量文字,也需要大量工作——通常涉及反复试验。法国国家资讯科学研究院(INRIA)南锡分部的密码学家 塞西尔.皮耶罗(Cecile Pierrot) 与同事们花了六个月,才逐步解开一封 500 年前由神圣罗马帝国皇帝兼西班牙国王查理五世所写信件的密码钥匙。这封信仅有三页,却使用了 120 种不同的密码符号。

解密后的信件揭示了查理五世——当时最有权势的人之一——因害怕遭暗杀而陷入恐惧。他担心效力于法王法兰西斯一世的义大利佣兵军阀正密谋刺杀他。

在开始破解密码之前,研究人员必须先费力地将手写的密码文本转换成数位文件,才能输入到解码软体中。潦草的字迹与墨水的褪色让这项工作更加困难。

皮耶罗表示,她通常需要花上一整天,才能转录一封包含陌生符号的两页信件。

博格密码

图像来源,Biblioteca Apostolica Vaticana

图像加注文字,博格密码被认为已有约四百年历史,全书 408 页混合了奇怪的密码符号与部分拉丁文字。

人工智慧如何加速解读祕密

人工智慧正开始加快这个过程。挪威奥斯陆大学德语语言学教授 米歇尔.瓦尔迪斯普尔(Michelle Waldispühl) ,最近与同事们使用一个名为 Transkribus 的线上 AI 平台,转录了一封由贵族西吉斯蒙德.海斯纳.冯.万德斯莱本(Sigismund Heusner von Wandersleben) 在1637 年三十年战争高峰期写给瑞典大法官阿克塞尔.奥克森谢纳(Axel Oxenstierna) 的祕密信件。这场宗教冲突最终夺走了数百万人的生命,并摧毁了欧洲大片土地。

该工具已经接受过多种语言、文字与字迹风格的训练,涵盖数个世纪。当文件影像上传到系统后,AI 会先侦测文字区块与行列,再逐字扫描整篇文本,将其转换为数位形式。

虽然仍需一些人工修正,但该工具在处理万德斯莱本的信件时表现良好,因为信件仅部分使用数字加点的方式加密,且字迹整齐、符号之间留有清晰空格。其他部分则未加密,仅以 17 世纪德文书写。

现有的 AI 转录平台在遇到使用奇特符号加密的手稿时常常表现不佳,例如自创符号、占星符号或以特殊方式书写的数字。但 梅杰西、瓦尔迪斯普尔及其同事正在开发自己的 AI 工具,作为跨国 Descrypt 计画的一部分,目标是将含有晦涩符号或文字的历史手稿转换成机器可读的文件。

梅吉西说:“我们正在开发更具适应性的模型,并在广泛的文字、字母与符号系统上进行训练与测试。”

一旦祕密文件被转录,侦探般的工作便可展开。目前,密码学家通常使用特别设计的非人工智慧电脑软体来协助,透过演算法判断所使用的密码并尝试破解。简单的密码往往能透过分析符号出现的频率来破解,并将其与语言中相同频率的字母匹配。例如,在英文中,字母 E 最常见,而 Z、Q、X 则最少。

然而,在万德斯莱本 的信件中,他竟用多达八种不同符号来代表字母 E。这意味着必须依靠反复试验,以及 瓦尔迪斯普尔对古德语的知识,才能逐步解开密码。

瓦尔迪斯普尔说:“这完全是机器与人工验证者之间的来回过程。也许有一天,人工智慧能完全独立完成。”

隐藏在密码背后的,是万德斯莱本对瑞典新教盟友派系威胁的警告。他告诉奥克森谢纳,自己在得知盟友间的阴谋后,被迫从战事中战略性撤退,其中包括萨克森的弗朗兹.海因里希勋爵(Lord Franz Heinrich)。

图书馆

图像来源,Getty Images

图像加注文字,世界各地的档案馆与图书馆中保存着加密文本,这些文本可能包含珍贵的历史资讯。

重启冷案密码

梅杰西 与她的团队如今正在探索人工智慧如何跳过转录阶段,直接分析页面照片来解读祕密讯息。他们最近展示了这种方法在简单密码上的可行性——即每个字母以单一符号替代。

他们将系统测试于一份 105 页的手稿,即 科皮亚勒密码(Copiale cipher),该手稿记录了一个18世纪德国秘密社团的仪式、规则与理念。透过先以一般字迹训练 AI,再输入密码特定行的影像与对应的德文解码文本,系统能准确解读先前未见过的部分。

这样的系统在密码原始语言未知时尤其有用。

“这为稀有与非标准书写系统开启了令人兴奋的可能性。我们的最终目标是将转录与解码结合为单一步骤,”梅杰西说。

瓦尔迪斯普尔与她在 Descrypt 计画中的同事,一直在旧档案中搜寻密码文本,并将其编入资料库。这可能至关重要,因为要训练能破解密码的人工智慧,需要足够的数据。支撑 AI 聊天机器人的大型语言模型(如 ChatGPT)是以数兆字的书籍、文章和网站训练而成;要找到相当规模的密码数据则相当具有挑战性。

在他们收集的材料中,包括400张来自19世纪末至 20世纪初的神祕明信片,皆以密码书写。少数已解读的片段显示,其中一些是用德文写成的情书。

梅杰西的团队利用这些工作,创建了一个 聊天机器人式 AI 工具,能在单一步骤中结合转录与解码。该聊天机器人结合了基于密码符号与其对应文字的解码演算法,以及基于不同时期历史文本训练的大型语言模型,来提供解码线索。它还融入了基于注解字迹训练的影像识别演算法。此AI工具能透过专家使用时的修正来持续改进。

费斯托斯圆盘

图像来源,Getty Images

图像加注文字,距今四千年的费斯托斯圆盘——在克里特岛米诺斯宫殿遗址中出土——其上的符号至今仍大多未被解读。

这个构想是让研究人员,甚至一般大众,都能将加密的历史文本交给聊天机器人,并获得解读结果。

研究人员在测试该 AI 聊天机器人处理博格密码时,发现它能在 29 分钟多一点的时间内翻译并解码 500 个符号的片段,甚至提供英文翻译。它还记录了解码过程,并解释为何解答合理,这对避免 AI“幻觉”或捏造解释非常重要。

团队最近也用两份先前已解码的密码进行测试,这些密码代表不同时期、语言、秘密代码类型与复杂程度。系统同样快速解码,显示它能处理各种密码。

梅杰西说:“人工智慧最能帮助的是规模、速度、模式发现与任务整合。”

这类 AI 工具可能是破解至今仍难以解读的历史密码的关键,也能协助处理那些以无人能读的字母书写的古代文本。例如,来自克里特岛的 4,000 年历史的费斯托斯圆盘(Phaistos Disc)至今仍未解读,早期希腊语线形文字 A(Linear A)亦然。

“令我兴奋的不仅是解开某个特定的历史谜题,而是能创造出能协助研究人员处理各种案例的方法,”梅吉西说。