陰謀、情書與療方:人工智慧揭示的中世紀祕密

博格密碼

圖像來源,Beáta Megyesi

    • Author, 桑德琳.瑟斯特蒙(Sandrine Ceurstemont)
  • Published
  • 閱讀時間: 4 分鐘

「被難以理解的密碼遮掩的歷史訊息與文件,散落在世界各地的圖書館與檔案館。人工智慧正協助歷史學家打開這些神祕文本。」

在梵蒂岡圖書館的深處,一本充滿奇怪符號的神祕手寫書籍,沉睡了四百多年未被閱讀。據封面上的文字顯示,書中隱藏著「人體疾病的祕方」。由於這些療法在當時可能引來懷疑甚至被指控為巫術,因此被秘密保存。

這本名為 「博格密碼」 的手稿長達 408 頁,主要以 34 個晦澀符號編碼,夾雜少量羅馬字母,封面則以阿拉伯文書寫。由於沒有已知的解碼鑰匙,加上部分頁面因年代久遠而受損,使得破解難度更高。

然而,透過 機器學習(人工智慧的一種形式),研究人員成功解開密碼。他們發現書中充斥著數千種奇特療法,例如喝數杯高品質紅酒,或將肉豆蔻發酵在麵團中來治療痢疾。

斯德哥爾摩大學計算語言學教授 貝婭塔·梅傑西(Beáta Megyesi )表示:「這就像偵探工作,每一個符號、模式與部分解答,都可能讓我們更接近某人的祕密與失落的歷史世界。」即使有 AI 協助,破解密碼的過程仍然十分艱辛。

如今,梅傑西與她的同事正領導一項計畫,利用人工智慧的力量更有效率地破解歷史密碼,這有望解鎖過去大量原本無法解讀的加密資訊。

據估計,全球各地的檔案館與圖書館中約有 1% 的資料是完全或部分加密的。一些最早的密碼可追溯至古希臘與羅馬。

偽裝、死語與潦草字跡

這些加密的歷史文件共同隱藏了外交情報、秘密社團的儀式、醫學知識、戀愛往事,甚至是人們想要保密的日常細節。這些資訊目前缺席於我們的歷史敘事中。在某些情況下,解碼這些文件甚至可能改寫我們對某位知名人物或整個歷史時期的理解。

(例如,最近的一份密碼文件是一批由蘇格蘭女王瑪麗在她長期被囚禁於英格蘭期間所寫的加密信件。這些信件揭示了她參與奪回王位的陰謀,以及她與兒子——蘇格蘭國王詹姆士六世、未來的英格蘭國王詹姆士一世——之間緊張的關係。)

歷史密碼有時相對簡單:例如 博格密碼,它採用的是簡單的替換密碼,也就是每個符號都對應一個羅馬字母,用來隱藏原本的文字。然而,其他密碼則可能難以破解。在某些情況下,甚至無法確定原始文本所使用的語言。加密者還可能插入額外且無意義的符號作為誘餌,以混淆任何試圖窺探文本的人。在其他情況下,則可能用多個符號來代表同一個字母。

這意味著即使是解讀少量文字,也需要大量工作——通常涉及反覆試驗。法國國家資訊科學研究院(INRIA)南錫分部的密碼學家 塞西爾.皮耶羅(Cecile Pierrot) 與同事們花了六個月,才逐步解開一封 500 年前由神聖羅馬帝國皇帝兼西班牙國王查理五世所寫信件的密碼鑰匙。這封信僅有三頁,卻使用了 120 種不同的密碼符號。

解密後的信件揭示了查理五世——當時最有權勢的人之一——因害怕遭暗殺而陷入恐懼。他擔心效力於法王法蘭西斯一世的義大利傭兵軍閥正密謀刺殺他。

在開始破解密碼之前,研究人員必須先費力地將手寫的密碼文本轉換成數位文件,才能輸入到解碼軟體中。潦草的字跡與墨水的褪色讓這項工作更加困難。

皮耶羅表示,她通常需要花上一整天,才能轉錄一封包含陌生符號的兩頁信件。

博格密碼

圖像來源,Biblioteca Apostolica Vaticana

圖像加註文字,博格密碼被認為已有約四百年歷史,全書 408 頁混合了奇怪的密碼符號與部分拉丁文字。

人工智慧如何加速解讀祕密

人工智慧正開始加快這個過程。挪威奧斯陸大學德語語言學教授 米歇爾.瓦爾迪斯普爾(Michelle Waldispühl) ,最近與同事們使用一個名為 Transkribus 的線上 AI 平台,轉錄了一封由貴族西吉斯蒙德.海斯納.馮.萬德斯萊本(Sigismund Heusner von Wandersleben) 在1637 年三十年戰爭高峰期寫給瑞典大法官阿克塞爾.奧克森謝納(Axel Oxenstierna) 的祕密信件。這場宗教衝突最終奪走了數百萬人的生命,並摧毀了歐洲大片土地。

該工具已經接受過多種語言、文字與字跡風格的訓練,涵蓋數個世紀。當文件影像上傳到系統後,AI 會先偵測文字區塊與行列,再逐字掃描整篇文本,將其轉換為數位形式。

雖然仍需一些人工修正,但該工具在處理萬德斯萊本的信件時表現良好,因為信件僅部分使用數字加點的方式加密,且字跡整齊、符號之間留有清晰空格。其他部分則未加密,僅以 17 世紀德文書寫。

現有的 AI 轉錄平台在遇到使用奇特符號加密的手稿時常常表現不佳,例如自創符號、占星符號或以特殊方式書寫的數字。但 梅傑西、瓦爾迪斯普爾及其同事正在開發自己的 AI 工具,作為跨國 Descrypt 計畫的一部分,目標是將含有晦澀符號或文字的歷史手稿轉換成機器可讀的文件。

梅吉西說:「我們正在開發更具適應性的模型,並在廣泛的文字、字母與符號系統上進行訓練與測試。」

一旦祕密文件被轉錄,偵探般的工作便可展開。目前,密碼學家通常使用特別設計的非人工智慧電腦軟體來協助,透過演算法判斷所使用的密碼並嘗試破解。簡單的密碼往往能透過分析符號出現的頻率來破解,並將其與語言中相同頻率的字母匹配。例如,在英文中,字母 E 最常見,而 Z、Q、X 則最少。

然而,在萬德斯萊本 的信件中,他竟用多達八種不同符號來代表字母 E。這意味著必須依靠反覆試驗,以及 瓦爾迪斯普爾對古德語的知識,才能逐步解開密碼。

瓦爾迪斯普爾說:「這完全是機器與人工驗證者之間的來回過程。也許有一天,人工智慧能完全獨立完成。」

隱藏在密碼背後的,是萬德斯萊本對瑞典新教盟友派系威脅的警告。他告訴奧克森謝納,自己在得知盟友間的陰謀後,被迫從戰事中戰略性撤退,其中包括薩克森的弗朗茲.海因里希勳爵(Lord Franz Heinrich)。

圖書館

圖像來源,Getty Images

圖像加註文字,世界各地的檔案館與圖書館中保存著加密文本,這些文本可能包含珍貴的歷史資訊。

重啟冷案密碼

梅傑西 與她的團隊如今正在探索人工智慧如何跳過轉錄階段,直接分析頁面照片來解讀祕密訊息。他們最近展示了這種方法在簡單密碼上的可行性——即每個字母以單一符號替代。

他們將系統測試於一份 105 頁的手稿,即 科皮亞勒密碼(Copiale cipher),該手稿記錄了一個18世紀德國秘密社團的儀式、規則與理念。透過先以一般字跡訓練 AI,再輸入密碼特定行的影像與對應的德文解碼文本,系統能準確解讀先前未見過的部分。

這樣的系統在密碼原始語言未知時尤其有用。

「這為稀有與非標準書寫系統開啟了令人興奮的可能性。我們的最終目標是將轉錄與解碼結合為單一步驟,」梅傑西說。

瓦爾迪斯普爾與她在 Descrypt 計畫中的同事,一直在舊檔案中搜尋密碼文本,並將其編入資料庫。這可能至關重要,因為要訓練能破解密碼的人工智慧,需要足夠的數據。支撐 AI 聊天機器人的大型語言模型(如 ChatGPT)是以數兆字的書籍、文章和網站訓練而成;要找到相當規模的密碼數據則相當具有挑戰性。

在他們收集的材料中,包括400張來自19世紀末至 20世紀初的神祕明信片,皆以密碼書寫。少數已解讀的片段顯示,其中一些是用德文寫成的情書。

梅傑西的團隊利用這些工作,創建了一個 聊天機器人式 AI 工具,能在單一步驟中結合轉錄與解碼。該聊天機器人結合了基於密碼符號與其對應文字的解碼演算法,以及基於不同時期歷史文本訓練的大型語言模型,來提供解碼線索。它還融入了基於註解字跡訓練的影像識別演算法。此AI工具能透過專家使用時的修正來持續改進。

費斯托斯圓盤

圖像來源,Getty Images

圖像加註文字,距今四千年的費斯托斯圓盤——在克里特島米諾斯宮殿遺址中出土——其上的符號至今仍大多未被解讀。

這個構想是讓研究人員,甚至一般大眾,都能將加密的歷史文本交給聊天機器人,並獲得解讀結果。

研究人員在測試該 AI 聊天機器人處理博格密碼時,發現它能在 29 分鐘多一點的時間內翻譯並解碼 500 個符號的片段,甚至提供英文翻譯。它還記錄了解碼過程,並解釋為何解答合理,這對避免 AI「幻覺」或捏造解釋非常重要。

團隊最近也用兩份先前已解碼的密碼進行測試,這些密碼代表不同時期、語言、秘密代碼類型與複雜程度。系統同樣快速解碼,顯示它能處理各種密碼。

梅傑西說:「人工智慧最能幫助的是規模、速度、模式發現與任務整合。」

這類 AI 工具可能是破解至今仍難以解讀的歷史密碼的關鍵,也能協助處理那些以無人能讀的字母書寫的古代文本。例如,來自克里特島的 4,000 年歷史的費斯托斯圓盤(Phaistos Disc)至今仍未解讀,早期希臘語線形文字 A(Linear A)亦然。

「令我興奮的不僅是解開某個特定的歷史謎題,而是能創造出能協助研究人員處理各種案例的方法,」梅吉西說。