原標題:深度學習AI正在幫助考古學家翻譯古代碑
深度學習人工智慧正在幫助解決現代世界中的許多問題。但它也可以在幫助解決一些古老問題方面發揮作用,例如協助翻譯來自波斯阿契美尼德帝國(Achaemenid Empire)的2500年歷史的黏土平板文件。
這些藥片於1933年在現代伊朗被發現,已經被學者研究了數十年。但是,他們發現平板電腦的翻譯過程非常麻煩,並且容易出錯,該翻譯過程數以萬計。人工智慧技術可以提供幫助。
芝加哥大學計算機科學系助理教授Sanjay Krishnan告訴「數字趨勢」:「我們進行了應用機器學習的初步實驗,以識別平板電腦圖像中存在哪些楔形文字符號。」「機器學習通過從人類標記的示例中推斷模式來進行工作,這使我們將來能夠自動執行注釋。我們認為,這是對這些平板電腦的分析和研究實現重大自動化的一步。」
在這種情況下,帶有人標籤的示例是波斯波利斯要塞存檔(PFA)的在線文化和歷史研究環境(OCHRE)數據集中的帶注釋的平板電腦。在DeepScribe中,芝加哥大學東方學院的研究人員與計算機科學系合作,他們使用了6,000多個帶批註圖像的訓練集,建立了一個神經網絡,能夠讀取館藏中未經分析的藥片。當該算法在其他平板電腦上進行測試時,它能夠以大約80%的準確度翻譯楔形文字。希望將來可以提高此基準。即使沒有發生,該系統也可以用於翻譯大量藥片,使人類學者可以將精力集中在真正困難的地方。
「楔形文字是自公元前三千年以來使用的一種腳本,用於編寫包括Sumerian,Akkadian和Elamite在內的多種語言,」Assyriology副教授Susanne Paulus對《數字趨勢》表示。
楔形文字對機器翻譯提出了一系列特殊的挑戰。首先,它是通過將蘆葦筆打入溼粘土中來編寫的。這使楔形文字成為極少數的三維腳本系統之一。其次,楔形文字是使用數百個符號的複雜腳本系統。每個符號根據其上下文具有不同的含義。第三,楔形文字片是古老的人工製品。它們經常被打碎並且難以解讀,這意味著閱讀一臺平板電腦可能需要幾天的時間。
克裡希南說:「到目前為止,我們有一個初步的原型,表明這種技術在受控環境中非常有效。」「考慮到單個符號的清晰圖像,[我們可以]確定該符號是什麼。我們的下一步是開發考慮上下文和數據質量的更強大的模型。」