深度學習AI正在幫助考古學家翻譯古代碑

2020-12-18 AI資訊

原標題:深度學習AI正在幫助考古學家翻譯古代碑

深度學習人工智慧正在幫助解決現代世界中的許多問題。但它也可以在幫助解決一些古老問題方面發揮作用,例如協助翻譯來自波斯阿契美尼德帝國(Achaemenid Empire)的2500年歷史的黏土平板文件。

這些藥片於1933年在現代伊朗被發現,已經被學者研究了數十年。但是,他們發現平板電腦的翻譯過程非常麻煩,並且容易出錯,該翻譯過程數以萬計。人工智慧技術可以提供幫助。

芝加哥大學計算機科學系助理教授Sanjay Krishnan告訴「數字趨勢」:「我們進行了應用機器學習的初步實驗,以識別平板電腦圖像中存在哪些楔形文字符號。」「機器學習通過從人類標記的示例中推斷模式來進行工作,這使我們將來能夠自動執行注釋。我們認為,這是對這些平板電腦的分析和研究實現重大自動化的一步。」

在這種情況下,帶有人標籤的示例是波斯波利斯要塞存檔(PFA)的在線文化和歷史研究環境(OCHRE)數據集中的帶注釋的平板電腦。在DeepScribe中,芝加哥大學東方學院的研究人員與計算機科學系合作,他們使用了6,000多個帶批註圖像的訓練集,建立了一個神經網絡,能夠讀取館藏中未經分析的藥片。當該算法在其他平板電腦上進行測試時,它能夠以大約80%的準確度翻譯楔形文字。希望將來可以提高此基準。即使沒有發生,該系統也可以用於翻譯大量藥片,使人類學者可以將精力集中在真正困難的地方。

「楔形文字是自公元前三千年以來使用的一種腳本,用於編寫包括Sumerian,Akkadian和Elamite在內的多種語言,」Assyriology副教授Susanne Paulus對《數字趨勢》表示。

楔形文字對機器翻譯提出了一系列特殊的挑戰。首先,它是通過將蘆葦筆打入溼粘土中來編寫的。這使楔形文字成為極少數的三維腳本系統之一。其次,楔形文字是使用數百個符號的複雜腳本系統。每個符號根據其上下文具有不同的含義。第三,楔形文字片是古老的人工製品。它們經常被打碎並且難以解讀,這意味著閱讀一臺平板電腦可能需要幾天的時間。

克裡希南說:「到目前為止,我們有一個初步的原型,表明這種技術在受控環境中非常有效。」「考慮到單個符號的清晰圖像,[我們可以]確定該符號是什麼。我們的下一步是開發考慮上下文和數據質量的更強大的模型。」

相關焦點

  • 機器學習吧面向ai的中文機器學習資源與分享平臺
    關於自動化機器學習的研究很早以前就有過非常系統化的論文和書籍,如果你感興趣我推薦一下孫向祥的機器學習分析,然後是西方機器學習理論,英文版的如果你沒時間翻的話國內有很多人翻譯過譯作,如果你時間多可以看coursera的opendatamlcourse如果你時間有限我推薦你這門early-resolutionmachinelearning
  • 鈦媒體專訪深度學習奠基人特倫斯:人類智慧與AI正在融合,量子計算...
    深度學習奠基人——特倫斯·謝諾夫斯基人工智慧技術正在重塑商業和社會形態。當阿法狗擊敗李世石,無人駕駛和醫療科技逐漸落地時,應用背後的深度學習技術正逐漸走向大眾視野。深度學習是推動人工智慧落地的重要力量,但令人驚訝的是,深度學習卻是由一群在當時被視作「非主流」的科學家創造的。
  • 十行代碼就能搞定深度學習?飛槳框架高層API,一起輕鬆玩轉AI
    機器之心發布機器之心編輯部嚮往深度學習技術,可是深度學習框架太難學怎麼辦?百度傾心打造飛槳框架高層 API,零基礎也能輕鬆上手深度學習,一起來看看吧?另:文末有福利,一定要看完呦~高層 API,What深度學習作為人工智慧時代的核心技術,近年來無論學術、還是工業領域,均發揮著愈加重要的作用。然而,深度學習理論太難學,開發過程太複雜,又將許多人拒之於深度學習的門外。
  • 搜狗翻譯推出國內首個AI寫作助手,開啟外語學習智能化新篇章
    近日,搜狗翻譯推出國內首個AI寫作助手,通過藉助先進的人工智慧算法對英文作文進行實時語法和拼寫糾錯,並提供專業的語句潤色優化建議,從「糾錯」到「潤色」,一站式解決英語寫作常見難題。以AI寫作助手為代表,搜狗翻譯正不斷探索高效的英語學習方式,推動外語學習智能化。
  • 深度學習「壟斷」!分析17萬篇AI頂會論文,他們首次揭示了計算資源...
    的確,深度學習時代,學術界計算能力的不平等正在進一步加劇不平等。    論文地址: https://arxiv.org/pdf/2010.15581.pdf  「深度學習壟斷」:中低排名高校的研究資源正在被蠶食
  • 吳恩達deeplearning.ai五項課程完整筆記了解一下?
    項目地址:https://github.com/mbadry1/DeepLearning.ai-Summary上周吳恩達在推特上展示了一份由 TessFerrandez 完成的深度學習專項課程信息圖,這套信息圖優美地記錄了深度學習課程的知識與亮點。這一份信息圖的詳細介紹請查看:這是一份優美的信息圖,吳恩達點讚的 deeplearning.ai 課程總結 。
  • MIT警告深度學習正在逼近計算極限,網友:放緩不失為一件好事
    機器之心報導參與:魔王、杜偉MIT的一項研究認為,深度學習正在逼近算力極限。深度學習需要大量數據和算力,這二者的發展是促進這一次人工智慧浪潮的重要因素。但是,近期 MIT 的一項研究認為,深度學習正在逼近算力極限。這項研究由 MIT、MIT-IBM Watson AI 實驗室、延世大學安德伍德國際學院和巴西利亞大學的研究人員開展,他們發現深度學習的進展「極大地依賴」算力增長。他們認為,深度學習要想繼續進步,需要更加計算高效的深度學習模型,這可以來自於對現有技術的更改,也可以是全新的方法。
  • 還在為入門深度學習發愁嗎?其實你只需要一周的時間
    大年初八,百度飛槳組織了一個神奇的「深度學習 7 日打卡營」。由百度深度學習認證布道師親自授課,只用了 7 天時間,就幫助 1000 多名小白開發者,高效的入門了深度學習。學習期間,開發者們每日實踐、打卡如火如荼,不少同學為了提高精度刷榜到深夜,我們的布道師也奉陪到底,起早貪黑的為大家答疑與批改作業。隨著上一期 7 日打卡營的落幕,同學們紛紛表示:不過癮、要繼續!應大家所願,作為最寵粉的我們必須安排!時隔一周,我們再次啟動了最新一期的深度學習 7 日打卡營(Pro 版)。保障課程質量與服務的同時,還新增案例,讓知識更加豐富!
  • 2021,要不斷學習!吳恩達等 AI 大佬發表新年寄語
    吳恩達在 Deeplearning.ai 網站的 The Batch 網刊上發布新年寄語,希望給熱愛深度學習的朋友們一些參考。 去年,吳恩達分享了自己每年寒假都會閱讀很多的書,制定一個學習的小目標,即使是度假也會帶著沉重的書箱子,這些都對 Coursera 的創立有所幫助。
  • 深度學習面試寶典(含數學,機器學習,深度學習,計算機視覺等)
    深度學習面試寶典這是一個在 github 上開源的 深度學習面試寶典,收集和整理了很多相關的知識。相關收集內容 自我介紹 數學 機器學習 深度學習 強化學習 計算機視覺 傳統圖像處理 自然語言處理 SLAM 推薦算法 數據結構與算法 程式語言 深度學習框架 面試經驗 面試技巧 其它深度學習001 神經網絡中的Epoch、Iteration、Batchsize神經網絡中epoch與iteration是不相等的batchsize:
  • 商務翻譯難,AI來幫忙
    人工智慧只是解決方案的一部分與基於雲的模型一樣,SYSTRAN系統也在使用無監督學習。不過,它為每個行業使用一個更加精確的數據集用於訓練系統。神經網絡只是系統邏輯的一個組成部分。鑑於許多語言中有特定術語,在神經網絡的前後處理中使用程序邏輯,有助於應用業務部門的明確規則和術語。
  • 「我是來打醬油的」怎樣翻譯成外語?「雲上曲率」以AI翻譯幫助遊戲...
    杜曉祥認為,在遊戲聊天中,經常出現的口語、俚語(或方言)、遊戲專有名詞、縮略語等,使常規翻譯平臺並不能高效準確翻譯。此外,市面上的常規內容審核產品與用戶自研詞庫,對於網遊中的敏感詞(涉政、色情、暴恐、辱罵、廣告等)也基本是「一刀切」,導致玩家的正常交流時常受到幹擾。
  • 天才黑客George Hotz開源了一個小型深度學習框架tinygrad
    George Hotz 開源了一個小型深度學習框架 tinygrad,兼具 PyTorch 和 micrograd 的功能。 在深度學習時代,谷歌、Facebook、百度等科技巨頭開源了多款框架來幫助開發者更輕鬆地學習、構建和訓練不同類型的神經網絡。而這些大公司也花費了很大的精力來維護 TensorFlow、PyTorch 這樣龐大的深度學習框架。   除了這類主流框架之外,開發者們也會開源一些小而精的框架或者庫。
  • 考古學家稱復活節島石像為古代宗教路線一部分
    考古學家認為這些石像是被人沿一個特意修建的路線網擺放的。但考古學家一直更鍾情於不是冤家不聚頭的理論——它們是被人沿一個特意修建的路線網擺放的。 復活島上的巨型石像一直困擾著考古學家和探險家,但是近一個世紀以來第一個到達該島的英國考古遠徵隊得出的最新結論推翻了個流傳了50年的說法,考古學家認為,這些石像是復活島古代道路系統的一部分。
  • ai必須掌握在自己手中,不可能由別人替代
    人工智慧熱潮湧動,自動駕駛競爭也愈演愈烈,車企也在逐步宣布開啟ai落地探索。車企ai布局以及巨頭如何抓住機遇順勢而為不斷推出ai戰略,這將是這個系列的最大看點。第一,蔚來cvlab與人工智慧結合非常緊密,是全球ai領域裡在基礎研究方面做得最好的團隊之一,擁有超過50%的未來學習率,也已經與2018年申請了ai申請專利。其次,作為人工智慧從業者來講,你幾乎可以看到以下更多的ai相關技術。比如我們都知道,nlp的優勢就是比人類閱讀速度快很多,但只是閱讀速度,針對語義的理解,是遠遠不夠的。
  • 不到1000行代碼,GitHub 1400星,天才黑客開源深度學習框架tinygrad
    機器之心報導機器之心編輯部最近,天才黑客 George Hotz 開源了一個小型深度學習框架 tinygrad,兼具 PyTorch 和 micrograd 的功能。
  • 支持108種語言的谷歌翻譯如何用AI讓翻譯質量越來越好?
    有噪音的數據和轉移學習另一個翻譯性能提升來自更好地處理訓練數據中噪聲的建模方法。觀察到有噪聲的數據(含有大量無法正確理解或解釋的大量信息的數據)會損害語言的翻譯,因此Google翻譯團隊部署了一個系統,該系統使用經過訓練的模型為示例分配分數對嘈雜的數據進行調優,並對「乾淨的」數據進行調優。
  • 2019 年 1 月 AI 最佳網文榜單最新出爐!
    我們本月榜單中的文章主題涵蓋強化學習、自然語言處理、人工智慧立法等。如果大家想要跟著這些教程進行實際操作,建議準備好一個 Python 環境。首先不妨來看一個本月的笑話:「當收到的大部分正面反饋都是挖苦的時,研究人員很難對深度學習算法進行訓練。」1.當 AI 在繪畫時,它在想什麼?
  • 全球三十大最佳 AI 創業公司公布
    4、Drive.ai(GGV紀源資本被投企業) Drive.ai 成立於 2015 年,是一家位於矽谷的自動駕駛公司,其主要成員來自史丹福大學人工智慧實驗室。公司專注研究深度學習在自動駕駛中的應用,致力於通過工具包將普通汽車變為無人車。
  • 即時翻譯、瞬間排版,這個基於漫畫的AI系統居然想消滅漢化組?
    這項AI技術不僅提升了漫畫翻譯的速度,翻譯的成本也降低了60-70%。說到這,文摘菌想到AI也曾幫助中國爽文成功出海,看來AI對文化產業仍然有十分重要的貢獻。這個項目在開發初期就接受到了來自東京大學FoundX計劃、IPA、東大IPC計劃的支持。