近日,羅徹斯特理工學院(Rochester Institute of Technology,RIT)的研究人員開發了一款數學公式辨識工具,名為Mathdesk。這是一個在線搜索界面,任何人都可以通過它輕鬆創建、編輯、檢索複雜的數學公式。該平臺對數學公式的檢索方式不同於單純的字符性質的檢索,它引入了機器學習等技術,從而可以更直接地識別出公式。
研究人員認為,人們對公式等「數學性關鍵詞」的網絡檢索需求正在不斷增長,但對許多人來說,如果對LaTeX等工具缺乏熟悉,想要準確地在電腦上鍵入複雜的數學公式是很困難的。
MathDesk正是為了解決這一問題而被創造的。該工具支持用戶以多種方式輸入公式,如手寫、圖片識別、LaTeX的數學公式標記語言等。這將極大地方便人們在閱讀論文的時候隨手查閱公式(截圖識別),或在電腦端快捷鍵入公式(手寫輸入)。此外,該工具同樣支持對公式進行關鍵詞檢索,比如鍵入Euler就能找出所有帶歐拉關鍵詞的公式及函數。
MathDesk能夠將鍵入的公式自動轉換成標準的LaTeX的數學公式標記語言,方便進一步檢索。用戶可以從11個搜尋引擎中進行選擇,包括標準搜尋引擎(例如Google)和以數學為中心的引擎(如Wolfram Alpha、Math Stack Exchange)。RIT學院副教授Anurag Agarwal表示:「有了這樣的工具,專業與非專業人士都將能更輕鬆地輸入特殊數學符號和複雜公式,並在搜尋引擎中快速有效地檢索相關詞條。此外,它還可以幫助不同學科的人們進行協作,使他們的發現得以共享。」
該界面在提高效率方面頗具深度,用戶可以隨時保存需要的公式以備使用,不必反覆輸入。公式的檢索結果以簡潔的卡片形式顯示,卡片還可展開其相關概念的名稱和簡要說明。
在識別用戶輸入的公式時,該工具藉助了機器學習技術,這是它能夠識別公式圖像和手繪符號的必要條件。MathDesk隸屬於MathSeer這個大型項目,後者得到了NSF和斯隆基金會近100萬美元的資助。項目負責人介紹說:「 MathSeer的目標是開發新技術來為公眾提供數學檢索的工具平臺。這涉及到了開闢新的搜索界面、用於圖像識別的AI算法以及優化公式檢索引擎等方面。」
為了提升MathDeck的使用效果,開發團隊必須更好地理解用戶的搜索行為:用戶是如何表達其查詢需求的?用戶傾向於查詢何種資料類型?此外,研發人員還指出,數學表達及符號通常具有多種含義並處在較強的上下文聯繫中。
首席開發人員Gavin Nishizawa介紹說:「從用戶的角度來看,輸入數學公式是一個很大的挑戰,因為數學對象通常是在『二維層面』進行表達,而鍵盤上僅能產生一個字符序列。為了使MathDesk能夠應對這種複雜性,我們利用我們在數學上的專長使系統&39;對象在數學意義上的細微差別,使其得以準確地表示和釋出公式中各個對象間的數學聯繫,從而提高檢索的有效性。」
在檢索過程中,MathDeck可以對公式的結構進行識別,並將其結構表示傳遞到神經網絡中生成嵌入向量,然後在各公式卡片中進一步比較,最終獲得檢索結果。這一檢索方式跳出了以字符性質的檢索,引入了圖形識別等人工智慧,用更高級的算法優化了公式的檢索過程。雖然實現的功能很基礎,但是其意義是更為深遠的。
RIT文檔和模式識別實驗室主任Zanibbi表示,開發團隊還計劃進一步擴展MathDeck,他們正在開發在大型PDF資料集檢索公式的技術,並進一步改善現有的公式識別及檢索功能。
研究人員表示:「數學周及無數複雜領域,若能使數學更方便地被使用,則也是為解決數學及科學中的許多問題盡了一份力。」
點擊https://mathdeck.cs.rit.edu/333333; --tt-darkmode-color: #A3A3A3;">即可查看MathDesk網站。