人工智慧技術應該是當今計算機技術中最熱門、發展最快的技術。而人工智慧技術也是計算機最重要的一個發展方向和趨勢。人工智慧雖然發展了幾十年,但是現在仍然處於發展期,技術仍有待提高。
計算機網絡與人工智慧的結合構成了新的Web3.0,它是新一代的網頁標準,是一個人工智慧的網絡,也叫語義網。
人工智慧的關鍵技術是模式識別,而且在當今有著廣泛的應用。模式識別主要有文字識別、語音識別和圖像識別技術。
01文字識別最常見的是手寫輸入和光學字符識別(OCR)
手寫輸入到現在為止已經發展得非常成熟,我們經常使用手機的手寫輸入來錄入文字,識別的準確率已經達到了98%,特別是對於老人和小孩這種不會打字的人群使用手機和平板提供了方便,也讓電腦、平板和智慧型手機擁有了更大的用戶群。不僅僅是比爾·蓋茨在四十年前所預言的:「我要讓世界上每一個家庭都擁有計算機」,可能在將來的某一天,我們每一個人都可以擁有計算機、平板或手機。
光學字符識別系統(OCR):早期掃描儀用的非常廣泛,但是掃描的文檔信息卻是一張圖片,不是文字,怎樣將掃描的文檔識別為文字呢?光學字符識別系統就是將圖片識別為單個可編輯的文字的軟體,但是因為數位相機和手機相機的大量使用,掃描儀現今使用的並不廣泛。而光學字符識別系統識別的準確率並不高,在字體發生變化,字體大小太小,文本背景不是純白色時識別起來都會出現問題。這就是為什麼我們註冊時使用的驗證碼都是那些看得不太清楚的字符,它就是為了防止機器識別,造成惡意大量註冊。要是光學字符識別能達到很高的準確率,那麼文本型的驗證碼也就會從此消失了。
02語音識別
語音識別應該是所有模式識別技術中最關鍵和最重要的技術。一旦語音識別能達到高級階段,人工智慧也就很容易達到高級階段。因為語音技術可以直接將人的語音轉換成命令,而計算機或機器人一旦執行對應的命令就能完成我們的任務。例如:你說話,機器人如果能識別你的語音,就能將你的語音轉換成命令進行執行,就能完成你的任務,那時機器人為你上課、為你就醫、為你做飯、為你打掃衛生、為你工作都不是難事了。所以語音識別技術是模式識別,同時也是人工智慧的關鍵技術。
語音識別技術最常見的是語音輸入,我們說話,就能對應為我們將語音轉換為文字進行錄入,語音識別沒有手寫輸入識別率高,但是語音識別的效率更高,錄入的更快。
微軟在Windows10中加入的核心技術Cortana(微軟小娜)就是語音識別技術。
蘋果公司的Siri也是語音識別技術,而且是蘋果公司的重大創新和大力發展的一項人工智慧技術。
Google和百度的語音搜索以及Google公司的語音翻譯軟體都是語音識別技術。
03圖像識別
圖像識別技術在近幾年發展特別快,技術也相對比較成熟。圖像識別技術比較常見的指紋識別、人臉識別、圖像搜索技術已得到了廣泛的應用。
指紋識別在手機上成了標配,上班打卡一般都是用的指紋機。
人臉識別是近兩年來快速發展的技術,由於人臉識別的廣泛應用,第三代身份證在有的城市已經出現,它變成了電子的人臉識別身份驗證。人臉識別不僅應用於門禁系統,而且支付系統的廣泛應用,身份真實性驗證也得益於人臉識別技術的成熟。
圖像搜索功能也得到了快速的發展,相機拍片搜索技術也在應用。公安系統通過在幾萬甚至幾十萬中對比犯人的圖片搜索定位正在得到廣泛應用。旅遊景區的圖像搜索跟蹤人物讓小孩走丟情況不再是難題。
計算機技術的發展推動了社會的進步,而計算機技術不僅能代替我們的體力勞動,更重要的是它正在逐步代替我們的腦力勞動。而人工智慧的出現則是讓計算機發展達到一個更高級的階段。人工智慧的廣泛應用,需要有模式識別技術的重大突破和創新,而模式識別中的文字識別、圖像識別和語音技術現在正在快速發展,其核心語音識別技術也得到了廣泛的應用。