指南者留學定期推送留學資訊,專業介紹,申請故事,學長學姐在線講座等諸多優質內容,最接地氣、最有用的留學微信號!關注我們妥妥沒錯!
編者按:指南者分析是由我們指南者留學新推出的一個專欄。每篇文章都由我們的申請顧問和海外導師精心準備2周以上,千字乾貨,閱讀時間較長,但字字精華,建議收藏「食用」。歡迎各位小夥伴文末留言自己感興趣的專業與話題,我們會根據大家的需求酌情安排。
本文作者
指南者教育諮詢師王老師
CS專業分支中的熱門方向AI,熱門到什麼程度呢?基本上在我這裡諮詢的有一半以上申CS的同學,都想申AI。熱門的原因大致有兩點:第一是這個專業本身很有意思,聽著就很Fancy;第二AI方向的就業情況和前景確實非常好。本文主要從AI的主要工具、用途、以及申請AI需要的核心能力來介紹AI這個熱門方向。
AI主要有以下幾個主要子方向:
-Planning and Scheduling
-Machine Learning
(Supervised,Unsupervised,Reinforcement,Deep Learning)
-Natural Language Processing
-Perception
(Computer Vision, Speech Recognition)
-Motion and Manipulation
在AI的子方向中,有80%的學生都會選Machine Learning,這一塊是最熱門的。
人工智慧主要工具:
Search and optimization
第一個是 Search and optimization(搜尋和優化),在整個人工智慧領域,優化的過程非常重要。做各種預測和分析,都是選擇裡面最優結果展示給用戶,所以整個人工智慧都是基於優化的方案。
業界有這樣一句話:人工智慧是一門Art,不是Science。如果是Science,那麼你可以通過人工規定一套規則來嚴格定義,換句話說,只要掌握了規則,那麼你就可以戰無不勝,任何問題都可以解決。但如果它是Art,那麼它就無章可循,或者說不完全有章可循,很多東西是按照你的經驗去創造和發揮的過程。
很多的人工智慧的算法和方法,只要進入optimization,就會發現裡面會有很多經驗不完全是Science,那麼這恰好就是人工智慧領域最具魅力的地方,他不是一門呆板的science。所以很多人學人工智慧的原因就是因為它是非常靈活的,仁者見仁,智者見智。這就是這個學科的魅力所在。
Probabilistic methods for uncertain reasoning
第二個工具是Probabilistic methods for uncertain reasoning,這個意思就是整個人工智慧都需要針對不確定的情況進行分析。一個算法算出的結果往往不止一個,每個結果都有一定的概率,給用戶最後的recommendation是將每個結果的概率進行加權平均最終得到的結果。
比如天氣預報,任何的氣象部門其實都不知道颱風的具體路徑,只能推測出十個可能性,每個路徑都有一個概率,通過這樣的分析後能夠綜合考量不同的可能性,最後綜合給出最可能的路徑,因而你看到的天氣預報的結果是來自於加權平均的結果。
這樣一來,整個人工智慧都需要處理好概率問題。統計基礎實際上是非常核心的部分,整個算法的設計都以此為基礎,所以申請AI一定要有統計基礎。
Statistical regression and classification
Regression的中文翻譯叫「回歸」或者「擬合」,Classification的意思是「分類」。它們的共同點是兩者都是對一個對象進行甄別或者貼標籤。不同在於分類的過程就是貼標籤的過程。Classification像是個是非題,不是A就是B。而Regression的變化是連續的,比如判斷一個人的人品給他進行打分,從最壞到最好是0到10分,比如可以是1.3,也可以是5.8。那麼這樣的給他連續的score過程就是Regression的過程。所以Classification是離散的,而Regression是連續的。在Machine Learning的很多地方,都要用到統計知識,所以需要AI申請者對統計一個深刻的認識。
事實上在整個CS領域,只有人工智慧方向是特別需要統計知識的。如果你本科學的就是統計,想轉CS,那麼申請AI方向就能最大化地體現你的優勢。
Neural Networks
第四個工具是Neural Networks,這是目前最熱門的手段,本身門檻也比較低,這方面其實是對應Deep Learning的方向。廣泛應用於圖像、聲音以及語言的識別等各方面。這裡面還有很多子方向比如卷積神經網絡、遞歸神經網絡等。關於這方面的門檻其實是很低的,哪怕你是文科生,只要花一個月的時間去學都能學會,因為這個工具本身不難。因為用途廣泛,所以現在也很熱門。
Control theories
第五個是Control theories,這個工具在機器人控制方向大量使用,AI方向有一個子方向是機器人控制,機器人控制裡有很多控制理論。這不是一個簡單的二元信號,而是非常複雜的信號,裡面還包括很多算法,比如模糊控制、PID控制等算法,那麼這部分也屬於人工智慧,也就是Control theories。
AI在不同領域的主要用途:
人工智慧領域,有五個主要用途:
1Business
第一就是Business(商業用途),包括IT、零售業,這是人工智慧比較大的應用領域。舉個例子,比如有人網購了一個奶瓶,那麼系統進行分析就能預測到這個用戶一定有孩子,根據你購買奶瓶的size,也能預測你的孩子是幾個月大。根據分析,當你下一次登錄這個網站的時候,系統就會給你推薦一些你可能需要的商品。這一方面能方便顧客,另一方面又能擴大商機。這個部分其實是商業營銷中的一個很大的方向——E-Business(電子商務),電子商務裡的一個方向Customized Marketing就是針對客戶的特點做定點營銷。這些技術的實現都需要靠人工智慧。
2Healthcare
當然,我上面說的是零售業,但其實商業不同的領域都會用到這樣的技能。比如Healthcare(健康醫療業)在美國是很大的一個市場,七八十年代的時候,由於美國出現嬰兒潮,很多家庭都狂生孩子,導致現在人口老齡化,而美國子女是不會去照顧老人的,老人要自己想辦法找護工照顧自己,由此美國的醫療護理行業蓬勃發展,在市場上有很大的需求。
在Healthcare裡,很多工作都是依靠人工智慧來做。比如現在很多開藥方都是靠人工智慧進行自動開藥(如微軟的Hanover系統),主要是根據病人的診斷書自動向病人開藥,這在美國廣泛使用。再比如有個學科叫影像學,會根據你拍的片子,如CT、核磁共振、X-ray等來分析你的情況,檢測出各種病症。而現在影像學的行業逐漸被人工智慧所取代,在美國的很多醫院都是靠人工智慧的算法自動識讀片子,再給病人做診斷。
3Automotive
再比如Automotive汽車行業方面,人工智慧用途也是非常廣,這裡主要談一下autopilot(自動駕駛儀),主要是通過一個算法,通過一個攝像頭或者一些傳感器去搜集汽車周圍的一些信息,從而進行分析,達到指導駕駛過程的目的。而它的實現要靠autopilot。現在在全世界範圍內主要由三大公司來做autopilot,分別是Tesla,Google和Apple。這三大公司如今在不遺餘力地開發這個汽車的自動駕駛儀,所以這個其實也是一個很大的應用。
4Finance
第四是Finance。首先就是Fraud detection,這在美國和全世界已經廣為應用了。主要是通過人工智慧的算法自動檢測欺詐行為,比如假支票、假帳號等網上欺詐行為。通過人工智慧算法自動分析後向用戶提供警告。
其次是算法交易。比如炒股票或買賣一些比較複雜的金融衍生品,如期權和期貨之類,那麼這些就叫交易。以前做交易都是靠trader,以後就會變成自動交易,也就是算法交易(algorithmic trading)。其實這方面現在是整個金融行業的一個趨勢,算法交易非常迅速,每毫秒就可以做一萬次交易,比人要迅速得多。又快又能綜合分析整個市場的信息,使交易行為更加明智。所以一旦技術成熟,現在很多銀行的交易員會失業。現在很多大投行,比如高盛,都在逐漸開發自己的這套算法,這是整個Finance行業的大趨勢。
5Video Game
最後一個是Video Game。人機對戰遊戲其實就運用了很多人工智慧的技術,我知道很多學人工智慧的學生畢業後都去了各大遊戲公司。
AI核心數學基礎
本質上講,整個CS就是一門應用數學,CS的核心就是數學,但不同的子方向可能對數學要求不一樣,所以我簡單提一下人工智慧方向有哪些知識需要特別掌握。
整個數學雖然博大精深,但是不外乎兩個大方向:純數學(Pure Math)和應用數學(Applied Math)兩個大分支。純數學包括Quantity(arithmetic),Structure(algebra,圖論,數論,組合數學), Space (geometry), Change (微積分)。應用數學包括優化,統計和概率,流體力學,數值分析,密碼學,控制理論,常微分和偏微分方程。
在數學中,具體和人工智慧相關的只有4個方向,在純數裡有兩個,分別是圖論和微積分;在應數裡也有兩個,分別是優化、統計和概率。申AI專業數學的這四大方向是一定要了解的。
AI核心專業課程
數學課程:線代、微積分,概率論和數理統計,隨機優化,Monte Carlo方法,優化(linear,nonlinear,quadratic,convex programming),離散數學
計算機基礎:算法,數據結構,一門偏統計的程式語言如Python,Matlab,R
雖然CS不同子方向都需要編程,但不同的方向需要掌握的程式語言並不一樣。針對人工智慧方向,主要需要掌握Python,Matlab,R這三門程式語言。由於整個人工智慧是以統計為基礎,而這三門語言都特別強調統計分析。
計算機高級:人工智慧,機器學習,數據挖掘
計算機高級課程包括人工智慧、機器學習和數據挖掘。這些課都是研究生階段才上的課程,但如果你能有超前的學習意識,能在本科階段能提前修這些課程,申請的時候肯定是能夠加分的。
其它方面的核心能力
數學建模能力
對於人工智慧而言,數學建模是非常關鍵的一部分。無論你用任何人工智慧方法來解決問題,(比如金融、汽車駕駛、圖像識別等問題)都需要把一個具體問題進行抽象(abstraction)和簡化(simplification),完成以後再作假設,最後再作敏感性分析。敏感性分析的意思是換一換參數,看參數變化對你的結果有多大影響的一個過程。這些剛好就是數學建模的核心部分,整個人工智慧的問題都是以此為基礎,所以一定要在申請時好好體現數模能力。
其它領域的知識
如果你能同時具有其他領域的知識,申請的時候也是亮點。因為人工智慧強調深度和廣度。廣度的意思是人工智慧本身沒有任何價值,只有把人工智慧用到其它領域才有價值。如果你本科是學金融、電子或機械,申AI是有背景優勢的,因為他們可以很自然地將人工智慧應用於相應的領域,所以如果想轉專業申請人工智慧,一定要在文書中充分利用自己本科所學的知識。
實習
人工智慧在實驗室和工業界的實習機會是很多的,申請的時候最好有相關的實習。和人工智慧相關的公司主要有:MSRA(微軟亞洲研究院)、百度、騰訊和阿里巴巴。這些公司會招很多實習生做人工智慧,我們今年就有申請AI的學生在百度實習過,這段實習是為他的申請是加分不少的。
AI會議
AI領域會議非常多,如KDD(data mining), SIGIR (information retrieval), IJCAI (AI), NIPS (Machine Learning), ICDE(Data Science),這些會議能給學生提供short paper的機會,如short paper session,for demo,workshop paper,abstract,student paper之類。對於這些會議而言,是很難發表一篇長文章的,但如果你的目的僅僅是想去掛個水,發表一些短文章,那麼門檻還是比較低的。並且這個paper對申請是非常有幫助的。
以上就是對CS的熱門AI方向的專業解析,如果想了解更多關於AI申請的細節,可以進一步和我溝通。