本文改編自IBM Think Blog
Watson要進軍好萊塢了?!是的。
由好萊塢大導演雷德利-斯科特親自擔當監製、其子盧克-斯科特執導的科幻恐怖片《Morgan》,近日發布了1分25秒的正式預告片。但是你應該不知道,真正的導演是Watson呢!
20世紀福克斯公司與IBM研究院聯手,共同為即將上映的懸疑恐怖電影《Morgan》製作了有史以來第一部「認知電影預告片」。福克斯公司希望探索利用人工智慧(AI) 製作恐怖電影預告片,從而為觀眾帶來緊張刺激的體驗。
電影具有極強的主觀性,恐怖電影更是如此。大家可以回想一下自己感覺最恐怖的電影(對我本人來說,是1976年上映的《兇兆》(The Omen))。我幾乎可以肯定,如果您問一下身旁的人,答案一定不同。恐怖片具有一定的情感模式和類型,但每位觀眾有不同的共鳴,這些模式和類型的錯綜複雜的相互關係正是人工智慧系統必須去識別並理解的,這樣才能製作出具有吸引力的預告片。我們的團隊面臨的挑戰不僅在於訓練認知系統理解「什麼是恐怖」,但更重要的是製作出一個對絕大多數觀眾來說足夠「恐怖和懸疑」的電影預告片。
圖片轉自sciencefiction
與任何人工智慧系統一樣,第一步需要訓練系統理解一個主題涉及的方方面面。藉助機器學習技術和試驗性的Watson API,我們的研究團隊將100部恐怖電影的預告片中的每個鏡頭分離出來,對Watson進行訓練,Watson會對這些預告片進行視覺、音頻、場景構成的分析:
1) 視覺分析以及人物、對象和場景的識別。每個場景都被Watson標記為一種情感,而這些標記來自於擁有24種不同情感的和22,000個場景類別的巨大資料庫,場景類別有諸如可怕、恐懼和喜悅等分類;
2) 電影背景音樂的音頻分析(例如人物的語調和音樂分貝),以理解每個不同場景與情緒的關係;
3) 每個場景的構成分析(例如拍攝位置、圖像設計和燈光),對傳統上組成恐怖和懸疑電影預告片的情節和拍攝類型進行分類。
系統對每個分類分別進行分析,並採用統計的算法將各個分析結果結合在一起。這樣Watson就可以「理解」哪些電影場景類型更適合做懸疑和恐怖電影預告片。
圖片轉自sciencefiction
接下來是真正的考驗了。我們將完整的影片《Morgan》導入到Watson中,在「觀看」了電影後,Watson迅速挑出了10個最適合製作預告片的電影場景。如果選擇不同的懸疑恐怖電影,例如《兇兆》,系統則可能選擇不同的場景類型。但對於喜劇,Watson則需要一組不同的參數做為挑選不同場景的標準。
值得注意的是,像這樣的創新項目不存在「絕對真理」。我們或者福克斯公司的團隊在正式開始之前都不知道最後的結果會怎樣。根據我們對系統的訓練和測試,我們知道溫情和懸疑場景會被列入候選名單,但我們不清楚系統會選擇哪些場景加進預告片。與大多數創造性的工作一樣,我們相信「眼見為實」。
圖片轉自fossbytes
我們的系統可以選出不同的場景時刻,但它並不是電影編輯員。我們與駐場的一位IBM電影製作人合作,安排並編輯每個Watson選出的鏡頭,最後匯總為預告片成片。大家會在後期添加的黑色字幕卡、後期音樂和預告片中場景順序方面看到他的專業能力。
果然不出意外的是,我們的系統從影片中選出了一些在其他《Morgan》預告片中未出現的時刻。系統使我們能夠以不同的方式看待影片中的時刻,這些時刻過去可能依照傳統不會被剪輯出來,但是現在被篩選後放到了備選名單上。另一方面,在審查系統選出的所有場景時,如果某個時刻不符合我們試圖表達的故事主線,我們就決定不採用。
過去,製作電影預告片會耗費大量人力,而且得完全依靠人工完成。團隊必須對長達幾個小時的影片進行梳理,最後手工選出每個可能成為備選的鏡頭。這個過程需要投入大量是財力和時間,製作預告片通常需要10天到一個月才能完成。
從90分鐘的影片中,Watson為製作人提供了一段長達六分鐘的影片。從Watson第一次「觀看」《Morgan》那一刻起,直到我們的製作人完成最後剪輯,整個過程由通常的10天到1個月,縮減到了短短的24小時。
將製作過程的時間從幾星期縮短到數小時,這就是人工智慧的真正強大之處。
圖片轉自technobuffalo
這是一次將「機器智能」與人類專業能力相結合的有力實踐。本次調查研究的領域只是我們希望機器和人類發揮巨大創意潛力的眾多領域之一。對待這一挑戰的解決方案不止一種,但令我們感到振奮的是人工智慧能夠增強每個人的專業能力和創造力的可能性。
人工智慧已經應用於多個行業:幫助科學家發現應針對某種疾病的潛在治療方案,或者幫助法律專家發現案件之間的聯繫等。電影預告片製作只是認知計算系統幫助人們探索未來的突破之一。