累計設計 10 億次海報,阿里 AI 設計師「魯班」核心技術詳解

2021-01-07 雷鋒網

2018 年 4 月 21 日,在阿里巴巴 UCAN 用戶體驗設計論壇上,「魯班」創始人、阿里巴巴智能設計實驗室負責人樂乘向現場觀眾展示「魯班」的設計能力,臺下掌聲雷動。

這是一場以設計師為主要觀眾的論壇,對於設計師來說,他們的工作往往包含許多重複性體力勞動,比如裁切素材、調整圖片大小、修正白平衡等,而「魯班」基本上能包攬上述絕大部分內容,這大大解放了設計師的雙手。

「魯班」是阿里巴巴自研的一款設計人工智慧產品,目前累計設計 10 億次海報。據雷鋒網 AI 研習社了解,2017 雙 11 期間,魯班一天製作 4000 萬張海報,並且每張海報都是根據商品圖像特徵專門設計。

據樂乘介紹,「魯班」的設計能力已經接近高級設計師水平,他們將會開放「魯班」的一鍵生成、智能創作、智能排版、設計拓展四個核心能力,目前有 100 個免費內測名額,大家可以點擊 luban.aliyun.com 申請。他表示,在未來,即使是設計小白,也可以通過「魯班」一鍵生成自己的海報。

「魯班」的核心算法技術由阿里巴巴達摩院機器智能技術實驗室研發,在強化學習、平面設計美學量化評估、知識圖譜方面分別聯合倫敦大學學院、清華大學、浙江大學團隊。得益於深度學習、增強學習、蒙特卡洛樹搜索、圖像搜索等技術以及大量設計數據,「魯班」可以通過自學獲得設計能力。

雷鋒網 AI 研習社了解到,「魯班」包括規劃網絡、行動器、評估網絡三大核心部分。

圖:「魯班」進行風格學習

規劃網絡的基礎來源於設計師的創意設計模板和基本元素素材,設計師將大量設計素材進行結構化數據標註,最後經由一系列人工智慧網絡學習,輸出空間+視覺的設計框架。

圖:元素分類器對輸入的素材進行識別及分類

行動器根據「魯班」收到的設計需求,從學習網絡中抽取設計原型,並從元素中心中選取元素,規劃輸出多個最優生成路徑,完成圖片設計。

圖:魯班行動器規劃最優設計生成

評估網絡的工作原理是輸入大量的設計圖片和評分數據,訓練魯班學會判斷設計的好壞。

圖:評估得分

作為阿里巴巴智能設計實驗室負責人,樂乘主要負責「魯班」的數據、產品、設計和業務,達摩院機器智能技術實驗室資深算法專家星瞳則負責算法技術及後臺視覺生成引擎系統,包括數據的分析處理,在線、離線流程,各類機器學習算法的研究。雷鋒網 AI 研習社針對「魯班」背後的技術細節與他們進行探討,整理如下。

問:「魯班」即將達到人類高級設計師水平,它的這一設計水平是如何衡量的?具體的考慮因素有哪些?

答:魯班的設計取決於人類輸入,輸入水平決定了輸出水平,我們有一個專門的團隊來訓練「魯班」,目前它學完之後可以達到中級設計師水平,而想要達到高級水平,需要用到更大規模的數據,預計在今年下半年可以實現。

對於設計水平的衡量,需要從多個維度來考慮:

第一,從設計的合理性、美感上評估,這更多是設計行業評判設計師水平的通用標準。

第二,生成圖片的使用效果如何。

第三,從美學和藝術的角度,這裡可能不同的人會有不同的看法,這一部分也需要設計師參與評估。

問:「魯班」項目 2015 年底啟動至今,有哪些比較重要的時間節點?

答:總的來說有三個節點。

我們在兩年多前,有了研發魯班的想法,先做出了第一個 Demo,這是第一個節點。第二個節點是 2016 年的雙十一,我們想真正規模化地應用這一系統,當時,針對集團的特定場景,開發了一個版本,那個版本最重要的貢獻,就是能夠真正大規模地輔助線上系統。但是那時候「魯班」主要是針對阿里的一些場景應用,與外界目標群體的需求存在差異,之後我們又集中精力進行了這方面的研發,到目前,能滿足不同群體的需求。這是第三個比較重要的節點。

通過時間的積累、越來越多的資源投入以及大家的一起努力,魯班現在在某些場景下能輸出很不錯的結果。

問:「魯班」對硬體的要求如何?

答:「魯班」依賴於 GPU,目前大概需要幾百個 GPU。同時,這一系統具有伸縮性,在雙十一活動的高峰期,需要的 GPU 多一些,平時相對來說少一些。

問:「魯班」系統在設計過程中,需要的原始數據量有多大?

答:2016 年雙十一,我們利用「魯班」設計出 1.7 億張海報,那是比較早期的摸索。2017 年雙十一,「魯班」設計了 4 億張海報,那時候我們投入了十多人的設計師團隊,他們會創作出少量的元素以及符合雙十一要求的基礎數據,在投入數據規模方面,當時種子數據的量級在千級別,隨著應用規模擴大,種子數據也有數量級的擴大。

問:在標註數據方面,需要投入大量人力成本,你們是如何解決這一問題的?

答:總的來說,啟動的種子(需要極大人力投入的數據)在前期必不可少,但魯班是一個不斷進化的閉環系統,它具有自我評估能力,機器產生的數據,一部分可以直接用,還有一部分,可以經過人工的參與,去做進一步清理、編輯、打標等。隨著處理數據越來越多,算法的力量越來越強大,人力成本會不斷降低,之後,系統會越來越好,數據會像滾雪球一樣往前走。

問:支撐「魯班」系統的核心技術有哪些?

答:你可以認為「魯班」系統是對 AI 算法的集中。

這一系統比較複雜,其中有針對設計數據的分類和分割算法;在線規劃生成的時候,又有一些序列學習算法;同時,還使用到一些多 Agent 強化學習算法;此外,我們也使用了一部分 GAN 的方法;還有一系列其他的方法,比如大規模檢索或特徵表達。

算法層面,我們基本上覆蓋了現在比較新的技術。此外,我們還會用到大規模分布式數據處理技術。

問:「魯班」背後主要的技術難點有哪些?

答:我們前前後後花了兩年多時間來研究「魯班」系統,因為以前並沒有比較好的可供參考的案例,很多技術及解決方法都要靠我們自己去探索。

雖然業界有很多利用 GAN 去做生成的案例,但這些技術並不能達到我們的目標——可控數字內容的生成。

此外,我們既要能滿足可控,又要生成用戶想要的內容,還得保證圖片質量以及生成速度。

另外,還有幾個典型問題:怎麼利用多 Agent 強化學習,從粗到細地生成中間的結構;怎麼利用一些特殊的特徵去描述各種各樣的元素;還有最基礎的圖像理解、對象分割問題。

目前,「魯班」系統不可能像一般的深度學習算法,直接端對端就可以達成目標,相對來說它的邏輯比較複雜,使用單一的算法不能達到我們的目標。

問:前面提到多 Agent 強化學習,能具體解釋「魯班」中的這項技術嗎?

答:這是我們與 UCL 汪軍老師團隊合作的一項技術。

具體來說,系統會根據用戶的需求,得到一個非常粗粒度的結果,例如把一張圖或者一個目標變成多個組成部分,可以將這些組成部分稱為元素或者量化單元,並把它當做一個 Agent,這些 Agent 單獨不能決定結果的好與壞,只有多個 Agent 同時才能決定。可以認為這是一個組合優化問題,這裡就會用到多 Agent 強化學習技術。

問:未來還會基於已有的算法做出哪些改進與創新?

答:未來還有很多需要鑽研的地方。

第一,基於 GAN 的一系列學習,尤其是照片級別、像素級別的生成算法,我們希望與學術界或業界不斷合作、實驗。

第二,我們的系統還是過於複雜,所以想找到比較好的系統工程辦法,使得各方面都能更加高效。

第三,在設計知識圖譜這一領域,希望與外界合作,做得更加完善和靈活。

第四,我們希望能更好地量化生成效果,設計水平是很難衡量的,我們希望在這裡做出一些探索和改進。

我們目前的願景是「所想即所見」,即用戶想要什麼圖像,「魯班」就生成什麼樣的圖像。同時,我們也希望打造出能面向各種各樣場景、實時在線、高效且惠普地生成高質圖像的輔助系統。

相關焦點

  • 兩年製作10億張海報,阿里巴巴「AI 設計師」養成記
    2015年的雙十一之後,淘寶設計事業部聯合淘寶技術部、搜索推薦算法團隊、iDST(數據科學與技術研究院)共同成立「魯班」項目,希望以 AI 機器人代替設計師進行海報製作。在2016年、2017的雙十一,魯班依次製作了1.7億、4億張海報。截止目前,魯班已累積設計10億次海報,該項目也發展成為「阿里智能設計實驗室」。
  • 百萬設計師真要失業了!阿里智能AI一秒可做8000張海報!
    不過去年只是測試,今年的「魯班」正式上崗後,任務量更加驚人!2017年雙11將有4億張Banner由魯班設計,約等於每秒做8000張海報!通過大數據對海量的設計原始文件中的圖層做分類收集處理,把海報的組成元素進行分解,分解成背景層、產品、文字等元素,然後進行深度學習後批處理成統一風格海報。
  • 一天100張海報難倒設計師?這款人工智慧可以一天設計10億張海報
    這款人工智慧可以一天設計10億張海報 iwangshang / 黃天然 / 2020-01-08 摘要:老闆提出的「非人類」要求,交給「非人類」去解決吧 天下網商記者
  • 阿里新出個AI設計平臺!
    你還記得之前刷爆朋友圈的魯班嗎?它公測了!簡單普及下,魯班是阿里研發的人工智慧設計產品。今年五月的時候已經改名為鹿班。目前的鹿班相當於2年設計經驗。過去的鹿班服務於阿里平臺,目前已經全面為商家提供服務。除了鹿班外,阿里還研發了頑兔、智能文案、微海報等一系列功能。現在這些都集合在阿里新推出的智能設計工作檯。
  • 阿里發布雲上超級電腦「無影」,第一款「小蠻驢」日送500個快遞!
    同時,阿里還發布了第一款物流機器人「小蠻驢」,4度電能跑100多公裡,每天送500個快遞!「2020創新之源大會將於9月22日在中關村軟體園召開,詳細信息見文末海報,歡迎報名!」無影,代表著從PC時代到CC時代的質的飛躍! 阿里雲智能事業群總裁、阿里巴巴達摩院院長張建鋒在2020雲棲大會上發布了阿里雲第一臺雲電腦「無影」,這是一臺長在雲上的超級電腦。
  • 我是北影節海報設計師,設計被罵上了微博熱搜
    於是我趕緊到北京國際電影節的官微去看,他們發了電影節的先導海報,評論都是「太醜了」,「怎麼能醜成這樣」,「文字能不能設計一下」,「這學生做的吧」,「顏色怎麼這麼俗這麼髒」等等,還有一些純粹罵街的話。因為我除了有自己的工作室,還是世界設計師組織「國際平面設計聯盟」的會員,所以設計行業的一些活動經常會邀請我。那時我和設計周正好有合作,他們就請我去給電影節講一講海報是什麼。於是我去了,講了講自己的一些作品,好像也點評了一下北影節前幾屆的作品,具體記不太清,但我們就這樣認識了。
  • 阿里智能AI一天可做4000萬張海報!
    通過大數據對海量的設計原始文件中的圖層做分類收集處理,把海報的組成元素進行分解,分解成背景層、產品、文字等元素,然後進行深度學習後批處理成統一風格海報。16年的「魯班」為雙11製作了1.7億張海報。這些海報要是靠設計師人工去設計,假如一張圖需要耗時20分鐘,那麼需要100位設計師連續工作300年。今年,你設計水平提高多少?我不知道。
  • (乾貨分享)魯班公司二次防水深化設計大樣圖流出
    現代建築滲漏問題不斷,而造成滲漏的原因包括設計、施工、材料、維護等幾種因素。防水設計是建築物防水施工的先導,不合理的防水設計也是造成滲漏率居高不下的一個重要原因。而防水工程的節點細部構造是防水工程的重要部分,發生滲漏往往出自節點部位,因此做好各項細部構造處理及有關技術設計尤為重要。針對工程項目進行二次防水深化設計,可以提高防水設計水平,有效降低建築滲漏率。
  • 年前一天 100 張海報逼走設計師,AI:我還能再打 200 個!
    因此,海報的製作成為能否吸引消費者的決勝點。但是,製作一張海報可不是這麼容易的事,設計師不僅需要根據商品的信息進行個性化設計,還要保證吸引眼球,況且設計師價格也不低,文摘菌隨意在一家電商平臺上進行了搜索,發現一張商業海報的價格達到了799元。
  • 蟄伏三年,達摩院首款無人駕駛終端產品,阿里牽出一頭「小蠻驢」
    根據國家郵政局,今年全國快遞業務量已經突破 500 億件,不久的將來中國每天將產生 10 億個配送訂單,市場空間將會是千億級別。 同時,該市場看似簡單,但因場景複雜,「非結構化」特徵突出,技術壁壘很高。在乘用車無人駕駛落地前夜,末端物流場景剛好作為自動駕駛技術「練兵場」。 小蠻驢是阿里首款可量產的物流機器人,最早明年我們就可以在菜鳥驛站裡看到小蠻驢身影。
  • 雙十一設計大揭秘:對話天貓雙11幕後設計師
    過去的蓋樓、開店賺喵幣在互動包裝上更偏商業,貓不一樣,更強調養成屬性,和用戶有更多情感聯繫,因此今年我們選擇貓貓作為連接用戶的情感出口,「情感連接」也貫穿了今年的整個互動。  嘉靈:阿里巴巴從2016年投入做智能設計,是國內最早一批在智能設計領域做項目的團隊。2016年,鹿班通過機器學習圖像生成,在2016雙11累計設計了1.7億張海報,當時鹿班在阿 裡內部還是一個很小的應用。
  • 設計勞模 | 今年第55屆金馬獎海報設計師,以一己之力承包了臺灣大半個娛樂圈的設計!
    第51屆海報 / 設計:蕭青陽本屆海報由曾經四次入圍葛萊美獎並得過金曲奬最佳專輯包裝奬的知名設計師蕭青陽親自打造,以大氣勢恭迎歷久彌新的金馬圖騰。他在「5」字內,以飽滿圓融的東方紋路,來象徵過去半世紀所累積的電影藝術,已經豐收,並特別在「1」字的最頂端,變化成全新的尊貴馬頭權杖,象徵全新但更具權威性的金馬獎。
  • 日韓電影海報設計對比:日本設計師輸了?
    ARKIE智能設計分享新鮮設計資訊點擊上方藍字即可關注作為電影製造大國,日本每年有上百部國產電影發行,因此為了能夠一眼就吸引到觀眾,多數的日本電影海報,會將所有的資訊塞進一張海報,這也成了「有一種電影海報叫日本版」。尤其是西方電影來到日本後,原版的海報因地制宜而重新排版後,多數都會變成一種吐槽點滿滿的設計。
  • AI 求職季啟動:阿里、商湯等八大明星企業資深算法工程師親授獨門...
    因其較好的發展前景和出名的「高薪」,許多畢業生和IT從業者在擇業時也開始將 AI 行業納入考慮範圍。但作為一個新興行業,求職者對於 AI 行業的工作要求存在許多盲點,例如,行業內有哪些 AI 崗位?它的「高薪」究竟是怎麼樣的?如何做好求職定位與職業規劃?如何快速適應 AI 工程師的工作?
  • Facebook明年發布首款智能眼鏡;阿里「犀牛智造工廠」正式投產...
    Facebook CEO馬克·扎克伯格表示,「在與他們的團隊相處了一段時間,並參觀了工廠之後,我知道他們是合適的合作夥伴,將可幫助我們將最好的技術和最好的眼鏡結合在一起。」【阿里新製造工廠曝光】阿里巴巴打造的全球首個新製造平臺——犀牛智造正式亮相。
  • 建模繪圖自動化,AI助力建築設計智能發展
    小庫工具能實現實時快速排量,幫助助理建築師快速落實主創的多個設計草圖想法,智能生成車庫排布圖等。酷家樂:致力於AI技術與算法的研發,室內家裝軟體公司酷家樂推出智能造型設計、智能水電設計、智能施工圖等產品,讓設計師迅速完成外景別墅、樓梯、欄杆、梁柱、閣樓、長廊、斜頂的建模,並自動生成渲染效果圖。
  • 雙11這些海報竟然都是AI設計的?來看它們是如何做到的!
    作者 | 池志煒編輯 | 趙楠題圖 | 站酷海洛阿里人工智慧設計師「魯班」,在2016年的雙十一期間設計了1.7億數量級素材,這樣的產出,需要100個設計師不吃不喝連續做300年。依靠龐大數據量取得的驚人成果背後,帶給了我們很多思考。究竟機器學習在設計領域的應用前景如何?效率和審美如何做到同時在線?
  • 臺灣金馬獎近十年海報視覺設計 ​​​
    今天嘗試搜集金馬獎的歷屆海報設計,作為華語電影與中國設計的共同見證。第53屆臺北金馬影展(2016年)海報設計:黃海第53屆臺灣金馬獎海報由著名設計師黃海操刀,他曾為《黃金時代》《一代宗師》《太陽照常升起》《尋龍訣》等影片設計海報。
  • 創投日報 |「完美日記」完成1億美元新一輪融資,「普施康」獲數...
    「AllSeated」主要面向活動策劃人員提供可視化工具,包括2D&3D-CAD製圖、時間表以及設計桌面等。基於「AllSeated」平臺,用戶可在活動舉辦前設計、查看活動現場的3D畫面,並可將各個供應商及賓客邀請到平臺進行統一安排和管理。「AllSeated」平臺目前已經覆蓋了美國紐約、舊金山以及英國、德國市場.......
  • 「清水·追劇」設計師被日劇化?東京設計誕生之日
    12月的新日劇列表中有一部會讓很多設計狗產生共鳴的日劇——「東京設計誕生之日」。,由設計師千原徹也親手設計的企劃和作品為主題,描繪了其成立的經過和過程,以及與之相關的人們。雖然說本劇只有短短5集,清水君也不會掃大家的興致做過多劇透,但是每一集的設計案的誕生故事是根據真實案件所改編,在追劇之前,清水君就給大家先看看每一集出現的設計案吧!第一集的故事是女主作為新人設計師,負責了雜誌的海報拍攝工作。而所進行的方案正是今年在時尚雜誌bis上所連載的「野性爆弾くっきー!の女型人間くっきー!名鑑」的寫真集。