亞馬遜開發視覺化AI搜索模型,文字自動轉圖片,提升視覺搜索體驗

2020-12-03 跨境電商藍海億觀網

亞馬遜近日公布,開發了一款新的AI模型,可以把產品描述文字轉換成圖片,幫助消費者更好查找商品,提升視覺搜索體驗。

利用GAN網絡合成圖片,使搜索體驗更直觀

亞馬遜表示,這款AI模型運用GAN(生成式對抗網絡),能夠成功合成圖片。GAN技術於2014年首次面世。

也就是說,亞馬遜開發的這款「視覺化產品搜索AI模型」,主要功能是合成產品圖片,所謂文字轉圖片,這裡的圖片不是賣家自己提供的產品實圖,而是系統根據產品名稱或title,自動合成的圖片,為消費者查找商品提供更直觀的視覺體驗,幫助其更快找到心儀的產品。

藍海億觀網了解到,這款AI新模型,不僅僅可以把搜索結果中的文字轉換成圖片,另外一個重要的新功能,就是在添加新的產品圖片的同時,保留「舊」圖片。

舉個例子,如果消費者搜索「women’s black pants(女士黑色褲子)」,在搜索結果中會出現相關產品,但原來的文字描述改為圖片展示;在「women’s black pants」基礎上,添加「capri(卡普裡褲,又稱為七分褲)」或「petite(小個子)」等其他搜索詞,搜索結果會顯示新的匹配圖片,但之前搜索結果中的產品圖片也保留。

除此之外,還有一個顏色模型,能夠生成與顏色搜索詞更加匹配的圖片。

該AI模型分兩步合成圖片,配有「長短時記憶」組件

據亞馬遜所說,該「視覺化產品搜索AI模型」,已經在四個不同的系統上進行測試,而這四個系統都使用StackGAN,一種「文字轉圖片GAN」。

藍海億觀網獲悉,亞馬遜新AI模型,是StackGAN的升級版,分兩步生成圖片。第一步,直接根據文字生成低解析度圖片;第二步,在生成的低解析度圖片基礎上,合成更高清圖片,有更細節的紋理和線條,產品顏色也更自然真實。

而且,新AI模型還添加了「長短時記憶」組件,簡稱LSTM。LSTM和GAN網絡結合,能夠保證消費者在搜索框中連續輸入搜索詞時,AI模型能夠不斷「精煉」對應的產品圖,實現輸入文字與合成圖片高度匹配。(藍海億觀網egainnews)

相關焦點

  • 計算機視覺(圖像)技術:視覺圖像搜索綜述
    比如從簡單的以圖搜圖、車牌識別,到人臉識別、植物或寵物的識別,人體或車輛的跟蹤,無人機、無人汽車的自動駕駛,智慧機器人等領域,都離不開計算機視覺搜索技術,這也是此次谷歌開源基於 TensorFlow 的物體檢測代碼的意義所在。
  • 乾貨速遞,百度BML自動超參搜索技術原理揭秘與實戰攻略!
    百度全功能AI開發平臺BML帶著免費算力額度與自動超參搜索能力來了!  先來介紹百度最近全新升級的BML,何方神聖?  BML自動超參搜索的實現:系統架構  BML自動超參搜索功能基於百度自研自動超參搜索服務,服務運行過程如下圖所示,依靠百度智能雲CCE算力,支持多自動搜索任務並發。為了提供一個「好用」的自動超參搜索服務,架構實現時在並發搜索效率提升和系統容錯方面著重進行了考慮。
  • 百度全功能AI開發平臺BML自動超參搜索技術全面解析
    百度全功能AI開發平臺BML帶著免費算力額度與自動超參搜索能力來了!先來介紹百度最近全新升級的BML,何方神聖?全功能AI開發平臺BML(Baidu Machine Learning),是為企業和個人開發者提供機器學習和深度學習一站式AI開發服務,並提供高性價比的算力資源,助力企業快速構建高精度AI應用。
  • 夸克3.2版發布極速AI搜尋引擎:升級搜索全鏈路智能化體驗
    AI賦能提升搜索體驗 比達諮詢最新數據顯示,2018年中國移動搜索用戶規模達8.17億。龐大的用戶需求,讓移動搜索成為智能化創新嘗試的絕佳土壤。 在移動搜索業態之上,夸克從3.0版本以來持續將智能化能力滲透到產品全鏈路。此次最新3.2版本,夸克發布自主訂製的Quarkium內核,搜索響應更快更流暢。
  • 圖像搜索:一種比文字輸入更便捷的搜索方式
    原標題:圖像搜索:一種比文字輸入更便捷的搜索方式 可能你對它的認識還停留在令人尷尬的初級階段:上傳圖片,結果只是搜出一堆不明所以的所謂「類似圖片」;自拍一張照片在某個識圖軟體上搜索「像哪位明星」,顯示的結果卻是一位異性。   如今,在移動網際網路提供了更多可能與機會的情況下,圖像搜索還那麼「不堪大用」嗎?
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    OCR 9項能力全面升級 通用文字識別(標準含位置版)模型升級優化模型,識別精度進一步提升,字錯誤率下降7%。OCR 相關的需求自然也少不了:卡證識別、票據識別、汽車場景、教育場景文字識別……那麼,這個模型大小僅 8.6M,沒有 GPU 也能跑得動,還提供自定義訓練到多硬體部署的全套開發套件的開源通用 OCR 項目,了解一下?
  • 極速秒開、搜索直達、精準結果、AI對話……夸克加速搜索智能化
    4月26日,智能搜索應用夸克發布3.2版,在AI技術賦能移動搜索的理念下,向著極速、精準、智能的產品體驗跨進一步。 AI賦能下,提升極速、精準、智能的搜索體驗 採用AI技術的智能化應用是近年來網際網路產品創新的風口,為用戶開拓了全新的交互模式和體驗。比達諮詢最新數據顯示,2018年中國移動搜索用戶規模達8.17億。龐大的用戶需求,讓移動搜索成為智能化創新嘗試的絕佳土壤。
  • 平颱風向:11月16日,亞馬遜搜索功能發生新變化
    1.亞馬遜定價中的潛在定價錯誤也會導致商品停售亞馬遜發布公告稱,亞馬遜會根據商城公平定價政策、推薦報價等若干因素檢測賣家的商品是否存在潛在的定價錯誤,確定這些潛在錯誤後,將會通知賣家。賣家可以在定價狀況中查看因潛在定價錯誤而被停售的商品。
  • 深度學習變革視覺實例搜索
    研究興趣為深度學習與計算機視覺。曾獲2015年首屆阿里巴巴大規模圖像搜索大賽二等獎,總排名第三名。摘要近些年,深度學習在各種計算機視覺任務上都取得了重大的突破,其中一個重要因素就是其強大的非線性表示能力,能夠理解圖像更深層次的信息。本文對基於深度學習的視覺實例搜索方法做了簡單的總結和概括,希望能給讀者們帶來啟發。
  • 【亞馬遜排名算法揭秘】搜索加購為什麼能提升關鍵詞排名?
    公眾號:大寶站外推廣,亞馬遜綜合服務商,一手服務眾多,擅長站外推廣,帳戶申訴,快速趕跟賣,評論維護,各種其他小服務,另外每天更新亞馬遜乾貨
  • 效果提升18%!百度EasyDL自研數據增強服務加持AI模型開發
    在 AI 模型開發的過程中,許多開發者被不夠充足的訓練數據擋住了提升模型效果的腳步,一個擁有出色效果的深度學習模型,支撐它的通常是一個龐大的標註數據集。因此,提升模型的效果的通用方法是增加數據的數量和多樣性。但在實踐中,收集數目龐大的高質量數據並不容易,在某些特定領域與應用場景甚至難以獲取大量數據。那麼如何能在有限數據的情況下提升模型的效果呢?
  • AI看圖說話首超人類!微軟認知AI團隊提出視覺詞表預訓練超越...
    最近,Azure悄然上線了一個新的人工智慧服務,能精準的說出圖片中的內容。而背後的視覺詞表技術,更是超越了基於Transformer的前輩們,拿到nocaps挑戰賽冠軍。有沒有發現,搜索出來的圖片有時相關性很差?現在很多搜尋引擎都是基於圖片的文本標籤,但是我們的世界每天產生不計其數的照片,很多都沒有標記直接傳到了網上,給圖片搜索帶來了很多混亂。
  • 搜題目、看視頻、追小說 夸克iPad版升級智能搜索新體驗
    搜題目、看視頻、追小說 夸克iPad版升級智能搜索新體驗原標題:搜題目、看視頻、追小說夸克iPad版升級智能搜索新體驗 10月26日,智能搜索app夸克正式發布iPad版,延續AI引擎能力和極簡產品理念,在大屏端升級在線學習、視頻播放、小說閱讀等核心功能和場景,給用戶帶來橫屏「搜索框+AI工具」的創新內容體驗。
  • 亞馬遜機器人公司副總裁離職,加入23歲華裔成立的AI初創公司
    圖片來源:彭博社 攝影師:Joe Buglewicz /彭博社Scale AI 的創始人亞歷山大·王(Alexandr Wang )是一名華裔,在新墨西哥州長大。2016 年,19 歲的 他與朋友共同成立了 Scale AI,旨在加速 AI 應用程式的開發。
  • 用谷歌圖片搜索自製深度學習數據集 | 教程
    用谷歌圖片搜索自製深度學習數據集 | 教程 銅靈 編譯整理 就怕前腳剛立志搞個新研究,後腳就發現沒有合適的數據集可用。AI工程師從入門到放棄,可能就是這麼一會的功夫。 別找了,現在深度學習數據集也能自制了。
  • CVPR 2019 神經網絡架構搜索進展綜述
    Auto-DeepLab:語義分割的分層神經架構搜索熟悉語義分割領域的研究者應該對DeepLab團隊都不陌生吧?他們不斷提出新的思路、新的模型,不斷推進語義分割模型的性能提升。圖註:MnasNet神經架構搜索方法概觀。
  • 自帶筆記功能&搜索強化!百度網盤10.0新版體驗
    百度網盤的筆記功能支持文字、圖片、代辦事宜這幾個內容。跟其它專業的筆記APP對比起來,百度網盤的筆記功能的編輯功能有點弱,文字排版不方便。用戶可以將筆記分享給好友,百度網盤採用了自動將筆記生成為圖片的形式來進行分享。圖3 百度網盤的筆記功能 圖4 分享筆記百度網盤的筆記功能不僅可以自行編輯,也可以將喜歡的網頁內容存儲到這裡。
  • 《人民日報》點讚夸克搜索創新:「框+AI工具」圈出搜索新領地
    近兩年,伴隨各大網際網路巨頭的持續加碼,國內搜尋引擎市場越來越生機勃勃。7月1日,《人民日報》海外版刊文《網際網路企業角逐搜索市場》,梳理時下網際網路企業藉助多項新技術、細分市場後展開的「搜索工具+業務生態」新布局,同時分析了搜尋引擎在內容生態、算法推薦和視頻搜索等技術發展的新趨勢。
  • 自動超參搜索帶著免費算力資源拯救你!_發現頻道_中國...
    百度全功能AI開發平臺BML帶著免費算力額度與自動超參搜索能力來了!  先來介紹百度最近全新升級的BML,何方神聖?  全功能AI開發平臺BML(Baidu Machine Learning),是為企業和個人開發者提供機器學習和深度學習一站式AI開發服務,並提供高性價比的算力資源,助力企業快速構建高精度AI應用。
  • 新研究結合視覺和聽覺進行情感預測
    它可以幫助編制帶有描述性說明的病理圖像教材的索引,使受訓的醫科學生或病理學家能夠使用視覺搜索對這些教材進行檢索,加快教學進程。 此外,它還可以應用於癌症研究人員感興趣的研究——腫瘤形態學與患者預後的相關性。研究結果還表明,複雜的ML算法需要與以人為中心的設計和交互工具相結合,這是最有意義的。