倍賽首推全類型SaaS標註平臺,共享標註能力,賦能AI基礎行業

2020-12-12 億歐網

2019年《中國人工智慧基礎數據服務行業白皮書》顯示,2018年中國人工智慧基礎數據服務市場規模達到25.86億元,預計到2025年市場規模或將突破113億元。人工智慧基礎數據服務市場呈現出巨大發展潛力。但伴隨著需求的不斷膨脹,基礎數據服務商在迎來機會的同時,也面臨新的挑戰——如何有效提升數據標註的產能。

面對良好的市場預期,基礎數據服務供應商為提升產能紛紛做出積極嘗試,2019年11月倍賽BasicFinder第二代雲基礎設施——全類型SaaS數據標註工具集上線,在基礎數據服務領域探索出一條以工具賦能為核心的提升產能之路。或許創新工具的使用將為基礎數據服務商打開新局面。

泛用性是標註工具平臺的基本能力

自始以來,算法、算力和數據就被認定為拉動人工智慧發展的馬車,而數據則是馬車前進中不可缺少的輪子。由於算法和算力水平的不斷提升,以往市場上流行的標註工具已經無法適應AI數據從簡易到複雜的趨勢變化,因此,標註工具平臺的泛用性成為實現精準、高效標註的基本要素。

由於基礎數據服務商從事的標註業務具有普遍多樣性,單獨工具無法滿足業務需求。倍賽BasicFinder CEO 杜霖認為:作為SaaS標註工具,最基本的要求就是能對圖像、文本、語音、視頻以及點雲數據做到一站式加工處理,沒有完善的工具集,人機協作和提升產能將成為空談。這也是為什麼倍賽BasicFinder在SaaS平臺上投入精力,設計出含2D框、分詞標註、視頻追蹤、語音標註及點雲標註工具等18款套件的原因,目的就是讓平臺使用者不必因更換項目而頻繁切換工具平臺。

產能提升,工具效益非人力可替代

人工智慧在現實應用中多採用有監督學習模式,基於大量標註數據的模型訓練能夠幫助算法有效降低錯誤率。雖然現在AI科學家們在探索通過小樣本數據以達到訓練目的,但就目前的應用成果看,無監督學習或弱監督學習仍然不能取代有監督學習,這就使得在可預見的未來,市場對AI標註數據的需求將呈指數化持續增長,據IDC 統計,全球每年生產的數據量在2025年或將達到163ZB。緊張的產能需求迫使AI科技公司和基礎數據服務商對數據生產手段做出積極地調整。其中部分企業通過增加人力的方式擴充產能,但隨著人力不斷擴充,邊際收益逐漸遞減,趨於0值。雖然個別企業希望培訓機制可以進一步增加人效,卻收效甚微。在企業的調整實踐經驗下,不難發現與增加人力相比,提升標註工具平臺在人機協同方向的創新,或許是提升產能更「靠譜」的方式。

管理屬性和靈活性成為SaaS標註工具的優勢

在工具平臺的選擇方面,也有部分AI科技企業和基礎數據服務商通過改寫開源工具以獲得標註能力,但往往改寫工具僅能滿足當前最急迫的標註需求,長期卻無法適應項目更替,原因在於每次標註需求的變動,都需要技術人員進行再次改寫,開發時間周期和技術人力損耗在成本上加重了企業負擔。在成本考量之外,開源工具在管理屬性和靈活性層面也相對薄弱,而對於一款相對成熟的SaaS標註工具平臺來說,「標」是平臺基礎;「管」是平臺的靈魂;「活」則是工具的延伸。

以倍賽BasicFinder SaaS標註平臺為例,其內部系統嵌入工作流模塊。具體工作流為:任務發布、執行標註、結果審核、數據質檢。平臺通過每個環節的作業銜接,構建起流程管理系統,與單純的標註工具相比,任務在SaaS平臺中可以獲得更快的流轉速度。同時由於工序之間採用封閉節點構造,執行標註和審核工序的操作員無法對數據進行下載和傳輸,又進一步保證了數據的安全性。除流程管理外,該工具平臺還具有績效管理功能,尤其是AI企業或基礎數據服務商的管理層用戶,可以通過可視化面板了解項目的進度以及團隊下每個標註員的工作效率和完成任務的準確度。績效管理功能的加入,減少了項目經理因過度參與作業環節中的管理工作而耗費精力。之前一個項目經理能同時管理3個項目,在SaaS標註平臺的使用下可拓展管理10個,甚至更多的項目。

在工具的靈活性方面,倍賽BasicFinder SaaS標註平臺將標註標籤、標註工具、標註特質項等功能設計成可自由拖拽的模板配置形式,以指定標註範疇,規範標註員的標籤和工具使用,減少不必要的標註錯誤出現。除可自由配置模板,SaaS標註平臺也為有能力開發預標模型的AI科技公司或數據服務商提供加速工具接口。在執行大規模的標註項目時,平臺使用者可以通過接入預標模型,對大批數據進行預處理,而後人工進行補標,以增加操作員單位時間的作業頻次,提高產能輸出。

開放數據標註能力,普惠AI基礎行業

作為基礎操作層面,標註工具能力的全面性將對數據加工者起到至關重要的作用。如倍賽BasicFinder曾為招商銀行部署數據標註工具平臺私有化系統,通過獨立系統的配置,同時解決了招行關於標註工具、工序管理和數據安全三個方面的難題,一舉幫助其建立起可以獨立展開數據標註作業的能力。

在AI基礎數據服務市場的激烈競爭下,數據的標記質量和項目的執行速率成為數據服務商獲得競爭優勢的關鍵。由於數據標註工具私有化部署成本相對較高,倍賽BasicFinder將其 SaaS 化,大大降低了工具的使用成本,普惠中小型AI科技公司和基礎數據服務供應商,賦能AI基礎行業。

相關焦點

  • 倍賽旗下BasicFinder SaaS定義數據標註生產力工具
    數據結構化生產離不開標註工具。當前仍有很多中小企業選擇開源工具作為生產設施。開源工具多數免費,或被修修改改,或被拿來即用,因使用成本低而被青睞。但開源工具卻有不可迴避的痛點——功能和結構設計單一。如數據加工類型受限或工具不具備流程管理能力等。開源工具不具備批量化生產條件,產出效率也自然無從談起。
  • 宜人貸發布科技能力共享平臺,為行業健康高效前行「賦能」
    」:客戶獲取成本高、風控成本高、欺詐多、客戶體驗差,將是金融科技領域又一個裡程碑式的創新與變革,為行業健康成長「賦能」,提升用戶體驗。作為國內領先的金融科技平臺,宜人貸通過共享平臺輸出科技能力,能夠有效地解決行業「弊病」,促進全行業良性循環和健康、高效發展。 YEP共享平臺 「牛」在哪裡? 作為國內誕生的首個金融共享經濟平臺,YEP共享平臺 「牛」在哪裡,具體可以概括為數據、反欺詐以及客戶獲取三方面。
  • 數據標註師:AI學習的老師
    人工智慧機器要想認識世界需要依賴大量已經標註過的數據,數據標註讓機器理解並認識世界,是人工智慧金字塔的基礎力量。  相比於人工智慧行業的繁榮與奪目,數據標註則顯得似乎沒有那麼耀眼,甚至在前期還被貼上了很多偏見。殊不知,在人工智慧高速的發展進程之下,數據標註早已經實現了「脫胎換骨」,成為了新時代下最炙手可熱的行業之一。
  • AI開放平臺推出零基礎算法開發的意義
    這套平臺同樣可提供從新建模型、創建標籤、上傳數據、標註數據、訓練模型、評估校驗、發布模型全流程服務。開發者幾乎可以零開發搭建一套業務demo,據介紹只需2~3天時間即可完成部署,省去業務系統基礎功能的重複開發、以及基於AI的業務功能的開發成本。
  • 科大訊飛劉慶峰:未來數據標註產業面臨三大發展趨勢
    除此,劉慶峰預測未來數據標註產業將面臨三個發展趨勢:數據標註產業開始向專業服務化方向發展,更注重數據基礎來源和數據隱私保護;數據標註產業由單一類型標註向多模態標註發展,實現語音合成、圖像識別、多語種翻譯等多種類型融合;人機耦合新型標註將成為大勢所趨,提升數據生產效率和質量。
  • 從小作坊到大生產,AI數據標註轉捩點
    智研發布的數據標註行業報告指出,2018年我國數據標註與審核行業規模達到52.55億元,其中34%左右的業務量流向專業做數據採標的第三方公司。「甲子光年」觀察到,供給側的馬太效應開始顯現,體量較大的公司呈現出兩種業態:一是眾包平臺、二是定製化服務。
  • 喜推SaaS平臺2.0震撼發布,企業用戶可免費試用
    2月18日,喜推科技正式推出全新升級的SaaS平臺2.0,官方網站也隨之全面改版,並開啟免費試用,進一步為企業用戶打造功能更強、體驗更好的SaaS產品和服務。免費試用無疑成為本次更新升級的最大亮點,不僅在SaaS界投下「震撼彈」,也吸引了全國眾多中小企業的關注。
  • 海雲數據「圖易7」 AI能力服務平臺賦能蹊徑
    三大平臺實現能力閉環:圖易7賦能場景升級專注AI場景設計與應用,海雲數據圍繞場景五要素,以業務為基礎,以知識為核心,以數據為關鍵,以決策能力為最終導向,全面升級圖易AI能力服務平臺。新的圖易7 AI能力服務平臺著重打造場景頂層設計、場景快速搭建與複製、AI與數據、場景生態共享四大核心能力。
  • 高德地圖標註平臺 免費標註線下店鋪
    作為國內領先的數字地圖內容、導航和位置服務提供商,高德地圖不僅數據準確,導航好用,不做競價排名,不斷為用戶帶來出色的地圖導航體驗外,還於近日上線了商戶標註平臺,可以高效的幫助全國的商戶在高德地圖上標註位置信息,將其店鋪位置和品牌推廣給超過5億的高德用戶,以減少宣傳成本,提高店鋪知名度,打造更具影響力的品牌形象。
  • 2020數據標註公司排行
    於是,數據標註公司隨著發展如火如荼的人工智慧行業也發展起來。為了適應人工智慧公司對數據標註不同程度的需求,當前,我國數據標註行業的市場結構也分化為了幾種。 最開始興起的是眾包結構,在眾包平臺上,一端對接需求公司,一端對接大量有空餘時間的志願者(兼職人員)。
  • 5G+AI如何為行業發展賦能
    2019世界工業網際網路產業大會5G+AI賦能傳統製造平行論壇上,300多位各界代表齊聚於此,對當前炙手可熱的話題——5G+AI的前景和應用場景的探討,同樣火熱。5G元年帶來新挑戰2019年被稱為5G商用元年,20多個國家發放了5G牌照。「新一代信息技術與我國石化行業轉型升級形成歷史性交匯,大數據的應用讓創新變得更容易,當我們站在創新門檻之時,迎來了5G時代。」
  • 數據標註行業未來:面臨取代?
    2021-01-01 22:16:39 來源: 元真教育 舉報   數據標註行業未來
  • 標貝科技繆冠瓊:AI數據標註機器比重提升,但不可能完全取代人工
    AI技術在全場景的落地以及大數據時代的到來產生了海量、指數級別的數據,數據獲取也相對變得容易,然而,想要獲得大量的已標註數據卻並不容易,往往需要付出很大的人力、物力、財力成本。  數據標註主要是針對語音、圖像、文本等進行標註,主要通過做標記、標重點、打標籤、框對象、做注釋等方式對數據集作出標註,再將這些數據集給機器訓練和學習。數據標註的類型主要有:拼音標註、韻律標註、詞性標註、音素時間點標註、語音轉寫、分類標註、打點標註、標框標註、區域標註等等。
  • 最高精度99.99%:AI數據標註告別勞動密集進入技能密集時代?
    一個普通的草臺班子數據標註團隊可能也能實現及格線上的AI數據精確度,這是機械式的人力操作天然具備的能力,畢竟數據標註確實主要靠的是人力的勞動。但再要提升精度,尤其是無限往100%靠近,就必須更多依賴各種技能的支撐,不斷進行高位再優化,榨取精度提升的空間。 數據標註的精準度越高,再次上升(並保證配套服務質量)能夠從「人力」中獲得的支持越少,從「技能」獲得的支持越多。
  • 輿情分析的賦能者:NLP模型開發平臺設計實踐
    編者按NLP模型開發平臺是以快速打造智能業務為核心目標,無需機器學習專業知識,模型創建-數據上傳-數據標註(智能標註、數據擴充)-模型訓練-模型發布-模型校驗全流程可視化便捷操作,短時間內即可獲得高精度NLP模型,真正為業務賦能。
  • 最全分類!計算機視覺的圖像標註類型及應用
    圖像標註類型在深入學習計算機視覺的圖像標註用例前,首先要了解各類圖像標註的方法。一起來剖析一下最常見的圖像標註技術吧。1.邊界框(Bounding Boxes)邊界框用途廣泛且簡單明了,是計算機視覺中最常用的圖像標註類型之一。邊界框圈出目標,並協助計算機視覺網絡找出感興趣的目標。它很好創建,只需要指定盒的左上角和右下角的X和Y坐標。邊界框幾乎可以應用於任何目標,而且能大幅提升目標檢測系統的準確度。
  • 數據標註員被取代?EasyData為開發者提供服務
    5月20日「WAVESUMMIT2020」深度學習開發者峰會上,百度AI開發平臺部總監忻舟宣布EasyDL全新升級,重磅發布了業內首個專注於AI開發領域的智能數據服務平臺EasyData,進一步加強數據管理與加工能力,並在完整地支持Master模式的訓練與開發、端雲一體服務部署方面帶來了4項重要升級。
  • ...將標註效率提升50%,「星塵數據」還要為無人車場景提供全方位服務
    「星塵數據」是一家提供數據標註服務和AI數據中臺系統的SaaS公司,為人工智慧企業提供數據服務,提供AI數據全流程標註和質量管理。人工智慧的發展過程中,數據、算力、算法缺一不可。在標註時,平臺的智能識別功能可以對物體邊界進行高貼合度的分割,標註者只需要對標註數據進行選點即可框出物體。這一功能能將標註效率提升50%-80%。因為有系統支持,針對客戶的個性化需求,星塵數據開發了自動化報價平臺。客戶可以根據具體的標註場景上報圖形、標註範圍等精細化需求。平臺會根據需求自動生成價格評估單。
  • 500萬臺伺服器、500萬AI人才、5萬AI數據標註師,百度三個「5」加碼...
    從算力到人才培養,從賦能企業到促進社會就業,百度用三個「5」持續加碼布局新基建。近日,百度宣布,未來十年將繼續加大在數據、算力、人才等AI新基建領域的投入。7月2日,百度宣布未來5年將在百度山西數據標註基地培養5萬名AI數據標註師,提供更多的AI就業崗位,支持當地科技產業發展。
  • AI民工:字節跳動5萬多員工 天津等地數據標註員佔4萬
    現階段,讓AI提升認知世界能力的最有效途徑仍然是監督學習,劉吉團隊正在做的數據標註是其中最基礎的一環。就像教小孩子一樣,數據標註員通過打標籤的方式,將數據處理成AI能夠理解的特徵。在服務客戶的過程中,依靠自己的能力兼顧團隊產能、任務期限、價格、交付質量等環節毫無疑問是更大的挑戰。此前曾被彭博等多家知名外媒報導的矽谷公司Scale AI正在通過人機協作解決這些痛點。Scale開發的軟體可以實現對圖像等數據的自動化標註,標註員們在此基礎上進行審核及修改即可交付結果。