36氪獲悉,AI數據服務平臺龍貓數據日前獲KIP中國領投、金沙江創投跟投的的3300萬元Pre-B輪融資,本輪融資將主要用於市場擴展、自動化標註研發、AI研發投入等。公司此前曾獲金沙江創投、九合創投、不惑創投、真順基金、雲天使基金的多輪投資。
數據、算力、算法是人工智慧發展三要素,人工智慧技術的發展催生出市場對數據標註的需求。為了得到海量多樣化的數據,早期數據標註團隊多以線下形式開展,以外包形式僱傭人力,借用眾多人力進行數據的採集與標註,這使得行業勞動密集型的特點尤為突出,而隨著對數據需求量及數據品質要求的雙重提升,人力成本高、服務效率和質量低下成為了目前行業發展的主要問題。
龍貓數據根據以上行業面臨的難點,將數據標註工作從線下轉向線上,通過搭建AI數據平臺,吸引線上用戶參與數據採集和標註,以降低人力、場地成本,此外,還通過不斷優化數據標註工具、自動化標註、對數據進行預標註等方式,提高數據標註效率和質量。
龍貓數據平臺於2016年上線,服務領域覆蓋計算機視覺、語音語義、自動駕駛、傳統行業AI+四個方面。
從數據平臺具備的功能上看,公司已經實現AI自動化標註,在積累標註項目和數據的基礎上,通過開發工具對人臉識別、圖像語義分割、OCR、語音識別、自動駕駛等場景數據進行預標註,之後再將任務分包給標註人員。因此可以實現對AI有針對性的訓練和迭代。此外,平臺具備的驗收功能可以讓客戶遠程跟進數據生產過程,提高了客戶體驗。
從標註員管理和標註質量管控來看,平臺以流量吸引的方式獲得標註員,相比傳統的線下標註場景能夠獲得更多人力資源。此外,標註員在平臺上接受培訓,根據標註完成效果及熟練度分配不同的任務,按實際結果獲得報酬。這些管控措施能夠有效提高數據質量,同時使得服務報價比傳統線下模式便宜30%。
目前平臺累計註冊用戶約500萬人,標註團隊超過2000個,已經服務了數百家網際網路、科技研發頭部企業,包括百度、阿里、三星、京東、快手、頭條、小米、平安、中國移動等公司,都在長期使用龍貓數據提供的服務。
疫情也推動了數據標註從線下到線上的轉變,目前很多線下服務的 AI 數據公司面臨停擺,而龍貓數據的平臺數據交付沒有受到影響,還推出了大量為應對疫情而開發的專向 AI 應用數據。
從整體市場來看,數據標註行業國內起步較晚,行業代表公司有市值超28億美元的Appen、Amazon旗下的AMT、估值10億美金的Scale AI、以及近期完成2500萬美元B輪融資的Labelbox 等。
KIP中國投資董事林湧表示:在人工智慧落地各個垂直行業過程中,數據服務的需求會持續爆發。龍貓作為國內領先的人工智慧數據服務商,需求端受到國內外眾多優質客戶認可,供應端則具備彈性靈活的組織能力,有希望為各個有AI業務需求的企業提供更好的基礎設施服務。
金沙江創投合伙人陳斕傑表示:龍貓堅持技術先行,以技術迭代不斷深化規模上的先發優勢,在數據服務的精度、速度、智能化上均居於國內領先地位。金沙江創投持續看好龍貓團隊提供人工智慧數據服務的核心能力,看好中國人工智慧的發展前景,持續關注並積極布局人工智慧落地各垂直行業的投資機會。