「龍貓數據」利用完善系統和高效管理為市場提供專業AI數據服務

2020-12-05 創業邦

利用專業的數據對不同應用場景的設備智能化提供幫助,這是人工智慧時代背景下數據所能發揮的最大作用之一。

人工智慧產業中的數據服務環節日趨完善,有報導顯示,2019 年,我國人工智慧核心產業市場規模達到了105.5億美元,其中基礎服務市場規模約為21.1億美元,這其中很大一部分是數據服務。

整個市場在多年前就有了對數據服務的需求。隨著技術的發展,尤其是近年來我國在人工智慧和物聯網領域的發力,人機互動的場景變得越來越多,AI設備對數據類型的需求也更加豐富,圖像、語音、文本、視頻等數據類型都有著巨大的市場需求和訓練價值。也正是基於這樣的市場情況,昝智創辦了北京安捷智合科技有限公司(龍貓數據),並實現了轉型。

龍貓數據成立於2014年,是一家專業的AI數據服務公司。龍貓數據坐落於北京中關村科技園,在廣州、河北、上海等地設立分支機構,致力於為整個AI產業提供圖像、音頻、文本、視頻等領域的專業數據服務。創始人&CEO昝智畢業於中國人民大學,曾任豌豆莢商業產品負責人、百度商業產品經理,擁有十餘年網際網路產品設計、管理經驗。

2016年,跟隨著人工智慧的崛起和市場對底層數據的需求,昝智帶領龍貓數據實現了轉型。如今龍貓數據可以為人工智慧設備製造商及研發團隊提供定製化的數據採集、標註服務,還可以為客戶提供工具部署、BPO外包等個性化服務

人工智慧設備的多樣化帶來了人機互動功能的多樣化。以機器視覺為例,攝像頭及視覺算法的普及使得人體特徵變成了有效的操作信息,大量的人臉識別、五官識別、手勢動作識別、肢體關鍵點識別功能被開發出來,用以完成解鎖、認證、美化等任務。而實現這一切需要大量的訓練樣本。

語音領域也是如此,除了常見的普通話喚醒詞之外,應用場景的長尾效應使得AI設備廠商不得不盡力涵蓋所有可能出現的語音信息,這一點在語音指令環節尤為重要。

無論是智能音箱、家居、還是車載語音助手,由於使用者的不同,其接收的語音指令往往會出現方言、外語、口音區別,同樣一種目的也存在不同說法,如打開空調就有可能出現開空調、溫度調高/調低、太冷/熱了等近百種方式。

昝智告訴創業邦:「除了語音識別,近年來語音合成領域也出現了越來越多的數據需求,因為只有擁有足夠多的音頻數據,廠商才能推出風格多樣的合成語音產品。」

面對這樣的市場環境,龍貓數據在轉型之初就打造了「龍貓眾包」數據服務平臺,通過線上發布任務,建立規範化採集、標註、審核、質檢、驗收流程的方式完成數據的採集和標註工作。

昝智告訴創業邦:「眾包模式看起來簡單,但在數據採集、標註領域,雜亂無章的數據是不能為客戶所用的,因此我們需要制定詳細的採集、脫敏、標註、審核、質檢方案,通過完善的流程確保數據安全可用。」

以圖像標註為例,採集來的或者客戶給到的圖片首先需要進行脫敏,然後利用標註平臺集成的AI自動標註功能對數據進行機器預標註,之後由標註員完成數據的標註、多輪次審核質檢,數據最終流到驗收平臺由客戶進行驗收和下載,不合格數據則流回標註池重新標註。整個流程全程可視可控,保證了數據集的產出效率以及合格率。

在談到數據採集、標註需要大量的勞動力參與的問題時,昝智表示目前的人工智慧數據服務雖有各類算法加持進行自動標註,但行業並不能完全脫離人工作業。從本質上來說,AI數據就是從人類社會中提取出來的,人工作業是幫助機器學習人類行為的不可獲取的一環。但這並不代表AI數據服務是一個勞動密集型產業。

昝智告訴創業邦:「我們雖然需要大量的人工參與,但這些人絕不是僅憑經驗就能完成工作任務,他們需要被培訓、被管理、被賦予一定的專業性,且隨著行業發展其知識結構需要不斷更新,這樣才能生產出優質的數據,從這一點來說,我們和勞動密集型產業有著本質的區別。」

龍貓數據在數據採集員和標註員集體中創建了一定數量的公會,對全職、長期的工作人員建立了管理流程和管理細則。同時,利用機器算法,龍貓數據還可以有效分析出某個採集員、標註員適合什麼樣的任務,並在一定程度上做到任務的指定派發。

「龍貓眾包」平臺上的用戶累計已經超過400萬,其中長期核心用戶超過2萬名。龍貓數據目前擁有近百名在職員工,結合眾包平臺上的用戶,可以為客戶提供文本、語音、圖像、視頻等多種類型、場景下的數據集產品,以及定製化的數據採集、標註服務,並按照數據集使用時長和定製化項目進行收費,年營業額已經達到億級。

融資方面,龍貓數據在今年初獲得了數千萬元人民幣的Pre-B輪融資,由KIP中國領投,金沙江創投跟投。此前龍貓數據已獲得過金沙江創投、九合創投、不惑創投、真順基金、雲天使基金等知名投資機構的多輪融資。昝智表示,最近一輪的融資資金主要用在了技術研發和開拓市場等方面。

本文文章圖片來源於龍貓數據,經授權使用。本文為創業邦原創,未經授權不得轉載,否則創業邦將保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯繫editor@cyzone.cn。

相關焦點

  • 「龍貓數據」利用完善系統和高效管理為市場提供專業AI數據服務
    利用專業的數據對不同應用場景的設備智能化提供幫助,這是人工智慧時代背景下數據所能發揮的最大作用之一。 人工智慧產業中的數據服務環節日趨完善,有報導顯示,2019 年,我國人工智慧核心產業市場規模達到了105.5億美元,其中基礎服務市場規模約為21.1億美元,這其中很大一部分是數據服務。
  • 龍貓數據:專業的數據服務是如何煉成的
    人工智慧技術的發展催生出市場對數據服務的需求。作為行業早期入局者,龍貓數據始終秉持客戶至上,需求導向的理念,通過專業化服務為客戶提供優質數據。專業化理念也為龍貓數據贏得市場高度認可,公司已經與阿里、字節跳動、三星、百度、京東、小米、平安、快手、等眾多知名企業建立了長期合作關係。專業的 AI 數據服務如何做?且看龍貓數據三原則。
  • 「開放平臺+自動化管理」,*家用眾包為AI服務的龍貓數據,又一次...
    新方式也無疑為開創者龍貓數據帶來諸多益處,2018年,公司合同額整體翻了5倍,服務百度、工商銀行、字節跳動、京東、騰訊、小米、快手等大中型客戶超200家,平臺用戶超500萬,在龍貓數據註冊的專業渠道團隊超2000個,初步確立了AI數據服務領域領導地位,這對於從2016年底才開始轉型做AI數據服務的他們來說,無疑是巨大的成功。
  • 龍貓數據:服務AI產業,築基智慧生態
    之前說過,數據標註的質量會直接影響人工智慧訓練的效果,龍貓的數據標註平臺有標註員培訓—標註員考核—標註—審核——抽審等多重環節,多重把關機制能夠確保最終產出高質量數據;對於複雜的數據需求,龍貓還會通過自己管理的線下團隊進行採集標註。
  • 龍貓數據官網全新改版,打造AI數據閉環服務體系
    (官網地址www.longmaosoft.com)經過幾年的摸索,龍貓數據在行業內形成了自己的經驗模式,也逐步積累起各類型相關數據,如何更好的利用已有數據和經驗服務客戶,讓客戶在接受數據服務過程中更省心也更安心一直是龍貓數據在思考的問題。
  • 大數據安全市場 觀數科技要做安全管家「阿福」
    由星河互聯提供聯合創業服務的觀數科技,自從 2015 年 3 月成立以來,就定位為專業的 Hadoop 大數據安全解決方案提供商,發布了國內第一個網關級 Hadoop 大數據安全防火牆 BIGDAF,是目前唯一受公安部認證的 Hadoop 大數據安全防火牆。星河互聯母公司星河集團已布局了 30 多家大數據公司,積累了大量數據資源,星河互聯和觀數科技的合作和融合是「天然的一種東西」。
  • 紮緊制度籬笆,龍貓數據全方位保障數據安全與用戶隱私
    龍貓數據作為 AI 數據服務引領企業,始終以保障數據安全、保證用戶隱私不洩露為己任,通過先進的技術和完善的制度流程建立起牢固的防護網,實現了數據安全零事故。面對這些風險和挑戰,龍貓數據強化責任意識,基於深厚的服務經驗積累,打造出數據安全「一二三」的保障體系。「一」就是安全第一,預防為主,實行第一責任人負責制。龍貓數據嚴格遵守國家相關部門的管理規定,參照國際數據安全和隱私保護條例,結合國內的客觀事實,設置了公司專業的數據和隱私保護組織,以對項目合規性進行審查,組織內設有專門的數據保護官(DPO)。
  • 「蘑菇智能」利用人工智慧+大數據技術,提供全流程的智能投顧服務
    近期創業邦接觸到了一家專注於智能投顧的企業「蘑菇智能」,其面向C端投資者提供專業智能資產配置方案。公司成立以來,以人工智慧技術為動力,以創新為引擎,為各類資產管理提供資金評測、配置、交易、管理、風控等投前、投中、投後的一體化智能資產配置。
  • AI行業風口中崛起,龍貓數據獲Pre-B輪千萬融資
    龍貓數據:AI人工智慧數據服務提供商龍貓數據2014年成立於北京中關村科技園,並在廣州、河北、上海等地設立分支機構,立足AI數據服務,致力於為整個AI領域提供最專業的數據服務。此外,龍貓數據還提供定製服務,可根據客戶特定需求,提供多種類型的標註、篩選、分類等服務,滿足客戶在模式識別領域進行科研、測試和產品開發,包括人物表情標註、人臉多點標註、車輛標註、特殊場景標註等。
  • 36氪首發|實現AI自動化標註,「龍貓數據」獲3300萬元Pre-B輪融資
    36氪獲悉,AI數據服務平臺龍貓數據日前獲KIP中國領投、金沙江創投跟投的的3300萬元Pre-B輪融資,本輪融資將主要用於市場擴展、自動化標註研發、AI研發投入等。公司此前曾獲金沙江創投、九合創投、不惑創投、真順基金、雲天使基金的多輪投資。 數據、算力、算法是人工智慧發展三要素,人工智慧技術的發展催生出市場對數據標註的需求。
  • 以「閱鄰」為例,看二手書的市場邏輯與模式創新
    「閱鄰」的解決方案:用SaaS系統服務為二手書商附能TO C端服務方式:以高校學生教輔書為主,彌補主流市場缺失的二手教輔板塊不同於同期誕生的C2B2C模式的多抓魚們,「閱鄰」的微信小程序「閱鄰小書市」沒有「賣書」這一功能,其貨源全部來自B端二手書商,銷售環節由「閱鄰」統一管理。
  • 龍貓數據與重慶雲陽籤訂戰略合作協議,共築人工智慧發展之基
    重慶市政協主席王炯,中國工程院院士沈昌祥,重慶市政協秘書長、辦公廳主任秦敏,華為中國區副總裁雷戰奎等多位政府領導、專家學者、企業人員共聚一堂,為雲陽市數據產業發展出謀劃策。論壇現場,雲陽縣政府與龍貓數據等企業集中簽約10個項目,另外還有一批大數據智能化產業項目籤約,總籤約金額為31.69億元。
  • ai+3d列印的三維農業生產數據監測系統
    ai+3d列印的三維農業生產數據檢測系統。它是由湖南智慧農業聯盟聯合湖南廣播電視大學、藍州天生科技共同打造的三維創新型農業產業生產信息系統。通過3d列印的立體智慧農業生產數據檢測系統,有效的預警農業問題,如病蟲害,營養消耗過快,農藥殘留超標,肥料使用過量等問題,從對接,代理商和經銷商對接,農業專業人員協助監督,品牌推廣,合作機構之間互聯互通,形成農業生產、農產品品牌的建設。
  • 解決內容生產者的搜集事實難題,「搜信源」推出公共領域數據服務
    在疫情防控期間,媒體、研究機構等生產了大量內容,向公眾提供疫情發展狀況、政府防控措施、科研進展等重要信息。要做到這些並不簡單,以報導和科研均需使用的國內疫情數據為例,在疫情信息發布權下放後,更新數據需要每日收集34個省級衛健委及393個地市級衛健委網站的信息。
  • 智能飲水系統萬物互聯大數據,小蛙喝水讓更多百姓喝好水!
    小蛙喝水創新通過智能物聯技術對傳統淨水設備進行升級,打造高效的智能喝水新零售服務平臺,實現億萬用戶健康喝水一鍵掌控交互服務模式。在物聯網發展大趨勢和「後疫情時代」的雙重背景之下,小蛙喝水願意肩負起時代使命,讓更多人享受便捷健康喝水,在國家實施的健康中國戰略的宏偉藍圖上,寫上光輝燦爛的一筆,為國家為社會盡到自己的一份力量。小蛙喝水創於2016年,總部設在上海。
  • 「萌它寵物」獲青松基金千萬元A輪投資 要做寵物界的海底撈
    青松基金創始合伙人蘇蔚評價,「萌它」打通了產業供應鏈、自主研發SaaS數據信息工具、建立系統化的管理體系和培訓體系,為用戶提供高質標準化的服務以及線上線下結合的新零售體驗。但伴隨著國內養寵率大幅上升,能夠迅速整合市場、規範行業標準的新品牌「萌它」看到了機會。「我們的目標是,做寵物界的海底撈,把每一個服務細節夯實。」高茂翔說,同小店相比,「萌它」作為品牌連鎖門店最大的優勢在於,能夠實現服務和產品的標準化,給用戶帶來最大的安全感。
  • 龍貓數據獲3300萬元Pre-B輪融資,KIP中國領投
    投資界(微信ID:pedaily2012)消息,據36氪報導,AI數據服務平臺龍貓數據日前獲得3300萬元Pre-B輪融資,本輪融資由KIP中國領投、金沙江創投跟投。據悉,本輪融資將主要用於市場擴展、自動化標註研發、AI研發投入等。
  • DTCC2020阿里雲李飛飛:雲原生分布式資料庫與數據倉庫系統點亮數據...
    如果把這些結合在一起,阿里雲就是OSS、亞馬遜就是S3,低成本的對象存儲作為冷存儲池,同時利用高效的雲盤做一個本地的緩存,計算節點進行解耦,對本地節點進行加速,通過高速網絡連成一個池,再對應用做統一的透明式服務。AnalyticDB 雲原生數據倉庫
  • 攜手思愛普(SAP),巨鯊醫療優化業務管理,開創業務藍圖
    會議由巨鯊醫療黨總支書記、HR 總監卜凡林女士主持,雙方圍繞項目歷程、平臺搭建、業務優化及未來合作等維度,展開了友好的討論和交流,共同期盼新的業務藍圖和市場前景。會議上巨鯊醫療董事長王衛先生表示:「巨鯊醫療一直致力醫療行業創新技術應用和場景化解決方案,期望運用先進的科技手段,為醫務工作者提供更多的技術便利。我們秉持「穿國外的鞋,走中國的路」的經營理念,堅持自主創新製造之路。
  • 一組數據告訴你
    總的來說,在數字智能時代背景下,好心情準確把握住醫療產業改革方向,深耕精神心理醫療領域;在資本市場不斷跟投的同時,不斷沉澱,夯實基礎;最後憑藉完善的產品服務體系及良好的用戶體驗,得到了行業及廣大用戶的認可和青睞。