機器之心發布
機器之心編輯部
初創公司格物鈦希望通過在公開數據集社區和數據管理工具領域的創新,從而推動數據定義軟時代這一新時代背景下的全球創新,破局數據孤島,賦能AI基礎設施建設。
數據定義軟體時代到來
回顧網際網路發展歷史,過去 30 年是開源軟體生產數據的時代,這個時代誕生了 Google、Facebook、阿里、騰訊和字節跳動這樣的網際網路巨頭,他們都在用軟體生產海量的數據。但是不難發現這一趨勢從近幾年開始悄然發生了變化,實際上前 30 年的數位化變革已經產生了大量用於算法訓練的非結構化數據,如何存儲、管理以及利用現有的數據來完成更加高效的算法迭代和應用開發才是 AI 開發者在未來 30 年需要面對和解決的課題。伴隨著 Snowflake 這樣的數據處理軟體公司進入了人們的視野,我們看到數據定義軟體的時代已經到來。而初創公司格物鈦希望通過在公開數據集社區和數據管理工具領域的創新來推動這一新時代背景下的全球創新。
破局「數據孤島」成為關鍵
高質量的數據是支持 AI 算法的基礎。以往數據大多以孤島的形式存在,數據之間卻並沒有產生連接。不同企業、機構之間的數據標準規範並不統一,數據質量也參差不齊,就算進行共享也依然困難重重。伴隨著各類 AI 應用場景落地的技術難點逐漸浮出水面,以無人駕駛領域為例,許多駕駛場景具有稀缺性,僅憑一家之力構建包含所有的交通場景的數據集將消耗巨額的數據採集成本,並且很難在短時間內一步到位,AI 企業認識到打破數據孤島走向合作開放將是未來謀求發展的必然選擇。
近年來行業中不少企業和高校研究機構已經陸續發布公開數據集,將自身積累的優質、龐大數據公開出來,為認知層、感知層的 AI 技術提供學習驅動,把更多的數據、算力、技術匯集在一起,幫助各領域的數據釋放出其應有價值,為人工智慧的產業化落地提供關鍵基礎。
格物鈦公開數據集平臺
以開源數據集平臺賦能 AI 基礎設施建設
隨著行業參與者們對數據的態度越來越開放,很多公開數據集應運而生。但是由於缺乏統一的行業規範與標準,用戶搜索下載和使用這些公開數據集存在諸多困難。格物鈦看到這一行業痛點後隨即發起了 「尋集令」 項目的號召,希望發揮自己在數據管理上的技術優勢,建立 AI 公開數據集平臺。招募自動駕駛、網際網路泛娛樂、新零售、智慧城市和在線教育等多領域的合作夥伴加入,打造最受開發者歡迎的公開數據集社區,為企業、機構和個人提供高質量的真值數據、推動人工智慧行業場景落地。
格物鈦公開數據集平臺自去年九月份上線以來,用戶數實現了 13 倍的爆發式增長。目前已有涵蓋 8 個領域的 16 家企業與我們達成了戰略合作,他們將會在格物鈦公開數據集平臺上開源自有的數據,賦能 AI,加速人工智慧行業的快速落地和科研創新。
格物鈦 CEO 崔運凱表示:「尋集令是一個永遠不會終止的倡議。如果你是一個企業的決策者,如果你有大量的數據,還不知道如何發掘它的價值,或者還想探尋如何更好使用它們的創意,也許是時候開放它們其中的一小部分,給這個社區中的創新者們,讓他們運用他們的智慧,來發現這其中無限的價值。這個價值被發現的過程,往往帶來的是雙贏。社區的力量是強大的,Graviti 希望今天的分享和倡議,可以激勵你參與到我們的行動中來,因為只有我們攜起手來,才能一起定義未來。」 Graviti 公開數據集平臺下一階段還將持續投入研發,為人工智慧企業和各類學術研究機構提供專業的一站式公開數據集發布及運營支持,同時完善社區功能為用戶提供問題與需求的反饋渠道,有效解決用戶提出的各類數據集需求。未來格物鈦也希望可以攜手更多 AI 生態的各類夥伴,一起用心去開源,建設人工智慧數據領域的高地。
尋集令全球合作夥伴一覽
THE END
轉載請聯繫本公眾號獲得授權