「金猿產品展」ModelWhale——高效好用的數據科學雲端協作工具

2021-01-09 數據猿DataYuan

本產品由和鯨科技投遞並參與「數據猿年度金猿策劃活動——2020大數據產業創新服務產品榜單及獎項」評選。

ModelWhale 是和鯨科技自主研發的一款數據科學雲端協作工具,為數據工作者提供了即開即用的雲端分析環境,用戶可以高效地完成數據管理、編程分析、模型訓練、模型管理、資源管理、任務管理等工作。此外, Jupyter Notebook 交互式和 Canvas 拖拽式兩種分析界面,還可支持團隊間的代碼級協作與高效的成果流轉,更有效地挖掘和利用數據價值,令數據科學團隊的工作更加輕鬆、便捷。

應用場景/人群

目前,基於「社區+工具」的商業模式,和鯨的「數據科學協同平臺」覆蓋高校、科研機構、企業三大場景。中國氣象局國家氣象信息中心、醫學信息研究所、鵬城實驗室、IBM、中國聯通、平安科技、百度、攜程、快手、拍拍貸、同盾科技、好未來等企業已在部分業務場景中使用了和鯨社區和 ModelWhale 工具進行數據價值的創造。

以醫學信息研究所為例,此機構擁有著豐富的文獻資源、醫學特色資源和醫藥衛生科學數據,並且希望能充分發揮醫學數據的價值,建成能夠對海量醫學數據進行分析和建模的醫學數據挖掘平臺,助力行業培養更多專業的醫學數據挖掘人才。同時,讓研究所的科研人員快速進行數據建模、數據挖掘、模型訓練等工作,最大化釋放醫學數據的研究價值,和鯨為其搭建了一個教學和科學研究一體化的醫學數據挖掘平臺,此平臺依託於 ModelWhale 可按需配置應用模塊的定製化功能,通過給學生和科研人員帳號配置不同模塊,實現教學和科研功能的區分,並幫助學院領導與導師在一個平臺完成科研任務、教學任務的統一和協同管理。有效提升信息所內部教學和科研工作開展效率的同時,也構造了良好的人才培養和科研轉化生態圈。

●ModelWhale 科研版

基於量化的科研生產與協作需求,為科研機構及團隊提供的科研協作平臺。支持 GPU、CPU 算力升級調用,提供開箱即用的 Python、R、Julia 語言生態,具備完善的論文生產功能,便捷的團隊協作分享機制和一體化代碼文獻管理。幫助導師精準把控項目細節,加快研究進度,讓團隊成員擺脫繁複的基礎工作,迅速進入研究重要階段,大幅提升科研探索效率和論文質量。

隨著科研數據體量、維度的大幅增加,科研課題的多元化。科研團隊對於數據處理和團隊協同難度逐漸提高,需要引入大量雲資源,並需要為團隊提供統一的協作系統,這不僅需要進行繁複的基礎工作,對於一些沒有計算機背景的團隊成員更是十分困難。從硬體到軟體,為科研實驗室專門配置一套高性能計算能力的設備往往需要花費上百萬甚至千萬,而硬體技術的快速更迭使得高性能計算集群頻繁換代,帶來潛在且不菲的更新成本。

和鯨科技旗下的數據科學工具 ModelWhale 科研版,不僅提供了Python、R、Julia 語言的豐富生態,覆蓋了上百種主流數據分析工具功能,也為團隊提供了統一的雲計算環境,只需一鍵環境配置和項目分享,從數據到模型甚至論文報告都可以一鍵共享,完成無縫實時協作。和鯨ModelWhale 科研版,實際上提供了一整套完整的數據科學相關科研解決方案。

對於科研導師來說,ModelWhale 科研版能夠幫助導師精準把控項目細節,加快研究進度,讓團隊成員擺脫繁複的基礎工作,迅速進入研究重要階段,大幅提升科研探索效率和論文質量。同時也讓科研團隊直接跳過瑣碎的運維管理,從繁重的基礎工作中解放,無需任何硬體部署和運維,快速在應用層開展研究工作,根據任務需求彈性調度雲算力,既高效又經濟。

具備雲資源彈性調度、開箱即用的環境配置、交互式編程、便捷的代碼庫、豐富的學習資源、多人實時在線協作、任務與權限靈活管理、論文復現等諸多優勢的 ModelWhale 科研版,不僅在深度學習等前沿科研領域有著很好的應用前景,在歷史、社科和經濟學這些人文學科也有著豐富的應用。據悉,ModelWhale 科研版推出後,受到了眾多高校與科研機構的廣泛關注,並已經在國內的頂級高校如清華大學、上海交通大學的科研團隊中得到應用。

●ModelWhale 教育版

除了科研版之外,和鯨還推出了 ModelWhale 教育版,包括實訓教學平臺、管理平臺、課程體系、課程內容、實訓項目、優質師資與師資培訓、就業與企業需求對接等全方位服務,使得數據科學的教學工作更加簡單高效,大幅提高學習效果與就業水平。教育版已被清華大學、北京大學、中國人民大學、上海交通大學、同濟大學等知名院校以及中國醫學科學院採用,作為在「數據科學與大數據技術」專業以及相關輔修專業、交叉學科中的數據科學教學平臺。

ModelWhale 教育版基於高校的學科建設與發展需求,為高校提供數據科學與人工智慧一站式教學解決方案,包括實訓教學平臺、管理平臺、課程體系、課程內容、實訓項目、優質師資與師資培訓、就業與企業需求對接等全方位服務,使得數據科學的教學工作更加簡單高效,讓學生擺脫純理論教學的桎梏,快速融入到實戰式學習中,大幅提高學習效果與就業水平。

產品功能

一、數據管理

●數據源接入:用戶可將分析所需的各類格式數據文件上傳至 ModelWhale ,進行安全統一的管理、展現與共享,也可遠程訪問資料庫直接調取使用,無需下載、存儲與重複維護等繁瑣流程。文件形式數據可以以數據集形式進行管理。對於結構化數據文件,可自動生成描述性統計、頻數可視化分布;對於關係型資料庫可在線查看、篩選各資料庫表與詳細欄位。

●數據源管理:ModelWhale 支持配置與管理不同數據源的訪問路徑、使用權限、描述文檔等信息。使用權限上,支持以用戶組形式對使用權限進行統一管理。針對數據集形式的數據源,掛載分析時可自動將該數據加載到分析環境中;針對資料庫形式的數據源,在分析時將自動在環境中嵌入訪問憑證,然後進行遠程訪問,避免出現訪問憑證的安全洩漏。

二、分析工具

●Notebook 交互式分析:ModelWhale 提供針對數據分析流程進行專業優化的Jupyter Notebook 環境,支持版本管理、變量管理、資源監控等專業功能,擁有不斷更新的數據科學常用算法代碼片段,涵蓋數據分析處理、可視化與常用模型功能,支持 Cell 輸入輸出的隱藏發布、PPT 模式演示、HTML、PDF 格式導出等多樣化的呈現方式。

●Canvas 拖拽式分析:ModelWhale 可基於圖形化、組件化的操作進行數據預處理、數據可視化、統計分析、機器學習建模工作,並支持一鍵轉換為 Notebook 進行深度代碼分析,幫助團隊快速搭建分析流程,進一步提升數據工作效率與體驗。

三、模型管理

●模型解析:ModelWhale 支持對主流機器學習框架輸出的模型文件進行可視化解析,用戶能夠直觀的獲取模型的內部結構,查看模型組成、模型結構以及每層網絡節點的輸入、輸出和對應的參數說明。

●訓練記錄:ModelWhale支持對每次模型訓練記錄當次使用的數據、運行的代碼、訓練過程中關注的參數以及運行中的性能情況進行查看,通過對比分析模型在訓練過程中的各種重要評價和硬體使用情況,進一步優化大規模模型訓練成本。

●模型服務:ModelWhale 支持將產出的模型文件通過一鍵部署的方式構建 RESTful API 服務。該服務以 API 的形式呈現,使得平臺內開發者能夠基於 API 進行模型的開發或調用,通過即時調用獲取推斷結果。此外,用戶還可將已經部署的服務,例如數據讀取、數據推斷、數據可視化等靈活組合,構建新的服務供其他研究人員調用,以提高服務的便捷性和可復用性。

四、協作管理

●任務規劃:ModelWhale 可進行任務拆解與分配、進度交流與分享,輕鬆同步團隊進展;用戶資料與成果在知識庫中可輕鬆沉澱與梳理,方便協作者直接查看與使用。

●代碼式協作:ModelWhale 可在項目中添加協作者實現團隊協同,團隊間可針對每個代碼塊的分析結果進行討論和批註,甚至一鍵輕鬆 Fork 他人代碼,實現 Notebook cell 級別代碼版本的比對與合併,還可定義項目輸出功能,支持基於數據和模型產出的工作流。

五、計算引擎

●鏡像管理:ModelWhale 為用戶提供即開即用的 Python 與 R 語言開發環境,並提供統一使用的數據科學鏡像,鏡像中包含常用機器學習框架與數據分析研究過程中的常用工具包,支持用戶根據分析需求快速構建自定義鏡像,以滿足不同應用的分析需求。

●彈性算力調度:ModelWhale 提供基於 Kubernetes 的調度服務,每次項目運行時將從對應實例類型的集群中,調度對應配置的機器並提供計算服務。當項目關閉後,可以自動釋放運算資源,使資源能夠服務於其它業務,實現計算資源利用率和可復用性的有效提升。SaaS 模式支持跨雲調度 AWS、阿里雲、華為雲、騰訊雲的計算資源,私有化模式可支持在公有雲和私有雲環境的獨立部署。

●離線訓練任務:ModelWhale 離線訓練任務可支持調度單機 CPU 實例、單機 GPU 實例與分布式 GPU 集群算力,用戶可指定實例類型、Notebook、鏡像進行離線訓練,實時返回訓練結果以及訓練過程中的資源使用情況,並將訓練結果在系統內進行同步與保存。GPU 集群支持基於 Horovod 的環狀規約(Ring - AllReduce)架構下的分布式機器學習方法,它是高性能計算中常用的技術,相比傳統的參數伺服器架構,它可以顯著分散網絡傳輸的壓力,且隨著集群的規模增大性能線性增加。用戶只需修改少量的單機代碼就可以將訓練腳本改為分布式的版本,大大優化調試成本。

產品優勢

細粒度的權限管理

對數據、算力、項目、成員進行細粒度的權限管理,保證企業內部的數據安全;通過自動測評模塊高效管理算法模型,實現對算法的生命周期管理。

功能豐富的專業化分析界面

ModelWhale 通過自主研發的Notebook、Canvas可直觀呈現研究過程,模型解析功能讓成果更好地被詮釋,雲端分析環境支持研究結果一鍵復現。

業界領先的資源調度能力

統一的開發環境:ModelWhale 在容器中預安裝所有主流數據科學的算法和框架,數據科學家一方面可以開箱即用地使用自己已經熟悉的算法,同時能夠實時與他人同步自己的分析成果;提供實時存儲的文件系統,雲端保存數據分析的中間結果。

拖拉拽式編程

Modelwhale提供拖拉拽的Canvas模塊化編程組件,組件搭建後,數據小白也可以輕鬆修改參數完成工作。

使用客戶/人群

和鯨科技的核心產品 ModelWhale ,擁有了出色的用戶體驗和產品口碑,贏得了包括了中國氣象局國家氣象信息中心、醫學信息研究所、金風科技、鵬城實驗室、清華大學、上海交通大學、同濟大學、華東師範大學、中國電信、中國銀聯、中電科等在內的,國內最優秀的一批機構客戶的信任。使用人數已超100萬人次。

市場價值

資料經驗分享,節約學習成本

ModelWhale 數據科學雲端協同平臺可支持一鍵分享自己的學習經驗、人工智慧算法及數據集,形成和鯨社區(目前已覆蓋了130,000+優質數據人才)的開放學習文化,方便社區內的成員互相幫助及分享研究成果,從而可加速人才提升,並降低學習成本。

協作效率提升,人力消耗降低

ModelWhale 數據科學雲端協同平臺是基於雲技術的原生平臺,方便協作並能夠提升數據科學技術的運用效率,可減少人工智慧研發人員在協作過程中產生的相關人力資源浪費。

分析門檻降低,數據價值擴大

ModelWhale提供便捷的代碼片段收藏與調用功能,更有拖拽式編程界面,降低數據科學技術使用成本,同時提供拖拉拽的Canvas模塊化編程組件,組件搭建後,數據小白也可以輕鬆修改參數完成工作。

智能人才匹配,減少時間浪費

通過基於 ModelWhale 的人工智慧及數據科學競賽以及眾包項目,能夠為企業更加精準、快速的找到最合適的人才,大幅降低人才與企業需求的匹配成本。

創新兼顧風險,試錯成本可控

ModelWhale 的人工智慧及數據科學競賽與眾包項目,能夠充分利用全社會人才之智,在降低人工智慧創新成本與風險的同時,最大化的產出優秀成果,促進企業的業務創新與增值、提升企業的核心價值,從而推動企業快速發展。

產品所屬企業·和鯨科技:

和鯨科技(主體為「上海和今信息科技有限公司」)2015年4月創始於上海,是愛分析評選的「中國數據智能創新企業50強」,專注於「數據科學協同平臺」的數據智能科技公司,以「connect people with data 數據與人的高價值連結」為使命,專注於挖掘商業數據和數據人才的價值。

和鯨社區(原「科賽網」)是中國知名的第三方數據科學社區之一,最早一批專注於大數據算法比賽的平臺,擁有近13+萬註冊數據科學家用戶,輻射超過30萬數據人才群體。和鯨科技旗下的ModelWhale(原K-Lab),是具備國際領先性的數據科學SaaS平臺,可滿足數據科學家、人工智慧工程師、商業分析師等數據工作者在線完成分類、建模、分析、可視化、結果輸出等任務,並支持私有化部署和雲端協同,幫助企業、高校、科研機構開展工業級數據科學應用與人工智慧研發。

相關焦點

  • ModelWhale正式上線,和鯨掀起新一輪數據浪潮
    2020年10月20日,和鯨科技成功舉辦「喚醒數據 煥新未來」線上發布會,宣布其核心產品 K-Lab 全面升級並正式更名為 ModelWhale,與數萬名線上觀眾一起,共同見證了 ModelWhale 的新生。
  • 「金猿產品展」Smartbi Eagle——推動企業數據化運營
    本產品由思邁特軟體投遞並參與「數據猿年度金猿策劃活動——2020大數據產業創新服務產品榜單及獎項」評選。Smartbi Eagle 自助分析平臺並不只是一個 BI 工具,它還匯集了眾多有利於分析使用、傳播、沉澱的功能。因此除了提供全面且易用的自助分析工具集外,還提供統一門戶、數據導航、數據答疑、應用商店等特色功能。本質上Smartbi Eagle 自助分析平臺是企業的的數據生態圈,通過平臺的方式整合企業數據資產,提高數據應用效率,促進企業大數據繁榮,讓企業獲取更高管理和業務效益。
  • 雲端數據表分析服務商「Fivertran」年收入增長超3倍,計劃下一年...
    作者:包淺雨荷 編輯:石亞瓊 ** 技術發展的AI和5G時代,數據體量加大,需要更高效、更靈活、更安全地對源數據進行集中化處理、備份和分析。總體來說,一個公司需要花費約50萬美元才能將10個數據源集中化處理,然而大多數公司都有幾十到上百個基於雲端的數據源。如何降低處理數據的成本,提高效率,是企業關心的問題。
  • 「金猿產品展」詢盤雲Marketing CRM——賦能外貿企業業務增長
    本產品由詢盤雲投遞並參與「數據猿年度金猿策劃活動——2020大數據產業創新服務產品榜單及獎項」評選。詢盤雲Marketing CRM,是一款圍繞外貿企業的客戶旅程,打通營銷鏈路上所有觸點的SaaS系統。
  • 微鏈創業者基扶植項目「即時設計」上線,填補國內UI 設計工具產品...
    微鏈創業者基扶植項目「即時設計」上線,填補國內UI 設計工具產品空缺該產品的發布,將打破以往設計師對歐美公司研發的專業設計工具產品的需求市場,注入嶄新的"血液"。據了解,即時設計是一款在線設計工具,除 UI 設計外,還可覆蓋互動設計、高保真原型設計、海報設計、插畫設計等多類平面設計需求;同時也是一個團隊設計協作平臺,可多人實時協作編輯同一個文件,並可原生支持設計成果的評審、交接與溝通。
  • 設計師有了新選擇,國內首款 UI 設計工具「即時設計」正式上線
    「即時設計」也是一個雲端設計平臺,在產品形態上類似於 Figma,相較於其他傳統設計工具,有以下幾個顯著優勢:(1) 隨時隨地打開瀏覽器即可使用:無需下載安裝、不受系統限制;同時全平臺版本均自動更新,自然地解決了其他本地軟體因文件版本不同而出現的無法打開和打開異常的問題。
  • ...ONES」收購協作工具「Tower」,要做中國研發管理的 Jira + Trello
    原標題:研發管理工具「ONES」收購協作工具「Tower」,要做中國研發管理的 Jira + Trello     獲悉,企業級研發管理工具「ONES」宣布完成對協作工具「Tower」的收購,進一步拓展其研發管理業務版圖。
  • 和鯨推出自有賽事品牌DataJoy,以最大化數據人才價值
    DataJoy®品牌將專注於服務數據人才,幫助他們更好地掌握數據科學方法,熟悉數據科學工具,貼近數據科學的實際應用場景,同時讓數據科學愛好者們能夠有一個平臺可以更好地探索、互動和創造。在和鯨看來,數據的積累與算力的升級正在以指數級的速度推進,但是數據到智能的閉環,還遠沒有實現,太多的數據在沉睡,太多的算力在空轉。
  • 「磨礪 · 聚變」 日事清 2020 新產品發布會成功舉辦
    2020年5月12日下午14:00,主題為「磨礪 · 聚變」的 日事清 2020 新產品發布大會,通過線上播出的方式成功舉辦。日事清創始人劉磊、CTO毛文強、產品總監曹德季等多位日事清高管和行業意見領袖嘉賓帶來了精彩的演講,同時重磅發布日事清 8.0 新版本。
  • 產品經理常用工具介紹與下載
    產品經理是一個綜合職能的崗位,日常用到的工具挺多,這裡整理了一些的日常用到的好用的工具,推薦給大家。思維導圖工具1.XMind可以導入MindManager、FreeMind數據裡面的文件,也可以將文件導出為Word、PPT、PDF、圖片和TXT等格式的文件,以便將用XMind繪製的圖與他人輕鬆共享。
  • 360收購文檔協作產品「億方雲」,強勢入局在線辦公
    Tech星球獨家獲悉,360將全資收購一家企業文件管理與協作SaaS產品——「億方雲」,進入企業在線辦公領域。作為網際網路的「老一輩」巨頭,360一直都在安全方面深耕。此次轉戰辦公領域,一方面,是因為辦公市場仍然還沒有形成一超多強的局面,還有機會去搶佔市場份額。另一方面,是由於企業辦公中最注重的就是安全性。
  • 專訪| 帷幄Whale 葉生晅:站在品牌一線,全域全流程服務品牌數位化
    面對激烈競爭、快速變化的商業環境,品牌方一致認可數位化這把利器,但如何用好數位化、用什麼樣的數位化卻一直是個難解的問題。 當品牌商開始正視數位化帶來的能量、相信數位化的價值時,「全渠道」、「全域」的發展邏輯便自然形成,未來基於「全域」的「自動化流程」、「全生命周期」的數位化發展方向也清晰可見。
  • 在線協作工具「一起寫」獲金山WPS戰略投資
    DoNews 9月7日消息(記者 周勤燕)在線協作工具「一起寫」今日對外宣布,獲得金山WPS的戰略投資,同時還與金山WPS達成了戰略合作,但並未對外透露具體的投資金額。 一起寫CEO蔡健表示,傳統的文檔協作方式效率非常低下,傳統的協作方式通常為:在本地用Word寫完文檔後,再通過郵件或qq發給其他人,這種傳統的文檔協作方式的效率非常低下。而一起寫作為一款雲端Office產品,是為了解決大家在使用office過程中協作效率低下的問題,實現多人實時在線協作。
  • 「原型指南」產品原型設計工具如何選?
    但如今,形形色色的產品原型設計工具擺在眼前,每款工具都各有千秋。然而怎樣去選擇一款適合自己的原型工具,就成了設計師的一大難題。特別是對於一些剛入門的設計師來講,會稍顯茫然。選擇一款高效的設計工具,可讓你得到事半功倍的效果。反之,將徒勞無功。本文我會以我的親身經驗來教大家如何選擇一款適合自己的工具。
  • 聚焦「用戶為本」,騰訊設計工具產品實踐與產業發展同行
    近日,在騰訊2020 Techo Park開發者大會自研設計工具專場上,騰訊雲集中發布了設計素材庫工具平臺(包括控制項庫TDesign)、CoDesign設計協作平臺和ProWork項目管理平臺三大產品,將B端的設計能力形成數位化工具箱,方便客戶和行業夥伴「隨取隨用」。
  • 「金猿案例展」老百姓大藥房——新零售數位化升級
    本案例由開域集團投遞並參與「數據猿年度金猿策劃活動——2020大數據產業創新服務企業榜單及獎項」評選。老百姓大藥房(上海證劵交易所主板上市公司,股票代碼603883)是中國具有影響力的藥品零售連鎖企業,系中國藥品零售企業綜合競爭力百強冠軍、中國服務業500強企業、中國連鎖百強企業、湖南省百強企業。
  • 作為產品經理,哪些工具適用?
    這兩個是最常用的原型設計工具,用於產品或者頁面策劃,也經常被拿來對比,從界面可以看出Balsamiq Mockups偏手稿風格,Axure RP更加偏商務風,如果你想讓你的設計師更多自己想像的空間就選Balsamiq Mockups,如果更實體化,可以選擇Axure RP。可以用再帶畫圖工具手動畫。
  • 6款相見恨晚的在線設計工具,原型海報流程圖輕鬆搞定
    不論你是交互還是視覺設計師,不論你是產品經理還是運營,不論你是技術還是銷售,都可以選擇在線設計工具——再也不用下載幾個GB的安裝包,或者愁著文件沒存,隨時隨地,你都可以做設計、與人協作、分享便捷,整體都更為簡單高效。下面,我們為你介紹6個工具,涵蓋原型設計、平面設計、流程圖設計等場景。
  • 吐血整理,最全的產品經理常用工具清單!
    三、用戶需求調研工具產品經理的一個重要工作就是了解用戶需求。實際工作中,產品經理與用戶接觸的機會並不多。如何低成本地快速收集大量用戶的真實意見和產品使用反饋,這是困擾很多產品經理的問題。麥客CRM是比較實用的用戶信息調研工具,支持自定義,不管是用戶反饋、內測申請、需求調研等都可以按照想法來設計。簡單好用而且免費。
  • TrackingIO:幫市場省錢,助產品賺錢丨金猿產品展
    ,H5,小程序等多種產品類型的監測產品功能移動廣告歸因TrackingIO通過全網的廣告點擊數據,幫助廣告主實現精準的激活歸因。還唄等上萬家移動網際網路公司提供第三方移動廣告效果監測服務,涵蓋遊戲,金融,電商,教育,房地產,社交,直播,手機工具等移動APP行業客戶。