「智能」的產生,本質上是非結構化數據結構化的過程

2020-12-16 IT桔子

每天了解一點創投圈

2019 年 9 月 19 日,IT 桔子邀請循環智能(Recurrent)聯合創始人&CEO 陳麒聰為人工智慧社群,帶來「挖掘非結構化客戶交互數據,Recurrent.ai 的商業化之路」的主題分享。

循環智能(Recurrent)最近剛剛完成由真格基金領投,金沙江創投、靖亞資本和華山資本跟投的 A 輪融資。循環智能此前獲得金沙江創投、靖亞資本和華山資本的 PreA 輪融資,半年融資總額達千萬美元。此次融資將主要用於人才引進、產品創新和業務拓展。

以下是嘉賓分享部分內容:

「客戶交互」智能化的四個市場階段

企業的「客戶交互」數據,既包括用戶使用網站或者 App 的行為數據,也包括電話溝通、視頻會議、在線 IM 溝通以及線下的當面溝通數據,但大部分數據都是非結構化的,「智能」的產生,本質上是非結構化數據結構化的過程。

「客戶交互」的智能化需要經過四個市場階段,這四個階段既是「客戶交互」數據從單一渠道向全渠道擴展的過程,也是行業覆蓋從網際網路向全行業擴展的過程,更是人的工作和機器的工作逐步結合的過程。

這四個市場發展階段的特徵分別是:

1. 第一個階段是存量的結構化數據:這個階段主要是指客戶通過 App 或網站與企業產生的交互過程,用戶產生了大量點擊行為數據,這些數據跟轉化結果相關,經過分析,可以做推薦和預測。

2. 第二個階段是存量的全渠道非結構化數據:這個階段主要指企業與客戶通過電話或者在線 IM 進行溝通的數據,這些數據大部分是非結構化的,而且涵蓋了金融、教育、網際網路+生活服務等更多領域。

3. 第三個階段是增量的全渠道非結構化數據:這個階段就是將線下場景囊括進來,比如線下的面對面銷售過程、銀行櫃員與客戶溝通的過程等。

4. 第四個階段是線上線下融合以及人機結合:這個階段將由機器主要完成對「客戶交互」的人、時間、信息和渠道進行規劃和計算,由人負責信息傳達。

Recurrent.ai 目前做的事情,專注在第二階段的市場,第三階段也開始嘗試。為了適配第二階段和第三階段的技術需求,我們採取了 AutoAI 系統架構:

這個結構的底層是數據來源,包括呼叫中心、錄音設備、IM 即時通訊、資料庫以及傳感器。這些數據首先需要通過語音識別和文本處理技術,變成結構化的文本數據。

下一步是通過預訓練模型 XLNet 提取基礎特徵,以及通過人工標註來適配不同行業的實際情況,輔助提取行業特徵。將兩者結合,通過 AutoML 技術產生優化的模型。

最頂層是應用層。針對不同行業,Recurrent.ai 會把最重要的五六個維度標籤和幾十個上百個弱特徵找出來,使文本被充分結構化,之後就可以根據需求做出不同的應用。

與傳統的基於規則的應用相比,Recurrent.ai 所採用的 AutoAI 架構,最大優勢是底層架構是統一的,基於統一的底層架構,就可以規模化、可複製地支持不同類型的上層應用。

目前很多行業最大的痛點是獲客成本非常高、拉新非常貴,因此很多行業從增量運營轉到存量運營,就是從現有客戶身上獲取更大的價值。面向銷售領域,Recurrent.ai 通過 AutoAI 架構實現了銷售場景的 5 種應用:

線索打分(Retargeting):對海量未轉化的線索進行意向打分,重新激活已有線索;客戶畫像提取:從溝通、對話內容中自動提取客戶畫像,讓銷售更有針對性;客戶心聲分析:了解大部分客戶在想什麼,然後據此調整銷售策略;銷售行為挖掘:分析高轉化的回覆,找出來哪些行為能促成銷售成單;服務質檢:了解銷售或客服是否按照規範來溝通,改進服務水平。

這些應用的最終目標都是提升銷售的轉化率。Recurrent.ai 在與客戶公司的實踐中發現,採用新的系統可以大幅降低人力成本,提升質檢和銷售線索轉化的效率。具體是怎麼做到的?我來分享教育領域的一個案例。

案例:銷售線索評分和用戶心聲分析

我們為某上市教育公司提供的服務效果,如果抽取頭部 30% 的銷售線索(leads),成單率可以做到就是傳統隨機撥打平均轉化率的兩倍多。

簡單理解,如果有 30 萬個未成交的歷史銷售線索,銷售員有精力聯繫其中 9 萬個,若隨機對這 9 萬個銷售線索進行重新溝通,那麼最終的成單量是 2700 個,成單率 3%。

如果採用線索評分系統,對歷史溝通數據進行評分,然後按照評分的高低,選擇評分高的 9 萬個客戶進行溝通,那麼就能達成 6300 個成單,成單率 7%。成單率是之前的 2 倍多,或者說,幫助企業不增加工作量情況下,帶來了 3600 個成單增量。這只是其中一項應用帶來的效果提升。

Recurrent.ai 的線索評分整體解決方案,包含了客戶畫像生產、跟進時間和渠道特徵學習以及產品特徵學習等三個主要模塊:

客戶畫像生產模塊。通過自動化的畫像生產管理系統,抽取結構化的客戶畫像。其中很多畫像特徵(用戶到底關心什麼)是甲方公司之前並不知道,Recurrent.ai 也不知道,但可以通過機器學習來得到的。跟進時間和渠道特徵學習模塊。就是要知道什麼時候、通過什麼渠道聯繫客戶。在競爭激烈的行業,如果隔了一周沒有聯繫,客戶就被別人搶走了。如果溝通太頻繁會打擾到他,所以需要從歷史溝通數據中學習到其中的規律。產品匹配特徵學習模塊。很多甲方公司的痛點不是銷售線索(leads)多到銷售電話打不過來,而是根本不知道應該向客戶推哪個產品。一旦推錯產品,就相當於少了一次機會。Recurrent.ai 的系統會從過往的溝通數據中學習到產品匹配的規律。

也就是說,為了進一步提升轉化率,企業還需要結合銷售員的能力模型進行線索分配、推薦,並且結合時間、渠道的建議,以及產品匹配的信息,綜合起來提高銷售線索的轉化率。

這個案例是執行層面的,講的是具體怎麼做能提升銷售效率。但實際上,客戶交互的智能化,還會在管理層面為企業提供更多價值。比如你會發現一個產品再怎麼推薦也沒有效果,可能問題就出在產品本身上面。

舉例來說,在教育客戶的一個案例中,一家企業通過用戶心聲分析發現「提到錄播課程上線太慢的客戶中,大部分都退課了」。對於管理者而言,這是一條非常有用的信息。如果不去改進產品,而是一味地想通過提升銷售轉化率來提升業績,顯然是不可能的。

IT 桔子超級小組介紹

「超級小組」是 IT 桔子推出的網際網路垂直行業社群,通過不同的主題性小組,為用戶結構化呈現某一領域最新動態、優質內容、火爆話題以及嘉賓乾貨。

往期活動分享嘉賓包括但不限於:Video++ COO 董慧智、來也的合伙人 白澤宇、數庫創始人劉彥、環信 CEO 劉俊彥、深思考 CEO & AI 算法科學家 楊志明、英諾天使基金執行董事周全等,人工智慧線上公開課每月一期,超級小組會員免費參與,歡迎持續關注。

相關焦點

  • 結構化數據 vs. 非結構化數據
    企業內部的結構化數據與非結構化數據問題決定了他們是否應該投資於非結構化數據的分析,以及將這二者結合是否成為一種更好的商業智能?   什麼是結構化數據?   結構化數據通常駐留在關係資料庫(RDBMS)中。其欄位存儲長度顯示數據電話號碼,社會安全號碼或郵政編碼。
  • 結構化數據,最熟悉的陌生人
    同時,結構化數據的語義學習也是一個讓結構化數據「升華」的重要一步,於是我們又結合近期的幾篇論文列舉了結構化數據預訓練的方式。最後,我們列舉了幾個處理結構化數據常見的下遊任務和數據集,以便想做更深入研究的小夥伴自取。值得注意的是,本文主要介紹結構化數據處理的主幹架構,而不是對多篇論文的解讀,所以無法包含論文中所有的精彩的創新點,只選取了對結構化數據處理流程有用的大框架內容進行講解。
  • 數據佔比高於80%?關於這些非結構化數據你管理了多少?
    而在這些數據中,結構化數據僅佔到全部數據量的20%,其餘80%都是以文件形式存在的非結構化和半結構化數據,日誌文件、機器數據等又佔據非結構化數據的90%。所以巨大非結構化數據管理和運用對於企業來說愈發的重要,今天就和大家聊聊非結構化數據管理這些事。
  • 國內數據分析「七宗罪」 美國進入「非結構化」數據分析新時代
    雖然,近年來「大數據」及「數據分析」概念被炒得很火,但國內,國內很多CIO/CTO們仍很「害怕數據」——一方面,企業充斥著無從分析的非結構化數據;另一方面,結構化數據分析方面,與非結構一樣面臨著方法不科學、周期冗長、性價比低、不能直接產生經濟效益等典型的問題。國內大數據分析越來越陷入到一種不得要領、頗為雞肋的僵局。
  • 結構化SQL資料庫與非結構化NOSQL資料庫大比拼
    只要我們在處理數據的過程中存在這樣的操作,要麼成功,要麼失敗,那麼我們首先要選擇的就是SQL資料庫。然而在NOSQL資料庫中不存在這樣的機制。但是這裡追求數據的統一性,比如說你有很多個數據集,這裡不稱之為數據表了。一旦有一部分修改,你必須更新所有的包含這類數據數據集。比拼3:效率方面。
  • 如何解決大規模非結構化數據的存儲挑戰
    【IT168 評論】存儲非結構化數據是存儲系統的主要挑戰之一,大數據、人工智慧、5G等技術的進步正在產生大量的必須進行管理、存儲和分析的數據,這為存儲系統帶來了許多挑戰。  當然,處理非結構化數據並非是一個「世紀難題」,越來越多的提供商正在興起,幫助企業滿足處理大量數據的需求。
  • 「視點」從IT到DT,數據技術的本質到底是什麼?
    那麼在IT信息技術基礎上發展起來的數據技術(DT技術)的本質是什麼呢?二、DT的本質DT,英文是Data Technology,即數據技術。在探討數據技術的本質之前,我們要對「數據」有清晰且一致的理解。什麼是數據?
  • [原]深入對比數據科學工具箱:Python和R 非結構化數據的結構化
    對於這些非結構化數據,最常見的數據結構就是JSON,而對應的資料庫就是MongoDB。利用MongoDB這樣的NoSQL資料庫,我們可以把異構的數據源整合到若干個collection中,通過key-value的形式對數據進行增刪改查。雖然MongoDB在數據聚合上有天然的優勢,但是在事務處理(OLTP)與數據分析(OLAP)上的表現卻不盡人意。
  • 幫您分析非結構化數據的 10 個實用步驟
    【IT168 導購】數據分析正在成為企業發展的重要部分。對於企業來說,了解結構化和非結構化數據是非常有必要的,以便為業務發展做出正確的決策。 下面的10個步驟將幫助企業來成功的分析非結構化數據。
  • 數安行CEO王文宇榮獲WIT2020「年度數據安全研究課題與論文」獎項
    12月29日-30日,第六屆WitAwards (2020)中國網絡安全創新年度評選活動頒獎盛典(以下簡稱WIT2020)在CIS 2020網絡安全創新大會上隆重舉行,數安行CEO王文宇先生的論文——《基於數據運營安全的個人信息保護》榮獲「年度數據安全研究課題與論文」獎項。
  • Taste Analytics落地中國,讓中國非結構化數據分析不再落後美國
    的估測非結構數據分析的應用佔據大數據分析市場份額的75%,汪曉宇做的就是非結構化數據分析。Taste Analytics主要產品服務平臺就是Signals,這是一個可以對企業日常經營狀況做出智能分析的解決方案,有強大的非結構化文本數據的分析能力,包含數據採集,數據分析和可視化這三層服務。
  • 非結構化數據之困:先歸檔 才能少備份
    【IT168 評論】在大數據備受關注的今天,企業不能盲從,而是應該明白大數據為什麼會如此之熱,為什麼去關注它。其中一個重要原因就是,大數據不同於普通數據,它增加了很多半結構化數據和非結構化數據,並且其數量級和價值不可同日而語。
  • ...顧客體驗管理平臺「體驗家XMPlus」,瀚一數據完成數百萬美元Pre...
    來源:時刻頭條瀚一數據科技(深圳)有限公司(以下簡稱「瀚一數據」)宣布完成數百萬美元的Pre-A輪融資。本輪融資由SIG領投,真格基金等天使輪投資人繼續跟投,山景資本擔任獨家財務顧問。此前,瀚一數據曾於2019年底完成真格基金投資的數百萬美元天使輪融資。
  • 打造顧客體驗管理平臺「體驗家XMPlus」,瀚一數據完成數百萬美元...
    瀚一數據科技(深圳)有限公司(以下簡稱「瀚一數據」)宣布完成數百萬美元的Pre-A輪融資。本輪融資由SIG領投,真格基金等天使輪投資人繼續跟投,山景資本擔任獨家財務顧問。此前,瀚一數據曾於2019年底完成真格基金投資的數百萬美元天使輪融資。
  • 你看到的是視頻,我看到的是「成噸成噸」的非結構化數據
    因為這可都是「成噸成噸」的非結構化數據!IDC說,現在全球70%的數據都是非結構化數據。它們遍布醫療、傳媒、教育等幾乎所有行業。無處不在的非結構化數據,我們是如何存放?如何管理?如何利用的呢?最近,戴爾科技集團舉辦了一場以「管理數據,論道價值」為題的技術交流會。
  • XSKY發布X3DS立體數據管理系統,解決海量非結構化數據管理難題
    IDC預測,2018年到2025年之間,全球產生的數據量將會從33ZB增長到175ZB,其中超過80%的數據都會是處理難度較大的非結構化數據。 非結構化數據其體量要比結構化數據大得多,而且,隨著現在非結構化數據在企業生產系統中的重要性不斷凸顯,多數企業都面臨海量非結構化數據的管理難題: 1、海量小文件快速遷移 更換設備廠商,新老系統替換都需要遷移數據。
  • 釋放海量非結構化數據潛能,愛數AnyShare技術探索之旅揭秘
    海量非結構化數據正在洶湧而來  如今,非結構化數據已佔據數據總量的90%,且保持高速增長;非結構化數據存在於各種設備以及各種系統之中,無處不在。毋庸置疑,海量非結構化數據的時代已經到來,海量非結構化數據的管理、處理、保護等巨大挑戰與難題也接踵而至。
  • 「原創」Google排名方法集:優化Structured Data(結構化數據)
    優化Structured Data(結構化數據)做外貿電商SEO的都知道,得Google者得天下,所以針對Google的優化,必不可少,今天我給大家講講,如何去通過優化Structured Data(結構化數據)獲得更高的排名
  • Taste Analytics如何解決海量非結構數據分析
    在談大數據分析的時候,非結構化數據是無法繞過的話題,那麼首先究竟什麼是非結構化數據呢,Derek Wang給我們做了詳細的解答,他表示,非結構化數據主要包含三大塊,第一是文本文字,就是人們所說的語言;第二非結構化數據是圖像、圖片,包括現在社交網絡上的交流圖像、圖片等;第三大非結構化數據是視頻流、電視流。
  • 釋放海量非結構化數據潛能,愛數AnyShare Family 7技術探索之旅揭秘
    海量非結構化數據正在洶湧而來如今,非結構化數據已佔據數據總量的90%,且保持高速增長;非結構化數據存在於各種設備以及各種系統之中,無處不在。毋庸置疑,海量非結構化數據的時代已經到來,海量非結構化數據的管理、處理、保護等巨大挑戰與難題也接踵而至。