從海量金融文本中挖掘價值信息,華為雲助力企業風控與輿情分析

2020-12-11 站長之家
首頁

 > 

傳媒

 > 

關鍵詞

 > 

華為雲最新資訊

 > 

正文

從海量金融文本中挖掘價值信息,華為雲助力企業風控與輿情分析

近日,在2019 CCF大數據與計算智能大賽(CCF Big Data & Computing Intelligence Contest,簡稱CCF BDCI)決賽中,華為雲語音語義創新Lab獲得金融實體級情感分析大賽冠軍,體現了在文本情感分析和知識圖譜領域的實力。

華為雲獲2019CCF BDCI金融信息負面及實體判定大賽冠軍

CCF BDCI是由教育部高等學校計算機類專業教學指導委員會、國家自然科學基金委員會信息科學部及鄭州市人民政府指導,中國計算機學會主辦的重量級大賽,今年已經是第七屆。本次大賽共吸引了來自全球 25 個國家, 1500 餘所高校及科研院所, 1800 餘所企事業單位的 60000 餘人參加。

隨著網際網路的飛速進步和全球金融的高速發展,金融信息呈現出爆炸式增長的態勢。如何從海量的金融文本中快速準確地挖掘出關鍵信息一直是金融領域研究的熱點,其效果好壞對投資者和決策者有至關重要的影響,其難點在於如何識別出海量文本中針對不同實體的報導的正負面,核心技術是實體級情感分析,而這也成為了本次大賽「金融信息負面及實體判定」賽道的重點解決問題。

本賽題關注金融文本中信息主體的挖掘和面向主體的負面消息檢測,在風控和輿情分析等領域有較大現實意義,如及時發現對企業的負面報導,然後及時客服跟進或採取改進措施,對企業有非常大的幫助。

挑戰情感分析技術高點

該任務分為兩個子任務:給定金融文本和文本中出現的金融實體列表,

負面信息判定:判定該文本是否包含金融實體的負面信息。如果該文本不包含負面信息,或者包含負面信息但負面信息未涉及到金融實體,則負面信息判定結果為0。

負面主體判定:如果任務 1 中包含金融實體的負面信息,繼續判斷負面信息的主體對象是實體列表中的哪些實體。

實際上,該問題屬於NLP情感分析領域的一個技術分支——實體級情感分析。傳統情感分析任務都是文本級的,即只判定一個文本整體的正負面,不涉及具體的正負面評價的對象或實體,但基於這種方式有時並不能作出準確判斷。如圖 2 的新聞報導,對實體「A公司」和「B公司」來說是正面的,但是對實體「C公司」則是負面的。

實體級情感分析

本次大賽華為雲聯合武漢大學、重慶郵電大學,設計了三種基於深度學習技術的方案:

方案一:將問題轉化為一個二分類問題,通過合併文本和實體構造新樣本,判斷該實體是否為文本的負面實體;

方案二:先判斷文本是否是負面文本,再在負面文本樣本中針對每個實體判定該文本是否針對該實體;

方案三:採用多任務模型,將情感分析與實體判別同時訓練優化。

最終,通過情感校驗和模型融合三個方案獲得的最終結果為F值0.959,獲得該賽道的冠軍。

持續在語音語義領域創新

實際上,華為雲語音語義創新Lab長期在自然語言基礎(如詞法、句法等)、語言理解、語言生成、知識圖譜等進行持續的研究創新,並將成果以雲服務的形式呈現出來,為客戶服務。 2019 年,華為雲推出了知識計算即服務(KaaS)框架,助力政企客戶破解大型企業和政府機構的智能化知識挖掘和管理難題,實現知識化轉型。

具體來說,基於在自然語言處理、知識圖譜、深度學習、圖計算等領域的技術積累和實踐,該框架能夠以知識計算雲服務形式提供全棧知識計算流水線平臺,能夠針對不同行業多源異構數據進行分析和處理,通過流水線平臺幫助客戶構建知識獲取、知識建模、知識管理和知識應用的全套知識管理體系。基於知識圖譜底座,衍生出各種知識增強的自然語言處理服務,如分詞、命名實體識別、句子級情感分析、屬性級情感分析、對話機器人服務、機器翻譯等。

在 2019 年華為全聯接大會上,華為就攜手中石油聯合發布了勘探開發人工智慧平臺。基於KaaS框架,華為雲助力中石油進行勘探開發知識體系的構建、計算和應用,為油氣勘探開發科研、生產管理提供智能化分析手段,實現油氣行業的知識化轉型。

今年 5 月,憑藉創新性和技術先進性,「華為雲知識計算雲服務」獲得了行業權威獎項「 2019 數博會領先科技成果獎」。在不久前的全國知識圖譜及語義計算大會(CCKS 2019)上,華為雲也獲得了中文知識圖譜問答大賽「創新技術獎」、DigSci科學數據挖掘大賽冠軍。

目前,華為雲語音語義相關服務已經成功應用於政務、金融、油氣、醫療、汽車、物流、保險、電商、稅務、媒體等領域,為客戶提供智能客服、對話助手、知識圖譜等產品服務。相關服務歡迎到「EI體驗空間」小程序體驗。

免責聲明:「站長之家」的傳媒資訊頁面文章、圖片、音頻、視頻等稿件均為自媒體人、第三方機構發布或轉載。如稿件涉及版權等問題,請與我們聯繫刪除或處理。稿件內容僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性,更不對您的投資構成建議。我們不鼓勵任何形式的投資行為、購買使用行為。

相關焦點

  • 中文語言處理專家慧科訊業AI Lab助力「金融+AI」
    信息爆炸式增長的時代,如何從海量數據中抽絲剝繭挖掘有價值的內容? 基於輿情數據天然蘊含的風控因子,在實際應用中,慧科訊業Wisers AI Lab利用命名實體識別、文本聚類與過濾、信息抽取及情感分析等技術,通過關聯度和情感值挖掘可能出現的風險;通過話題(違規操作、訴訟等)控制前置並持續跟蹤標的的風險;通過關聯關係與上中下遊全方位挖掘隱形的風險,將風險控制在最低點。
  • 商業分析中,如何進行文本挖掘
    我的好友吳亦凡在這篇文章中,提供了一種通過文本挖掘得出商業洞察的方法,簡單易上手,又極具價值。本文將從商業分析的視角來介紹文本挖掘的實際應用場景,以及一項完整的文本挖掘流程。本篇的重點以「器」的角度,介紹我珍藏的幾款文本挖掘工具,手把手教你製作一個精美的個性化詞雲。
  • 華為雲助力,深圳福田走出「金融+科技」新路子
    「華為雲平臺就像一個基礎底座,提供了人工智慧算法模型和可擴容的空間,方便我們從各大網站迅速抓取業務所需的涉及合規管理的數據。」談起與華為雲歷時數月一起研發的輿情監測數據系統,深圳價值在線信息科技股份有限公司董事長蘇梅感受很深。
  • 2020金融科技領域最具商業合作價值企業盤點
    萬物互聯時代,企業擁有的海量數據顯示的信息,本應用來支持一臺設備、一項業務、一個部門甚至一家企業的健康運轉。目前對很多企業來說,這些數據散落在不同設備和各個部門中,企業組織難免會一葉障目,無法把正確的數據——即信息反饋給一線員工,也無法做出正確的決策。
  • 知識圖譜深挖關係價值,海致星圖2年拿下25家金融大客戶
    1.結合多方數據,利用知識圖譜技術深入挖掘複雜關係無論是銀行信貸業務風控,還是零售、對公客戶營銷,都涉及對實體關係的辨別,以及判斷風險或價值信號的傳導。傳統方式以人力解決,費時費力且全面性、準確度有限,運用知識圖譜技術,能夠通過海量信息建立起關聯網絡,更精準、高效地分析、解決問題。
  • 華為雲攜手玖富共話智能風控,促進行業可持續發展
    玖富國際董事總經理陳穎峰在演講中提到:「全流程的智能風控管理,以數據模型為驅動,是玖富搭建風控體系的核心理念,玖富通過人臉識別、文字識別、語音識別、生物指針等先進技術,研發了基於大數據、雲計算的智能風控系統——『火眼分』與『彩虹評級』,結合華為雲在安全、AI、算力等方面的優勢,從而為行業輸出更完整的高性能智能風控解決方案。」
  • 企風控,商業合作的親密夥伴
    媒體報導:劉強東疑似「退位」,其實不然,大股東是劉強東的控股企業,實控權仍然在劉強東手裡,左手倒右手。  商業關係中最複雜的就是股權了,裡面可以大做文章,比如在合作中,有些公司試圖掩蓋「黑歷史」,改頭換面隱秘關聯,讓你看得眼花繚亂,暈頭轉向,怎麼辦?企風控幫你理清盤枝錯節的股權脈絡,清晰的呈現最終受益人。
  • 百融雲創:AI+大數據賦能 助力金融機構嚴把風控關
    ​本網12月10日訊 近日,在2020北京國際金融安全論壇上,專家提出要把金融安全放在更加重要和優先的位置上,在做好全面風險管理和安全保障的前提下,穩妥、審慎地推進金融科技創新。「如今,我們要認識到科技發展與安全應是相輔相成的,金融科技正乘著時代的浪潮迅猛地發展,但不可忽視,這種迅速必然會帶來不穩定隱患。
  • 優捷信達:輿情監測系統挖掘網絡口碑信息
    如何更好的挖掘海量消費者網購評價和微博、論壇信息,將是未來企業競爭勝出的重要砝碼。在消費者市場,其顯著的特點就是消費者的購買行為具有很大程度的可誘導性,包括消費者需求的內在誘因和外部環境誘因。消費者的購買行為很大程度上受需求、購買能力和擁有欲望支配。如何深入分析消費者需求和購買行為,獲得真實、全面的信息,對於企業非常重要。
  • 賦能行業數據 華為雲FusionInsight方案解析
    不知不覺中你又貢獻了一次自己的數據,而這種類似的數據貢獻行為的發生,實質上促進了大數據行業及其生態鏈發展。由此,通過大數據分析,政企可以精準測算出你生活和工作所喜好的一切。大數據力量之強大讓其成為平安城市的幕後推手,像華為雲FusionInsight這樣的大數據平臺解決方案,正在幫助企業快速構建海量數據信息處理系統,發現數據價值和商機。
  • 知識計算的新成績單,華為雲奪得CCKS篇章級事件抽取技術評測冠軍
    事件抽取就是從自然語言文本中抽取出用戶感興趣的事件信息,並以結構化的形式呈現出來。金融領域的 「事件」則是指產品出現問題、高管減持、違法違規等信息。金融「事件」是金融領域投資分析,資產管理的重要決策參考。2020年中國網民規模達到了9.04億,網頁總數超3000億。
  • 中國個人信息保護法草案首次亮相,華為雲助力企業實現數據合規
    個人信息是以電子或者其他方式記錄的與已識別或者可識別的自然人有關的各種信息,不包括匿名化處理後的信息。個人信息的處理包括個人信息的收集、存儲、使用、加工、傳輸、提供、公開等活動。適用範圍:中國的企業處理個人信息的活動,中國境外處理中國境內個人信息的活動(中國境外的企業向中國境內提供產品或服務,分析境內個人的行為)。
  • 華為雲攜手夥伴構建業財一體化平臺,助力企業實現財務精細化管理
    在企業精細化管理過程中,財務管理是企業實現全面價值管理和風險管理的重要前提,越來越多的企業開始引入新的管理形式和數位化系統,通過搭建業財一體化平臺,將集團總部與各業務線的業務和財務數據進行統一的處理,形成集團級數據資產,深化數據服務能力,推進集團數位化轉型。
  • 百融雲創打造智能風控中臺 應對數字金融新挑戰
    近年來,金融科技領域備受關注。傳統的金融機構在這個新時代中,面臨較大的競爭壓力,各大金融機構積極運用金融科技加強自身實力,做到「增本降效」,來應對激烈的市場競爭,更應對數位化時代的到來。數位化轉型的過程,要求金融機構不斷優化產品、營銷渠道、營銷方式和風控流程。
  • 王志峰:這些金融監管科技改變金融生態
    雲計算及其應用雲計算在金融及監管科技領域的應用呈現出不同特點:傳統大型金融機構更傾向於自主開發上層應用,專有雲是首選甚至是唯一的部署模式;中小金融機構由於自身資金和技術實力相對薄弱,更傾向於採用行業雲、公共雲平臺的系統建設方式;新型的網際網路金融企業則主要偏好採用公共雲的部署方式,需求也很旺盛。
  • 華為雲NLP算法專家:全面解讀文本情感分析任務
    機器之心專欄 作者:李明磊 作為 NLP 領域重要的研究方向之一,情感分析在實際業務場景中存在巨大的應用價值。在此文中,華為雲 NLP 算法專家李明磊為我們介紹了情感分析的概念以及華為雲在情感分析方面的實踐和進展。
  • 「乾貨」July:擺脫科研小白第一步:學會輿情分析和文本挖掘!
    老師的研究方向是大數據和輿情分析,而之後的研究方向也偏向於傳播學方向的,最終,我將選題確定為「明星在價值觀倡導、民族觀念培養與文化認同的構建中的效果探析」,涵化通俗來說是指媒介在人們生活中對價值觀念和意見產生的潛移默化的影響使之逐漸趨同。
  • 專欄|用 Word2vec 輕鬆處理新金融風控場景中的文本類數據
    機器之心投稿作者:唐正陽編者註:本文作者為 CreditX 氪信市場經理唐正陽,深入淺出的介紹了 word2vec 這一深度學習技術,及其在金融風控領域的應用。在當前更加普惠的市場環境下,新金融服務的客群和範圍進一步下沉擴大,業務形態也趨於更加小額分散、高效率和規模化,這對傳統風控提出了更大的挑戰,一方面針對此類客群的高價值金融數據覆蓋率大為降低,另一方面業務專家在面對更多非結構化數據時到底該如何與風險掛鈎也存有諸多疑惑。
  • 百融雲創構建高效靈活的貸前風控方案 助力數字金融發展
    隨著線上金融服務走向普及化、常態化,欺詐技術也隨之發展。近年來,欺詐方式呈現出多樣化趨勢,偽造資料、惡意註冊大量虛假帳號、代辦包裝、刷單、搶紅包、套返利等欺詐手段層出不窮。分工明確和配合縝密的團夥形式的欺詐給金融機構風控帶來了更新的、更嚴峻的挑戰。
  • 富勤金融『人控+車控』 直擊貸中、貸後風控痛點
    富勤金融利用小啟控車風控系統,打造汽車金融智能風控服務平臺。依託強大的人工智慧技術與海量基礎數據,運用精準策略模型,完善的大數據風控和場景化風控,實現汽車金融持續、高效、可靠、穩定的風險控制。在貸中、貸後通過精準風控模型實現反欺詐、防拆、設備分離、危險區域、離線報警、停車異常等風險預警;大數據智能分析則利用全渠道接入數據,敏捷性數據分析,對用戶行為和車輛行駛軌跡做實時分析,全面預警貸後風險。物聯網+SaaS雲平臺聚合各方數據,綜合評估風險。