向AI轉型的程式設計師都關注了這個號👇👇👇
機器學習AI算法工程 公眾號:datayx
基於 TensorFlow 的實體及關係抽取,2019語言與智能技術競賽信息抽取(實體與關係抽取)任務解決方案。
給定schema約束集合及句子sent,其中schema定義了關係P以及其對應的主體S和客體O的類別,例如(S_TYPE:人物,P:妻子,O_TYPE:人物)、(S_TYPE:公司,P:創始人,O_TYPE:人物)等。任務要求參評系統自動地對句子進行分析,輸出句子中所有滿足schema約束的SPO三元組知識Triples=[(S1, P1, O1), (S2, P2, O2)…]。輸入/輸出: (1) 輸入:schema約束集合及句子sent (2) 輸出:句子sent中包含的符合給定schema約束的三元組知識Triples
例子 輸入句子: "text": "《古世》是連載於雲中書城的網絡小說,作者是未弱"
輸出三元組: "spo_list": [{"predicate": "作者", "object_type": "人物", "subject_type": "圖書作品", "object": "未弱", "subject": "古世"}, {"predicate": "連載網站", "object_type": "網站", "subject_type": "網絡小說", "object": "雲中書城", "subject": "古世"}]}
數據簡介本次競賽使用的SKE數據集是業界規模最大的基於schema的中文信息抽取數據集,其包含超過43萬三元組數據、21萬中文句子及50個已定義好的schema,表1中展示了SKE數據集中包含的50個schema及對應的例子。數據集中的句子來自百度百科和百度信息流文本。數據集劃分為17萬訓練集,2萬驗證集和2萬測試集。其中訓練集和驗證集用於訓練,可供自由下載。
項目代碼和數據集 獲取:關注微信公眾號 datayx 然後回復 文本標註 即可獲取。
AI項目體驗地址 https://loveai.tech
「信息抽取」任務冠軍隊伍報告
閱讀過本文的人還看了以下文章:
TensorFlow 2.0深度學習案例實戰
基於40萬表格數據集TableBank,用MaskRCNN做表格檢測
《基於深度學習的自然語言處理》中/英PDF
Deep Learning 中文版初版-周志華團隊
【全套視頻課】最全的目標檢測算法系列講解,通俗易懂!
《美團機器學習實踐》_美團算法團隊.pdf
《深度學習入門:基於Python的理論與實現》高清中文PDF+源碼
特徵提取與圖像處理(第二版).pdf
python就業班學習視頻,從入門到實戰項目
2019最新《PyTorch自然語言處理》英、中文版PDF+源碼
《21個項目玩轉深度學習:基於TensorFlow的實踐詳解》完整版PDF+附書代碼
《深度學習之pytorch》pdf+附書源碼
PyTorch深度學習快速實戰入門《pytorch-handbook》
【下載】豆瓣評分8.1,《機器學習實戰:基於Scikit-Learn和TensorFlow》
《Python數據分析與挖掘實戰》PDF+完整源碼
汽車行業完整知識圖譜項目實戰視頻(全23課)
李沐大神開源《動手學深度學習》,加州伯克利深度學習(2019春)教材
筆記、代碼清晰易懂!李航《統計學習方法》最新資源全套!
《神經網絡與深度學習》最新2018版中英PDF+源碼
將機器學習模型部署為REST API
FashionAI服裝屬性標籤圖像識別Top1-5方案分享
重要開源!CNN-RNN-CTC 實現手寫漢字識別
yolo3 檢測出圖像中的不規則漢字
同樣是機器學習算法工程師,你的面試為什麼過不了?
前海徵信大數據算法:風險概率預測
【Keras】完整實現『交通標誌』分類、『票據』分類兩個項目,讓你掌握深度學習圖像分類
VGG16遷移學習,實現醫學圖像識別分類工程項目
特徵工程(一)
特徵工程(二) :文本數據的展開、過濾和分塊
特徵工程(三):特徵縮放,從詞袋到 TF-IDF
特徵工程(四): 類別特徵
特徵工程(五): PCA 降維
特徵工程(六): 非線性特徵提取和模型堆疊
特徵工程(七):圖像特徵提取和深度學習
如何利用全新的決策樹集成級聯結構gcForest做特徵工程並打分?
Machine Learning Yearning 中文翻譯稿
螞蟻金服2018秋招-算法工程師(共四面)通過
全球AI挑戰-場景分類的比賽源碼(多模型融合)
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(列印收藏)
python+flask搭建CNN在線識別手寫中文網站
中科院Kaggle全球文本匹配競賽華人第1名團隊-深度學習與特徵工程
不斷更新資源
深度學習、機器學習、數據分析、python
搜索公眾號添加: datayx
機大數據技術與機器學習工程
搜索公眾號添加: datanlp
長按圖片,識別二維碼