點擊上方,選擇星標或置頂,每天給你送乾貨!
閱讀大概需要2分鐘
跟隨小博主,每天進步一丟丟
1 MUC Data Sets
https://www-nlpir.nist.gov/related_projects/muc/https://www.clips.uantwerpen.be/conll2002/ner/CoNLL 2003是由新聞通訊社的文章以四種不同的語言(西班牙語、荷蘭語、英語和德語)創建的,重點關注4個實體:PER(人員),LOC(位置),ORG(組織)和MISC(其他,包括所有其他類型的實體)https://www.clips.uantwerpen.be/conll2003/ner/2010 I2B2 NER任務考慮了臨床數據,重點關注臨床問題、測試和治療實體類型https://www.i2b2.org/NLP/Relations/ 5 DDIExtraction2013(Drug NER)重點關注藥品、品牌、集團和藥品n(未批准或新藥)實體類型https://www.cs.york.ac.uk/semeval-2013/task9/index.html 6 CHEMPROT(Similar to 5)相比5更側重於化學和藥物實體,例如縮寫、配方、家族、標識符等https://biocreative.bioinformatics.udel.edu/ 7 microbiology NER datasets從PubMed和生物學網站收集,並且主要關注細菌、棲息地和地理位置實體http://2016.bionlp-st.org/tasks/bb2下載一:中文版!學習TensorFlow、PyTorch、機器學習、深度學習和數據結構五件套!
由於微信平臺算法改版,公號內容將不再以時間排序展示,如果大家想第一時間看到我們的推送,強烈建議星標我們和給我們多點點【在看】。星標具體步驟為:
(1)點擊頁面最上方「深度學習自然語言處理」,進入公眾號主頁。
(2)點擊右上角的小點點,在彈出頁面點擊「設為星標」,就可以啦。
感謝支持,比心。
投稿或交流學習,備註:暱稱-學校(公司)-方向,進入DL&NLP交流群。
方向有很多:機器學習、深度學習,python,情感分析、意見挖掘、句法分析、機器翻譯、人機對話、知識圖譜、語音識別等。
整理不易,還望給個在看!