明晚8點,「因果科學與Causal AI」讀書會將進行第十二期的線上論文分享,主題是「 因果助力CV、NLP和認知神經科學」,將由 浙江大學在讀碩士吳亦全、 浙江大學在讀博士張聖宇、 集智俱樂部常駐作者十三維來進行分享,本次內容將在集智俱樂部B站直播。
論文解讀 《De-Biased Court’s View Generation with Causality》
數據不平衡問題經常出現在文本分類任務中,而在文本生成任務中被忽視。在民事訴訟中,存在著無法被觀測到的數據生成機制:原告往往在有把握的情況下才會起訴。這種數據生成機制導致的數據不平衡,會導致法院觀點生成模型在編碼時只關注支持性的信息,從而生成不準確的法院關點。文章通過對這種現象進行了因果建模,並將後門調整巧妙運用到了NLP中,從而使得法院觀點生成模型能夠消除數據生成帶來的混淆偏差。
Outline
Introduction to Court's View Generation
Brief Introduction to Legal AI
Task Definition
Challenges
Method
Causal Graph
Backdoor Adjustment
Backdoor in Implementation
Model Arch
Experiments
Dataset
Metrics
Baselines
Results
Discussion
Ethical Issue
Future Work
Reference
I Sutskever, O Vinyals, and QV Le. 2014. Sequence to sequence learning with neural networks. Advances in NIPS.
Abigail See, Peter J Liu, and Christopher D Manning. 2017. Get to the point: Summarization with pointer-generator networks. arXiv preprint arXiv:1704.04368.
Haoxi Zhong, Zhipeng Guo, Cunchao Tu, Chaojun Xiao, Zhiyuan Liu, and Maosong Sun. 2018. Legal judgment prediction via topological learning. In Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing, pages 3540–3549.
Judea Pearl. 2009. Causality. Cambridge university press.
Judea Pearl, Madelyn Glymour, and Nicholas P Jewell. 2016. Causal inference in statistics: A primer. John Wiley & Sons.
分享者介紹
吳亦全,浙江大學在讀碩士,研究方向為自然語言處理
因果在去偏差預訓練中的應用
預訓練技術旨在可輕易大規模收集的無標籤 (或單一標籤) 數據集上,通過包括自監督學習 (Self-supervised Learning) 在內的手段學習到和某個具體下遊任務無關的通用表徵。大量的下遊任務可利用這種通用的特徵作為先驗知識或額外輔助知識以增強性能和實現冷啟動。相比於一般的深度學習任務,預訓練任務更加看重模型的泛化能力,並且對預訓練數據中存在的偏見更為敏感。這是因為,領域內的偏見知識可能對領域內的分析判斷有幫助,但對領域外的任務可能是有害的[1]。因此,如何實現去偏差預訓練和特徵提出是重要的研究和應用課題。
Outline
Introduction to Causal Pretraining
Brief introduction to pretraining
Motivation
Challenges
Paper Reading [2-3]
Discussion
Reference
[1] Kun Kuang, Peng Cui, Susan Athey, Ruoxuan Xiong, and Bo Li. 2018. Stable Pre- diction across Unknown Environments.. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, KDD 2018, Lon- don,UK,August19-23,2018.1617–1626. https://doi.org/10.1145/3219819.3220082
[2] Shengyu Zhang, Tan Jiang, Tan Wang, Kun Kuang, Zhou Zhao, Jianke Zhu, Jin Yu, Hongxia Yang, Fei Wu: DeVLBert: Learning Deconfounded Visio-Linguistic Representations. ACM Multimedia 2020: 4373-4382
[3] Zekun Yang, Tianlin Liu: Causally Denoise Word Embeddings Using Half-Sibling Regression. AAAI 2020: 9426-9433
分享者介紹
張聖宇,浙江大學在讀博士,研究方向為多模態學習、推薦系統和穩定學習
論文解讀 《Causality in cognitive neuroscience: concepts, challenges, and distributional robustness》
背景介紹
概率模型描述了觀察變量之間的依賴結構,因果模型則更進一步,例如可以預測認知功能如何被外部幹預造成的神經元活動影響。在這篇論文綜述中,作者回顧了知神經科學背景下的因果關係概念,並回顧了從數據中推斷因果關係的現有方法。因果推理是一項頗有野心又異常艱巨的任務,在認知神經科學中尤其具有挑戰性。在文章中,作者從各個方面詳細討論當前兩個主要困難:幹預數據的稀缺性和尋找正確變量的挑戰,主張將分布魯棒性作為解決這些問題的指導原則。魯棒性或不變性是是因果方法的基本原則,只要目標環境不產生因果作用,一個目標變量的因果模型就可以在不同的環境或主體中泛化。如果一個候選因果模型不能泛化,那麼要麼它不包含目標變量的正確原因,要麼問題中基本變量沒有表示為恰當的粒度。為解決幹預數據稀缺和尋找正確變量問題,認知神經科學同樣需要從數據和模型評估兩方面分別發展種種技術去應對挑戰。
Outline
- 認知神經科學中的因果
- 認知神經科學研究層次
- 場景 1:stimulus → brain activity → response
- 場景 2:stimulus → brain activity
認知神經科學的因果挑戰
- (1)幹預數據缺乏(the scarcity of interventional data)
- (2)尋找正確變量(the challenge of fnding the right variables)
結構因果模型中的觀察與幹預
- 幹預分布與觀察分布
- 因果模型的等效性
- 典型因果模型和方法
- 隨機化實驗
- 基於約束的方法(Constraint-based methods)
- 基於分數的方法(Score-based methods)
- 約束結構因果模型(Restricted structural causal models)
- 動力因果模型(Dynamic causal modelling (DCM)
- 格蘭傑因果 (Granger causality)
- 跨環境不變性與因果模型
- 尋找正確粒度變量
- 模型魯棒性和變量結構
- Robust Independent Component Analysis
- Causal discovery with exogenous variation
- Anchor regression
分享者介紹
十三維,某航空公司數據運營主管,集智俱樂部常駐作者,畢業於首都師範大學數學系,長期關注複雜系統與認知科學等跨學科研究
直播時間:明晚(12月13日) 20:00-23:00
參與方式 1:騰訊會議(需報名參加系列讀書會)
參與方式 2:集智俱樂部B站直播
關於讀書會內容介紹的更新
集智俱樂部聯合智源社區發起了因果科學與Causal AI讀書會受到了因果科學領域一線科研工作者的廣泛認可,我們也深深的感受到了青年科學工作者推動該領域發展的熱情。目前因果科學與Causal AI讀書會已經有220+的朋友報名,其中碩博的比例接近80%。
在讀書會中的參與者以科研工作者居多,清華大學、北京大學、國防科技大學、浙江大學、復旦大學、中山大學等國內高校的學生居多,也有許多一線網際網路包括谷歌X、FackBook、滴滴、騰訊、阿里、拼多多等大廠的工程師也參與其中。
歡迎大家加入其中,現在加入讀書會的成員將會作為因果社區的種子用戶長期運營,將可以免費享受集智俱樂部後續因果相關主題的讀書會,如果你心動了,就點擊下面的連結報名吧~
時間:9月20日起,每周日晚19:00-21:00,持續約2-3個月
模式:線上閉門讀書會;收費-退款的保證金模式;讀書會成員認領解讀論文
費用:299/人
了解讀書會具體規則、報名讀書會請點擊下方文章:
目前讀書會已經有超過130餘人的海內外高校科研院所的一線科研工作者以及網際網路一線從業人員參與,如果你也對這個主題感興趣,就快加入我們吧!
針對讀書會的主題,由發起人龔鶴揚設置好了內容框架,每個主題下有一個負責人來負責維護組織相關內容,目前已經定好的如圖所示,歡迎對主題感興趣的聯繫相關負責人,以及來認領相關主題~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.