雷鋒網AI科技評論按:全國社會媒體處理大會(SMP)由中國中文信息學會社會媒體處理專委會主辦,專注於以社會媒體處理為主題的科學研究與工程開發,為傳播社會媒體處理最新的學術研究與技術成果提供廣泛的交流平臺,旨在構建社會媒體處理領域的產學研生態圈,成為中國乃至世界社會媒體處理的風向標,會議將以社交網絡的形式改變傳統的學術會議交流體驗。
據雷鋒網了解,第六屆全國社會媒體處理大會(SMP 2017)由中國科學院計算技術研究所承辦,將於2017年9月14—17日(也即這周四到下周一)在北京友誼賓館召開。四天的會議都有哪些內容呢?本篇文章將對SMP大會做一個完整的梳理,以方便準備參加會議的老師、同學準確地找到自己感興趣的內容,而不至錯過。
簡單來說,這次大會包含四個部分:4場講習班、8場特邀報告、8場專題論壇、2場技術評測頒獎典禮及4場論文報告會。
講習班為進一步推進計算科學和社會科學的交叉融合,迸發出更多更好的思想火花以及促進研究成果的落地,SMP專委會從2017年開始推出全國社會媒體處理講習班(SMP Tutorials),旨在選擇計算科學和社會科學交叉融合的重點領域和關鍵技術進行系統深入的講解。講習班的講者包括領域大咖和一線青年骨幹,講習班本著梳理脈絡、引領方向、探索未來的思路組織,以冀為社會科學和計算科學的交叉融合提供新動力和新思潮。
講習班將於9月14日上午開始,到9月15日下午結束,共四場。
第一天為社會科學專場,邀請了社會科學領域著名學者中山大學梁玉成講授、北京師範大學的張倫博士和南京大學王成軍博士,介紹計算社會學和計算傳播學的研究進展。
第二天為計算科學專場,邀請了社會媒體計算和數據挖掘領域的青年才俊微軟亞洲研究院的唐建博士和清華大學的崔鵬博士,介紹網絡表示學習方面的最新研究進展。
專題(一):計算社會學的理論與方法
講者:中山大學 國家治理研究院副院長 梁玉成 教授
講習摘要:不同於傳統社會科學所依賴的調查問卷,來自社交網絡的電子行為蹤跡呈現了微觀,異質,實時,大規模,和相互關聯等特徵。在此基礎之上,基於網際網路的大數據,以及傳統的問卷調查與行政大數據結合,都成為新的研究平臺,幫助學者來認識從人類行為和社會原理。計算社會科學屬跨學科的新領域。許多重要的工作來自計算機科學,物理學和數學。我將介紹這些跨學科的方法,主要包括傳統調查數據與大數據結合的法則、跨越社會宏觀與微觀結構的社會計算、基於文本數據的社會理論研究等。
專題(二):計算社會科學視角下的計算傳播學
講者:南京大學新聞傳播學院 王成軍 副教授
北京師範大學藝術與傳媒學院 張倫 副教授
講習摘要:基因是生物學飛躍的原因,貨幣是經濟學發展的關鍵。人類傳播行為所隱藏的計算化「基因」是什麼?計算傳播學是計算社會科學的重要分支。它致力於尋找傳播學可計算化的基因,以傳播網絡分析、傳播文本挖掘、數據科學等為主要分析工具,大規模地收集並分析人類傳播行為數據,挖掘人類傳播行為背後的模式和法則,分析模式背後的生成機制與基本原理,可以被廣泛地應用於數據新聞和計算廣告等場景。注重編程訓練、數學建模與計算思維。本次講座將介紹計算傳播學的概念、內涵、應用、工具,並討論如何開展跨學科合作、計算傳播學的研究策略等問題。
專題(三):Learning Representations of Large-scale Networks
講者:HEC Montreal & MILA Jian Tang Ph.D
講習摘要:Large-scale networks such as social networks, citation networks, the World Wide Web, and traffic networks are ubiquitous in the real world. Networks can also be constructed from text, time series, behavior logs, and many other types of data. Mining network data attracts increasing attention in academia and industry, covers a variety of applications, and influences the methodology of mining many types of data. A prerequisite to network mining is to find an effective representation of networks, which largely determines the performance of downstream data mining tasks. Traditionally, networks are usually represented as adjacency matrices, which suffer from data sparsity and high-dimensionality. Recently, there is a fast-growing interest in learning continuous and low-dimensional representations of networks. This is a challenging problem for multiple reasons: (1) networks data (nodes and edges) are sparse, discrete, and globally interactive; (2) real-world networks are very large, usually containing millions of nodes and billions of edges; and (3) real-world networks are heterogeneous. Edges can be directed, undirected or weighted, and both nodes and edges may carry different semantics.
專題(四):Network Embedding: Enabling Network Analytics and Inference in Vector Space
講者:Tsinghua University Peng Cui Associate Professor
講習摘要:Nowadays, larger and larger, more and more sophisticated networks are used in more and more applications. It is well recognized that network data is sophisticated and challenging. To process graph data effectively, the first critical challenge is network data representation, that is, how to represent networks properly so that advanced analytic tasks, such as pattern discovery, analysis and prediction, can be conducted efficiently in both time and space. In this tutorial, we will review the recent thoughts and achievements on network embedding. More specifically, a series of fundamental problems in network embedding will be discussed, including why we need to revisit network representation, what are the research goals of network embedding, how network embedding can be learned, and the major future directions of network embedding.
特邀報告本次大會共邀請八位嘉賓做特邀報告。特邀報告將於9月16日和17日上午進行,每天各四場。
報告主題:騰訊的自然語言應用和研究
嘉賓:張潼
報告摘要:我在這裡介紹一下騰訊的自然語言應用場景,現階段取得的一些進展,遇到的挑戰和今後的前沿研究方向。
報告主題:大數據在社會經濟及行為分析中的應用
嘉賓:周濤
報告摘要:以幾個典型的事例,呈現大數據社會經濟宗教教育系統中的典型應用,包括區域經濟發展決策、宏觀社會經濟態勢感知、與人有關的行為分析、風險評估和行為預測、宗教網絡結構分析等方面的應用,總結大數據特殊的方法手段以及大數據給經濟社會研究可能帶來的重大變化。
報告主題:社會媒體中的語言情感分析
嘉賓:秦兵
報告摘要:社會媒體是以社會網絡為基礎,網際網路用戶發表和分享信息為主要形式的在線交互媒體。在這些信息中包含大量的用戶情感文本信息,並通過社會媒體影響現實世界。因此,社會媒體的發展一方面為情感分析的研究提供了海量的數據和資源,另一方面為情感分析新的任務和應用的發掘提供了新的契機。本報告將結合文本情感表達和社會媒體的特點,從情感分析研究面臨的任務說起,深入探索目前情感分析的熱點任務和相關算法,進一步分析和思考情感分析未來的研究趨勢、以及情感分析在各個領域的應用中所面臨的機遇和挑戰。
報告主題:社交影響力與行為預測
嘉賓簡介:唐傑
報告摘要:社會網絡已經成為溝通真實物理世界和虛擬互聯空間的橋梁。我們在網際網路中的行為直接反映了我們在真實世界的活動和情感。我將介紹在大規模真實網絡中(如:微信、微博、Twitter、 AMiner等網絡)如何分析用戶之間的交互影響力和基於網絡拓撲的結構影響力,並基於影響力預測用戶行為。模型同時考慮了網絡結構、用戶屬性和網絡用戶的偏好。並設計了針對大規模網絡的並行學習算法。在實際真實在線社交系統中得到了驗證。
報告主題:從輿情分析到態勢感知
嘉賓:施水才
報告主題:推動人工智慧發展 ——來自人類社會的啟迪
嘉賓:劉鐵巖
報告摘要:近年來,人工智慧技術取得了飛速的發展,不僅在某些特定任務上接近人類水準,在與產業結合方面也邁出了堅實的步伐。那麼,人工智慧到底距離人類智能還有多遠?如何才能進一步提高人工智慧的水平?本報告中,我們指出目前主流的人工智慧技朮忽略了在人類社會(尤其是其教育體系)中扮演重要角色的兩個因素:同學和教師。因為有同學,我們在成長道路上互相幫助、共同進步,「聽君一席話,勝讀十年書」;因為有教師,我們被因材施教、被系統地傳道受業。那麼如何在人工智慧技術中體現同學和教師的作用呢?本報告將介紹我們最近的兩項研究成果 – dual learning和learning to teach。前者利用多個智能體之間的互相協作,可以從無標籤數據中學習高效的人工智慧模型,也可以提高有監督學習和推斷的性能。後者自動地為機器學習過程選擇合適的訓練數據和損失函數,實現因材施教;並通過教與學的互動,實現教學相長。我們以機器翻譯為例展示dual learning 和 learning to teach 的效果,並探討如何更多地借鑑人類社會機制,以促進人工智慧技術的進一步發展。
報告主題:Modeling Dynamic Networks
嘉賓:Wei Wang
嘉賓簡介:Wei Wang is the Leonard Kleinrock Chair Professor in Computer Science at University of California, Los Angeles and the director of the Scalable Analytics Institute (ScAi). She received her PhD degree in Computer Science from the University of California, Los Angeles in 1999. She was a professor at the University of North Carolina at Chapel Hill from 2002 to 2012, and was a research staff member at the IBM T. J. Watson Research Center between 1999 and 2002. Dr. Wang's research interests include big data analytics, data mining, bioinformatics and computational biology, and databases. She has filed seven patents, and has published one monograph and more than one hundred seventy research papers in international journals and major peer-reviewed conference proceedings.
報告主題:Bridging Digital Divide: Online Opinion-Policy Nexus and Government Responsiveness in China
嘉賓:孟天廣
報告摘要:The widespread use of information and communication technology (ICT) has reshaped the public sphere in the digital era, making both digital democracy and digital divide for political life. Internet is widely touted for its potential to facilitate government responsiveness and reduce inequality in political influence among citizens through lowering participation cost and amplifying pressure from below, but few research examined the online opinion-policy nexus. Based on a series of big data analytics to massive administrative data of online citizen-government interaction in China, the study provides new micro foundations for both the facilitating effect and equalizing impact of Internet-based participation on local government policies in the regime level. The study finds that China government is considerably responsive to citizens' opinion with a rapid growth of response rate in both individual and policy level, and the popularity of online participation led local government to produce pro-redistributive policy, which disproportionately benefit the lower class.
論文報告論文報告將在9月16日下午14:00-16:00分四組同時進行,分別為社會網絡分析、自然語言處理、文本挖掘與情感分析、數據挖掘與知識發現,每組分別有6場報告。
Divergence or Convergence: Interaction between News Media Frames and Public Frames in Online Discussion Forum in China(Lun Zhang)
傳播源估計中有效觀察點部署策略研究(Dong Liu, Jing Zhao and Hao Nie)
異質信息網絡中基於元路徑的社團發現算法研究(Yuyan Zheng, Mingsheng Wang, Rui Wang and Chuan Shi)
When Dragon and Crescent are in the Same Tweet: Exploring the Country Co-Occurrence Network in the Twittersphere in an International Economic Event(Xinzhi Zhang)
Hierarchical Community Structure Detection based on Multi Degrees of Distance and Submodularity Optimization(Shu Zhao, Chengjin Yu and Yanping Zhang)
The 2016 US Presidential Election and its Chinese Audience (Jiahua Yue, Yuke Li and James Sundquist)
Neural Chinese Word Segmentation as Sequence to Sequence Translation(Xuewen Shi, Heyan Huang, Ping Jian, Yuhang Guo, Xiaochi Wei and Yikun Tang)
Entity Set Expansion on Social Media: A Study for Newly-presented Entity Classes(He Zhao, Chong Feng, Yuxia Pei and Zhunchen Luo)
Opinion Target Understanding in Event-level Sentiment Analysis(Suyang Zhu, Shoushan Li and Guodong Zhou)
基於DQN的開放域多輪對話策略學習(宋皓宇, 張偉男, 劉挺)
EEG: Knowledge Base for Event Evolutionary Principles and Patterns(Zhongyang Li, Sendong Zhao, Xiao Ding and Ting Liu)
融合深度匹配特徵的答案選擇模型(Wenzheng Feng and Jie Tang)
TLRank:一種新的社會化協同排序推薦算法(李改, 陳強, 李磊)
Supervised Domain Adaptation for Sentiment Regression(Jian Xu, Hao Yin and Shoushan Li)
Dependency-Attention-based LSTM for Target-Dependent Sentiment Analysis(Xinbo Wang and Guang Chen)
Deep Transfer Learning for Social Media Cross-Domain Sentiment Classification(Chuanjun Zhao, Suge Wang and Deyu Li)
基於協同表示學習的個性化新聞推薦(Shiwei Liang, Chenrui Zhang, Lei Cao, Hongbo Xu and Xueqi Cheng)
Context Enhanced Word Vectors for Sentiment Analysis(Zhe Ye and Fang Li)
社會網絡中基於主題興趣的影響最大化算法研究(Yong Liu)
Supervised Hashing for Multi-labeled Data with Order-Preserving Feature(Dan Wang, Heyan Huang, Xian-Ling Mao and Hua-Kang Lin)
異構數據源論文集成(Fanjin Zhang, Xiaotao Gu, Peiran Yao and Jie Tang)
Inferring User Profile using Microblog Content and Friendship Network(Zhishan Zhao, Jiachen Du, Qinghong Gao and Ruifeng Xu)
在線技術社區的用戶技能與興趣發現(張東雷, 林友芳, 陸金梁, 馬語丹, 萬懷宇)
A Markov Chain Monte Carlo Approach for Source Detection in Networks(Le Zhang, Tianyuan Jin, Tong Xu, Biao Chang, Zhefeng Wang and Enhong Chen)
技術測評本次大會共有兩個技術評測,分別為:CSDN用戶畫像技術評測和中文人機對話技術評測。兩次測評的頒獎典禮及測評報告將在9月16日下午16:00-18:00分場同時進行。
本次CSDN用戶畫像技術評測吸引了來自全球200多家單位的757名選手報名參賽,共組建了329支參賽隊伍,最終共有52支隊伍完成比賽並提交了完整有效的評測結果。
在大會期間(9月16日下午),將會為獲獎隊伍舉行頒獎典禮,並邀請獲獎隊伍做評測報告。
中文人機對話技術評測主要包括兩項任務:(1)用戶意圖領域分類;(2)特定域任務型人機對話在線評測。經過近五個月的籌備和角逐,目前已順利落下帷幕,關於任務一(包括封閉式和開放式)和任務二的評測結果如下:
任務一:用戶意圖領域分類
1、封閉式評測
2、開放式評測
任務二:特定域任務型人機對話在線評測
在大會期間(9月16日下午),將會為獲獎隊伍舉行頒獎典禮,隨後將邀請獲獎隊伍做評測報告。
專題論壇SMP 2017大會共有八個專題論壇,分別為:
1、智能教育論壇(9月16日下午16:00-18:00)
2、計算傳播學論壇(9月16日下午16:00-18:00)
3、智能金融論壇(9月17日下午14:00-16:00)
4、情感分析論壇(9月17日下午14:00-16:00)
5、計算社會學論壇(9月17日下午14:00-16:00)
6、表示學習論壇(9月17日下午16:00-18:00)
7、推薦系統論壇(9月17日下午16:00-18:00)
8、企業論壇 (9月17日下午16:00-18:00)
時間:2017年9月16日下午 16:00-18:00
論壇簡介:當前人工智慧與教育的深度融合正在對教育領域的發展發揮著越來越重要的作用,其核心在於促進傳統教學方式、學習方式、評估方式及教學管理模式的智能化轉型與變革,以更有效地服務於個性化教育、學習與管理,實現因材施教及教育資源的優化配置。本論壇將集中展示多位智能教育領域的專家探析智能技術促進教育、學習的研究。內容包括:對教育大數據科學基礎、服務模式及機遇與挑戰的深度解析;闡述大數據和移動學習背景下的語言教學技術;介紹機器智能閱卷技術及推廣應用。
論壇主席:何婷婷(華中師範大學教授)
報告主題:教育大數據:機遇與挑戰
嘉賓簡介:劉三女牙,華中師範大學教授
報告摘要:隨著大數據時代的迅猛而至,大數據已經開始衝擊著各行各業,並影響著教育的方方面面。當前,「數據驅動學校,分析變革教育」已逐漸成為共識,教育大數據已引起業內外的高度關注。教育大數據在促進教與學,推進教育決策的科學性,完善教育質量監控體系,變革教育管理,實現教育評價的全面性和客觀性,助力智慧教育等方面帶來了重大的機遇。但是,教育大數據的發展才剛剛起步,還面臨諸多挑戰:如何界定教育大數據?大數據環境下的教育倫理如何構建?如何量化教育場景及相應主體?教育大數據的科學基礎是什麼?如何打造面向未來的教育大數據服務模式?機遇與挑戰並存,唯有抓住機遇,迎接這些挑戰,教育大數據產、學、研健康發展才有根本保障,精準化、個性化、智慧化的未來教育新生態也才能取得理想效果。
報告主題:How AI help MOOCs
嘉賓簡介:唐傑,清華大學副教授
報告摘要:Massive open online courses (MOOCs) boomed in recent years and have attracted millions of users worldwide. It is not only transforming higher education, but also provides fodder for scientific research. In this talk, I am going to first introduce the major MOOC platforms in China, for example XuetangX.com, a similar platform to Coursear and edX, is offering thousands of courses to more than 7,000,000 registered users. I will also introduce how we leverage AI technologies to help enhance student engagement on MOOCs.
報告主題:面向移動學習的漢語教育技術
嘉賓簡介:荀恩東,北京語言大學教授
報告摘要:語言教育技術面向語言研究、語言學習和語言相關服務,為老師、學生和語言服務者提供信息技術支持,現代語言教育技術是多個方向組成的技術群,本報告對涉及到技術進行梳理,介紹大數據和移動學習背景下語言教學技術的相關研究和開發工作。介紹研發的教育技術系統,包括BCC語料庫、卡片漢語和漢字書寫練習等。
報告主題:訊飛超腦智能閱卷——AI讓教育更加公平高效
嘉賓簡介:付瑞吉,科大訊飛研究院北京分院副院長
報告摘要:閱卷是老師教學工作中,非常重要的一環,同時也十分耗時耗力。隨著科技的發展,機器可以協助我們進行數據計算、體力勞動等工作。那麼,「閱卷」是不是也可以由機器代勞呢?答案是肯定的。科大訊飛的研究員們就實現了口語和中英文作文的自動評閱,並且在全國多地開展應用。機器「閱卷」標準統一,不會受體力、情緒等主觀因素影響,更加公平高效。教師們將會有更多的時間和精力被解放出來,投入到對教學方法、教學手段等創造性工作的研究中,學生們也會因此獲得更好、更全面的教育。這樣的未來,你期待嗎?
論壇時間:2017年9月16日下午 16:00-18:00
論壇簡介:計算傳播學致力於尋找傳播學可計算化的基因,以傳播網絡分析、傳播文本挖掘、數據科學等為主要分析工具,大規模地收集並分析人類傳播行為數據,挖掘人類傳播行為背後的模式和法則,分析模式背後的生成機制與基本原理。最近幾年,計算傳播學正在成為計算社會科學中重要的研究領域。本次論壇邀請了香港城市大學計算社會科學講座教授祝建華博士、北京師範大學新聞與傳播學院吳曄教授以及今日頭條算數中心總監趙蕾女士,分別從學科反思、研究案例以及業界應用三個層面對計算傳播學進行多面向探討。
論壇主席:沈浩 教授(中國傳媒大學)
報告主題:計算傳播學的金礦與泥坑
嘉賓簡介:祝建華,香港城市大學教授
報告摘要:計算傳播學研究日益普及,現在既有可能、也有必要回顧總結一下相關的成果與問題。根據我們的研究來看,計算傳播學大多採用文本挖掘方法以研究特定事件的報導和評論內容。這種研究路徑,既有其價值和貢獻、但也含有內在局限,尤其是難以回答主流傳播學更關心的理論問題,如社會媒體的使用與效果。後者含有更多的理論金礦,需要更廣泛地藉助於行為挖掘或在線實驗。
報告主題:人行為中的厚尾現象及其在傳播中的影響
嘉賓簡介:吳曄,北京師範大學教授
報告摘要:自2005年複雜網絡的先驅A.L.Barabasi教授從書信和Email的實證中發現人的通信行為是非泊松過程,其連續事件之間的時間間隔是一個厚尾的冪率分布之後,越來越多的實證證據表明厚尾現象在人的行為中是一種常見現象,由於厚尾現象中的冪率分布的均值經常是發散的,故會對基於人的行為的各種集群現象產生很大的影響,比如傳播,選舉,意見形成,同步等。本報告將介紹我們組在這方向的一些進展,主要是人的簡訊行為,論壇發帖行為,大眾點評行為中的厚尾現象,以及厚尾現象對傳播的影響。
報告主題:個性化推薦資訊平臺的數據應用探索
嘉賓簡介:趙蕾,今日頭條總監
報告摘要:報告主要介紹頭條兩款大數據產品媒體實驗室、頭條指數,頭條數據在手機行業的應用。
時間:9月17日下午 14:00-16:00
論壇簡介:當前人工智慧與金融的深度融合正在對金融領域的發展發揮著越來越重要的作用,其核心在於用人工智慧技術自動化和智能化金融交易,並促進傳統金融業的投資、分析、管控的智能化轉型與變革。本論壇將集中展示多位智能金融領域的專家探析智能技術促進金融領域的研究。內容包括:大數據、人工智慧與中國金融機遇。
論壇主席:劉挺 教授(哈爾濱工業大學)
報告主題:區塊鏈、人工智慧與社交金融新思路
嘉賓簡介:白碩,阡尋科技董事長
報告摘要:社交帳戶具有高度的穩定性和持續性。社交平臺可利用去中心化方式打造;付費社交可通過區塊鏈技術結算和打賞;用戶畫像可進一步延伸到金融維度;用戶身份證明可充分利用社交信息。區塊鏈、人工智慧正在通過深度滲透和融合,逐漸改變社交平臺的特性,形成信息、知識、價值三者之間良性互動的生態。
報告主題:AI Challenges to Finance and Economics: When all agents are fully rational.
嘉賓簡介:鄧小鐵,上海交通大學教授
報告主題:大數據、人工智慧與中國金融機遇
嘉賓簡介:葉強,哈爾濱工業大學管理學院教授、院長
論壇時間:2017年9月17日下午 14:00-16:00
論壇簡介:近年來,情感分析已成為社會媒體處理領域中的研究熱點問題之一。隨著網際網路上異構數據的不斷湧現,對於多模態信息情感分析的研究也逐漸成為社會媒體處理領域中新的研究熱點。為了進一步推動情感分析技術向縱深方向發展,促進社會媒體處理領域的前沿技術交流,本次論壇邀請了來自蘇州大學、清華大學和騰訊公司的三位專家講者,分別從文本情緒分類,跨媒體領域的情感計算和基於社交媒體的輿情監控等方面展現情感分析研究的前沿動態。具體報告內容如下:文本情緒分類是情感分析中一項重要的基礎研究,蘇州大學李壽山教授將針對文本情緒分類中標註語料匱乏問題介紹其相關研究工作;針對如何從網際網路海量異構數據中獲取用戶情感、以及如何把情感與心理健康分析相關聯等技術挑戰,清華大學賈珈副教授將介紹其在網絡海量數據的情感計算與交互方面開展的相關研究工作;情感分析技術在業界具有廣泛的應用前景,騰訊公司楊巍將結合具體應用場景以及海量社交數據,介紹騰訊公司在輿情技術方面的探索以及基於相關技術的商業化嘗試。
論壇主席:秦兵 教授(哈爾濱工業大學)
報告主題:文本情緒分析關鍵技術研究
嘉賓簡介:李壽山,蘇州大學教授
報告摘要:情感分析是自然語言處理方向的一個重要研究子方向。文本情緒分類是情感分析研究中的一項基礎內容。本報告主要針對文本情緒分類中標註語料匱乏問題,介紹了近幾年的部分研究工作。具體內容包括:文本情緒分類體系構建和相關語料庫建設;基於協同訓練的讀者情緒半監督分類方法;基於標籤傳播的讀者情緒半監督分類方法;基於圖標信息的詞向量學習方法及其在文本情緒分類方面的應用。
報告主題:網絡海量跨媒體數據的情感計算
嘉賓簡介:賈珈,清華大學副教授
報告摘要:針對如何從網際網路海量異構數據中獲取用戶情感、以及如何把情感與心理健康分析相關聯等技術挑戰,本次報告將系統介紹報告人在網絡海量數據的情感計算與交互方面開展的研究工作,重點介紹情感維度屬性與情感認知表徵的關聯方法、融合深度學習與因子圖的海量跨模態異構數據的情感預測模型、以及面向心理健康的情感計算方法等。此外,報告還將展示基於網絡海量數據情感計算的其它相關應用研究,例如如何讓計算機學會欣賞人類眼中的美學。
報告主題:基於社交媒體的輿情分析及商業化探索
嘉賓簡介:楊巍,騰訊AI平臺部基礎技術中心和遊戲AI中心總監
孫鍾前,騰訊AI平臺部大數據方向負責人
報告摘要:輿情分析已經有較長的研究歷史,但隨著科技發展和社會進步,輿論在傳播渠道、形式、時效性、數據量等方面都與以前有較大的差異,同時,輿情分析的作用也不再局限於輿情安全,對商業活動同樣具有非常重要的意義。在不斷深化的大數據和網絡時代,如何使用技術的手段對海量數據進行分析,以獲取有價值的信息?這些信息如何作用於商業活動,給企業帶來商業價值?本報告主要介紹兩方面內容:一是基於海量社交數據,騰訊在輿情技術方面的探索。二是,結合騰訊的應用場景,輿情分析在商業化方面的嘗試。
時間:9月17日下午 14:00-16:00
論壇簡介:大數據時代的到來,既向傳統的社會科學分野及其方法論範式提出了挑戰,又為全新的學科發展及其方法論範式的突破準備了基礎條件;「計算社會科學」(computational social science)應運而生,形象地概括了社會科學在大數據時代所呈現出的新發展、新動態和新前景。計算社會科學旨在探討如何立基於海量數據和大數據方法的發展,以研究人類社會的結構、行為和關係,社會運行的屬性和規律等涉及社會科學基本範疇的問題,對於構建有中國特色的社會科學具有極其重要的意義。計算社會科學立足於「第四範式」,強調在科學研究和技術應用方面,要更多地利用數據,要在科研領域發展並推廣數據採集、數據存儲、機器學習、數據可視化等方面的技術,促進數據和科研成果的分享和更加廣泛的使用,推動定性研究和定量研究的融合。本論壇將集中展示多位計算社會科學領域的專家,利用社交媒體數據、政務數據和行政記錄數據等多元數據集,探析大數據在社會學、政治學、經濟學和公共管理等領域的應用。內容包括:網絡媒體大數據中的用戶建模研究;基於網絡問政平臺開展公眾網絡反腐敗參與的大數據研究;基於廣州政務論壇探討地方政府在線回應現狀及影響因素;基於行政數據開展老年人共病對北京市城鎮職工醫療保險支出的影響的衛生大數據研究。
論壇主席:孟天廣 副教授(清華大學)
報告主題:網絡媒體大數據中的用戶建模研究
嘉賓介紹:王莉,太原理工大學教授
報告摘要:人是技術進步的驅動者、使用者和終極服務目標,了解用戶是政府管理與決策、商業服務、教育培訓等各領域的重要內容。用戶建模就是對用戶的人口特徵、興趣偏好、關係結構、行為模式等不同維度屬性進行標籤化,網絡媒體大數據為用戶建模提供了新的契機和挑戰。本報告將針對網絡媒體大數據環境中多源異構數據匯合帶給用戶建模的新契機、新挑戰以及相關研究工作、解決策略進行匯報和討論。
報告主題:公眾網絡反腐敗參與研究——以全國網絡問政平臺的大數據分析為例
嘉賓介紹:李莉,中國政法大學教授
報告摘要:貪腐問題不僅是黨和政府致力於解決的重大社會問題,也是民眾網絡政治參與的重要訴求內容。本文通過網絡問政平臺獲得的民眾網絡舉報腐敗投訴的海量信息,綜合應用自動文本分析、空間分析和統計分析方法,描述和統計了民眾網絡投訴的數量變化、議題類型分布狀況以及不同身份的投訴主體的訴求內容。民眾通過網絡這一信息平臺進行腐敗投訴的行為不僅是新媒介環境下實現政治參與的有效手段,而且也是觀察十八大以來反腐倡廉工作成效的渠道。
報告主題:地方政府在線回應現狀及影響因素探究:基於廣州市政務討論板的大數據分析
嘉賓簡介:鄭躍平,中山大學研究員
報告摘要:隨著信息技術與網際網路的快速發展,網絡參與逐漸興起,地方政府越來越多地採用政務討論板來鼓勵公民參與並提升政民互動水平。然而數據表明,地方政府在回應公民網絡參與方面的表現不佳,阻礙了政府與公民之間的良性互動。現有文獻試圖從技術、預算、人力資源等政府能力視角來解釋地方政府在線回應不足,但公民參與對政府在線回應的影響並未充分討論。為此,本研究選取廣州市政務討論板作為研究對象。使用Python對2.7萬條市民諮詢投訴數據進行分析,並將文本轉化為相關變量通過回歸模型來檢驗公民網絡參與對政府在線回應的影響。研究結果表明,公民參與會顯著影響地方政府的在線回應,參與主題及形式的差異會帶來政府在線回應的不同。
報告主題:老年人共病及其對北京市城鎮職工醫療保險支出的影響:一項公共衛生大數據研究
嘉賓介紹:陳鶴,北京大學講師
報告摘要:共病(即患有至少兩種慢性病)是老年患者中的普遍問題,越來也受到各國醫療政策制定者的重視。但是,關於中國老年人共病的研究比較稀少。以北京市城鎮職工醫療保險在2015年具有支付記錄的參保人為總體,本研究採取系統抽樣抽取2%的參保人,即按照年齡對受訪人排序後,每50人抽取1個樣本。針對被選擇的參保人,提取所有的醫保支付記錄。進一步,再從中選取年齡為60歲及以上的參保人的醫保記錄進行分析。共得到193.64萬支付記錄。基於共病測量的方法論綜述以及全球疾病負擔2013結果,選取對老年人疾病負擔重要的33種疾病,包括腫瘤、腦血管病、缺血性心臟病、糖尿病、抑鬱等。基於此,本研究計算了共病在北京市城職保老年參保患者中的現患率、分布情況以及對醫保支出的影響。
論壇時間:2017年9月17日下午 16:00-18:00
論壇簡介:表示學習旨在學習研究對象的語義表示,是機器學習和人工智慧的重要研究課題,最近在語音、圖像、語言以及知識、社交網絡等方面取得了很多成果。該論壇旨在分享表示學習的最新研究趨勢和現狀,研討該方向的重要問題與挑戰,推動表示學習在社會計算中的研究與應用。
論壇主席:劉知遠 助理教授(清華大學)
報告主題:表示學習在推薦系統中的應用
嘉賓簡介:趙鑫,北京大學博士,中國人民大學信息學院講
報告摘要:推薦系統已經成為電子商務平臺和社交網絡平臺必不可少的重要功能組件,其中一個重點就是如何設計更為有效的推薦算法。傳統的推薦算法主要是基於協同過濾、矩陣分解等。作為一個較為新興的研究方向,表示學習最近幾年得到了廣泛的研究和應用,包括推薦系統。本次報告試圖打通領域間的界限,討論表示學習在推薦系統中的應用。特別地,將介紹word embedding、network embedding、knowledge graph embedding和metric learning等技術在推薦算法中的借用和移植,從多個角度來分析表示學習在推薦系統的一些最新進展。
報告主題:自然語言表示學習
嘉賓簡介:韓先培,中國科學院軟體研究所副研究員
報告摘要:自然語言的表示學習是深度自然語言處理方法的基礎,極大的提升了自然語言處理多個任務的性能並降低了系統構建難度。本報告介紹面向自然語言表示學習,介紹了當前的研究現狀,從早期的離散表示,到分布式表示,再到分散式表示;並進一步總結目前不同方法之間的內在關聯,以及存在的問題和挑戰。最後對未來的發展趨勢做出展望。
報告主題:語言表示學習與計算社會科學
嘉賓簡介:劉知遠,清華大學計算機系助理教授
報告摘要:語言是人類交流的工具、人類文化的載體,是了解人類社會的重要視角。近年來隨著表示學習在自然語言處理中的應用,語言表示學習也為社會科學研究提供了全新的技術工具,特別是面向在線社會媒體的大規模用戶產生內容進行用戶和內容分析,具有很大優勢。本報告將介紹語言表示學習技術在計算社會科學方面的最新動態,探討該方向的未來發展趨勢。
論壇時間:2017年9月17日下午 16:00-18:00
論壇簡介:推薦系統在金融、電商、零售、社交媒體等領域有著廣泛的應用。近年來,人工智慧在語音識別、計算機視覺、自然語言處理等領域取得了重大的突破,但在推薦系統領域的研究與應用仍處於早期階段。本論壇邀請了多位推薦系統領域的學者,共同分享他們在這個領域的最新研究成果,以及對推薦系統未來的思考。論壇內容包括:融合用戶上下文的個性化推薦;今日頭條的人工智慧技術實踐;基於循環神經網絡的序列推薦;以及冷啟動推薦的思考與進展。
論壇主席:謝幸 研究員(微軟亞洲研究院)
報告主題:融合用戶上下文的個性化推薦
嘉賓簡介:張敏, 清華大學計算機科學與技術系副教授
報告摘要:各類電商和社交平臺積累了豐富的用戶數據,在推薦系統的設計中,如何有效的利用用戶信息來提升推薦的精度和用戶體驗是一個尚待解決的問題。本次報告試圖從模型設計和理論探索角度出發,討論我們在推薦系統中融合用戶上下文的思路和最新進展。報告將從三個方面介紹我們利用用戶上下文拓展傳統推薦方法的嘗試,包括如何對社交網絡和推薦系統中的隱式反饋進行精細建模,如何利用神經網絡和用戶社交信息對經典的SVD++ 進行拓展,以及如何將個性化推薦拓展到群組推薦並利用帕累託最優方法來同時確保推薦效益和公平性。
報告主題:今日頭條的人工智慧技術實踐
嘉賓簡介:曹歡歡,今日頭條算法架構師
報告摘要:近幾年人工智慧技術的發展如火如荼,一個突出的表現就是很多傳統行業正在被人工智慧技術深刻影響。2012年上線後迅速崛起的明星產品今日頭條就是一個用人工智慧技術顛覆信息分發行業的經典案例。那麼今日頭條到底應用了哪些人工智慧技術?這些技術是如何提升了用戶和內容生產者使用體驗的?在這個報告裡,我將嘗試簡要的解答上述問題,希望能給各位業界同仁一些有益的啟發。
報告主題:基於循環神經網絡的序列推薦
嘉賓簡介:吳書,中國科學院自動化研究所副研究員
報告摘要:隨著網際網路應用的快速發展,推薦系統逐漸成為了信息檢索、數據挖掘等領域中的研究熱點。它不僅能提升用戶體驗,同時也能為應用平臺創造更多價值。在廣泛存在的序列推薦場景中,傳統方法在還存在著一系列的局限性,同時在面對實際應用場景時傳統方法常無法建模好其中的關鍵因素。報告圍繞序列推薦中存在的一些主要問題,構建基於循環神經網絡的序列推薦模型框架,詳細講述針對情境建模、時序建模提出的策略,介紹如何更為有效的利用時空情境信息、有效建模一般情境和時序情境、把握多行為關係等方面的一系列探索,以期構建更為有效可靠的序列推薦模型。
報告主題:冷啟動推薦的思考與進展
嘉賓簡介:趙鑫,北京大學博士,中國人民大學信息學院講師
報告摘要:推薦系統已經成為電子商務平臺和社交網絡平臺必不可少的重要功能組件。長期困擾推薦系統的一個問題就是「冷啟動推薦」問題。冷啟動推薦問題通常包括兩種:新用戶推薦和新物品推薦。本次報告試圖對講者以及其他學者最近的一些研究進展進行一次梳理和總結,給出對於冷啟動推薦的部分解決思路。報告主要涵蓋兩大塊:新物品和新用戶推薦。新物品推薦主要介紹最新的一些深度學習的研究進展(非講者工作),新用戶推薦主要介紹基於用戶屬性的方法與基於物品代表的方法(講者工作)。
論壇時間:2017年9月17日下午 16:00-18:00
論壇簡介:近年來,社會媒體處理技術的發展如火如荼,一個突出的表現就是IT創新企業幾乎涵蓋了與社會媒體處理技術相關的各類業務。本論壇旨在分享與社會媒體處理技術相關的企業主要業務、分析行業發展趨勢,使之一方面有效增進校企合作、產研結合,另一方促進相關領域的高校人才培養,更好的服務企業,服務社會。
論壇主席:李斌陽(國際關係學院)
報告主題:新浪微博Feed流機器學習實踐
嘉賓簡介:劉博,高級架構師,新浪微博高級架構師
報告摘要:Feed流如何實現內容高效分發是近幾年業界網際網路公司探索的問題。新浪微博以月活 躍用戶3.6億規模的絕對優勢,領跑社交媒體行業。在如此大的用戶規模下,如何通過機器學習實時捕捉 用戶行為並對內容做及時調整,是微博機器學習研發部一直探索與實踐的問題。報告將圍繞在微博關係流 中用到的機器學習技術、這些技術如何提升用戶發現和消費內容效率等進行概要介紹。
報告主題:知識圖譜在司法領域內的一些嘗試和應用
嘉賓簡介:舒怡,國雙司法大數據事業部總經理助理
報告摘要:專業領域知識圖譜如何搭建,專業領域知識圖譜如何支持應用一直是大家關注的主題。國雙公司作為中國首家赴美上市的大數據及雲計算企業級軟體公司,進年來深耕法律領域,組建了強大的司法實務專家團隊,與數據工程師緊密結合,依託公司大數據技術探索了司法知識圖譜的搭建,並成功推出了「法信」、「智慧財產權案例指導服務平臺」及一系列服務司法的工具型產品。均受到最高人民法院、政法委領導的高度評價。本次報告希望通過知識圖譜概述和知識圖譜構建的主要技術與應用介紹,簡述國雙公司在知識圖譜領域的實踐經驗。復盤國雙公司在司法知識圖譜搭建過程中的探索經歷,比如如何與傳統知識庫對接,以應用為導向改造傳統知識庫等,總結國雙公司司法知識圖譜與應用場景結合的方式與方法,提出我們對構建專業領域知識庫的設計思想。展示國雙公司在司法領域事件圖譜的新嘗試。
報告主題:三角獸對話系統的技術框架與理論研究進展
嘉賓簡介:王寶勳,三角獸公司首席科學家、合伙人,前微軟小冰機器學習科學家
報告摘要:三角獸是由百度度秘、微軟小冰核心團隊組成,提供對話式交互解決方案和端對端交互系統,是國內人工智慧語義領域發展最快,技術落地領域最廣的公司,已經與BAT、微軟、移動、新浪、小米、富士康、錘子、光明網、扶貧辦、恒生、新東方、Rokid、Jibo等達成合作。開創了微軟小冰和百度度秘聊天技術,情緒識別準確率 99%,擁有超百億語料,逐步去結構化,具備領域無關的高度泛化統計模型,從零建設了百度度秘中控。本次分享人將概述對話系統,就對話系統由技術路線及商業實踐進行介紹。
雷鋒網(公眾號:雷鋒網)註:了解更多信息可參看 「SMP 2017官網」
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。