科技信息是創新的基礎,而學術搜索使得科研工作者可以從海量資料中更快捷、更精準地搜集所需要的信息。
近年來,學術搜索的內涵和外延不斷擴大,從文獻檢索一直擴展到科研人員畫像、交叉學科發現、學術趨勢分析等。同時,AI技術的快速發展深刻影響了用戶搜索的習慣,在AI時代,學術搜索的內涵與外延是什麼?學術搜索的技術、應用、產業發展如何?研究者該如何藉助學術搜尋引擎站在巨人的肩膀上?學術搜索提供商如何為學術發展貢獻力量,優化學術資源生態,實現技術價值?
在AI時代,學術搜索的內涵與外延有什麼變化?
2009年至2019年,中國科技人員共發表國際論文260.64萬篇,按數量排名,處在世界第2位;論文共被引用2845.23萬次,增加了25.2%,也排在世界第2位。快速增長的科技文獻規模已遠遠超出了個人的處理能力,面對海量的文獻資源,學術搜索的範圍有哪些變化?學術搜索的用戶和應用場景發生了變化?研究者該如何去粗取精,找到自己需要的資源?
對此,李涓子認為:學術搜索的本質是幫助我們找信息的,即如何從海量的文獻資源中找到需要的資源。找文獻的目的是輔助研究或者了解研究現狀。從整個技術發展的角度來說,學術搜索要助力科研創新,提升創新的速度,發現值得研究的問題以及具體的研究方法,以加速研究過程。在這個過程中,學術搜索可以助力研究者看到整個環境對人、機構、研究問題的評價,發現現象背後的科技創新的規律,而不僅僅是找信息,這已經突破了傳統的直接搜索的範疇。
從學術搜索整個發展過程來看,周園春談到隨著大數據驅動的科研創新的發展,我們越來越側重基於數據做科技創新,而科技創新必然會帶來數據。所以,在這過程中學術搜索的範圍越來越大,除了傳統的論文、專利、其他文獻,學術搜索還需要附加其他的一些資源,ImageNet項目就是找到、使用大規模的科研數據,以支持科研創新甚至引發新一代技術浪潮的典型例子。科學數據既是學術創新的源頭,也是學術創新的成果之一。所以:學術搜索的外延可能不斷擴大;在擴大過程中,學術搜索也將和NLP、知識圖譜等新的技術等不斷融合;另一方面,學術搜索服務提供商和用戶可能會雙向促進,學術搜索在為科研人員提供精準的信息搜索時,科研人員也會為學術搜索貢獻自己的智慧,交互式的學術搜索在未來將會藉助大眾參與實現系統完善、準確性提高的過程中來。學術搜索的發展趨勢應該是用戶群體不斷地平民化,外延不斷地擴展,以便使得自己能夠更好地與技術、應用、產業相互的關聯。
劉筱敏從應用方的角度進行了分享。從學術搜索的內涵來說,無論是過去的圖書館服務讀者,還是今天的學術搜索服務更多的用戶,其本質都是搜索信息,即圖書館中所說的檢索。檢索從18世紀40年代誕生以來,走到今天擁有了兩個極大的特徵:檢全率(怎麼檢索到全部信息);檢準律(怎麼檢索到準確的信息)。從學術搜索的外延來說,因為現在所有的信息都服務於科研的整個學術生命周期,所以搜索本身就是圍繞著科研的任何一個因素或任何一個生產要素,將其作為學術搜索的對象,並隨著科研方式的變化而演變。學術搜索的關鍵是要抓住學術是什麼,搜索在檢索的全面、準確、深度上能做什麼。
劉雪峰從產業界的角度進行了展開。他認為學術搜索最主要的變化是在用戶層面,即解決的問題一直是沒有發生劇烈變化的,但是用戶群體在不斷擴大。以前學術搜索的使用可能都是一些專業學者,而隨著技術的發展,很多高校學生、普通用戶、甚至是對某些專業領域有疑問的愛好者都來使用學術搜索查找自己問題而答。百度學術也在順應這樣的潮流,其正在做得就是這樣一個事情,希望能服務更多的用戶,擴大用戶群體。
學術搜索的技術發展
在聊完了學術搜索的內涵與外延以後,大家開始了對學術搜索的相關技術的探討。
問題一
學術搜索和普通的搜索有什麼區別?是更容易了,還是更難了?
對此,劉雪峰認為判斷難易程度要先定義維度,學術搜索的難點在於學術搜索的核心是背後的學術內容,即怎麼保證內容的準確性、權威性,以及如何把那些異構的資料庫實現成結構化的數據。劉雪峰舉了一個形象的例子:如果說普通搜索是建造一棟百貨大樓,學術搜索可能就是開一家書店。開書店的成本更低,但是要想開好一家書店,需要提供非常優質的書籍和內容,滿足各個讀書群體的需求,這裡面其實可能是學術搜索的難點所在。
李涓子補充到:通用搜索的是和學術搜索不一樣的,學術搜索作為垂直搜索,其資源的準確率、覆蓋面以及對特定領域的分析深度決定了學術搜索的品質。此外,學術還需要注意對需求方的服務程度,因為需求方的要求可能會更高,需要的信息更精細,對學術前沿的預測能力要更強,這些可能是學術搜索更難的地方
問題二
在這個領域,我國現在技術方面的現狀是處於領跑、並跑還是跟跑狀態?
周園春提到學術搜索不僅是技術問題,還是一個綜合問題。一些學術搜索服務提供商之所以強大,很大程度上是因為擁有多年的數字資源的積累,而積累量是查全率的基礎。目前來看,與國際對比,我們在技術上的差距比內容上的差距要小,這是我國目前面臨的現狀。這個問題在這次疫情中展現得也比較明顯,數據孤島的現象比較嚴重。近幾年國家一直在推動資源的開放共享,出臺了一系列政策實現資源的匯聚,以打破數據孤島。
問題三
關於學術搜索中的實體、知識融合,學術界已經有很多方法,但是在實踐上並不能完全滿足要求。如何應對這類問題?
李涓子強調打破信息孤島最重要的一個技術就是融合,而實體的歧義是這裡面一個最困難的問題。消歧問題被研究了很多年,從自然語言處理一直走到知識工程,但是一直達不到應用的狀態,成為學術搜索的一個技術瓶頸。要打破技術瓶頸、推動學術搜索的技術進步,可以嘗試設置一個長期的比賽,以鼓勵每年都用一些技術更新來推動相關領域的技術發展。
周園春分享了自己正在做的事情:在科研數據中設置一個數據資源的ID,通過異構的標識融合和解析,在實踐上、工程上實現底層資源和基礎設施的互聯互通,然後實現語義的互聯互通,這樣可以實現幾個層面的一些交叉融合,最後在實踐上提高學術搜索的準確率。
劉筱敏提到了國際上作者、機構、基金等的唯一識別號的發展現狀、存在的各種風險,以及其在國內面臨的挑戰。並認為它一方面從在提高技術含量,另一方面也在鼓勵科學工作者開放交流。
周園春補充到通過統一的標識實現科技資源融合是一個從源頭促進科技實體標準化的有效手段,我國也已經開始嘗試做相應的工作並取得了初步的效果。要想進一步提高效果,還需要從制度體系包括技術體系等方面共同解決這個問題。
劉雪峰談到百度學術正在搭建自己的學者體系,就是為每一位學者建建造了專屬的唯一ID,除了國家機構去推動,是不是可以通過為學者建造高影響力的個人網站等方式讓學者更主動地去分享自己的學術成果,把自己的一個學術體系給它搭建起來。
問題四
在自動摘要生成、交叉學科發現、趨勢分析與預測、學術影響力評價、專家&機構畫像等場景中,還有哪些技術可以賦能?
劉雪峰首先分享了百度學術在實現自動摘要生成過程中遇到的問題。
周園春結合自己工作重點分析了交叉學科發現領域的技術。第一,中科院計算機網絡信息中心一直在數據服務、軟體工具等方面支撐中科院的科技創新,鼓勵研究者進行跨所、跨學科領域的交叉學科的發現。第二,從國內外基金申請、管理的情況看,打破學科的限制,更多地按關鍵詞來對專家、項目等進行評估,從這些交叉學科裡面發現哪些技術是值得深入探討的。
李涓子提到要從學術搜索的整體去分析到底需要什麼樣的信息,如專家畫像、專家的學術影響力分析等。知識圖譜是支持整個學術搜索底層內容,摘要生成是中間層的支撐技術,上層的應用則是根據精確的知識支持不同業務場景,如趨勢分析等。學術搜索最終要賦能用戶,增加用戶的能力,讓用戶能夠更好地去做自己要做的事情。
劉筱敏認為5個場景都是學術搜索的目標,只是因為用戶需求不同衍生出來了不同應用場景,核心都是能夠把所有信息的內涵比較簡單地、顯性化地展示出來。對此,技術需要發揮極大的作用。大家比較詬病的影響因子等指標,主要是過去受傳統的閱讀方式、文獻使用方式的影響。未來,在學術搜索的環境下,用戶行為更多元,可以抓住數據應用過程這個著力點,創造新的學術評價方法甚至算法,這將產生新的結果,也將引導用戶採取一種新的使用學術資源的方式。
周園春對劉筱敏老師的內容進行了評價,認為學術搜索在科研誠信、學術影響力評價方面可以做一些工作。現在國內的科研評價(學術影響力)側重於論文,未來也許評價範圍應該超越科學研究領域,在評價體系中包含專利申請、技術轉化和綜合創新等,從解決國家層面的問題、服務社會經濟發展、服務整個國家戰略的角度進行評價。
學術搜索的應用落地
問題
從用戶角度(例如學者、期刊/會議、高校、基金資助機構等)來看,AI在哪些場景已經發揮了作用?哪些場景還需要改進?還有哪些需求沒有被滿足?在學術搜索領域還有哪些場景可以用AI賦能?學術搜索+AI對國內外學術環境有哪些影響?
劉雪峰首先就百度學術的現狀和AI技術賦能的方向進行了介紹:第一,百度學術現在很大一部分用戶是畢業生群體,他們面臨的一個主要問題是如何開題。此外,很多熱門的研究方向其實都有很多人在做,能不能通過AI算法觀察整個行業的研究趨勢、熱點方向、演進圖,然後分析出自己應該聚焦的研究方向?第二,語義搜索是否是一個有價值的方向,傳統都是通過關鍵詞進行搜索,未來能否藉助AI技術,實現用戶可以用自然語言進行交互,對搜索請求進行智能化的搜索和分析?
周園春提出:在學術搜索、科研評價過程中,當前我們聚焦的範圍是不是太狹隘了?評價體系是不是可以多元化一點?並指出在最近的一些政策文件已經提出數據可以作為我們生產要素,如果科研評價的要素更廣泛、更多,這將對學術搜索帶來的挑戰。因為搜索的範圍、服務的內容、資源都更廣泛的話,收集、整理的難度會更大,這可能就是我們未來需要持續改進和持續往前走的一個理由。
李涓子談到,隨著學術搜索的發展,大家看到了它除搜索文獻之外的應用場景,如評審人的智能指派等。在此過程中,學術搜索實際上已經發生了很大的一個變化,應該把學術搜索放到科技信息服務業的一部分這樣一個角度,從科技情報、科技信息、科技技術整體服務的角度來考慮。在這當中,學術搜索可以滿足的需求非常多,自身可以擴展到非常大的一個空間,值得投入非常多研究資源,也必將能夠幫助用戶更好地做出科技的創新。
學術搜索的產業化突破
問題一
目前,谷歌、百度、微軟等大型企業都持續在學術搜索上發力,作為Semantic Scholar、AMiner這樣的學術搜索平臺,在哪些方向會有所突破?面對AMiner這樣的平臺的衝擊,百度學術這樣的傳統學術搜尋引擎,應該如何響應?
李涓子認為很多新湧現的學術搜索,如Semantic Scholar、AMiner等,更多地是希望能夠用新的這樣技術來去助力面向科研、科技的信息服務。如AMiner提出「打造最智能的學術搜尋引擎」,Semantic Scholar的發起人則直接提出「希望能去發現最本質的研究點、交差研究點,從而促進創新」。後起的學術搜索可能更希望在搜索的基礎上更上升一步,更好地理解科研資源背後隱藏的引領科技創新的東西。
劉雪峰提到傳統學術搜索和新銳學術搜索二者存在差異。第一:AMiner和百度學術並不構成一個直接的競爭關係,雙方都是希望成為科研學者學術道路上的一個好幫手,雙方的產品定位不同,面向的用戶群體以及提供的一些服務也有一些差異,AMiner是用計算機技術完成計算機領域的一個學術搜索,有非常大的一個學術和社會價值。而百度學術的定位與AMiner存在差異,它是全網論文的搜索平臺,涵蓋各個領域,用戶和內容是百度學術的一個優勢和責任。第二:AMiner提供的服務更加的深度,對很多前沿的技術做得更加深,而這些是百度學術正在做的,百度學術希望能把CS領域的一些AI技術等尖端的技術也應用在別的領域,讓別的領域的用戶也能夠對體會到AI技術帶來的一些搜索體驗的提升。
周園春認為:從產業的角度來說,最終還是面對用戶,從用戶的角度來說,用戶希望能夠確實在技術發展的過程中,服務內容、服務形式要吸引人。
劉筱敏從學術搜索用戶的角度提出:用戶黏性很重要。很多人使用百度學術等的主要原因就是因為它使用起來簡單、快捷、直觀,這是它的優點。而使用AMiner算出來的結果需要用戶自己進一步分析。二者的產品定位存在差別,所以目標用戶、使用體驗存在差別。AMiner揭示了學術創新背後的內涵,如果能把內含變得更為顯性,更便於理解的話,將會有更多的用戶願意使用他。
問題二
學術搜索對學術出版,科技情報產業的意義在哪裡,能否突破產業局限?還有哪些商業上的想像空間?
劉筱敏首先介紹了科技情報產業與學術搜索的關係。「中國科學院文獻情報中心」這個名字從字面意義上來看就已經不在是傳統意義上的圖書館,而是要做大量的文獻分析、情報服務。中國科學院文獻情報中心大量的情報服務其實都是以數據為基礎,然後進一步分析、專家解讀,最後形成報告。而AMiner挖掘了深層次的科技信息的內涵,並且給顯性化了,描述了學科交叉發展的狀態,這是非常值得關注的一個點。
科技情報產業的需求非常的旺盛,而且需求的點也不一樣,它可能會定定製某一些研究的領域或者是某一個微小的點信息。現在,文獻是主要的分析對象,其次是專利甚至會議信息,以後甚至可能是科技成果轉移、轉化當中的某個點。正因為科技情報需要比較專注或做得比較深,所以,類似AMiner的學術搜尋引擎就需要做深,做個性化的定製,把深度的內容給挖掘出來,這樣才能輔助於科技情報產業的發展,才能擺脫對大量的數據的計算,進而做專家解讀,更好的指引研究方向。人工是輔助智能發展的,最終結論還是需要專家來解讀的。學術搜索肯定是有意義的,而且肯定是有大的輔助作用,但是學術搜索後面還需要有情報人員的個性化定製過程,只有情報人員參與,才能使數據活起來,才能誕生更有價值的情報產業。
從學術出版角度來看,學術搜索可以輔助發現人才,如編委、主編等,可以成為學術出版中一個很好的工具。
周園春認為:第一,現在對學術出版也做了很大的延伸,如預出版、數據出版等,這些新的出版形勢如何進入學術搜索,如何被客觀評價是一個很大的問題。第二,學術搜索本身是科技情報的一個基礎,學術搜索如果要提供精準的搜索,需要對專利和論文做深度的分析,為科技情報提供一個很好的支撐。此外,科技情報它的範圍更廣,除了相應的政策分析等,通過企業的招聘信息可以推斷出企業的戰略布局,進而發現行業整體的發展走勢,這些都是未來科技情報產業的一個基礎,學術搜索的很多東西可以用到這個地方。從中央政府、到地方政府在到風投機構,大家對科技情報的關注度都很高,因為科技情報可以觀察科技貢獻,進而輔助評估高新區的新型研發機構。由於面向整個創新創業,科技情報其實很大的想像空間。學術搜索很多的積累、沉澱給科技情報產業能夠帶來什麼很大的想像空間。目前,我們希望打通從設備到數據,然後再從數據到人和成果的整個鏈條,而這需要我們精準的搜索、準確的評估,進而提供相應的支撐,這裡的想像空間很大。
問題三
目前,有一種模式是跟一些出版商進行合作來去匯聚了大量的資源,我們稱它為自外而內。還有一種模式是基於內部的一些數據來去做自己的學術搜索,我們稱它為自內而外。這兩種模式有什麼差別,以後有沒有可能由一個這樣的融合?
劉雪峰覺得在本質上這是兩種完全兩種不同的模式。百度學術、谷歌學術等沒有自己生產的內容,提供的是爬取信息、作為連接人與信息的中間的橋梁,而自內而外本質上就是說是作為內容的生產方。
二者在運營模式上會有一些很大的區別。百度學術這種平臺是一些免費的平臺,如果想沉澱自己的內容,可能是基於全網的內容再做一些結構化的處理上,然後再生成自己的內容來展示給用戶。而自內而外的一些平臺可能本身就有一些內容,他在運營模式上可能就相對的封閉一些,他要解決的一些問題可能是更加專業的,或者是某一個垂直領域的一些內容,因為它也不可能兼顧到所有的一個行業的方向。所以,不管是在面向的用戶群體上,還是在經營模式上,二者都會有一些區別的。
周園春認為兩者的服務對象的差別非常大。第一,因為人是社會的人,所以不可能將搜索只限定在某一塊,他還需要很多外部的東西。從服務模式來說,如果要滿足用戶要求,需要跟外界的數據的融合貫通。第二,從用戶的要求來說,因為從內而外類搜索的受到限制、場景比較明確,所以用戶對他的服務要求相對明確,所以對準確性要求可能就非常高。對數據質量、準確性的要求不一樣,帶來的後果就是所需的技術完全不一樣,這時,在構建時可能需要人工和技術融合。第三,從未來的角度,二者很難融合。總結來說,由外而內可以給由內而外提供很好的支持和技術。由內而外構建的高質量數據集反過來也許會為外面的模式提供一個支撐和基礎。這樣的話兩個做這樣一個融合還是很有必要的。此外,兩者都需要有商業模式運轉起來,如由外而內的模式慢慢也許可以聚焦一些大客戶。總之,兩塊之間慢慢可能會有一些交叉和融合。
李涓子提到由內而外和由外而內其實應該是都需要的。由外而內的通用的服務是面向大眾的服務,如果要做更精細的服務的話,可能還是需要在一個領域或者一個方向上面去深耕。AMiner現在有一個整體的、大的數據,同時,在40個領域上建立了一些有代表性的資源,然後在每一個領域裡面深耕。不過,不同領域之間的技術是有共性的,我們希望能夠深耕每一個領域裡面共性的技術,同時,把通用的需求抽象出來形成一些技術點,然後把它做深,最後為所有的科研人員提供這樣一些服務。這樣的話,需求方可能就更多了。如果可以去找到最根本的需求,就可以在不同的需求下去做服務。此外,即使有自己特別封閉的一個領域的,它也是需要根外部的庫結合。
劉筱敏認為兩者之間有關係,簡單來說就是如何把科研的成果用到市場上去,這其中最重要的是用戶的需求。無論是什麼模式,我們只是把研究成果做一個產業化的應用。
AI學術搜索的前景與機會
問題
作為計算機、文獻情報界以及產業界的代表,各位對學術搜索的未來怎麼看?為學術搜索領域從業者(科研人員、項目研發、產品設計等)提供一些建議?
以計算機行業的代表,李涓子認為對科技信息的這種分析需要很深入的這種對科技文獻或者科技信息的理解,第一,科技領域的知識圖譜是一個非常重要的資源,它是一個分析科學脈絡、組織相關的科學研究的人物機構的一個特別重要的基石。我們應該投身到科技信息情報相關研究的這種基礎知識、基礎設施的建立過程中,這個過程可能不是一蹴而就的,而是一個長期的過程,但是積累下來之後,它就是關於科技信息的一個很好的財富、一種很好的資源,我們應該做這樣一個積累。第二,現在AI技術、算法對數據、知識都有很好分析,我們應該把這資源與分析能力兩個驅動力都用上,更好地用AI技術去賦能學術搜索。
劉筱敏從文獻情報界特別是圖書館的發展現狀進行了剖析。
第一,現在的圖書館面臨著很大的挑戰,在工具越來越多的情況下,圖書館在做什麼?這是圖書館行業的一個問題。劉老師希望有更優秀的學術搜索工具能夠輔助、服務於科學家,這事這是肯定的。為了使學術搜索做得更好,圖書情報界對數據非常了解的老師們在思考如何把大數據變成一個相對精準的數據,從而提高我們的學術搜索的質量,這是可以有所作為的地方。
第二,面對科研倫理問題,從學術搜索的角度來說有兩個點需要注意,首先是學術搜索後邊的算法問題,這個算法對用戶來說是黑箱,這時就要非常注意要不帶歧視地去做,這是非常關鍵的一個點,即保證你推薦的東西是別人相信的。那麼從這個角度來延伸的話,就是說我們整個的學術搜索或者AI的學術搜索的科研倫理是什麼,有什麼邊界和標準需要遵守。
第三,怎麼實現用戶信息與AI之間的匹配和交流。用戶在搜索中的留痕,甚至對信息的一個評價如何反哺學術搜索,然後提高學術搜索的價值,這個可能期待於未來能夠和科學家之間有一個互動。
周園春談到在當下暢想未來需要「不忘初心,牢記使命」。第一,面對當前國際形勢帶來的實際挑戰,作為從業者來說,無論是從內容上還是從技術上都只能埋頭苦幹,腳踏實地。第二,多年以來,中科院計算機網絡信息中心聚焦科學數據很長時間,但是現在回過頭來看壓力非常大,因為突然有些數據不可挽回的。這是非常遺憾的,所以對數據的積累,還是希望科研人員、項目研發人員、產品設計人員等真正為國家服務,為人民服務,然後腳踏實地,砥礪前行。
作為產業界的代表,劉雪峰認為我們更關注的應該還是用戶的需求。隨著AI的發展、5G的應用,技術的進步本身對學術搜索的衝擊力是非常很大的。
第一,學術場景變得多元化了。之前做學術搜索可能是埋在圖書館裡或者電腦前,未來可能我們可以時時刻刻都進行學術搜索,怎樣把各個場景下的搜索體驗做好,這是產業界一定要橫下心來考慮的一件事。
第二,學術內容的多樣化了。現在,科研學者的產出可能主要還是以期刊文獻為主。其實,學術內容正在以各種各樣的形式噴薄而出,如直播等,怎麼把多樣的數據進行結構化的處理、融合,提煉出有意義的價值,這些都是可以做的一些事情。
第三,學術內容的下沉。學術搜索麵向的用戶會越來越多,怎麼把一些晦澀難懂的一些學術的問題,通過一些AI、可視化的手段向普通大眾展示出來是學術內容下沉的關鍵。搜索的本質在開始時是人找信息,學術搜索的未來可能直接是人找人,如我找一個或研究領域的時候,能夠通過AI的手段直接連接到想要諮詢的專家,這之前是做不到的。
最後,做學術的最重要的嚴謹,內容是最重要的,要鼓勵產出精品的內容、高質量高標準內容,對科研學者的學術成果要給予充分的尊重,這是最重要的。此外,網際網路人是再做學術搜索中要多實踐多創新,學術搜索作為一個有很多年歷史的東西,從前期的人工到現在的一些使用AI的技術,技術在不斷進化,我們要打破之前的一些傳統,多創新,摸著石頭過河可能會創造出一些比較好的產品。
Q&A
最後,各位老師就觀眾感興趣的話題進行了答疑。
問題
學科圖譜的構建範圍如何界定,學科圖譜的術語、概念、屬性該如何定義?
李涓子對此做了解答。學科範圍的定義,實際上現在在AMiner裡面,還是面向一個學科有代表性的期刊和會議,然後從裡面去找相關的術語,如果這個領域已經有一些術語,就把它作為比較好的種子,在總的基礎上利用各種資源進行擴展。論文是一個獲取這些術語的比較好的資源,但我們也可以從論文之外的一些外在的資源去擴展。
此外,知識圖譜的構建是挺複雜的一個事情,建一個簡單的前後續的關係就挺難的。
在科研信息裡面,其實我們也可以建立一些重要的關係,比如某篇論文的研究點,論文研究的問題,或者在論文裡面用什麼方法去解決這個問題,再比如對論文的一些問題和研究方法進行一些標註,對一個研究點的定義,中英文的對應,以及研究點一些固有屬性。
怎麼去確定呢?實際上,我們可能會分析這個領域裡面大家通用的一些屬性,也會利用論文裡面上下文的這種情景,去把那種描述兩個研究點之間的屬性來去學到,後者這個情形其實應該是更難,離實用更遠一些,也是我們的一些研究的問題,但是前者可以給他定義一個通用的知識圖譜的這樣一個結構,而目前我們更多關註上下位的關係,即學科的分類的信息,以及研究點之間的先後序的依賴關係,這是我們定義的一些通路的關係。
然後,對於特殊的這種屬性的話,我們實際上還是處在算法階段,還沒有就是說在知識圖譜真正構建的時候把它用進去。