親屬關係推理系統研究與實現

2021-03-02 中國學派

摘要:從親屬關係知識表示和親屬關係推理規則兩個方面看,現有親屬關係推理系統缺乏對親屬關係及其形式結構方面的理論探討。親屬關係推理具有複雜性:親屬關係推理的實質是血緣關係的推理;血緣關係結構是一個以「父親」、「母親」、「孩子」組成基礎單元的遞歸的圖結構;親屬關係的定義是按照血緣關係結構圖中最短路徑來給出的;利用婚姻關係、生育關係、被生育關係、兄弟姐妹關係作為四個基本血緣關係,重新設計了親屬關係表達式;利用親屬關係式能夠確定系統邊界,以及形式化描述親屬關係的相關概念。在此基礎上,基於血緣關係結構圖的親屬關係推理系統得以構造,利用定位、匹配、檢索最短路徑和移位四項操作,來完成複雜的親屬關係推理任務。跟以往的親屬關係推理系統相比,此推理系統的邏輯和步驟更加直觀簡明,保證了親屬關係推理的完備性與準確性。基於血緣關係的親屬推理算法能推廣到其他語言的親屬關係推理。

關鍵詞:親屬關係  稱謂系統  血緣關係  推理系統

作者盧達威,中國人民大學文學院講師(北京100872);袁毓林,北京大學中文系/中國語言學研究中心/計算語言學教育部重點實驗室教授(北京100871)。

近年來,隨著人工智慧的迅速發展,自然語言處理(Natural Language Processing,NLP)的水平達到了前所未有的高度。在大數據和深度學習的支持下,閱讀理解、文本分類、機器翻譯、情感分析、自動問答等多項自然語言處理任務都有了長足的進步。這些任務共同特點是能夠在大數據下挖掘出問題與答案的相關性,可以使用端到端(end-to-end)的深度學習模型進行計算。相比之下,需要理解因果關係的常識推理(commonsense reasoning)至今仍是巨大挑戰。親屬關係推理是常識推理常見問題之一,屬於社會關係的推理。

親屬關係推理是涉及人類學、語言學和人工智慧等多學科的問題。親屬關係是最基本的社會關係,其背後是複雜的血緣關係。就語言系統而言,漢語的親屬稱謂系統在世界各種語言中是比較複雜的,親屬稱謂詞之間的語義關係也錯綜複雜。對於常識推理來說,親屬關係知識在文本中佔比不大,且推理步驟較多,故難以從大數據中直接習得推理的答案。這些使得親屬關係推理看起來簡單,做起來難。另一方面,親屬關係知識又是一個領域封閉的輕量級知識,邊界清晰,辨識度高,是研究常識推理的良好的切入點,可以作為其他社會關係推理研究的範本。正確的親屬關係推理能夠提高自然語言理解的精度,為閱讀理解、自動問答、機器翻譯等任務提供幫助。

現有的親屬關係推理研究大多是從計算機工程的角度構建的應用系統,它們雖然能夠完成簡單的親屬關係推理任務,但是遇到稍微複雜的親屬關係推理就很容易出錯。對於複雜的漢語稱謂系統,現有的研究甚至沒有方法窮盡地列舉出漢語親屬稱謂詞的種類,更無法對系統的推理能力和推理完備性進行定量描述。至於系統可用性,主要依靠不斷的系統測試和修改,無法從理論上保證推理系統可用。歸根結底是缺少多學科角度的思考,缺乏對親屬關係語義及推理機制的理論探討。

本文擬在分析現有親屬關係推理系統研究的基礎上,揭示親屬關係推理複雜性的成因,明確親屬關係推理系統應有的推理能力和推理邊界;構建完備的親屬關係推理系統,為人工智慧中的常識推理問題探索新的研究思路。

一、親屬關係推理系統研究現狀

漢語親屬關係的推理系統研究已有不少成果。例如,靳小龍等基於親屬詞的常識構建的親屬關係推理模型,王樹西等針對《紅樓夢》做的人物關係問答系統,陳振宇等基於親屬關係知識庫的推理模型,陳振宇等基於親屬基元構建的推理模型,以及陳振宇等基於語義特徵分析的親屬關係推理模型,等等。

這些親屬關係推理系統主要包括兩個部分:親屬關係的知識表示;親屬關係的推理規則。以下從這兩個方面介紹和分析現有推理系統研究情況。

(一)親屬關係知識表示研究

前人的工作中,親屬關係知識表示大概可以分為三種思路。

第一種思路是以其他親屬詞來刻畫兩個親屬之間的親屬關係。靳小龍等將兩個親屬關係分為對應關係(如「丈夫」對應於「妻子」)和半等價關係(如「兒子」半等價於「(父親/母親的)孫子/外孫」),關係的兩端親屬稱謂詞(簡稱「親屬詞」)需加上親屬的性別、輩分、長幼等常識來表示該親屬,如「父親(a)」具有這樣的常識:「a的性別是男性,而且對某個人來說有身份為a的親屬一般只有一個,再者,每個人的a的輩份要高於自己」。陳振宇等將這一思想推向極致,他把每對親屬關係的稱呼人與被稱呼人都通過中介人聯繫起來,並窮舉這種聯繫的所有可能路徑,例如,「父親」既是「母親」的「丈夫」,也是「祖父」的「兒子」,還是「外祖父」的「女婿」,等等。這樣,每個親屬詞就跟其他親屬詞連接起來了。通過窮舉每個親屬詞與所有其他親屬詞的關係,就構成一個龐大的親屬關係知識庫,作為推理的基礎。但是,該方法存在理論缺陷,就是知識量過於龐大,甚至可以說無邊無際。隨著兩個親屬關係越遠,相互表達就會越複雜,且可能路徑越多,事實上無法窮盡所有的任意兩兩親屬所有可能的路徑。

第二種思路是用固定的若干核心親屬詞來刻畫其他親屬詞。這些核心的親屬詞稱為「親屬基元」。陳振宇等將親屬基元分為三類,「自己,母,夫」是核心基元,「父,妻,女,子」是次核心的基元。「兄,弟,姐,妹」是再次核心的基元。其他親屬詞都用這些親屬基元來表示。相比第一種知識表示方法,這種思路大大減少了知識庫規模。同時增加了「自己」這種零階關係,以區別「我父親的兒子」是「我」還是「哥哥/弟弟」。在親屬關係知識表示上又前進了一步。

第三種思路是從親屬關係中抽象出核心的語義特徵作為基本描述單位,所有的親屬關係均用這些核心語義特徵來定義。這是第二種思路的發展。王樹西等較早採用了這種思路,但僅簡單舉例說明,沒有系統地闡述。陳振宇等則詳細列出了各個親屬詞的知識表達,並貫徹到整個推理系統中,並通過7個核心語義特徵,列舉了46個親屬關係,是所有親屬關係推理系統中,列舉最詳細,展示最透徹的。該系統的核心語義特徵如下表:

上述核心語義特徵中,x或y表示親屬關係的結點。表示親屬關係時,所有的特徵直接用邏輯與號「∧」相連,形成一個一階謂詞邏輯表達式。例如,「女兒(x, y)」表示為「child(x, y)∧female(y)」,即「x叫y女兒」等價於「x叫y孩子,且y是女性」。若兩個親屬表示之間涉及多個中介人,則用z1……zn命名各中介結點,例如,妻子的弟弟「內弟(x, y)」的定義是「husband(z1,x)∧child(z2,z1)∧child(z2,y)∧male(y)∧elder(y,z1)」,即「x叫y內弟」等價於「y是x的妻子(z1)的雙親(z2)的另一個孩子(y),且y是男性,且妻子(z1)比y大」。

文章表明,該知識表示方法可以表示所有親屬關係。但是我們要指出,這個知識表示方式不是親屬關係最貼切的表示方法,從親屬關係推理的角度看,主要有以下幾個問題。

1.不同性質的特徵並置。在這7個核心特徵中,有四類不同的性質:第一類是描述親屬關係的拓撲結構的,包括關係函數child和husband,分別代表兩結點的血親關係和姻親關係;第二類是描述某一結點屬性的,包括描寫某一結點性別屬性的male和female,描寫兩個結點長幼屬性的elder;第三類是描述某一親屬關係屬性的,包括alone。第四類是因計算需要而設置的信息,包括self,這類信息不是親屬相關的信息,只是為了推理方便。把層次不同的四類信息置於一個邏輯表達式中,並放在一個平面來描寫,不利於親屬關係的化簡和推理。

2.關係順序信息隱藏過深。child和husband的順序構成親屬關係的核心,「丈夫的孩子」和「孩子的丈夫」是不同的兩個人。該知識表示中,將所有語義特徵並置,而沒有強調其順序。順序信息主要由child和husband的參數(結點)來體現,隱藏過深,推理時需要反覆計算關係的順序,大大增加了推理複雜度。

3.中間結點信息冗餘。該知識表示方法將所有中間結點都賦予一個變量名稱,而變量名稱在合一推理時要不斷變化,造成推理複雜度的提升。我們將在後文提出不需要結點名稱的更優的解決方案。

4.最關鍵的一點,無法窮舉所有的親屬關係。該知識表示方法能夠對給定的親屬關係進行知識表示,但無法指導構建完備的無遺漏的親屬關係集,無法為人類學和語言學的親屬關係定量研究提供理論支持。

(二)親屬關係推理規則研究

對於親屬關係的推理方法,不同的知識表示方法下稍有不同。

第一種基於「大知識庫」的知識表示方式下,由於假定已經窮盡兩兩親屬關係的所有路徑,所以親屬關係的推理,可以轉化為定義式的檢索,再用合一運算進行定義匹配。但正如上文分析,「大知識庫」的知識表示方法存在理論缺陷,對稍微複雜的親屬關係推理就無法完成。

第二、第三種基於「親屬基元」和「語義特徵」的知識表示方式下,推理過程相似,主要包括連接、化簡、匹配定義等。以陳振宇等人的研究為例,親屬關係推理過程大致如下:

輸入:格式為兩個前提條件和一個提問,如「已知老張是張三的父親,翠花是張三的嬸嬸,問老張和翠花是什麼關係」。

連接:推理時先將「父親」和「嬸嬸」轉化為定義式並連接,形成親屬關係推理表達式。

擴展:調用輔助規則,擴展推理表達式的性別、長幼次序、唯一屬性等。

化簡:調用化簡規則,簡化親屬關係表達式,以便匹配親屬關係的定義。

匹配:使用合一運算進行定義匹配,完成親屬關係推理的任務。

陳振宇等研究者列出了基於語義特徵的親屬關係推理的7條輔助規則和4條化簡規則。但是問題在於:

首先,無法證明這些規則是足夠的、完備的,即不能保證這些規則能解決所有可能的推理。事實上,這些規則並不完善。例如,化簡規則8「夫妻—子女定理」,原規則是husband(x, z1) ∧ child(z1, y) → child(x, y),表示若x叫z1丈夫,z1叫y孩子,則x叫y孩子;該規則輸出部分不完整,應該修改為husband(x, z1)∧ child(z1, y) → child(x, y) ∨ child(z1, y),表示若x叫z1丈夫,z1叫y孩子,則x叫y孩子,或者z1叫y孩子。兩者都將husband關係化簡了。化簡規則的結果部分缺少了一個分支,會導致有時候無法推理出正確結果。

其次,親屬關係的語義特徵有四類,而親屬關係表達式卻把它們放在一個層次,編寫規則時,對不同類型的語義特徵考慮欠周密。例如,推理中缺少如下這條規則:已知生育出孩子x的兩個結點是y和z,若y和z的性別相同,則y和z是同一個人(父親或母親),若y和z性別不同,則y和z是夫妻。這條規則是需要性別屬性和化簡關係密切配合的,文中的知識表示描寫這種規則比較困難,以致造成了遺漏。

但是,即使補充了以上兩條規則,仍然不能確認推理規則是否完備。基於以上系統的分析,本文擬從理論上解決親屬關係的知識表示問題,並保證規則完備。

二、親屬關係推理的複雜性

(一)親屬稱謂系統的複雜性

從語言的詞彙系統看,親屬稱謂詞的語義關係是一種特殊的詞彙聚合關係,與一般的詞彙語義關係不同。

1.同義關係,包括語義完全相同的等義詞,例如「電腦—計算機」,和語義中某一義素(sememe)相同的近義詞,例如「美麗—漂亮」。主要描述名詞、動詞、形容詞和副詞的語義聚合關係。

2.反義關係,包括概念意義在邏輯上有矛盾關係的詞,例如「男—女」,和概念意義上處於反對關係的兩個極端的詞,例如「大—小」。主要描述形容詞、副詞、區別詞的語義聚合關係。

3.上位—下位關係,指兩個詞具有類(大)和種(小)關係,如「汽車—越野車」。主要描述名詞的語義聚合關係。

4.整體—部分關係,包括三類:整體—組件,例如「汽車—車輪」;整體—成分,例如「空氣—氧氣」;整體—成員,例如「船隊—船」。主要描述名詞的語義聚合關係。

5.方式關係,指一個動詞是另一個動詞的完成方式,例如「密談—說話」,密談是說話的一種方式。主要描述動詞的語義聚合關係。

6.蘊涵關係,指一個動詞是另一個動詞的前提,例如「離婚—結婚」,離婚必須以結婚為前提。主要描述動詞的語義聚合關係。

這些詞彙語義關係的特點是,都可以通過集合來解釋。一個詞是其所有語義的集合,兩個詞的關係本質上就是兩個詞的語義集合的關係。同義關係表示兩個詞語的語義集合基本相同,上位—下位關係表示兩個詞的語義集合是真包含關係,整體—部分關係表示兩個詞之間是集合和元素的關係。通過這些詞彙語義關係可以將詞語聚合起來,例如通過上位—下位關係構建生物譜系樹,通過整體—部分關係描述物質的構成,等等。

雖然某些親屬關係也可以用上述語義關係來描述,例如「父親—母親」在雙親的範圍中是反義關係,「雙親—母親」可以看作上下位關係,「媽媽—母親」是同義關係,「家族—父親」是整體部分關係。但是,這些詞彙語義關係不能全面解釋親屬稱謂詞之間所有的語義關係,例如無法解釋諸如「父—子」、「兄—妹」等的關係。究其原因,親屬稱謂詞之間的語義關係不適合用集合來解釋。親屬稱謂詞的語義不是獨立存在的,詞與詞的關係需要有「參照體」。比如,「父親」的釋義是「有子女的男子」,「兒子」的釋義是「男孩子(對父母而言)」,可以看出,「父親」是通過「子女」來定義的,「兒子」是通過「父母」來定義的,互為參照體,只有「男性」這一語義是獨立存在的,不需要參照體。這只是兩個詞的關係,整個親屬稱謂系統涉及的親屬稱謂詞眾多,需要協調生育關係、婚姻關係,還有性別屬性和長幼屬性等。複雜性由此而來。親屬稱謂系統對人類認知能力的要求遠超一般詞彙語義關係。喬姆斯基認為,親屬稱謂系統具有很多數學系統的性質;理解親屬關係需要用上人類解決形式問題的算術能力。

親屬關係是最複雜的社會關係之一,其他社會關係或者社會關係網絡都可以從親屬關係中得到簡化。研究親屬關係推理,將對解決其他社會關係推理問題有莫大助益。

(二)親屬稱謂系統的人類學問題

親屬稱謂系統不僅是語言學的問題,其基礎更是人類學問題。人類學研究指出,親屬稱謂本質上是對血緣關係的稱呼,是人類利用語言對血緣關係歸納和分類。這種歸納和分類體現在,親屬稱謂與血緣關係不是一一對應的,人們會將某些血緣關係的親屬歸為一類,用同一個親屬稱謂詞來稱呼。受社會文化的影響,不同的語言對血緣關係的歸納和分類不同,由此形成不同的親屬稱謂制度。

根據人類學的研究,世界上主要有六大親屬稱謂制度:愛斯基摩制、夏威夷制、易洛魁制、克羅制、奧馬哈制和蘇丹制。例如,愛斯基摩制對父親的兄弟和母親的兄弟用同一個親屬稱謂稱呼,父親的姐妹和母親的姐妹也用同一個親屬稱謂稱呼;夏威夷制、易洛魁制、克羅制、奧馬哈制都將父親和父親及母親的兄弟用同一個親屬稱謂稱呼,將母親和父親及母親的姐妹用同一個親屬稱謂稱呼;蘇丹制是稱謂最精確的,它將父親的兄弟和母親的兄弟都分別稱謂,漢語的親屬稱謂系統屬於這種稱謂制度。

然而,現實的複雜性遠不止此。以上討論的僅是傳統的由夫妻共同生育孩子所構成的血緣關係而形成的親屬稱謂系統。隨著現代婚姻觀念的變化和科學技術的進步,親屬關係和親屬稱謂日趨複雜。例如由於離異和再婚,出現了繼父、繼母、繼子、繼女、前妻、前夫等親屬關係。又如試管嬰兒、領養等新情況的出現,使血緣關係變得複雜,有學者甚至認為,至少需要10個不同名詞來涵蓋「母親」和「父親」的概念,包括:基因母親、孕育母親、養母、完全的母親、基因—孕育母親、基因—養育母親、孕育—養育母親、基因父親、養父和完全的父親。而且,每個這些親屬關係背後,都各自有一個巨大的血緣關係網絡,雖然他們的親屬稱謂不一定有區別,但血緣關係與傳統的血緣關係是有差別的。親屬關係推理系統應該根據新的變化改進設計,至少,可以在系統設計時留有接口,為可能的親屬稱謂新情況提供擴展的可能性。

(三)親屬關係推理的邊界

親屬關係推理的邊界有兩層含義,一是漢語親屬稱謂系統本身的邊界,二是親屬關係推理系統定義的邊界。

就親屬稱謂系統本身而言,親屬稱謂詞的數量總是有限的,這就是親屬稱謂系統的邊界,超過這一邊界的親屬我們無法直接稱呼。漢語的親屬稱謂究竟有多少種呢?《親屬稱呼辭典》中列舉了10大類親屬333小類的親屬稱謂,有的小類還有細分,在日常的使用中,這是超出人的記憶能力的。有些親屬稱謂由於距離過遠,已經很少使用,例如「堂叔伯祖母」指「祖父的堂弟媳或堂嫂」等。生活中當然不會涉及這麼海量的親屬稱謂。可是,即使我們把這些親屬稱謂都用上,仍然無法證明,這些就是漢語親屬稱謂的全部。漢語親屬稱謂系統的邊界本身是一個模糊的概念。

就推理系統而言,每個親屬關係推理系統都存在一個親屬稱謂定義範圍,這是親屬關係推理系統的邊界。例如若系統中親屬稱謂定義代際最高的是「曾祖父」的話,那麼「曾祖父的父親」,必然無法推理出來,這是親屬關係推理系統的限制。

親屬關係推理系統雖然沒有必要把《親屬稱呼辭典》中333個親屬稱謂都進行定義,但是,要保證在定義範圍內的親屬關係推理正確,就要求我們設計一個定義的方法,能夠形式化地界定親屬定義的範圍,使親屬稱謂能夠由近及遠,無遺漏地逐一排列和定義。例如,如果系統只定義了「叔叔」卻沒有定義「伯父」,就會造成「父親的弟弟」有定義,「父親的哥哥」沒定義的奇怪現象。

這是以往的研究沒有重視的問題。

(四)親屬關係推理的複雜性

親屬關係推理的困難之處在於需要同時計算生育關係、婚姻關係以及性別、長幼等屬性。主要包括三個方面:是否需要計算多種關係;是否以「自己」為視角;是否要處理親屬關係結點。

當只需要協調一種關係的時候是相對容易的,例如容易推理出「我父親的祖父的兒子的孫子」有可能是「我」,這裡只涉及生育關係。若推理中涉及多個關係,就困難很多,如推理「我舅母的公公的外孫」有可能是「我」,就不那麼容易了,該例涉及生育關係和婚姻關係。

進一步,如果不是以「我」為中心的推理,將更加困難。例如以下例子:已知大張是張三的叔叔,翠花是張三的嫂子。問翠花是大張的什麼人?

這個問題可以轉換為「張三的叔叔叫張三的嫂子叫什麼?」推理時,需要把視角轉移到「大張」上。而且涉及眾多親屬結點,需要一一簡化。

在親屬聚會的場景中,以「我」為中心的親屬關係推理比較常見;而在文本中,以他人為視角的親屬關係推理才是常態。有時甚至需要推理多於兩個已知條件的情況。例如:已知老張是張三的外祖父,翠花是張三的嫂嫂,李四是翠花的公公,問老張是李四的什麼人?這裡涉及多種親屬關係,以他人為視角且涉及多個親屬結點,要推理出「老張是李四的嶽父」是一件非常複雜的事情。

從以上這些分析可見,雖然親屬關係推理是生活中常見的邏輯或算術應用,但是親屬關係的推理系統的研製卻並不簡單,對開發者的知識結構(簡稱「認知」)和計算機科學技術知識(簡稱「算力」),都有較高的要求。因此,實用化的親屬關係推理系統的研製,是目前人工智慧和問答機器人開發的典型難題。

三、親屬關係推理的關鍵問題分析

(一)親屬關係推理的實質

所謂親屬關係,要區分兩層含義:一是現實中親屬之間實際的血緣關係,二是稱呼這些血緣關係的親屬稱謂詞。前者是客觀存在的人際關係,後者是一種慣例性的(conventional)語言表達系統。這會造成兩方面的「歧義」:一是同一個親屬詞可以指稱血緣關係不完全相同的兩個人。例如「表弟」,可能是「父親的妹妹(或姐姐)的年紀比我小的兒子」,也可能是「母親的妹妹(或姐姐/哥哥/弟弟)的年紀比我小的兒子」。二是血緣關係相同的兩個人,也可以用不同的稱謂詞。例如,在《親屬稱呼辭典》中僅「父親」的稱呼就收集了不同語體、不同方言、古代和現代等不同稱呼共101種。後一種「歧義」是可以通過人為指定一種說法來消除的,而前一種「歧義」是語言系統和血緣關係不完全匹配造成的,是無法避免的系統性「歧義」。親屬關係推理中更關心這種系統性「歧義」。

我們認為,親屬關係推理的實質是血緣關係的推理;只是在推理的起點以及終點,需要進行血緣關係和親屬稱謂詞的轉換。故親屬關係推理系統應該分為兩部分:一是血緣關係與親屬稱謂詞轉換系統,二是血緣關係推理系統。詳見圖1。後者是推理的核心,跟具體的語言無關;前者則跟具體語言的親屬稱謂系統密切相關。

以往的親屬關係推理研究,往往僅圍繞親屬稱謂詞展開推理,忽略了背後的血緣關係結構,因此造成各種糾葛。以下我們將從分析血緣關係結構的特點著手,設計血緣關係的知識表示;在此基礎上研究血緣關係推理問題,從理論上保證完備性;研究親屬稱謂系統的知識表示以及與血緣關係的轉換問題,從而構造親屬關係推理系統。

(二)血緣關係結構的特點

圖2以「自己」為視角,展示了上下三代人的部分血緣關係的結構圖。單實線表示生育關係,雙實線表示婚姻關係,虛線是兄弟姐妹關係。為了控制問題的複雜度,根據人類學的研究,對血緣關係結構作出以下限制。(1)婚姻關係方面,以人類社會採用較多的一夫一妻制為準,婚姻關係只能有兩個人,且為一男一女。同時,按照法律不考慮近親婚姻和重婚的情況。(2)生育關係方面,僅考慮傳統夫妻雙方生育孩子為準,暫不考慮領養或他人提供基因的試管嬰兒等情況,即暫不考慮基因父/母、生育父/母、養育父/母是不同人的情況。(3)兄弟姐妹關係方面,暫不考慮再婚同父異母或同母異父造成的兄弟姐妹關係,後文將把這些情況視為親屬關係推理系統的擴展。

因此,圖2是最基本的血緣關係結構,該血緣關係結構是一個非常受限的圖結構,具有以下特點:

1.血緣關係結構具有遞歸性。血緣關係中,最基本的構造單位是以「父親」、「母親」和「孩子」結點通過婚姻關係和生育關係構成的結點組,我們稱為血緣關係結構的基礎單元(下文簡稱「基礎單元」)。為了推理簡便,有時候會引入兄弟姐妹結點(如圖2方框部分)。整個血緣關係結構,就是由一個個基礎單元相互疊加而形成的。血緣關係結構的遞歸性是血緣關係推理的基礎。

2.每個結點跟其他結點連接的邊的數量非常有限。婚姻關係方面,最多1條婚姻關係的邊。生育關係方面,每個結點的入度(引入結點的邊的數量)最多為2(父親母親),出度(從結點引出的邊的數量)有限。為了推理方便,還可能有若干兄弟姐妹關係邊。而且,兩個結點之間只可能有一種關係(否則屬於「亂倫」的情況)。

3.每個結點最多處於兩個血緣關係基礎單元中。在一個基礎單元中作為「父親或母親」,在另一個基礎單元中作為「孩子」。

4.生育關係和被生育關係不對應。從後輩往前輩看的被生育關係,是一個二叉樹結構,每個人最多只有兩個父母;從前輩往後輩看的生育關係,則是一個多叉樹結構,每個人可以有多個孩子。

以上這些血緣關係結構的特點,大大限制了血緣關係結構圖的複雜度,保證了血緣關係結構的簡單性和有序性,使得人們面對錯綜複雜的血緣關係結構,依然能夠認知、歸納並快速地進行推理。血緣關係結構是親屬關係推理系統的基礎。

(三)血緣關係結構的知識表示

由於血緣關係結構是基於基礎單元來遞歸的,因此我們只要充分描述一個基礎單元內所有的關係,就可以利用其遞歸性表示所有基礎單元外的血緣關係。在一個基礎單元內的血緣關係描述有多種方法,相比以往僅用husband和child來描述,我們有如下幾個改變:

1.用四種關係來描述基礎單元。分別用字母m、b、p、c代表婚姻關係、生育關係、被生育關係和兄弟姐妹關係(如圖3)。婚姻關係(m)兩端是一一對應的,方向由性別決定;生育關係(b)和被生育關係(p)是不對稱的,故用兩個函數來描述,可以通俗地稱孩子(b)和父/母(p);兄弟姐妹關係(c)是為了便於推理而設置,否則每次表達「我的兄弟姐妹」時都要增加推理分支,分化為兩個表達式「我母親的孩子」或「我父親的孩子」,而且要設置標記(如self)區分「我」和「我的兄弟姐妹」結點,令推理複雜度大大增加。我們將這四個關係稱為基本血緣關係。

2.性別屬性和長幼屬性方面,我們直接把它們作為基本血緣關係的參數,即m(x), p(x), b(x)和c(x, y)。x表示性別屬性,y表示長幼屬性。性別屬性值有1, -1, 0分別表示男、女、未知。長幼屬性值有1, -1, 0分別表示長、幼、未知。

3.不再出現結點標記。以往知識表示中,結點標記的出現大大影響推理效率,實際上沒有必要,結點標記所攜帶的性別屬性和長幼屬性信息可以融入基本血緣關係中,這樣使屬性信息成為基本血緣關係的參數,不再與基本血緣關係處於表達式的同一平面,方便血緣關係推理運算。

4.增加起始標記結點s(x),x為性別屬性。該標記用於表達親屬稱謂中的「自己」。

5.基本血緣關係用「+」號連接,「+」號前後順序不可交換。以此替代以往知識表示中順序無關的「∧」號,強調基本血緣關係的順序的重要性。

用此知識表示方法,則「母親」表示為:s(0)+p(-1),即「我(性別未知)+父/母(女)」;「叔叔」表示為:s(0)+p(1)+c(1,-1),即「我(性別未知)+父/母(男)+兄弟姐妹(男,幼)」。我們將這樣表達式稱為「親屬關係式」。形式化描述為:R = s(x0) + f1(x1, y1) + f2(x2, y2) + … + fn(xn, yn)。

R稱為親屬關係式。其中,s是起始標記,f1, f2, …,fn是四種「基本血緣關係」之一,x1, x2, …,xn是性別屬性,y1, y2, …,yn是長幼屬性。x0, x1, x2, …,xn, y1, y2, …, yn∈{1, -1, 0}。

(四)血緣關係推理的化簡及完備性

所謂血緣關係推理的化簡,就是在血緣關係結構中找到兩個結點的最短路徑。在分析已有親屬關係推理系統時,我們曾指出陳振宇等提出化簡規則不滿足親屬關係推理的完備性。現在基於血緣關係結構,我們可以利用血緣關係結構的特點來完成化簡。我們發現,血緣關係的化簡存在以下四個特徵,可以保證化簡的完備性。

1.同一個基礎單元內的多個關係,總可以化簡為一個關係。例如,c+p「兄弟姐妹的父/母」可以化簡為p「父/母」;p+m「父/母的配偶」可以化簡為p「父/母」。

2.不同血緣關係基礎單元的兩個關係,不能被化簡。例如,p+p「父/母的父/母」,m+c「配偶的兄弟姐妹」,不在一個基礎單元內,均不能化簡。

3.所有的表達式,總能分解成兩個關係之間的化簡。也就是說,只要相鄰的兩個關係化簡到最簡,就能保證整個親屬關係式化簡到最簡。例如,要化簡b+c+p「孩子的兄弟姐妹的父/母」,利用其遞歸性,可以先把b+c「孩子的兄弟姐妹」化簡為b「孩子」,再代入原公式,把b+p「孩子的父/母」化簡為s「自己」或m「配偶」。

4.本文定義的基本血緣關係共有4個,兩兩排列組合有16種,其中8種落在同一基礎單元內,可以化簡,包括m+m、m+b、b+p、b+c、p+m、p+b、c+p、c+c;8種落在基礎單元外,不可化簡,包括m+p、m+c、b+m、b+b、p+p、p+c、c+m、c+b。

以上四個特徵說明,第一,血緣關係的化簡只可能發生在一個基礎單元內,且只需要兩兩化簡;第二,我們通過無遺漏窮盡了一個基礎單元內所有血緣關係可以化簡的情況,保證了基礎單元內化簡的完備性;第三,多個基本血緣關係的親屬關係式,只需要利用血緣關係的遞歸特性,重複兩兩化簡的步驟,即可保證化簡結果最簡。

(五)親屬稱謂的特點

從血緣關係結構圖上看,所謂親屬關係,就是「自己」結點到另一個結點的關係。親屬關係的定義是按照「自己」到另一個結點所經過的基本關係來定義的。例如,在「我」跟「兒媳」兩個結點之間,經過了「兒子」這個結點,對應了生育關係和婚姻關係這兩段關係,因此「兒媳」定義為「我的兒子的妻子」。從血緣關係結構圖上考察親屬稱謂系統,我們可以發現它有如下三個特點:

1.親屬稱謂系統具有非遞歸性。親屬稱謂系統是一個以「自己」為中心的對親屬關係的命名系統。相比血緣關係的遞歸性,親屬稱謂是非遞歸的,不能形成某種基本的結構單元。

2.親屬關係稱謂具有單繼承性。如果把生育關係看作單從父親或者母親那裡繼承,那麼血緣關係的圖結構就會簡化為嚴格的樹結構。比如中國人的族譜,一般採用父親單一生育關係的表示形式,從而形成了樹結構,配偶只是作為一種屬性的附加。我們對親屬關係的稱謂,就是按照單一生育關係來命名的。即命名時,僅考慮父親或母親的生育關係。比如「兒子」,只需定義為「我的孩子」;而無需定義為,「我和配偶」共同生育的「孩子」。

3.親屬稱謂詞的定義採用最短路徑的原則。即親屬稱謂的定義時,總是使用最少的基本關係來描述血緣關係結構中兩個結點的關係。

(六)親屬關係推理系統的邊界問題

親屬關係推理系統的邊界,就是血緣關係結構圖上的親屬稱謂的命名範圍。親屬稱謂的命名範圍可大可小,不同語言的命名範圍和方式不一樣,不同精度的推理系統也不一樣。因此,需要一個可控的方法來界定推理系統的邊界。

前文提出的親屬關係式的知識表示方法,可以幫助我們無遺漏地排列出所有的親屬關係來,其步驟是:

1.按照基本血緣關係的數量排列親屬關係式,先排只有一個基本血緣關係的親屬關係式,再排含有兩個基本血緣關係的親屬關係式,直至無窮。

2.對每個基本血緣關係個數既定的親屬關係式,按照四種基本血緣關係進行全排列,即對於基本血緣關係個數為n的親屬關係式來說,可能的排列有n4個;排列後,再刪除任何兩兩基本血緣關係可化簡的親屬關係式。

3.對每個基本血緣關係排列既定的親屬關係式,按照每個基本血緣關係的屬性的取值範圍{1, -1, 0}逐一取值,形成屬性值的全排列。

由此形成了所有親屬關係的全排列。例如:m(1), m(-1), m(0), p(1), p(-1), p(0), …, m(1)+p(1), m(1)+p(-1), m(1)+p(0), m(-1)+p(1), …

有了無遺漏的親屬關係排列的方法,在確定親屬關係推理系統邊界時,就可以做到邊界可控。也就是說,我們可以清楚地知道推理系統對哪些血緣關係進行了親屬稱謂命名,更重要的是,我們可以清楚地知道對哪些血緣關係沒有進行親屬稱謂命名,這是以前的推理系統所做不到的。

以此為基礎,系統就可以根據需求制定邊界的策略。例如, 我們可以規定,推理系統親屬稱謂的邊界是所有含有4個基本血緣關係的親屬關係式;或者規定,推理系統的邊界是三代以內的血親等。 但後者要求我們用親屬關係式對親屬關係相關概念進行形式化描述。

(七)親屬關係相關概念的形式化描述

利用親屬關係式,我們可以對已有文獻中有關親屬關係的相關概念進行形式化的界定。概念的定義我們按照張偉等編寫的《親屬法學》為例,討論血親、姻親、直系親、旁系親、行輩等概念。

1.血親。血親指以血緣為紐帶而聯絡的親屬,包括生物學意義上的自然血親和法律意義上的擬制血親。按照親屬關係式,自然血親就是各基本血緣關係中都不含婚姻關係(m)的親屬關係式。擬制血親需要對親屬關係式進行擴展,我們後文再討論。

2.姻親。姻親指以婚姻為中介而聯絡的親屬,但不包括配偶。包括配偶的血親、血親的配偶,以及配偶的血親的配偶。

按照親屬關係式,配偶的血親可以表達為:基本血緣關係個數大於1,並且有且只有第一個基本血緣關係是婚姻關係的親屬關係式。

血親的配偶可以表達為:基本血緣關係個數大於1,並且有且只有最後一個基本血緣關係是婚姻關係的親屬關係式。

配偶的血親的配偶可以表達為:基本血緣關係個數大於2,並且有且只有第一個和最後一個基本血緣關係是婚姻關係的親屬關係式。

3.直系親。直系親包括直系血親和直系姻親。直系血親指具有直接血緣關係的親屬,即生育自己和自己生育的上下各代血親。按照親屬關係式,可以表達為:只含有生育關係(b)或被生育關係(b)的親屬關係式。

直系姻親是以婚姻為中介,配偶雙方根據一方配偶預期親屬間的直接血緣關係而對另一方加以類推適用的。包括配偶的直系親屬(兒媳、女婿等)和直系親屬的配偶(公婆、嶽父母等)。按照親屬關係式,可以表達為:最後一個基本血緣關係為婚姻關係,其他血緣關係為生育關係或被生育關係的親屬關係式;或第一個血緣關係為婚姻關係,其他血緣關係為生育關係或被生育關係的親屬關係式。

4.旁系親。旁系親包括旁系血親和旁系姻親。旁系血親指具有間接血緣關係的親屬,即指和己身同出一源、除直系血親以外的所有和己身有血緣關係的血親(兄弟姐妹、叔、伯、姑等)。按照親屬關係式,可以表達為:基本血緣關係中含有至少一個兄弟姐妹關係(c)但不含婚姻關係的親屬關係式。

旁系姻親指以婚姻為中介,配偶雙方根據一方配偶與其親屬間的間接血緣關係而對另一方配偶加以類推適用的,分為旁系血親的配偶,配偶的旁系血親,配偶旁系血親的配偶。

按照親屬關係式,配偶的旁系血親表達為:基本血緣關係個數大於1,且第一個基本血緣關係是婚姻關係,而且其他基本血緣關係含有至少一個兄弟姐妹關係但不含婚姻關係的親屬關係式。

旁系血親的配偶表達為:基本血緣關係個數大於1,且最後一個基本血緣關係是婚姻關係,而且其他基本血緣關係含有至少一個兄弟姐妹關係但不含婚姻關係的親屬關係式。

配偶的旁系血親的配偶表達為:基本血緣關係個數大於2,且第一個和最後一個基本血緣關係是婚姻關係,而且其他基本血緣關係含有至少一個兄弟姐妹關係但不含婚姻關係的親屬關係式。

5.行輩。行輩指輩分,根據親屬的世代而劃分。以己身為參照可以劃分為長輩親屬、晚輩親屬和同輩親屬。按照親屬關係式,可以表達為:若親屬關係式中生育關係(b)的數量多於被生育關係(p),則是晚輩親屬;若生育關係數量等於被生育關係數量,則是同輩親屬;若生育關係數量小於被生育關係數量,則是長輩親屬。

其他一些相關的親屬關係概念都能通過親屬關係式形式化表達,不再一一列舉。

(八)親屬關係式的擴展

隨著社會的變化和發展,親屬關係已不限於直接的血緣關係和一般的婚姻關係,例如同父異母、同母異父、繼子、繼女、繼父、繼母、前妻、前夫等親屬。為了適應新情況,我們可以擴展親屬關係式。

對於婚姻關係(m),需要擴展一個參數「是否現任」,取值為{1,-1,0},1表示現任,-1表示前任,0表示未知,婚姻關係表示為:m(性別, 是否現任)。

對於被生育關係(p),需要擴展一個參數「是否血親」,取值為{1,-1,0},1表示血親,-1表示非血親,0表示未知,被生育關係表示為:p(性別, 是否血親)。

對於生育關係(b),需要擴展一個參數「是否血親」,取值為{1,-1,0},1表示血親,-1表示非血親,0表示未知,生育關係表示為:b(性別, 是否血親)。

對於兄弟姐妹關係(c),需要擴展兩個參數「是否同父」、「是否同母」,取值為{1,-1,0},1表示同父/母,-1表示非同父/母,0表示未知,生育關係表示為:c(性別, 長幼, 是否同父, 是否同母)。

親屬稱謂定義和化簡的框架都不需要變化。只是如此一來,為保持完備性,定義親屬稱謂時會迫使人們思考一系列倫理問題,比如「前夫的親屬是否需要稱呼?怎麼稱呼?」等等。

本節主要分析了親屬關係推理中的關鍵問題,得出以下主要結論:親屬關係推理的關鍵是血緣關係的推理。血緣關係結構圖是一個以「父」、「母」、「孩子」組成基礎單元的遞歸的圖結構。親屬稱謂系統則是以「我」為中心的非遞歸結構。親屬稱謂是依據一個結點到另一個結點的血緣關係最短路徑來定義的。根據血緣關係結構的特性,我們證明了血緣關係化簡的完備性。利用婚姻關係、生育關係、被生育關係、兄弟姐妹關係作為四個基本血緣關係,設計了親屬關係表達式。該表達式有助於確定推理系統的邊界,並且能夠形式化描述親屬關係的相關概念,經過擴展,還能夠容納新的親屬關係。

四、親屬關係推理系統的構建與實現

基於第一、二、三節的分析可知,親屬關係的推理可以轉化為血緣關係結構圖上的匹配和推理問題,這樣不僅能保證推理的正確性,還能使推理的邏輯和步驟更直觀簡明。本節將描述親屬關係推理系統的構建和推理過程的實現。本節以下列推理問題為例:已知大張是張三的叔叔,翠花是張三的嫂子。問翠花是大張的什麼人?

(一)前提:構建血緣關係結構圖

在推理之前,系統需要構建完整的血緣關係結構圖,並在圖上對整個親屬稱謂詞進行命名。不同語言,可採用不同的命名體系,本節以漢語為例,血緣關係結構圖如圖2。

(二)基本操作

該系統的基本操作有四項:(1)定位。該操作指在血緣關係結構圖中,找到指定親屬稱謂的對應結點。(2)匹配。該操作是指根據血緣關係結構圖的結點,匹配相應的親屬稱謂。該操作是定位操作的逆操作。(3)檢索最短路徑。該操作指,當已知兩個結點就是所求的關係時,在血緣關係結構圖中檢索出這兩個點之間的最短路徑。(4)移位。該操作指,已知血緣關係結構圖中兩個結點,以其中一個結點為起始點,另一個結點為終點,將起始點移到指定位置,並計算出終點的位置,保證兩個結點的血緣關係不變。

整個親屬關係推理的流程如圖4所示:

(三)推理舉例

1.定位

題幹「大張是張三的叔叔」和「翠花是張三的嫂子」均是以「張三」為中心的親屬關係,根據定義操作,在血緣關係結構圖中定位題幹。「叔叔」是p(1)+c(1,-1)「張三的父親的弟弟」。「嫂嫂」是c(1,1)+m(-1)「張三的哥哥的妻子」。定位題幹,是將題幹中所有的親屬關係表達式描述到同一個血緣關係結構圖中。如圖5。

2.檢索兩個所求結點間的最短路徑

所求結點是「張三的叔叔」「大張」和「張三的嫂嫂」「翠花」。找到他們直接的最短路徑,忽略其他結點。可知「翠花」是c(1,1)+b(1)+m(-1)「大張的哥哥的兒子的妻子」。如圖6所示。

3.移位與匹配

因為血緣關係結構是以「父親、母親、孩子」為基礎單元而構成的,圖中各個結點是同構的。所以,兩個結點同時移位並不會影響結點之間的關係。問題所求的是「翠花」與「大張」的關係,我們以「大張」為中心,將「大張」移至血緣關係結構圖「我」的位置,再根據兩結點的關係,算出「翠花」的位置。從步驟(2)可知,「翠花」是c(1,1)+b(1)+m(-1)「大張的哥哥的兒子的妻子」。執行匹配定義的操作,求得,「翠花」是「大張」的「侄媳」(見圖7)。

若待匹配的結點已經超出了親屬稱謂系統定義的邊界,則以系統最大邊界作為中間結果,並保持該中間結果結點以及待匹配結點的關係,進行移位操作,將中間結果結點移到中心位置,進行二次匹配。例如,若稱謂系統的定義中只有「侄子」,那麼就將「侄子」作為第一次匹配的中間結果,所求變成了「我的侄子」與「翠花」的關係,然後將「侄子」移到血緣關係結構圖中心的位置,即可求得,「翠花」是「我的侄子的妻子」。

結語

本文在分析現有親屬關係推理系統的基礎上,指出現有系統存在的缺陷,揭示其根本原因是:缺乏對親屬關係及其形式結構方面的理論探討。通過深入分析親屬關係的複雜性,我們發現:(1)親屬關係推理的實質是血緣關係的推理;(2)血緣關係結構圖是一個以「父、母、孩子」為基礎單元的遞歸的圖結構;(3)親屬關係的定義是按照血緣關係結構圖中最短路徑給出的;(4)利用婚姻關係、生育關係、被生育關係、兄弟姐妹關係作為四個基本血緣關係,重新設計了親屬關係表達式;(5)利用親屬關係式能夠確定系統邊界,以及形式化描述親屬關係的相關概念,經過擴展,還能夠容納新的親屬關係。

在此基礎上,筆者構造了基於血緣關係結構圖的親屬關係推理系統,利用定義、匹配、檢索最短路徑和移位四項操作,就能夠完成複雜的親屬關係推理任務。跟以往的親屬關係推理系統相比,該推理系統的邏輯和步驟更加直觀簡明,保證了親屬關係推理的完備性與準確性。

值得說明的是,本文是基於血緣關係這一人類共有的關係構建的,因此不僅適用於漢語親屬關係的推理,也可適用於其他語言的親屬關係推理。其他語言進行親屬關係推理時,親屬關係知識表示和推理規則均不變,只需要修改親屬稱謂詞的定義,可以輕易地實現該語言的親屬關係推理。本文的親屬關係推理,實際上是利用血緣關係構造了一個親屬關係概念的語義空間,該語義空間有四個維度,實現了語義空間內的運算。這為研究其他社會關係推理問題,提供了借鑑。

〔責任編輯:莫斌〕

來源:《中國社會科學》2019年第11期 P25—P43

相關焦點

  • KuAI平臺 | 模型在線推理系統的高可用設計
    本文提出一種分布式機器學習模型在線推理系統的完整技術方案,該系統主要採用CPU/GPU 計算節點來提供推理任務的基礎算力,通過Docker容器技術封裝、打包模型推理任務,將不同服務的運行環境完全隔離,並藉助Kubernetes進行服務編排,提供服務的分布式容災和資源的彈性伸縮功能,同時結合模型倉庫、容器鏡像倉庫、系統/服務狀態監控、服務註冊/訂閱、可視化面板等功能模塊使算法模型與服務架構解耦
  • 業界 | 英特爾發文Caffe2在CPU上的性能檢測:將實現最優的推理性能
    大多數深度學習工作負載同時包含訓練和推理。其中,訓練通常需要幾個小時或幾天才能完成,而推理通常需要幾毫秒或幾秒,並且通常是更大流程的一個步驟。雖然推理的計算強度遠低於訓練,但推理經常涉及更大的數據集。因此,與推理所需的計算資源總量相比,訓練所需的計算資源總量相形見絀。值得指出的是,絕大多數推理工作負載都運行在英特爾至強(Xeon)處理器上。
  • onnx實現對pytorch模型推理加速
    ONNX Runtime是適用於Linux,Windows和Mac上ONNX格式的機器學習模型的高性能推理引擎。對於硬體供應商來說,也可以簡化神經網絡計算的複雜度,實現優化算法。使用onnx推理預測CNN-RNN-CTC 實現手寫漢字識別yolo3 檢測出圖像中的不規則漢字同樣是機器學習算法工程師,你的面試為什麼過不了?
  • 無人系統自主性研究綜述
    機器人作為智能體,引發了人們對其能力、自適應能力、共享目標以及人際禮儀的高期望值,這種期望被稱為「社會響應」,儘管人一機之間的關係可能並不十分和諧。人一機交互主要解決六大基礎研究問題①(1)人與無人平臺如何溝通?(2)如何為人與無人平臺之間的工作娛樂或相應的交互關係建模?(3)如何研究並提高人與無人平臺之間的配合度?
  • 首次在手機端不犧牲準確率實現BERT實時推理,比TensorFlow-Lite快近8倍,每幀只需45ms
    由於移動平臺的存儲空間以及計算能力的限制,這些模型很難實現在移動端的部署。因此,在這個邊緣計算越來越重要的今天,如何有效的壓縮這些大模型成為了一個重要的研究課題。 在過去的一年中,為了減少BERT模型的大小,同時保持多個下遊NLP任務的準確性,很多小模型被相繼提出。
  • 國際關係研究中科學方法的缺陷
    但是,這種研究方法在國際關係研究中的運用走向了極端,把其在國際關係研究中的作用誇大到了不適當的程度,突出表現為不顧自然現象和社會現象、自然規律和社會規律的差異,把研究自然現象和自然規律的方法機械照搬到作為社會現象的國際關係研究中來,造成這種研究方法在國際關係研究中出現「水土不服」的問題,致使以科學方法建構起來的理論體系帶有嚴重的理論缺陷,主要表現就是解釋力不足和預測錯誤。
  • 模具零件智能加工工藝設計系統研究
    夏琴香,曾偉國,黃國軍,王亞東.模具零件智能加工工藝設計系統研究[J].工具技術,2021,55(5):43-48.為減少傳統依賴於設計人員的水平與經驗存在的模具零件設計周期長、不適應市場變化、工藝設計不穩定和零件知識獲取困難等缺陷,開發出具有自動下載、自動獲取、自主決策和自主適應等功能的智能加工工藝設計系統,並已成為實現加工工藝設計過程自動化和智能化的研究熱點。相關文獻採用實例推理技術,實現了汽輪機葉片加工工藝設計過程的自主決策。
  • 利用 TensorRT 實現 TensorFlow 低延遲推理
    圖 2:僅在 TensorFlow 中執行推理,以及在 TensorFlow-TensorRT 中使用轉換後的 SavedModel 執行推理時的工作流圖圖 2 顯示了原生 TensorFlow 中的標準推理工作流,並與 TF-TRT 工作流進行了對比。SavedModel 格式包含共享或部署經過訓練的模型所需的所有信息。
  • 攻擊溯源-基於因果關係的攻擊溯源圖構建技術
    但是當前攻擊溯源的研究工作還遠沒有走到這一步,主流的因果關係是挖掘告警或日誌之間的依賴關係。溯源圖是攻擊溯源的基礎,所有的技術均是建立在對溯源圖的分析處理上的。下面將從三個方面介紹攻擊溯源圖的構建:1 終端側的攻擊溯源圖構建方法;2 系統日誌與應用程式日誌關聯溯源圖構建方法;3 網絡側與終端側關聯溯源圖構建方法。
  • 前庭系統與其它神經系統間的關係
    現在我們來一起學習前庭系統與其它神經系統間的關係前庭系統與視覺系統:人在凝視時,需要頭頸穩定不動;追視移動的目標時,需要頭頸穩定的移動,如此捕捉的影像才會清晰。前庭系統將地心引力的強弱信息提供給視覺系統,形成遠近、高低、前後、左右等方位概念,此即「空間視知覺」。
  • 論文推薦 | 複雜海況無人艇集群控制技術研究現狀與發展
    靜態知識圖譜補全是指所需的實體和關係均已存在, 只需要在已存在的實體中補充他們之間的關係。靜態知識補全算法與模型設計密切相關, 即通過模型訓練即可得到不同實體之間的關聯。動態知識圖譜補全是指所需的實體或關係不存在於訓練集中, 需要動態增添、修改或刪除實體以及實體之間的關係。知識推理指從已知的事實出發, 通過已掌握的知識, 歸納出一些新的事實。
  • 大型複雜裝備研發成本控制專家系統
    ,給出專家系統的知識表示及推理機的一種實現方法,最終使得知識庫和推理機得以獨立實現.實現後的系統以知識庫和專家系統相結合的方式對裝備研發成本進行實時監控和預測,對於輸入的問題,系統經過推理後給出相應的參考建議,為成本管理智能化提供可行依據.由於知識庫和推理機是相對獨立實現,因此該系統相對傳統專家系統來說具有更好的可維護性和可靠性.
  • 百度EdgeBoard為AI推理實現更強大的算力
    其中,算力體現著人工智慧(AI)技術具體實現的能力,實現載體主要有CPU、GPU、FPGA和ASIC四類器件。CPU基於馮諾依曼架構,雖然靈活,卻延遲很大,在推理和訓練過程中主要完成其擅長的控制和調度類任務。GPU以犧牲靈活性為代價來提高計算吞吐量,但其成本高、功耗大,尤其對於推理環節,並行度的優勢並不能完全發揮。
  • 一鍵啟動在線推理服務,輕鬆實現在線部署,這有個「煉丹」利器
    今天我們就來講講如何使用飛槳的服務化部署框架 Paddle Serving 來實現第二種部署方式。這時可能會有讀者說了:部署?算了吧,我直接用 python 也能做推理,而且部署太複雜了,都是企業才能幹的事情,與我無關。這位客官慢走!
  • 【CCCF專題】從問答系統看知識智能
    問答系統發展歷程問答系統的研究經歷了幾個階段。從20世紀50~60年代開始,人工智慧科學家就致力於研究基於知識推理的問答系統,其特點是:專家建立知識庫,答案或者從知識庫中檢索得到,或者在知識庫上經過推理得到。推理主要是基於專家制定的啟發式規則進行。代表性系統是美國麻省理工學院開發的數學符號運算系統MACSYMA[1]。
  • 近期必讀的六篇 ICML 2020【因果推理】相關論文
    Nori摘要:機器學習模型,特別是深度神經網絡,已經被證明容易受到隱私攻擊,例如成員關係推理(membership inference),在這種情況下,對手可以檢測到數據點是否被用於訓練黑盒模型。當模型用於預測不可知數據分布時,這樣的隱私風險就會加劇。為了減輕隱私攻擊,我們展示了基於輸入特徵和結果之間因果關係預測模型的好處。
  • 【防務每日快報】多模式開放世界基礎學習和推理系統\諾格獲美空軍兩份合同\諾格再獲日本E-2D預警機合同\泰雷茲空中監視系統
    這一服務將集成包括表示學習、知識圖譜和可解釋人工智慧在內的當前最先進的智能研究,被稱為多模式開放世界基礎學習和推理(MOWGLI)系統。該系統將對視頻和文本等多模式源執行最小監督、聯合常識提取和計算機視覺處理,最終形成一個常識性的知識圖譜,在統一的推理引擎中支持推斷、類比、因果關係、代理等一系列直觀的日常現象。
  • 在NVIDIA Drive PX上利用TensorRT 3 進行快速INT8推理
    研究人員和開發人員必須優化他們的網絡,以確保低延遲推理和能源效率。多虧了NVIDIA TensorRT中新的Python API,這個過程變得更加簡單。圖1所示。TensorRT優化訓練過的神經網絡模型,以生成可部署的運行時推理引擎。TensorRT是一種高性能的深度學習推理優化器和用於深度學習應用程式生產部署的運行時引擎。開發人員可以優化TensorFlow或Caffe培訓過的模型,以生成內存效率高的運行時引擎,從而最大限度地提高推理吞吐量,從而使深度學習對於像自動駕駛這樣的延遲關鍵產品和服務變得切實可行。
  • MLPerf最新AI推理結果出爐:阿里平頭哥單晶片第一
    幾個月前,我們與MLperf推斷工作背後的一位領導David Kanter討論過,將具有截然不同的體系結構的系統進行比較以實現截然不同的部署(在同一平面上的伺服器中,該設備具有旨在在攝像頭或無人機內部進行推斷的設備),這很困難。最新發布的MLperf推理基準測試是代表30多家公司和組織以及200多名工程師和實踐者的努力成果。該團隊的第一次徵集來自14家公司和44個系統的600多個測量數據。