專利英文檢索是很多從業者檢索能力薄弱的一個環節,相信一定會有一部分人對專利英文檢索存在一些困惑,在表達英文關鍵詞時總是讓人感覺很混亂。
·有什麼好用的翻譯軟體可以幫助更全面拓展英文關鍵詞?
·如何用一兩個形式全面表達英文單詞的諸多詞形變換?
·當雙引號「」遇到通配符(*?$)時怎麼辦?
·當英文詞組中可能有「-」的時候怎麼辦?
·如何用幾個簡單的表達方式涵蓋英文詞組所有組合的可能性?
本文筆者就將結合自己的專利英文檢索經驗,針對一些問題介紹一些檢索小技巧,希望能夠對大家有所幫助。
在進行英文關鍵詞拓展時,我們以關鍵詞「電阻」為例,通常會用中文在資料庫裡面檢索,然後看看資料庫中的英文是如何表達該關鍵詞的,像下圖這樣。
這樣做在一定程度上有助於收集表達電阻的多個英文表達,但是會增加人工的閱讀量,需要閱讀很多專利才能收集到較多的「電阻」的英文表達方式。那麼如何提高效率,如何更有助於全面拓展英文關鍵詞呢?這裡筆者推薦一個小工具:一本詞典(http://www.onedict.com/)該工具基本界面如下。
該工具的特點在於其翻譯均是來自於專利文獻、學術論文、科技材料等,且絕大多數是對專利文獻中的英文表達方式的統計,因此準確性相對較高,且該工具會對翻譯結果進行數據統計排名,有助於用戶選擇相關性高的英文表達方式,此外還會提供中文相關聯的關鍵詞,具體如下圖所示。
英文單詞與中文最大的不同就是詞形變換,下面就介紹幾種常見的英文單詞的表達方法:
·幾種常見的單複數的表達形式
①加s的情形:
在Incopat資料庫中,可以用car$一個表達代替car與cars。
釋義:$代表零個或者一個字符。
②加es的情形:
在Incopat資料庫中,可以用bus$$一個表達代替bus與buses,但這也可能帶來一定的噪音,例如該表達涵蓋了busy,那麼為了去掉這個噪音,可以進一步改進為bus$$ not bus?,不過如果這樣表達不如乾脆直接就用bus or buses。
釋義:?代表一個字符。
③變y為i加es的情形:
在Incopat資料庫中,可以用cand$$$一個表達代替candy與candies,但這也可能帶來一定的噪音,去噪方法可以同樣參照上文。
④變f或fe為ves的情形:
在Incopat資料庫中,可以用kin?e$一個表達代替kinfe與kinves。
·同一個單詞的不同拼寫
例如color和colour都是顏色的意思,在Incopat資料庫中可以用colo$r來同時表達上述兩個詞。
·時態、詞根、詞綴變化
時態,詞根,詞綴的變化通常使用*即可,在Incopat資料庫和智慧芽資料庫均適用。*的使用相對簡單,本文不再贅述。
劃重點了,下文將是本文的重點
專利英文檢索的時候,可能會遇到需要用雙引號表達一個詞組的時候,例如「cross link」,但是可能還有「cross linking」、「cross linked」、「cross linkable」等,按照通常思路,一般我們會想到用「cross link*」表示全部情況,但是目前常用的資料庫通常都不支持引號和通配符(*?$)的同時使用,那面對這種情況我們怎麼辦?有一種常規解決辦法:我們可以把cross與link的所有組合形式全列出來,像這樣「cross link」 or 「cross linking」 or 「cross linked」 or 「cross linkable」。除此之外還有「cross links」 or 「cross linker」 or 「cross linkers」 or 「cross linkability」,那會不會還有「cross linkabilities」?
即使真的能夠把所有的可能性都羅列出來,這也會帶來一個問題,那就是我們要面對一個複雜的基本檢索要素表,後面還要面對冗長的檢索式,帶來的檢索感受可能也不太好。因此,筆者總結了一種簡單的表達方式,具體如下:
·智慧芽資料庫中的表達方式:
(cross $PRE0 link*)
釋義:$PREn兩個限定位置順序的關鍵詞之間間隔不超過n個單詞;
如果cross和link是沒有位置關係的,那麼可以用下面的表達方式:
(cross $W0 link*)
釋義:兩個無位置順序的關鍵詞之間間隔不超過n個單詞或n個中文字;
·Incopat資料庫中的表達方式:
(cross (0w) link*)
釋義:w檢索的每個單詞均已指定順序。如果前加數字,則代表在兩個關鍵詞之間插入0~n個單詞;
如果cross和link是沒有位置關係的,那麼可以用下面的表達方式:
(cross (0n) link*)
釋義:n檢索包含指定檢索詞且詞序任意的記錄。如果前加數字則代表兩個關鍵詞之間插入0~n個單詞;
英文詞組的表達在英文中經常可能帶有「-」符號,例如cross-link、cross-linking、cross-linked、cross-linkable等,此時應該如何表達?
·智慧芽資料庫中的表達方式:
字符「-」位於單詞之間的時,智慧芽是將其作為正常的字符解釋的,因此上述情況在智慧芽中可以用cross-link*全部表達。
·Incopat資料庫中的表達方式:
字符「-」位於單詞之間的時,系統會將其處理為空格,即cross-link等同於「cross link」,因此上述情況在Incopat中可以用(cross (0w) link*)全部表達。
英文詞組有多少種可能的組合方式呢?想必很多人在檢索的時候也都會被各種組合方式所折磨吧,還是以「cross link」為例,在專利文獻中的詞組組合方式應該主要有三種:「cross link」、cross-link、crosslink,再加上各種時態、詞根、詞綴的變化,組合方式就更多了,前文第4節就列舉了9種變化,如果再乘以3,那就是27種變化,而且還不一定能夠窮盡,顯然我們不能把這27種情形全部列到檢索要素表中,綜合前文的表達方式,現給出較為理想的英文詞組的全部組合方式的表達方式。
·智慧芽資料庫中的表達方式:
(cross $PRE0 link*) or cross-link* or crosslink*
·Incopat資料庫中的表達方式:
(cross (0w) link*) or crosslink*
上述的表達方式相對就比較簡潔了,兩三種表達方式就能夠涵蓋眾多英文詞組組合的可能性,檢索更加全面,檢索效率也更高。
以上是筆者個人在專利英文檢索過程中總結的一些經驗,如果有錯誤或不當之處,請及時聯繫筆者修改或刪除,歡迎業內同仁探討、交流、指正。