作者 | 吳雪健 王玉姣 陳彬 江蘇瑞途律師事務所
(本文系知產力獨家首發的稿件,轉載須徵得作者本人同意,並在顯要位置註明文章來源。)
(本文3250字,閱讀約需7分鐘)
摘要:在進行專利信息的檢索和調研的過程中,化學結構式的數位化檢索是醫藥化工領域專利信息檢索重要手段。由於具有化學結構檢索的商業資料庫價格較高,使得許多企業不能及時有效地進行化學結構的專利檢索。本文篩選出幾種具有化學結構檢索功能的免費資料庫,為採用化學結構檢索醫藥化工專利提供幫助和參考。
關鍵詞:化學結構;專利檢索;資料庫;免費
01 化學結構信息檢索的重要性
專利信息的檢索和利用在醫藥化工領域技術調研、新產品開發和實施專利保護中有著重要的作用;醫藥化學領域行業,對專利信息的檢索和利用已關乎到企業發展的戰略層面。在進行專利信息的檢索和調研的過程中,一般領域專利檢索常採用關鍵詞和分類號進行檢索,而醫藥化工領域的專利檢索除了採用關鍵詞和分類號進行檢索,還可以採用化學結構信息進行專利的檢索。化學結構式的電子化檢索逐漸成為醫藥化工領域專利信息檢索的重要手段。
隨著化學專利數量不斷增加且化學物質的命名不唯一,而且很多新合成或者新發現的化學物質必須以化學結構的方式進行描述,再加之專利撰寫過程中語言表達的多樣性和複雜性,因此在檢索的過程中很難用關鍵詞進行充分描述。而化學結構信息作為化學物質結構組成的特有表現形式,化學結構與化學物質具有唯一的對應性,採用化學結構式進行檢索可以大大提高檢索的準確性和檢索效率。因此,化學結構信息在醫藥化工領域專利檢索中表現出尤為特殊的重要性。
02 化學結構式檢索的困境
化學結構式是一種特殊圖形信息,採用化學物質的結構進行信息檢索,是以化學結構圖形進行匹配檢索。需要檢索系統對化學結構信息作深加工處理,才能實現以化學結構式進行專利檢索,一般的檢索系統往往難以實現化學結構的檢索。當然,現有的資料庫也已經能對結構式進行檢索,例如Scifinder、ISI chemserver等,但是這些數據對專利的檢索功能較差。對於專利數據來說,現有的部分商業專利資料庫已經實現了化學結構的檢索(例如DWPI等)。
由於具有化學結構檢索的專利資料庫往往需要較高的開發費用,具有化學結構檢索的商業資料庫價格較高,大大增加了國內企業的檢索和研發成本,使得很多資金薄弱的初創企業對價格高昂的檢索資料庫望而卻步。而一般免費專利資料庫,由於沒有對複雜化學結構信息進行處理的手段,往往無法採用化學結構信息進行專利檢索。使得檢索人員渴望進行化學結構檢索時,往往沒有合適、免費的檢索工具。如何利用免費資料庫,實現醫藥化工專利的化學結構檢索成為了檢索人員的困境。
筆者通過對大量免費資料庫的篩選,選擇出幾種具有化學結構檢索的免費資料庫,並對資料庫功能進行介紹和說明,希望為檢索人員採用化學結構檢索醫藥化工專利提供一定的參考和幫助。
03 檢索化學結構的免費專利資料庫
3.1 PATENTSCOPE資料庫
世界智慧財產權組織的PATENTSCOPE資料庫可以對《專利合作條約》和部分國家和地區專利局的專利文獻進行檢索,檢索欄位包括關鍵字檢索、號碼檢索、名稱檢索和分類檢索等。2016年10月PATENTSCOPE推出了化學結構檢索功能,為用戶提供了在PATENTSCOPE中對專利文件中的化學結構信息進行檢索的途徑。PATENTSCOPE結構式檢索目前可用於英文和德文(自1978年起)公布的PCT申請和美國(自1979年起)的資料庫。
(1)PATENTSCOPE化學結構檢索
登錄PATENTSCOPE後點選「Chemical compounds」模塊進行化學結構的檢索,具體見下圖。
採用PATENTSCOPE進行化學結構式檢索時,具有2種方式:
(1)可以通過上傳結構式進行檢索,接受的格式包括結構式文件(文件類型MOL)或者圖片格式(文件類型png、gif、tiff和jpeg等);具體如下圖所示:
(2)採用結構編輯器繪製或編輯結構,以非常直觀的方式繪製化學結構、反應和片段;具體如下圖所示:
除此之外,近期PATENTSCOPE資料庫對化學結構檢索進行了進一步的優化,檢索人員可以進行化學亞結構檢索,並在大約1000萬個結構中查找含有某個特定片段的結構。此前的化學品檢索功能只能通過名稱或完整結構圖進行檢索,而新工具使研究人員得以查看更大範圍的結果,使得檢索人員更容易查到哪些分子含有其尋求的片段。
例如,在檢索模塊中輸入阿託品化合物某種亞結構,以阿託品化合物某種亞結構進行檢索,檢索結果如上圖所示。含有亞結構的相關內容都會在檢索結果中輸出,同時還以特殊的顏色進行標註,大大提高了檢索人員的閱讀效率。
3.2 國家知識產權局專利檢索系統
國家知識產權局專利檢索系統於2011年4月26日上線,收錄了103個國家、地區和組織的專利數據,其中包括文摘數據、全文數據、引文及法律狀態數據等,文獻數量達1億3000萬條;具有常規檢索、表格檢索、概要瀏覽、詳細瀏覽、批量下載等功能。隨著國家知識產權局對專利檢索系統的不斷優化,並且增加了化學結構檢索模塊。
在登錄國家知識產權局專利檢索系統時,檢索人員可以通過國家知識產權局進入檢索系統;進入檢索系統後,可以點擊「藥物檢索」進入藥物檢索界面,具體界面如下圖所示:
而後在藥物檢索界面中選擇「結構式檢索」,並在其中輸入化學結構式即可進行化學結構信息的檢索,而且在輸入結構式的過程中檢索系統提供了結構式的核查功能,檢索人員可以對結構式進行校核。繪製結構式後再生成檢索式即可進行專利檢索。
採用該檢索系統進行化學結構檢索的過程中,檢索人員可以根據需要進行精確結構、子結構和相似性檢索(相似性係數範圍為0.4~0.99),從而可以根據檢索需要選擇不同的檢索模式。
3.3 北京市智慧財產權公共信息服務平臺
北京市智慧財產權公共信息服務平臺涵蓋103個國家和地區的文獻數據近1億條,該平臺除了包括智能檢索、關鍵字檢索、號碼檢索、分類檢索、同義詞檢索和企業關聯檢索;而且也開發了化學結構式檢索,可以通過檢索界面中的「化學結構式檢索」進入。
北京市智慧財產權公共信息服務平臺在進行相似結構檢索時,可以選定檢索的相似度;輸入的化學結構可以與其他34個欄位進行組配檢索,例如可以在下圖的空白區域中繪製化學結構式,從而進行化學結構式檢索;化學結構檢索可以進行化學結構的準確結構檢索、子結構檢索,還可以進行相似結構的檢索。
北京市智慧財產權公共信息服務平臺利用化學結構檢索可以在一定程度上解決現有檢索系統在檢索化學、藥物專利時難以檢全、檢準的問題。不足之處在於:該平臺的化學結構式檢索還處於試用階段,化學結構數據僅1萬條左右。
3.4 PubChem資料庫
PubChem是世界上免費獲取的化學信息的最大集合,是一種化學模組的資料庫,其是美國國家健康研究院( US National Institutes of Health,NIH)的開放資料庫,並由美國國家生物技術信息中心負責維護。PubChem自2004年開放以來,已成為科研工作者、學生和公眾的重要化學信息資源。檢索的過程中,PubChem可以按名稱、分子式、結構和其他標識符進行化學物質的檢索和搜索。值得說明的是,PubChem可以查找化學和物理性質、生物活性、安全性和毒性信息;而且PubChem資料庫還與專利、論文資料庫相關聯,進而實現利用化學結構檢索相關專利。進入PubChem資料庫後的界面如下圖所示:
進入PubChem資料庫後,點擊繪製結構後即可進入化學結構編輯界面,如下圖所示;並可以在繪製框中繪製出所需的化學結構圖。檢索的過程中可以對相似結構、子結構進行檢索。
最重要的是PubChem資料庫與專利資料庫相關聯,可以通過化學結構的信息檢索到相應的或者相關的專利,並且可以直接連結到相應的專利資料庫。從而提高檢索人員的檢索效率。如下圖所示。
此外,值得稱讚的是PubChem資料庫還對檢索得到的相關專利的IPC分類進行了加工、標引和排序,使得檢索人員對檢索得到的相關專利的IPC進行快速、有效地梳理。
04 結束語
由於醫藥化工領域專利檢索的特殊性,在進行醫藥化工領域的專利檢索時,務必重視化學結構信息的利用。本文為基於化學結構信息進行專利檢索提供了部分解決途徑,上述資料庫化學結構檢索的準確性和全面性可能與商業資料庫還有一定的差距,但是在一定程度解決了利用化學結構進行專利檢索的困境,擴展了檢索人員的檢索途徑,為企業及時、準確掌握國內外相關專利的保護情況和新產品的發展動態提供了支持。
參考文獻(略)