2021-4-9 | 行業經濟
一、煙草行業專利數據庫建設的意義及作用
專利信息匯聚著全人類智慧成果,據WIPO(WorldIntellectualPropertyOrganization世界知識產權組織)統計表明[1],世界上每年發明創造成果的90%-95%能在專利文獻中檢索到,而且有70%的技術內容未在其它非專利文獻中發表過,若能運用好專利文獻,能節約40%的科研開發費用,同時少花60%的研究開發時間。專利信息不僅包含技術信息,還包含法律信息和經濟情報[2]。每個企業的核心技術和開發項目基本都會反映在專利上,因此通過分析競爭對手的最新專利,可以洞悉競爭對手的技術研發動態、市場開發以及專利戰略,甚至了解整個企業的運營戰略。隨著信息技術的發展,專利信息應用也從最初的手工時代步入互聯網時代。目前網絡上不乏優秀的專利數據庫,如歐洲專利局的EP專利數據庫(http://ep.espacenet.com/),該數據庫包含世界上七十多個國家和地區以及歐洲專利局、世界知識產權組織公開的專利[3]。但此類專利數據庫面向各個技術領域的用戶,包括所有行業的專利,所以專利檢索結果不可避免地出現大量不相關專利。另外,這些專利數據庫覆蓋范圍雖廣但未包括所有國家的專利數據,用戶若需檢索不同國家的專利,往往需要到多個數據庫分別檢索。煙草行業專利數據庫包含的絕大部分專利是煙草相關技術的專利。該專利數據庫綜合了世界主要國家和地區的專利,解決了客戶針對不同國家的專利需到不同專利數據庫檢索的問題,降低了專利檢索的專業要求,使得專利檢索更加便捷。該數據庫可根據使用者的需求定制,既使用者關注的技術主題和重點企業的專利。用戶在這個數據庫中檢索,可排除雜質專利的干擾,提高檢索效率。此外,煙草行業專利數據庫還設置了其它功能,如針對國外專利可翻譯專利標題,專利摘要,專利權利要求書;在檢索過程中,不但可以查看專利細節,還可分析專利結果的整體情況,利用分析結果對檢索式做進一步調整,得到更準確的檢索結果。
二、煙草行業專利數據庫的建設思路與流程
(一)建設思路
專利數據庫的建設目的是幫助用戶提高工作效率,解決實際問題,因此衡量專利數據庫的最優標準是使用率。建立煙草專利數據庫必須以用戶的需求為出發點,了解用戶的特征和具體需求。煙草行業專利數據庫的建設思路是根據煙草行業的特點,以用戶的需求為基本出發點,以現有的專利數據庫為數據源。
煙草專利數據庫的建設包含以下三個階段(見圖1):⒈確立煙草相關技術主題,以及各技術主題所包含的技術范圍;⒉確定檢索式,建立相應的技術平臺完成煙草專利數據的提取;⒊以已經確定好的技術主題為單元,根據第二階段提取的數據建立專利數據庫,添加檢索的功能模塊。煙草行業專利數據庫由分布在不同部門各類技術人員使用。因此,在專利數據庫的建設中,要選擇便于部署、管理和維護的構架方式。煙草行業專利數據庫采用基于互聯網的構架(B/S構架,Browser/Server構架),用戶不需要部署客戶端軟件,通過網頁瀏覽器(如InternetExplorer、Firefox、Chrome等)即可訪問專利數據庫。專利數據庫進行軟件版本升級,專利數據進行更新,直接在服務器端完成,實現平滑升級更新和集中管理。
(二)建設流程
⒈確立技術主題
通過文獻調研、調查問卷結合專家咨詢等方式,擬訂了煙草專題數據庫包含的技術主題,這些技術主題不僅涵蓋了行業的整個生產鏈,還聚焦了當今煙草行業的熱點技術(見圖2)。
⒉提取專利數據
數據提取是一個從各行各業的專利數據庫中篩選煙草行業的專利的過程,稱為ETL(Extraction-Transformation-Loading),即數據的抽取、轉換和加載。這一過程對于分布在異構數據源中的專利數據進行抽取,并經過整理和轉換,最終加載到數據倉庫中,作為下一步建立不同專題專利數據庫的基礎。專利信息是分散的,各國的知識產權數據為各國所有并在所有國的知識產權管理部門公開,查詢不同國家的專利,需要登陸相應國家的網站,進入不同的檢索頁面,采用不同的檢索策略,而檢索獲得的,也是按國家不同的檢索結果。因此,獲取不同來源的專利數據,并進行轉換和加工,是建立煙草專利數據庫的基礎。
針對世界主要知識產權數據庫,煙草行業專利數據庫開發了一套分布式的自動化搜索和下載工具,并且針對不同的數據編寫了不同的轉換器,能夠定時從世界主要國家的專利數據庫中提取我們所需的煙草相關的專利數據,并對這些數據進行整合,保存在數據庫服務器中,從而實現了專利的自動更新運轉(見圖3)。在數據倉庫中,為每一個專利設置了統一的數據字段。由于專利信息包含了技術、法律、經濟等諸多信息,在專利數據字段定義時充分考慮了這一特點。對專利信息進行統一規范的定義,可以保證其檢索的準確性,從而保證后續專利分析結果的準確性。字段名稱的定義以專利信息行業通用稱謂的縮寫定義。
專利的標題、摘要和權利要求書體現的是技術信息,是重要的專利檢索要素之一,專利文獻當中的技術專業詞基本分布在標題,摘要和權利要求書中。在專利文獻中,代表同一意思的技術關鍵詞往往有多個,這里稱之為技術同義詞。在檢索過程中,漏掉一個技術同義詞的后果可能是漏檢一大批關鍵性專利,因此技術同義詞是一項重要的工作。技術同義詞形成的原因很多,如發明人技術用詞習慣、專利代理人的撰寫習慣、不同的外文翻譯等[4]。收集技術同義詞必須綜合多方面的信息。國際專利分類也體現了技術信息,是各國對專利進行分類的通用標準。在煙草專利數據庫的建設中,為了保證數據庫的準確性,必須涵蓋IPC分類。
專利法律狀態體現的是專利的法律信息,代表專利權的權屬情況,是技術借鑒和侵權規避的重要指標,因此必須提取。專利的申請人信息是專利經濟信息的一個重要體現。專利申請人也是專利數據庫建設的要素之一,是企業結合市場競爭情報綜合得到的。實力雄厚的行業巨頭往往是一個行業各項技術的開創者,而且它們非常注重知識產權的保護,因此它們的專利代表各項技術的發展方向。從這些企業當前申請的專利信息中,可以挖掘出主要的技術路線,當前技術動向,關注的市場區域等情報。需要注意的是,企業在專利申請的時候所采用的名稱可能多種多樣,同時,由于行業內經常發生公司的收購兼并重組等情況,使得專利所有人的情況多變,故而需要充分了解主要申請人的情況,以獲取全面的專利情況。