人们所需的专利信息,不论是技术、法律或是经济信息,都深藏于浩瀚的专利文献之中。如果人们要想从浩瀚的专利文献中查找到对自己有用的专利信息,必须从某一特定的角度入手,同时还要利用特定的方法,并借助于一定的工具进行查找。
专利信息检索的定义
信息检索(information retrieval)也称情报检索,它是指从众多的文献信息源中,迅速而准确地查找出符合特定需要的文献信息或文献线索的方法和过程。信息检索的宗旨是把散乱无章的信息收集、汇总起来,以便人们在相关活动中作为知识进行参考。因此信息检索的基本要求是全、准、快、灵。文献信息检索过程可概括为提出问题、分析问题、选择检索工具、确定检索途径、选择检索方法、最终查获所需的信息。这一过程就是信息检索。
按照上述情报学的观点,可以简单地说专利信息检索就是有关专利信息的查找活动;其实这也是从事专利文献信息工作的人们,在长期的工作实践中概括出来的一种特指查找专利信息活动的术语。
但是专利信息检索并非专利信息的简单查找,对大多数进行检索的人而言,检索并不意味着发现,而是获得。因此,可以把专利信息检索定义为“根据一项数据特征,从大量的专利文献或专利数据库中挑选符合某一特定要求的文献或信息的过程”。
专利信息检索的发展
与信息检索相同,专利信息检索已有很长的发展历史。它的发展经历了书本式检索、机械检索和计算机检索3个大的阶段。
1.书本式检索
书本式检索发展于19世纪末。专业化的信息检索产生于参考咨询工作。1876 年召开的美国图书馆协会第一届大会上提出了正规的参考咨询工作概念。这个阶段的专利信息检索手段是利用书本式和卡片式的检索工具,包括专利累计索引、专利公报等工具书。如各国专利机构出版的专利分类年度索引、专利权人年度索引、专利公报,以及英国Derwent 公司出版的书本式《世界专利索引》(WPI)、《世界专利文摘》(WPA)等。这些检索工具至今仍在某些特殊的检索活动中发挥作用,如检索一些国家的工业品外观设计专利。
2.机械检索
机械检索存在于书本式检索向计算机检索的过渡阶段。它起始于20世纪70 年代末至80 年代初,生命周期很短暂,很快就被计算机检索替代。在这一阶段,专利检索主要是利用机械阅读缩微型专利信息制品,如缩微胶卷、缩微平片。著名的有Derwent 公司出版的《世界专利索引》累计索引平片、世界专利文献中心(INPADOC)出版的专利注册服务缩微平片。
3.计算机检索
随着计算机技术、网络技术的发展,计算机检索以其方便、快捷以及节约空间等特点,逐渐成为专利信息检索所采用的主要手段。虽然 1954 年美国海军兵器中心图书馆利用IBM701机开发计算机信息检索系统,标志着计算机信息检索阶段的开始,但专利信息的计算机检索起始的年代比较晚。20世纪70 年代,Derwent 公司将专利信息做成了可在计算机上读取的数据,这就是专利信息计算机检索的雏形。但由于数据量的庞大,检索的速度非常之慢。1976 年,该公司及时推出了联机检索服务,首先成为Orbit系统的信息提供商。
计算机信息检索根据其检索方式可分为联机信息检索、光盘信息检索和网络信息检索。
(1)联机信息检索。
联机检索是指用户利用终端设备,将专利检索需求按一定的查询语言和检索命令经过国际通信网络送到联机检索系统,系统将用户的提问与专利数据库中存储的专利数据进行匹配运算,查找出用户所需信息,并把检索结果立即通过网络反馈给终端的全过程。这种检索方式可以实现人机实时对话,检索的专业性比较强。目前较为著名的几大国际联机检索系统有DIALOG、STN、QUESTL•ORBIT及DATA-STAR等,它们都提供专利信息检索服务。
(2)光盘信息检索。
光盘是一种集激光技术及计算机技术于一体的高技术结晶。它以其存储量大、价格低廉、适应性强等优点,成为重要的信息载体。它不仅能存储文字、图像等文献信息,还能存储电视、电影、录像等各种视听信息,并将这些信息集合为一体,构成多媒体的文献载体。与联机检索相比,光盘检索具有价格低廉、容易掌握等特点。联机检索通常采用指令检索,一般用户难以了解复杂的检索指令,而光盘检索通常采用菜单检索,只要逐级展开菜单,做出相应的选择即可实施检索。
而且,用户可以直接上机操作,不受联机时间限制。20世纪90 年代以来,我国国家知识产权局开发了《中国专利文献检索数据库》和《中国专利全文光盘数据库》,它们在专利信息检索中发挥了极大的作用。国外影响较大的光盘数据库有美国MicroPatent 公司出版的CAPS 光盘、日本的JMSCD系列和PAJ系列光盘、欧洲专利局1989 年开发的ESPACE系列光盘等。
(3)网络信息检索。
IT和网络技术的高速发展和广泛应用,使世界范围内的信息交流、资源共享成为可能,使Internet成为全世界最大的图书馆,从而使网络信息检索成为信息组织、检索和获取的最佳方式之一。网络信息检索有如下特点。
①信息检索空间拓宽,检索范围覆盖了因特网上的所有网络资源。
②所有工具都具有交互式作业的特点,用户可以在检索过程中及时调整检索策略以获得更好的检索结果。
③用户界面友好且操作方便,网络检索采用交互式作业,系统透明、通用的Windows界面和符合大多数用户检索习惯的用户接口都使检索变得简单易行。
1997 年 2月IBM 公司开始在因特网提供专利信息服务,这标志世界专利信息传播发生了根本性变化,专利信息传播进入因特网时代。也就是说,传播信息的载体形式已不仅仅局限于纸载体及CD-ROM或DVD 等电子出版物,网络成为专利信息传播的主要途径之一。1998 年 10月欧洲专利局开始通过esp@cenet网络数据库提供专利信息服务。从此之后,各国专利局或国际组织纷纷建立自身的网络专利数据库,也开始在因特网上提供各种专利信息。
专利信息检索方式和影响因素
一般来说,检索者在了解了检索目的、需求之后,首先要决定采取什么样的检索方式。因为这是检索工作最基本的工作内容。检索方式主要分为手工检索、计算机检索两种。
1.手工检索
手工检索是利用书本形式、卡片形式或缩微品形式的检索工具,依靠检索者的手工劳动和脑力劳动查找专利信息的过程。这种检索方式所使用的检索工具主要有:各国专利机构出版的专利分类年度索引、专利权人年度索引、专利公报,以及Derwent 公司出版的书本式或缩微形式的《世界专利索引》(WPI)、《世界专利文摘》(WPA),INPADOC出版的专利注册服务缩微平片等。
2.计算机检索
计算机检索是利用计算机系统,将用户的提问输入到系统中,并匹配运算,查找出用户所需信息,并把检索结果反馈给用户的全过程。在国内利用计算机进行专利信息检索,可以选择以下3种类型的专利数据库资源。
(1)国家知识产权局专利文献馆为公众提供的专利数据库。专利文献馆作为国家知识产权局对社会公众提供专利信息的窗口和专利文献的国家级收藏单位,不仅收藏了全世界各国的专利文献四千多万件,而且提供各种专利检索工具书,以及计算机专利信息检索系统。公众可以去国家知识产权局专利文献馆,利用其专利信息数据库查询所需的专利信息。
(2) Internet 网上的专利信息资源。网上的专利信息资源是检索和获取的最佳方式之一。使用者可以不受空间和时间的限制,随时随地进行检索。目前许多国家的专利局或国际性专利组织开发了网上专利数据库,为公众提供专利信息服务。占全世界专利信息总量的80%的4个网上数据库如下:
①http://www.sipo.gov.cn;
②http://ep.espacenet.com;
③http://www.uspto.gov;
④http://www.jpo.go.jp.
②http://ep.espacenet.com;
③http://www.uspto.gov;
④http://www.jpo.go.jp.
因此这4个数据库一般是专利信息检索者主要使用的数据库。
(3)内部的专题数据库。出于自身需求及安全因素的考虑,一些企事业单位开始建立内部的专题专利数据库。这种方法对企业来说,技术领域的针对性较强,技术人员的使用率较高,使用的难度较低,而且安全性可以保证。
3.专利检索的影响因素
专利信息检索是一项复杂的工作,是由多种因素构成的,这些因素共同制约着专利信息检索的过程,直接影响着检索的结果。主要的影响因素有如下几个方面:
(1)检索目的、需求;
(2)检索依据;
(3)采取的检索方式;
(4)选择检索系统;
(5)检索策略;
(6)检索范围;
(7)检索者所具备的检索经验等。
专利信息检索的效果
查全率和查准率是对常用的、相对合理的评价信息检索系统和检索者检索效果的指标。前者是衡量检索系统和检索者检出相关信息的能力,后者是衡量检索系统和检索者拒绝非相关信息的能力。两者合起来,即表示检索效率。
(1)查全率(recall ratio)。用R表示,是被检出的、切合问题要求的记录数与检索系统数据库中所存储的、切合提问要求的记录总数之比。
(2)查准率(precision ratio)。用P 表示,是被检出的、切合提问要求的记录与被检出的所有记录之比。