专利定量分析方法主要有专利技术生命周期法、统计频次排序法、布拉德福文献离散定律、时间序列法和趋势回归法。
专利定量分析简述
专利定量分析是指利用数理统计、科学计量等方法对研究对象的相关信息进行加工整理和统计分析,从而对研究对象的发展趋势做出预测和推断的一种基础信息分析方法。在科学研究中,通过定量分析可以使人们对研究对象的认识进一步精确化,以便更加科学地揭示规律,把握本质,理清关系,预测事物的发展趋势。
专利信息定量分析是研究专利信息的重要方法之一,它是在对大量专利信息加工整理的基础上,对专利信息中的某些特征进行科学计量,从中提取有用的、有意义的信息,并将个别零碎的信息转化成系统的、完整的有价值情报。
专利定量分析方法是建立在数学、统计学、运筹学、计量学、计算机等学科的基础之上,通过数学模型等方式来研究专利文献中所记载的技术、法律和经济等信息的本质。这种分析方法能提高专利信息分析质量,可以很好地分析和预测技术发展趋势,科学地反映发明创造所具有的技术水平和商业价值。
同时科学地评估某一国家或地区的技术研究与发展重点,用量化的形式揭示国家或地区在某一技术领域中的实力,从而可以获得认识市场热点及技术竞争领域的经济信息。及时发现潜在的竞争对手,判断竞争对手的技术开发动态,及时获得相关产品、技术和竞争策略等方面的信息。
定量分析专利信息首先要对专利文献的有关外部特征进行统计。这些外部特征有:专利分类、申请人、发明人、申请人所在国家、专利引文等,它们能够从不同角度体现专利信息的本质。
技术生命周期分析法
技术生命周期分析是专利定量分析中最常用的方法之一。通过分析专利技术所处的发展阶段,推测未来技术发展方向。它针对的研究对象可以是某件专利文献所代表技术的生命周期,也可以是某一技术领域整体技术生命周期。
1.专利技术的4个发展阶段
人们通过对专利申请数量或获得专利权的数量与时间序列关系、专利申请企业数与时间序列关系等分析研究,发现专利技术在理论上遵循技术引入期、技术发展期、技术成熟期和技术淘汰期四个阶段周期性变化。
(1)技术引入期。在技术引入阶段,专利数量较少,这些专利大多数是原理性的基础专利,由于技术市场还不明确,只有少数几个企业参与技术研究与市场开发,表现为重大的基本专利的出现。此时,专利数量和申请专利的企业数都较少(集中度较高)。
(2)技术发展期。随着技术的不断发展,市场扩大,介入的企业增多,技术分布的范围扩大,表现为大量的相关专利申请和专利申请人的激增。
(3)技术成熟期。当技术处于成熟期时,由于市场有限,进入的企业开始趋缓,专利增长的速度变慢。由于技术的成熟,只有少数的企业继续从事相关领域的技术研究。
(4)技术淘汰期。当技术老化后,企业也因收益递减而纷纷退出市场,此时有关领域的专利技术几乎不再增加,每年申请的专利数和企业数都呈负增长。
2.专利技术生命周期计算方法
基于专利技术生命周期理论上存在4个阶段,人们引用多种方法来测算专利的技术生命周期。本文重点介绍专利数量测算法、图示法和TCT (technology cycle time)计算方法。其中,专利数量测算法和图示法主要用于研究相关技术领域的技术生命周期,而TCT计算方法主要用来计算单件专利的技术生命周期。
(1)专利数量测算法。
该方法通过计算技术生长率(γ)、技术成熟系数(α)、技术衰老系数(β)和新技术特征系数(N)的值测算专利技术生命周期。
①技术生长率(γ)。所谓技术生长率是指某技术领域发明专利申请或授权量占过去5年该技术领域发明专利申请或授权总量的比率,如式所示。
γ=a/A
其中,a为该技术领域当年发明专利申请量或授权量;A为追溯到五年的该技术领域的发明专利申请累积量或授权累积量。如果连续几年技术生长率持续增大,则说明该技术处于生长阶段。
②技术成熟系数(α)。所谓技术成熟系数是指某技术领域发明专利申请或授权量占该技术领域发明专利和实用新型专利申请或授权总量的比率,如式所示。如果技术成熟系数逐年变小,说明该技术处于成熟期。
α=a/(a+b)
其中,a为该技术领域当年发明专利申请量或授权量;b为该技术领域当年实用新型申请量或授权量。
③技术衰老系数(β)。所谓技术衰老系数是指某技术领域发明和实用新型专利申请或授权量占该技术领域发明专利、实用新型和外观设计专利申请或授权总量的比率。如式所示,如果β逐年变小,说明该技术处于衰老期。
β=(a+b)/(a+b+c)
其中,c为该技术领域当年外观申请量或授权量。
④新技术特征系数(N)。指新术特征系数由技术生长率和技术成熟系数推算而来,在某一技术领域如果N值越大,说明新技术的特征越强。
实例1
为了分析电动汽车技术的技术生命周期,选择了中国专利数据库作为数据采集的信息源。数据采集范围为1985年-2001年中国专利公开数据,包括发明、实用新型和外观设计,共采集有关电动汽车的专利684件。为了便于作时序分析,数据的统计以申请日为基础,以年为单位;采集数据时以篇数(或称为件)为单位。考虑到专利申请公开、公告滞后的问题,趋势分析主要考虑1985年-2000年的数据情况,见表1。
年度 专利申请量/件 年度 专利申请量/件
1985 5 1993 37
1986 10 1994 54
1987 10 1995 66
1988 25 1996 52
1989 13 1997 66
1990 15 1998 81
1991 16 1999 84
1992 33 2000 99
数据来源:中国专利信息中心光盘
(1)专利数量测算法。
该方法通过计算技术生长率(γ)、技术成熟系数(α)、技术衰老系数(β)和新技术特征系数(N)的值测算专利技术生命周期。
①技术生长率(γ)。所谓技术生长率是指某技术领域发明专利申请或授权量占过去5年该技术领域发明专利申请或授权总量的比率,如式所示。
γ=a/A
其中,a为该技术领域当年发明专利申请量或授权量;A为追溯到五年的该技术领域的发明专利申请累积量或授权累积量。如果连续几年技术生长率持续增大,则说明该技术处于生长阶段。
②技术成熟系数(α)。所谓技术成熟系数是指某技术领域发明专利申请或授权量占该技术领域发明专利和实用新型专利申请或授权总量的比率,如式所示。如果技术成熟系数逐年变小,说明该技术处于成熟期。
α=a/(a+b)
其中,a为该技术领域当年发明专利申请量或授权量;b为该技术领域当年实用新型申请量或授权量。
③技术衰老系数(β)。所谓技术衰老系数是指某技术领域发明和实用新型专利申请或授权量占该技术领域发明专利、实用新型和外观设计专利申请或授权总量的比率。如式所示,如果β逐年变小,说明该技术处于衰老期。
β=(a+b)/(a+b+c)
其中,c为该技术领域当年外观申请量或授权量。
④新技术特征系数(N)。指新术特征系数由技术生长率和技术成熟系数推算而来,在某一技术领域如果N值越大,说明新技术的特征越强。
实例1
为了分析电动汽车技术的技术生命周期,选择了中国专利数据库作为数据采集的信息源。数据采集范围为1985年-2001年中国专利公开数据,包括发明、实用新型和外观设计,共采集有关电动汽车的专利684件。为了便于作时序分析,数据的统计以申请日为基础,以年为单位;采集数据时以篇数(或称为件)为单位。考虑到专利申请公开、公告滞后的问题,趋势分析主要考虑1985年-2000年的数据情况,见表1。
年度 专利申请量/件 年度 专利申请量/件
1985 5 1993 37
1986 10 1994 54
1987 10 1995 66
1988 25 1996 52
1989 13 1997 66
1990 15 1998 81
1991 16 1999 84
1992 33 2000 99
数据来源:中国专利信息中心光盘
根据表1的数据和上述计算式,计算技术生长率(γ)、技术成熟系数(α)、技术衰老系数(β)和新技术特征系数(N),绘制表2。从表2中可以看出,电动汽车技术生长率γ值1996年—1997年增长很大,而1998年—2000年,γ值持续在一定的数值区间,并有逐步变小的趋势,显现出该技术领域技术趋于成熟的迹象。
同时电动汽车的技术成熟系数α值的变化也反映出从1998年开始逐年变小的趋势;而技术衰老系数β值并没有逐年减小,未反映出技术衰老的特征。同样,新技术特征系数N值的变化规律与γ值的变化规律性相似,1997年以后开始逐年变小。这说明电动汽车技术已不属于新技术范畴。从α、β、N系数的变化情况看,电动汽车技术已脱离了新技术范畴,并趋于成熟,而且尚未显现技术衰老的特征,处在技术生命周期的第三阶段,即技术成熟期。
表2 α,β,N随时间变化一览表(中国专利数据)
系数/年度 1996 1997 1998 1999 2000
γ 0.2069 0.2609 0.2303 0.2182 0.2249
α 0.4615 0.5714 0.4430 0.4390 0.4043
β 1 0.9545 0.9753 0.9762 0.9495
N 0.5090 0.6077 0.4993 0.4902 0.4626
(2)图示法
在日常研究中人们发现利用专利申请量与时间序列图可以推算专利技术生命周期。
实例2
在美国专利数据中采集有关电动汽车技术领域的专利,以此研究其技术生命周期。
数据采集范围:1990年—2001年公开的美国专利数据,截至2001年底,有关电动汽车的美国专利共1960件。
目前,整体说来有关电动汽车的技术已经趋向成熟,企业在研究制定相关专利战略时,应根据企业的具体情况,对已经研制成功的技术应积极申请专利,以取得法律保护;对尚未投入开发的技术,以实施技术引进战略为宜;或者采取交叉许可战略或协同战略,使企业在最短的时间内获得技术、投入生产、参与市场竞争。
(3)TCT计算法。
TCT计算方法是基于这样的理论:技术生命周期可以用专利在其申请文件扉页中所有引证文献技术年龄的中间数表示。TCT用于捕获企业正在进行技术创新的信息,它测量的是最新专利和早期专利之间的一段时间。很显然,早期专利代表着现有技术,因此TCT其实就是现有技术和最新技术之间的发展周期。一个技术领域其技术生命周期TCT平均值可以从本质上区别于其他技术领域。TCT具有产业依存性,相对热门的技术TCT较短,快速变化的技术领域,如电子技术,技术生命周期一般为3-4年,而技术缓慢变化的领域,如造船技术,技术生命周期一般在15年或更长。
如果一个企业比它的竞争对手在相同的技术领域拥有较短的技术生命周期,那它就拥有寻求技术革新的优势。此外,通过测算国家的平均技术生命周期还可以比较不同国家的技术创新速度。在专利信息分析中,有时将技术生命周期指标与专利增长率指标一起使用,来判断企业的强势技术领域。研究表明:一个企业增加它的专利申请,而且这些技术有较短的技术生命周期,说明该企业的技术处在技术领域的前沿,可以看成是技术领域的带头人。实际工作中TCT主要用来计算单件专利的技术生命周期,但也可以计算企业专利技术的平均生命周期或技术领域的生命周期。
实例3
根据美国专利数据库中引文数据,计算专利号为6736071专利技术生命周期。
值得一提的是有些学者用专利申请文件扉页中所有引证专利年龄的平均数来表示该专利的TCT。如果研究的技术属于发展变化较快的领域,可以用所有引证专利文献年龄的平均数来表示TCT。而对于技术缓慢发展的领域,如造船医药等技术领域,一般来说,倾向于用所有引证专利文献年龄的中间数或中间数的平均数来表示TCT,这是因为有些专利的引证专利,常常有1-2个很古老的专利,如上述事例中第一个参考专利文献的年龄为109年,将这些专利的年龄计算到平均数中容易造成数据的不准确。
统计频次排序法
对专利数据进行统计和频次排序分析是定量分析专利信息中的一项最为基础的和最为重要的工作。专利分类号、专利申请人、专利发明人、专利申请人所在国家或专利申请的国别、专利申请或授权的地区分布、专利种类比率、专利引文等特征数据是进行统计和频次排序的对象。
1.统计和频次排序的基本做法
在对专利信息进行分析时,首先要对专利分类号、专利申请人等特征数据进行统计分析,在完成数据统计的基础工作后,要对统计数据进行频次一排序分析。频次一排序分布模型是科学计量学中的重要模型,主要用来探讨不同计量元素频度值随其排序位次而变化的规律。这一模型用于专利文献的计量分析是非常合适的。因为不同专利分类所包含的专利数量的变化,以及不同专利权人所申请的专利数量的变化等,是科学地评价和预测专利技术,发现专利权人动态的极具价值的信息。它们能够从不同角度体现专利中包含的技术、经济和法律信息。专利信息定量分析的统计对象一般是以专利件数为单位。频次一排序分布模型对于展示这些专利信息是非常直观和有效的。
根据专利信息分析的目的,首先进行相关的专利检索,并对检索结果中专利分类号、专利申请人、专利发明人、专利申请人所在国家或专利申请的国别、专利申请或授权的地区分布、专利种类比率等特征数据项进行升序、降序排列。排序表中通常包括:表格名称、序号、专利统计项的名称和频度值(专利申请数量或专利授权数量等)。
然后在图中建立频次一排序分布模型,利用x-y坐标系中排列的点阵,进行回归分析。也可以利用x-y-z三维坐标系中排列的点阵进行相关分析。有时也可以将普通的坐标系转换成对数lgx-lgy坐标系或lgx-lgy-lgz三维对数坐标系,或半对数x-lgy或x-lgy-lgz坐标系等。目的是将坐标系中分布成曲线的点阵转换为排列成直线的点阵,从而使点阵的排列特征更直观,也便于作回归分析。
2.专利申请量或授权量统计
专利信息分析中专利申请或授权量统计是最为基础的工作,统计方法因分析目的而异,如逐年统计某一技术领域专利申请量,以便进行时序分析;或统计某一技术领域3种专利类型,以便研判该技术领域的特征等。
实例4
以“打火机专利技术研究”项目为例,探讨专利信息分析中有关特征数据的统计和频次排序。所采集的数据中,中国专利数据截至2002年6月,有关打火机的专利共1622件,这些专利涉及的IPC小组约1693个。德温特世界专利索引( WPI)专利数据库所收录的专利数据中,1991年至2001年有关打火机的专利共1281件。
①专利申请量统计。
通过研究中国专利数据中打火机专利申请量随时间变化的情况(见图8-3)可以看出:在1985年至1990年间,打火机技术的申请量很少,且申请量变化不大。从1991年至1997年,打火机技术领域的专利申请量逐步增加,此时,打火机技术处在技术发展期的特征明显。到1998年相关的专利申请进一步增加,从1998年至2000年之间,相关的专利申请量又维持在一个高水平阶段,从而反映出打火机技术逐步趋于成熟。
②专利类型统计。
截至2002年6月,中国专利数据库中,有关打火机的专利共1622件,其中发明专利98件,约占总数的6%;实用新型专利580件,约占总数的36%;外观设计专利944件,约占总数的58%。从发明专利和外观设计所占总数的比例看,有关打火机的专利申请大部分涉及产品形状、图案、色彩等外观设计专利,相对而言,其技术含量不高。
3.分类号统计排序
一些国家的专利局有自己的专利分类法,由于各国的专利分类法指导思想的差异,任何国家在利用其他国家的专利文献时都会因分类体系的不同而带来困难。因此,在这种情况下,国际专利分类法应运而生。在专利信息分析中比较常见的是利用国际专利分类号(IPC)进行统计和频次排序分析,简称IPC分析。此外美国专利分类体系因其类目详细、主题功能强劲等特点被专利信息分析人员广泛使用。本文主要介绍国际专利分类的统计研究。
统计时,根据各个IPC号对应技术领域内专利数量的多少,进行统计和频次排序分析,研究发明创造活动最为活跃的技术领域、某一技术领域可能出现的新技术、某一技术领域中的重点技术。利用IPC号与时间序列的组合研究,还可以探讨技术的发展趋势。利用某一技术领域内对应IPC号最近几年的专利授权量与过去10年的授权量之比,统计专利技术增长率,分析“热门”技术。
实例5
截至到2002年6月,在德温特世界专利索引数据库中采集有关打火机技术领域专利数据,根据IPC号进行统计频次排序。(注:由于1件专利文献可以有几个分类号,统计时考虑了副分类号,所以在分类号统计集合中涉及的专利数大于采集的样本专利数)
通过分析得出国外打火机技术的发展重点主要集中在以下几个方面:一是点火技术及其装置,二是安全技术及其装置,三是打火机外壳及材料技术,四是存放燃料的存储器技术,五是打火机燃料技术。国外打火机专利技术中,涉及打火机点火技术的专利也占绝对优势,前30个IPC小组中,有10个IPC小组涉及打火机点火技术。
但是,值得注意的是:在国外点火技术专利中,“电热点火器技术”和“车辆乘客用的电热点火器技术”占有一定的比重,排名趋前。而且涉及“雪茄烟点火方面的专利技术”和‘‘火焰调节技术’’以及车用打火机相关的电传导连接等方面的技术所占比重较大。最值得注意的是:国外打火机技术中,涉及“打火机安全方面的专利技术”投入的力量相当大,专利申请量排名靠前,是打火机领域的重点技术。
通过以上分析,企业可以了解生产打火机涉及的关键技术,以此评价本企业技术特点以及在打火机领域的地位,指导企业技术投资方向等。
4.国别统计排序
国别统计分析是指按专利申请人或专利优先权国别统计其专利申请量或授权量,研究相关国家的科技发展战略及其在各个技术领域所处的地位。应该注意的是,国别统计分析方法也可以用于地区问对比研究。
实例6
表1是1991年法国、德国、英国、意大利、美国、加拿大和日本7个国家在欧洲专利局就相关领域被授权的专利数量(件)。从表中可以发现日本、美国在基本电气元件方面、仪器仪表等行业专利较多,技术处于领先地位。美国在制药领域独占鳌头,而德国、美国则在加工工艺(Process engineering)领域并驾齐驱。在消费品、食品、民用工程以及机械工程等领域德国优势明显。就法国而言,它的科技投入重点主要在机械工程、基本电气元件等方面,而意大利的技术重点相对侧重于机械工程等领域。这种统计结果有助于人们了解某一时期各国科研和开发的重点。
表1 美国、日本、英国等国家1991年在欧洲专利局专利授权量