北京儿童插座价格联盟

Patentics与PowerBI联合使用进行专利分析

只看楼主 收藏 回复
  • - -
楼主

 各位老师、朋友,大家晚上好!我是来自武汉的周俊,感谢裘博士提供这么好的平台让我来分享专利分析工作中的一些经验心得。时间仓促,水平有限,过程中免不了有很多问题,还望各位老师、朋友批评指正。

在开始介绍实例前,我先来介绍一下我们为什么要联合使用Patentics和PowerBI软件进行专利分析。

通常,任何一个专利分析工作,都离不开数据采集、数据加工、数据分析和数据可视化这几个重要的工作。

首先,在数据采集、数据加工、数据分析方面,Patentics客户端的功能十分强大。在数据采集工作中,客户端支持用户在自身数据库内通过布尔运算和智能语义两种方式检索数据,同时支持多种类型的TXT文件导入数据。进行数据加工时,客户端可快速导出字段格式规范的excel文件,提供标准化的申请人,并且正在开发通过txt文件人工清洗申请人的功能。在数据分析方面,客户端具有分组、组合等多样化的分析功能,并具有基于智能语义技术衍生出的多种高端分析手段,例如技术分组、攻防分析、雷区分析等,这是目前其他分析软件无法替代的。

另外,Patentics在数据可视化功能方面也有很大的开发力度,前不久上线的“分析库”功能可以根据用户需求快速生成柱状图和气泡图,并且,客户端的分析界面——分类器,本身就是将分析过程中的数据可视化的绝佳工具。正是Patentics客户端在数据可视化方面的便捷,让我开始重新认识数据可视化这一工作,认为通过数据可化不仅能将我们的研究结论通过图表展示,更能让我们在研究过程中更快的挖掘到重要的信息。

带着这样的想法,我开始学习Power BI这一强大的数据可视化工具,因为虽然Patentics客户端的可视化功能不弱,但毕竟无法和专业的工具相媲美。

BI(Business Intelligence)是工具商业智能分析工具的英文缩写。这类工具的数据分析处理和可视化功能强大,在2012年大数据概念风靡全球后才有更多的非商业领域的人士关注,在Power BI出现以前,BI工具都是收费软件,因此在专利分析领域的使用率不高。而Power BI是微软在2015年推出的一款免费BI软件,其很多功能是从excel和sql server中移植而来的,并且在2016年9月推出了中文版本,因此学习起来并不困难。

我在专利分析实践过程中发现,联合使用Patentics和PowerBI工具不仅能够提高专利分析的效率、准确性,并且能够挖掘到很多我们曾经难以获得的专利信息。今天我就通过一个简单的案例,和大家分享一下我在专利分析中联合使用Patentics客户端与PowerBI的经验。

第一步、在Patentics数据库(远程)中检索数据

本次演示将浅显的分析轮边电机技术(包括轮毂电机技术)。分析数据为Patentics中检索icl/ b60k7/00(全部数据库),获得的11806件专利。(本次分析仅为方法演示,不考虑检索数据的全面性和准确性)

第二步、在客户端分类器中进行数据加工和清洗

首先,在分类器中右键—导入—主搜索,将刚刚检索获得的文献导入到分类器中。

接下来,为了使得导出的excel数据包含我们需要的技术字段,并且使申请人信息更为规范,我们进行两个步骤的数据处理。

1、清洗标准申请人:根据我们的分析需求,将同一申请人的不同表达方式进行统一化处理。

如果大家看了上周六裘博士在群里发的PDF文件,就知道原本该项工作是要在Excel中完成的。现在有个好消息是,裘博士开发了一个新的功能,使得我们能够在分类器中就可以完成对标准申请人的清洗。下面我来演示一下使用新方法进行标准申请人清洗的步骤。

首先,在节点上—右键—分组,选择标准化申请人,并根据需要设置项数,如100项。

我们看到,标准化申请人中“ntn轴承”“ntn”“NTN”都是一个公司,下面经过几步简单的操作,就可以将他们统一成一个名称。

在节点“B60K7/00 - 标准申请人”上—右键—导出—节点图—模板


将导出的TXT文件保存到指定目录下,并在该文件的基础上制作清洗需要的文件

在每个需要修改的标准化申请人后面,输入一个“Tab”键,再加上修改后的名称,删除不需要修改的数据,完成后保存该文件

在原始节点“B60K7/00”上—右键—数据—标准申请人清洗

选择刚刚制作的文件,不到一秒的时间,系统就根据该文件对标准化申请人字段进行了更新,下面再次对原始节点“B60K7/00”进行标准化申请人分组

接下来,我们利用Patentics的智能语义技术分组功能,进行计算机自动技术标引(该标引可与手工标引数据配合使用)。

在原始节点上—右键—分组,勾选“技术”选项,分组后结果如下:

技术分组后获得8个英文技术分支,8个中文技术分支(通常,我们可以将人工阅读并拆分或归并上述分支,使其更为符合研究所需技术分解,由于此次仅为演示,在此不做手动归并等处理)。

在技术分组获得的节点“B60K7/00 - 技术”上—右键—导出—Excel

在弹出的选项卡上勾选需要导出的字段,注意:本次Patentics的更新,增加了“国家”字段和“优先权国家”字段,便于分析申请目标国和技术来源国。

我在17日晚间22:30分处理的该数据,一万条数据,导出30多个字段,并勾选了全文链接,我测一下导出的时间,大约只用了5秒,速度非常的快,导出的表格如下

可以看到,我们清洗的标准申请人出现在了表格中,技术分组字段也添加到第一列。到目前为止,Patentics的第一步工作就告一段落,利用这个导出的数据,我们就可以在Power BI中实现交互式的可视化分析了。

第三步:安装PowerBI软件

简单来说,Power BI是一个交互式数据可视化工具,它包含了一系列的组件和工具,2015年1月正式上线,2016年8月简体中文版上线。下面借用“PowerPivot工坊”在知乎上提供的一幅图介绍Power BI的功能。

简单来说,微软为了使Excel透视表功能更加强大,开发了了多个获取数据(Power Query)、分析数据(Power Pivot)、呈现数据(Power View、Power Map)的模块。而后推出的Power BI就是与Excel独立的,将获取、分析、呈现、发布功能集于一身的工具。在Power BI出现之前,大部分BI工具都是收费软件,因而将BI工具用于专利分析还不是很普遍,接下来我们就尝试使用Power BI进行专利分析,了解BI工具在专利分析中的优势。

附上软件下载地址:https://powerbi.microsoft.com/zh-cn/get-started/

该软件的下载安装十分简单,在此不做说明。

第四步、将刚刚导出的Excel工作簿导入Power BI

在PowerBI的启动界面点击“获取数据”,可导入包括Excel工作簿、数据库、网页信息等多种数据 


还可以在开始菜单栏中点击“获取数据”,在此次分析中,我们要导入刚刚导出的数据,因此点击“Excel”,选择要导入的文件


打开文件“B60K7 00 - 技术”后,系统自动打开“导航器”窗格,在窗格左侧选择要导入的表格,右侧则显示该表格的预览,在右下角单击编辑则进入后台编辑页面,单击加载则将该表格的全部数据导入Power BI中。

导入后的每列数据变为一个元素,显示在字段窗格中。至此,清洗后的数据已经导入到PowerBI中,接下来就可以在PowerBI中进行可视化操作了。

第五步、在Power BI中实现可视化

首先,简单介绍一下PowerBI主窗口中的五个区域:

1. 功能区,用于显示与报表和可视化效果相关联的常见任务

2. 报表视图或画布,可在其中创建和排列可视化效果

3. 底部的页面选项卡,用于选择或添加报表页

4. 可视化效果窗格,你可以在其中更改可视化效果、自定义颜色或轴、应用筛选器、拖动字段等

5. 字段窗格,可在其中将查询元素和筛选器拖到报表视图,或拖到可视化效果的筛选器窗格 

简单来说,PowerBI的可视化步骤就是:从可视化效果窗格(4)中选择一种可视化效果,在字段窗格(5)中选择所需字段,可视化图形就会显示在报表视图或画布(2)上。具体的,在 Power BI Desktop中有两种不同的方式来创建新的可视化效果:

1、你可以从字段窗格中拖动字段名称,并将它们放在报表画布上。默认情况下,你的可视化效果显示为数据表。



2、你也可以在可视化效果窗格中单击想要创建的可视化效果类型。如果使用此方法,默认的视觉对象则是类似于你所选的视觉对象类型的空白占位符。

在你创建了图形、映射或图表后,便可以开始将数据字段拖动到可视化效果窗格的下半部分以生成和组织你的视觉对象。可用字段将基于你所选择的可视化效果的类型而进行更改。当你拖放数据字段时,你的可视化效果将自动更新以反映相应的更改。下图显示了利用申请日、申请号字段绘制申请趋势图。



接下来,调整图表的大小和位置,然后在同一个画布上,绘制任意个感兴趣的图表:

上图在同一个画布上,使用了条形图显示重要申请人;使用树状图显示申请目标国和IPC(小类)分布,使用分区图显示申请趋势,采用气泡图显示各公司的平均引用、被引用数。绘制上述图表只需要几分钟的时间。

如果您从来没有使用过任何BI工具,可能会以为到现在为止,已经把PowerBI的基础功能展示的差不多了。但实际上,真正的分析才刚刚开始。

我们单击左上角的条形图中,“日本东洋精工”的数据条,有趣的事情发生了!所有图都发生了相应改变,突出显示或仅显示该申请人的数据。这就是Power BI的核心功能:在可视化效果间创建复合交互作用。在下一次的分享中我们就要利用该功能,真正开始数据分析,挖掘数据背后的秘密!

由于时间的关系,今天的分享要结束了。在下一次分享中,我将在Power BI中继续对该数据进行分析,与大家共享分析成果,并将介绍更多的联合使用Patentics与Power BI的技巧,我们不见不散。

推荐阅读

《ANN与AN区别》

《北京中心Patentics系列培训讲座8-田松涛老师第1讲》

《北京中心Patentics系列培训讲座7-任卫华老师第1讲》

《Patentics微信语义检索命令介绍》

《运营美国专利组合之策略2、3》

《小米购买Intel专利再分析》

《北京中心Patentics系列培训讲座6-马志勇老师第9讲》

《导出excel图表分析 2》

《导出excel图表分析》

《自动扫描低质量专利》

《Patentics数据导入》

《北京中心Patentics系列培训讲座》

《北京中心Patentics系列培训讲座2-马志勇老师第5讲》

《北京中心Patentics系列培训讲座3-马志勇老师第6讲》

《北京中心Patentics系列培训讲座4-马志勇老师第7讲》

《北京中心Patentics系列培训讲座5-马志勇老师第8讲》


微群管理员:patentics智能语义 (←长按复制)


有意入patentics微信检索、分析技术讨论群者,请加管理员微信,拉您进群。


微信公众号:patentics_public (←长按复制)


www.patentics.com  sales@patentics.com



举报 | 1楼 回复

友情链接