区块链与zcash(Patentics光阴的故事系列)

区块链与zcash(Patentics光阴的故事系列)(1)

区块链与zcash(Patentics光阴的故事系列)(2)

区块链,福利,福利,还是福利

说实话,最近区块链这三个字已经被人用烂了,各行各业花式蹭热点,蹭的动手晚的我们已经觉得很难有新意了。那么憨直如索意,我们决定就明明白白送福利最直接吧,二话不说,开篇就送:

适合Patentics的区块链检索式如下:

((a/区块链 or b/blockchain or b/”block adj/1 chain”) AND ipc/(g06 or h04l)) OR a/(联盟链 or 公有链 OR 私有链 OR 比特币 OR 莱特币 OR 智能合约) OR ((a/(cryptocurrency or bitcoin or namecoin or metacoin or litecoin or ppcoin or darkcoin or swiftcoin or primecoin or hashcash) or a/”smart adj/1 contract” or a/”intelligent adj/1 agreement”) and ipc/(g06 or h04l)) or ((a/”genesis block” or a/”digital timestamp” or a/”intelligent agreement” or a/ethreum) and ipc/(g06 or h04l)) and db/patent

使用方法,贴进去直接用,数据库,中英文分类号都给你们整好了,所以是福利么。这个说实话比其他人给你们一个所谓的分析报告靠谱多了,A家一个报告,B家一个排行,你也不知道他们的基准是什么,问人家,这个检索式肯定是核心中的核心,我们公益一下,把底儿交给大家。

文头说好了福利三连击的,那么第二个就是我们要具体说一说这个理解,就是检索式怎么用,靠谱么,我有个人意见怎么办,能不能改,怎么个改法儿,我这么整专家们怎么看,憨直的索意今天都给大家讲了,讲透了,大家耐心坐好,我们挨个道来。

第一:检索式本身是一个布尔检索式,传统的很,干专利分析的都知道,这个长久以来就是最基本的范式,你开动分析的时候要进行一个所谓的划界,把你需要分析的专利都框到这个框框里来。那么客观的讲,我们给大家的这个检索式,中规中矩,该有中英文关键词有相当的扩展,分类号也是精准挑选了一番,但是,如果大家希望基于此进行个性化改造,那当然是没有问题,比如方向有:进一步扩展关键词,通过同在算符进一步细化表达方式等等,指明方向,各位尽管放手去做。

第二:布尔检索的这个传统范式是不是就是真理,是不是就是唯一,来口说无凭,看例子:

检索式:c/区块链 andnot a/区块链

该检索式表达的是概念检索“区块链”这三个字,但是概念可不一定非要是出现这三个字不可,这说白了是机器自己来决定到底是什么,那么我们就看看如果这个概念检索出来以后我们刨除掉白纸黑字有“区块链”三个大字的文献都是些什么,看下图:

区块链与zcash(Patentics光阴的故事系列)(3)

怎么样,靠不靠谱,显然出现了咱们上面给大家的布尔检索式里面扩展的一些词,比如:“联盟链”等等,这里我们说至少证明了两件事,一是传统布尔检索,如果就词检词,完全不扩展,那么简直就是开玩笑;二是,语义系统是科学,科学基于真正的研究,自然就会反馈真实的客观,比如此时,语义在你缺乏足够扩展能力时就能把缺失的东西,至少是部分,给补充回来。

第三:看到这里我们要讲第二波福利的核心思想了,即现阶段的技术手段赋予了我们更好的表达,在我们对一个目标领域进行划界的时候,应该同时考虑传统布尔以及语义生成,并将两者结合后再进行必要的数据清洗。来我们具体看看如何操作,也看看检验验证,是不是那么回事。

具体操作,对于布尔不多说,我们讲如何利用语义来圈定边界,这里有两个挑战要回答,第一个:基于谁来做检索基准?!即便是语义检索,那么也是应该有基准的,我们讲从香农的信息论角度,信息越丰富对应的就越能更准确的确定你要的信息,那么利用语义进行检索,我们讲,同样是区块链,你简单输入这三个字的效果肯定不如输入例如:百度百科,维基百科等一段话对于区块链的解释,如图:

区块链与zcash(Patentics光阴的故事系列)(4)

更进一步的讲,如果我们针对这些信息进行一定的筛选与编辑,就会是更好的基础,最后的检索式参考如下:r/”百度百科选定的一段话” and ctop/25000

上面的检索式的前半段好理解,我们上面已经讲过,后面的含义是,即ctop/数字,是限定你选定前面的概念从最相关开始一共截断多少个,当然是一个用户可以自定义的数字,比如,10,比如1万,比如10万。我们这里选择了2.5万是基于前面布尔算符的结果,因为布尔检索的结果是25000 ,据此我们认为大致是如此的一个数据范围,当然如果做详细,就一定要真实的考察一下,即具体看看数据的结果,并具体的人工验证一下。

区块链与zcash(Patentics光阴的故事系列)(5)

区块链与zcash(Patentics光阴的故事系列)(6)

参见上两幅图,我们将布尔检索与语义检索的文献进行了合并与区分,发现布尔检索到的25000 篇与语义框定的25000篇,其中有将近7000篇是完全相同的,这个肯定是好事,证明殊途同归,没有问题,我们想大家和我们一样真正关心的是剩下的,所谓布尔独有的以及语义所独有的,这些是什么情况,是谁在漏检?!

我们通过技术分组把文献进行大致的分组,这样很容易从“第一眼”先看一下到底靠不靠谱,是不是从根儿上就跑偏,结果就是上图,其实真的是即在意料之内也是很惊喜,就是两种检索方式所命中的文献看起来确实真的都很靠谱。

进一步的讲,可以理解说布尔也好语义也罢都存在一个边界到底哪里才是最好的问题,布尔确实可以通过继续扩充来获得更多的文献,但是多即意味着噪音的同步增长。语义也是同样,语义可以通过扩充最高相关度上限来开闸放水,放进来更多的文献,但是相关度的放水同样意味着不相关文献的混入。

两头努力都去做到极限的代价显然是高的,因为都会遇到一个所谓的“困难陡增曲线”,但是都各自做到不错确实相对容易实现,此时两种方法的可控程度都会很好,也就是操作者心中的把握度会很高,了解自己没有放水,选择的范围适中。

第三个福利就是,我们想明白了上面的逻辑后,憨直的索意终归是技术的索意,我们最擅长的还是技术实现分析师们心中所想。

如下列图解操作:第一步:检索布尔获得文献,打开分类器右键选择导入,获得第一个文件夹集合,布尔的集合;

区块链与zcash(Patentics光阴的故事系列)(7)

第二步:同理检索获得语义检索的文献,对应刚才的“布尔”文件夹进行追加导入,即主检索检索新的内容后,重复上图操作。

第三步:没有什么第三步了,就是见证奇迹了,我们为了方便用户,当一个新的检索,其实此时也没有额外限制,任意形式的新的检索,也就是对着原有存在的文件夹进行追加文献补充导入的时候,我们做了自动的去重,重复的东西自动就没有了,这还不算,我们做了自动标引,纯新引入的标引一类,新的与原有的共同的标引一类,原有的自成一类,三类分开清清楚楚。

怎么样,棒不棒!我们今天讲区块链其实讲的是专利分析第一课,数据,也是很多专家们口中的划界,对目标分析物进行划界。我们今天除了给大家派送布尔检索式福利更是把整个理念说清楚,把更先进的布尔与语义结合理念讲明白。

后期我们非常欢迎各位读者来投稿,基于Patentics客户端有了基础的数据集合,后面真的可以做出很多的花样来,我们欢迎有想法的同学们和我们联系,我们会提供试用账号,希望大家开心用起来,多发文章,投稿我们我们也有小礼物派送哦。

区块链与zcash(Patentics光阴的故事系列)(8)

文末还有小惊喜,就是之前内部测试组老师们的独享小福利,beta测试版的下载链接,目前的即将发布的4.3已经接近成熟了,我们提供链接供大家下载使用,感受好多好多的新功能哦(下载链接:https://www.patentics.cn/download/SetupCn64_Beta20191107.msi)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页