P2P网络是对网络边缘资源的利用,它的能力被广泛应用到现代化的信息检索机构当中,其中对于网页缓存资源的利用,提出了以节点所拥有的信息通过广播和共享模式传输的就是路由模式。接下来本位以信息量声誉激励方法和节点兴趣域聚类方法为进行,对P2P网络中的兴趣域和非结构化进行研究分析,然后构造相对应的动态结构模式。在分析的时候我们结合辅助信息量,对网络系统的节点数据进行综合评价和分析,最终通过仿真实验证明了P2P网络检索方法的有效性和科学性。
1 P2P网络检索算法
定义:P2P网络检索算法主要由以下几个基本点构成,首先是信息量,通过节点信息量让系统在最短时间内进行兴趣度的计算;信息量的相似程度,通过公式反映就是 ,公式中的( )决定了网络信息量的好坏程度,同时Sim(Ni,Nj)所得值越小,相近程度也高;还有节点兴趣和节点兴趣的相近程度,利用兴趣相近度的方法,可以把节点信息量以兴趣为基准进行分类。其中还有兴趣域的定义、语义分析和用户个性化设置等。通过这些信息和数据都可以将搜索得到的数据进行非常细致、准确的划分和组合,最终目的就是为用户提供一条非常准确的消息值。
P2P网络检索算法由以下几部分构成,第一部分:人机互换。用户在登陆之后,输入相对应的关键字词,系统就会根据用户提供的关键词语进行相关信息的搜集,然后用户可以根据的需要选择保留或者推出P2P网络。第二部分:语言的分析。对于用户输入关键字进行相近词的分析,而且在分析的时候会产生一定的词语联想技术分析词语的意思,然后产生相对应的辅助词语供用户选择。第三部分:网络拓扑结构。P2P网络检索模式是依赖兴趣节点对于所含信息量的有效程度,然后把相同兴趣的节点信息分门别类,在此基础上计算相邻节点的信息,构成系统需要的声誉激励法兴趣树,最后就会形成P2P网络拓扑结构。第四部分:信息的检索。第一步要在P2P网络检索系统中发布检索关键词内容的指令,目的是确定为P2P网络检索系统提供可以使用的信息节点,然后在搜寻到满足用户检索要求的时候,对信息节点内的全部资源进行搜索。第五部分:综合信息的处理。P2P网络检索系统对于检索出来的没有链接效应和空白链接会及时的删掉,然后P2P网络检索系统依据兴趣相近的程度和用户关键词的要求,对已经搜索到的结果进行排列组合,最终呈现给用户一个较为满意的数据信息。
P2P网络检索模式主要是通过“进入节点”和“退出节点”兴趣树的形式对其进行数据更新,主要是通过兴趣树更新可以确保相同节点信息从始至终都在一个固定有效的范围内,在用户检索的时候提升了工作效率。针对用户输入关键词语方面,P2P网络检索系统会进行语义分析,分析采用的是辅助语义和语义分析相互结合的方式。按照检索信息判断出在线的服务节点,然后在网络缓存数据中进行地毯式的搜索,目的在于满足用户个性化设置的要求。
2 P2P算法的分析
P2P网络检索算法是对节点信息和和个性化服务为基础形成的兴趣树结构和网络拓扑结构,然后根据信息量的相近程度对兴趣相邻节点的数据进行匹配和选择,其中数据资源就是网络缓存下来的资源和每个节点存在的数据资源。
2.1 兴趣树的构成。部分步骤如下
第一步:Start //所有变量进行初始化操作。第二步:scanf Z //调入资源库Z。第三步:for(F{each Ei=Si}) //判断条件;{ If( 0 < k0 < t0) / /如果信息E 与S0节点信息量兴趣相似度在额定值t0内;那么t0∈ S0; / /然后在信息E 节点信息量中添加进S0节点集合,最后更新S0;第四步:(0-i,m)→S// 生成兴趣的集合,然后构建P2P网络拓扑结构。第五步:for ( j = 0; j < = d; j + + ){ if ( 0 < ki < tj) / / 若兴趣相似度满足兴趣树第j层阈值; Else ki∈ Ynew / /生成新的兴趣树;End if } End for。第六步:S=S;Y=Y;//输出网络拓扑图,得到兴趣树Y,及时对其更新。
2.2 P2P网络检索机制。部分步骤如下
第一步:Start //所有变量进行初始化操作。第二步:同义词分析、近义词分析和语义分析//进行语义的分析,生成辅助语义。第三步:同义词分析→(M∪ N)→E //确定检索的词语。第四步:if Sean(S∩e)=e;go to第五步//如果检索信息的节点在线,那么就继续执行第五步。如果说Else Scan = = null; return not answer//那么就是说扫描的结果是0,返回上一步。第五步:For ( search E ∈ S){ if ( 0 < k < t0) / / 如果信息E 和S0中信息量的兴趣相似度在额定值t0内;输出 Y0 / / 扫描Y0;If Y0j ∩ E = E , / / 扫描Y0的第c 层节点序列;Y0 = Y0;S0 = S0 / / 兴趣树Y0和节点集合S0更新;End for。第六步:判断集合N属于集合L// 资源列表L进行更新。
3 试验仿真
实验环境配置:同一种网络环境下的PC机,配置的系统是Windosw 2000 Professional,处理器是Intel Pentium 1.73GHz,缓存数据是128M,P2P网络协议是BestPeer,编写程序的环境是VC++2005。实验使用的参考数据是在TREC中随机抽取5000份资源。实验在开始的时候,要对抽取的文档资源进行网络拓扑结构的生成和兴趣树的构成,然后才可以进行信息检索的评测。其中全部检索率是V,检索准确率是B和G: ; ; 。上述公式中的I就是根据检索条件得出兴趣树的数量,R:兴趣集合的数量,W:供用户选择的信息量,G:综合分析指标。下图是我们在试验的时候,分别对四种不同兴趣度的数据信息进行检索操作,
从上述表格中的数据看得出来P2P网络检索方法具有非常好的检索效率,然后通过Q综合评价的计算值得出,P2P网络检索方式的非常准确和有效的,从基本方面来说已经实现了实时搜索的功能。
每个算法的执行时间都会随着规模的增大在增加,而且P2P网络检索计算方法相比较其他方法耗时是最少的。在计算初期的时候,因为经常使用公共数据中缓存的文件,所以在小规模的随机抽样中路由方式存在一定的优势,但是根据本文需要探讨的内容,以语义分析和兴趣树为基准进行计算的时候,耗时还是非常长的,并且搜索的效率很低。但是当节点规模慢慢变大的时候,本文所提到的P2P网络检索方式的优势远远超过路由
模式。因为本文提到的P2P网路检索方法对兴趣域向邻近的节点进行值域划分和定义的划分,因此在计算的时候,如果说节点规模非常大的时候,会呈现一种非常高的执行效率。
4 总结
通过上述材料的具体分析,我们具体分析了P2P网络检索算法、P2P算法的分析和试验仿真三个方面的相关问题,以兴趣域聚类为构建数据进行动态数据的构建,然后把信息资源相关的节点数据按照兴趣类别进行规整,然后就形成了我们需要的非结构化的P2P网络,根据用户输入关键语义开始搜寻节点信息数据,然后对最优声誉节点数据进行更新。通过仿真实验证明了P2P网络检索算法的执行效率和有效性能。
参考文献:
[1]项兴彬,曾国荪,夏冬梅.P2P环境下文件共享的信任建立博弈模型及稳态分析[J].计算机应用研究,2010(19):100-103.
[2]刘凤鸣,丁永生.基于进化博弈的P2P网络中信任计算的动力学分析[J].计算机应用研究,2010(18):120-123.
[3]刘凤鸣,丁永生.基于生态网络的P2P环境信任博弈进化模型[J].计算机工程与应用,2011(23):200-205.
作者简介:吴谋硕(1978.08-),男,湖南湘乡人,副教授,硕士研究生,研究方向:网络信息检索。