第三千八百二十五章hits算法(1 / 2)

一秒记住【】

对着旁边的工作人员挥了挥手,很快5块白板被抬到了报告台上。

白板他们准备了很多,原本打算的是给秦洛准备的。

结果没想到,却先一步用到了乔恩·克莱因伯格的身上。

“谢谢。”乔恩·克莱因伯格道了声谢,然后目光看向了众人:“在我正式论证之前,我想先像各位讲讲什么是hits算法。”

“这是一种,全新的计算模式,当用户输入关键词后,算法对返回的匹配页面计算两种值,一种是枢纽值,另一种是权威值,枢纽值指的是页面上所有导出链接指向页面的权威值之和。权威值是指所有导入链接所在的页面中枢纽之和……”

“相较於传统的pagerangk算法,hits算法能够更好地描述互联网的组织特点,而且收敛速度更快,减少了搜索时间……”

“……”

洋洋洒洒,乔恩·克莱因伯格将hist算法的优点简单的阐述了一遍。

内容很多,但是归结起来就是两句话。

hits算法的反应速度更快,花费的时间更短。

简单的对hits算法做过介绍之后,乔恩·克莱因伯格开始做正式报告。

“我是这样想的,将查询q提交给基於关键字查询的检索系统,从返回结果页面的集合中取前n个网页(如n=200,作为根集合,记为s,则s满足:

“1.s中的网页数量较少”

“2.s中的网页是与查询q相关的网页”

“3.s中的网页包含较多的权威网页”

“……”

“通过向s中加入被s引用的网页和引用s的网页,将s扩展成一个更大的集合t.以t中的hub网页为顶点集v1,以权威网页为顶点集v2……”