第298章 科技民主化(2/2)
“啊”周浩然很吃惊,“是吗”
霍普斯教授点了点头,缓缓的说:“不过你的理论更全面更有深度,搜索算法也在贯彻‘科技民主化’的宏观理念……好人,你是互联网哲学家啊!”
周浩然笑笑,“互联网精神不能口说无凭,在算法的设计上和架构的搭建上,都要有始有终。”
“嗯。”
霍普斯教授点了点头,又了几分钟看了一遍他的论文。
论文不算长,也就1000个单词左右。
阐述的主要是搜索思想,而非算法实现。
“你要不要跟我们的那个小团队谈谈”霍普斯教授进一步的有了确认,“真的,你们的算法思想简直一模一样。要是他们看到了你的论文,或者能得到你的指点,我相信对他们来说一定是巨大的帮助。”
周浩然笑道:“可以啊,走!”
谭明亮觉得可惜。
心说这个小周,太善良了!
好东西要藏起来啊。
“你的科研成果,就真的要这样分享出去”
谭明亮趁着导师打电话联系人的时候,很心疼的质问。
周浩然很大气,“学术交流嘛。”
谭明亮不舍的说:“学术交流,这也不是单方面的。学术交流那都是骗人的,实际上应该是学术交易。要真是学术交流,为什么国内没人有资格进圈跟他们交流这是交易啊,你不能把你的本钱都白送啊!”
周浩然不以为意的说:“都什么年代了,咱们不能用李鸿章的对外思想了,把洋人当傻子,吃亏的一定是自己。还是得多学学曾国藩,真诚才是必杀技。”
“你啊!”
谭明亮恨铁不成钢,觉得这小子太不成熟,回学校了得跟老院长好好聊聊。
另一边,霍普斯教授已经联系好了。
是系里的另一个安德鲁教授。
那个项目,是他手下的几个研究生在做,申请了2.2万美元的科研经费。
项目名叫做“backrub”。
顾名思义,这是个围绕着“反向链接”做理论指导的搜索项目。
跟周浩然的搜索思维很像!
现在的搜索算法,大部分都是全文检索。
搜索平台要对所有的网页进行检索。
最关键的来了。
怎么把网页排名
理论上,肯定是应该把最相关最符合用户需求的网页排在前列。
这就是最大的技术难度了。
怎么来判断一个网页,最符合用户的需求
是按关键词的数量排列。
网页里关键词出现的越多,排名就越靠前。
就比如搜索“旅游”。
一个网页里,全文检索后,“旅游”两个字出现了100次;另一个网页里,“旅游”这个关键词出现了101次。
那么,后者的排名就会靠前。
关键词最多的网页,就会排在搜索首页的第一位!
这种方法简单粗暴。
缺点明显。
需要爬虫所有网页,需要检索全部内容……需要的算力太多了,就导致服务器的压力太大,搜索速度太慢。
还有一点,内容也不够精准。
谁说关键词出现的次数越多,内容就越好
真正的好文章,可能是全文都没有“旅游”二字,但处处都是围绕着“旅游”的点点滴滴。却因为算法的不足,缺乏关键字,无法被用户搜索到。
周浩然的搜索思想,就跟他这段时间的交流会里一直表达的“科技民主化”的提议很相符。
采用的是投票制。
谁获得的投票多,谁的网站就排名靠前!
投票的策略,就是反向链接。
一个旅游内容的网页,会链接接到另一个网页;另一个旅游内容的网页,可能也会链接到相同的网页……
这个超链接,就是投票!
要是100个旅游相关的网页,都同时连接到了同一个旅游主页。
那就说明这个旅游主页获得了100个网页的认可,获得了100票!
一个旅游网页,被许许多多的旅游相关的网页都链接了,都关联上了,就充分说明这个旅游网页获得了业内同行的认可!
价值含量极高!
这就是投票制。
靠着投票,来把所有网页内容进行排列,按照票数的多少来排名先后,推荐给用户。
内容质量就大大提升了。
用超链检索取代全文检索,需要的算力也会大幅度减少,搜索速度也就大大提高了。
这可以说是充分的践行了互联网“科技民主化”的大理念。
恰好,斯坦福大学里也有研究生,在做类似的课题研究。
谭明亮长吁短叹。
觉得好吃亏。
周浩然却兴致勃勃,跟着两位老教授,一起去了这个“backrub”项目实验室。
这个项目组,一共就只有四个研究人员。
两个博士,两个硕士。
周浩然在意的是那两个博士。
“你好,我叫拉里,拉里佩奇。”
“周先生,你前天的座谈会,我去现场听了,真让人心潮澎湃!你说的‘科技民主化’的概念真好,我是谢尔盖,谢尔盖布林,很高兴认识你。”
看着眼前这两个蓬头垢面的年轻人。
周浩然长舒了一口气。
这下妥了!
找到正主了!
没错,就是他俩!