谷歌第二大脑使得搜索完全改变(一)


谷歌第二大脑使得搜索完全改变

 12/12/12 

在 1983年发行的科幻喜剧电影《男子与两个大脑》中,史蒂夫 · 马丁扮演的迈克尔-Hfuhruhurr,娶了他的一个病人为妻,后来却爱上了另一个女人安妮的大脑。迈克尔和安妮保持着心灵上的沟通,直到迈克尔的结发妻子被谋杀,才得以把安妮的大脑移植到妻子的体内。

虽然谷歌天天见,但你可能没有注意到她也正在进行脑移植。而且,跟Hfuhruhurr医生一样,你会更加喜欢新的版本。

一般来说,谷歌以前是统计专家的化身。除了按关键字索引数千亿网页之外,它新增了一些微妙的功能,如用户的查询中的人名识别、 短语解析,纠正错词等。但这都是以谷歌庞大搜索日志为依托的数学计算。这些日志记录了人们输入的查询词和点击的网页链接。这些并没有发掘更加底层的信息,比如谷歌的算法不知道"旧金山"是一个城市而"旧金山巨人队"是一个棒球队。

现如今,这种情况正在发生改变。当在谷歌中输入搜索词时,谷歌会启动两个独立并行的搜索系统,一个跑在基于关键字的传统网页索引上,返回按照相关性排序后的结果,即所谓的"十个蓝色链接"。而另一个则运行在一个新的数据库上,这个数据库存储了命名实体及其关系。

查询“费城”时,第二个搜索系统会在结果页的右边显示“知识面板”,里面有一个地图还有其他包括创建人威廉 · 佩恩在内的一些基本信息(与此同时,谷歌还显示了汤姆 · 汉克斯在1993年出演的电影《费城》的电影海报)。根据谷歌的说明,新的数据库使得搜索引擎从之前的对关键字串的搜索变成了对“物”的搜索。

这个第二大脑被称为知识图谱英语国家的人在五月份就用上了这种给力的搜索服务而且从上周开始,这项服务推广到了七种其他语言的国家。而知识面板背后的故事则要追溯到 2010 年年中,当时谷歌收购了一家旧金山的名叫Metaweb Technologies创业公司并且决定使用这家公司的大规模语义数据库---FreeBase。这个数据库按照人类理解世界的方式来为项目组织数据。

谷歌的数据库是通过文档之间的关联而建立的粗糙结果的集合。相反,Metaweb 的成果是经过核实的事物及其关系,是一部拥有超过 5 亿 7000 万的事物和 35 亿的关系的人类百科全书。(费城是一个城市,城市是州的一部分,而州又是国家的一部分; 它有多少的人口,还有典型的天气,等等)

虽然知识面板是知识图谱的最常见的样式,新的信息帮助合理安排几乎一切谷歌在做的事情。这个结果也是比较彻底的。虽然真正的人工智能还有很长的路要走,但知识图谱已经算是一种通过软件满足我们的信息需求的快速入口。最基本的,谷歌工程师正在构建公司著名的“手气不错”,使其第一次和每一次都能返回完美的结果。

Amit Singhal, Google's top search guru

Amit Singhal,谷歌的热门搜索大师

阿米特辛格尔(Amit Singhal)是谷歌高级副总裁,负责改善谷歌核心搜索算法。他说:"这是让计算机拥有理解能力的一次尝试"。"现在,当在任何网页上出现字母 T-A-J-M-A-H-A-L ,计算机马上就能够理解,本文档是关于纪念碑的,或者这个是音乐家,或者这一个是关于一家餐馆。挖掘“相关内容”(aboutness)是构建未来搜索的基础。

财富杂志》最近采访中,谷歌首席执行官拉里 · 佩奇说在过去的 10 年他一直在推动这种变化。他说:"完美的搜索引擎会理解您的真正需求。它能深入地了解世界上的一切事物,返回你真正需要的内容“

当然,Google (纳斯达克: GOOG) 并不只是一个搜索引擎,她也是去年收入370亿美金的广告市场,她还是一个媒体平台 (YouTube),是云计算服务 (Gmail 和谷歌驱动器)提供商 ,是浏览器软件 (Chrome) 和移动操作系统 (Android) 的领头制造商。若一个搜索引擎能够理解“相关内容”,那这将改变她的整个帝国。到目前为止,究竟怎么做尚无线索,但所做的改变至少会与以往公司的大型核心技术一样的具有深远意义。

首席工程师Shashi Thakur 对通用搜索2007年引入知识图谱项目的先后作了比较。这种改变使得用户首次能在单个页面内搜索网页、 视频、 地图、 图像和书籍,对谷歌的整体流量产生了巨大的推动力。最终,知识图谱项目可能比通用搜索具有"更大的战略影响",Thakur 说。

翻译未完,待续。

另:文章好长,鄙人翻译比较慢,英文原版见:http://www.xconomy.com/san-francisco/2012/12/12/google-gets-a-second-brain-changing-everything-about-search/?single_page=true



注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
© 2014-2018 ITdaan.com 粤ICP备14056181号