开发者俱乐部
标题:
搜索中的互联网
[打印本页]
作者:
xunweb
时间:
2016-2-3 21:27
标题:
搜索中的互联网
演讲一开始,幻灯片上就显示出过去图书馆查阅图书的场景,马维英博士解释到,“其实我们最早的索引是从图书馆的目录开始的”,借助于目录,我们可以更快地找到相应的图书。但,随着互联网的出现,大量的网页涌现在互联网上,知识已经呈爆炸性的增长,人们获取知识的途径,也从最初跑图书馆,发展到利用搜索引擎来进行搜索。而今,人们如果遇到问题,往往要先从各大的搜索引擎搜寻一下解决方案。
目前流行的搜索引擎主要分为网页索引和结果排序等几个关键部分。这种搜索这种技术有点像图书馆的“倒排表检索”,把所有互联网上的信息组织起来。直到现在,其实也还没有超出这种思路。现在我们所看到的互联网上面,大概有上万亿个网页,其中约有亿的页面可以被检索而有可能出现在用户搜索结果里,也就是说,目前互联网上的所有网页中,最多只有用户有机会看到。而在信息大爆炸的当今,用户可能只有精力关注前100个搜索结果。如果再过10年这个比例可能会迅速降到百分之零点几了。
既然大部分的计算给用户带来的价值越来越少,那么,我们能不能直接关注用户的需求?能不能像完成用户交给搜索引擎的一个任务那样,帮助用户作出决策并采取行动,而不是给用户10个链接让他们逐个打开,自己判断其中是否包含有用的信息?另外,由于绝大部分的网页用户根本看不到,那能不能将这部分搜索资源应用到更多的像应用软件在线商店这样的细分领域?因此,如何让用户更满意,更喜欢用微软开发的搜索引擎,则是我们研究院从事该方面研究工作的研究员和实习生们密切关注的问题。
下一代搜索引擎:3个改变与5个方向
就下一个阶段的互联网搜索,马维英博士提出了下面一些新颖的观点。
搜索引擎索引结构的改变:目前我们在做搜索引擎的时候,往往是希望索引的越多越好,这样用户进行查询的时候,才不会因为我们索引中没有该网页,而返回不了用户希望得到的结果。可我们就上面的研究发现,索引中大约的页面,即便采用当前最好的排序策略,对于所有用户提交的查询,都无法被排到结果的首页,从而基本上就无法被用户看到,以至于白白地浪费了我们的服务器资源去存放这些网页。我们何不改变一下传统的索引模式,改为只去索引那些能被用户看到的页面呢?
(二) 用户的搜索行为的改变:当前的搜索引擎,仅仅接受用户输入的几个关键词语,就返回给用户结果。除了让用户输入关键词,我们还可以让用户提供一些其他信息,比如简单的语音,简单的构图,这些在搜索语音和图像时候,往往非常管用。马维英博士还当场展示了几个对应的
(三) 结果呈现的改变:目前在网页搜索中,我们对于一个用户提交的查询,都是返回前十个网页,这似乎已经形成了习惯,而导致大家都不希望去改变它。而我们研究院最新的一些研究成果,已经可以在很多方面提升用户的体验,在用户搜索一个关键词的时候,把该词语作为一个实体,将其各个属性都输出给用户,例如输入“中国”,我们可以提供人口、国土面积等信息。
基于此,我们从五个方向对未来搜索引擎进行了的战略性思考。第一是从组织所有的网页信息,到直接关注用户的搜索目的。搜索引擎一开始的目标是希望组织所有的页面,这个概念非常强大,但有弱点,而且现在的效率已经越来越低。因此要通过做需求理解 来关注用户的需求是什么,而不再是关键字搜索;第二是建立知识库,利用各式各样的挖掘技术,把结构性中的对象 关系抽出来之后,以知识的方法来表示;第三是语义的检索与任务完成,也就是帮助用户完成任务的搜索;第四是从搜索内容走向搜索应用和服务;第五是云平台和建立生态系统,在这样的生态系统中,会有更多的开发人员创建自己的微应用和微服务。
微软下一阶段的搜索策略:“云+端”平台的整合
在搜索之外,对于另外一个热门的话题“云计算”,马维英博士也说出了自己的看法。他说道,微软在云计算的道路上已经迈出了自己的步伐,将操作系统都搬到云中去了,这意味着,以后我们可以利用一根网线,控制自己的操作系统,并且获得云中的服务。
其他的大型互联网公司都有自己独特的云。总体来讲,目前的云存在如下几类:第一种是信息云,目前的几家主要的搜索引擎供应商是该领域的领导者;第二种是社交媒体云,比如Facebook之类的网站中,包含了相当多的用户数据;第三种就是娱乐云,比如的平台上也存在着大量数据和信息。这些云如果在将来结合在一起,其所产生的机会将不可胜数。
而从搜索应用的切入角度看,最有希望和机会的是社交媒体搜索。搜索会与社交网络发生更多的融合,比如通过找人与人的关系,微软亚洲研究院开发的“人立方”关系搜索引擎,纯粹是机器自动抽取数据和信息,而这些信息全是上的用户手工产生的,这无疑将会得到非常全面的关系图谱。
PC已发展了30年,直到今天还有很多数据是以“孤岛”的形态存在你的手机里、即时通信软件里、在图片库里等等。“云+端”可以连接所有的数据、设备、应用和服务,最终连接所有的人和事件。数据是核心,“云+端”平台的整合,就是要把人类社会历史上的最后一公里走完。这也是我们所正在面临的一个历史机遇。其下一步就是所谓的自然用户界面,比如“云+端”的界面,这会让任何人都更加便捷地像使用搜索引擎那样拥有超级的计算能力。
欢迎光临 开发者俱乐部 (http://xodn.com/)
Powered by Discuz! X3.2