这一设想的提出者来自一位百度工程师,他在百度校园最近发布的“最有价值互联网技术问题”白皮书中提出一个问题:“如何让用户直接获取想要的查询内容而不是一个个链接”,并给出以上设想,以及详细的学术阐释、技术研究现状分析、技术关键点归纳,以及实现后的价值预测。
在2009年,百度提出“框计算”的概念,并逐步应用到百度搜索当中。用户将需求输入搜索框中,系统会把需求分配给最优内容资源提供商,返还给用户精准优质的搜索结果。如用户搜索天气情况,在搜索页面中能够直接看到中国天气网发布的天气情况,不用再点开链接看详情。但“框计算”对除去热门词条外的其他词条还不能覆盖,展现的不够立体。
“机器融合信息”(Machine Fused Information)技术对于一些需要立体展示信息的词条,建立智能知识库,不直接在知识库中记录全部内容,而是记录摘要并把相关搜索结果按照知识库字段进行分类。进而由机器自动生成一个信息融合页面,该页面能对与关键词相关联的各个属性有充分的说明。融合页可以作为一条搜索结果,和其它网页一样,在搜索结果列表中出现。如用户以商品名称做检索关键词,机器生成的页面包括:产品参数、参考价格、销售情况、厂家信息、网友评论、评测文章、关注度及二手交易信息等;对于某个地名,在信息融合页面中则会显示地图、周边设施、交通方式、网上评价等内容。
这一概念有哪些需要突破的技术关键点?“词条同一性分辨”技术,需要将不同名称、相同事物的相关描述,聚合到一起;把相同名称、不同事物的相关描述区分开来;“网页结构化”技术,解析网页的排版格式,理解某段文字或某个多媒体元素的含义;“评价综合”技术,包括感情色彩理解、用户印象标签提取、相悖描述的甄别技、逻辑顺序梳理技术等。
这种“信息融合页面”的设想,对于用户体验的提升的意义不言而喻。“即搜即得”在未来的实现,让我们不再在浩如烟海的信息中迷失,把大量的时间花费在信息检索中。网络信息进一步得到逻辑性、有条理的梳理,将为人们的生活带来极大便利,信息参考价值大大提升。
图:“李白”词条的信息融合页设想
注释:百度校园“最有价值互联网技术问题”白皮书介绍
凝聚百度百名工程师智慧的“最有价值互联网技术问题”终于整理完成。这些问题是工程师平时工作中遇到的、亟需解决的行业技术难题,每个问题进行详细的学术阐释、技术研究现状分析、技术关键点归纳,以及实现后的价值预测,共涉及信息检索、软件工程、系统架构、数据处理、应用服务五大类,涵盖了互联网前沿的热点、趋势、挑战。
希望这些来自工业界的前沿问题能够给大家的学习和工作带来一些有益的启发和思考,这就是我们的目的所在。同时,也希望大家参与到问题的讨论中来,也许你的参与,能够成为下一个互联网技术革新的关键动力!
由重庆网站建设公司整理发布 www.cqboss.net