Fwd: 华中科大研发新系统 搜索引擎取代Google
cai 发表于 2004/04/15 12:22 华中科技大学校友论坛 (www.hust.org)
送交者: bielao 2004年4月14日09:50:14
导读:互联网上有大量形形色色的资源,这些资源分布在互联网的各个角
落,如各个大学的图书馆。在这种情况下,信息检索技术的提高已经成为
互联网发展的重中之重。因为对于用户来讲,如果能够构建一种单一的界
面用于搜索所有的互联网数字资源将会节省大量的时间。目前,来自华中
科技大学的研究人员在这一研究课题上已取得突破性进展。
随着网络资源成几何级数的增长,当前以Google为代表的网络搜索引擎已
经显得力不从心,因为任何一个搜索引擎的数据库都不可能和整个互联网
的增长保持完全同步。仅就网页资源一项来说,当前所有的网页搜索引擎
的覆盖率都小于60%,而且其更新速度一般都在一个月左右。在这种情况
下,建立一种全新的网络资源检索系统已经势在必行。
中国华中科技大学的研究人员研发的分布式信息检索系统就是这方面
的佼佼者,这一系统最终将会成为域名服务的一个扩展,成为互联网基础
结构的一部分。华中科技大学研究员王亮表示:“域内资源整合系统
(Domain resources Integrated system,简称DRIS)将帮助用户对互联网上
的资源进行搜索,而完全不需要考虑该资源是存在于网页还是数据库。”
华中科技大学研发的这种DRIS系统把网络资源分为三个层次:单个
域,如一个大学或公司;子网,如包括中国所有大学在内的中国教育网
(CERNET);以及顶级域,如整个中国互联网。王亮透露,目前华中科技
大学研究人员研发的产品原型已经实现了对该学校内部Web、FTP以及数
据库资源进行统一搜索的功能。
每一个层次对于搜索功能的要求都不尽相同,而DRIS系统虽然仅提供
了最基本的资源搜索功能,但可以通过同其它软件协作来实现各种定制的
搜索功能。王亮称目前他和他的同事们正在试图建立一个整合了所有中国
国内大学资源的DRIS系统。他表示:“我们将会首先在中国教育网建立一
个试验型的DRIS系统,一旦取得成功,我们将会在政府部门的帮助下把它
扩展到整个中国互联网。”
这一测试性DRIS系统将采用分布式标准、独立与操作系统的搜索界
面、信息检索协议、标准元数据统计系统以及标准公开网页搜索系统,同
时这一系统还将考虑采用下一代互联网标准,如IPV6。王亮称他们最终的
研究目标就是将DRIS系统集成到互联网上,他说:“我们希望每一个互联
网用户都能建立一个这样的概念,搜索是互联网所固有的功能,每个人都
应该拥有个人的搜索引擎。”
一旦将DRIS系统集成到互联网,将可以有效的去除各种不相关或是过
时的搜索结果,覆盖更多大学或其它方面的数据库,同时还可以减少目前
的搜索引擎创建网页索引所产生的流量。目前的搜索引擎提供给用户的搜
索结果都千篇一律,而个性化搜索引擎的出现将帮助用户在进行搜索时能
够量体裁衣,
王亮表示,通过将个性化前端搜索引擎同集成到互联网的搜索功能相
连,未来每个人都将拥有自己的搜索引擎,届时雅虎、Google等商业搜索
引擎将不再有市场。华中科技大学相关课题组计划在2004年夏天完成基于
中国教育网的试验型DRIS系统,这一课题获得了中国高等教育文献保障系
统(CALIS)的大力支持。
〖校友论坛索引首页〗