TA的每日心情 | 开心 2016-10-18 06:23 |
---|
签到天数: 72 天 连续签到: 1 天 [LV.6]常住居民II 扫一扫,手机访问本帖
|
信息检索(Information Retrieval),通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。
多媒体信息检索系统MIRES
近年来随着计算机网络的全面普及,多媒体信息检索发展很快。IBM公司数字图书馆方案将物理信息转化为数字多媒体形式,通过网络安全地发送给世界各地的用户。自然语言查询和概念查询对返回给用户的信息进行筛选,使相关数据的定位更为简单和精确。聚集功能将查询结果组织在一起,使用户能够简单地识别并选出相关的信息。摘要功能能够对查询结果进行主要观点的概括,这样用户不必查看全部文本就可以确定所要查找的信息。IBM Almaden 研究中心推出了QBIC系统。该系统开创了图象信息查询的全新领域。图像可以按照颜色,灰度,纹理和位置进行查询。查询要求将以图形方式表达,如从颜色表中选取颜色,或从例图中选择图像的纹理。查询结果可以按照相关的序列指导子序列查询的进行。这种方法能够使用户更为快速和简便地对可视化信息进行筛选和确定。在“863”高技术项目支持下, 我们研究基于特征的多媒体信息检索系统MIRES(Multimedia Information REtrieval System)。
运行环境:
该产品客户端、Web服务器端使用Java语言开发,应用服务器使用C++语言开发,然后使用中间件服务器CORBA进行集成。应用服务器可运行于Windows2000,Windows NT,Windows Server。Web服务器可运行于各种主流操作系统,包括Windows,UNIX,Linux,Macintosh等。要求具有Java运行环境(Java虚拟机JVM),如JDK1.3以上,另外还必须有中间件CORBA服务器,如visibroker ,orbix等。Web服务器的支撑软件可是支持JSP/Servlet的任何平台,如TOMCAT等。客户端仅要求支持Java的网络浏览器,如IE4.0等。硬件上要求PII、256M内存以上或者Sun、HP工作站等主流机型。
主要功能:
在MIRES的客户端,用户可以完成以下功能:
(1)提供要检索的样本图象提交给图象服务器;
(2)提供要检索图象的语义关键词提交给图象服务器;
(3)用户可以以上两种模式交互混合检索所需图象。
(4)对样本图象检索方式,允许用户设置各种特征的重要性系数;
(5)对返回的结果图象组,用户可以通过交互式反馈,使检索更为符合用户的要求。
在服务器端,接收客户端回传的检索请求,进行分析,选择查询策略,启动检索引擎进行检索;将查询结果图象排序后返回客户端。服务器还要完成对检索进程的管理、图象数据库的管理功能。 接口和封装功能,能对各种已有软件或者程序进行良好的接口和封装,包括外挂式、内嵌式以及动态连接库等方式接口。 运行平台能够提供网络运行模式,即一个平台可以分布在多台计算机上,而多个平台也可以相互进行通信和服务访问。客户端与服务器端之间要有友好的、高效的通信方式,并能选择不同的协议进行通信。
关键技术:
●基于特征的图象信息检索:图象信息具有丰富的内涵,给人以直觉、形象、生动的感受,在多媒体信息中是一种重要的信息形态。重点研究按照颜色、 形状、纹理等特征对图象信息进行检索。
●中文信息全文检索:研究中文信息全文检索方法,具有布尔检索、截词模糊匹配检索、完全字符串匹配检索、位置相邻检索等多种检索机制。利用相关索引机制,提高检索效率。
●内容的创建和获取:将物理形式的资料转化为数字信息,并进行压缩和转化。多媒体信息载体由于采用了大量的图象、视, 其数据量比传统以文字为主的单媒体要大数百倍。数据的压缩及还原成了多媒体发展的一项关键技术。
●信息存储管理:存储对象可以是文本、图形、图象数字化信息等。研究大容量信息组织管理方法,探索多维空间索引方法以提高信息管理的有效性及检索高效性。信息存储管理采用客户/服务器方式。
●跨平台的客户端检索:跨平台的客户端检索技术就是解决网络环境(特别是Internet/Intranet环境)下,多种软、硬件平台上统一的图形检索界面问题。网络环境中,不同检索客户端的软、硬件配置千差万别,跨平台的客户端检索技术将使这些差别对用户透明,不同平台上的用户将使用统一的图形检索界面进行检索工作。
|
|