国外六个著名搜索引擎的特征和评析
《现代图书情报技术》 2001年 第1期信息检索技术总第84期国外六个著名搜索引擎的特征和评析徐建华 伍 宪 胡燕菘(深圳大学图书馆 深圳518060)【摘要】 对国外六个著名的搜索引擎Altav
《现代图书情报技术》 2001年 第1期
信息检索技术
总第84期
国外六个著名搜索引擎的特征和评析
徐建华 伍 宪 胡燕菘
(深圳大学图书馆 深圳518060)
【摘要】 对国外六个著名的搜索引擎Altavista 、E xcite 、Go 、Hotbot 、Lycos 、Yahoo 的数据库规模和范围、信息采集方
式、标引内容、检索功能、结果显示格式、结果排序规则与数据库更新频率等七个方面进行了比较和评析。
【关键词】 因特网 搜索引擎 网络检索工具 【分类号】 G 354. 2
An Examination of Six Popular Web
Search Engines on Abroad
Xu Jianhua Wu Xian Hu Yansong (Shenz hen Univ ersity L ibr ary , S henz hen )
【Abstract 】 T his ar ticle evaluates six po pular W eb Sear ching Engines:Altav ista, Ex cit e, Go , Hot bo t, L y co s, and Y ahoo. T hese databases ar e compar ed and ana ly sed in seven a spects:sco pe and size, co llecting met ho ds, index ing and abstr act ing, search features, displaying , sor ting , and updating frequency.
【 Internet Sear ch eng ines N etwo r k r etr iev al to ols Keywords 】
Inter net 搜索引擎就象信息海洋中的导航员, 能帮助人们快速找到所需要的信息。然而随着各种信息的巨量增长, 人们使用搜索引擎也遇到了困难, 相同的检索词在不同的搜索引擎中得出的结果在质量和数量上都有所不同, 产生这种现象是因为不同的搜索引擎采集信息的方法、标引的内容以及检索功能是有所区别的, 这样就导致利用相同的检索词在不同的搜索引擎中获得不同的结果。本文将对Int ernet 六个著名的搜索引擎的特征进行比较和评析, 通过比较不同搜索引擎的工作方式, 有助于用户正确地掌握不同搜索引擎的使用规则, 轻松方便地上网查找信息; 另一方面, 还可以帮助网页设计者根据搜索引擎的要求去设计和提交网页, 确保证自己的网站能被搜索引擎收录, 并且在进行检索时能得到较高的排名。
件标引网页的内容是不同的, 有些对网页全文进行标引, 有些只标引网页的地址、篇名、题名、特定的段落和重要的词。不同的索引软件建立数据库的规模不一样, 数据库规模的大小决定查询到的信息是否全面和查全率的高低。数据库越大, 检索到的结果越多。查询软件负责在数据库中进行检索, 并将查询到的结果返回给用户。查询软件决定搜索引擎的检索功能和返回结果的相关性。在检索过程中, 该软件还会利用特殊的计算机算法对文献与检索词的相关性进行计算和评估。不同的搜索引擎使用各自的标准对相关度作出判断, 这些标准包括:标题、网址、题名、M eta 标记等, 根据检索词出现在文件中的位置、频率、多个词检索时所出现的检索词数量的多少等。
1 搜索引擎是如何工作的
机器人搜索引擎一般由搜索软件、索引软件和检索软件三部分组成。搜索软件, 通常称为机器人(Robo t ) 、爬虫(Cr aw ler s ) 、蜘蛛(Spider s ) , 它们是可以运行在W WW 的空间、能够沿着网站的链接从一个页面跨越到另一个页面, 自动追寻和发掘网上的各种文献信息资源, 采集新出现的信息, 确认网页之间的链接是否有效, 剔除死链的一种软件。一般来说搜索软件通常最先访问知名度高的服务器。所谓知名度高, 是指服务器和网页的" 被链接率”高。索引软件将采集的网页信息进行自动标引, 建立索引数据库。不同的索引软
2 六个著名搜索引擎的特征和评析
下面将从数据库规模、信息采集方式、标引内容、检索功能、结果显示格式、结果排序规则、数据库更新频率等七个方面对六个著名的搜索引擎进行比较和评析。需要指出的是, 随着时间的推移, 搜索引擎的某些特征可能会有所变化。2. 1 A lta Vist a 网址:http://ww w. altav ista. co m/
A ltaV ista 是资格最老的搜索引擎之一, 1995年由著名计算机Dig ital 公司正式推出, 1998年被Co mpaq 收购, 为了将其发展成为提供Inter net 信息和电子商务服务的主要网站, 今年1月又从Co mpaq 中独立出来, 成为自主运营的子公司。新近开发的3. 0新版为电子商务站点、信息门户和B2B 市场等增添了很多额外的搜索功能。这些功能包括对整个网络、数据库以及200多个不同的文件类型进行搜索。是
收稿日期:2000-07-16
,《现代图书情报技术》 2001年 第1期
信息检索技术
总第84期
目前最受欢迎的因特网搜索工具之一, 它以其搜索功能强大, 响应速度快和巨大的信息量著称。
数据库规模和范围:数据库中已包括2. 5亿个网页, 在搜索引擎库容量排行榜上列居第三, 仅次于Inktomi 和FAS T 。在1999年以前它一直以最大的数据库称雄于网络之中。AltaVista 提供关键词和分类目录检索。检索内包括产品、6-14天的新闻、讨论组、W eb 页面、图像、视频等信息。M P 3/音频、
信息采集的方法:A ltaVis ta 采用用户提交和利用网络机器人自动搜索的方式增加和更新数据库。它的超级蜘蛛“Scooter ”每天会不断地在网上搜寻, 及时发现网页的变化, 并自动地将更新的信息在索引中反映出来, 每天至少更新300万条信息。机器人可以识别假冒伪劣的网页, 并对其进行惩罚。所谓的假冒伪劣网页是那些重复使用关键词或者将一些与网页主题不相关的热门词汇做成与背景相同的颜色来欺骗搜索引擎以获得较高相关性等级的网页。
标引内容:对网页的所有文本(包括标题、文摘、关键词、全文) 、图像、链接、锚点、域名、主机名、M ate 标记、URL 和Applet 、Acc-tivex 等进行标引。摘要通常是M ate 描述标记的内容, 如果无此项则利用文献中的前两行编制一个简短的文摘。
检索功能:AltaVis ta 支持简单和高级查询。可进行单词和词组检索(用双引号) , 词间缺省关系为or, 可用自然语言进行检索。如果要求特定单词包含在索引的文档中, 可以在它前面加一个 号, 如果要排除含有特定单词的文档, 可以在它前面加一个-号。利用通配符*进行截词。在高级查询中, AltaVis ta 支持全功能的布尔逻辑式检索、近似搜索, 能将文本译为多种语言, 在主页列出了热门站点, 它还提供日期限定, 语言限定, 字段限定等扩展功能, 可进一步提高用户的查准率。字段限制包括篇名、域名、主机名、图像文件、链接点、URL 等。在字段检索中可以采用布尔逻辑式表示是AltaVista 的独特之处。此外还可利用Ask Jeeves 自然语言技术和分类目录进行检索。
结果显示格式:包括篇名、文件的前两行、URL 文件大小及文件索引的日期。另外还提供对网页进行翻译和利用“查Related pages ”找相关的网页信息的功能。
结果排序规则:AltaV ista 根据每个文献包含检索词的数量, 关键词出现的位置和关键词彼此接近的程度等信息给出一个等级。如在结果的前几个单词中含有要查找的单词(特别是网页的标题) , 或在结果中要查找的单词很靠近, 或该结果比其它的结果含有更多的要查找的词则会得到较高的排序。
数据库更新频率:索引内容大约每4~6周全部更新一次。评价:数据库容量大, 用户介面友好, 在线帮助文件完整, 检索速度快。是目前检索软件中功能最全面、查全率最高的优秀搜索引擎之一。由于进行全文索引, 对内容不进行选择, 因而“信噪比”较大, 但对于进行精细检索和查找内容较专的特定词以及比较偏僻的信息会得到比较满意的结果。
但并没有包括这些主题词的文件。它是通过统计的方法, 发现词频相近的目录, 从而将其作为相关文件进行检索。
数据库规模和范围:查询内容包括WW W 、Usenet 、音频、视频、新闻、地图、黄页、软件、股票、电子邮件地址、飞机航班等信息。含有5000万个网页, 由30名专业记者组成的队伍用一年半的时间对6万个W eb 站点进行评论。
信息采集方式:人工提交和通过检查流行的网站来采集信息。E xcite 的机器人每周运行一次, 检索自己数据库内的各站点, 并且查看“What's New ? ”网页。对于用户提交的网页, 机器人第一次访问时就会将此内容加到数据库中。
标引内容:Excite 标引网页题名、URL 和链接, 注重标题文字、网页文字和可见的或含链接的词。不标引注释标记、Alt. 标记、Java 或其它在浏览器中不可见但出现在原代码中的信息。不查看meta 标记项, 但标记M eta 描述项。Excite 用“智能概念抽取”软件分析站点并根据一定的规则确定关键词索引, 再根据关键词为指南来查询最合适的句子, 然后将这些句子连在一起组成摘要。这种由检索程序编制的智能文摘使其摘要具有较高的可读性。Excite 注重应用关键词或关键词语, 如某个关键词能深入整个网页比多个主题或关键词堆积在一块效果要好。对假冒伪劣网页进行惩罚。
检索功能:有基本检索和高级检索。其中基本检索支持关键词、词组和自然语言检索。自然语言检索越详细越好。Ex cite 中要求的单词和排除的单词的使用方法同AltaVista 一样, 使用 号和-号。
布尔搜索:Ex cite 支持AND 、它也支持OR 、AND NOT 操作符。用括号来构成检索式。高级检索利用表格可选择检索或排除某个单词和词组, 还可对国家和语言、域名等进行限制检索。
结果显示格式:首先显示Web 目录、然后最好的10个Web 结果、下面是最相关的5条Web 新闻。W eb 结果包括相关得分、题名、摘要、URL, 也可选择只显示题名。可用Web 结果中的“S earch for m ore documents like this one ”进行相关性检索。新闻可显示标题、出处、相关得分、日期和进行相关新闻的检索, 选择显示摘要按日期和出版物进行排序。每屏显示的结果可选择10、20、30、40、50条。
数据库更新频率:1-2周。
评价:系统反应速度快。便于简短查询。查询相关网页服务的检索效果比其它检索工具强。智能文摘技术使其摘要具有较高的可读性。可以以多种方式浏览结果。相关性排序质量一般。搜索出来的结果不能指明其格式或以兆字节数来告知文件的大小。
2. 3 Go (Info seek) 网址:htt p://ww w. g o. co m/
G o 创建于1999年1月, 是由Infoseek 和Disney 共同开发的门户和搜索引擎网站, 它的前身是Infoseek (1995创建) 。它是第一个提供有偿服务的网络信息检索系统。1999年4月新增翻译服务, 可将英语翻译成法语、德语、意大利语、西班牙语和葡萄牙语。提供巴西、荷兰、丹麦、德国、法国、瑞典、意大利、日本、英国等10个语言的版本, 使其具有全球效应。
数据库规模和范围:数据库内容包括5000万个网页。分类目录是一个由人工精选的高质量的Web 网站目录, 可检索W WW 信息、图像、音频、视频、新闻和公司信息以及新闻组。此外还提供许多附加的参考数据库。如股票报价、公司资料、类似字典的E -mail 地址、各种参考资料以及邮政编码指南。利用Expres s Sear ch(h ttp://ex-press. go. com. ) 多元搜索引擎可同时对10个搜索引擎进行查询。
2. 2 Ex cite 网址:http://w w w. excite. com
Ex cite 于1995年底创建, 它的最大特色恐怕就是它的概念搜索了。Ex cite 首先将你的检索词按字义进行自动扩展或加以限定, 然后根据“智能概念抽提”技术查找与提问的概念和含义相关的文献, 而不只是简单的关键词匹配。概念检索是指在检索文件的过程中, 不仅能够检索到含有用户提出的关键词的文件, 还能检索到与用户的检索主题密切相关、
,《现代图书情报技术》 2001年 第1期
信息检索技术
和网页中都使用M ate 标记。
总第84期
信息采集方式:Go 对信息源的采集利用自动跟踪软件漫游获取与用户登录相结合的方式。通常要花十天左右的时间来处理一个网址加入其索引库, 它对网址的自动登录有严格的限制, 也保留删除一个网址的权力。它允许用户以200个字符来描述一个网页的内容, 这段文字将出现的检索结果的摘要中。不支持Frames 和S temming 。
标引内容:Go 进行全文索引, 但不标引禁用词。利用超感知觉的算法和人工编辑的目录为用户提供优质服务。主要根据M eta 标记来决定网页被索引的数量。如果无M eta 标记则利用最前面的250个字母, 因此最好写入一定数量的关键词在M eta 标记中, 这样被索引的机会大。前250个字母最好包括主题词和关键词。
检索功能:可通过高质量的分类目录进行浏览。查询功能有简单和高级的搜索功能, 词语缺省检索为or, 无截词功能, 但可自动检索单复数形式。它支持支持布尔逻辑and 、or 、not 检索、双引号短语检索, 大小写有别, 利用管道“ ”进行缩检。高级检索中可选择检索题名、URL 、网站、超级链接、域名、人名等进行限制检索。
结果显示格式:首先出现分类目录中检索到的高质量的网站, 然后是网页信息。每一条结果都显示文献的题名、文摘、相关性得分、文件创建或更新的日期、文件大小、URL 。具备进行相关网页的检索、翻译和聚类功能。聚类功能可将同一网站下的网页聚在一块, 利用“M ore results from . . . ”可显示同一网站的更多结果。如果取消聚类功能则对网页的相关性重新排序。还可选择不显示文摘, 按时间先后顺序排列结果。
结果排序规则:按网站的相对得分进行排序, 得分的依据是根据检索词在网页中出现的位置(篇名或文章的开始部分) 、词出现的频度、权重和链接分析等因素。数据库中不常见检索词的加权较高, 常用词加权较低。
数据库更新频率:1-60天。
评价:搜索精度高, 查到的信息一般都比较准确。新站点加入很及时, 数据库中剔出了陈旧的列表和重复的主页。由于软件排除数据库中重复的URL , 每一U RL 只标引一次, 因此检索到的重复文件相对比较少, 系统反应速度快, 相关性排序较好。可以检索人名、地名和其它专有名词。高级检索功能较少。数据库较小。
检索功能:提供简单和高级检索。简单检索利用下拉菜单可选择利用单词、短语、题名、人物、URL 布尔逻辑进行检索, 可对语言、日期进行限制。高级检索除包含简单检索的功能外, 可选择包含或排除某个检索词, 是检索所有的网页还是首页, 还可对媒介类型、地区和域名进行限制。可在得到的结果中作进一步的检索。
结果显示格式:可选择一次显示10、25、50或者100条结果。结果由三部分组成。先列出10个最好的网站, 这10个网站是根据受用户的欢迎程度以及相关性来决定的(太专一或偏的检索可能没有此项结果) , 然后是显示与检索相匹配的分类目录列表, 最后是由Ink-tomi 产生的结果列表。在结果显示时, HotBot 会列出标题、一个简短的由软件产生的摘要、相应的得分、文件大小、日期和网址。结果中的日期表示此信息加入数据库的时间或更新的时间。一般同一个网站只列出主要的页面或首页, 利用“可查看同一网站Th is site on ly ”的其它网页。
结果排序规则:根据题名, M eta 标记中的关键词、词(排除太一般的词) 在文献中出现的位置和频度以及文献的长度决定排列顺序。随着时间的推移, 还会不断改进算法规则。对欺骗性的网页进行惩罚, 降低排名。
数据库更新频率:每3-4周更新一次。
评价:HotBot 最大的特点在于它的界面组织和丰富的检索功能。HotBot 在页面上提供了直观的图形化检索菜单功能, 用户可以通过简单的下拉菜单创建复杂的布尔查询, 或者按日期、地理区域和媒体类型进行限制性搜索。可对搜索结果进行再搜索。由于使用了并行处理办法, 数据库也分配在几个工作站上, 因此速度快。在搜索引擎领域, HotBot 仍然是令众人瞩目的领头羊。它的不足之处在布尔操作符上有些限制。
2. 5 L ycos 网址:http://w ww. ly co s. com
L y cos 是最早出现的搜索引擎之一, 创建于1995年, 由美国卡内基・梅隆大学的机器翻译中心开发研制。L y co s 来源于一种陆上蜘蛛的拉丁文名称。这种蜘蛛不靠结网而靠抓取猎物生存, 而且活动速度很快, 习惯于夜间活动。
数据库规模和范围:利用多个数据库提供关键词和分类主题查询以及其它服务。高级检索利用Fast 的数据库(包含3. 4亿个网页) 。Lycos 自身的目录指南包含5000万网页。最好的十个网站来自Direct Hit 。检索对象包括WW W 、FTP 、Gopher, 以及图像、音频、视频文件。每项服务包括特别的增值服务, 如热点选评、当前最新信息和报道等。
信息采集方式:用户提交和利用机器人自动搜索。用户注册提交URL 和电子邮件地址, 然后Lycos 的蜘蛛会自动地根据访问到的信息创建文摘, 确立关键词和说明。几周后就可检索到提交网页的信息。可同时提交多个不同内容的URL, 如果是相同的内容将会认为是“spam ”而被剔除。不支持M eta 标记和Frame 。机器人每4周要访问所有的网站一次。
标引内容:非全文数据库, 标引U RL 、篇名、题名、文件的前20行文字(或文件内容的20) 和文献中最重要的100个词以及超文本的链接词。
检索功能:Lycos 提供简单和高能检索。利用 、-表示要求或排除的单词, 缺省检索是And 。
在高级检索中, 不使用布尔逻辑操作符, 但可用下拉菜单选择检索“所有的词”、“任何词”或“精确地匹配”。字段限制检索:题名,
2. 4 Ho tBo t 网址:ht tp://ww w. ho tbot. com
HotBot 是Wired Digital Inc. 1996年5月推出的搜索引擎。1998年10月L y co s Inc. 将其收购, 成为L y cos N et-wo rk 的一个独立的检索服务商。Ho tBo t 是一个非常优秀的搜索引擎, 它获得了美国《个人电脑》杂志及许多媒体的奖项。
数据库规模和范围:数据库包含1. 1亿个网页。主题分类目录由专家组成的编辑对其进行维护, 编辑们对一些特别好的优秀网站进行评论, 读者也可申请成为某子目录的编辑。HotBot 除了能够检索Web 页面、新闻讨论组之外, 还包括股票、电子商务、新闻、商业信息等服务。是一个提供最新、最全面信息服务的门户网站。
信息采集方式:HotBot 利用蜘蛛漫游提交的网页。提交的网页到最好在HT M L 代码中有meta 标记内容, 包括作者、内容描述(150个字母) 和75个字母的关键词。对网站进行索引需要3周-60天的时间, 每个网站在最多能提交50个网页(这些工作需在一天之内完成) 。
标引内容:HotBot 标引题名、链接点、多媒体文件、利用文本的前20行以及文献中最重要的100个词做索引。根据M ate 标记中的描述和关键词来排序, 似乎与题名和前250个字母无关, 建议在首页
,《现代图书情报技术》 2001年 第1期
信息检索技术
总第84期
主机/域名。可选择的文献类型有:所有的W eb 、书、城市、软URL 、
件、FT P 检索、多媒体、新闻、Open Director y(人工编辑的目录) 、股票、M P3等14种25种不同的语言。取消了以前的自动截词功能, 大小写无区别。
结果显示格式:首先列出流行的网站、紧接着是W eb 网站, 最后是新闻。也可对搜索结果进行再搜索。每条结果包括题名、摘要、URL 。
结果排序规则:Lycos 在搜集文件的过程中采用流行网站优先的策略。排序方法根据网站的流行程度(指被其它网址和文件链接的数量最多, 类似于科学文献中的被引率高) 、检索词出现的位置和频度来判断。分析题名、标题和子标题、不分析图像, 但分析图形标记的ALT 属性。关键词出现在篇名或大标题上的文件, 其相关性比关键词出现在文摘中的文件要高。不同的数据库排序依据不一致。
数据库更新频率:2-4周。
评价:用户界面友好, 在搜索图像和声音文件上的能力强。它的优点在于它的速度快、使用简便、相关性排序较好, 查准率较高。检索结果中文件的重复率高, 有名存实亡的链接存在。速度有些慢。
U RL , 题名和目录, 索引人员检索一个完整的站点, 然后参考自己的主题分类目录, 将选择的网页与主题匹配起来, 这些主题目录一般在大类目下分成若干小类目, 类目之间按照等级系统排列。Yahoo 的主题编排主要分14大类:艺术、商业和经济、计算机和Internet 、教育、娱乐、政府、健康、新闻、消遣、参考工具书、地区信息、自然科学、社会科学、社会和文化, 以超文本指南的方式将主题词链接起来。编辑对
[*]
质量比较高的网页加上标记, 建议用户优先访问这一地址。表明
该主题在内容和版面设计上都优于其它文件; @符号代表这个类目会同时出现在Yahoo 的其他分类类目下, 括号里的数字代表这个类目下连结站点的总数。“New ”表示这是新增加的类目。
检索功能:Yahoo 支持简单和高级查询, 在高级查询中, Yahoo 支持词语检索和 、-、截词等, 它还提供日期限定, 还有URL 和题名限制检索等。可进行时间限制和控制每屏结果输出的数量(10、25(缺省) 、50或100) 。
结果显示格式:按下列顺序排列结果, 首先是满足查询条件的Yahoo 目录和子目录, 接着是满足查询条件的网站, 最后是网页。网页只显示题名、摘要、URL 。
结果排序规则:Yah oo 搜寻引擎会根据分类类目网站信息与关键字串的相关程度来排列出相关的Yahoo 类目和网站。匹配的关键词越多, 相关性越高; 检索词出现在题名中的文献给出一个优先的排序。出现在分类目录中的级别, 按目录的级别从高到低排序。
数据库更新频率:不定期。
评价:系统反应速度较快, 通过主题主题指南进行查询查准率高。它的优点是反映了人在选择和组织信息时的知识和智慧, 收录的网页经过筛选和系统组织, 质量较高, 条理性比较强, 检索结果接近用户的信息需求。缺点是采集信息的速度远远比不上网络资源的增长速度, 所建立的数据库的规模都比较小, 因此检索到的文献数量有限, 对于较为专业偏僻的查询很难提供满意的结果。
2. 6 Y ahoo 网址:ht tp://w ww. y ahoo. com
Y ahoo 于1995年3月1994年底由美籍华裔杨致远等人创办到现在, 从过去一个单纯的互联网目录发展成为许多人上网冲浪的中心。它现在提供的服务包括:拍卖, 购物, 开设网上商店, 个人免费电子信箱服务、聊天和新闻等多种网络服务。Y ahoo 不是搜索引擎, 而是严格的层次组织的分类主题索引。有150个编辑人员来维护, 将其收集到的网站及网页分门别类加以索引和文摘。Y aho o 由人工索引的分类数据库也保证了库内数据质量较高, 冗余信息较少的优点。
数据库规模和范围:主题指南提供Internet 资源检索新闻地图分类广告, 股票、运动、商业、电话号码个人主页和电子邮件地址(独立数据库) 服务, 它是最大的人工编辑的目录。可检索目录, W eb 网页、相关新闻、网络事件等。Yahoo 包含120万个网页内容, 如果用户的检索词在Yahoo 中查询不到结果, Yah oo 还会自动地将查询较交给Inktomi, 由后者来为用户作进一步的检索。In ktomi 是一个真正的搜索引擎, 它拥有世界上最大的数据库(5亿网页) 。实际上它在后台支持着十几个有名的搜索引擎。
信息采集方式:由索引人员用人工方式建立并更新。鼓励用户利用联机表格递交自己的网页地址, 用人工和Yahoo 的蜘蛛软件不定期地在W eb 的“W hat's new ”网站上发现新文件。Yahoo 对收集到的信息要进行严格的审核和分类。
标引内容:Yah oo 根据提交的注册表中的信息建立索引, 包括
参考文献
1 Scott Nich olson. In dexing an d Abstracting on the World Wide
Web :An exam ination of s ix W eb databases . Information T ech-nology and Libraries , 1997, 16(2) :73-812 h ttp://w w w. searchen gines how dow n. com/3 h ttp://w w w. altavista. com/4 h ttp://w w w. excite. com 5 h ttp ://w w w . go . com /6 h ttp://w w w. hotbot. com 7 h ttp://w w w. lycos. com 8 h ttp://w w w. yah oo. com.
(上接第47页)
参考文献
1 VE NKE NT N . GUDIVADA , M odeling and Retrieving Imag es
b y Content. Information Process ing &M anagement. 1997(4) 2 Chang S K, Yan C W. Dimitroff D C, Arndt T. An Intelligen t
Image Databas e Sys tem, IEEE Trans on Softw are Engineering , 1998, 14
3 赵丹群. 图像信息基于内容检索方法的研究分析. 情报科学,
1998, (6)
4 胡晓峰 刘 毅. Q BIC :一个典型的基于内容的检索系统. 微型
计算机, 1996, (6)
5 史忠植. 多媒体信息检索研究动态. 计算机世界, 1998, 1, 19,
D3
6 胡 宏. 图像内容检索方法. 计算机世界, 1998, 1, 19, D37 h ttp ://w w w . ee . colum bia . edu /s fchang /dem os e . h tm 8 h ttp://w w w. qbic. almaden. ibm. com
9 h ttp://w w w. excalib. com/cgi-bin/s dk/cs t/cst2-bat