学技术 什么叫全文检索?
浏览量:1816
时间:2021-03-15 22:06:50
作者:admin
什么叫全文检索?
全文检索是指计算机索引程序通过扫描文章中的每一个单词,为每一个单词建立一个索引,指明该单词在文章中的出现频率和位置。当用户查询时,搜索程序会根据事先建立的索引进行搜索,并将搜索结果反馈给用户。这个过程类似于通过字典中的搜索列表查找单词的过程。全文检索的方法主要分为词搜索和词搜索。基于词的检索是指为文章中的每个词建立索引,并将词分解成词的组合。对于不同的语言,单词有不同的含义。例如,英语中的词和词实际上是统一的,而汉语中的词和词则有很大的不同。逐字检索是指对文章中的词语进行索引,即语义单位、逐字检索、同义词处理。英语和其他西方词汇根据空白进行分割,所以实现类似于文字处理,并且很容易添加同义处理。为了达到索引的目的,需要对汉字和其他东方文字进行切分。这是当前全文检索技术中的一个难题,特别是中文全文检索技术中的一个难点,这里不作详细介绍。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。