2016 - 2024

感恩一路有你

全文搜索引擎是什么 什么叫全文检索?

浏览量:2899 时间:2021-03-12 14:51:34 作者:admin

什么叫全文检索?

全文检索技术是一种以文本、声音、图像等数据为主要内容,检索文献内容而不是外观特征的检索技术。全文检索系统主要有TRS系统、天语系统等,与其他搜索引擎相比,全文搜索引擎的显著特点是可以搜索文本中任何有意义的词,检索结果是原始文档,而不是文献线索。中文全文检索技术原理。计算机存储设备用于对结构化数据和非结构化数据进行分类,包括TRS系统和天语系统

全文检索是指计算机索引程序通过扫描文章中的每个单词,为每个单词建立一个索引,指明文章中单词的出现频率和位置。当用户查询时,搜索程序会根据事先建立的索引进行搜索,并将搜索结果反馈给用户。这个过程类似于通过字典中的搜索列表查找单词的过程。全文检索的方法主要分为词搜索和词搜索。基于词的检索是指为文章中的每个词建立索引,并将词分解成词的组合。对于不同的语言,单词有不同的含义。例如,英语中的词和词实际上是统一的,而汉语中的词和词则有很大的不同。逐字检索是指对文章中的词语进行索引,即语义单位、逐字检索、同义词处理。英语和其他西方词汇根据空白进行分割,所以实现类似于文字处理,并且很容易添加同义处理。为了达到索引的目的,需要对汉字和其他东方文字进行切分。这是当前全文检索技术中的一个难题,特别是中文全文检索技术中的一个难点,这里不作详细介绍。

什么叫全文检索?

全文搜索是搜索引擎最重要的功能,许多系统(如luence)也支持全文搜索。全文搜索背后有两个最重要的原则:倒排索引和搜索结果的排名。

1. 倒排索引:给定一些搜索词{Ti},我们可以根据倒排索引快速搜索相关文档{Di}。

2. 搜索结果排序(文档排序)的主要思想是找出搜索词中的重要文档(设置评价标准),然后通过比较角色大小对其进行排序(通过评价标准进行评价)。它分为两个步骤:

2.1。求出每个搜索词在每个被搜索文档中的权重WTD,从而得到每个被搜索文档的搜索词权重向量

2.2。将每个搜索项视为一个文档,得到相应的权重向量,并将文档权重向量与搜索项权重向量进行比较。越接近,就越相关。

全文搜索引擎是什么 git的常用命令 全文检索什么意思

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。