• 0

    用户访问量

  • 0

    注册用户数

  • 0

    在线视频观看人次

  • 0

    在线实验人次

倒排索引实现原理

作者:云创智学|发布时间:2021-11-30 11:39:54.0|来源:云创智学

倒排索引实现原理:

1、任务概述

要求对文件建立倒排索引,使之能够被方便地查询。

2、遍历读取文件

所有的文件都存放在文件夹中,首先要把这些文件读取出来,才能进行后续处理。

3、对单个文件进行处理

包括文本分词、去除无关词语、词语归一化和建立单个文件的信息统计表。

4、将单个文件信息和总体的倒排表进行合并

转变“词语-出现次数”统计表为“词语-文件-出现次数”倒排表。

5、查询处理

通过Key查找到对应的Value即可。

联系方式
企业微信