倒排索引实现原理:
1、任务概述
要求对文件建立倒排索引,使之能够被方便地查询。
2、遍历读取文件
所有的文件都存放在文件夹中,首先要把这些文件读取出来,才能进行后续处理。
3、对单个文件进行处理
包括文本分词、去除无关词语、词语归一化和建立单个文件的信息统计表。
4、将单个文件信息和总体的倒排表进行合并
转变“词语-出现次数”统计表为“词语-文件-出现次数”倒排表。
5、查询处理
通过Key查找到对应的Value即可。
用户访问量
注册用户数
在线视频观看人次
在线实验人次
倒排索引实现原理:
1、任务概述
要求对文件建立倒排索引,使之能够被方便地查询。
2、遍历读取文件
所有的文件都存放在文件夹中,首先要把这些文件读取出来,才能进行后续处理。
3、对单个文件进行处理
包括文本分词、去除无关词语、词语归一化和建立单个文件的信息统计表。
4、将单个文件信息和总体的倒排表进行合并
转变“词语-出现次数”统计表为“词语-文件-出现次数”倒排表。
5、查询处理
通过Key查找到对应的Value即可。
¥ 5999
·难
·32
¥ 9999
·难
·9
¥ 7999
·难
·12
¥ 199
·易
·34
¥ 899
·适中
·16
¥ 1688
·适中
·202
¥ 28000
·难
·170
¥ 199
·偏易
·3591
¥ 100000
·难
·173
¥ 998
·难
·13
¥ 1899
·难
·16
¥ 199
·易
·343
¥ 5999
·适中
·35
¥ 6999
·难
·20
¥ 5999
·难
·17
¥ 3999
·难
·19
¥ 2999
·难
·58