关于Hadoop的安装以及实验一可以参考:
下面来看实验二:文档倒排索引算法实现
(debug的过程还是挺艰辛的)实验内容包括:(1)去除stop-words (2)统计单词在每篇文档中出现的频率
一开始的思路我是参考的Hadoop之倒排索引,感觉挺好的,但是做到后面发现有问题。
还是从头开始吧。
more >>
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent:
meta: false
pages: false
posts:
title: true
date: true
path: true
text: false
raw: false
content: false
slug: false
updated: false
comments: false
link: false
permalink: false
excerpt: false
categories: false
tags: true