This document is written about "Data-Intensive Text Processing with MapReduce" Chapter 4.
This chapter describes how to design inverted index with MapReduce algorithm.
Data-Intensive Text Processing
with MapReduce
(Ch4 Inverted Indexing for Text Retrieval)
2010/10/03
shiumachi
http://d.hatena.ne.jp/shiumachi/
http://twitter.com/shiumachi
big data における検索
● リアルタイム処理が要求されるので
MapReduceはどの道無理
● 以下MapReduce全く出てこない……
● でも分散させるのは一緒
● 分散の方法は2つ
● ドキュメントを分割し、それぞれのサーバで全ての
term を持つ
● term を分割し、それぞれのサーバで全てのドキュ
メントを持つ