ある言語の中で重要な単語を列挙するのは、知識への入り口です。そのための方法として、昔は、大きな文書集合(コーパスと呼びます)から、出現頻度などによって重要な度合いを計算してきました。ですが、もし「月」という単語がなかったらどんなに困るかなあ、と考えたとき、単語が消失したときの困り具合で単語の大切さ(=必要度)を計算してもよいのではないかと考え、まとめてみました。最後のほうで提案したのはグラフ理論でよく知られたBetweenness Centralityという概念に相当し、その自然言語のコーパスにおける単語集合が作るグラフへの応用という形になっています。