時間が経つほど毛の量が増えてますね
via 9gag
IBMのビジュアライゼーション(可視化)に関する実験サイトmany eyesが公開している、Phrase Netというブラウザツールがあります。
そのツールにビートルズの歌詞を放り込んで解析させた人の結果が以下のようなもの。
「ビートルズの曲の歌詞では」、ストロベリーといえばフィールズだし、ヘイといえばバンガローでビルだし、ロンリーなのはピープルな傾向にある、というのがわかるわけです。
“yellow submarine”のようにスペースでつながっている単語を解析すると上記のようになりますし、”rock and roll”のようなandでつながれた関係、”pepper’s lonely”, “top of slide”, “sees the sun”などいくつかの英語での単語のつながり方に応じて、どんなフレーズが多用されているのかを見ることができます。(その場で操作しながら見られるバージョンはリンク先で。ブラウザのJava利用がonになっている必要があります) あらかじめ用意されたパターン以外にも、自分でパターンを指定して解析させることも可能です。
Phrase Netの本サイトでは、サンプルデータとして、ジェーン・オースティンの「プライドと偏見」全文を解析しています。