文庫本をWordCloudにすると内容を思い出しやすい

最近改めてシャーロック・ホームズを読み返しています。好きな小説なのに内容を忘れてしまっていることがショックで、視覚的に思い出せるようにできないかと思ってWordCloudで『シャーロック・ホームズ』作品を表現してみました。

シャーロック・ホームズ

『シャーロック・ホームズ』はイギリスの小説家サー・アーサー・コナン・ドイル(1859-1930)(1902年にナイトに叙せされた)によって生み出された推理小説。シャーロック・ホームズという架空の探偵が事件を解決していく様を相棒ワトスンの視点から描いています。

代表作『緋色の研究』

『シャーロック・ホームズ』を読んだことがないという方も、シャーロック・ホームズシリーズ第1作目である『緋色の研究』をまず読んでみることをおすすめします。

『緋色の研究』はシャーロック・ホームズとワトスンの偶然の出会いや、ワトスンから見たシャーロック・ホームズの特徴が詳細に記述されております。警視庁の腕利き刑事であるグレグスンやレストレードでも犯人に翻弄されてしまう中、ホームズは着実に犯人に迫っていきます。読んでいる私もホームズの頭脳に完全に置いてかれてしまいました。

ホームズは自身が興味のある分野(化学など)に関しては深遠な知識を有する一方で、地球が太陽の周りを回っていることを知らないなど、とても極端な人物です。

「緋色の研究」(A study in Scarlet)という言葉はホームズがワトスンに探偵について語っている部分に出てきます。

“(前略)そう、緋色の研究というやつをねえ。
いささか美術的な表現をつかったっていいだろう? 人生という無色の糸桛(いとかせ)には、殺人というまっ赤な糸がまざって巻きこまれている。それを解きほぐして分離し、端から端まで一インチきざみに明るみへさらけだして見せるのが、僕らの任務なんだ。(後略)”
(『緋色の研究』,コナン・ドイル著,延原謙訳,新潮文庫p.73より引用)

劇場版『ベイカーストリートの亡霊』でもこの部分が用いられており、よく覚えているコナンファンの方も多いと思います。

WordCloudとは

WordCloudとは、文章中で出現頻度が高い単語をその登場頻度に応じた大きさで図示する手法のことであり、様々なサイトで解説されております。(ex. Qiita)

解析の概略としては、上記文章を「WordCloud/とは/、/文章/中/で/出現/頻度/・・・」のように品詞ごとに分解(形態素解析と呼ばれます。)して登場する頻度順に抽出して可視化します。

本記事の文章をWordCloud化したもの。
本記事の文章をWordCloud化したもの。

青空文庫

WordCloudの存在は以前から知っていました。最近、小説の中身のテキストデータが公開されている青空文庫という存在を初めて知ったため、『シャーロック・ホームズ』をWordCloud化しようと考えました。

青空文庫では著作権が切れた作品(翻訳者など一部著作権が存在しているものもあります。)を電子化することでより多くの人に快適に作品を味わってもらうことを目指しています。

『シャーロック・ホームズ』をWordCloudで表現

残念ながら全ての作品が青空文庫に掲載されているわけではないため、『緋色の研究』などをWordCloud化することは現時点では叶いませんでした(2021/09/12現在)。それでも多くの『シャーロック・ホームズ』作品が掲載されていたのでその一部をWordCloud化してみました。なお、解析に用いているテキストデータの著作権は全て青空文庫に帰属しております。

『まだらの紐』のWordCloud
『まだらの紐』
『赤毛連盟』のWordCloud
『赤毛連盟』
『白銀号事件』のWordCloud
『白銀号事件』
『踊る人形』のWordCloud
『踊る人形』

助詞(「これ」「あれ」など)をどこまで除外するかによっても表示される図は変わってきます。

WordCloudによって作った画像をもとに、それがどの作品かクイズにするのも面白いでしょう。シャーロキアンの方なら上記の図を見ただけでどの作品か即答できることと思います。

[ちなみに]読んだきっかけは名探偵コナン

実家では母が『名探偵コナン』を購読しておりました。私は活字よりも漫画を読む方が多かったですが、主人公であるコナン君が目を輝かせて語るシャーロック・ホームズの凄さを知って、小学生の頃図書館で『シャーロック・ホームズ』の小説を手に取りました。

ちなみに私が『名探偵コナン』で一番好きな作品は劇場版『ベイカーストリートの亡霊』です。コナン君たちが100年前のロンドンという『シャーロック・ホームズ』の仮想世界に入りこみ、現実世界で起きた事件の手がかりを探しにいくというストーリーです。

最後に

今回は『シャーロック・ホームズ』作品をWordCloud化してみました。これが作品のことを思い出すきっかけとなると良いと思っています。今後も読んだ作品についてはWordCloud化を試してみたいと思います。

コメント

タイトルとURLをコピーしました