この記事はエムスリーAdvent Calendar 2020 24日目の記事です。
クリスマス付近の予定はこのアドカレ執筆だけ、エンジニアリングGのowlです。
ところでみなさんは怪談がお好きだと思います、もちろん自分も大好きです。常日頃から手当たり次第に読んでいるのですが、最近では読むものが少なくなってきたので中国古典の志怪小説や江戸時代以前に書かれた怪談集や説話集も集めています。いつか現代語訳されているものも読みつくしてしまったら外国語や古典籍のくずし字を解読する羽目になるかもしれません。
ちなみに怪談は好きですがホラー映画は苦手です、びっくりするので。
さて、大量の怪談を読むうちにその内容や語られ方が時代や地域によって大きく異なりそれぞれが興味深い特徴を持っていたり非常に似通った類話が存在することに気づきました。例えば江戸時代からいわゆる幽霊物の占める割合が急激に増える、現代の都市伝説的怪異の中には「色」をキーワードとするものが多い、日本である年代から突然「霊感」という概念が一般に広まる……など。
そこで少し真面目に怪談に関する考察をやってみようと思い立ち、その前準備としてなるべく怪談をデータベース化していくことにしました。
- やりたいこと
- 使う技術スタック
- 実装に関する短い説明
- 「類話」の話
- 重要語の抽出とテキスト分類
- 入門してみた感想
- We're hiring !