F.Ko-Jiの「一秒後は未来」

電車遅延なうに遅延路線で話題のワードを表示するようにしてみました

Twitter のデータを元に遅延路線を推測する「電車遅延なう」に、遅延路線で話題になっているワードを表示する機能を追加しました。

traindelay-trend-words.jpg

↑ 遅延中の路線でのみ表示します。

単純に単語数をカウントしているだけなので、どの単語も閾値より少ない場合は表示されません。

最初は形態素解析して単語数を数えればできるんじゃないかと考えていたのですが、結構たくさん無関係なワードが抽出されるので、なるべくそれらを除外するように調整していて結構な手間です。

形態素解析は以前から Mecab を利用していて、今回から「neologd/mecab-ipadic-neologd」を IPA 辞書と一緒に使うようにしました。辞書を併用する方法は「MeCab システム辞書への単語追加(mecab-ipadic-neologd) | あぱーブログ」に詳しく書かれてます。それでも足りない鉄道関連の頻出語は、随時ユーザー辞書に追加する形で運用してます。

Twitter アカウント @traindelay のほうでは、遅延路線が 1 つの場合のみ話題のワードもあわせてツイートするようにしてみました。あわせてご利用ください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

著者について

fkoji

F.Ko-Ji

Webエンジニアやってます。最近は ドットインストール の開発がお仕事です。その傍ら、個人で Meity電車遅延なう梅酒.in#グラドル自画撮り部 の部室といったネットサービスを開発・運営してます。梅酒と草野球とリアル脱出ゲームが好きです。

» 詳しいプロフィールや運営サービスの一覧など