F.Ko-Jiの「一秒後は未来」ではウェブやSEO、API、RSSといった技術的ネタから、ちょっとした豆知識や梅酒、エンタメ系まで様々な情報を不定期にお届けしています。

F.Ko-Jiの「一秒後は未来」 > API > ツイフルに「Twifluホットワード」という機能を実装してみた

ツイフルに「Twifluホットワード」という機能を実装してみた

  • B!
スポンサード リンク

いわゆるインフルエンザ版の buzztter か、インフルエンザ版の急上昇ワードみたいな感じですが、ツイフルにも「Twifluホットワード」という機能を実装してみました。

twiflu-hotword.gif

» Twifluホットワード - インフルエンザで話題のワード | Twiflu

この手の機能は初めて作るので、とりあえずそれっぽく結果が出ればいいやと割り切って作ってます。

まずはデータを集めないといけないので、以下のような処理をするバッチを 30 分おきに動かしています。

  • 「インフルエンザ」「タミフル」といったインフル関連ワードで Twitter を OR 検索。100件ずつ取得。
  • 取得したつぶやきを繋げて Yahoo! の日本語形態素解析 API に POST。単語の出現回数を形容詞と名詞に絞って取得。
  • ワードの出現回数をつぶやきの年月日時とともにデータベースに保存。
  • これを前回のバッチで取得した最初のつぶやきが出てくるまで繰り返す。

これでインフル関連のつぶやきの中に時間単位で何が何回登場したかが記録されるので、あとはお好みで調理するだけ。

といっても調理の仕方を知らないのでとりあえず次のようにしてみました。

  • 現在時刻から過去6時間以内の単語の出現回数を合計し、出現回数の降順で数十件取得。
  • 取得した単語ごとに、2時間前から過去6時間の出現回数と比較。
  • 2時間前起点の出現回数より増加していればホットワードに採用。

ざっくり過ぎるのですが、インフル関連ワードに絞るとかなり出現回数が少なくなるので、これくらいでもそれっぽい結果が出てくるようです。あとは状況を見つつ微調整をする感じです。

[2010-01-12] RSS フィードの URL が変わりました。お手数ですが RSS リーダーへの再登録をお願いします。
Subscribe with livedoor Reader Add to Google Subscribe with Fastladder My Yahoo!に追加 Bloglinesで閲読登録 はてなRSSに追加 エキサイトリーダーに登録


コメントを投稿

(承認されるまでコメントは表示されません。)

API / Twitter(ツイッター)

English version

前のエントリー: « PowerShot S90を持って猫カフェで猫写真を撮ってきたよ
次のエントリー: iPhoneのTwitterアプリに「降りる駅が近づいたら通知してくれる機能」がほしい »

トラックバック

このエントリーのトラックバックURL:

タイトル:

URL:

リンク用HTMLタグ:

Agile Media Network

AMN Partner Blog

広告掲載について

東京ナイロンガールズ
最近の注目記事
持っているガジェット
powered by Gadget Party
最近のつぶやき
えもにゅ

↑ 気持ち記録サービス「えもにゅ」です

このブログの読者になる

F.Ko-Jiの「一秒後は未来」 - RSSフィード

クマでもわかるこのブログの便利な更新チェック方法

DailyFeed

あわせて読みたいブログパーツ

フィードメーター - F.Ko-Jiの「一秒後は未来」

月別アーカイブ


<< March 2010
SuMoTuWeThFrSa
 123456
78910111213
14151617181920
21222324252627
28293031 
人気エントリー
TopHatenar
携帯からのアクセスは
QRコード
http://mob.fkoji.com/