RSSのアクセスログを集計してみた
ブログにはアクセス解析をつけているので訪問者数は集計されているけれど、RSSには集計機能をつけてないのでどのくらいの人が購読しているのか分からない。なんとなく気になったので、昨日のアクセスログからPerlで直接集計してみました。対象フィードはhttp://blog.fkoji.com/index.xmlとhttp://blog.fkoji.com/atom.xml。簡単ですが集計に使ったプログラムは以下の通り。ユーザ・エージェント別に集計します。こういう時にハッシュのソート方法とか覚えておくと便利です。
#!/usr/local/bin/perl -w use strict; my $file = $ARGV[0]; open(IN, $file) or die $!; my $count = {}; while (my $log = <IN>) { if ($log =~ /GET \/(index|atom)\.xml/) { if ($log =~ /"\-" "(.+)"\n$/) { $count->{$1}++; } } } foreach my $ua (sort {$count->{$b} <=> $count->{$a}} keys(%{$count})) { print $count->{$ua} . " : " . $ua ."\n"; } close(IN);
これで集計した結果は次のようになりました。同じユーザエージェントでだぶっているのは、index.xmlとatom.xmlの2種類のフィードがあるためです。こう見てみると色々なリーダーから読まれていることが分かりますね。
48 : Bloglines/3.0-rho (http://www.bloglines.com; 4 subscribers)
48 : Bloglines/3.0-rho (http://www.bloglines.com; 6 subscribers)
36 : FreshReader/1.0.06030100 (id: 549f074b; http://www.freshreader.com/; 1 subscribers)
24 : FreshReader/1.0.06030100 (id: 53e906cf; http://www.freshreader.com/; 1 subscribers)
24 : FreshReader/1.0.06032900 (id: 3dfc402b; http://www.freshreader.com/; 1 subscribers)
21 : Mozilla/5.0 (Windows; U; Windows NT 5.1; ja; rv:1.8.0.2) Gecko/20060308 Firefox/1.5.0.2
20 : Feedfetcher-Google; (+http://www.google.com/feedfetcher.html)
20 : Feedpath/1.0 (http://feedpath.jp; 0 subscribers)
18 : Mozilla/4.0 (compatible; Google Desktop)
14 : MagpieRSS/0.61 (+http://magpierss.sf.net)
11 : livedoor FeedFetcher/0.01 (http://reader.livedoor.com/; 1 subscriber)
10 : livedoor FeedFetcher/0.01 (http://reader.livedoor.com/; 3 subscribers)
10 : NewsGlue/1.3.3.0 (MSIE 6.0.2800.1106; Windows NT 5.0.2195.0; .NET CLR 1.1.4322)
9 : InfoSeek RssReader/0.1 (http://reader.www.infoseek.co.jp/)
8 : cococ/1.04
7 : Hatena RSS/0.3 (http://r.hatena.ne.jp)
6 : RssBar/1.25
4 : Technoratibot/0.7
3 : livedoor FeedFetcher/0.01 (http://reader.livedoor.com/; 2 subscribers)
3 : –
3 : gree_http_loader
3 : Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; ja) Opera 8.54
2 : livedoor HttpClient/0.1
2 : Mozilla/5.0 (Windows; U; Windows NT 5.0; ja; rv:1.8.0.2) Gecko/20060308 Firefox/1.5.0.2
2 : FeedChecker/0.01
2 : Captain NAMAAN/0.05 (www.namaan.net)
1 : So-net RSS Crawler Java/1.5.0_06
1 : Y!J-BSC/1.0 (http://help.yahoo.co.jp/help/jp/blog-search/)
1 : So-net RSS Crawler
1 : BlogRanking/RSS checker (http://blog.with2.net/)
1 : BlogPeople Java/1.4.2_04
48 : Bloglines/3.0-rho (http://www.bloglines.com; 6 subscribers)
36 : FreshReader/1.0.06030100 (id: 549f074b; http://www.freshreader.com/; 1 subscribers)
24 : FreshReader/1.0.06030100 (id: 53e906cf; http://www.freshreader.com/; 1 subscribers)
24 : FreshReader/1.0.06032900 (id: 3dfc402b; http://www.freshreader.com/; 1 subscribers)
21 : Mozilla/5.0 (Windows; U; Windows NT 5.1; ja; rv:1.8.0.2) Gecko/20060308 Firefox/1.5.0.2
20 : Feedfetcher-Google; (+http://www.google.com/feedfetcher.html)
20 : Feedpath/1.0 (http://feedpath.jp; 0 subscribers)
18 : Mozilla/4.0 (compatible; Google Desktop)
14 : MagpieRSS/0.61 (+http://magpierss.sf.net)
11 : livedoor FeedFetcher/0.01 (http://reader.livedoor.com/; 1 subscriber)
10 : livedoor FeedFetcher/0.01 (http://reader.livedoor.com/; 3 subscribers)
10 : NewsGlue/1.3.3.0 (MSIE 6.0.2800.1106; Windows NT 5.0.2195.0; .NET CLR 1.1.4322)
9 : InfoSeek RssReader/0.1 (http://reader.www.infoseek.co.jp/)
8 : cococ/1.04
7 : Hatena RSS/0.3 (http://r.hatena.ne.jp)
6 : RssBar/1.25
4 : Technoratibot/0.7
3 : livedoor FeedFetcher/0.01 (http://reader.livedoor.com/; 2 subscribers)
3 : –
3 : gree_http_loader
3 : Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; ja) Opera 8.54
2 : livedoor HttpClient/0.1
2 : Mozilla/5.0 (Windows; U; Windows NT 5.0; ja; rv:1.8.0.2) Gecko/20060308 Firefox/1.5.0.2
2 : FeedChecker/0.01
2 : Captain NAMAAN/0.05 (www.namaan.net)
1 : So-net RSS Crawler Java/1.5.0_06
1 : Y!J-BSC/1.0 (http://help.yahoo.co.jp/help/jp/blog-search/)
1 : So-net RSS Crawler
1 : BlogRanking/RSS checker (http://blog.with2.net/)
1 : BlogPeople Java/1.4.2_04
コメントを残す