アクセスログ解析:ログファイルから特定ファイルへのアクセスを取得する

grepのパターンマッチを利用する。

特定ファイルを対象としたログを取得して、そのファイルだけをSiteTrackerなどで分析する事もたまにある。

 

■トップページへのアクセスログだけを取得する

トップページへのアクセスを top.log として保存する。 

$ grep "GET /index.html" access_log > top.log

 

■複数の特定ページへのアクセスログを取得する 

複数の特定ページを pattern.txt として新規ファイルを作る。内容は、

GET /index.html
GET /news/index.html
GET /news/20061125.html

Apacheのログの記録の仕方が、GET /xxxx となっているためこのように記述する。

 

特定ページへのアクセスを tokutei.log として保存する。

$ grep -f pattern.txt access_log > tokutei.log

 -f オプションで、複数パターンを指定できる。

 

 ■複数のログファイルが対象の場合

2006年の複数ログファイルから、index.htmlへのアクセスログを取得する。

$ grep -h "GET /index.html" access_2006* > top.log 

-h オプションで、ログファイル名をtop.logの中に出力しない。