wwwChecker
Download
これ何
CLI な Web 更新チェッカ。
特徴
- 更新情報を HTML として吐くだけのシンプルなコマンドラインアプリ。
- 特定の文字列を無視するなどの情報を用いず、広告挿入など動的なページの更新誤検出をある程度抑える。
- 更新部分の文章を抜き出して表示。
- If-since-modified, Accept-encoding: gzip ヘッダつきのリクエストや、
Last-modified, Content-length ヘッダなどのチェックによる基本的な省力化。
- n 並列取得。
- Python 2.x のみに依存。そこそこクロスプラットホーム。
仕組み
HTML を flatten したものを前回の結果と DP マッチングし、レイアウトが変わっていないかをチェックする。今のところ閾値など、調整の必要なパラメタはない。
使い方
~/.www-list にチェックしたい URI を一行ごとに書く。
python /path/to/wwwChecker
- チェック終了後ブラウザが起動する。もし起動せずに終了してしまった場合は、
~/.www-check.html を開く。
初回実行時は更新時刻や更新内容がデタラメだけど気にするな。
ChangeLog
- 1.5: 長いページでの DP マッチング改善。
- 1.5: 処理時間の表示を平均値から中央値に変更。
- 1.5: CSS 改善。
- 1.?: シグナルの扱いを改善。
- 1.2: Accept-encoding: gzip に対応。
戻る
y.fujii <y-fujii at mimosa-pudica.net>