ココログの画像を一気に全部まとめてダウンロードする方法(メモ)
先日の記事で、↓のように書いたが、解決策がありました。
最大の問題は画像を表示する為に↓のようにcgi(何故かimage.htmlと言う名前になっているが)を使って表示している事。このcgiでは指定された画像ファイルへのリンクを含んだhtmlファイルを返してくる。
http://ichi.txt-nifty.com/.shared/image.html?/photos/uncategorized/2008/06/09/mdsc0457a_tna.jpg
巡回ソフトではcgiと認識せず、こういうURLの画像ファイルとして取得してくるので、DLされたファイルは拡張子がjpgなのに中にhtmlが書かれている。もう一段階リンクを辿って画像をDLしてくれる巡回ソフトがあればいいのだがねぇ。
巡集でDLする場合、「URLの文字を置き換え」の機能で「/.shared/image.html?」を「/」と置換するように設定すればok。こうすると次のように読み替えて画像をDLしてくれるようになります。たまたま、画像表示用のcgiのパスと画像のパスが単純な文字列置換で読み替えられたからできるんでしょう。(置き換え文字列は「/」ではなく「」でいいのかも。)
http://ichi.txt-nifty.com/.shared/image.html?/photos/uncategorized/2008/06/09/mdsc0457a_tna.jpg
↓
http://ichi.txt-nifty.com/photos/uncategorized/2008/06/09/mdsc0457a_tna.jpg
但し、DLしたhtmlファイル中のURL(画像へのリンクタグ)は置換されず、「/.shared/image.html?」のままなので、後処理が必要です。
- URLフィルタ
nifty関係のサーバと一致するURLのみを許可するよう指定しておく。 - 取得設定
階層を限定する。
「HTMLのMETAタグを読まない」を選ばないとDLが始まらないかも。
巡集は便利で良くできたソフトなんだが、機能の詳細な説明をまとまって書かれたものがないのが難点。
| 固定リンク
コメント