効率アップ、クオリティアップのためのデジタル仕事術

誠 Biz.ID誠 Biz.ID

ニュース

3分LifeHacking:

消えてしまったWebページを閲覧する

インターネット上の情報は永遠ではない。さっき見たページがなくなっている……というときに困らないように、何とかなるかもしれない方法。
2007年07月26日 20時46分 更新

 ブックマークしておいたサイトに行ったら、消えていた。昨日は表示されていたのに──。

 インターネットに載っている情報は、必ずしもずっと残っているわけではない。いったんは公開したものでも、個人の都合で消去されることもあれば、サービスの終了に伴いサイト自体がなくなってしまうこともある。そうはいっても、重要な情報は確認したい。

 そんな“消えてしまったWebページ”を閲覧するための方法を3つ紹介しよう。

Googleのキャッシュに残っていないか?

 Googleの検索エンジンは、「該当ページのサーバがダウンした場合でも、ページの内容が見られるように」、多数のWebページの中身を保存している。Google検索の結果一覧画面に「キャッシュ」というリンクがあり、これを押すとGoogleが保存しているページの中身を確認できる。

 あるページに行ったら消えていた──というときは、そのページのキャッシュが残っていないか確認してみよう。次のようにGoogleの検索窓に入力する。

cache:URL

ex.: cache:http://www.itmedia.co.jp/bizid/


ks_archive1.gif

 現在見ているページのGoogleキャッシュを表示するBookmarkletも存在する(2月8日の記事参照)

 ちなみに検索エンジンのキャッシュはGoogleだけではない。Yahoo! JAPANの検索にもキャッシュが用意されている。URLを検索窓に入れて検索し、キャッシュのリンクを押せばいい。GoogleとYahoo!ではクローラーの動作が違うので、一方で求めるキャッシュがなくても、もう片方では表示されるかもしれない。

 またページが削除された場合、その次のクロール時(検索エンジンのロボットがページを見に行った時)に削除が反映され、キャッシュからも消える。あくまでサーバがダウンしたときのためで、削除されたページを見るためのサービスではないという位置づけだ。

Internet Archiveを確認する

 850億ページを保存している──というInternet Archive。こちらは、削除されたページも見ることができる。URLを入れると、過去のそのページを表示してくれる。

 Webページだけでなく、動画や画像なども保存されているかもしれないのがInternet Archiveの面白いところ。相当過去まで遡って見ることができる。

ks_archive2.gif http://www.google.com/の履歴を確認したところ。日付の後ろに「*」が付いているものは、大きな変更があったところ
ks_archive3.gif 1998年のGoogle(Internet Archive)。β版だし、「!」が付いていた。アップデートをメールで受信する──という現在ではちょっと考えられないようなサービスもあったようだ

RSSリーダーに保存しておく

 最近はブログに限らず企業のプレスリリースや、ニュースサイトでもRSSを配信することが当たり前になってきた。RSSリーダーでフィード(RSS)を受信しておけば、配信元がページを削除してもフィードされた部分については閲覧が可能だ。

 もちろんニュースサイトなどでは記事の全文を配信しているところは希だし、一般のサイトでRSSを出していない場合は別のクロールサービスと組み合わせる必要がある。しかし「あのページが読めなくなっている!」というときは、RSSリーダーに残っていないか確認するといい。


 もちろんこうした方法だけでなく、本当に消えたら困る重要な情報については、ローカルに保存しておくといいだろう(7月18日の記事参照)

[斎藤健二,ITmedia]

Copyright© 2012 ITmedia, Inc. All Rights Reserved.



Special



Special

誠Focus

@IT自分戦略研究所

タクシー、めし、ライブからシステム開発/仕事を思う
今後のタクシーの乗り方、「エンジニアめし」としての寿司、ライブに行くことについての3コラムをお届けする。そこには、ある共通点があった

IIJのRuby対応PaaS「MOGOK」は、どんなサービスか?
 2月16日、17日の2日間、東京・目黒でDevelopers Summit 2...

手順書いてる暇あったら仕事しろ
■手順書のとおりにうまくはいかない  どちらかと言えば、インフラ系の話だ。よく大...