林檎の木タイトル画像

Windows用のフリーソフト、シェアウェアの紹介サイト

Internet Archive: Wayback Machineの紹介

お知らせ:林檎の日記をブログに移行します

Internet Archive: Wayback Machine Internet Archive: Wayback Machine [海外]

WEB上の全てのページを保存。しかも過去にさかのぼって閲覧できるサービス

TOPページ
TOPページ
TOPページ
ライセンス: フリーソフト
おすすめ度:
4.5点 / 1件 )
著作権者: The Internet Archive
動作環境: WEBアプリ
公式サイト:

この世の中のあらゆるものを検索可能にしようとしているGoogle、寄付であるとか無償の参加者達による善意によってあらゆる事象を網羅したオンライン百科事典を作ろうとしているWikipedia。インターネット上には崇高な理想を掲げて活動している、企業団体が多く存在しますが、インターネットアーカイブも間違いなくその一員と言えるでしょう。すべてのインターネット上のデータを保存して後世に残すという理想を掲げています。

今回紹介する、Wayback Machineはインターネットアーカイブが収集している中でもWEBサイトについてのサービス。あらゆるサイトの現在の状態をコピー保存(スナップショット)して、後々それらを閲覧出来るようにするサービスです。つまり、一年前の林檎の木がどんな状態であったか、5年前の2ちゃんねるがどんな風だったか、10年前のYahooはどういったサイトだったのかがを閲覧できるという事です。まるで出版物における国立国会図書館みたいですね。日本で書籍を出版する場合は、すべて国立国会図書館に納本する義務があります。今までに日本で出版された書籍は、国立国会図書館行けばすべてある。今まで存在したWEBページは、インターネットアーカイブにはすべてある。

Wayback Machineは、10年前のYahooを表示した後にあまつさえそのリンクを辿ってサイト内を回遊出来ます。つまりWayback Machineの収集範囲は、サイトのTOPページだけではなく、文字通りインターネット上の全ページがです。全世界のサイト総数は数億ぐらいと言われていて、それぞれに何十、何百、場合によっては何万ものページが紐づくはずです。その膨大なページを時系列で保存しようなどとは、なんて恐ろしい事を考えるの。確実に容量がやばい。インターネットアーカイブは2012年にデータ容量が10ペタバイトに到達した事を発表しました。すげー多分それはすげー。ペタはテラのさらに1000倍ですね。なじみがない単位なので凄いんだか、凄くないんだかよくわからなくなっています。

さっそく林檎の木のスナップショットを検索してみました。林檎の木は、一番最初はジオシティーズで始めたのでその時のURLを使用。最古のスナップショットは、2001年6月21日 21:17:18 のものでした。サイトを開設したのが2001年5月7日なので、それから一ケ月程度しか経っていない状態を保存されていました。いやー懐かしい。2000年初頭のホムペの香りがする。そして横幅が尋常じゃなく狭い。昨今のWEBサイトでは、1000ピクセルでも誰も文句を言わないのに600ピクセルですか。きっとVGA(640×480)のディスプレイを使っている人が無視出来ない数居たって事なんでしょうね。
ただ保存されるデータは、必ずしも完璧ではないようです。サイト内をうろうろしていると、保存されていないページがあったりしますし、画像の保存がされていない場合もあります。印象として人気のあるサイトほど高頻度でスナップショットが保存されているようです。一時期おっつかないのか反映までに何年もかかっているような時期があったと記憶しているのですが、最近は改善された印象。林檎の木も最新のスナップショットは13日前の奴でした。ばっちり画像も保存されていた。

インターネットが一般に普及し始めて20年程しかたっていませんが、それでももう失われてしまったサイトは無数にあります。その中にはWEBにおけるターニングポイントとも言えるサイトも含まれます。個人サイト界隈で上げるならば、俺ニュースとか、ReadMe!とか、カトゆー家断絶とか。それらの在りし日の姿を見ることが出来るのは大変に興味深い。これからも、もりもりサイトが立ち上がって、ガシガシ閉鎖して行くでしょうし、インターネットアーカイブのもっているデータの価値がガンガン上昇していくのは間違いない。

管理人おすすめ度:

管理人おすすめ度

( 2013/11/17 )

その他スクリーンショット

昔のYahoo
昔のYahoo

ユーザーレビュー

まだユーザーレビューの投稿がありません。

レビューを投稿する
レビューを投稿する

コメント

3 : e75dA0 : 2013/11/17 (日) 22:13:55 返信
>>1 君、さあ勇気を持って晒し給へ
4 : dkuZCS : 2013/11/18 (月) 03:24:33 返信
>>2 一応、メールを送って消してもらう方法はある。やりとりは英語になるが、それほど難しくないらしいのでGoogle翻訳や、解説ページを見れば何とかなるっぽい。
5 : so5mzC : 2013/11/18 (月) 11:29:52 返信
だけどそれどうやって本人と確認するんだろう
6 : wakntY : 2013/11/18 (月) 13:21:40 返信
本人かどうか確認のしようがないだろうし、申請があればとにかく応じる、もしくは形だけで申請してもろくに応じてくれないのどっちかじゃないか?
7 : BOm61J : 2013/11/21 (木) 11:04:11 返信
Wikipediaの「納本制度」の『出版物のおよそ8割程度と推定』とあるように、国会図書館に全ての本があるわけではないです。利用してみると分かりますが、意外と無い本は多いです。参考まで

公式サイト : Internet Archive: Wayback Machine