WEBサイトをアーカイブする

アーカイブ(Archive)は、記録庫、書庫といった意味の英語です。
インターネットのサイトページ(WEBサイト)を保存したいときがあります。

サイトに載っていたということは、新聞雑誌に記事が載るような情報価値があるわけですから。
ところが、WEBサイトは印刷物(刊行物)と違って、簡単に修正したり、削除することができます。
そうすると、WEBサイトを保存したり、印刷したりしても、いったい何時(いつ)の時点で公開されたものなのかはがはっきりしません。

そこで、世界中のサイトの情報を、監視カメラのように日付と共に保存するサービスがあれば証拠として使えます。

その一つに、インターネットアーカイブサイトの記録閲覧サービス、Wayback Machineというものがあります。
これは米国の団体が運営しています。 ウイキペディア(インターネット・アーカイブ

現在では、いつでもWayback Machineに保存させることができます。

保存方法:
(1)
http://archive.org/web/ にアクセスする。
(2)Save Page Nowに保存させたいサイトのアドレスを入れて ⇒ SAVE PAGE をクリック
    これで、保存させることができます。
    ただし、保存させないように処理したページは保存させることができません。

保存できません
 Page cannot crawed or display due to robot.txt
 この処理は簡単に設定できるため、アーカイブ化を拒否するサイトは増えてゆくと思われます。



保存されているかどうかの確認

保存させるまえに、すでに保存されていれば、その保存先のURLを利用することができます。

wayback

http://archive.org/web/画面

この画面の上方のアドレス欄に、保存の有無を確認したいアドレスを入れて、BROWSE HISTORYをクリックすると、保存されている場合はそのカレンダーとともに保存数が現れます。

保存されていない場合には、保存しますかといった内容の英語表示がされます。
同じアドレスであっても内容が異なる場合がありますので、複数回数保存されることにも意味があります。


アーカイブでは、WEBページだけでなくAudio Archive(音声倉庫)もあり、米国の1950年代のラジオ録音を聞くなどができます。

DONATE 寄付を募るページがあります。
私は、一度寄付したことがあります。(paypal経由)

フォローする

コメントをどうぞ

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>