だれかの、なにかに、役立てるウェブ制作者YoTaの趣味ブログ

インターネットアーカイブの過去ページを削除してみた時の方法

インターネットアーカイブ(Internet Archive)では、デジタルアーカイブの「Wayback Machine」で、世界中の色んなwebページを保存・閲覧できるようにしています。

ただ、削除したいページが記録されても、メールでお願いすると削除してもらえるとのことで、実際にやってみた時の方法を紹介します。

インターネットアーカイブのwebページを削除してみた

まずはメールで依頼する

調べたところ、公式メールアドレスが下記の2点ありました。

  • info@archive.org
  • wayback@archive.org

自分は後者のwayback宛先にメールを送りました。

英語で書かないと対応してもらえないそうで、他のみなさんの文面を引用させて頂き、こんな風に書きました。

Hello.
I'd like you to delete the following data from your archive.
 
【1】
https://web.archive.org/web/*/https://*****.com/webpage1/
 
【2】
https://web.archive.org/web/*/https://*****.com/webpage2/
 
This mail is sent from my domain.
thank you

この時、削除するwebページと同じドメイン名のメールアドレスから送信しないと対応してもらえないので注意です。

相手からの返信は一日で届いた

こちらがメール送信した翌日には返信が届いていました。

具体的な指示内容があるので、その通りに対応していきます。

テンプレ通りに対応してから再度返信

「こういう風に書いてくれよ」ってメールだったので、その通りに修正をして、あらためてメールしました。具体的な文面は以下の通りです。

Hello, I answered.

-----
 
【STEP1】
 
URL/URL path to exclude:
https://*****.com/webpage1/
⇒https://web.archive.org/web/*/https://*****.com/webpage1/
 
URL/URL path to exclude:
https://*****.com/webpage2/
⇒ https://web.archive.org/web/*/https://*****.com/webpage2/
 
time period of domain ownership: 20**-**-** to present
time period to exclude: 20**-**-** to future
 
【STEP2】
 
https://*****.com/waybackverify.txt
 
-----
 
Thank you for your support.

ポイントは、メールだけでなく、FTP経由で、ドメイン直下のディレクトリに「waybackverify.txt」を作成しておくことを求められます。テキストファイルには、以下のように削除するページを記載しておきます。

Hello.
I'd like you to delete the following data from your archive:
 
[1]
https://web.archive.org/web/*/https://*****.com/webpage1/
 
[2]
https://web.archive.org/web/*/https://*****.com/webpage2/
 
There are no URLs to exclude.
thank you

あとは待つだけ

1日ほど経過すると、ページが削除されています。

ただ、自分の場合は、もう1ページが削除されていなかったので、さらに催促メールを送ったところ、ちゃんと削除してもらえました。

まとめ

インターネットアーカイブに保存されたwebページを削除したい時は、メールで問い合わせて、指示された通りに対応すれば、それでOKです。

全文英語になるので、先人のみなさまの記事を見つつ、文章を引用したり、Google翻訳など使いつつ、シンプルに書きましょう。

参考リンク

ページ上部に戻る