インターネットアーカイブの過去ページを削除してみた時の方法
インターネットアーカイブ(Internet Archive)では、デジタルアーカイブの「Wayback Machine」で、世界中の色んなwebページを保存・閲覧できるようにしています。
ただ、削除したいページが記録されても、メールでお願いすると削除してもらえるとのことで、実際にやってみた時の方法を紹介します。
目次
インターネットアーカイブのwebページを削除してみた
まずはメールで依頼する
調べたところ、公式メールアドレスが下記の2点ありました。
- info@archive.org
- wayback@archive.org
自分は後者のwayback宛先にメールを送りました。
英語で書かないと対応してもらえないそうで、他のみなさんの文面を引用させて頂き、こんな風に書きました。
Hello.
I'd like you to delete the following data from your archive.
【1】
https://web.archive.org/web/*/https://*****.com/webpage1/
【2】
https://web.archive.org/web/*/https://*****.com/webpage2/
This mail is sent from my domain.
thank you
この時、削除するwebページと同じドメイン名のメールアドレスから送信しないと対応してもらえないので注意です。
相手からの返信は一日で届いた
こちらがメール送信した翌日には返信が届いていました。
具体的な指示内容があるので、その通りに対応していきます。
テンプレ通りに対応してから再度返信
「こういう風に書いてくれよ」ってメールだったので、その通りに修正をして、あらためてメールしました。具体的な文面は以下の通りです。
Hello, I answered.
-----
【STEP1】
URL/URL path to exclude:
https://*****.com/webpage1/
⇒https://web.archive.org/web/*/https://*****.com/webpage1/
URL/URL path to exclude:
https://*****.com/webpage2/
⇒ https://web.archive.org/web/*/https://*****.com/webpage2/
time period of domain ownership: 20**-**-** to present
time period to exclude: 20**-**-** to future
【STEP2】
https://*****.com/waybackverify.txt
-----
Thank you for your support.
ポイントは、メールだけでなく、FTP経由で、ドメイン直下のディレクトリに「waybackverify.txt」を作成しておくことを求められます。テキストファイルには、以下のように削除するページを記載しておきます。
Hello.
I'd like you to delete the following data from your archive:
[1]
https://web.archive.org/web/*/https://*****.com/webpage1/
[2]
https://web.archive.org/web/*/https://*****.com/webpage2/
There are no URLs to exclude.
thank you
あとは待つだけ
1日ほど経過すると、ページが削除されています。
ただ、自分の場合は、もう1ページが削除されていなかったので、さらに催促メールを送ったところ、ちゃんと削除してもらえました。
まとめ
インターネットアーカイブに保存されたwebページを削除したい時は、メールで問い合わせて、指示された通りに対応すれば、それでOKです。
全文英語になるので、先人のみなさまの記事を見つつ、文章を引用したり、Google翻訳など使いつつ、シンプルに書きましょう。