BLOGTIMES
2005/01/07

ndl-japan-research-robot

  webarchive 
このエントリーをはてなブックマークに追加

変なアクセスがないかどうか生のアクセスログをたまに眺めるようにしています。そうしたらUser-Agentがndl-japan-research-robot-1.1という見慣れないロボットが襲来しているのを見つけました。人間の情報処理能力というのはすごいもので、洪水のようなログをなんとなく眺めているだけで、こういうのを見つけることができるんですよね。

とりあえずUser-Agentに入っているURLにアクセスしてみると、国立国会図書館の調査のためのロボットであることがわかりました。実際にロボットを運用しているのはNTT Dataのようです。

「デジタルアーカイブのための日本のウェブサイトの実態調査」のお知らせ

インターネット上に存在する電子情報は、近年、急速に増大しており、また、後世に残すべき「文化財」としての重要性も高まっています。しかし、ウェブ情報は、日々更新されており、歴史的観点から見て貴重な情報が記録されることなく消滅する危険性に直面しています。

cles::blogが後世に残すべき「文化財」なのかという問題はおいておくとしても、なかなか面白いプロジェクトだと思います。

参考文献の消滅が防げる?

最近、論文の参考文献にWebのURLが指定されていることも珍しくなくなっています。ところが、数年前の論文の参考文献に指定されているサイトのURLを打ち込んでみるとページがなくなっていて困ることが多々あります。本の絶版も困るのですが、失われてしまったウェブページは、現在のところどうやっても取り戻す手段がありません。このプロジェクトがうまく機能すると、そういう問題もなくなるかもしれませんね。

協力してあげましょう

ちゃんとrobot.txtも読んでいるようだし、アクセス間隔も適切なので、協力してあげる*1ことにしました。

  • *1: つまり、巡回させてあげるということ。

トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/609
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form

コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。

OpenID を使ってログインすることができます。

Identity URL: Yahoo! JAPAN IDでログイン