- blogs:
- cles::blog
2006/11/24

拡張子によってYahoo! Slurpのクロールを制御


Yahoo! Slurpの解釈するrobot.txtの内容がいつの間にか拡張されていたようです。
Yahoo! Search、robots.txtでワイルドカード対応 :: SEM R
Yahoo! Search、robots.txtでワイルドカードに対応、クローラSlurpに対して指定した文字列を含む全てのファイル/ディレクトリへのアクセス禁止指示をすることが可能に。
なんといっても目玉なのは拡張子によってクロールが制御できるということでしょうか。
Yahoo! Search blog: Yahoo! Search Crawler (Yahoo! Slurp) - Supporting wildcards in robots.txt
User-Agent: Yahoo! Slurp
Disallow: /*.gif$
こんな感じにするとサイトにある.gifを拡張子に持つファイルをすべて禁止することができるみたいです。mod_rewiteなんかで動的サイトを静的に見せたりしているような場合に、ロボットによる過負荷を防ぐには便利そうですね。
トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/1716
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form
コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。
OpenID を使ってログインすることができます。
サイト内検索
検索ワードランキング
へぇが多いエントリ
- 居酒屋 八(ひらく) (3)
- iPad をプレゼンタイマーにする (1)
- 退去通知もネットで可能な時代に (1)
- ケーブルカーのケーブルが切... (1)
- Visual Studio 2017/2019 で ... (1)
閲覧数が多いエントリ
1 . Solr-rubyで複数のドキュメントを一括Post(32919)
2 . Windows 10 で勝手にログアウトされないようにする(26829)
3 . Word で数式がグレーアウトされていて挿入できないときは(24737)
4 . リモートデスクトップで Alt + PrtSc と同じことをするには(20985)
5 . Visual Studio 2017/2019 で scanf() がエラー(C4996)になるときは(20421)
2 . Windows 10 で勝手にログアウトされないようにする(26829)
3 . Word で数式がグレーアウトされていて挿入できないときは(24737)
4 . リモートデスクトップで Alt + PrtSc と同じことをするには(20985)
5 . Visual Studio 2017/2019 で scanf() がエラー(C4996)になるときは(20421)
cles::blogについて
Referrers