google sitemap

WordPress以外の hp部分も、Google Sitemapに登録しよう。
ってことで、それぞれの /sitemap.xmlを作成する shスクリプトを作成しました
sitemap.xmlを作り始めて 15日ぐらいたつのです。
毎日、cronで更新しています。
しかし今日、こりゃまずい!ってのを発見しました。

crawl-66-249-66-13.googlebot.com – - [09/Dec/2005:03:31:52 +0900] “GET /db/blog_data/xoops_stories.MYI HTTP/1.1″ 403 372 581 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

googleの robotsは、近頃凶悪なところもクロールするんだなー、オイ!
と思ったら、私の手違えで sitemap.xmlへ、ディレクトリー一覧を吐き出しては駄目な部分の
ディレクトリーが吐き出されていました。

sitemap.xmlは一時期の、会社の存亡を左右するほどの情報ダダ漏れ事件、directory indexと同じか、
それ以上に危険な情報です。

/dbディレクトリーへのアクセスは、apache2の httpd.confの設定で denyにしました。