ドジっ子Watcher
「スーパードジっ子Company」の更新情報、ならびに自分が書きたいことなんでも。
201705<<123456789101112131415161718192021222324252627282930>>201707
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
--/--/--(--) --:--:--| スポンサー広告| コメント:- ブックマークに追加する
 以前の記事(誰も書かなかった? 検索避け(検索除け)テクニック)にも書いたが、Webサイトを公開する人の中にはできる限り検索エンジンに拾われたくないと思う人もいる。そしてそれらの人たちが行っているのが検索避け(検索除け)と呼ばれる行為であり、それらを施すことによって作成したWebサイトが検索エンジンに拾われなくなったり順位が下がったりし、無関係な人がサイトを見るのを防止する効果がある。

 しかしながら今までの方法ではどれも一長一短であり、「検索避けしたはずなのに効果が無い! これは誰かがオンラインブックマークでもしてるんじゃないの?」といった責任転嫁が見られたりする。まあもちろん責任転嫁して騒ぐのが好きな人はそれでいいのだろうが、これでは犯人扱いされたオンラインブックマークが可哀想……じゃなかった、本当に検索除けしたい人にとっては不満足であろう。

 ということで、今まであまり語られることのなかった「暗号化による検索避け」について書いてみることにする。はたして決定打になるや否や? 
 (実験ページを検索エンジンに拾ってもらうためにリンク→http://blunderer.web.fc2.com/crypt/
検索除け方法の2分類

 検索避けにはいろいろな方法があるが、大きく分けて2つに分類できる。

1)サイトに「検索エンジンに載せないでください」というお願いを書いておく
 →metaタグ、robots.txt、rel=nofollowなど
2)検索エンジンのロボットが読み込めないような細工をする
 →無関係な文字挿入、BASIC認証、.htaccessによるロボット拒否など

 1)に関しては手軽であるものの、残念ながらそれを無視するロボットもあるので完璧とはいいがたい。それでは2)はどうかというと、読みづらくなる(無関係な文字挿入)、閲覧者に手間をかける(BASIC認証)、各検索エンジンに個別対応しなければならない(.htaccessによるロボット拒否)など、やはりこちらも一長一短である。

 「それなら、人間が読めてロボットに読めない文字で書けばいいじゃないの?」
 確かにそれならば問題無く読むことができるし、検索エンジンにも載らない(載ったとしてもキーワードが存在しないから結果に出にくい)。というわけでその方法について書いてみることにした。

その方法は?

 さてその方法であるが、以下の2つの方法がある。

1)ブラウザがそれを読み込んだ時に元の文字に変換してくれるよう、決まった法則に従って変換する(URLエンコード、エンティティ変換)。
2)文字をある法則に従って変換しておき、表示する際にJavascript等で復元する。

 1)はJavascriptを実行しないよう設定していても問題無く表示できる反面、変換規則が決まっているので検索エンジンのロボットが解読するのではないかという懸念が拭いきれない。その反面2)は変換規則を自由に決定できるのでロボットが解読する可能性はほぼ皆無(Javascriptを実行するロボットであれば別だが、今のところ存在しない)だが、Javascriptを実行しないよう設定していると表示できないという欠点がある。

 いずれの方法にしても原理的には手動で変換することも可能なのだが、そんな大変面倒なことをやりたいという人は皆無であろう。というわけでそれらを変換するソフトをいくつか探してみた。

暗号化に使用できるソフト

 いずれも無料でダウンロード及び使用できるソフトである。シェアウェアになっているものもあるが、変換後のページに広告が入る等の制約が気にならなければそのまま使用して差し支えは無い。

1.HTMLエンティティ変換
 JavascriptをOFFにしていても表示できるが、検索エンジンのロボットが解読する可能性は否定しきれない(後日レポート予定)。
※2008/4/22追記 現在のところ検索エンジンにインデックスされてないようだ。ロボットが解読する可能性は杞憂だったか(詳しくは最後)。
※2008/5/7追記 Googleにインデックスされ、内容も解読されたようだ。この方法は単独では意味無いかもしれない。

 サンプルページ:http://blunderer.web.fc2.com/crypt/page1.html
 ダウンロードはこちら→http://www.vector.co.jp/soft/win95/net/se414548.html

2.HTMLガード
 本来はページのソースを読みにくくして内容の流用などされるのを防ぐ目的で作成されたソフトであるが、ここでは検索エンジンロボットへ対策に使用してみた。Javascriptを使用しているのでOFFにしていると表示できない。

 サンプルページ:http://blunderer.web.fc2.com/crypt/page2.html
 ダウンロードはこちら→http://www.vector.co.jp/soft/win95/net/se319362.html

3.Encorder for HTML
 上記HTMLガードと同じくソースの難読化を目的としたソフト。JavascriptがOFFになっていると表示できない。
 サンプルページ:http://blunderer.web.fc2.com/crypt/page3.html
 ダウンロードはこちら→http://www.vector.co.jp/soft/winnt/net/se440621.html

4.HTML Encorder Pro
 本来は正しいパスワードを入力しないと表示されない「(本来の意味での)暗号化ソフト」だが、メッセージにパスワードを書いてしまうことによって前回の記事で述べた「公開パスワード方式」的な使い方ができる。

 サンプルページ:http://blunderer.web.fc2.com/crypt/page4.html
 ダウンロードはこちら→http://www.vector.co.jp/soft/win95/net/se140288.html

※2008/04/22追記
やはり有効か?

 2008/04/22現在、暗号化ページはYahooとGoogleにはインデックスされてない模様。キーワードが検知できないばかりでなく、インデックスそのものがなされないというのは意外だった
Yahooでの検索結果 Googleでの検索結果

 ということで、この方法は検索避けにはかなり有効ではないだろうかと思われる。

※2008/5/7追記 「HTMLエンティティ変換」で変換したページがGoogleにインデックスされ、内容も解読されているのを確認。残念ながらJavascriptを使わない方法は効果が薄いと言わざるを得ないかも。
スポンサーサイト

テーマ:web制作 - ジャンル:コンピュータ

この記事へのコメント
コメントを投稿する(記事に関係無いコメントは荒らしとみなし削除・アク禁とします)
管理者にだけ表示を許可する
トラックバック
この記事のトラックバックURL
この記事へのトラックバック
管理人の承認後に表示されます
2014/04/02(水) 20:26:42 |
ブクマコメント  はてな:  Buzzurl:  livedoor:
copyright © 2004-2005 Powered By FC2ブログ allrights reserved.
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。