奥が深い google の ヒミツ -検索語句が結果のページに含まれないことがあるよ-
google で、検索語句が入っていないページが検索結果に出ることがあるというお話
その1
これは有名だと思いますが、「_| ̄|○」を検索すると、「くずおれる男」が検索結果のトップに出るというもの。コレは「_| ̄|○」理解のための正しい結果なのか正しくないのか判らないがともかく笑えるからよいでしょう。
その2
「京ポン 京ぽん キター」の検索結果トップが、『DDIポケット、待望の新型AirH”PHONE「AH-K3001V」』であるというもの。コレも実際に「京ポンキタ━━━━(゜∀゜)━━━━ッ!!」な人々にとってはただしい検索結果なのですが、そのページ内には、「京ポン」も「京ぽん」も「キター」も含まれていない。
更に、「京ポン」を検索すると、「京セラ | 製品情報 | 携帯電話・PHSパーソナルユーザー | 製品情報 | AH-K3001V」がトップに出ますが、これまたキーワードがページに含まれない。
google の中の人も例外的登録をいっぱいやっているんだなあ。意味としては正しく検索されているけれども、検索エンジンとしてはコレは正しいのか、正しくないのか!?
| 固定リンク
トラックバック
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/5574/518898
この記事へのトラックバック一覧です: 奥が深い google の ヒミツ -検索語句が結果のページに含まれないことがあるよ-:

コメント
それらは「例外処理」じゃなくて、Googleがそういうルーチンを組んでいるのでは、と考えました。詳しくはURLを。
投稿 imasa | 2004.05.07 16:42
# n12a 『まあ、確かに人力で登録処理しているとは思えませんが、ページそのものにキーワードが含まれていない場合でも検索結果にひっかかる、という例外はルーチン内に含まれているわけですな。「_| ̄|○」は dmoz.org にも登録が無いようだし。』 (2004/05/08 12:50)
というコメントを私の日記にいただきました。ほかの方に話の流れがわかるよう、こちらに転記させていただきます。
投稿 imasa | 2004.05.08 13:35
こんにちは。
これは例外ではなく、Google が売りにしている PageRank のストレートな結果だと思います。
PageRank はページの順位をよそのページからのリンクによって決定する仕掛けですが、そのリンクのキーワード(すなわち HTML の A タグで囲まれた語句)も、ランキングのキーワードとして採用されているようです。
つまり「そのページが世の中からどのように見られているか」ということが、Google の PageRank の意味になります。それゆえ、有名人のホームページが不本意なキーワードで検索トップに挙がる例も見受けられます。
投稿 K. | 2004.06.08 23:04