こないだ伊藤さんと夕食を食べた時のこと。
「Googleで検索するとさ、結果が何万件ってでるじゃない?
それなのに、実際は100ページ以上クリックすると
表示されないのがっかりだよね」
その場にいたみんなが
「え、そうなんですか?」
早速帰って調べてみました。例えば、「日本」をキーワードでググルと、
「日本 の検索結果 約 90,300,000 件中 1-10件目 (0.19秒)」
とステータスバーに表示されます。そこで実際にページを送っていくと、「日本」の検索結果の場合、25ページ目で
「最も的確な結果を表示するために、上の243件と似たページは
除かれています。検索結果をすべて表示するには、ここから
再検索してください。」
さらに「ここから再検索」をクリックすると再び検索結果ページが。でもこのページを送っていくと、やっぱり100ページ目の997件で検索結果表示は終わってしまうのです。
つまり、9030万件ヒットしたうちの、9029万9000件の結果は知ることが出来ないわけです。
でももっと驚きだったのは、伊藤さんに指摘されるまで、それに自分が気づかなかったこと。検索すると該当結果の数は必ず見ているのに、考えてみるとたいてい100件以内(ページで10ページくらい)の検索結果で満足していたのだなぁ・・・。私ってバカ?!
でも、さすが伊藤さん、「想定の範囲外」の視点を持っているところが素敵です。そういう視点が、次の時代を見抜く力になるのかなと改めて尊敬してしまいました。
Comments 7
私も知りませんでした。
試しに1ページの表示件数を100件にして検索してみましたが、たった10ページしか表示されず、なんかサビしい感じがしてしまいますね。
全部の結果を表示できるようにしてしまうと、API経由でデータを吸い取られてしまう危険性があるからなのかもしれませんし、人間なら1000件以上、一つの検索キーワードで調べないからかもしれません。でも「いっぱいあるけど、全部は見せないヨ」という「チラリズム」も、Googleの狙っていることなのかもしれませんね。
一応知っていました。この程度の結果にしておくことでほとんどの人が「がっかり」しないのではなく、そのほうが「満足」することをGoogleは知っている、理解している、承知している、意図しているということも言えるのではないかと思っています。
元々Googleがインターネット上の全てを網羅しているわけでもないし、情報にある程度の色眼鏡を通して見ている事に価値があるので、全部見ることに対しての価値がどれだけあるのか?、言い換えれば、全部見えることが必ずしも素晴らしくないという事だと思います。
例えば一般的な言葉を入れたときに、特定の固有名詞が結果として上位に来る事がありますが、そのあたりに価値が見え隠れしていると思います。
僕もこの場にいた人間なのですが「この人(伊藤さん)アホだな〜(笑)」ってすっごくわらっちゃいました。
でも林さんも指摘してる通り、こーいうところが、また変なサービスを見つけたりするところに繋がるんだろうなーって。
あとふじもとさんも指摘しているところですが、こうやって「え?これ以上出てないの?」って皆が思うってことはグーグルに対する絶対的な信頼感とかの現れだと思うのです。グーグルこそはインターネットの全ての道しるべ的な。
そう思われてるグーグルとそのブランド力もすごいし、でも最近こうやって少しづつその力に陰りとか影が見えてきてるのかな〜?とも思います。
ちなみに日本にプロバイダーを持ち込み、何年も前にブログやSNSを予見し(て持ってき)た伊藤さんは、今何に目をつけてるんだろうと思ったら意外なところでした(つづく)。
ヒット数って、スペルミスや用法を確認する時くらいしか見てないですねぇ。たまに「もしかして・・・」とか表示されると、「あーそれそれ」みたいにツボにはまることが。
同じ単語で再度検索してみると「もしかして」が表示されなかったりして、どうやって表示してるのか謎ですが。
面白いですね。世界中のすべてのDOCUMENTを吸い込んで開発してきたすばらしいGOOGLEシステムなのに、結局は自分の適切評価基準技術(PageRank)の上位結果件数内でしか世界を検索していません。GOOGLE検索エンジンの適切性も問われますが、別の視点から見れば、世界全体の膨大な情報データベースをどのように検索可能にすればいいかという問題が浮かんできます。
今までは、世界のすべての情報をひとつにまとめて、いかにバランス良く情報を検索すればいいかでした。でも実際はそれが人間にとって不可能なので、これからもより不可能になります。これからは分野別、地域別、時間帯別などの条件付き検索エンジンに絞らない限り、いつまでもすべての情報を検索している幻像に落ちってしまってしょうがないでしょう。
すごく面白いコメントを皆さん、ありがとうございます。
たしかにGoogleは計算の上で、パフォーマンスとの適正化を図り、「大半の人に満足してもらえる」上位結果しか表示していないのだと思います。でも、数百万件も結果があると知りながら、400〜500件の結果で満足してしまう人間って不思議じゃないですか?もし検索結果が「該当 150件」とか「該当400件」だと、えむくまさんじゃないですが「あれ、間違った言葉で検索しちゃったかな?」って思うくらいなのに。目にすることができない残りの何百万件、何千万件の結果ってどんなものなんでしょうね??
あと、たしかにこれからは分野別、とか地域別といった条件付検索が主流になっていくかもしれないですね。(すでに掛け合わせ検索が上手な人は、そういう検索方法しているのかもしれませんが)
以下は何が真実か、正しいか、誰が何を求めているのかという定義にもよりますが、少し補足します。
インターネットに「落ちていた物」、「ひろいもの」という言葉が普通に認識されているように、元々「期待できない」相手に対して検索をしているという時点で、何らかの介在がなければ「正しい結果」を期待できないと思っています。そういう意味で、「残りの何百万件、何千万件の結果」に期待を持つ必要はあまりないとも言えます。ここが、何らかの目的に用意されたデータベースや時点などを検索する事とは全く異質なのではないでしょうか。