【 ここから本文 】

Googleウォッチ

ソーシャルブックマークに登録 : Yahoo!ブックマークに登録 はてなブックマークに登録 del.icio.usに登録 newsing it!に登録 Buzzurlにブックマーク livedoorクリップに登録 Slashdotにタレコむ イザ!ブックマークに登録 Twitterでつぶやく
print 印刷用ページの表示



Wikipediaの創始者が語る検索エンジンの理想像

「ユーザーは検索エンジンのアルゴリズムを知る権利がある」

(2007年03月29日)

「今や検索エンジンはインターネットの根幹となるインフラである。にもかかわらず、検索エンジンのアルゴリズムが“ブラックボックス化”されている現状はおかしい」との信念に燃え、利用者が自由に執筆/編集できるオンライン百科事典「Wikipedia」の創始者であるジミー・ウェールズ氏が、今度は検索エンジンの開発に立ち上がった。すでにGoogle、Yahoo!、Windows Live Searchといった競合製品が市場にひしめき合う中で、オープンソースで開発される検索エンジンに勝算はあるのだろうか。

鈴木恭子/IDGオンライン編集部

オープンソースでの検索エンジン開発に意欲を見せる、Wikipediaの創始者ジミー・ウェールズ氏
――新しい検索エンジンの概要を教えてほしい。

 新検索エンジン「Search Wikia」(開発コード名)の開発プロジェクトは、私が運営しているホスティング・サービス「Wikia」を主体として昨年の12月に発足した。

 Search Wikiaのキーワードは「オープンソース」だ。インターネット上に検索エンジンのソース・コードと開発ツールを公開し、開発者がこれらを自由に利用できる環境を提供するようにしたい。

――Wikipediaと同様、だれもが改変を行えるという手法によって、検索エンジンを開発するということか。

 そのとおりだ。基本的に、オープンソースの開発コミュニティに属する開発者たちが自分たちの持っている技術やツールを利用して改良を加えていくという手法を採用しようと考えている。すべてのソース・コードやアルゴリズムをインターネット上に公開し、だれでもダウンロードできるようにするつもりだ。

――なぜオープンソースでの開発にこだわるのか。

 今や、インターネットは電気や水道のような社会全体のインフラと化した。そして、検索エンジンはインターネットの根幹を担っている“インフラの中のインフラ”だ。もはや検索エンジンを利用しないでインターネットを活用することは不可能だとも言える。にもかかわらず、グーグル、ヤフー、マイクロソフトは、どのようなアルゴリズムを利用しているのかといった情報をユーザーに公開していない。私は検索エンジンが秘密主義に基づく“ブラックボックス”であってはならないと考えている。

 オープンソースで開発し、検索のアルゴリズムを公開したからといって、だれもがそれを理解できるわけではない。また、検索のアルゴリズムは企業秘密だという意見もあるだろう。しかし、ユーザーは自分の検索要求がどのようなアルゴリズムによって処理されたのかを知る権利がある。われわれは地球市民として、検索エンジンのブラックボックス化に危惧を抱くべきなのだ。

「Wikia Search」のWebサイト。同サイトによると、オープンソースの検索エンジン「Nutch」と「Lucene」が基盤となるようだ
――検索エンジンに携わる開発者は、どのようなメリットを享受できるのか。

 開発者がSearch Wikiaプロジェクトに参加したからといって、金銭的なメリットがあるわけでも何かの特典が与えられるわけでもない。Search Wikiaプロジェクトの理念はWikipediaと同様、「ボランティア」だ。そのかわり、われわれはすべてをオープンにする。技術者はこのプロジェクトに参加することで、プロジェクトに集まるすべての技術情報を得ることができるわけだ。

 これは開発者にとって魅力的な環境だと言える。実際、すでに複数の開発者がSearch Wikiaプロジェクトに参加している。また、開発者だけでなく検索エンジンを提供している企業からも参加したいという申し出を受けている。

――オープンソースで検索エンジンを開発するにあたって、何が課題になると考えているか。

 過去、オープンソースで検索エンジンを開発するときに課題となったのは、検索アルゴリズムの大規模なテスト環境をいかに確保するかということだった。アルゴリズムは検索エンジンの「心臓」だ。十分なテストが実行できなければ、検索エンジンの精度が低下し、粗悪な検索エンジンが出来上がってしまう。だが、大規模なテスト環境を構築するには、ハードウェアへの莫大な投資が必要となる。

 しかし、この課題はもはや解決済みだ。われわれは、開発者が開発ツールやソフトウェアを十分にテストできる環境をインターネットを通じて提供することにしており、すでにその準備も完了している。

 ここで1つ強調しておきたいのは、Search Wikiaプロジェクトはまだ始まったばかりだということだ。計画では、最初の試用版を今年中にリリースしたいと考えているが、その段階では、試用版でどのような検索が行えるのかを示すにとどまるだろう。

――市場には、すでにGoogle、Yahoo!、Windows Live Searchといった検索エンジンが存在する。Search Wikiaは、こうした既存の検索エンジンとどのように差別化を図っていくのか。

 先にも述べたが、既存の検索エンジンとSearch Wikiaとの最大の違いは、Search Wikiaには“ブラックボックス”が存在しないということだ。

 ある調査によると、かつてユーザーは最も信用できる検索エンジンとしてYahoo!を挙げており、Googleは次位に甘んじていた。しかし、最近はこの順位が逆転している。その理由は、「Googleのほうがブランド・イメージが良いから」だという。つまり、ユーザーが検索エンジンを選択する際には、使い勝手と検索精度のほかに、「ブランド」も考慮されているわけだ。

 だが、Googleがそのブランド・イメージによってユーザーに支持されているとしたら、それは検索エンジンとして致命的な“脆弱性”ともなりうる。なぜなら、今後高精度な検索エンジンが登場し、それが一般に普及すれば、Googleの検索エンジンとしてのブランド力は低下することになるからだ。Googleに限ったことではないが、ブランド力が低下すれば、広告を主体とするビジネス・モデルの屋台骨は揺らいでしまう。

――では、他の検索エンジンよりも高精度のものを作れるという自信はあるのか。

 オープンソースで開発すると検索エンジンの精度が下がると考えているのであれば、それは間違いだ。すべてをオープンにし、ユーザーの知恵を結集させることができれば、完成度の高いものができることはWikipediaが証明している。Search Wikiaの認知度が上がり、より多くのユーザーや開発者の知恵を集めることができれば、既存の検索エンジンよりも良いものができると確信している。そうなれば、現在インターネット上で繰り広げられている競争は劇的に変化することになろう。

――オープンソースで開発を行う際に問題となる、悪意のある開発者やいたずらをどのように排除するのか。

 残念ながら、Wikipediaにも悪意のある書き込みや“荒らし”と呼ばれる悪質なユーザーは存在する。アルゴリズムが公開されていれば、例えば、自分のWebサイトが常に上位に表示されるようにアルゴリズムを改変したいと考えるユーザーも出てくるだろう。簡単なアルゴリズムであれば、それも可能かもしれない。また、公開されたアルゴリズムは、攻撃者にとって格好の攻撃ターゲットであることも理解している。

 しかし、私は開発者コミュニティの自己浄化作用のほうが悪意のあるユーザーの攻撃よりも強力だと信じている。そもそも、スパマーに簡単に攻撃されてしまうようなアルゴリズムしか構築できないようでは、Search Wikiaプロジェクトは成功しないだろう。




関連記事

▲ページの先頭へ戻る


インタビュー

「OHAへの共通理解があるから、技術的な細分化は生じない」――グーグルのAndroid担当者

「OHA各社独自のアプリケーションや機能の乱立」という懸念に答える

次世代の検索技術においても“主役の座”は渡さない

グーグル幹部、ビデオ/セマンティック/ユニバーサル検索の現状と問題点を語る

キーパーソン

グーグル幹部、R&Dセンターの国際展開構想を語る

「グーグルは、R&Dもグローバルに考える」

「ニュースの収集・インデックス化は公正利用の範囲内」

グーグル幹部が語るGoogle Newsのポリシー

グーグル幹部、エンタープライズ分野への意気込みを語る

「ITマネジャーやCIOにも十分食い込める」

グーグルのトップ・エンジニアが語る「Google Groups」の将来構想

「共有機能の強化は大規模サービス改革の始まりにすぎない」

「auとの提携で何を目指すのか」

グーグルのモバイル担当責任者に聞く

「検索は引き続き事業の中核」

グーグルCEOのシュミット氏が強調

キャッチアップ

グーグル幹部が指摘する、ECMシステムに欠落している“視点”とは

「コンシューマー向け製品を見習うべきだ」

肥大化するWebメール受信箱の「功」と「罪」

ヒートアップするサービス合戦にほんろうされるユーザー

Googleの秘密――検索結果ランキングの“隠し味”に迫る

SEO専門家を悩ませるトップ検索エンジンの謎

データセンターは地域活性化の起爆剤となるか

グーグルのデータセンター建設で、「二匹目のどじょう」をねらう地方自治体

「Web 2.0 Summit」で語られたコンピューティングの未来

イノベーション創出のため、Web 2.0を製品戦略に取り入れるベンダー各社

「オフィスSaaS」の使い勝手をチェックする

“Web 2.0系オフィス・アプリケーション”はこれだけ使える

エンタープライズ検索テクノロジーの「着眼点」

企業ITインフラ上での位置づけを押さえ、導入に備えよう

“使える!”ビジネス・インテリジェンス(BI)がやってきた

エンタープライズ検索との融合で、必要なデータへの直接アクセスが可能に

“秘密のベールに包まれた”グーグルの新データセンター

世界最強のデータセンターの要件とは

エンタープライズGoogle「期待の声」と「死角」

Web検索エンジンの覇者、“ファイアウォールの内側”に挑む

トレンドフォーカス

セールスフォースとグーグルが戦略的提携――CRMアプリとAdWordsを統合

技術開発やマーケティングなどを共同で推進(2007年06月06日)

グーグル幹部、検索アルゴリズムの一部を“手作業”にする可能性を示唆

ウェブマスター・ガイドラインの見直しも明言(2007年06月05日)

グーグル、オフライン対応Webアプリの開発/実行環境「Google Gears」を発表

各種データをローカルDBに保存(2007年05月31日)

グーグル、検索アプライアンスの機能を拡張するオープンソース・フレームワークを開発

各社の文書/コンテンツ管理システムとのネーティブ接続を実現(2007年05月22日)

グーグル、GmailとDocs & Spreadsheetsの連携を強化へ

マイクロソフト「Office」を凌駕するコラボレーション機能を提供(2007年05月17日)

グーグル、PowerPoint対抗のプレゼン・ソフトを今夏にリリース

Docs & Spreadsheetsの一員としてWebコラボレーションを支援(2007年04月18日)

グーグル、ラジオ広告分野に本格進出――全米のAM/FM局で広告展開

クリア・チャネル傘下の675を超えるラジオ局に広告を配信(2007年04月17日)

グーグル、ダブルクリックを31億ドルで買収――買収合戦に勝利

リッチ・メディア広告をいよいよ本格展開へ(2007年04月16日)

グーグル、検索ログを匿名化する新ポリシーを導入へ

検索ユーザーのプライバシー保護を強化(2007年03月16日)

グーグル、「Google Desktop 5」をリリース

UIの一部変更とともにセキュリティを強化(2007年03月08日)

グーグル、サイト管理者向けマルウェア警告サービスを強化

より詳細な情報をメールでも通知(2007年02月28日)

グーグル、ヤフー、マイクロソフトの3社、Sitemapプロトコルを共同で推進

サイト管理者によるコンテンツ情報の提供を容易に(2006年11月17日)

グーグルがジョットスポットを買収

JotSpotは無料に(2006年11月01日)

インテュイット、会計パッケージにグーグルのサービスを統合

小規模ユーザー企業のオンライン販促活動を支援(2006年09月14日)

グーグルのバイナリ検索機能をマルウェアの検知に活用

危険なWebサイトの発見を容易に(2006年07月10日)

グーグル、オンライン決済サービス「Google Checkout」を発表

購入情報を保存・管理し、電子商取引を効率化(2006年06月30日)

課題を見極める

Wikipediaの創始者が語る検索エンジンの理想像

「ユーザーは検索エンジンのアルゴリズムを知る権利がある」

バイアコム、YouTubeの著作権侵害でグーグルを提訴

10億ドルの損害賠償とクリップ削除を要求

ベルギーの裁判所、グーグルに再び著作権侵害の判決

10億ドルの損害賠償とクリップ削除を要求

バイアコム、10万件以上のビデオ・クリップを削除するようユーチューブに要求

「ユーチューブ側に公正な市場協定を締結する姿勢は見られない」

「PayPal」に遠く及ばない「Google Checkout」の顧客満足度

調査会社JPモルガン・セキュリティーズが明らかに

グーグルの戦法に専門家が賛否両論

「公正利用」か「著作権侵害」か

グーグル、ダブルクリックを31億ドルで買収――買収合戦に勝利

リッチ・メディア広告をいよいよ本格展開へ

Google Book Search訴訟でフランスの出版業界が共闘

書籍の一方的なデジタル化を阻止へ

グーグルのユーチューブ買収価格は適正か?

収益のない新興企業になぜ16億5,000ドルも

グーグル、ヤフーなど、主要検索サイトの顧客満足度が低下

Webポータル全体の顧客満足度は1.3%上昇も

「Google Checkout」のサービス遅延に不満の声が噴出

原因は審査プロセスの負荷?

「クリック詐欺の件数は誇張されている」

グーグルが報告書

グーグル、「不当検索ランキング」訴訟にどう挑むのか

ランキングは本当に公正なのか?

「検索戦争は始まったばかり」

ヤフー幹部がグーグルに挑戦状

ヤフーとイーベイが提携

「広告」と「検索」の強化でグーグルに対抗

「イーベイのマイクロソフト/ヤフー提携」報道

分かれるアナリストの評価

情報セキュリティ問題

Google Desktopに新たな脆弱性

セキュリティ企業が実証ビデオを公開

Google Desktopでまたしても脆弱性が発覚

PCの全データが流出するおそれも

Google Desktopに深刻な脆弱性

グーグルが修正版を配布

「5大検索エンジンのサーチ結果の3.1%が危険なリンク」

マカフィーが警鐘

Weekly Ranking

集計期間:08/23〜08/29



Computerworld Global
米国
英国
中国
ドイツ
オーストラリア
シンガポール
その他の国