【 ここから本文 】

Web 2.0

ソーシャルブックマークに登録 : Yahoo!ブックマークに登録 はてなブックマークに登録 del.icio.usに登録 newsing it!に登録 Buzzurlにブックマーク livedoorクリップに登録 Slashdotにタレコむ イザ!ブックマークに登録 Twitterでつぶやく
print 印刷用ページの表示


SOA

Wikipediaの創始者が語る検索エンジンの理想像

「ユーザーは検索エンジンのアルゴリズムを知る権利がある」

(2007年03月29日)

「今や検索エンジンはインターネットの根幹となるインフラである。にもかかわらず、検索エンジンのアルゴリズムが“ブラックボックス化”されている現状はおかしい」との信念に燃え、利用者が自由に執筆/編集できるオンライン百科事典「Wikipedia」の創始者であるジミー・ウェールズ氏が、今度は検索エンジンの開発に立ち上がった。すでにGoogle、Yahoo!、Windows Live Searchといった競合製品が市場にひしめき合う中で、オープンソースで開発される検索エンジンに勝算はあるのだろうか。

鈴木恭子/IDGオンライン編集部

オープンソースでの検索エンジン開発に意欲を見せる、Wikipediaの創始者ジミー・ウェールズ氏
――新しい検索エンジンの概要を教えてほしい。

 新検索エンジン「Search Wikia」(開発コード名)の開発プロジェクトは、私が運営しているホスティング・サービス「Wikia」を主体として昨年の12月に発足した。

 Search Wikiaのキーワードは「オープンソース」だ。インターネット上に検索エンジンのソース・コードと開発ツールを公開し、開発者がこれらを自由に利用できる環境を提供するようにしたい。

――Wikipediaと同様、だれもが改変を行えるという手法によって、検索エンジンを開発するということか。

 そのとおりだ。基本的に、オープンソースの開発コミュニティに属する開発者たちが自分たちの持っている技術やツールを利用して改良を加えていくという手法を採用しようと考えている。すべてのソース・コードやアルゴリズムをインターネット上に公開し、だれでもダウンロードできるようにするつもりだ。

――なぜオープンソースでの開発にこだわるのか。

 今や、インターネットは電気や水道のような社会全体のインフラと化した。そして、検索エンジンはインターネットの根幹を担っている“インフラの中のインフラ”だ。もはや検索エンジンを利用しないでインターネットを活用することは不可能だとも言える。にもかかわらず、グーグル、ヤフー、マイクロソフトは、どのようなアルゴリズムを利用しているのかといった情報をユーザーに公開していない。私は検索エンジンが秘密主義に基づく“ブラックボックス”であってはならないと考えている。

 オープンソースで開発し、検索のアルゴリズムを公開したからといって、だれもがそれを理解できるわけではない。また、検索のアルゴリズムは企業秘密だという意見もあるだろう。しかし、ユーザーは自分の検索要求がどのようなアルゴリズムによって処理されたのかを知る権利がある。われわれは地球市民として、検索エンジンのブラックボックス化に危惧を抱くべきなのだ。

「Wikia Search」のWebサイト。同サイトによると、オープンソースの検索エンジン「Nutch」と「Lucene」が基盤となるようだ
――検索エンジンに携わる開発者は、どのようなメリットを享受できるのか。

 開発者がSearch Wikiaプロジェクトに参加したからといって、金銭的なメリットがあるわけでも何かの特典が与えられるわけでもない。Search Wikiaプロジェクトの理念はWikipediaと同様、「ボランティア」だ。そのかわり、われわれはすべてをオープンにする。技術者はこのプロジェクトに参加することで、プロジェクトに集まるすべての技術情報を得ることができるわけだ。

 これは開発者にとって魅力的な環境だと言える。実際、すでに複数の開発者がSearch Wikiaプロジェクトに参加している。また、開発者だけでなく検索エンジンを提供している企業からも参加したいという申し出を受けている。

――オープンソースで検索エンジンを開発するにあたって、何が課題になると考えているか。

 過去、オープンソースで検索エンジンを開発するときに課題となったのは、検索アルゴリズムの大規模なテスト環境をいかに確保するかということだった。アルゴリズムは検索エンジンの「心臓」だ。十分なテストが実行できなければ、検索エンジンの精度が低下し、粗悪な検索エンジンが出来上がってしまう。だが、大規模なテスト環境を構築するには、ハードウェアへの莫大な投資が必要となる。

 しかし、この課題はもはや解決済みだ。われわれは、開発者が開発ツールやソフトウェアを十分にテストできる環境をインターネットを通じて提供することにしており、すでにその準備も完了している。

 ここで1つ強調しておきたいのは、Search Wikiaプロジェクトはまだ始まったばかりだということだ。計画では、最初の試用版を今年中にリリースしたいと考えているが、その段階では、試用版でどのような検索が行えるのかを示すにとどまるだろう。

――市場には、すでにGoogle、Yahoo!、Windows Live Searchといった検索エンジンが存在する。Search Wikiaは、こうした既存の検索エンジンとどのように差別化を図っていくのか。

 先にも述べたが、既存の検索エンジンとSearch Wikiaとの最大の違いは、Search Wikiaには“ブラックボックス”が存在しないということだ。

 ある調査によると、かつてユーザーは最も信用できる検索エンジンとしてYahoo!を挙げており、Googleは次位に甘んじていた。しかし、最近はこの順位が逆転している。その理由は、「Googleのほうがブランド・イメージが良いから」だという。つまり、ユーザーが検索エンジンを選択する際には、使い勝手と検索精度のほかに、「ブランド」も考慮されているわけだ。

 だが、Googleがそのブランド・イメージによってユーザーに支持されているとしたら、それは検索エンジンとして致命的な“脆弱性”ともなりうる。なぜなら、今後高精度な検索エンジンが登場し、それが一般に普及すれば、Googleの検索エンジンとしてのブランド力は低下することになるからだ。Googleに限ったことではないが、ブランド力が低下すれば、広告を主体とするビジネス・モデルの屋台骨は揺らいでしまう。

――では、他の検索エンジンよりも高精度のものを作れるという自信はあるのか。

 オープンソースで開発すると検索エンジンの精度が下がると考えているのであれば、それは間違いだ。すべてをオープンにし、ユーザーの知恵を結集させることができれば、完成度の高いものができることはWikipediaが証明している。Search Wikiaの認知度が上がり、より多くのユーザーや開発者の知恵を集めることができれば、既存の検索エンジンよりも良いものができると確信している。そうなれば、現在インターネット上で繰り広げられている競争は劇的に変化することになろう。

――オープンソースで開発を行う際に問題となる、悪意のある開発者やいたずらをどのように排除するのか。

 残念ながら、Wikipediaにも悪意のある書き込みや“荒らし”と呼ばれる悪質なユーザーは存在する。アルゴリズムが公開されていれば、例えば、自分のWebサイトが常に上位に表示されるようにアルゴリズムを改変したいと考えるユーザーも出てくるだろう。簡単なアルゴリズムであれば、それも可能かもしれない。また、公開されたアルゴリズムは、攻撃者にとって格好の攻撃ターゲットであることも理解している。

 しかし、私は開発者コミュニティの自己浄化作用のほうが悪意のあるユーザーの攻撃よりも強力だと信じている。そもそも、スパマーに簡単に攻撃されてしまうようなアルゴリズムしか構築できないようでは、Search Wikiaプロジェクトは成功しないだろう。




関連記事

▲ページの先頭へ戻る


キーパーソン

FacebookのザッカーバーグCEO「リアルな人間関係で情報共有の輪を広げてほしい」

GoogleとのSNS連携については「話し合って妥協点を見つけたい」

ローレンス・レッシグ氏、Web 2.0技術を駆使した政治改革推進プロジェクトを発足

政治活動の透明化を促進し、裏金問題の再発を防止

Wikipediaの創始者ウェールズ氏が語る検索エンジンの理想像

「ユーザーは検索エンジンのアルゴリズムを知る権利がある」

Web 2.0のキーパーソンたちが語る「企業と検索の良好な関係」

ITマネジャーの新たな課題──サーチやソーシャル・メディアをビジネスにどう活用するか

キャッチアップ

Web 2.0技術の利用実態、IT部門の大半がブログ/Wiki/RSSを“未導入”

IT予算の制約が導入の障壁に

「Gmail障害」の対処に奔走するグーグル――なお残る不透明感

可用性への懸念高まるなか、Google Appsは引き続き企業に受け入れられるか

元グーグルの技術者が放つ、新検索エンジン「Cuil」の“実力”と“アキレス腱”

テスターからは「比べてわかるGoogleのスゴさ」との声も

“秘密主義下の情報共有”は困難そのもの――CIAのIntellipediaプロジェクト担当者

WikiやIM、ソーシャル・ブックマーク、“CIA版YouTube”などWeb 2.0技術を駆使

世界の労働者の16%が、7種のデバイスと9種のアプリを駆使する“ハイパーコネクト・ユーザー”

仕事/プライベートの両面でコミュニケーション技術の活用が進む

ユーザーの声から考える“情報共有/活用基盤2.0”

エンタープライズ検索/イントラ・ブログ/ソーシャル・ブックマークの企業での活用

Web 2.0ツールを使いこなす――社内導入に乗り遅れるな

CIOに贈る「Web2.0ツール導入ガイド」

「Second Life」のインパクト――ビジネス・プラットフォームとしての可能性を探る

“仮想世界サービス”は、既存のソーシャル・メディアを凌駕するか

目指すは「脱ブラウザ」――スタンドアロン型リッチ・クライアント最新事情

次世代デスクトップ・プラットフォームの“本命”となるか

SOAでエンタープライズ・マッシュアップを!

マッシュアップの真価を引き出し、Web2.0時代の“勝ち組”を目指せ

従業員のSNS利用禁止は逆効果?

Web 2.0サイトの「功」と「罪」

オープンソースへと移行するSecond Life

開発元が一部のソースコードを公開

Web 2.0でビジネスを変革する![前編]

最新のWeb技術が企業ITにもたらすメリットとは

Web 2.0でビジネスを変革する![後編]

Ajaxを採用し、顧客起点の中古車紹介サイトの構築に挑んだヤマトリース

期待と懸念──産学官連携の「日の丸検索エンジン」計画が始動

Web 2.0時代のプラットフォームで日本のIT業界は再び輝きを取り戻せるか

「オフィスSaaS」の使い勝手をチェックする

“Web 2.0系オフィス・アプリケーション”はこれだけ使える

「Web 2.0系情報共有ツール」企業での活用法を考える

Wiki、ソーシャル・ブックマーク、CMS……個性的なツールが多数登場

Web 2.0と企業セキュリティ

ソーシャル・メディアのセキュリティ・リスク

ブログ、Wiki、SNS、ビデオ共有……便利だが危険と隣り合わせのWeb 2.0

IMの利用ポリシー/ルールを定めよ

気軽なコミュニケーション・ツール。だが気軽に運用してはいけない

社員の「モバイル・ガジェット」をどう管理するか

職場のPCに接続されるガジェットがセキュリティ・リスク要因に

Web 2.0事例研究

国家海洋大気局、マッシュアップを使った自然資源関連ポータルを開設

自然資源に影響を及ぼす各種人的要因データを集約

ソーシャル・メディアの活用術を「先行事例」に学ぶ

イントラ・ブログで社内ポータルを強化――カシオ計算機のチャレンジ

トレンド・ウォッチ

アドビ、マッシュアップ技術「Genesis」の非公開テストを10月に開始へ

複数のアプリ/サービスを統合する、企業クライアント・ユーザーのための“次世代ポータル”(2008年09月08日)

グーグル幹部、新ブラウザ「Google Chrome」への注力姿勢を鮮明に

「次世代Webアプリにはすぐれたブラウザが必要」と指摘(2008年09月03日)

グーグル、Wikipedia対抗の知識共有サイト「Knol」を一般公開

記事投稿は実名で。読者はコメントやレビューを記入可能(2008年07月24日)

WSO2、オープンソースのマッシュアップ開発環境「Mashup Server」をアップデート

Google Gadgetsをサポート。複数のデータ・ソースとの連携が可能に(2008年07月22日)

ヤフー、カスタム検索サービスの構築プラットフォーム「Search BOSS」を発表

検索APIを公開し、グーグルに対して巻き返しを図る(2008年07月11日)

ガートナー「仮想世界プロジェクトの90%は18カ月以内に失敗する」

「技術面ばかりに固執してはダメ」と辛口アドバイス(2008年05月16日)

拡大するWeb 2.0関連市場、2013年には46億ドル規模へ

業界大手の展開加速で新興ベンダーの減少を予想(2008年04月22日)

IBM、2種類の企業向けマッシュアップ構築ツールを発表

開発者向けと非開発者向け。前者はRESTfulベース(2008年04月09日)

Weekly Ranking

集計期間:11/25〜12/01


トピック一覧

ニュース特集

セキュリティ

ソフトウェア&サービス

経営/業務改革

ITマネジメント

データ・マネジメント

プラットフォーム

IT基盤技術

ハードウェア

ネットワーキング

トレンド

IT業界動向


Computerworld Global
米国
英国
中国
ドイツ
オーストラリア
シンガポール
その他の国