【 ここから本文 】

データ・マネジメント

ソーシャルブックマークに登録 : Yahoo!ブックマークに登録 はてなブックマークに登録 del.icio.usに登録 newsing it!に登録 Buzzurlにブックマーク livedoorクリップに登録 Slashdotにタレコむ イザ!ブックマークに登録 Twitterでつぶやく
print 印刷用ページの表示


データ・マネジメント

【XML DB プロダクト・レビュー】
「TX1」(東芝ソリューション)

(2007年09月28日)

大量XMLデータの検索を高速化する独自技術を搭載

 東芝ソリューションの「TX1」は、大量のXMLデータに対する検索の高速化を図る各種の機能を備えたネーティブXML DBである。現行バージョンは「V2」で、日本語を対象とする「自然言語処理機能」を搭載したことが大きな強化ポイントだ。

 XML検索の高速化のために、TX1では、「構造自動抽出技術」と「問い合わせ最適化技術」という同社独自の技術を実装している。前者により、登録されたXMLデータの構造を自動抽出してインデックスを作成し、後者では、抽出した構造と語彙を統計的に分析して最適なクエリ実行プランを生成する。加えて、全文検索のためのインデックスを作成する機能も搭載している。これらの機能群により、検索対象となるXMLデータへの参照回数を低減し、検索速度の高速化を実現している。

 検索の実行には、XML向けの問い合わせ言語であるXQueryを利用することができる。また、検索で得られたXMLデータが大容量となる場合でも、メモリの消費量を抑えることが可能になっている。

 XMLデータの登録の際には、データベース構造の定義が不要で、構造の異なるXMLデータもそのまま格納することができる。そのため、データ構造が変更されたときにも柔軟な対応が可能だ。

新たな自然言語処理機能で検索精度・速度が向上

 TX1の現行バージョンは、2006年11月に販売開始された「V2」となる。同バージョンでは、日本語を対象とする「自然言語処理機能」を搭載したことが大きな強化ポイントだ。具体的には、従来からの「Nグラム方式」に加えて、「形態素解析方式」による自然言語検索機能をサポートした。

 Nグラム方式は、隣接する文字列でインデックスを切り出す手法。例えば、「東京都港区」という文字列に対しては、「東京/京都/都港/港区」というインデックスを作成する。同方式は、漏れのない検索が可能なため、型番のような英数文字列の検索には適しているが、この例で言えば、「京都」で検索した場合でも、東京都港区が検索結果に含まれてしまうことになる。

 これに対して形態素解析方式は、言語の規則や辞書に従い、意味のある単語でインデックスを切り出す。前述の例では、「東京/都/港区」という形でインデックスを作成する。これらの2種類の検索手法を使い分けることで、検索時の速度および精度を向上させることができる。

 また、新バージョンでは、さまざまなデータをXML形式に変換して登録する「データ連携機能」も追加された。この機能により、さまざまな種類の元データのXML化とTX1への登録が容易になり、複数のシステム/アプリケーションを横断した検索や分析を迅速に行うことが可能となる。

XML DB「TX1」によるXMLデータの登録と検索
製品名
TX1
開発元
東芝ソリューション
稼働環境
Windows 2000 Server/Server 2003、Solaris 9/10
 
Red Hat Enterprise Linux AS 4
URL
http://xml.toshiba-sol.co.jp/

(Computerworld.jp)




▲ページの先頭へ戻る


Computerworld Special

「F5 ARXシリーズ」がもたらすデータ管理革命

ファイル・ストレージの仮想化でストレージ環境の運用管理負荷とコストを大幅削減

注目のホワイトペーパー

ラネクシー

30日でストレージ使用量の約30%を節減する、ラネクシーの「NORTHERN STORAGE SUITE V8」

ストレージ資産を最大限に活用し、不要ファイルによる容量のむだ使いを防止

変化に強いIT基盤構築のためのEAI活用術

変化に強いIT基盤構築のためのEAI活用術

システム間の差異を的確かつ迅速に吸収することがポイント


Weekly Ranking

集計期間:03/07〜03/13


データ統制

蓄積データのセキュリティに目を向けよ

ストレージ内のデータをいかに守るか?

オンライン・ストレージ・サービスが突然終了――そのときデータはどうなるのか?

データをクラウドに預ける前に知っておくべき前例

アーカイブすべきデータを見極めよ

保管するデータを取捨選択するポイントを考える

ビジネス・コンティニュイティでIT/IS部門が果たす役割

目指すは、ディザスタ・リカバリと事業継続マネジメントの“統合”

“孤立”した経営データを1つに統合――意思決定支援システムを刷新したトランスワークス

すべての経営情報を単一プラットフォームで提供する「Cube」を開発

“メール盗み見”の厳しい代償――罪の意識の希薄さが招くリスク

他愛ない行為が、刑事事件にまで発展するおそれも

ディザスタ・リカバリの迷路を解く

複雑な状況の中、自社にとってのベスト・プランにたどり着くためには

エンタープライズ・データを守れ

担当者が負担に押しつぶされず、企業にとって価値のある情報を保護するために

ILMの導入で、IT運用コストを引き下げろ!

ILMを成功裏に導入するための“6つのステップ”

全社レベルでコンテンツを“統制”する「ECM」

今日のコンテンツ管理製品分野における最注目領域

過去のあらゆるデータをリカバリできるデータ保護技術「CDP」

データ・ロスとダウンタイムの最小化をも実現

コンプライアンスを重視したメール運用管理の実際

ECM/CMSではカバーしきれない最重要コンテンツ

“完全なる”ペーパーレス・オフィスの実現に向けて

「もはや企業に選択の余地はない!」

キャッチアップ

EMC、IBM、マイクロソフトの3社、CMSの相互運用仕様「CMIS」を共同開発

複数ベンダーのCMS/ECMを連携させるための仕様で、2009年中には標準化の見通し

「データ・シャッフリング」とは何か――開発者が説く新データ・マスキング技術

機密データのセキュリティ確保と分析への活用を両立

米国小売企業の半数がデータ漏洩を経験――そのほとんどは公表されず

「われわれが耳にするよりはるかに多くの事件が起きている」

デデュープ、HDDスピンダウン、SSD――EMC幹部が最新技術を紹介

「ストレージ分野は今、正に大きな変革期を迎えている」

データ量削減の新アプローチ「リアルタイム・データ圧縮」の効能を知る

ILMを補完する新技術を活用し、ストレージの効率化を推進せよ

米国国税局の「高速/大規模データ・ウェアハウス」がもたらした効果

もうだれも確定申告はごまかせない?――総容量150TBものデータを管理分析

生誕10周年を迎えた「XML」――その普及・活用の進展度を知る

「もはや“空気”のような存在であり、必要不可欠なものに」

「分析は力なり」みずからの創意工夫で競争優位に立つ

構造化/非構造化を問わず、あらゆるデータからトレンドを得る

今、XMLデータベースが求められる理由

新たな利用領域を開拓しつつある第2世代の製品

エンタープライズ検索テクノロジーの「着眼点」

企業ITインフラ上での位置づけを押さえ、導入に備えよう

ビジネス・インテリジェンス

ビジネス・インテリジェンス最新事情

ビジネス・インテリジェンス最新事情

組織と“個”の知的生産性を高める

データベース・ウォッチ

データベースのトレンドを読む

データベースのトレンドを読む

進化するDBMSの実力と可能性

[連載]バックアップ新論

第1回:デスクトップのバックアップ

第1ステップはユーザーへの喚起

第2回:データセンターのバックアップ

まずは経営上のリスクとコストとのバランスを評価

第3回:メッセージのバックアップ

内部統制に必須の重要課題に取り組む

第4回:ワークグループのバックアップ

「バックアップの盲点」をいかに克服するか

第5回:PDAのバックアップ

ネットワーク・デバイスとして管理する

第6回:ブランチ・オフィスのバックアップ

常に変化する“標的”を的確に“キャッチ”する



Computerworld Global
米国
英国
中国
ドイツ
オーストラリア
シンガポール
その他の国