「Nehalem」プロセッサの実力を徹底検証する
驚異的な性能を示す新型Xeonプロセッサの魅力に迫るIntelのNehalemベースのクアッドコアXeonプロセッサ(シングルソケット向けXeon 3500シリーズ、デュアルソケット向けXeon 5500シリーズ)は、サーバ/ワークステーションに次々と採用され始めている。InfoWorld米国版のテストセンターでは、NUMAと呼ばれるメモリ統合アーキテクチャを採用し、これまでのIntelのどの製品よりも格段に優れた性能を発揮する新世代のXeonプロセッサを取り上げ、徹底的な検証を試みた。
Nehalemパワーの原動力
Intelの新型Xeonプロセッサ「Nehalem」は、シングルおよびデュアルソケット・サーバ/ワークステーションに次々と採用されつつあるが、業界では少し前からその性能について話題になっていた。今年2月に開催された新プロセッサのテクニカル・ジャーナリスト向け発表会の席上、Intelのグローバル・コミュニケーション マネージャ、ニック・クニュプファー(Nick Knupffer)氏が、「Nehalemのパフォーマンスは、Intel Pentium Pro以来最大の飛躍的な向上を見せている」と力説したからだ。
当初は、発表会の参加者のほぼ全員が、この発言に首をひねった。もちろん本稿の著者である私自身も疑問を持った一人である。しかし、その後、数週間をかけて2ソケット8コアのNehalemシステムを筆者のラボでテストしたところ、クニュプファー氏の発言が正しいことが次第にわかってきた。Intelはきわめて魅力的な新製品を世に送り出した。しかも、性能向上のために、AMDの製品ビジョンの一部まで取り込んでいたのだ。
AMDがOpteronによってパフォーマンスの記録を塗り替えていた当時、Intelは1つのダイに2つのコアを統合したデュアルコアCPUをデビューさせるのに必死だった。
当時は、プロセッサの全般的なパフォーマンスでは満足できる結果を出していたものの、メモリ・コントローラを共通ダイ上に統合できなかったことがネックとなり十分なメモリ帯域幅を確保できていなかった。Opteronで実現されていたNUMA(Non-Uniform Memory Access)機能が欠落していたのだ。
*上段落のNUMA部分の表現を一部訂正いたしました(2009年5月25日)
Nehalemでは、Opteronと同じNUMAアーキテクチャを採用し、これまでのIntelのどの製品よりも格段に優れたパフォーマンスを実現している。この点には大変驚かされた。
NehalemベースのクアッドコアXeonプロセッサ(シングルソケット向けXeon 3500シリーズ、デュアルソケット向けXeon 5500シリーズ)は、トランジスタ数7億3,100万、コアごとに256KBのL2キャッシュと、8MBのL3キャッシュを搭載し、キャッシュ容量の拡張、キャッシングの高速化、分岐予測(Branch Prediction)の高精度化を特徴とする。



























