これは萌える、Sandy Bridge

【後藤弘茂のWeekly海外ニュース】なぜSandy Bridgeはそんなにパフォーマンスが高いのか - PC Watch
【後藤弘茂のWeekly海外ニュース】Intelが次世代CPU「Sandy Bridge」の詳細を発表 - PC Watch
http://journal.mycom.co.jp/articles/2010/09/15/idf04/index.html
AVXは、実行ユニットがちゃんと256bit(今までは128bit)なので、
ベストケースでSSEの2倍の性能が出ることが期待できそうだ。
GPUは、別ダイではなくちゃんと内蔵されており、CPUとキャッシュの共有までしている。
DirectX 11は非対応だが、かなり強力なGPUになっている様子。
何より、メモリコントローラがCPUに内蔵されたというのが嬉しい。
約1500個の内部命令が入るuOPキャッシュ(uはμのこと)。トレースキャッシュみたいな。
キャッシュヒットするかぎり、糞難しいx86命令のデコードをしなくていいので、
性能のボトルネック解消や消費電力の低減につながる。
消費電力が減ればTurbo Boostが効きやすくなるので、なかなか味がいい。
命令のスケジューリング周りも改良された。
よくわからないけど、物理レジスタの割り付け方式が変わったらしい。
L1キャッシュ付近のメモリアクセスも強力になっている。
Load, Store Address, Store Data の3つの実行ユニットがあったところ、
Load / Store Address, Load / Store Address, Store Data になっている!
つまり、メモリアクセスを伴なう命令を2つ同時に実行することができるわけで、
これはかなりとんでもない。
ちなみに、PentiumMは8byteロード1回を1クロックで行うことができるが、
Sandy Bridgeではこれが16byteロード2回になる。羨ましい。
他、Turbo Boostが、瞬間的にはTDPを超えることもできるようになった。
GPUも含めてより細かく管理できているらしい。
また、リングバスによってCPUコア数などを柔軟に変えることができる。
トランジスタ数は10億個。
7,700万トランジスタを電力効率向上に費やす「Banias」なんて言われてたのが8年前。
当時、Pentium4ですら5500万トランジスタだった。
胸がキュンとなる萌え属性ばかり。ほんとに耳あたりのよい性能アップばかり並んでいる。
256bitあったら、将棋盤が3個入っちゃうよ?