2008年08月20日

Intel Larrabee/強力なスカラ演算能力

Intelのスループット・プログラマブルプロセッサ
「Larrabee (ララビ)」の相対的に強力なスカラ演算能力に
ついて解説・予測した記事がありました。

【関連記事】
PC Watch
LarrabeeがPentiumをベースにしたのはなぜか

並列性を抽出しGPGPUで処理した際に、確かにベクタ演算処理は
圧倒的にCPUよりも高速です。GPGPUで問題なのは、

1. CPUからGPUへの転送時間
2. GPUからの読み出し時間(リードバック)

が大きなオーバーヘッドになる事です。
結局、CPUのSIMD命令で頑張った方が高速になってしまう
事も、しばしばあります。
(AGP/PCI Express GPUテクスチャ転送時間まとめ)

更に困ったことに、最近は改善されているのかも知れませんが
最近のマルチコアCPUを使い、

1. CPUからGPUへの転送時間
2. GPUからの読み出し時間(リードバック)

を、別スレッドで見かけ上の処理を隠匿できませんでした。
リードバック中は、PIO転送でもしてるのか・・・という
遅さとCPU負荷でした。


基本的なアイデアはAMDのFUSION構想に近い。AMDのFUSIONも、
シリアルコードとパラレルコードを、1つのプロセッサ、
1つのメモリの中で走らせるという構想を持っているからだ。

と記事ではありますが、これはGPGPUやIntel Larrabeeとは
全く異なる思想だと思います。
GPGPUやIntel Larrabeeでは、CPUとは別のGPUボード上の
メモリへの転送とリードバックが必要になりますが、
1つのメモリの中で走らせるAMD FUSION構想では、
CPUとGPUでメモリを共有するUMA型アーキテクチャを
発展させ、CPUとGPU感でメモリに相互にアクセス可能に
する事を狙っているように見えます。

このようなアーキテクチャでは、GPUボード上のメモリと
比較し低速なメモリを利用する為、ピーク性能は相対的に
低くなりますが、

1. CPUからGPUへの転送時間
2. GPUからの読み出し時間(リードバック)

が不要になる可能性があります。(相互にアドレス参照)
posted by ぽっぽファクトリー at 00:59 | Comment(0) | TrackBack(0) | ソフトウェア開発

神岡鉱山前駅/飛騨神岡散策 第1稿

お墓参りを兼ねて、岐阜県飛騨神岡へ帰省しました。
(記事1記事2)
わずかな時間ですが、飛騨神岡散策をしました。
今回は、旧神岡鉄道神岡線の駅、神岡鉱山前駅です。
昔は、ここにコンビニ「ニュートリノ」がありました。
神岡鉱山前駅 レール・マウンテン・バイク

2006年(平成18年)に廃駅になりましたが、駅入り口は
残っています。定期的にレール・マウンテン・バイクで
旧神岡鉄道の軌道を走行できるイベントを開催
しているようで、
その看板がありました。
レール・マウンテン・バイクって、世界初なんですね。
posted by ぽっぽファクトリー at 00:00 | Comment(0) | TrackBack(0) | 旅の記憶