にゃははー

はへらー

CUDA

【解決済】VDPAUのOutput Surfaceに書き込めない?

いま、VDPAUに犯されまくってるのは周知の事実として、Output Surfaceに書き込もうとすると蹴られるんですが、何か情報ないですかね。つまり int width; uchar4 *dev_ptr; kernel<<< ... >>>( dev_ptr, ... ); ... VdpOutputSurface surface; cudaGraphicsRe…

Boost.Test(boost/test/unit_test.hpp) with nvcc

segfaultします。

cudajpのサイトを作りました

cudaに日本のコミュニティってないよね - Flast?なにそれ、おいしいの?でGroupsは作りましたが、なんかwelcomeメッセージすら書けないとかいうプギャーな使用に変更されてるっぽいのでGoogleSitesで簡易的にサイト作りました。 CUDAjp Groupsのメンバなら…

cudaに日本のコミュニティってないよね

だからつくろうと思う。 Google グループなので興味のある人は入ってみてください。初心者・上級者・未経験問いません。とりあえず未経験でもCUDAをやってみたいとかそういうのであれば歓迎です。 また、勉強会を主催したいとかそう言うのもあればいいですね…

CUDAにおけるBoostをつくるという意気込みで頓挫するプロジェクト

を細々とやろうかと。例えばCUDAのサードパティー製ライブラリと言えばtrustが有名だが、これはHostレベルでSTLっぽくできるようにするライブラリである。(と思う というのも私は軽く眺めただけなのでよく知らないで、どっちかって言うとDeviceレベルのコー…

祭りだそうで

0から1000までの0の数を数える ->無駄に並列化してみる ->TBBで遊んでみたよ(12) ->並列化?ハナアルキしてやんよ! >いまここ 今のご時世CPUで並列化とか...ってことで書いたんだけどレジスタが11も使われてて悲しい・・・ あと1つ減らせたら理論値で実行効…

Driver APIのリンク方法が分からなくなった

前は/usr/local/cuda/libをldに渡して-lcudaすればDriver API使えた気がするんだが・・・ nvccはほんと黒魔術で.aが存在しないのにRuntime APIにはリンクできる。んーwindows版だとcuda.libとかcudart.libがあるんだけどな・・・Driver APIがgccから直接リン…

GPUコンピューティング2010に行ってきた

んだけど、完全にアウェー状態ですごく悲しかった。 それしか言えないorz

vimのsyntaxが更新されないので...

だれかCUDAのやつを更新してあげてください。と言っていてもダメだと思うけどいつものように他人任せ。思いついたのはローカルに書き足したりしてる。気が向いた人がいたら下のやつを適当に修正して投げてあげてください。 # HG changeset patch # User Kohe…

CC2.1とかGTX460とか

出ました。でもCC2.1についてはリファレンスに特に書いてなかったんだけど、どうやら出力されるPTX/CUBINが若干変わるらしい。GTX460用に。残念ながらPTXの仕様は一回も読んでなので詳しいところはわからんけど、32CC/SM(CUDA Core par SM)から48CC/SMになっ…

CUDA3.1をざっとまとめてみる

簡単にprogramming guide 3.1を読んでみたので備忘録も兼ねて軽くまとめる。コード量とかあるので基本Runtime APIで。あと、結構落としてる箇所があると思うけど、まぁキニシナイ。

CUDA3.1toolkitの対応ディストリ

対応するディストリのバージョンが上がりました。前見たときは代わってなかった気がしたんだけどな。 ディストリ CUDA3.0 CUDA3.1 Fedora 10 12 Ubuntu 9.04 9.10 RedHad 5.3(?) 5.4 OpenSUSE 11.1(?) 11.2 RedHadとOpenSUSEはうろ覚えなので変わってなかっ…

CUDA3.1

はやいですねーCUDA3.1がリリースされました。今回はデバイスコードの中にprintf()を埋め込めたり、Fermiで__device__の関数ポインタを取れたり再帰できたりとゆがみないですねー。 まぁFermi持ってないので悲しいですが。バージョン上げるのは嬉しいんだけ…

これ何がいけないんだろう

#include <stdlib.h> #include <iostream> using namespace std; int main( void ) { float3 h_ptr[ 1024 ][ 1024 ]; float4 *d_ptr = NULL; if ( cudaMalloc( &d_ptr, sizeof( float4 ) * 1024 * 1024 ) != cudaSuccess ) { cout << cudaGetErrorString( cudaGetLastError() ) <</iostream></stdlib.h>…

cudaMalloc3Dの上限

cudaMalloc3Dを試しに使ってみたらcudaErrorMemoryAllocationが返ってきた。extentが小さい場合はアロケート出来るらしいんだけど、各軸がある程度以上だとどうやら失敗するらしい。 アロケートの上限サイズについてはcudaMalloc3DArrayには各軸[0,2048)(3D)…

そういえば

そういえばあれだけ騒いでた(?)AviUtlのプラグインについてですが、そろそろ公開するかもしれないという脳内情報を聞いた気がするのでそれについて。 とりあえず未だDL出来るようにはなってないけどそろそろ出来るはず。いろいろめんどいんで http://www.ac-…

やっぱ3.0のせいだろうか・・・

昨日マンデルブロ集合に関する記事を書いたが、cuda3.0のドライバにしてからやけに描画まわりが重くなる。どうもIOが多い様で、最悪CPUの50%を持ってかれる。gridderなFlastには痛い。ということで2.3に落としてきます。 どうせ3.0の機能なんか使いこなせな…

OpenGLを使ってマンデルブロ

前にCUDAでマンデルブロを描いてビットマップに出力するのを作ったんだけど、毎回ビットマップ見るのめんどいしディスクIOが遅いからショボーンだった。 だから今日1日でGL使って描くように作り直してみた。まぁ手抜きでglut使ってるんだけどね。でもGLの仕…

にゃーーーーー///

【タイトルは】昨日の続き【関係ない】 ここでも書いたけどDriverAPIがめんどかった。 よく分からないけど実行ができて、正しい値が帰ってくるようになった。途中に出てるcuCtxGetDevice()あたりを抜くと上手く行くようになった。これあるとcontextとか変わ…

DriverAPIはよーわからん

とりあえずRuntimeAPIを使えば何とかなるんだけど、DriverAPI叩けるようになったら幅広がるよねーと思って、マニュアル参照しながらVecAddのやつ作ってみたんだけど、なぜかCUDA_ERROR_LAUNCH_FAILEDが出る。 まぁ私が悪いっていう命題が真なわけですが、ど…

クリスマスと聞いて

クリスマスらしいです。でもイヴだとか。まぁあろうがなかろうがあんま変わらんのがFlastの日常なのでクリスマスは二日間だと認識しています。まぁそんなのはどうでも良くて、このあいだSofmap行ったらGeForce210 (G210ではありません)が4,500円ぐらいで売っ…

CUDA2.3のバグ?

Constant Memoryを使おうとして下のようなソースを書いてコンパイル通したら、通ってしまって動くんだけど、正しい結果が帰ってこなかった。 ...(ry __constant__ float d_data[ 10 ]; int main( void ) { float h_data[ 10 ]; ...(ry cudaMemcpyToSymbol( d…

Half-Wrapってどう作られる?

要はどれとどれのスレッドが1つのHalf-Wrapになるか誰か知りませんかね。 まぁCUDAの話なんですけど。coalesced accessになるように最適化しようと思ってみたものの、どういう要件でHalf-Wrapにまとめられるかが分からず・・・ やっぱ blockDim.x*blockDim.y…

やられた・・・

NVIDIAから待望のNexus BetaへのRegisteredメールが来たと思ってNexusを落とそうとページに跳んだ。しかし現実は実に非情だ。まぁメールタイトルだけで判断した私も悪いのだろう。 跳んだ先で待っていたのは"You are not registerd."の1文。慌ててメールの本…

はえーーーー

いや、はやいwwwwwとりあえずいろんな補間は実装できたから、あとは高速化だと思っていろいろがんばった結果、textureメモリを使うという方法を思いついた。ただ、textureReferenceが3要素のテクセルを受け付けないからx方向に3倍して当てたんだけど・…

sinc()のこと

先日、sinc()の挙動がおかしいって言ってたけど、どうやら俺の頭がおかしかったらしい。ろくに調べもしないでやってたからいけないんだ。 まぁそんなこんなで一応うまく動いた。うまく言ったついでにLanczos-2,3の方も実装してみた。Lanczos-3を実装するとき…

続・CUDAと戯れる

とりあえず今日はいろんな補間方法をAviUtlで実行してみた。GPUはGeForce9600GTで使った補間アルゴリズムは最近傍点補間と1次スプライン、3次スプライン、3次畳み込みの4つ。細かいデータはとってないけど走らせてみた体感だと、最近傍はもちろん最速で大体2…

CUDAと戯れる

keepaliveもかねて軽く...とりあえず9月になりましたねー(遅っ まぁそんなのはどうでもいいんだけど、最近CUDAにはまっててとりあえず動画像のアプコンでもやってみようといろいろ実装してます。CUDAでsinc関数を実装して走らせて見たんだけど、1ってことで…

現在の進歩状況・・・?

今はJPEGのデコーダー書いてるんですよ。なんでかっていうと、実は今大学のある組織にいて(前書いたか?)、そこではCUDAの研究をやろうかと思っるんだ。いきなりCUDA書こうとしてもどうせかけないのは目に見えているので、まずはCPUで動かしてからCUDAを書こ…

ktkr

なんかこのタイトルよく使うな・・・まぁそんな事はどうでもよくて、GPGPUの代名詞でもあるnVIDIAのCUDAがやっとデレ期に入ってくれましたwwwww今までツン期をがんばって乗り越えてきた甲斐があるというものです。デベロッパーズ版のnotebook用ドライバをが…