AMD ve Nvidia GPU'lar için OpenCL arasındaki performans farklılıklarını değerlendirmeye çalışıyorum. Matris-vektör çarpımını gerçekleştiren bir çekirdeğim var. Çekirdeği iki farklı sistemde çalıştırıy
Nvidia GPU'da OpenCL kernellerinde hata ayıklamanın bir yolu var mı, yani kesme noktaları belirleyip değişkenleri inceleyin? Anladığım kadarıyla, Nvidia's tool, OpenCL hata ayıklamasına izin vermiyor
Bugüne kadar tüm sys eklentileri aracılığıyla eski 386 temel talimatlardan x86 montajını bugüne kadar öğrenmeye çalışıyorum. Ben SSE5 gibi bazı şeyler 170 yeni talimatlar sayar okumak - ve ben toplam