intrinsics

    8ısı

    2cevap

    benim uygulamanın darboğazları optimize etmek ve şu soruyu olması SSE2 intrinsics kullanıyorum : Microsoft C++ derleyicisi üzerinde ddata = _mm_xor_si128(_mm_xor_si128( _mm_sll_epi32(xdata, 0x7u),

    5ısı

    1cevap

    içindeki __m128 veri türü yazdırma değeri, doğrudan GDB'de __m128 veri türü (Intel SSE Intrinsics için kullanılır) değişkeninin değerini yazdırmanın herhangi bir yolu var mı? print $myVariable komutu

    10ısı

    2cevap

    __m128i değişkenindeki tüm bit/bayt/sözcüklerin vb. Olup olmadığını kontrol etmenin bir yolu var mı? Uygulamamda, __m128i değişkeninde paketlenmiş tüm tam sayıların sıfır olup olmadığını kontrol etmel

    7ısı

    2cevap

    Şu anda SSR41'e kadar gayet iyi olan bir filtrelenmiş örnek için sadece bir anda filtrelenmiş bir örnek için bir intrinsik kullanmaya alışkın bir egzersiz olarak anlamaya çalışıyorum. inline __m128i D

    7ısı

    2cevap

    Benim ilk girişimi böyle görünüyordu (biz çarpmak istiyoruz sözde) __m128 mat[n]; /* rows */ __m128 vec[n] = {1,1,1,1}; float outvector[n]; for (int row=0;row<n;row++) { for(int k

    6ısı

    1cevap

    ile packusdw işlevinin simüle edilmesi by Intel [pdf] numaralı algoritmaya göre pixman numaralı hızlı bir x888 -> 565 piksel dönüştürme işlevi gerçekleştiriyorum. Onların kodları x888 -> 555'i dönüştü

    5ısı

    2cevap

    iPad'deki milyonlarca 32 bit tam sayıdaki MSB'yi (en anlamlı bit) çok hızlı bir şekilde hesaplamam gerekiyor. Yavaş olan düz C'ye yazılan MSB'nin kendi (çirkin) uygulamasına sahibim. ARM işlemcileri,

    7ısı

    1cevap

    SSE2 intrinsics'i ve inline assembler'ı gcc'de karıştırmaya çalıştım. Ama bir değişken xmm0/register olarak girdiysem bazı durumlarında bir derleyici hatası alıyorum. Örnek: #include <emmintrin.h> in

    5ısı

    3cevap

    Neon intrinsics kullanarak kodumu optimize etmeye çalışıyorum. 128 bitlik bir dizi üzerinde 24 bitlik bir dönüşüm var (her biri 8 uint16_t). İşte benim c kodu: Ben yaklaşık Neon Intrinsics gcc belgele

    6ısı

    1cevap

    Sadece Visual C++ 2012'yi kullanarak SSE intrinsics'i kullanmaya başladım ve bazı göstergelere ihtiyacım var (hiçbir amaç yok). Her biri 4 signed short s içeren iki dizim var (her dizi 64 bit, toplam