üzerinde TF1.4 ile karışık hassas etkin değil Yeni Volta mimarisi ve faydası ile 3dconv/deconv katmanları kullanan nöral ağımı (bir jeneratör olarak hizmet veren bir Autoencoder + bir ayrımcı olarak bir CNN olarak hizmet eden) test etmekle ilgilendi. Karışık Hassasiyet eğitiminden. Tensorflow 1.4'ün CUDA 9 ve CudNN 7.0 ile en yeni kaynak kodunu derledim ve conv/deconv katmanlarım tarafından kullanılan tüm eğitilebilir değişkenleri tf.float16'ya döktüm. Ayrıca, tüm giriş ve çıkış tensörleri, 8'den fazla olan boyutlara sahiptir. Ne yazık ki, bu yapılandırma ile herhangi bir önemli hız artışı göremiyorum, tf.float32 kullanırken eğitim süresi kabaca benzerdir. Benim anlayışım, Volta mimarisi ve cuDNN 7.0 ile, Karışık Hassasiyetin TF tarafından otomatik olarak algılanması ve dolayısıyla Tensor Core matematiğinin kullanılmasına olanak tanımasıdır. Yanlış mıyım yoksa etkinleştirmek için yapmam gereken bir şey var mı? Ayrıca TF1.5 nighlty build denedim ve bu benim özel 1.4 daha yavaş olduğu gibi görünüyor.Teste V100
Tensorflow'a dahil olan herhangi bir devrenin buna cevap verebilmesi için minnettar olurum.
DÜZENLEME: NVIDIA teknik desteği ile konuştuktan sonra, float16'yı desteklerken TF, basit 2D konv Ops için karışık-hassas hızlandırmayı bütünleştiriyor, ancak şimdiki gibi 3D konv Ops için değil.
@Engineero AWS sadece V100 – yjmade
ben de V100 var olan P3 örneğini bırakın ve ayrıca sinirli hissediyorum: Henüz bu değişiklikleri test edilmemiş olmasına rağmen
tensorflow github Bu PR konuyla alakalı görünen tensorflow tarafından destek eksikliği. Evrişim grupları için destek eksikliği de rahatsız edici: https://github.com/tensorflow/tensorflow/issues/3332. Bu yazı bana yakında bir şeyler yayınlanacağını ümit ediyor: https://github.com/tensorflow/tensorflow/issues/12474#issuecomment-338309705. Sabırsız olursam Caffe2'yi deneyeceğim. Uzun bir süre için en yeni cudnn özelliklerini destekledi. –
Burada NVIDIA tarafından önerilen adımları denediniz mi: http://docs.nvidia.com/deeplearning/sdk/mixed-precision-training/index.html#tensorflow Tf 1.4 şu anda kullanılabilir, sadece kodu değiştirmeliyiz Daha hızlı eğitim desteği. Ayrıca bloga bakın: https://devblogs.nvidia.com/parallelforall/mixed-precision-training-deep-neural-networks/ – melgor89