TensorFlow: Sonraki toplu iş için LSTM durumunu hatırla (durum bilgisi olan LSTM)

Eğitimli bir LSTM modeli verildiği zaman, aşağıdaki örnekte tekli zamanlamalar için, yani seq_length = 1 çıkarım yapmak istiyorum. Her zaman diliminden sonra, bir sonraki 'parti' için dahili LSTM (hafıza ve gizli) durumların hatırlanması gerekir. Çıkarımın başlangıcında, iç LSTM durumları init_c, init_h girilerek hesaplanır. Bunlar daha sonra LSTM'ye iletilen LSTMStateTuple nesnesinde depolanır. Eğitim sırasında bu durum her zaman güncellenir. Bununla birlikte, çıkarım için, state'un partiler arasında saklanmasını istiyorum, yani başlangıç durumlarının sadece en baştan hesaplanması gerekir ve bundan sonra LSTM durumlarının her bir 'batch' (n = 1) 'den sonra kaydedilmesi gerekir.TensorFlow: Sonraki toplu iş için LSTM durumunu hatırla (durum bilgisi olan LSTM)

Bu ilgili StackOverflow sorusunu buldum: Tensorflow, best way to save state in RNNs?. Ancak, bu yalnızca state_is_tuple=False ise çalışır, ancak bu davranış yakında TensorFlow tarafından kullanımdan kaldırılacaktır (bkz. rnn_cell.py). Keras, durum bilgisi olan LSTM'leri mümkün kılmak için iyi bir sarıcıya sahip gibi görünüyor, ancak bunu TensorFlow'da başarmanın en iyi yolunu bilmiyorum. TensorFlow GitHub'dan Bu sorun benim soruya ilişkilidir: https://github.com/tensorflow/tensorflow/issues/2838

Herkes iyi öneri bir durum bilgisi LSTM modeli inşa etmek?

inputs = tf.placeholder(tf.float32, shape=[None, seq_length, 84, 84], name="inputs") 
targets = tf.placeholder(tf.float32, shape=[None, seq_length], name="targets") 

num_lstm_layers = 2 

with tf.variable_scope("LSTM") as scope: 

    lstm_cell = tf.nn.rnn_cell.LSTMCell(512, initializer=initializer, state_is_tuple=True) 
    self.lstm = tf.nn.rnn_cell.MultiRNNCell([lstm_cell] * num_lstm_layers, state_is_tuple=True) 

    init_c = # compute initial LSTM memory state using contents in placeholder 'inputs' 
    init_h = # compute initial LSTM hidden state using contents in placeholder 'inputs' 
    self.state = [tf.nn.rnn_cell.LSTMStateTuple(init_c, init_h)] * num_lstm_layers 

    outputs = [] 

    for step in range(seq_length): 

     if step != 0: 
      scope.reuse_variables() 

     # CNN features, as input for LSTM 
     x_t = # ... 

     # LSTM step through time 
     output, self.state = self.lstm(x_t, self.state) 
     outputs.append(output)

kaynak

2016-07-07 verified.human

Olası kopyası [Tensorflow, RNN'lerde durumu kaydetmenin en iyi yolu nedir?] (Http://stackoverflow.com/questions/37969065/tensorflow-best-way-to-save-state-in-rnns) –

Yer tutucudaki tüm katmanlar için tüm durumu kaydetmek en kolay olduğunu öğrendim.

init_state = np.zeros((num_layers, 2, batch_size, state_size)) 

... 

state_placeholder = tf.placeholder(tf.float32, [num_layers, 2, batch_size, state_size])

Sonra onu açarsınız ve yerli tensorflow RYSA Api kullanmadan önce LSTMStateTuples bir tuple yaratmak.

l = tf.unpack(state_placeholder, axis=0) 
rnn_tuple_state = tuple(
[tf.nn.rnn_cell.LSTMStateTuple(l[idx][0], l[idx][1]) 
for idx in range(num_layers)] 
)

RYSA API geçirir: state

cell = tf.nn.rnn_cell.LSTMCell(state_size, state_is_tuple=True) 
cell = tf.nn.rnn_cell.MultiRNNCell([cell]*num_layers, state_is_tuple=True) 
outputs, state = tf.nn.dynamic_rnn(cell, x_input_batch, initial_state=rnn_tuple_state)

- değişkeni sonra bir tutucu olarak bir sonraki yükleme için beslenecektir.

kaynak

2016-10-10 08:28:03 user1506145

Tensorflow, RNN'lerde durumu kaydetmenin en iyi yolu? aslında benim asıl sorumuydu. Kod feryat, durum tuplesini nasıl kullanırım.

with tf.variable_scope('decoder') as scope: 
    rnn_cell = tf.nn.rnn_cell.MultiRNNCell \ 
    ([ 
     tf.nn.rnn_cell.LSTMCell(512, num_proj = 256, state_is_tuple = True), 
     tf.nn.rnn_cell.LSTMCell(512, num_proj = WORD_VEC_SIZE, state_is_tuple = True) 
    ], state_is_tuple = True) 

    state = [[tf.zeros((BATCH_SIZE, sz)) for sz in sz_outer] for sz_outer in rnn_cell.state_size] 

    for t in range(TIME_STEPS): 
     if t: 
      last = y_[t - 1] if TRAINING else y[t - 1] 
     else: 
      last = tf.zeros((BATCH_SIZE, WORD_VEC_SIZE)) 

     y[t] = tf.concat(1, (y[t], last)) 
     y[t], state = rnn_cell(y[t], state) 

     scope.reuse_variables()

Aksine tf.nn.rnn_cell.LSTMStateTuple kullanmaktan daha ben sadece iyi çalışır listelerinin bir listeleri oluşturun. Bu örnekte durumu kaydetmiyorum. Bununla birlikte, kolayca değişkenler üretebilir ve değerleri kaydetmek için sadece atamayı kullanabilirsiniz.

kaynak

2016-07-17 03:41:51 chasep255

TensorFlow: Sonraki toplu iş için LSTM durumunu hatırla (durum bilgisi olan LSTM)

cevap

İlgili konular