因为我是深度学习的新手,所以这个问题对你来说可能很有趣。但我无法在脑海中想象它。这就是为什么我要问它。
我给一个句子作为 LSTM 的向量,认为我有一个包含 10 个单词的句子。然后我将这些句子更改为向量并将其提供给 LSTM。
LSTM 单元的长度应该是 10。但是在大多数教程中,我看到他们添加了 128 个隐藏状态。我无法理解和想象它。LSTM层这个词是什么意思"128-dimensional hidden state"
例如:
X = LSTM(128, return_sequences=True)(embeddings)
这看起来的夏天
lstm_1 (LSTM) (None, 10, 128) 91648
这里看起来像是添加了 10 个 LSTM 单元,但为什么那里有 128 个隐藏状态?希望你能理解我的期待。
相关分类