-
Notifications
You must be signed in to change notification settings - Fork 5.6k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
栈式双向LSTM模型中的代码问题 #10622
Comments
是的,因为paddle中lstm的输入不包含序列数据的线性变换,所以在lstm之前一定要连接fc层 |
还有就是一个问题:
|
@kuke 嗯,lstmemory前先加一层前馈我知道。但是这行是lstm层之后的前馈层,他的input是一个列表[fc, lstm],同时参数列表para_attr也包含[fc_para_attr, lstm_para_attr]两部分,fc_para_attr, lstm_para_attr分别是fc1, lstm1层到fc层的连接权重矩阵吗? |
@leyiwang
infer时一个batch的序列数据按第0维concat成了一个长序列,所以其维度变成了5634*128;
注意这里的pooling方式是max pooling(一个序列的max pooling,得到的是一个时间步大小维度的向量,其每个元素都是从该序列不同时间步相同维度选出的一个最大值)
|
@kuke 非常感谢!最后再确认一下,infer操作本身会将batch中的元素按0维拉成长序列,事实上数据在网络模型中并未进行这种拉伸操作吗?paddlepaddle有木有比infer更直观的方法可以看到网络中层的shape信息。另,上述代码的前馈过程中,inputs的两部分[fc, lstm]和参数的两部分[fc_para_attr, lstm_para_attr]有什么联系,具体进行了怎样的操作? |
您好,此issue在近一个月内暂无更新,我们将于今天内关闭。若在关闭后您仍需跟进提问,可重新开启此问题,我们将在24小时内回复您。因关闭带来的不便我们深表歉意,请您谅解~感谢您对PaddlePaddle的支持! |
阅读paddlepaddle book中第节情感分析栈式双向lstm网络模型代码中有以下疑问:
其中第9行的前馈操作具体实现了什么,输入inputs包含两部分即 [fc1, lstm1],同时传入的参数para_attr也包含[fc_para_attr, lstm_para_attr],fc_para_attr, lstm_para_attr是否分别是fc1, lstm1层到fc层的连接权重矩阵?
The text was updated successfully, but these errors were encountered: