Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Set batchsize #29

Open
songbohui opened this issue Mar 17, 2023 · 9 comments
Open

Set batchsize #29

songbohui opened this issue Mar 17, 2023 · 9 comments

Comments

@songbohui
Copy link

你好,我现在正在复现你的代码,看到您的回答中提到batchsize的设置和lr有关系,那么,我想请问一下,我的batchsize设置为64,lr应该设置为多少更接近论文实现的指标?

@buxiangzhiren
Copy link
Owner

你这边是多少张卡,单卡batchsize 64吗

@songbohui
Copy link
Author

我这是四张3090,单卡设置的16

@buxiangzhiren
Copy link
Owner

buxiangzhiren commented Mar 17, 2023

那可以在初始的lr上除以4或者8试试,先除以8看看效果

@songbohui
Copy link
Author

那可以在初始的lr上除以4或者8试试,先除以8看看效果

好的,感谢哈!

@songbohui
Copy link
Author

那可以在初始的lr上除以4或者8试试,先除以8看看效果

你好,我最近尝试了bs 512和lr 2e-4,我使用的是四张卡,和您提供的代码参数一样,但是得到的结果和您的有较大的差距,下图是我的实验结果,我再想是不是因为参数guidance_scale的设置问题,因为论文中提到的是1.17,而代码中是1.06,麻烦您帮我分析一下,谢谢!
bs 512 lr 2e-4

@buxiangzhiren
Copy link
Owner

那可以在初始的lr上除以4或者8试试,先除以8看看效果

你好,我最近尝试了bs 512和lr 2e-4,我使用的是四张卡,和您提供的代码参数一样,但是得到的结果和您的有较大的差距,下图是我的实验结果,我再想是不是因为参数guidance_scale的设置问题,因为论文中提到的是1.17,而代码中是1.06,麻烦您帮我分析一下,谢谢! bs 512 lr 2e-4

代码那个参数是test dataset的参数,paper里面的报的是val dataset的参数。而且没有预训练的情况下,cider 117是正常点数。

@songbohui
Copy link
Author

songbohui commented Apr 24, 2023 via email

@buxiangzhiren
Copy link
Owner

117.8是val的结果,test的结果在table 10,0.7的误差在正常范围内,你换个随机种子多跑一次可能就可以达到了。你也可以试下trainable的clip(run tran_tclip)看下效果咋样,应该能高一个点的样子

@songbohui
Copy link
Author

songbohui commented Apr 24, 2023 via email

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants