Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

IndexError: Caught IndexError in replica 0 on device 0. #5

Open
lizhenping opened this issue Feb 25, 2021 · 6 comments
Open

IndexError: Caught IndexError in replica 0 on device 0. #5

lizhenping opened this issue Feb 25, 2021 · 6 comments

Comments

@lizhenping
Copy link

I run as the direct,but got a errot IndexError: Caught IndexError in replica 0 on device 0.

@lizhenping
Copy link
Author

any one can help me or face the same issue ,thank you.

@lizhenping
Copy link
Author

for multi gpu used , you should use pytorch 1.4,there is a bug in pytorch1.5 in nn.ParameterList
when used the multi-gpu ,the nn.parameterlist will get 0, say idx out of

@lizhenping
Copy link
Author

lizhenping commented Apr 8, 2022 via email

@hxi667
Copy link

hxi667 commented Apr 8, 2022

经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** |
...
---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | @.> | | 抄送至 | @.@.> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案

@lizhenping
Copy link
Author

经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** |
...
---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | _@**._> | | 抄送至 | _@.@._> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: _@_.*>

不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案

其他代码的可以通过降级解决。但是这个代码的不行,多卡不支持,多卡比较恼火,有些事发布的代码,没在多卡测试,你就算这个代码调通了,后面还有问题,我换了1.4。然后又有其它问题了。

@hxi667
Copy link

hxi667 commented Apr 9, 2022

经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** |
...
---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | _@**._> | | 抄送至 | _@.@._> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: _@_.*>

不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案

其他代码的可以通过降级解决。但是这个代码的不行,多卡不支持,多卡比较恼火,有些事发布的代码,没在多卡测试,你就算这个代码调通了,后面还有问题,我换了1.4。然后又有其它问题了。

我用的cuda版本是11.0.,好像只支持pytorch1.7以上,不支持1.4.。苦恼

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants