-
Notifications
You must be signed in to change notification settings - Fork 124
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
训练出的模型的效果如何? #7
Comments
精度没有损失,效果取决于你所用的数据,以及训练技巧,我自己训练的模型在特定场景下优于mxnet开源的模型。 |
谢谢,我打算用您的代码去复现一下insightface的实验。 |
这个版本的 insightface r100 LFW上面多少? |
您好,训练过程中为什么会出现cos_theta大于1的情况啊? |
1、你的学习率太大,导致梯度爆炸,请降低你的学习率。 |
@xialuxi 您好作者,请问一下模型的主干网络是什么昵? |
开源的这些网络模型都可以用,只是换下损失函数就行了。 |
@xialuxi |
@xialuxi |
@ZHAIXINGZHAIYUE |
@xialuxi |
不需要focallosss,就用softmaxwithloss就行了,一旦出现cos _theta >1 ,表明训练失败了。 |
Iteration 120200, loss = 0.0135795 没有修改正则化 |
在分类的fc7层, 做了一次normalize,再输入到cos_add_m层的,而cos_theta的值就是fc7的normalize输出,如果cos_theta不是在【0,1】之间,证明训练出问题了。建议学习率从0.001开始。 |
谢谢 xialuxi,我试着从,0.001进行训练,特别感谢您的回复。。。 |
作者您好, |
1、caffe这样去训练的确会出现收敛困难,具体原因还未查清楚。 |
谢谢您的回复,请问您说的m 从0.1,到0.5,训练,是在0.1时候都训练完,所有步数,然后修改成0.2,进行finetune,然后修改继续finetune, 还是在训练的时候,从0.1开始,到一个地方震荡长时间不下降,时候,增加m,进行finetune |
训练完再微调,可以先训练softmax的作为预训练模型。 |
|
您好,请问您的normalize层用的不是am-softmax @shiyuanyin caffe带的normalize层吗,我的情况跟您一样,,,我对比了其他caffe里的normalize层确实不一样,不知道我应该用哪一个normalize层,您能给个参考吗。 |
跪求大神 收敛指点 :目前 id=5w 人,m=0.35, loss = 0.390078,acc=0.9918 还是比较差 不然其他训练的效果0.998 |
你好,可否多讲一点你的实现方法? |
你可以用insightface 检测对齐的方式,处理数据人脸,m 的设置好像不一样
…------------------ 原始邮件 ------------------
发件人: "wavelet2008"<notifications@github.com>;
发送时间: 2019年6月25日(星期二) 晚上6:30
收件人: "xialuxi/arcface-caffe"<arcface-caffe@noreply.github.com>;
抄送: "史诗"<892781037@qq.com>;"Mention"<mention@noreply.github.com>;
主题: Re: [xialuxi/arcface-caffe] 训练出的模型的效果如何? (#7)
跪求大神 收敛指点 :目前 id=5w 人,m=0.35, loss = 0.390078,acc=0.9918 还是比较差 不然其他训练的效果0.998
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub, or mute the thread.
|
@xialuxi 在caffe下跑的arcface识别,识别结果不准确,比python版本的差远了,楼主有什么建议吗 |
作者您好,请问训练出的模型的效果如何?和mxnet的代码相比,模型精度有损失吗?
The text was updated successfully, but these errors were encountered: