-
Notifications
You must be signed in to change notification settings - Fork 394
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
train.py中的预训练向量没加载成功,而全部加载的是111111111111 #27
Comments
遍历的是 word2id 中的 key 值,也就是 word,感觉没有错呢? |
for word in word2id: |
py2 for in 遍历的是 key 啊,难道 py3 不是? |
|
额,py3 是value。不是key,好吧,怪不得那 ,我确实改成py3了。 |
has.key()这个函数不存在了吧,后来怎么改的,我也遇见了embedding_pre全是1111 |
改成这样就好了 |
记得把bert_vector替换成word2vec。我后来用了bert的词向量,改了code 忘记改回来了!你改一下把 |
运行python train.py,报错:No such file or directory: '../data/renmindata.pkl',创建renmindata.pkl再运行python train.py,报错: File "train.py", line 18, in |
renmindata.pkl是要用数据创建的,不是你创建的名字相同的就完事了 ,renmindata.pkl这个文件存放的是所有你的数据。你得先生成renmindata.pkl文件 ,才能进行训练。 |
咋生成啊0.0 |
运行ChineseNER-master\data\renMinRiBao\data_renmin_word.py文件 就能生成renmindata.pkl |
啊哦,知道了0.0,蟹蟹~ |
还有个问题,就是tenserflow2.0里面没有contrib了要怎么办啊,运行train.py pretrained的时候一直报错:AttributeERROR:'module' object has no attribute 'contrib'。 |
1.0 和2.0是不兼容的,他这个是1.0的版本 ,你要么换成1.0的 要么把代码改动一下适应2.0 |
好的吧,我改成1.7.0的了,谢谢你~ |
您好,发现在bilstm-crf模型中,词向量是随机生成的,没有用的训练好的词向量(vec.txt) |
你把上次训练的模型restore一下不就成了,向量就变成不是随机的了 |
在训练的时候,虽然把embedding_pretrained传到了bilstm-crf中, |
tensorflow版本的tran.py文件在加载预训练向量的时候,原始的是word2id找到的是id,而不是字,word2vec里的词向量都是以字为主的,所以word2id应该改成id2word. 如果不改的话 也是能用的,不过embedding_pre全部是111111111,而不是vec.txt里的字向量。建议楼主改下这个坑,很难发现的。
The text was updated successfully, but these errors were encountered: