为什么我用c-eavl测试chatglm2-6B 在zero-shot 下的分数很低？ #53

EdisonWujr · 2023-08-21T08:51:48Z

为什么我用c-eavl测试chatglm2-6B 在zero-shot 下的分数很低？并且使用cot的模式，分数也没有提升。

EdisonWujr · 2023-08-21T09:27:35Z

补充一下，用few-shot cot模式的话，评分就接近官方

1014670860 · 2023-09-04T08:50:25Z

补充一下，用few-shot cot模式的话，评分就接近官方

请问一下是怎么测评的, 看README也不清楚, --model-name 写本地地址也不行,

ssssmy · 2023-09-12T09:16:14Z

@1014670860 在chatglm文件中写你本地的模型地址。不过我不知道怎么运行test测试，只可以跑dev

Flywolfs · 2023-09-22T06:06:09Z

是不是和代码里这行代码有关系？
choice_score = [score[167], score[333], score[251], score[416]]
我看代码好像这个chatglm的评估是适用于chatglm-6b，并没有适配chatglm2-6b。因为两个版本的模型词表不一样

Flywolfs · 2023-09-22T08:24:07Z

为什么我用c-eavl测试chatglm2-6B 在zero-shot 下的分数很低？并且使用cot的模式，分数也没有提升。
这个问题确认了，如果使用chatglm2-6b进行测试的话，使用zeroshot时，chatglm.py的145行需要改成：
choice_score = [score[316], score[347], score[319], score[367]]才能对应到新版本的词表

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

为什么我用c-eavl测试chatglm2-6B 在zero-shot 下的分数很低？ #53

为什么我用c-eavl测试chatglm2-6B 在zero-shot 下的分数很低？ #53

EdisonWujr commented Aug 21, 2023

EdisonWujr commented Aug 21, 2023

1014670860 commented Sep 4, 2023

ssssmy commented Sep 12, 2023

Flywolfs commented Sep 22, 2023

Flywolfs commented Sep 22, 2023

为什么我用c-eavl测试chatglm2-6B 在zero-shot 下的分数很低？ #53

为什么我用c-eavl测试chatglm2-6B 在zero-shot 下的分数很低？ #53

Comments

EdisonWujr commented Aug 21, 2023

EdisonWujr commented Aug 21, 2023

1014670860 commented Sep 4, 2023

ssssmy commented Sep 12, 2023

Flywolfs commented Sep 22, 2023

Flywolfs commented Sep 22, 2023