Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

实际上model0的效果就说得过去了 #3

Open
jingyaogong opened this issue Jan 7, 2024 · 3 comments
Open

实际上model0的效果就说得过去了 #3

jingyaogong opened this issue Jan 7, 2024 · 3 comments

Comments

@jingyaogong
Copy link

我拿你的预训练模型测试结果

问题: 你知道北京吗?
回答:好的,北京是一个充满活力和多元文化的城市,有着丰富的历史文化和多彩的美食文化。它的景色美丽,建筑壮观,还有着独特的文化氛围,如古代建筑和现代文化。在这里,您可以品尝到地道的北京特色食物,如烤鸭和北京烤鸭,还可以游览世界著名的博物馆和艺术场所。北京是一个充满活力和文化底蕴的城市,您可以在这里体验到它独特的魅力和文化魅力。

## 每秒平均tokens:  54.59629622562443



问题: 你知道江苏有哪些美食吗?
回答:知泰(Sangoran)是一家著名的中国特色餐厅,位于中国四川、陕西、甘肃等地。

餐厅内拥有多种美食,包括:
- 川菜:如辣子鸡、鱼香肉丝、麻婆豆腐等。
- 西餐:如:烤牛肉、意大利面、法式面包等。另外还有:香辣鸡、酸辣牛肉、糖醋鱼等多种。

餐厅装饰艺术气息浓郁,环境温馨舒适,服务热情周到,是品尝当地美食的好去处。其中,一些菜品还有独特的创意和元素,如:

## 每秒平均tokens:  90.16312303431275



问题: 什么是人工智能?
回答:人工智能是一种模拟人类智能的技术,它可以帮助计算机在各种领域进行自主学习、推理、识别语音、图像处理、自然语言处理和决策预测等任务。人工智能可以被广泛应用于各种领域,包括医疗、金融、交通、教育、安全、娱乐等。它可以帮助人们更高效地完成各种任务,提高生产力和效率。

## 每秒平均tokens:  91.26197264205129



问题: 你知道中国的四大名著吗?
回答:是的,中国的四大名著是中国古代的“诗仙”· 白居易的《赋得古原草送别》中一篇。它是唐代大诗人李白为李白的《望天门山之作》所诗的· 即著名的《登高》,以描绘了诗人游历中外的自然风光和内心感受。它是唐代著名的文学巨匠牛移动所著《牛儿山》中的·《题曲江食醋记》中的名篇之一,也是中国文学宝库的一个重要组成部分。

## 每秒平均tokens:  90.0948662493943



问题: 你了解美国的历史吗?
回答:美国是一个悠久的国度,拥有丰富的文化历史。它有着悠久的历史背景和文化特色。作为美国的一个州,美国也是全球重要的贸易和金融中心。它的首都是华盛顿特区。在17世纪,美国开始成为美国的首都,并在1783年成为美国的州。1793年成为美国的首都,并在1794年成为美国的州。自工业革命以来,美国成为了美国的经济、文化、社会等领域的重要中心。自70年代以来,美国成为全球最大的金融中心之一,并拥有世界上最重要的金融公司之一——美中电子,这是美国的历史之一。

## 每秒平均tokens:  89.97920461045642



问题: 介绍一下中国吧
回答:中国吧 ( IJJ) 是一个中文名称,意为 "中国吧"。它是中国的一个吧,位于北京市,旨在为那些在中国领域有影响力和关注者提供帮助和指导,鼓励他们加入中国,为当地社区和亚洲地区的吧主和吧主做出贡献。吧内的吧风是自由、轻松、平等,吧内氛围积极向上,鼓励吧友相互尊重、互相支持,为吧友提供一个健康、和谐、进步的地方。

## 每秒平均tokens:  90.57550094004526



问题: 左手一只鸭,右手一只鸡。交换两次后左右手里各是什么?
回答:左里是鸭(鸭子)。

## 每秒平均tokens:  92.022527869133



问题: 鸡兔同笼,共35只头,94只脚,问鸡兔各多少?
回答:鸡兔同笼,共35只头。94只脚,鸡兔各3只脚,94只脚。

## 每秒平均tokens:  90.61163823646325



问题: 将以下中文翻译成英文:穿衣需要适应天气变化。
回答:"就医需要适应天气变化。"

## 每秒平均tokens:  93.07773946668368



问题: 什么是机器学习?
回答:机器学习 (RM 是一种人工智能分支, 指的是让计算机系统通过学习、分析、识别和决策等方式自主地改进其性能。 它通过算法自动地从数据中学习,并逐渐提高其预测准确性和效率。 在机器学习中,算法被用于训练计算机系统,以便能够自动化执行复杂的任务,并在各种任务中表现出色。

## 每秒平均tokens:  91.06932049375057



问题: 1+2是多少?
回答:1 + 2 = 4.

## 每秒平均tokens:  95.42311647419622

之前效果不行完全是因为这个bug
可以重新测试了,readme里的效果和实际不符的

@jingyaogong
Copy link
Author

model3_sft1的结果

问题: 你知道北京吗?
回答:我是一个人工智能的助手,没有一个具体的城市,但我知道北京是中国的首都和最大城市,它位于中国东海岸的南方河流上。

## 每秒平均tokens:  25.955258039894268



问题: 你知道江苏有哪些美食吗?
回答:我没有品尝过任何美食,以下是我推荐的一些:

1. 香辣肉丝:这是一道非常常见的鲁菜,用牛肉末和辣椒粉炒制而成。它的辣度很高,口感很鲜,辣味很浓。

2. 面食:在江苏,面食是不可或缺的一部分。其中,小笼包、手抓饼和油面等都是很受欢迎的面食。这些小笼包通常非常小,但非常好吃。

3. 煎饼: 这是一道很受欢迎的鲁菜,用薄薄的面饼煎制起来

## 每秒平均tokens:  46.40208690507312



问题: 什么是人工智能?
回答:人工智能(AI)是指计算机系统或机器能够执行或模拟人类智能,通过学习、推理、感知和自然语言处理等能力来实现特定任务的能力。人工智能已广泛应用于自然语言处理、计算机视觉、机器学习、自主驾驶等领域的应用。

## 每秒平均tokens:  46.50877235780389



问题: 你知道中国的四大名著吗?
回答:中国有四大经典小说,它们分别是《红楼梦》、《西游记》、《红楼梦2、3、4》和《红楼梦6、7》。

## 每秒平均tokens:  46.816485677462765



问题: 你了解美国的历史吗?
回答:当然,我可以为您提供一些关于美国历史的信息。

美国是一个拥有悠久历史的国家。自1783年美国独立战争爆发以来,美国一直在经历了各种战争和革命。美国历史上有许多重要的事件和人物,例如乔治·华盛顿、托马斯·杰斐逊、约翰·亚当斯、弗吉尼亚·奥尔科特等等。这些人物和事件为美国的历史产生了深远的影响和贡献,使得美国成为了全球超级大国之一。

美国历史上有许多重要事件和人物,例如独立战争、独立运动、种族隔离、种族平等、民权

## 每秒平均tokens:  46.57535514284188



问题: 介绍一下中国吧
回答:中国是一个拥有56个民族的国家,也是世界上最大的国家也是经济最为发达的国家之一。中国历史源远流长,拥有丰富的文化和历史遗产。中国有着丰富的自然风景和气候,还有着独特的自然风光和城市。

中国有着广泛的文化和艺术,包括传统的绘画、音乐、舞蹈、戏剧、文学等,以及现代的艺术和科技。中国的饮食文化也很有特色,以辣椒、蒜、姜、辣椒油等为特色。

中国拥有许多知名的技术和文化成就,比如中国造纸术、造太阳、造太阳花等!此外,中国还拥有

## 每秒平均tokens:  46.555527005139425



问题: 左手一只鸭,右手一只鸡。交换两次后左右手里各是什么?
回答:无法回答,因为“左”和“右”两个字没有明确表示,不能确定“左”和“右”两个字同时出现的条件是什么。

## 每秒平均tokens:  47.0100821455974



问题: 鸡兔同笼,共35只头,94只脚,问鸡兔各多少?
回答:根据您提供的信息,您描述了25只鸡和35只兔子,94只脚和25只脚。根据提供的信息,这些只鸡和只兔子共4个,而25只脚和25只脚共5只。这个数字就是三只一只,所以这些只兔子和三只一只兔子加起来就为25只。根据这个数字,这些只兔子和三只一只兔子应该有21只脚和17只脚。所以这些只鸡和这只小兔子的总数量应该为8只鸡和6只兔子?由于

## 每秒平均tokens:  46.43452753561132



问题: 将以下中文翻译成英文:穿衣需要适应天气变化。
回答:6. The 2018) 7- 2007. 通常,适应天气变化是穿着的重要任务,因为它可以帮助人们更好地应对可能出现的大雾和强风。

## 每秒平均tokens:  46.70460568610188



问题: 什么是机器学习?
回答:机器学习是一种人工智能技术,它使用算法和数学模型来使计算机系统能够从经验中学习,并改进它们的性能。它涉及使用大量数据和机器学习模型,以及让计算机系统能够从经验中提取出模式和规律,并基于这些规律进行决策或预测。

## 每秒平均tokens:  46.5744482011711



问题: 1+2是多少?
回答:我不知道你想要我回答的“1+2”的类型是什么,但是您可以通过打开编程语言的“数据类型”和“变量”函数来获取您的要求,然后通过计算得到结果。

## 每秒平均tokens:  46.869801828068134

我觉得可以在model0-1的量级上停止增加model复杂度了,dim不用再增加到1024以上了
这个量级(0.5B)已经智能萌芽了,千问最小也就1.8B水平不错的

下面重点应该在训练数据上下功夫了
模型复杂度已经不是瓶颈了(对于“baby“而言)(我认为)

我就两张3090和单卡4090还要和别的同学抢资源,大规模分布式训练和大数据量我是玩不起来了。
加油!!

@AI-Study-Han
Copy link
Owner

好的,我在检查一下

@boystray
Copy link

我就推理测试了一下model0,效果惊人:

阿里巴巴的寓言故事?
阿里巴巴的寓言故事中,一只小鸟在草丛里休息,一只狗在吃草。
故事中描述了小鸟在草从中休息,吃草。狗在吃草。他们非常快乐,因为小鸟在草丛中休息

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants