大家好 Deepseek v3 版本已经静悄悄的上线了。 它的聊天页面和API都可以用了 这个就是Aider的一个测试基准分数 它包含225道高难度编程题组成, 覆盖众多的编程语言 看一下第一名的,就是OpenAI刚发布的o1模型 之后到了我们的Deepseek v3预览版 之后才到claude 3.5 Sonnet 所以它的编程能力是非常强的 再看一下这一个基准测试 可以看到Deepseek下面的两个模型是GAMINI 2 Flash和claude 3.5 sonnet模型。 可以看到它分数相当的亮眼,名列前茅 在开源模型中真的非常强大。 这个就是用V3版本做的游戏, 大家可以看一下好,非常有意思。 现在我们来测试一下吧 首先我们用API在Open web ui 中进行测试 首先问一下他的版本,验明正身。 他说他就是V3,深度求索公司开发的智能助手 现在开测这个开源中最强大的一个模型吧 第一题正确