网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明-麦享科技
麦享科技
前沿资讯网站

网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明

麦享科技3月9日消息,此前传闻DeepSeek V4在上周发布,遗憾的是这事也没有发生,目前DeepSeek依然是官网更新了一个小模型,被网友成为DeepSeek V4 Lite。

DeepSeek V4 Lite的参数量据说只有2000亿,相比V3版本的6700多亿小了很多,而传闻中的DeepSeek V4满血版参数量达到1万亿级别,因此这次的DeepSeek V4 Lite被认为是在做测试验证,方便后续微调。

DeepSeek V4 Lite的官方介绍不多,提升的主要是上下文能力,从上代的128K提升到了1M,虽然比有些AI大模型的2M上下文还差一些,但网友实测这个1M上下文是实打实的,实际上还不止。

当然,最受关注的还是DeepSeek V4 Lite的能力,之前已经有过不少测试,知乎网友给出的反馈还可以看到更多的。

网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明

网友@帅得自然表示网页版的编程能力比之前强了10倍,几乎没幻觉了,而且扔给1MB的txt代码文本让它修改都能基本一次过,最多三次。

网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明

另一个网友@起名困难症晚期提供了一个更好玩的测试,他扔给DeepSeek V4 Lite一个2.9MB的《三体》全集文档,但在其中随机加入了几个密钥,让AI给找出来,这是验证上下文能力的一个关键。

网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明

结果DeepSeek V4 Lite真的给找出来了,第一次有些顺序不对,但提醒之后就给出了更详细的说明,而且每个密钥的出现位置也给详细标明了。

《三体》全集大约80万字,虽然文字数并就是AI的上下文能力,但通过这个测试可以看出DeepSeek V4 Lite现在的体量已经可以处理百万级文本,再加上编程能力的大幅提升,实用性就强出太多了。

完整版的DeepSeek V4啥时候发布还是个迷,具体的能力当然也不好说,但是从现有的表现来看DeepSeek V4还是有不鸣则已一鸣惊人的能力,大家的期待值也是拉满的。

网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明

未经允许不得转载:麦享科技 » 网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明
分享到: 更多 (0)

相关推荐

  • 暂无文章

评论 抢沙发

评论前必须登录!