首页 电脑软件 印度也有自己的“DeepSeek”大模型Alpie了:性能超越GPT-4o、Claude等

印度也有自己的“DeepSeek”大模型Alpie了:性能超越GPT-4o、Claude等

印度也有自己的“DeepSeek”大模型Alpie了:性能超越GPT-4o、Claude等 麦享科技1月14日消息,目前AI技术的领头羊是中美两国,但其他国家也不想缺席这场被视为有…

印度也有自己的“DeepSeek”大模型Alpie了:性能超越GPT-4o、Claude等

麦享科技1月14日消息,目前AI技术的领头羊是中美两国,但其他国家也不想缺席这场被视为有史以来最大的科技革命的盛宴,韩国喊出了要做全球第三AI大国,印度当然也想分一杯羹。

最近印度169PI公司发布的Alpie大模型引起了注意,它被称为印度版的DeepSeek,目前已经开源在多个平台,还开放了API,在线体验的话可以到这个页面体验下。

这款模型只是一个320亿参数的小模型,主打4bit量化,但AI榜单上表现非常强,GSM8K数学榜单上超过了DeepSeek V3,跟GPT-4o、Qwen 2.5-30B一个档次,略低于Cluade 3.5。

在SWE软件工程榜单上则力压其他大模型,包括Claude 3.5等,表现非常强。

BBH榜单上也超过了GPT-4o、Qwen 2.5、Calude 3.5等大模型,略低于DeepSeek V3。

印度也有自己的“DeepSeek”大模型Alpie了:性能超越GPT-4o、Claude等

不过Alpie的榜单表现很好很强大,但它的争议不少,因为它其实不是印度工程师自己训练出来的大模型,而是DeepSeek-R1-Distill-Qwen-32B二次深度开发的,是中国开源大模型基础上蒸馏+量化出来的。

这样做的好处不少,比如大幅降低了成本,只有GPT-4o的1/10,显存占用降低了75%,16-24GB的显卡就能流畅运行。

印度也有自己的“DeepSeek”大模型Alpie了:性能超越GPT-4o、Claude等

印度也有自己的“DeepSeek”大模型Alpie了:性能超越GPT-4o、Claude等

AD 麦享生活

网购比价查优惠券就用麦享生活
领打车|外卖红包|美团|抖音团购也用麦享生活
各大应用商店均可搜索安装【麦享生活APP】

文章来源【快科技】,转载请注明出处,本文链接 : https://www.bltcool.com/68718.html
上一篇
下一篇

为您推荐

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部