首页 企业动态 DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

麦享科技10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。 据介绍,DeepSeek-OCR的参数量约为3B,是研…

麦享科技10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。

据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。

DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

该模型核心由DeepEncoder与DeepSeek3B-MoE-A570M解码器构成:DeepEncoder能够在高分辨率输入条件下保持低激活状态,实现高压缩比并生成适量的视觉token;解码器则负责将这些视觉token准确转化为文本信息。

实验数据显示,当文本token数量控制在视觉token的10倍以内(压缩率<10 x )时,OCR识别精度可达97%;即使压缩率提升至20×,模型准确率仍能维持在60%左右。

研究团队表示,这一成果为长上下文压缩技术以及大语言模型的记忆与遗忘机制研究提供了新的思路与方向。

DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

论文标题:DeepSeek-OCR: Contexts Optical Compression

项目地址:https://github.com/deepseek-ai/DeepSeek-OCR

论文地址:https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf

Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-OCR

AD 麦享生活

网购比价查优惠券就用麦享生活
领打车|外卖红包|美团|抖音团购也用麦享生活
各大应用商店均可搜索安装【麦享生活APP】

文章来源【快科技】,转载请注明出处,本文链接 : https://www.bltcool.com/58437.html
上一篇
下一篇

为您推荐

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部