DeepSeek-OCR
多模态
文档大模型
图像理解
2K
版本名称:DeepSeek-OCR
所属模型:DeepSeek
所属公司:DeepSeek-AI
发布时间:2025年10月20日
最新版本:DeepSeek-OCR
参数规模:3B
上下文长度:2K
支持语言:中文,英文
授权协议:Apache 2.0
体验方式:https://github.com/deepseek-ai/DeepSeek-OCR

简介

DeepSeek-OCR 是一款基于视觉模态压缩长文本上下文的 OCR 模型,通过光学二维映射高效压缩文本内容,主要由 DeepEncoder 和 DeepSeek3B-MoE-A570M 解码器两大核心组件构成。该模型在保持高分辨率输入的同时,实现高压缩比,生成数量适中的视觉 token,展现出在长上下文压缩和 LLM 记忆遗忘机制研究中的潜力。

应用

DeepSeek-OCR 在金融、医疗、出版等领域具有广泛应用潜力。例如,在金融领域,它可以将厚厚的财报瞬间转为结构化数据;在医疗行业,能快速数字化历史病历档案;对出版机构而言,古籍数字化效率将提升数十倍。此外,该模型展现出的“视觉记忆”特性,为突破大语言模型的上下文长度限制提供了全新思路。
以上信息来自企数智AI小编,如有错误可反馈给我们
30
热度
人工导购
咨询服务