多模态模型
推理模型
图像理解
32K
| 版本名称: | 阶跃星辰 step-r1-v-mini |
| 所属模型: | Step |
| 所属公司: | 阶跃星辰 |
| 发布时间: | 2025年4月9日 |
| 最新版本: | Step-R1-V-Mini |
| 参数规模: | 未知 |
| 上下文长度: | 32K |
| 支持语言: | 中文,英文 |
| 授权协议: | 商用许可 |
| 体验方式: | yuewen.cn/chats/new |
Step-R1-V-Mini是阶跃星辰于2025年4月推出的新一代多模态推理模型,代表了国产多模态AI技术的重大突破。该模型采用多模态联合强化学习框架,基于PPO(近端策略优化)强化学习算法,引入可验证奖励机制提升模型鲁棒性。通过合成数据训练解决了传统方法中的模态能力不平衡问题,在保持通用能力的同时,特别擅长处理需要跨模态理解的复杂推理任务。
模型在技术架构上实现了视觉、文本和推理能力的深度融合,能够构建分步推理链并进行自我验证,显著提升了多模态任务的准确性和可靠性。其创新性的训练方法结合了冷启动数据微调与强化学习,逐步提升模型在不同模态任务中的表现。
Step-R1-V-Mini适用于多个行业和场景:
关注公众号
立刻获取最新消息及人工咨询