通义千问2.5-Omni-7B全模态 - 企数智|企业级大模型服务平台

首页数智产品供应商大模型

全模态

文本生成

语音合成

图像理解

视频生成

音频理解

16K

版本名称：	通义千问2.5-Omni-7B全模态
所属模型：	通义千问
所属公司：	阿里巴巴
发布时间：	2025年3月27日
最新版本：	Qwen2.5-Omni-7B

参数规模：	7B
上下文长度：	16K
支持语言：	中文,英文
授权协议：	Apache 2.0
体验方式：	https://chat.qwenlm.ai

通义千问Qwen2.5-Omni-7B是阿里巴巴发布的首个端到端全模态大模型，能够同时处理文本、图像、音频和视频等多种输入，并实时生成文本与自然语音合成输出。该模型采用了Thinker-Talker双核架构、Position Embedding融合音视频技术以及TMRoPE位置编码算法，实现了实时语义理解与语音生成的高效协同。在权威的多模态融合任务OmniBench等测评中，Qwen2.5-Omni刷新了业界纪录，全维度远超Google的Gemini-1.5-Pro等同类模型。

Qwen2.5-Omni-7B适用于多种应用场景，包括但不限于实时音视频交互、智能客服、多语言翻译、医疗诊断辅助、智能家居控制等。其轻量化的设计使得它能够在手机等终端设备上轻松部署，为开发者和企业提供了广泛的应用可能性。

以上信息来自企数智AI小编，如有错误可反馈给我们

收藏微博微信

226

热度

通义万相2.2-文生图-Flash 悦动人像EMO-detect 通义千问VL-OCR-2024-10-28 通义千问2-VL-7B 通义千问VL-Max-Latest 通义千问-Audio-Turbo-Latest 通义千问-QVQ-Plus-Latest 通义千问ASR-2024-12-04 通义千问VL-Max-2024-12-30 Sambert语音合成-知伦

企业数智化服务平台

www.QiShuZhi.com

微信

小红书

企数智，企业数智化服务平台

津ICP备14003781号-9

回顶部

简介

应用

相关模型

关于我们

内容服务

产品服务

联系我们

人工导购

咨询服务