首页
资讯
GPT
元宇宙
区块链
操作系统
数字产品
供应商
大模型
查产品
查企业
查资料
热门搜索:
数字员工
数字孪生
数字化转型
关注公众号
分类
全部
文本
语言
图像
视频
语音
音频
编码
多模态
推理
排序
向量
行业
其他
上下文
全部
<=8k
<=32k
<=64k
<=128k
>128k
热门
全部
DeepSeek
GPT
Claude
通义千问
GLM
Doubao
元宝
排序
默认
发布时间
热度
CogVideoX-2B
视频生成
多模态
1K
CogVideoX-2B是智谱AI开发的一款视频生成模型,采用3D变分自编码器技术,能够将视频数据压缩至原来的2%,显著减少资源消耗并保持视频帧的连贯性。该模型还集成了3D旋转位置编码技术,提升了视频内容的连贯性和流畅性。CogVideoX-2B能够处理长达226个token的提示词,生成6秒钟的视频,分辨率为720x480,帧率为8帧/秒。
2025年6月5日
智谱AI
通义千问2.5-Omni-7B全模态
全模态
文本生成
语音合成
图像理解
视频生成
音频理解
16K
通义千问Qwen2.5-Omni-7B是阿里巴巴发布的首个端到端全模态大模型,能够同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。该模型采用了Thinker-Talker双核架构、Position Embedding融合音视频技术以及TMRoPE位置编码算法,实现了实时语义理解与语音生成的高效协同。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新了业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。
2025年3月27日
阿里巴巴
Gemini 3.0 Flash
多模态
全模态
推理模型
977K
Gemini 3.0 Flash 是谷歌推出的下一代旗舰模型,具备强大的多模态处理能力,能够理解视频、3D对象、音频、地理空间数据等多种数据类型。该模型在上下文窗口、参数规模和响应速度方面均有显著提升,适用于复杂的前端开发、实时视频处理和音乐生成等场景。
2025年10月20日
谷歌
DeepSeek-OCR
多模态
文档大模型
图像理解
2K
DeepSeek-OCR 是一款基于视觉模态压缩长文本上下文的 OCR 模型,通过光学二维映射高效压缩文本内容,主要由 DeepEncoder 和 DeepSeek3B-MoE-A570M 解码器两大核心组件构成。该模型在保持高分辨率输入的同时,实现高压缩比,生成数量适中的视觉 token,展现出在长上下文压缩和 LLM 记忆遗忘机制研究中的潜力。
2025年10月20日
DeepSeek-AI
Ring-1T
推理模型
文本生成
16K
Ring-1T是蚂蚁集团推出的万亿参数思考模型,具备强大的自然语言推理能力。该模型通过大规模可验证奖励强化学习(RLVR)和人类反馈强化学习(RLHF)训练,显著提升了复杂推理能力和通用表现。在多项任务榜单上表现均衡,尤其在数学推理、代码生成和逻辑推理等领域表现突出。
2025年10月14日
蚂蚁集团
EnergyTS 2.0
行业大模型
时序模型
EnergyTS 2.0是蚂蚁数科推出的能源电力时序大模型,专为新能源行业定制。该模型采用混合专家(MoE)架构,融合气象、地理、日历等多元协变量信息,显著提升光伏发电、风力发电及用电负荷预测的精准度。参数规模从1B扩展至7B,能够应对更为复杂的能源预测任务。
2025年9月19日
蚂蚁数科
Sora 2
视频生成
多模态
Sora 2是OpenAI推出的一款先进的视频生成模型,也称为“视频生成器”。它能够生成最长10秒的视频,支持滑动浏览,并配备身份验证功能,用户可以在视频中使用自己的形象。Sora 2在物理逻辑、画面一致性和真实感上都有显著提升,能够通过一张照片和一句提示词生成有剧情、有文案的短片。
2025年10月1日
OpenAI
Kimi K2 0905
文本生成
推理模型
250K
Kimi K2 0905是月之暗面科技有限公司推出的一款混合专家架构(MoE)的开源基础模型,总参数为1000亿,激活参数为32亿。该模型在编程能力、上下文长度和API性能方面进行了显著升级,特别适用于复杂的编程任务和软件开发。
2025年9月6日
月之暗面科技有限公司
Gemini-2.5 Computer Use (Preview)
多模态
行业大模型
128K
Gemini 2.5 Computer Use 模型是 Google 基于 Gemini 2.5 Pro 的视觉理解和推理能力构建的专用模型,专门用于控制用户界面。与传统通过结构化 API 进行软件交互不同,该模型可以像人类一样直接与图形用户界面交互。
2025年10月8日
Google
GPT Image 1-mini
多模态
图片生成
GPT Image 1-mini 是 OpenAI 推出的一个原生多模态语言模型,能够同时接受文本和图像输入,并生成图像输出。该模型旨在提供高效且低成本的图像处理解决方案,适用于多种应用场景。
2025年10月7日
OpenAI
DeepSeek-V3.2-Exp
文本生成
推理模型
16K
DeepSeek-V3.2-Exp模型是DeepSeek发布的一个实验性版本,作为迈向下一代架构的重要中间步骤。该版本在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention稀疏注意力机制,针对长文本的训练和推理效率进行了探索性的优化和验证。
2025年9月29日
深度求索
GLM-4.6
文本生成
推理模型
GLM-4.6 是智谱推出的最新大模型,在中文指令遵循率、代码一次性可运行率等方面表现优异,尤其在2024高考数学卷中展现了强大的推理能力。
2025年9月30日
智谱
1
……
7
8
9
……
47
资讯
国家数据局确认 Token中文名:词元
AI养肥了腾讯云,马化腾:首次规模化盈利
Token调用量暴增,阿里云宣布AI算力和存储产品最高...
我们决定:让 AI 接管 Seele AI 的办公
企业微信支持3步接入OpenClaw
智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-C...
3 年、1 万人,快手技术团队首次系统披露 AI 研发...
Claude Opus 4.6 和GPT-5.3 Codex 同时发布
一门“洗稿”生意:AI抄袭“神韵” 爆款文章遭批量魔改
DeepSeek V4大模型被曝春节前后发布:AI编程能力质...
人工导购
咨询服务
回顶部
联系我们
关注公众号
立刻获取最新消息及人工咨询