首页
资讯
GPT
元宇宙
区块链
操作系统
数字产品
供应商
大模型
查产品
查企业
查资料
热门搜索:
数字员工
数字孪生
数字化转型
关注公众号
分类
全部
文本
语言
图像
视频
语音
音频
编码
多模态
推理
排序
向量
行业
其他
上下文
全部
<=8k
<=32k
<=64k
<=128k
>128k
热门
全部
DeepSeek
GPT
Claude
通义千问
GLM
Doubao
元宝
排序
默认
发布时间
热度
GLM-4.7
文本生成
推理模型
196K
GLM-4.7是智谱AI发布的新一代旗舰模型,在编程和复杂推理能力上实现重大突破,对标当下顶尖闭源模型。该模型在编程、复杂推理和工具使用方面都有显著提升,在多个关键基准测试中表现优异,包括LMArena代码竞技场、LiveCodeBench V6、AIME 2025和人类终极考试(HLE)。GLM-4.7支持200K上下文长度,最大输出128K tokens,处理速度达到每秒55+ tokens,并优化了交织思维模式,引入了保留思维和回合级思维。
2025年12月23日
智谱AI
Qwen-Image-Edit-2511
图片处理
图像理解
Qwen-Image-Edit-2511是阿里Qwen团队推出的图像编辑模型的最新版本,专注于提升图像编辑的稳定性和可控性。该版本在人物一致性、LoRA子模型内置、几何构造能力等方面进行了显著优化,特别适用于人像融合、风格迁移、材质替换等场景。
2025年12月25日
阿里
NextStep-1.1
图片生成
图像理解
多模态
16K
NextStep-1.1是由阶跃星辰团队开发的自回归图像生成模型,采用连续视觉token流匹配架构,结合14B参数的Transformer主干和157M参数的轻量级流匹配头,实现了高质量的逐步图像生成。该模型摆脱了传统扩散模型的依赖,直接在连续视觉空间中进行自回归生成,避免了离散化带来的信息损失。NextStep-1.1在多个权威评测基准中表现出色,支持高保真图像生成和精细的图像编辑。
2025年8月27日
阶跃星辰
Qwen-Image
图像生成
多模态
4K
Qwen-Image 是通义千问系列中的最新图像基础模型,专注于图像生成,尤其在文字渲染和图像编辑方面取得了显著突破。它是一个 20B 规模的 MMDiT 模型,致力于解决复杂文字在图像里的清晰、高保真且自然呈现这一难题。支持多行布局、段落文字、书法风格、广告牌牌匾、标志、海报等多种情境下的文字生成,同时能进行对象增删、风格转换、细节增强、人物姿态调整等多样编辑操作。
2025年9月15日
阿里巴巴
MiMo-V2-Flash
推理模型
文本生成
256K
MiMo-V2-Flash是小米公司于2025年12月16日发布并开源的MoE模型,总参数量达309B,活跃参数为15B。通过Hybrid Attention架构和多层MTP技术,实现了2倍生成速度提升和极低的推理成本。该模型专为智能体AI设计,支持256K超长上下文窗口,在多个Agent测评基准上保持全球开源模型Top 2地位。
2025年12月17日
小米
LongCat-Video-Avatar
视频生成
多模态
LongCat-Video-Avatar是美团LongCat团队发布的SOTA级虚拟人视频生成模型,基于LongCat-Video基座打造,支持多任务设计,包括Audio-Text-to-Video、Audio-Text-Image-to-Video及视频续写等功能。该模型在动作拟真度、长视频稳定性与身份一致性方面有显著提升,能够实现丰富饱满的情感表达,并在不说话时也能自然表现人类行为。
2025年12月18日
美团
GLM-ASR-Nano
语音识别
GLM-ASR-Nano是智谱推出的轻量级开源端侧语音识别模型,参数量为1.5B,主打本地运行,在延迟和隐私层面更友好。它在开源语音识别方向已达到SOTA水平,在部分测试中甚至超过了若干闭源模型。
2025年12月10日
智谱
GLM-4.6V
多模态
图像理解
文本生成
125K
GLM-4.6V 是智谱 AI 开源的多模态大模型系列,包括面向云端与高性能集群场景的基础版 GLM-4.6V(106B-A12B)和面向本地部署与低延迟应用的轻量版 GLM-4.6V-Flash(9B)。该模型将训练时上下文窗口提升到 128k tokens,在视觉理解精度上达到同参数规模 SOTA,首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从“视觉感知”到“可执行行动”的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。
2025年12月12日
智谱 AI
LongCat-Image
图片生成
图片处理
LongCat-Image是美团LongCat团队研发的图像生成与编辑基础模型,参数规模为6B(60亿),属于轻量化大模型。与之前动辄百亿参数的主流模型相比,它通过创新架构设计和系统性训练策略,在保持高生成质量的同时大幅降低了计算资源需求。模型采用文生图与图像编辑同源的混合骨干架构(MM-DiT+Single-DiT),并整合了视觉语言模型(VLM)条件编码器,实现了生成与编辑的一体化处理。
2025年12月8日
美团
DeepSeek-V3.2-Speciale
推理模型
125K
DeepSeek-V3.2-Speciale是深度求索推出的极致推理增强版模型,结合了DeepSeek-Math-V2的定理证明能力,具备出色的指令跟随、严谨的数学证明与逻辑验证能力。该模型在多个推理基准测试中媲美谷歌的Gemini-3.0-Pro,并在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等竞赛中斩获金牌级表现。
2025年12月2日
深度求索
混元 2.0
多模态
图片生成
视频生成
腾讯混元2.0是一款多模态大模型,专注于图像生成和游戏视觉内容生产。该模型在图像生成速度上实现了毫秒级响应,支持实时文生图和实时绘画板功能,大幅提升了创意表达和设计效率。混元2.0在游戏场景中表现出色,支持图生视频、自定义模型训练和角色一键精修等功能,适用于游戏资产生成和美术设计。
2025年9月5日
腾讯
豆蔻大模型
行业大模型
豆蔻妇科大模型是由壹生检康(杭州)生命科技有限公司研发的垂直医疗模型,专注于妇产科领域。该模型通过国家妇产科卫生高级职称(正高)笔试考试,具备主任级医师的专业判断力。模型依托钉钉企业专属AI平台,通过高质量妇产科数据构建与多阶段优化训练方法实现性能跃升,诊断准确率达到90.2%。
2025年7月29日
壹生检康(杭州)生命科技有限公司
1
……
5
6
7
……
47
资讯
国家数据局确认 Token中文名:词元
AI养肥了腾讯云,马化腾:首次规模化盈利
Token调用量暴增,阿里云宣布AI算力和存储产品最高...
我们决定:让 AI 接管 Seele AI 的办公
企业微信支持3步接入OpenClaw
智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-C...
3 年、1 万人,快手技术团队首次系统披露 AI 研发...
Claude Opus 4.6 和GPT-5.3 Codex 同时发布
一门“洗稿”生意:AI抄袭“神韵” 爆款文章遭批量魔改
DeepSeek V4大模型被曝春节前后发布:AI编程能力质...
人工导购
咨询服务
回顶部
联系我们
关注公众号
立刻获取最新消息及人工咨询