首页
资讯
GPT
元宇宙
区块链
操作系统
数字产品
供应商
大模型
查产品
查企业
查资料
热门搜索:
数字员工
数字孪生
数字化转型
关注公众号
分类
全部
文本
语言
图像
视频
语音
音频
编码
多模态
推理
排序
向量
行业
其他
上下文
全部
<=8k
<=32k
<=64k
<=128k
>128k
热门
全部
DeepSeek
GPT
Claude
通义千问
GLM
Doubao
元宝
排序
默认
发布时间
热度
Pelican-VL 1.0
多模态
具身智能
Pelican-VL 1.0 是北京人形机器人创新中心开源的一款具身智能 VLM 模型,覆盖 7B 和 72B 参数规模,是全球性能最强大的具身智能 VLM 模型之一。该模型通过 DPPO 训练范式,实现了在视觉-语言和具身任务上的卓越性能,支持零样本物体操作、触觉闭环抓握和多机器人协作等任务。
2025年11月14日
北京人形机器人创新中心
Kimi-K2-Thinking
推理模型
智能体
250K
Kimi K2 Thinking 是月之暗面发布的开源思考模型,具备边思考边使用工具的能力,无需用户干预,可自主实现300轮工具调用和多轮思考能力。在自主网络浏览能力、复杂信息收集推理等多项基准测试中达到领先水平。
2025年11月13日
月之暗面
Doubao-Seed-Code 251028
多模态
文本生成
图像理解
250K
Doubao-Seed-Code 是字节跳动推出的专为Agentic编程任务深度优化的编程模型,支持256K长上下文,能够处理长代码文件、多模块依赖等复杂场景,尤其在前端开发中表现突出。作为国内首个支持视觉理解能力的编程模型,它可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和Bug修复,大幅提升前端开发效率。
2025年11月13日
字节跳动
Doubao-Seed-1.6-thinking-0715
多模态
推理模型
256K
Doubao-Seed-1.6-thinking-0715 是字节跳动推出的深度思考模型,具备强大的逻辑推理和多模态理解能力。该模型在代码、数学、逻辑推理等基础能力上进一步提升,支持视觉理解,并支持256K长上下文窗口,输出长度最大支持16K tokens。
2025年8月5日
字节跳动
DeepSeek V3.2(Think)
文本生成
推理模型
16K
DeepSeek V3.2 是深度求索公司推出的最新实验性模型,引入了革命性的 DeepSeek Sparse Attention (DSA) 技术,显著提升了长文本处理的效率。该模型在 V3.1-Terminus 的基础上进行了优化,训练和推理效率提高了 30%-50%,同时 API 调用成本降低了超过 50%。
2025年9月29日
深度求索
Claude Sonnet 4.5
文本生成
推理模型
196K
Claude Sonnet 4.5 is a state-of-the-art AI model developed by Anthropic, designed to excel in programming, reasoning, and complex task execution. It features a 200K context window, allowing it to handle large-scale projects and long-duration tasks efficiently. The model has demonstrated superior performance in various benchmarks, including SWE-bench Verified and OSWorld, making it a leading tool for developers and professionals in fields such as finance, law, and medicine.
2025-09-30
Anthropic
Gemini 2.5 Flash
图像生成
图像理解
多模态
32K
Gemini 2.5 Flash是谷歌推出的革命性AI图像生成与编辑模型,以其闪电般的处理速度和角色一致性保持能力著称。该模型在创意生成、响应效率与用户体验上表现出色,将AI图像生成工具从“有趣的玩具”推向了“实用的生产力工具”。
2025年8月26日
Google
DeepSeek V3.1 Terminus
文本生成
推理模型
125K
DeepSeek V3.1 Terminus 是深度求索公司发布的最新版本,该版本在保持原有模型能力的基础上,针对用户反馈的问题进行了改进,特别是在语言一致性和Agent能力方面进行了优化。模型支持128k的上下文长度,并提供了思考模型和非思考模式两种版本,适用于多种复杂任务处理。
2025年11月11日
深度求索
Doubao-Seed-1.6
多模态
文本生成
推理模型
256K
Doubao-Seed-1.6 是字节跳动推出的全功能综合模型,支持256K长上下文、自适应思考、多模态理解和图形界面操作等多项能力。该模型能够理解和处理真实世界问题,具备强大的编码、数学和逻辑推理能力。
2025年6月11日
字节跳动
CogVideoX-2B
视频生成
多模态
1K
CogVideoX-2B是智谱AI开发的一款视频生成模型,采用3D变分自编码器技术,能够将视频数据压缩至原来的2%,显著减少资源消耗并保持视频帧的连贯性。该模型还集成了3D旋转位置编码技术,提升了视频内容的连贯性和流畅性。CogVideoX-2B能够处理长达226个token的提示词,生成6秒钟的视频,分辨率为720x480,帧率为8帧/秒。
2025年6月5日
智谱AI
通义千问2.5-Omni-7B全模态
全模态
文本生成
语音合成
图像理解
视频生成
音频理解
16K
通义千问Qwen2.5-Omni-7B是阿里巴巴发布的首个端到端全模态大模型,能够同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。该模型采用了Thinker-Talker双核架构、Position Embedding融合音视频技术以及TMRoPE位置编码算法,实现了实时语义理解与语音生成的高效协同。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新了业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。
2025年3月27日
阿里巴巴
Gemini 3.0 Flash
多模态
全模态
推理模型
977K
Gemini 3.0 Flash 是谷歌推出的下一代旗舰模型,具备强大的多模态处理能力,能够理解视频、3D对象、音频、地理空间数据等多种数据类型。该模型在上下文窗口、参数规模和响应速度方面均有显著提升,适用于复杂的前端开发、实时视频处理和音乐生成等场景。
2025年10月20日
谷歌
1
……
4
5
6
……
44
资讯
一门“洗稿”生意:AI抄袭“神韵” 爆款文章遭批量魔改
DeepSeek V4大模型被曝春节前后发布:AI编程能力质...
25个火过的国产AI应用,凉了
首销备货 3 万台,豆包 AI 手机要卖给谁?
雷军:未来5年人形机器人将大面积在小米工厂上岗
金融人才培养加速“数字化”转型 第二届全国高校数字...
工信部:“十五五”智能网联新能源汽车产业发展规划将...
蚂蚁开源万亿参数思考模型,综合能力逼近GPT-5
中央网信办、国家发展改革委印发《政务领域人工智...
科技部:正在推动人形机器人在汽车制造、物流搬运、...
人工导购
咨询服务
回顶部
联系我们
关注公众号
立刻获取最新消息及人工咨询