首页
资讯
GPT
元宇宙
区块链
操作系统
数字产品
供应商
大模型
登录
综合
查产品
查企业
热门搜索:
数字员工
数字孪生
数字化转型
关注公众号
分类
全部
文本
语言
图像
视频
语音
音频
编码
多模态
推理
排序
向量
行业
其他
上下文
全部
<=8k
<=32k
<=64k
<=128k
>128k
热门
全部
DeepSeek
GPT
Claude
通义千问
GLM
Doubao
元宝
排序
默认
发布时间
热度
DeepSeek-R1-Distill-Qwen-14B
向量表示
16K
本模型是在开源模型的基础上,通过微调训练得到的。训练过程中使用了由DeepSeek-R1生成的样本数据。
2025年2月8日
深度求索
DeepSeek-R1-Distill-Qwen-32B
向量表示
16K
本模型由开源模型的基础上,通过微调训练得到。训练过程中使用了由DeepSeek-R1生成的样本数据。
2025年2月8日
深度求索
DeepSeek-R1-Distill-Qianfan-70B
向量表示
16K
DeepSeek-R1-Distill-Qianfan-70B是由百度千帆团队推出的文本推理模型,基于千帆系列模型的基础上采用高质量的合成推理数据进行蒸馏训练,该模型为通用模型,在中文、英文、数学、代码等方面的表现强于同尺寸参数量的蒸馏模型。
2025年4月24日
深度求索
Qwen3-0.6B
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。通用能力显著超过Qwen2.5小规模系列。
2025年5月8日
通义实验室
Qwen3-1.7B
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。通用能力显著超过Qwen2.5小规模系列,模型人类偏好能力显著增强,创意写作、角色扮演、多轮对话、指令遵循能力均有明显提升,用户体验预期明显更佳。
2025年5月8日
通义实验室
Qwen3-4B
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、模型人类偏好能力显著增强,创意写作、角色扮演、多轮对话、指令遵循能力均有明显提升,用户体验预期明显更佳。
2025年5月8日
通义实验室
Qwen3-8B
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-7B。
2025年5月8日
通义实验室
Qwen3-14B
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-14B。
2025年5月8日
通义实验室
Qwen3-32B
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-32B-Instruct,达到同规模业界SOTA水平。
2025年5月8日
通义实验室
Qwen3-30B-A3B
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力以更小参数规模比肩QwQ-32B、通用能力显著超过Qwen2.5-14B,达到同规模业界SOTA水平。
2025年8月7日
通义实验室
Qwen3-30B-A3B-Instruct-2507
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力以更小参数规模比肩QwQ-32B、通用能力显著超过Qwen2.5-14B,达到同规模业界SOTA水平。
2025年8月7日
通义实验室
Qwen3-30B-A3B-Thinking-2507
多模态
16K
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力以更小参数规模比肩QwQ-32B、通用能力显著超过Qwen2.5-14B,达到同规模业界SOTA水平。
2025年8月7日
通义实验室
1
……
46
47
48
……
49
资讯
打通AI赋能实体经济“最后一公里”
汤道生对话姚顺雨:腾讯AI,慢了吗?
OpenAI GPT-5.6模型曝下月发布:AI上下文150万tokens
国家数据局召开词元经济座谈会
学习时报:词元经济的产业逻辑与演进方向
450亿美元!国家大基金拟领投DeepSeek首轮融资,中国AI迎来国家队
刚刚,DeepSeek V4 双版本正式上线!
梁文锋内部透露:DeepSeek V4将于4月下旬发布
五款头部AI平台半数医学建议存在误导性,研究称AI医生并不可靠
狂揽4万星!换掉OpenClaw太爽了,5美元就能养个AI打工人
人工导购
咨询服务
回顶部
联系我们
关注公众号
立刻获取最新消息及人工咨询