首页
资讯
GPT
元宇宙
区块链
操作系统
数字产品
供应商
大模型
登录
查产品
查企业
查资料
热门搜索:
数字员工
数字孪生
数字化转型
关注公众号
分类
全部
文本
语言
图像
视频
语音
音频
编码
多模态
推理
排序
向量
行业
其他
上下文
全部
<=8k
<=32k
<=64k
<=128k
>128k
热门
全部
DeepSeek
GPT
Claude
通义千问
GLM
Doubao
元宝
排序
默认
发布时间
热度
Qwen2.5-7B-Instruct
多模态
16K
Qwen2.5 是最新的 Qwen 大型语言模型系列。
2025年3月13日
通义实验室
Qwen2.5-Coder-14B-Instruct
多模态
Qwen2.5-Coder 是最新的面向代码的 Qwen 大型语言模型系列(以前称为 CodeQwen)。截至目前,Qwen2.5-Coder 已覆盖六种主流模型尺寸:0.5、1.5、3、7、14 和 32 亿参数,以满足不同开发者的需求。
2025年3月20日
通义实验室
Qwen2.5-Coder-32B-Instruct
多模态
Qwen2.5-Coder 是最新的面向代码的 Qwen 大型语言模型系列(以前称为 CodeQwen)。截至目前,Qwen2.5-Coder 已覆盖六种主流模型尺寸:0.5、1.5、3、7、14 和 32 亿参数,以满足不同开发者的需求。
2025年3月20日
通义实验室
QwQ-32B
向量表示
16K
QwQ 是 Qwen 系列的推理模型。与传统的指令调优模型相比,具备思考和推理能力的 QwQ 在下游任务中,尤其是在处理难题时,能够显著提高性能。
2025年3月7日
通义实验室
FLUX.1-schnell
文本生成
具有120亿参数的修正流变换器,能够根据文本描述生成图像。
2025年3月27日
Black Forest Labs
DeepSeek-R1-Distill-Qianfan-8B
向量表示
16K
DeepSeek-R1-Distill-Qianfan-8B是由百度千帆团队推出的文本推理模型,基于千帆系列模型的基础上采用高质量的合成推理数据进行蒸馏训练,该模型为通用模型,在中文、英文、数学、代码等方面的表现强于同尺寸参数量的蒸馏模型。
2025年4月24日
深度求索
DeepSeek-R1-Distill-Qianfan-Llama-8B
向量表示
16K
DeepSeek-R1-Distill 系列模型是在开源模型的基础上通过微调训练得到的,训练过程中使用了由DeepSeek-R1生成的样本数据。
2025年2月13日
深度求索
DeepSeek-R1-Distill-Qianfan-Llama-70B
向量表示
16K
DeepSeek-R1-Distill 系列模型是在开源模型的基础上通过微调训练得到的,训练过程中使用了由DeepSeek-R1生成的样本数据。
2025年2月13日
深度求索
DeepSeek-R1-Distill-Qwen-1.5B
向量表示
16K
本模型是在开源模型的基础上,通过微调训练得到的。训练过程中使用了由DeepSeek-R1生成的样本数据。
2025年2月12日
深度求索
DeepSeek-R1-Distill-Qwen-7B
向量表示
16K
本模型是在开源模型的基础上,通过微调训练得到的。训练过程中使用了由DeepSeek-R1生成的样本数据。
2025年2月12日
深度求索
DeepSeek-R1-Distill-Llama-8B
向量表示
16K
本模型是在开源模型的基础上,通过微调训练得到的。训练过程中使用了由DeepSeek-R1生成的样本数据。
2025年2月12日
深度求索
DeepSeek-R1-Distill-Llama-70B
向量表示
16K
本模型是在开源模型的基础上,通过微调训练得到的。训练过程中使用了由DeepSeek-R1生成的样本数据。
2025年2月12日
深度求索
1
……
44
45
46
……
48
资讯
450亿美元!国家大基金拟领投DeepSeek首轮融资,中...
刚刚,DeepSeek V4 双版本正式上线!
梁文锋内部透露:DeepSeek V4将于4月下旬发布
五款头部AI平台半数医学建议存在误导性,研究称AI...
狂揽4万星!换掉OpenClaw太爽了,5美元就能养个AI打...
阿里巴巴新设集团技术委员会:升级通义大模型事业...
DeepSeek 上线专家模式
智谱 AI 财报炸场,Token 价值暴涨、核心指标直追 ...
中兴通讯联合字节跳动研发新一代豆包AI手机,预计2...
国家数据局确认 Token中文名:词元
人工导购
咨询服务
回顶部
联系我们
关注公众号
立刻获取最新消息及人工咨询