首页
资讯
GPT
元宇宙
区块链
操作系统
数字产品
供应商
大模型
登录
查产品
查企业
查资料
热门搜索:
数字员工
数字孪生
数字化转型
关注公众号
分类
全部
文本
语言
图像
视频
语音
音频
编码
多模态
推理
排序
向量
行业
其他
上下文
全部
<=8k
<=32k
<=64k
<=128k
>128k
热门
全部
DeepSeek
GPT
Claude
通义千问
GLM
Doubao
元宝
排序
默认
发布时间
热度
pythia-12b
多模态
16K
由EleutherAI研发并开源,在Pile数据集上训练的12B参数transformer语言模型。[了解更多>](https://huggingface.co/EleutherAI/pythia-12b)
2023年9月3日
其他
oasst-sft-4-pythia-12b-epoch-3.5
多模态
16K
由EleutherAI研发并开源,在Pile数据集上训练的12B参数transformer语言模型。[了解更多>](https://huggingface.co/EleutherAI/pythia-12b)
2023年9月3日
其他
Cerebras-GPT-13B
多模态
16K
由Cerebras研发并开源,使用 Chinchilla 公式进行训练的13B参数GPT模型,可为给定的计算预算提供最高的准确性,具备更低的训练成本与功耗。[了解更多>](https://huggingface.co/cerebras/Cerebras-GPT-13B)
2023年9月3日
其他
mpt-30b-instruct
多模态
16K
MPT-30M-Instruct是一种短格式指令遵循模型,由MosaicML研发,基于MPT-7B模型在更为丰富的数据集上调优的版本,采用经过修改的仅使用解码器的transformer架构。[了解更多>](https://huggingface.co/mosaicml/mpt-30b-instruct)
2023年9月3日
其他
mpt-7b-instruct
多模态
16K
MPT-7B-Instruct是一种短格式指令遵循模型,由MosaicML研发,基于MPT-7B模型在Databricks Dolly-15k、HH-RLHF数据集上调优的版本,采用经过修改的仅使用解码器的transformer架构。[了解更多>](https://huggingface.co/mosaicml/mpt-7b-instruct)
2023年8月1日
其他
dolly-v2-12b
多模态
16K
由Databricks训练的指令遵循大语言模型。基于pythia-12b,由InstructGPT论文的能力域中生成的约15k指令/响应微调记录训练。[了解更多>](https://huggingface.co/databricks/dolly-v2-12b)
2023年8月1日
其他
openllama-7b-v5-fp16
多模态
16K
在Meta AI研发的Llama模型基础上,OpenBuddy进行调优,涵盖了更广泛的词汇、通用字符与token嵌入,具备与Llama相当的性能与推理效果。[了解更多>](https://huggingface.co/OpenBuddy/openbuddy-openllama-7b-v5-fp16)
2023年8月1日
其他
falcon-40b-instruct
多模态
16K
由TII研发的仅使用解码器的模型,并在Baize的混合数据集上进行微调,具备优异的推理效果。[了解更多>](https://huggingface.co/tiiuae/falcon-40b-instruct)
2023年9月3日
其他
falcon-7b-v5-fp16
多模态
16K
由TII研发、在精选语料库增强的1500B tokens上进行训练。由OpenBuddy调优并开源,提升了处理复杂对话任务的能力与表现。[了解更多>](https://huggingface.co/OpenBuddy/openbuddy-falcon-7b-v5-fp16)
2023年8月1日
其他
rwkv-4-pile-14b
多模态
16K
由香港大学物理系校友彭博研发并开源的14B参数模型,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。[了解更多>](https://huggingface.co/BlinkDL)
2023年9月3日
其他
rwkv-raven-14b
多模态
16K
由香港大学物理系校友彭博研发并开源的14B参数模型,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。[了解更多>](https://huggingface.co/BlinkDL)
2023年9月3日
其他
rwkv-4-world
多模态
16K
由香港大学物理系校友彭博研发并开源的7B参数模型,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。[了解更多>](https://huggingface.co/BlinkDL/rwkv-4-world)
2023年8月1日
其他
1
……
37
38
39
……
48
资讯
学习时报:词元经济的产业逻辑与演进方向
450亿美元!国家大基金拟领投DeepSeek首轮融资,中...
刚刚,DeepSeek V4 双版本正式上线!
梁文锋内部透露:DeepSeek V4将于4月下旬发布
五款头部AI平台半数医学建议存在误导性,研究称AI...
狂揽4万星!换掉OpenClaw太爽了,5美元就能养个AI打...
阿里巴巴新设集团技术委员会:升级通义大模型事业...
DeepSeek 上线专家模式
智谱 AI 财报炸场,Token 价值暴涨、核心指标直追 ...
中兴通讯联合字节跳动研发新一代豆包AI手机,预计2...
人工导购
咨询服务
回顶部
联系我们
关注公众号
立刻获取最新消息及人工咨询