首页
资讯
GPT
元宇宙
区块链
操作系统
数字产品
供应商
大模型
查产品
查企业
查资料
热门搜索:
数字员工
数字孪生
数字化转型
关注公众号
分类
全部
文本
语言
图像
视频
语音
音频
编码
多模态
推理
排序
向量
行业
其他
上下文
全部
<=8k
<=32k
<=64k
<=128k
>128k
热门
全部
DeepSeek
GPT
Claude
通义千问
GLM
Doubao
元宝
排序
默认
发布时间
热度
语音合成CosyVoice大模型
语音合成
CosyVoice 是通义实验室依托大规模预训练语言模型,深度融合文本理解和语音生成的新一代生成式语音合成大模型,支持文本至语音的实时流式合成。
2025年3月18日
阿里云
语音生成cosyvoice-v2大模型
语音合成
cosyvoice-V2是通义实验室依托大规模预训练语言模型,在深度融合文本理解和语音生成的新一代生成式语音合成大模型,支持文本至语音的实时流式合成。
2025年5月27日
阿里云
灵动人像LivePortrait-detect
视频生成
LivePortrait-detect是辅助LivePortrait的图像检测模型,用于检测图片中的人物形象是否符合视频生成要求。
2024年11月7日
阿里云
灵动人像LivePortrait
视频生成
LivePortrait是一款视频生成模型,可基于人物图片生成轻量化的人物肖像动态视频。
2024年11月7日
阿里云
悦动人像EMO-detect
视频生成
EMO-Detect是辅助EMO的图像检测模型,用于检测图片中的人物形象是否符合视频生成要求。
2024年11月7日
阿里云
视频风格重绘
视频生成
视频风格重绘可以将输入的视频帧序列进行多种风格化的重绘/生成,使新视频画面在兼顾原始人物和物体相貌的同时,带来不同风格的绘画效果。当前支持预置重绘风格包括日式漫画、美式漫画、清新漫画、3D卡通、国风卡通。
2024年9月13日
阿里云
悦动人像EMO
视频生成
EMO是一款视频生成模型,可基于人物图片生成高质量的人物肖像动态视频。
2024年11月7日
阿里云
声动人像VideoRetalk
视频生成
VideoRetalk是一个人物视频生成模型,可基于人物视频和人声音频,生成人物讲话口型与输入音频相匹配的新视频。
2024年12月10日
阿里云
舞动人像AnimateAnyone-detect
视频生成
AnimateAnyone-detect是辅助AnimateAnyone的图像检测模型,用于检测图片中的人物形象是否符合视频生成要求。
2024年12月10日
阿里云
声音复刻CosyVoice大模型
语音合成
声音复刻Cosyvoice大模型,依托先进的大模型技术进行特征提取,从而完成声音的复刻,且无需训练过程。仅需提供时长较短的音频,即可迅速生成高度相似且听感自然的定制声音。
2024年9月13日
阿里云
舞动人像AnimateAnyone-template
视频生成
AnimateAnyone-Template是辅助AnimateAnyone的动作模板生成模型,可基于视频提取人物动作并制作模板。
2024年12月10日
阿里云
通义千问-Plus-Character
文本生成
33K
通义千问系列角色扮演模型,本模型是动态更新版本,模型更新会提前通知,适合拟人化的角色扮演,同时优化了限定人设指令遵循、话题推进、倾听共情等能力,支持个性化角色的深度还原。
2025年3月20日
阿里云
1
……
14
15
16
……
44
资讯
一门“洗稿”生意:AI抄袭“神韵” 爆款文章遭批量魔改
DeepSeek V4大模型被曝春节前后发布:AI编程能力质...
25个火过的国产AI应用,凉了
首销备货 3 万台,豆包 AI 手机要卖给谁?
雷军:未来5年人形机器人将大面积在小米工厂上岗
金融人才培养加速“数字化”转型 第二届全国高校数字...
工信部:“十五五”智能网联新能源汽车产业发展规划将...
蚂蚁开源万亿参数思考模型,综合能力逼近GPT-5
中央网信办、国家发展改革委印发《政务领域人工智...
科技部:正在推动人形机器人在汽车制造、物流搬运、...
人工导购
咨询服务
回顶部
联系我们
关注公众号
立刻获取最新消息及人工咨询