英伟达(NVDA.US)推出新AI模型Fugatto,可修正并生成新声响

liukang20242个月前吃瓜始末116

智通财经APP得悉,英伟达(NVDA.US)推出了一款用于生成音乐和音频的新式人工智能(AI)模型,旨在为制造音乐、电影和视频游戏的人们供给服务。

生动的英伟达(NVDA.US)推出新AI模型Fugatto,可修改并生成新声音的照片

依据英伟达的说法,这款模型名为Fugatto(Foundational Generative Audio Transformer Opus),能够运用任何文本和音频文件来生成或修正音乐和声响。

例如,该模型能够依据文本提示创立音乐片段,从现有歌曲中删去或增加乐器,改动声响中的口音或心情,乃至宣布从未听过的声响。

英伟达运用音频研讨司理、管弦乐队指挥兼作曲家Rafael Valle表明:“咱们期望创立一个能像人类相同了解和发生声响的模型。”

英伟达指出,广告代理商能够运用Fugatto快速定位多个区域的现有广告,并在配音中参加不同的口音和情感。此外,视频游戏开发者能够运用人工智能模型修正游戏中预先录制的财物,以适运用户在玩游戏时不断改变的动作。

迷人的英伟达(NVDA.US)推出新AI模型Fugatto,可修改并生成新声音的图片

Fugatto能够使小号宣布狗吠声或萨克斯管宣布喵喵声。该公司弥补说,经过微谐和少数的歌唱数据,研讨人员发现它能够处理未经预先练习的使命,比如从文本中生成高质量的歌声。

英伟达表明,Fugatto的完好版别运用了25亿个参数,并在包括32个Nvidia H100 Tensor Core GPU的Nvidia DGX体系进步行了练习。该模型的全体作业耗时一年多。

Fugatto或许会与Runway等草创公司以及 Meta Platforms(META.US)等大公司的相似技能打开竞赛。10月,Meta 发布了名为Movie Gen的人工智能模型,该模型能够依据用户提示创立传神的视频和音频编排。

本年 2 月,ChatGPT制造商OpenAI推出了Sora,它能够依据文本指令创立传神且赋有想象力的场景。这家由微软(MSFT.US)支撑的公司尚未向大众发布文本转视频模型。

迷人的英伟达(NVDA.US)推出新AI模型Fugatto,可修改并生成新声音的视图

更多港股重磅资讯,下载智通财经app

更多港股及海外理财资讯,请点击www.zhitongcaijing.com(查找“智通财经”);欲参加智通港股出资群,请加智通客服微信(ztcjkf)

本文源自:智通财经网

告发/反应

相关文章

英伟达(NVDA.US)股价迫临AI年代估值凹地 多重危险成抄底“绊脚石”

虽然英伟达(NVDA.US)股价已跌至人工智能(AI)开展周期中的最轻视值区间,但接二连三的危险事情却让出资者对"逢低吸纳"战略望而生畏。这家全球AI芯片龙头正堕入地缘政治与工业周期叠加的漩涡之中。上...

友情链接: