首页 > 汽车活动 > 汽车活动 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50来源: 15210273549

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

汽车活动更多>>

丰田上海车展主题:直面问题所在,研产供销全面中国化 同级唯一天地门,空间堪比A+级,东风纳米06再次颠覆国民车 吉利银河星耀8:以豪华平权,再创“爆款” 长安汽车,销量涨了、利润跌了 传祺向往 M8 内饰官图发布!提供 7 座布局,搭载 2.0T 插混动力 方程豹钛 3 将于 4 月 16 日上市!采用纯电动力,配备一键漂移模式 广汽 CC4 概念车官图发布!配鸥翼门设计 新款 Jeep 大切诺基谍照曝光!外观内饰升级,定位中大型 SUV 汽车业加速重组并购最新成果:一汽或成零跑大股东 上汽之夜:懂车更懂你!上汽制造进阶,共创美好出行 上汽大通G50混动:重塑10万级MPV价值标准! 比亚迪580KW超级电机铭牌曝光:转速30500转/分钟全球第一 2024年全年销量3143.6万辆,增长4.5%,47.5%新能源渗透率,585.9万辆全球第一出口量 丰田纯电车型终端售价“崩盘” 消息称bZ3裸车只要9万多 小鹏汽车新总部2025年启用,办公空间翻三倍,打造智能车库 恢复序幕与尾声,李六乙版话剧《雷雨》令人耳目一新 新华文创携手FILA FUSION推出系列活动,用非遗开启新年 游戏成为文旅新引擎?上海游戏赋能商旅文体展融合发展的实践 晨光加速年轻化布局:联动腾讯视频《斩神》,力拓二次元千亿蓝海 广州“贺·岁”今日开展,系海昏侯相关展览首次在广州展出 信也科技顾鸣:东南亚数字金融市场正在加速接近成熟地区 福特游骑侠Ranger FX4沙狐版来袭,越野性能再升级,售价28.58万起 “一车抵三车” 长安启源E07迎来OTA升级 优雅的英国敞篷跑车,2门4座布局,V8发动机、665马力、加速3.5s 宏光MINIEV四门版来袭,小巧便捷,女友直呼开车出门超方便! 溜背造型+掀背尾门,后置后驱+5.9秒破百,体验东风风行星海S7 搭载全球最强电机 比亚迪唐L实车曝光:自带车顶无人机舱 三菱翼神改装AIRBFT气动避震底盘升降案例 双电机、四驱、650马力,27英寸大屏,这内饰看着可太有档次了! 2025年温州永嘉县事业单位引进博士研究生公告