用Veo 3+Suno做了个AI Rapper,吊打音乐节上的流量明星
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
机器之心报道
编辑:杨文
太疯狂了!AI生成的嘻哈歌手唱Rap以假乱真,网友直呼「看不出破绽」。
来来来,眼尖的朋友请告诉我,下面这个嘻哈歌手唱rap的视频到底是真实的,还是AI生成的?
我可以100%肯定地说,此为AI的手笔。你猜对了吗?
三天前,X博主@blizaine使用GoogleFlowVeo3和Suno4. 5制作了这一视频。画面和开场声音是Veo3生成的,歌曲和歌词则用了Suno4. 5。
由于效果过于逼真,网友直呼「太疯狂」,甚至还让摇滚老炮回想起了当年的舞台时光。
看样子,Veo3刚揭开流量明星的遮羞布,这下子又要让歌手瑟瑟发抖了。
循着这个方向在X上逛了一圈,发现不少网友热衷于用Veo3生成演唱会视频,而且一个比一个自然。
比如这个另类摇滚迷幻乐队在一家小酒吧的演出片段。主唱站在麦克风前,边弹吉他边演唱成名曲中的副歌部分,情绪饱满但不激烈;贝斯手、吉他手和鼓手沉醉其中,身体随节奏摇摆着,几乎找不出什么bug。
再比如,下面这个妆容怪诞的钢琴家演奏动作自然流畅,手指与琴键接触的力度、节奏与画面中的旋律同步,口型也对得严丝合缝。身后交响乐团不同乐器组的演奏姿态各具特色,指挥家起伏的手势也不机械重复。
更妙的是,Veo3还能找准时机切换镜头,细节之丰富几可乱真。
Prompt:Early2000sfootageofanaustraliangothpianistmakingawhimsicalsongaboutGodinfrontofanorchestra.
还有这个混乱的摇滚音乐会,三名乐队成员完全失控:主唱挥舞着鼓槌冲着观众嘶吼,吉他手头发凌乱猛拨琴弦,身后的鼓手则疯狂击打鼓面。唯一的瑕疵就是那莫名飞起的镲,说实话有点出戏。
接下来,我们也来复刻一个,看看AI能否拯救犹如一潭死水的华语乐坛。
这第一步就是生成音乐。
前段时间一个名为「梁正尚能饭」的博主火了。他凭借「粤语+古诗+摇滚」的独特风格,创作出《将进酒》《木兰辞》《王维说》《春归何处》等音乐作品,在各大平台播放量超百万。
视频来自博主「梁正尚能饭」
我们就用Suno3. 5和豆包尝试一下。
Suno算是资深的AI音乐生成模型,当初一问世就被外界称为「音乐界的ChatGPT」,经过一年多的技术迭代,Suno已更新至4. 5版本。
那么我们为何选择Suno3. 5而不是最新的4.5版本?原因只有一个:抠。4. 5版本要花钱升级会员,3. 5版本可免费体验,只需点击「Create」,上传歌词输入风格,它就能秒出2首歌。
Suno版的《木兰辞》有嘻哈那个味了,不过咬字会在粤语和普通话之间来回横跳,女声吟唱部分还会掺杂明显的电音,听起来不是很自然。
与Suno的专精不同,豆包就像一个啥都能装的菜篮子,涵盖AI搜索、视频生成、音乐生成、AI编程等15项功能。它的音乐生成功能可直接套模版,或让AI自动写歌词,或自己输入歌词,再选择音乐风格、情绪、音色即可。
相比于Suno,豆包的咬字更清晰,尤其是「鞍鞯」、「辔头」等生僻字,豆包都能读准,但旋律相对来说比较单一。
豆包还有一个优势,就是可以直接通过对话的方式,让它润色歌词以更好地配合嘻哈音乐风格。
经过改编后的《木兰辞》听起来就顺耳多了:
第二步就是用Flow中的Veo3生成画面和开场白。
Flow是谷歌打造的一站式AI电影制作平台,用户可以通过输入文本提示或上传图像,让Flow生成完整的电影场景或短片,同时它内置一整套视频制作工具,包括摄像机控制、场景构建器和素材管理器等。
Flow链接:https ://labs. google/flow/about
要想生成以假乱真的演唱会效果,提示词是关键。经过多次调试,我们搞了个像样的:
来看看实际生成效果:
多次重复此操作,就能得到一段自然流畅的嘻哈歌手演唱会视频。
最后,再用剪映将视频和音乐片段拼合在一起,大功告成!
上最终视频效果:
感兴趣的朋友也去试试吧!
参考链接:
https ://x. com/rpnickson/status/1925079953206608257
https ://x. com/bitfalls/status/1925072790593405065
https ://x. com/TheJasonRink/status/1925372569714090429
https ://x. com/nearcyan/status/1924966995910631899
https ://x. com/blizaine/status/1926757581021684215
©THEEND
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin. com