文本生成视频初露头角

深蓝色的畅想 發表於 2023-10-28 10:59:26

纽约人工智能初创企业朗韦（Runway）公司软件架构师伊恩·桑萨韦拉在电脑上输入了一段简短的文字：森林中一条宁静的河流。约两分钟后，该公司开发的生成视频模型Gen-2就生成了一段短视频：在阳光的照耀下，河面波光粼粼，河水蜿蜒穿过森林和草丛，轻轻撞击岩石。朗韦公司计划近期向少数测试人员开放Gen-2服务。该公司表示，用于图像和视频合成的深度神经网络正变得越来越精确、逼真和可控，也使人们能获得极其逼真且兼具美学艺术的图像，催生合成媒体的兴起。据“数字趋势”网站3月27日报道，仅过去7天就有5款此类AI视频生成器面世：朗韦公司的Gen-2，美易（Picsart）公司的Text2Video-Zero、Video-P2P、TemporalNet，以及中国阿里巴巴公司研发的Text-to-video。弄潮儿向潮头立！这些系统AI竞争进入下一个阶段，微软和谷歌等行业巨头和小规模初创企业纷纷入局。据《印度时报》报道，早在2022年9月，元宇宙平台公司就展示了“制作一段视频”（Make-A-Video）软件。只需输入几个字词，软件就能制作出无声视频。谷歌公司紧随其后，推出了生成式AI模型Imagen Video。该公司称，给出一段文本提示，Imagen Video就能生成高清晰视频。该公司还展示了另一款模型Phenaki，目标是在输入文本的基础上，制作出长视频。《纽约时报》的报道指出，这可能是技术领域的下一个重大事件，其重要性堪比网络浏览器或iphone的诞生

頁: [1]

比思論壇's Archiver

文本生成视频初露头角