百度视频黑科技 Vidpress体验
背景
2020年4月20日,百度研究院宣布已孵化出业界首个支撑通用型、大规模生产的智能视频合成平台VidPress。号称可以通过一段图文信息自动生成为一段视频。
《百度研究院宣布孵化出首个智能视频合成平台VidPress》
因为日常剪辑也会遇到很多文字稿配画面的困惑,所以立刻网上搜索后在“百度大脑”的“智能创作中心”找到了测试申请入口,因为我只是属于一个个人爱好者,抱着试试看的心态,提交了信息。原本这件事情也就结束了,因为之后没有得到任何反馈,我还猜想百度嫌弃我个人爱好者拒绝了我的申请。
神奇的事情发生了,今天接到了北京百度公司来的电话,询问我Vidpress的使用体验,重新找到入口页面发现居然开放给我测试了,于是立刻开始上手测试一下这个黑科技。
测试流程
目前因为还是测试阶段,所以界面还比较简单,不过好在提供了页面手工生成的提交入口,省去了使用API方式开发的繁琐。但第一阶段的内容必须是百度号发布的内容,并且似乎只能是官方内容,如果是个人百度号发布出来内容会由于域名不一致而拒绝提交。
当选定了一个百度号的内容后,选择朗读文字内容配音,可以选择男声或女生,设置一下预计时长,点击“生成视频”就可以了。
一般一个节目生成大约需要15分钟左右,看当时运算的繁忙程度而定。
体验及原理猜测
百度号内容主要为图文混排内容,Vidpress会对文字进行TTS的处理,然后首先优先会使用混排中的图片,同时根据文字内容去外部再获取一些配套的图片用于丰富展示。但这个外部自动获取是有一定概率问题,比如我的测试影片,在第三、四段有关电商直播、泰森复出影片中,外部图片调用的非常顺畅合理,总体感觉还比较舒适。但第一段不知是否是文字内容原因,配套内容有些莫名其妙。第二段总体因为内容中的图片本来就比较多,所以看不出外部调用,但在关键人物上自动加上了字幕。
测试影片
第一部 图片配的莫名其妙
内容原有文案:
生成视频
第二部 基本上以原文配图为主,但自动对主体做了字幕标注
内容原有文案:
生成视频
第三部 广泛的引入了外部图片和视频
内容原有文案:
生成视频
第四部 广泛的引入了外部图片素材
内容原有文案:
生成视频
测试后话
相比较以前在油管等渠道上看到直接整片文字的TTS朗读来说,配了图片的视频感受上确实好了很多,从操作角度也只是简单的给一个源地址就可以,如果用于内容的批量化生产,变图文内容为视频,是一种非常便捷的方式。
目前测试情况看,素材库由于用的多为百度图库等免费免版权资源,质量上还是有些欠缺,如果可以把这个做成私有云能力,叠加一些企业做的收费资料库,估计整体体验会好很多。由于测试阶段限制了输入图文信息的来源,如果再开放一点范围,或者可以自己上传文章,可能测试会更有意思。
话说以后逐步剪辑师是不是会下岗呀!
奔四老宅男
去看看
校验提示文案
奔四老宅男
去看看
校验提示文案
奔四老宅男
去看看
校验提示文案
奔四老宅男
去看看
校验提示文案