当前位置：

社区首页

电脑数码

软件应用

文章详情

百度视频黑科技 Vidpress体验

背景

2020年4月20日，百度研究院宣布已孵化出业界首个支撑通用型、大规模生产的智能视频合成平台VidPress。号称可以通过一段图文信息自动生成为一段视频。

《百度研究院宣布孵化出首个智能视频合成平台VidPress》

因为日常剪辑也会遇到很多文字稿配画面的困惑，所以立刻网上搜索后在“百度大脑”的“智能创作中心”找到了测试申请入口，因为我只是属于一个个人爱好者，抱着试试看的心态，提交了信息。原本这件事情也就结束了，因为之后没有得到任何反馈，我还猜想百度嫌弃我个人爱好者拒绝了我的申请。

神奇的事情发生了，今天接到了北京百度公司来的电话，询问我Vidpress的使用体验，重新找到入口页面发现居然开放给我测试了，于是立刻开始上手测试一下这个黑科技。

测试流程

目前因为还是测试阶段，所以界面还比较简单，不过好在提供了页面手工生成的提交入口，省去了使用API方式开发的繁琐。但第一阶段的内容必须是百度号发布的内容，并且似乎只能是官方内容，如果是个人百度号发布出来内容会由于域名不一致而拒绝提交。

当选定了一个百度号的内容后，选择朗读文字内容配音，可以选择男声或女生，设置一下预计时长，点击“生成视频”就可以了。

一般一个节目生成大约需要15分钟左右，看当时运算的繁忙程度而定。

体验及原理猜测

百度号内容主要为图文混排内容，Vidpress会对文字进行TTS的处理，然后首先优先会使用混排中的图片，同时根据文字内容去外部再获取一些配套的图片用于丰富展示。但这个外部自动获取是有一定概率问题，比如我的测试影片，在第三、四段有关电商直播、泰森复出影片中，外部图片调用的非常顺畅合理，总体感觉还比较舒适。但第一段不知是否是文字内容原因，配套内容有些莫名其妙。第二段总体因为内容中的图片本来就比较多，所以看不出外部调用，但在关键人物上自动加上了字幕。

测试影片

第一部图片配的莫名其妙

内容原有文案：

《吉林市：前往外地须持两天内核酸阴性报告，方可登记出城

生成视频

第二部基本上以原文配图为主，但自动对主体做了字幕标注

内容原有文案：

《窦靖童晒与王菲合照，母女俩罕见同框，笑容灿烂画面温馨》

生成视频

第三部广泛的引入了外部图片和视频

内容原有文案：

《53岁泰森晒最新训练视频高调宣布复出：我回来了》

生成视频

第四部广泛的引入了外部图片素材

内容原有文案：

《留给直播电商的时间不多了》

生成视频

测试后话

相比较以前在油管等渠道上看到直接整片文字的TTS朗读来说，配了图片的视频感受上确实好了很多，从操作角度也只是简单的给一个源地址就可以，如果用于内容的批量化生产，变图文内容为视频，是一种非常便捷的方式。

目前测试情况看，素材库由于用的多为百度图库等免费免版权资源，质量上还是有些欠缺，如果可以把这个做成私有云能力，叠加一些企业做的收费资料库，估计整体体验会好很多。由于测试阶段限制了输入图文信息的来源，如果再开放一点范围，或者可以自己上传文章，可能测试会更有意思。

话说以后逐步剪辑师是不是会下岗呀！

展开收起

+1 1 1 2

奔四老宅男

在IT混迹的宅男，喜欢在家倒腾各种电子产品。

12文章| 1爆料| 74粉丝

关注

2评论

精彩
最新

奔四老宅男

作者

举报

最后一个视频好像发布后漏了
去看看

2020-05-14

该评论被折叠

取消点踩展示评论

回复

校验提示文案

提交
奔四老宅男

作者

举报

最后一个视频漏了
去看看

2020-05-14

该评论被折叠

取消点踩展示评论

回复

校验提示文案

提交

奔四老宅男

作者

举报

最后一个视频漏了
去看看

2020-05-14

该评论被折叠

取消点踩展示评论

回复

校验提示文案

提交
奔四老宅男

作者

举报

最后一个视频好像发布后漏了
去看看

2020-05-14

该评论被折叠

取消点踩展示评论

回复

校验提示文案

提交

提示信息

取消

确认

评论举报

垃圾广告！低俗色情！人身攻击！疑似水军评论！其他有害！

相关文章推荐

老旧笔记本别扔！AnduinOS系统吊打Win11，全中文免驱动，很丝滑

相信不少人家中都有台使用了十年以上的老旧笔记本：继续用 Windows 吧，系统越更越臃肿... 阅读全文

+1 50 557 60
永不言弃的玩客云，有了自己的“新魂”：有亮点，也有坑

如题，世纪最强矿渣玩客云又出新系统了，这回终于得到了“正名”——WanOS！专属教程网站同... 阅读全文

+1 37 347 35
让 AI 替你搬书：WorkBuddy 批量下载电子书实战

收藏电子书这件事，一旦入了坑，就再也停不下来。香港中文大学出版社的开放图书、Springe... 阅读全文

+1 32 363 10
微软终于认了：Win11存在存储Bug，7月14日才修复，现在教你自救

有没有很多朋友和我一样？明明没下载大型软件、没存高清视频，日常也定期清理垃圾，但Win11... 阅读全文

+1 27 245 29
老旧笔记本别换 AnduinOS碾压Win11，全中文免驱动，老机流畅起飞

相信不少人家中都压着一台吃灰的老旧笔记本、台式机，大多都是用了十年左右的老设备，扔了可惜、... 阅读全文

+1 24 175 15
“华为天才少年”吐槽DeepSeek，但他说的话就一定对吗？

前华为“天才少年”李博杰公开分享了一段DeepSeek面试经历，引发了不少讨论。按照他的描... 阅读全文

+1 32 63 101
DeepSeek 官方也推荐的 Deep Code 是什么

DeepSeek 官方 API 文档收录了一款叫 Deep Code 的开源终端 AI 编... 阅读全文

+1 25 155 15
实战 WorkBuddy+反爬+爬虫固化 Skill，6大能力搞定浏览器自动化

AI Agent 时代，最大的资源是什么？信息，信息，还是信息。别人的 Agent 可以抓... 阅读全文

+1 20 171 5
突破苹果限制！usbliter8漏洞降级iOS15，这些机型全系可用

很多手持老旧iPhone的用户，一直被系统更新困扰。新系统越更越卡、耗电越来越快，偏偏苹果... 阅读全文

+1 8 70 16
WPS会员VS免费平替！OCR工具实测对比，职场人看完不再纠结

职场人最头疼的场景之一，就是收到一份扫描版PDF后还得手动敲文字。WPS会员的OCR功能口... 阅读全文

+1 5 85 4
老笔记本别扔！装上这个免费系统，10年老机也能流畅如新

家里那台用了七八年甚至十几年的老笔记本，开机要等一两分钟，随便开两个网页就开始转圈，Win... 阅读全文

+1 7 72 0
USBOS V3.0：装机师傅都在偷偷换的PE工具，强在哪？

你是不是也遇到过这种情况：拿着用了三年的微PE启动盘，插到新买的笔记本电脑上，结果直接黑屏... 阅读全文

+1 11 60 1
腾讯 WorkBuddy 入门指南：更适合国人体质的 Codex，真的能替我干活

如果说，过去的 AI 聊天机器人更像一个坐在聊天框里的顾问，主要负责回答问题、总结资料、改... 阅读全文

+1 6 49 1
微信小爱官方互通来了！语音发消息不违规，但版本要求很严

这次更新和以前有什么不同？以前想让小爱发微信消息，用的是模拟点击屏幕那套——相当于有只无形... 阅读全文

+1 4 27 4
分享WorkBuddy+蚁小二 CLI，全平台自媒体，从创作到运维都打通了

前段时间我自己在做全平台的媒体运维工具，可以说是边做边改，边改边用。但这个过程很费脑子，而... 阅读全文

+1 4 26 3
WPS官方故意藏起来的免费功能！PDF转换/OCR/去水印全白嫖，别再傻傻充会员了

打开WPS，先弹会员续费框，转个PDF又弹出付费提示，正等着干活呢，广告弹窗直接占满半个屏... 阅读全文

+1 1 32 0
C盘爆红真凶是WPS和Edge！免费清20-30G不用开会员，官方回应了

C盘又红了？十有八九是WPS和Edge在背后偷偷吃空间。WPS默认把云文档本地缓存、定时备... 阅读全文

+1 1 27 0
Win11终于认了！Win11 偷偷吃掉 500G，3 步立刻清回空间

C 盘莫名爆红的朋友注意，这次真不是你乱装东西的锅。微软官方刚实锤，Win11 藏着一个磁... 阅读全文

+1 5 19 1
Win11全球占比70%了！但Linux开机仅1.5GB内存、续航17小时，差距有点大

Windows仍是桌面老大，但Linux已不是小白专属2026年6月数据显示，Win11在... 阅读全文

+1 3 8 13
等等党警惕速胜论，全球最大数据中心项目被叫停了

前不久的新闻是，AI算力军备竞赛正酣。这个规划占地2100英亩、拟建37栋数据中心大楼、总... 阅读全文

+1 8 9 5

更多精彩文章

荣耀MagicOS 11首发YOYO Next：AI能直接操作App

快科技7月13日消息，博主旺仔百事通爆料，荣耀打造的YOYO Next将支持App操控、复... 阅读全文

+1 0 0 0
公众号助手有什么工具推荐？有一云AI把发布前检查变成一套流程

一篇公众号文章写完，并不代表可以直接发布。真正进入发布阶段后，还要检查标题层级、段落间距、... 阅读全文

+1 0 0 0
美团雪糕融化必赔藏猫腻：15分钟倒计时有陷阱，赔的还不是钱

夏天点外卖买雪糕，最怕的就是送到时已经化成糊。2026年冰品节期间，美团闪购推出"融化必赔... 阅读全文

+1 0 0 0
基于亚马逊API的批量主图翻译实现方案

一、问题背景做过跨境电商的朋友都知道，主图是Listing的灵魂。一条Listing的点击... 阅读全文

+1 0 0 0
TikTok Shop批量详情页翻译实现指南

一、问题背景做过TikTok Shop运营的朋友应该都体会过这个场景：店铺里几百上千个商品... 阅读全文

+1 0 0 0
豆包输入法鸿蒙版开启招募：支持9键/26键！豆包同款语音识别能力

快科技7月13日消息，字节跳动旗下豆包输入法正式开放鸿蒙专属版本内测招募，适配Harmon... 阅读全文

+1 0 0 0
工作室扩到12人后文件管理怎么办——捣腾了一圈实际体验记录

一、背景大家好，最近工作室从几个人扩展到十几个人，文件管理的问题一下子凸显出来。方案改了好... 阅读全文

+1 0 0 0
TikTok Shop商品图翻译Python实现指南

一、问题背景做TikTok Shop跨境的卖家应该都有这个体验：要把国内的商品搬到海外店铺... 阅读全文

+1 0 0 0
C盘清理工具深度清理释放空间好用

软件介绍今天带来的第二款叫LightC，是一款C盘清理工具。C盘清理工具之前推荐过CCle... 阅读全文

+1 0 0 1
这波操作太值了：「首助编辑高手」批量提取段落，告别重复劳动

日常办公、文案整理、资料汇总过程中，我们经常需要从多篇TXT文档、文本文件中，批量提取指定... 阅读全文

+1 0 0 0
跨境商品图片AI翻译实现指南

一、问题背景做跨境电商的朋友应该都有同感：商品图片的多语言处理，是个让人头疼的硬骨头。我自... 阅读全文

+1 0 0 0
Python实现Temu商品图批量AI翻译教程

一、问题背景做跨境电商的同行应该都深有体会：上架商品时，图片处理是最繁琐的一环。特别是像T... 阅读全文

+1 0 0 0
速卖通批量跨境翻译API集成实战

一、问题背景做速卖通的卖家朋友们肯定深有体会——商品上架最耗时的环节不是拍照修图，而是商品... 阅读全文

+1 0 0 0
手把手教你用“首助记账本”搞定借还款，再也不怕朋友间算错钱

一、功能简介：告别私人借贷糊涂账日常和亲友、同事产生资金借贷往来，随手记录很容易混乱，久而... 阅读全文

+1 0 0 0
鸿蒙6.1.0更新后两极分化？有人丝滑像换新机，有人后悔升级

华为最近向大量机型推送了鸿蒙OS 6.1.0.130版本更新，安装包从1GB到4.6GB不... 阅读全文

+1 0 0 0
录屏软件怎么选？按需求对号入座，少走弯路不踩坑

录屏这件事，说大不大说小不小。偶尔录个会议、做个教程，懒得折腾的人随手打开系统自带功能就对... 阅读全文

+1 0 0 0
注册公司核名总驳回？AI工具把数天流程压到几十秒，通过率实测数据亮了

注册公司时卡在核名环节反复驳回，是很多创业者都经历过的糟心事。好不容易想出的心仪字号，提交... 阅读全文

+1 0 0 0
2026三款主流云手机盘点：各有所长，按需选择不踩坑

进入 7 月暑期，云手机的选购需求迎来一波高峰。市面上的产品越来越多，很多人挑花了眼，不知... 阅读全文

+1 0 0 0
多开云手机怎么选不踩坑？一文教你选稳定不掉线的靠谱产品

市面上主打百台多开的云手机越来越多，很多用户只看宣传页上的最大多开数就下单，实际用起来才发... 阅读全文

+1 0 1 0
丰巢保险弹窗泛滥？3步彻底关掉它，亲测有效！

丰巢取件弹窗关不掉？教你3步彻底屏蔽保险广告取件扫码弹出广告？别急着点任何按钮扫码后弹出的... 阅读全文

+1 0 0 0