范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

别玩ChatGPT了,更酷炫的AI视频创作工具来了

  当我还在跟ChatGPT聊天时,AIGC圈子里已经刷起了新玩意儿——
  AI生成的乔布斯,他仿佛从画中醒来,对着镜头侃侃而谈ChatGPT,嗓音也颇似原声。
  据作者"汗青"介绍,视频中的文案选自于他与ChatGPT的对话,乔布斯的形象由AI作图工具Midjourney生成,AI拟声工具ElevenLabs提供了嗓音复刻,最后通过AI视频工具D-ID将图像转为视频。
  借助类似的AI工具,网友用"魔法"生成的纸片人都能动起来了,甚至还能轻松创造一个自己的数字分身。
  AIGC降低了创作门槛,越来越多的人正试图让AI参与内容创作,从文案、录制到配音、剪辑,几乎可以让AI全包了。据国外商业咨询机构Acumen Research and Consulting预测,若考虑下一代互联网对内容需求的迅速提升,2030年AIGC市场规模将达到1100亿美元。
  近年来,AI对话、AI绘画、AI语音技术其实都有一定的发展,而相对来说,视频领域的AI模型研发和应用才起步不久。像D-ID这样仅需一张静态图片就能创建虚拟人视频的技术,属实令人惊奇。
  目前国内外有哪些AI视频创作工具?AI又将给视频内容生产和交互体验带来什么改变?本文对此进行了盘点和分析。
  AI拼接素材,套上模板秒出视频
  一般视频创作包括这些环节:写脚本/文案,拍摄视频或寻找第三方素材,剪辑素材,配音,配乐,添加转场、特效、字幕、标题、封面图等。
  其中,AI现在已经可以辅助完成很多任务了,比如图文智能匹配视频素材、AI自动剪辑、AI抠像、AI换脸、画质优化修复。
  "图文成片"的功能在各平台推出的剪辑应用中十分常见,抖音的剪映、快手的快影、百度的百家号、B站的必剪都支持根据文案,一键拼接图片和视频素材,并同步生成字幕和配音。
  输入的文案可以参考AI助手的回答。举个例子,"养猫会对一个人产生什么影响",ChatGPT回答说养猫能减压缓解焦虑、增强社交能力、提高心理健康、增加运动量,我们可以在此基础上进行修改再导入剪映。
  剪映不到一分钟就自动生成了视频,画面跟文案内容基本符合。如果对素材不满意,比如想把静态图片换成视频,可以到在线素材库中搜索更合适的进行替换。
  值得注意的是,这些素材往往来源于网络或第三方服务,比如免版权图库Unsplash、Pexels,AI剪辑应用所做的是通过AI和机器学习对文案进行语义分析,分镜头处理,智能匹配相应的画面。
  因此,一键图文成片对创作者最大的帮助是节省搜集素材的时间,减少人工剪辑劳动量,通过自动化、模板化的方式提高视频生产效率。
  类似的视频自动剪辑工具还有"Lumen5",主打长图文转视频,提供了大量视频模板,操作上门槛更低,像制作PPT一样拖曳文字即可转成画面。Lumen5自2017年推出至今,官网介绍已有超100万家企业客户将其作用于社交媒体营销和传播。
  图源Lumen5
  "vidyo"出自于印度的AI初创团队,支持长视频转短视频,通过AI语音识别技术可以从素材中自动剪辑出精彩片段,适用于直播视频切片、播客剪辑,不过目前视频语言仅支持英文。
  图源vidyo
  尽管目前视频创作软件的AI功能以文字匹配视频素材为主,但之后可能会加入更多AIGC工具。
  例如海外的AI视频工具"Fliki",擅长短图文转视频,输入Twitter等博客链接即可快速生成短视频,在图片素材上它还提供文字生成AI图像,由DALL·E提供技术支持。
  图源Fliki
  "Copydone"出自于国内AIGC初创公司,支持小红书、淘宝等各平台AI营销文案生成,同时也能根据文案自动生成配图或拼接视频。
  图源Copydone
  海外AI视频网站"QuickVid"集成了GPT-3、DALL·E 2等AI生成图文的能力,用户只需给定一个视频主题,剩下的都可以自动生成。不过它在二次编辑上的自由度和丰富性比较有限。
  图源QuickVid
  此外,视频创作中的特定需求也可以尝试用AI实现。比如AI修复老视频已有很多热门案例,历史资料、早年的影视片段都能通过"Video Enhance AI"等视频增强软件提升画质和分辨率。
  图源B站
  让照片说话,跨模态AI做到了
  现在的AI只能算是辅助视频创作的小助手,如果想要原创度更高、从无到有地快速创作视频还比较困难,但更强大的跨模态生成视频的模型(例如文字生成视频,图像生成视频)已经在路上了。
  文字生成视频,除了从已有素材库中拼接而成,实际上还有更接近于人类的工作方式,就像AI绘画模型一样学习文本和图像的抽象概念。
  2022年5月,清华大学曾联合智源研究院发布"CogVideo",这是国内首个开源的文本生成视频模型。在其Demo网站中,选择"青年女子在餐厅里喝奶茶"就可以看到AI生成的4秒视频,分辨率为480×480。
  图源CogVideo
  在设计模型上,CogVideo含94亿参数,将预训练文本-图像模型(CogView2)有效地利用到文本-视频模型,并使用了多帧率分层训练策略。
  CogVideo生成的32帧的4秒剪辑
  从技术本质上来看,视频就是一帧帧的连续图像,AI文字生成视频也可看作文字生成图像的一种延伸。大致原理就是通过文本生成几个单帧的图像,再用插值算法在几个帧之间绘制图像,生成前后连贯的视频。
  之前Disco Diffusion走红时就有玩家利用其动画模式生成2D或3D视频,由此也延伸出一些使用门槛更低、创作更简便的AI生成视频应用。
  比如AI视频网站"Kaiber",用户输入图像或文本描述,也可以从预设中选择几个词,就能快速生成4种视频结果。
  图源Kaiber
  近期美国流行摇滚乐队Linkin Park发布的新MV《Lost》,就是由Kaiber为其制作的动画。
  图源《Lost》
  不过目前跨模态生成视频的AI模型仍处于探索阶段,谷歌、Meta等大厂去年都发布了相关研究论文,只有演示案例,具体产品还未上线。
  据Meta官网介绍,"Make-A-Video"加速了文本到视频模型的训练(它不需要从头开始学习视觉和多模态表示),也不需要成对的文本-视频数据,却可以实现丰富的文字生成视频,图像生成视频(让单个图像或两个图像间动起来),以及改变原始视频的风格。
  图源Make-A-Video
  谷歌发布的"Imagen Video"和"Phenaki"也能实现类似以上的效果,并且Phenaki可以根据一系列提示生成2分钟以上的长视频。
  太空行走的烟花
  使用的提示:
  宇航员穿过火星上的水坑的侧视图
  宇航员在火星上跳舞 宇航员
  在火星上遛狗
  宇航员和他的狗看烟花
  图源Phenaki
  人工智能公司Runway曾参与构建了第一个版本的Stable Diffusion,最近他们又发布了一个新的视频生成器"Gen-1",即将开放内测,宣称可以把视频转换成任意风格。
  根据Gen-1官网演示,用户提供一张参考图,就能对原视频进行指定风格化的渲染,或者用文字指示修改视频中的部分素材,甚至还可以输出3D模型渲染和定制视频。
  图源Gen-1
  在AI生成3D短视频方面,近期国内的深氧科技完成了千万元级天使轮融资,引入GPT3.5、Transformer、Diffusion Model等AI技术红利,其发布的O3.xyz引擎V1.0版本支持一站式生成3D短视频内容,百万粉博主"特效卡卡西"等创作者已加入内测。
  可见跨模态AI生成视频正在加速发展中, "用嘴做视频",未来在短视频、影视、设计、游戏、电商等诸多行业都存在应用的可能。
  回到开头提到的"D-ID",生成数字人/虚拟分身也属于图像生成视频的一种类型,这类工具目前在企业培训和营销方面的应用案例比较多。
  2020年推出的AI视频创作产品"Synthesia"显示已有数千家公司在使用,用户可以从现有演员库中选择或上传自己的视频来创建AI形象,然后输入脚本,让AI配音、拼接素材就能输出视频了。
  图源Synthesia
  Synthesia通过训练神经网络来达成逼真的合成效果,相比传统视频制作来说,减少了真人出镜录制等环节,能节省制作费用和周期,而且能一键生成多国语言的视频,便于本土化服务。因此,企业多用于大规模生成员工培训、产品入门演示、市场营销等视频。
  D-ID则在更早以前就开始研发图像处理技术,曾与MyHeritage合作推出"深度怀旧"计划而闻名,借助AI工具,用户可以让已故亲人的静态照片变成栩栩如生的动态视频。
  最近乘着ChatGPT的热潮,多种AI工具组合制作的视频被更多人看见了,D-ID的体验门槛较低,即使是不懂视频创作的新手,只要上传一张图片,几分钟内就可以生成有人物解说的视频。
  图源D-ID
  D-ID自动为人物添加了一系列面部动作,会模拟一些轻微的头部运动,不过有时表情显得有点怪异,太逼真的照片可能会令人产生"恐怖谷"的反应。
  同时,用户无法上传涉及政治、性、犯罪、名人、歧视性图像,D-ID会提示违规风险。这意味着AI生成视频技术同其他生成内容一样会面临版权、伦理等问题。
  下一波AIGC浪潮,我们如何应对
  去年Stability AI的CTO Tom Mason曾判断,继文字生成图像后,下一波浪潮肯定是视频、音频和3D。
  当AI可以写文章、画画、做视频,试图包揽大部分创作任务时,人类接下来该做什么呢?
  这里仅谈谈我的思考,首先技术人员可以继续开发和完善AI模型。在TikTok的官网上,已经挂出了AIGC方向机器学习工程师的招聘需求。
  图源TikTok Career
  TikTok表示,"AIGC最近的突破使我们相信可以将AIGC技术用于商业目的,尤其是创意制作。想想AI生成/辅助的广告创意脚本,甚至是AI生成的商业图像和视频,它们将永远改变创意制作行业。"
  当下的AI视频模型还不能很快生成像AI绘图那样高质量的作品 ,比如存在视频模糊、动作不自然、缺少细节等问题。但随着国内AIGC的技术发展,相关场景应用生态可能有很大的想象空间,包括上文提到的一些AI技术公司目前已经开始提供付费服务了,为个人和企业有针对性地提高内容生产效率。
  对于内容创作者来说,与其担忧会不会被AI取代,不如去学习认识和使用AI工具,让AI代替重复性的琐碎工作,将更多时间花在自己的核心优势上,产生更高质量的内容。
  的确有了AI的加入,内容竞争会愈发激烈。有创作者说D-ID出现后,"所有念稿式、新闻播报式的纯搬运类视频都将受到巨大冲击"。
  从用户角度出发,我想只要是高质量内容,即使是AI批量生成的又如何?我们担忧的其实是低质内容的泛滥。
  平台和用户都需要避免AI被滥用,比如生成虚假、仇恨、歧视或有害的内容,甚至是引发诈骗等犯罪行为。谷歌曾提到出于安全和伦理的考虑,在Imagen Video的内部试验中应用了输入文本提示过滤和输出视频内容过滤,但目前仍存在重要的相关风险,暂时不会发布两个视频生成模型的代码或Demo。
  总之,AI技术一方面大大降低了从文本到视频内容创作的门槛,另一方面AIGC也推动着内容行业革新,目前至少能达到一定程度的降本增效,但发展初期还未建立起新的规则和秩序,最终如何改变行业还得看人的作用。
  P.S.:本文提及的 部分AI视频工具网址 ,可以关注"  新榜  ",在公众号对话框回复"  AI视频  "获取。

知乎自制综艺站内播放破亿,站外无人知晓图片来源视觉中国文文娱价值官,作者丨风间,编辑丨刘娜娜作为一名资深用户,文娱价值官刚刚得知一档从未听说过的知乎自制综艺播放量破亿,不禁对知乎的综艺尝试心生好奇。当抖音B站小红书百度资治通鉴里的职场智慧关键岗位请远离精致的利己主义者公元前361年,魏国年迈的老相国公叔痤病危,魏文侯的孙子魏惠王前去探望公叔痤,询问其他走之后谁人能担任相国这一重要职位,公叔痤向魏惠王推荐了自己一个年轻的门客商鞅,且叮嘱魏惠王要重东莞观音山将于11月5日举办108万观音山上观山水品妙联座谈会10月23日,广东观音山国家森林公园(以下简称东莞观音山)再发英雄帖,宣布将于2022年11月5日举办108万观音山上观山水妙联品鉴座谈会,诚意邀请广大楹联家及楹联爱好者积极报名踊人生经历风雨熬过去就会变好寻找小组生活家真正的人生,每一步都有荆棘,只要走过去,才会慢慢变得好起来。表哥是一个公司职员,一次车祸变成坐轮椅的人。由于颓靡精神也出现了问题。一个人的变化,其实是意志不够坚强,在普京亲自坐镇指挥,俄罗斯向美国亮出核武三板斧北约和俄罗斯的核演习有多危险俄防长俄军进行大规模核打击演习文君剑据环球时报等报道,俄罗斯已经举行大规模战略核演习雷霆2022,俄总统普京亲自坐镇指挥室,指挥了此次演习过程。(普京坐曝冯小刚夫妇定居美国,穿搭随意豪宅会客,购买两套别墅价值上亿饿了吗?戳右边关注我们,每天给您送上最新出炉的娱乐硬核大餐!10月27日,有网友曝光了冯小刚夫妇在美国的近况,称他们已经在美国定居,此事引发了大家的热议。该网友称冯小刚的作品都很经微信长按2秒还有这么多隐藏功能学会受益无穷如果说手机每天必用的APP是哪个?对于大部分小伙伴来说,微信肯定榜上有名。微信作为我们日常使用最频繁的社交软件,天天使用微信,但你对它的功能真的都了解吗?其实微信里还隐藏了许多你不多面手已上线三星GalaxyZFold4再成业界标杆如今,折叠屏手机在生活中的出镜率越来越高,作为折叠屏手机领域的领潮者,三星今年秋季推出了三星GalaxyZFold4。作为三星第四代折叠屏机型,三星GalaxyZFold4凭借轻量如何确认现大盘的底部?确认底部的构成要素是什么?1大盘。大盘底部的确认,一般遵循确底的定律。大盘在2970点重要支撑位置处,出现一个缩量的有长上下影十字星见底形态后,今日跳空高开,按照确认底部的4要素定律,如出现一根大阳K线,吞睡个好觉可太值钱了!睡眠经济兴起,哄睡师每小时收费可达400元据上海新闻广播消息,睡个好觉,天都蓝了!但越来越多人正在经历失眠。记者从百度指数了解到,自10月3日至10月9日以来,失眠睡不着有什么好的方法词条搜索呈上升趋势。睡眠神器在睡不着的全球公共债务创二战以来峰值,世界将走向何方?文丨(德)克劳斯施瓦布(法)蒂埃里马勒雷本文摘自作者新书大叙事构建韧性公平和可持续的社会。作者施瓦布,系世界经济论坛创始人马勒雷,每月晴雨表管理合伙人。文章仅代表作者观点。界面新闻
发掘红色资源,助推乡村振兴邓德辉第1239期广德位于安徽省东南部,皖苏浙三省八县市交界处,古称桐汭,置县已有1800余年历史。区域面积2165平方公里,人口52万,下辖9个乡镇,136个村(社区)。近年来,2022年美国乡村音乐协会颁奖典礼众多明星女歌手红地毯一览第58届美国乡村音乐协会颁奖典礼于2022年11月9日在美国纳什维尔市举行,乡村音乐界的众多知名女歌手明星都参加了这场典礼活动,特别是穿着她们那漂亮的礼服走红地毯,更值得一看。凯蒂画里乡村安徽黟县从量变到靓变安徽黟县秋景图方龙摄中新网安徽黟县11月8日电题画里乡村安徽黟县从量变到靓变作者何彦铭11月3日一5日,安徽省黄山市黟县县委书记程寄县带队赴上海开展双招双引工作,先后到中产集团康师组图数十万的候鸟到广州南沙湿地过冬到南沙湿地过冬的候鸟(央广网发南沙湿地供图)央广网广州11月9日消息(记者夏燕)近日,在广州最南端的南沙湿地景区,又迎来了数十万的候鸟栖息过冬。记者了解到,来南沙湿地过冬的候鸟数量上新了,武昌暖冬时节走在武昌城内微风拂面时并不觉得有寒意这样温暖的季节中武昌又上新了一起来看看吧!01hr武昌生态文化长廊里绿皮火车头成为新打卡点旧车厢改造而成的餐厅与咖啡厅为餐饮提供了更多情甘肃靖远北城滩疑云甘肃靖远县西北部的双龙镇,隔黄河同景泰县五佛乡毗邻,在历史上,特别是隋唐时期,丝绸之路的北线在此经过,形成了两大著名的渡口乌兰津和白卜渡,熙来攘往的戍卒和商队,以及西域各国的使节臣创新旅游模式深得游客青睐,延安红街能满足不同人群的旅游需求文化是一个国家一个民族的灵魂,红色文化是我们的优良传统和宝贵的精神财富,弘扬红色文化还要高度重视新一代的教育引导,加强学习革命历史传统文化,这样才能够正确树立人生价值观。延安红街就赏秋倒计时这条梧桐大道火遍朋友圈,再不来打卡就要等明年啦拍摄者谢岫松遵义的秋天比其他城市要慢半拍,立冬刚过,红城的秋意正浓,银杏梧桐红枫次第变色。天高气爽,让人无法好好待在室内,总想出去走走,才不错过这一期一会的秋景。今天就跟着小编,打迪拜回内地最全流程资料准备1。登机前48小时内,双核酸检测阴性证明,核酸检测不再指定机构,两次检测遵循交叉检2。经迪拜中转的乘客需要入境做核酸,在迪拜至少呆,提前预约好酒店,准备好始发国的健康码。31950年那个凛冬我穿越三八线(45)指导员没死还获知美军的弹药库多年后,在南京第二十离休干部的休养所里,老兵林凯旋找出了他保存的从抗美援朝战场上带回来的东西两枚勋章一等功臣奖章和一级自由独立勋章以及一些战场上拍的旧照片。他颤巍巍来回走着,急迫地算无遗策的毒士贾诩,真就毫无底线吗?东汉末年诸侯争霸,这是一个战火纷争,但也是一个充满魅力的时代。这个年代涌现出了很多非凡的英雄人物,他们推动天下形成魏蜀吴平分天下的局面,开启了新的历史篇章。提到英雄人物,很多人想到