继谷歌和Meta后,阿里达摩院上线文本生成视频大模型
封面新闻记者 吴雨佳 欧阳宏宇
这波AIGC(利用人工智能技术来生成内容)的热潮,已经开卷视频了。近日,阿里达摩院低调地在魔搭社区(ModelScope)放出了"文本生成视频大模型"。
据了解。目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。
记者发现,这个模型目前已经开放给用户试玩,只要输入一些简单的描述词,就可以看到生成的视频效果。比如输入"A panda eating bamboo on a rock",就可以看到一只大熊猫坐在岩石上吃竹子的画面。
不过,目前这个模型还不支持中文输入,而且生成的视频长度多在2-4秒,等待时间从20多秒到1分多钟不等,画面的真实度、清晰度以及长度等方面还有待提升。
不止是阿里达摩院,总部位于纽约的人工智能初创公司Runway也发布了一种从文本到视频转化的AI模型Gen-2。上个月,这家曾参与创建Stable Diffusion的公司推出过模型Gen-1,能通过文本提示或参考图像指定的风格,将现有视频转化为新视频。比如将"街道上的人"变成"粘土木偶",只需要一行提示词。
早在去年,谷歌和Meta都展示了各自在文本转视频上的尝试,利用AI生成泰迪熊洗碗和在湖上泛舟等视频。但这两家公司都没有宣布将相关技术推进到研究阶段以外的计划。
不过,从目前此类模型生成视频的等待时间,画面的真实度、清晰度以及长度等各方面来看,距离产出令人满意的视频还有很大距离。
【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料QQ:3386405712】
个体工商户,没有员工,还需要交社保吗?没有雇工的个体工商户,交不交社保由自己说了算,没有强制性。按照社保法的要求,在我国境内注册的法人单位,再注册后的三十天内依法办理社保登记,应当在员工入职三十天内办理社保登记。办理登
什么工作看起来高大上,其实工资特别低?环卫工人,我们的城市美容师。没有他(她)们的辛苦劳动哪来的清洁文明城市,这些工人做的是高大上的工作。人们感谢他们!当然是公务员。一说起公务员人们都是竖大拇指,以为公务员就都是领导干
有的人自己拿着几千块钱的工资还要给网红刷礼物,为什么?追星人特有的本能。一般来说女网红是比较会忽悠的,由于父母亲给了她一个好脸蛋好身材,把爱美的网友(粉丝)吸引到身边。在快手里面也常看到网红(名人)带货的,她也没有新鲜的东西表现出来,
连衣裙短了该怎么办?如何补救?我是时尚问答达人Sandy,从事服装设计搭配工作十余年,关注我了解更多接地气的时尚。相信很多妹子都碰到过这种情况,无论是因为当初一时眼馋买下,或是朋友送的,再或是放在衣橱的某个角落
人60多岁是不是每年需要冲2次血管?冲血管对不对?天气逐渐转凉,已经进入深秋季节了,很多老年人又要去医院输液通血管了。人到老年,确实是心血管疾病的高危年龄段,但真的需要每年输输液,通通血管吗?虽然辟谣过很多次了,但今天还是忍不住要
要出狱的犯人,在最后一个月的监狱生活是怎样的?在监狱即将被刑满释放的犯人在最后一个月是最难熬的,尤其是在监狱服刑时间较长的犯人这最后一个月对于他们而言简直就是一种煎熬。早在八九十年代,我曾在东北某老改支队(监狱)从事犯人的管理
为什么汉奸们都喜欢骑自行车?而日本军人却在地上跑?在日本帝国主义侵略中国的时候,为什么汉奸们都是骑着自行车,而日本鬼子却是在地上跑呢?这个问题有以下几方面的原因一是汉奸们大多是没有经过军事训练的,他们徒步行军的能力是不行的,所以每
爱吃螺蛳粉是一种什么体验?你好,螺蛳粉是现在我们小区团购最畅销的食品。正所谓萝卜青菜,各有所爱,有人接受不了螺蛳粉霸道的臭味,也有人对螺蛳粉爱到不行。如果你也喜欢吃螺蛳粉,那么,螺蛳粉的酸臭味在你看来就是一
都是商业的领军人物,你们怎样评价联想的柳传志和华为的任正非呢?有人做企业,为国家计,为人民计。联想干了啥?老百姓得了什么好处?国家得了什么好处?一个人不为国也不为民,这人活着再多的钱,,只是行尸走肉,得万人垂骂!我只能说他是个彻头彻尾的资本家
98寸大屏幕电视机选择什么牌子的好啊?现在大屏幕流行的爆款就要属TCL的超大板98寸Q6E智屏了。这款电视的超大屏幕绝对是看球赛,玩游戏,赏大片,追热剧的不二之选。纵观其他品牌的大屏产品,总是不能抓到大屏幕产品的核心。
南京森林警察学院就业前景怎么样?我是一枚警校小老师,喜欢警校警察的可以关注我。南京森林警察学院虽然是国家林业局主管,与公安部共建的警院,但其招生,和公安部直属警院没有区别,都是面向全国招生,招生要求基本一样。森林