范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

一句话生成视频AI爆火分辨率达到480215480,只支持中文输入,轮到国外网友学翻译了

  一周不到,AI 画师又"进阶"了,还是一个大跨步 —— 直接 1 句话生成视频 的那种。
  输入"一个下午在海滩上奔跑的女人",立刻就蹦出一个 4 秒 32 帧的小片段:
  又或是输入"一颗燃烧的心",就能看见一只被火焰包裹的心:
  这个最新的文本-视频生成 AI,是清华 & 智源研究院出品的模型 CogVideo 。
  Demo 刚放到网上就火了起来,有网友已经急着要论文了:
  CogVideo"一脉相承"于文本-图像生成模型 CogView2,这个系列的 AI 模型只支持中文输入 ,外国朋友们想玩还得借助谷歌翻译:
  看完视频的网友直呼"这进展也太快了,要知道文本-图像生成模型 DALL-E2 和 Imagen 才刚出"
  还有网友想象:照这个速度发展下去,马上就能看到 AI 一句话生成 VR 头显里的 3D 视频效果了:
  所以,这只名叫 CogVideo 的 AI 模型究竟是什么来头?生成低帧视频后再插帧
  团队表示,CogVideo 应该是当前最大的、也是首个开源的文本生成视频模型。
  在设计模型上,模型一共有 90 亿参数,基于预训练文本-图像模型 CogView2 打造,一共分为两个模块。
  第一部分先基于 CogView2,通过文本生成几帧图像 ,这时候合成视频的帧率还很低;
  第二部分则会基于双向注意力模型对生成的几帧图像进行插帧 ,来生成帧率更高的完整视频。
  在训练上,CogVideo 一共用了 540 万个 文本-视频对。
  这里不仅仅是直接将文本和视频匹配起来"塞"给 AI,而是需要先将视频拆分成几个帧,并额外给每帧图像添加一个帧标记。
  这样就避免了 AI 看见一句话,直接给你生成几张一模一样的视频帧。
  其中,每个训练的视频原本是 160×160 分辨率,被 CogView2 上采样(放大图像)至 480×480 分辨率,因此最后生成的也是 480×480 分辨率的视频。
  至于 AI 插帧的部分,设计的双向通道注意力模块则是为了让 AI 理解前后帧的语义。
  最后,生成的视频就是比较丝滑的效果了,输出的 4 秒视频帧数在 32 张左右。在人类评估中得分最高
  这篇论文同时用数据测试和人类打分两种方法,对模型进行了评估。
  研究人员首先将 CogVideo 在 UCF-101 和 Kinetics-600 两个人类动作视频数据集上进行了测试。
  其中,FVD(Fréchet 视频距离)用于评估视频整体生成的质量,数值越低越好;IS(Inception score)主要从清晰度和生成多样性两方面来评估生成图像质量,数值越高越好。
  整体来看,CogVideo 生成的视频质量处于中等水平。
  但从人类偏好度来看,CogVideo 生成的视频效果就比其他模型要高出不少,甚至在当前最好的几个生成模型之中,取得了最高的分数:
  具体来说,研究人员会给志愿者一份打分表,让他们根据视频生成的效果,对几个模型生成的视频进行随机评估,最后判断综合得分:
  CogVideo 的共同一作洪文逸和丁铭,以及二作郑问迪,三作 Xinghan Liu 都来自清华大学计算机系。
  此前,洪文逸、丁铭和郑问迪也是 CogView 的作者。
  论文的指导老师唐杰,清华大学计算机系教授,智源研究院学术副院长,主要研究方向是 AI、数据挖掘、机器学习和知识图谱等。
  对于 CogVideo,有网友表示仍然有些地方值得探究,例如 DALL-E2 和 Imagen 都有一些不同寻常的提示词来证明它们是从 0 生成的,但 CogVideo 的效果更像是从数据集中"拼凑"起来的:
  例如,狮子直接"用手"喝水的视频,就不太符合我们的常规认知(虽然很搞笑):
  (是不是有点像给鸟加上两只手的魔性表情包)
  但也有网友指出,这篇论文给语言模型提供了一些新思路:
  用视频训练可能会进一步释放语言模型的潜力。因为它不仅有大量的数据,还隐含了一些用文本比较难体现的常识和逻辑。
  目前 CogVideo 的代码还在施工中,感兴趣的小伙伴可以去蹲一波了~
  项目 & 论文地址:
  https://github.com/THUDM/CogVideo

1099元,乐视超级电视LeTVY32上架开售感谢IT之家网友疯狂土地神的线索投递!IT之家3月15日消息昨日晚间,乐融致新官方微博LeTV宣布,推出新款Y系列电视Y32,并于15日0时上架开卖。乐视TVY32采用32寸136谷歌获婴儿AI监控专利可追踪眼球,有异常立即提醒IT之家9月8日消息现在社会人们往往因忙于工作而缺乏对婴幼儿的照顾,而如果单独请护理人员又怕他们不负责而让自己的孩子受委屈。不过近日谷歌的一项发明似乎很有可能解决这一问题。据外媒C华为智能眼镜上架9月6日发售,1999元起IT之家8月20日消息先前在巴黎举办的华为P30系列发布会上,华为对外展示了一款同韩国眼镜公司GentleMonster合作研发的智能眼镜。当时GentleMonster的CEOH外媒上手华为WatchGT挺好IT之家10月17日消息华为昨晚在伦敦正式发布了旗下最新旗舰手机华为Mate20系列。期间华为还发布了华为智能手表华为WatchGT,现在已有国外媒体拿到该款手表,并做了简单的上手百度演示无人挖掘机,蓝翔怎么办?11月1日,2018百度世界大会上百度董事长李彦宏演示了百度将AI技术赋能挖掘机的成果。李彦宏在2018百度世界大会现场提问挖掘机技术哪家强,随后在视频中亮相的无人自主挖掘机令从1官方自曝小米全新路由器内测中可插SIM卡IT之家11月27日消息小米路由器已经很长时间没有发布新品了,今天晚间,小米生态链副总裁唐沐提前透露了小米路由器新品的消息。其在微博表示很多人问今年小米路由器还有没有新品,我爆个图外媒体验亚马逊智能微波炉自动帮你算热饭时间11月18日消息,据国外媒体报道,亚马逊最近推出了一款售价60美元的微波炉,你可以通过亚马逊的智能助理Alexa对其进行语音控制,但前提是你要拥有亚马逊的智能音箱Echo。这意味着小米手环3NFC版全面现货开售199元IT之家10月19日消息小米官方今日正式宣布,小米手环3NFC版全面现货,小伙伴再也不用担心抢不到了!小米手环3NFC版本采用了NXPPN80T安全NFC模块,增加支持城市公交一卡摇一摇加好友荣耀小K2儿童手表发布IT之家12月20日消息今天,华为商城上线了一款荣耀智能手表新品荣耀小K2儿童手表。荣耀小K2儿童手表针拥有魔法蓝甜心粉两个配色,采用了1。3寸TFT触摸屏,240240像素,支持赵明暗示荣耀智慧屏开机速度很快IT之家8月3日消息荣耀官方此前已经宣布荣耀智慧屏将在8月10日正式发布,近期荣耀总裁赵明多次在微博为其造势,继此前暗示荣耀智慧屏将没有开机广告后,今晚赵明再次在微博暗示其开机速度亚马逊首批送货机器人Scout上线外观呆萌,速度相当于步行北京时间1月24日消息,零售巨头亚马逊今天宣布,该公司正在华盛顿州斯诺霍米什县测试一款名为Scout的送货机器人。据悉,从周一至周五白天,亚马逊将在当地推出6个Scout机器人用于
<<<<<<>>>>>>
小米5月25日将推三款冰箱两门三门对开门IT之家5月22日消息今天下午,小米智能家电通过官方微博宣布将于5月25日的品质家电新享季推出三款冰箱,其中包括两门三门和对开门的冰箱产品。根据微博的信息来看,三款新品分别是第一款索尼5大系列电视中国发布Z8H系列8K电视最高售79999元IT之家3月31日消息索尼中国今天晚间以线上的形式召开了2020年春季电视新品发布会,索尼中国董事长高桥洋先生出席了发布会,正式公布了包括Z8H系列A8H系列X9000H系列X95OPPOWatch正式开售双曲面柔性屏支持eSIM,1499元起感谢IT之家网友长沙铺路分局的线索投递!IT之家3月24日消息OPPOWatch今日正式开售,41mm款售价1499元,46mm款售价1999元。OPPOWatch采用了1。91英超瑞士表业总和!苹果2019年AppleWatch出货量达3070万IT之家2月6日消息据外媒报道,市场调研公司StrategyAnalytics发布的最新研报显示,苹果2019年AppleWatch出货量达3070万,相较2018年的2250万台三星NEON官方网站上线,或与人工智人有关IT之家12月27日消息今天上午据NEON官方消息,三星NEON官方网站已经上线从官方暗示来看可能和人工智人有关。据了解,前几日三星STARLab发布预告,从预告内容来看这款产品的华为儿童手表3X强大的安全和学习功能,是核心竞争力距离春节还有不到一个月的时间,不知大家今年春节怎么过呢?小编发现,如今很多人会选择春节期间外出游玩。例如数据显示,去年春节期间全国旅游接待总人数4。15亿人次,同比增长7。6。忙碌小米手表宣布支持中国联通eSIM一号双终端,1月1日起可办理IT之家12月31日消息今日中国联通正式宣布,将于2020年1月1日起,在全国范围内陆续开展eSIM可穿戴设备一号双终端业务。对此,小米公司表示,小米手表成为首批获联通官方认证的智韩国电信推出韩国首个基于AI的大数据平台北京时间12月18日晚间消息韩国电信推出了韩国首个基于人工智能(AI)的大数据平台,为企业提供了访问广泛信息的渠道,包括人口统计数据和消费者消费趋势。这家韩国第二大运营商7月份被韩孙正义呼吁日本将AI设为大学招生必考科目,追赶中美北京时间17日消息,软银集团CEO孙正义周二表示,日本应将人工智能(AI)设为大学入学考试的必考科目,以应对与中美在这一新兴领域日益扩大的差距。孙正义在一次旨在促进创新的政府会议上人类粪便数据库建立人工智能研究志愿者便便照片北京时间12月17日消息,据英国每日邮报报道,目前,美国两家科技公司开展一项最新业务,建立人类粪便数据库,让志愿者们发送粪便的照片进行研究分析。美国两家公司合作开发了叫做Auggi广州一家机器人中餐厅开业,迎宾做菜等均为机器人完成IT之家1月15日消息近日在广州一家名为机器人中餐厅的特殊餐厅正式开业,从迎宾做菜等环节均为机器人完成。视频点此了解更多据了解,在这家机器人中餐厅里从迎宾做菜送餐等均为机器人完成,