范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

一句话生成视频AI爆火分辨率达到480215480,只支持中文输入,轮到国外网友学翻译了

  一周不到,AI 画师又"进阶"了,还是一个大跨步 —— 直接 1 句话生成视频 的那种。
  输入"一个下午在海滩上奔跑的女人",立刻就蹦出一个 4 秒 32 帧的小片段:
  又或是输入"一颗燃烧的心",就能看见一只被火焰包裹的心:
  这个最新的文本-视频生成 AI,是清华 & 智源研究院出品的模型 CogVideo 。
  Demo 刚放到网上就火了起来,有网友已经急着要论文了:
  CogVideo"一脉相承"于文本-图像生成模型 CogView2,这个系列的 AI 模型只支持中文输入 ,外国朋友们想玩还得借助谷歌翻译:
  看完视频的网友直呼"这进展也太快了,要知道文本-图像生成模型 DALL-E2 和 Imagen 才刚出"
  还有网友想象:照这个速度发展下去,马上就能看到 AI 一句话生成 VR 头显里的 3D 视频效果了:
  所以,这只名叫 CogVideo 的 AI 模型究竟是什么来头?生成低帧视频后再插帧
  团队表示,CogVideo 应该是当前最大的、也是首个开源的文本生成视频模型。
  在设计模型上,模型一共有 90 亿参数,基于预训练文本-图像模型 CogView2 打造,一共分为两个模块。
  第一部分先基于 CogView2,通过文本生成几帧图像 ,这时候合成视频的帧率还很低;
  第二部分则会基于双向注意力模型对生成的几帧图像进行插帧 ,来生成帧率更高的完整视频。
  在训练上,CogVideo 一共用了 540 万个 文本-视频对。
  这里不仅仅是直接将文本和视频匹配起来"塞"给 AI,而是需要先将视频拆分成几个帧,并额外给每帧图像添加一个帧标记。
  这样就避免了 AI 看见一句话,直接给你生成几张一模一样的视频帧。
  其中,每个训练的视频原本是 160×160 分辨率,被 CogView2 上采样(放大图像)至 480×480 分辨率,因此最后生成的也是 480×480 分辨率的视频。
  至于 AI 插帧的部分,设计的双向通道注意力模块则是为了让 AI 理解前后帧的语义。
  最后,生成的视频就是比较丝滑的效果了,输出的 4 秒视频帧数在 32 张左右。在人类评估中得分最高
  这篇论文同时用数据测试和人类打分两种方法,对模型进行了评估。
  研究人员首先将 CogVideo 在 UCF-101 和 Kinetics-600 两个人类动作视频数据集上进行了测试。
  其中,FVD(Fréchet 视频距离)用于评估视频整体生成的质量,数值越低越好;IS(Inception score)主要从清晰度和生成多样性两方面来评估生成图像质量,数值越高越好。
  整体来看,CogVideo 生成的视频质量处于中等水平。
  但从人类偏好度来看,CogVideo 生成的视频效果就比其他模型要高出不少,甚至在当前最好的几个生成模型之中,取得了最高的分数:
  具体来说,研究人员会给志愿者一份打分表,让他们根据视频生成的效果,对几个模型生成的视频进行随机评估,最后判断综合得分:
  CogVideo 的共同一作洪文逸和丁铭,以及二作郑问迪,三作 Xinghan Liu 都来自清华大学计算机系。
  此前,洪文逸、丁铭和郑问迪也是 CogView 的作者。
  论文的指导老师唐杰,清华大学计算机系教授,智源研究院学术副院长,主要研究方向是 AI、数据挖掘、机器学习和知识图谱等。
  对于 CogVideo,有网友表示仍然有些地方值得探究,例如 DALL-E2 和 Imagen 都有一些不同寻常的提示词来证明它们是从 0 生成的,但 CogVideo 的效果更像是从数据集中"拼凑"起来的:
  例如,狮子直接"用手"喝水的视频,就不太符合我们的常规认知(虽然很搞笑):
  (是不是有点像给鸟加上两只手的魔性表情包)
  但也有网友指出,这篇论文给语言模型提供了一些新思路:
  用视频训练可能会进一步释放语言模型的潜力。因为它不仅有大量的数据,还隐含了一些用文本比较难体现的常识和逻辑。
  目前 CogVideo 的代码还在施工中,感兴趣的小伙伴可以去蹲一波了~
  项目 & 论文地址:
  https://github.com/THUDM/CogVideo

小米大师系列电视真机首曝4KOLED屏,边框极窄感谢IT之家网友复活甲的线索投递!下午94149更新更多真机图曝光IT之家7月1日消息据酷安网友小夏数码爆料,小米即将发布的小米电视大师系列已经亮相线下实体店,图片显示该机边框极窄官方科普小米电视大师系列为什么采用OLED屏幕IT之家7月1日消息小米将于明天下午发布旗下首款超高端电视小米电视大师系列,该机将首次搭载OLED屏幕,对此,小米集团副总裁供应链负责人张峰科普了OLED屏幕的一些优点,一起来了解AI也能作曲!OpenAI神经网络能生成任何流派音乐5月14日,据外媒报道,人工智能(AI)技术生成的音乐会给人以非常奇妙的体验,这其中有两个原因第一,这是个非常吸引人的全新领域第二,我们真的不知道它会走向何方。然而,AI技术实际上IDC2019年人工智能基础架构市场规模达20。9亿美元,同比增长58。7国际数据公司(IDC)发布的人工智能基础架构市场(2019下半年)跟踪报告显示,2019年人工智能基础架构市场规模达到20。9亿美元,同比增长58。7。其中GPU服务器占据96。1大神用AI技术为百年前北京影像上色,效果惊艳IT之家5月9日消息昨天微博博主大谷Spitzer上传了一段他制作的用人工智能修复了100年前北京的影像的10分钟视频,火遍全网。据博主介绍,这则视频的来源是人民日报四年前发布的资华为手环B6正式开售腕上柔性屏蓝牙耳机IT之家8月6日消息华为手环B6于7月下旬正式发布。这款产品既是一款健康手环,又能变成蓝牙耳机满足通话需求,发售价999元起。IT之家了解到,华为手环B6采用了1。53英寸的柔性屏爆料人JonProsser曝光苹果AR眼镜大量信息搭载StarboardUI,499美元起感谢IT之家网友一头熊猫的线索投递!IT之家5月19日消息推特知名科技博主苹果爆料人JonProsser在最新发布的视频中曝光了苹果智能眼镜的大量信息,一起来了解一下。Prosse消息称苹果AR眼镜明年上市设计精美,不支持WiFi北京时间5月15日晚间消息,据国外媒体报道,国外知名的苹果产品爆料人乔恩普罗瑟(JonProsser)今日表示,苹果公司的增强现实(AR)眼镜AppleGlasses将于明年上市,一加首款智能手环官方预热,暗示发布临近IT之家1月4日消息上周爆料者Stufflistings放出了号称是一加首款智能手环的渲染图,现在一加已经开始对该手环进行预热,该公司现在已经证实,该手环将通过亚马逊在印度销售。如红魔手表多彩外观亮相五款配色表带,两款为皮革材质IT之家3月2日消息腾讯红魔游戏手机6将于3月4日1900发布,官方还将在发布会上推出一款穿戴类新品红魔手表。今日,中兴通讯终端事业部总裁努比亚技术有限公司总裁倪飞公布了红魔手表的小米米家无线吸尘器Lite发布1。2Kg超轻,售价499元IT之家11月19日消息小米近日推出了米家无线吸尘器Lite,兼顾轻巧与吸力,售价499元,将于11月20日10点开售。IT之家了解到,米家无线吸尘器Lite仅重1。2千克,应用轻
苏宁极物小Biu空调开售,前1万台秒售罄IT之家3月6日消息今日上午10点,苏宁极物小Biu空调正式开售,主打互联网智能体验,1。5匹一级能效全直流变频智能操控,前10000台售价1999元。根据苏宁公布的数据,享受19苏宁极物小Biu空调价格曝光前1万台尝鲜价1999元IT之家2月25日消息今日凌晨,苏宁极物小Biu空调开启0元预约活动,最终销售价2499元,预约用户可在3月6日上午1000开始付款抢购,前10000台到手价1999元。据介绍,苏全球首个中性AI声音推出不是男性也不是女性IT之家3月17日消息几乎所有的虚拟助手都有一个共同之处默认声音为女性。据TechCrunch消息,Vice传媒旗下的创意机构Virtue推出了一种无性别的AI语音,定名为Q。ViAI种黄瓜大赛微软第一,腾讯第二IT之家12月17日消息此前在荷兰瓦赫宁根大学及研究中心举行的一场黄瓜种植比赛中,微软研究院成员与荷兰和丹麦的大学生共同赢得这场比赛。据了解,这场比赛的选手包括腾讯英特尔园艺专家微人工智能乌托邦迪拜认为未来人类应该这样生活不同于硅谷老牌的科技力量,迪拜一直是独特的存在。他们日益崛起的科技实力正在被验证,无论是全面AI化的基础建设和城市治安力量,还是频频登上全球科技头条的机器人警察和空中出租车,迪拜试日本推3DCG美少女导航系统还会说中文IT之家10月18日消息上周NTTDoCoMo官方发布了一个Demo,展示了使用3DCG制作的女子高中生形象的导航系统。官方将这位少女命名为沙耶(Saya)。得益于精良的3DCG技唐沐小爱触屏音箱应该在米粉节正式开售IT之家3月13日消息今日,小米智能硬件部总经理唐沐thomas表示,小爱触屏音箱应该会在米粉节正式开售(4月6日)。在小米9发布会的最后,雷军发布了小爱触屏音箱,官方称4英寸屏迷出门问问发布TicWatchPro4G版智能手表1799元IT之家11月28日消息今天,出门问问发布了TicWatchPro4G版智能手表,TicWatchPro4G版售价1799元,12月1日正式通过出门问问官网天猫京东及全国各地线下小小米电视销量公布2018年第四季度稳居中国第一感谢IT之家网友学士的线索投递!IT之家3月1日消息根据群智咨询最新发布的数据显示,小米电视在2018年第四季度中国市场出货量达300万台,中国市场第一,同比增长112。更早之前,用户亚马逊智能音箱Alexa出bug,收到陌生人1700条语音北京时间12月20日晚间消息,据德国媒体报道,由于亚马逊的人为错误,导致德国一位Alexa智能音箱用户听到了另一名用户的1000多条录音。该报道称,一名德国用户要求回听Alexa智迷你版索菲娅机器人亮相,能教编程1月31日消息,据VentureBeat报道,超逼真的机器人索菲娅(Sophia)曾在许多场合露面,引发巨大轰动。如今,索菲娅的开发公司HansonRobotics推出了迷你版索菲