范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

AI跳舞哪家强?谷歌3D舞者闻歌起舞,挑战DanceNet

  这次,Transformer 参与了舞蹈生成任务。
  在艺术领域,AI 有着各式各样的应用,如 AI 生成音乐、AI 绘画。
  跳舞,也是 AI 努力学习的一种能力。
  此前,以音乐的风格、节奏和旋律作为控制信号来生成 3D 舞蹈动作的 DaceNet 曾红极一时。
  如今,DanceNet 迎来了新的挑战者——来自谷歌的最新研究 AI Choreographer:给定一段 2 秒的指导动作,AI 模型可以按照音乐节奏生成一长段自然的舞蹈动作。
  生成的舞蹈效果是这样的(遗憾的是动图没有声音):
  而和 DanceNet 这些同类研究相比,谷歌新方法的效果更为明显。左边两种方法生成的舞蹈动作像「抽风」,该新方法则更加流畅自然:
  值得注意的是,这还是一个基于 Transformer 的模型。
  论文地址:https://arxiv.org/pdf/2101.08779v1.pdf
  项目地址:https://google.github.io/aichoreographer/
  下面让我们看下论文细节:
  通过编排与音乐节拍一致的动作模式来跳舞是人类的一项基本能力。舞蹈是所有文化中的通用语言,如今,许多人在多媒体平台上通过舞蹈来表现自己。在 YouTube 上最受欢迎的视频是以舞蹈为主的音乐视频,例如 Baby Shark Dance、江南 Style,在互联网信息传播中,舞蹈成为强大的传播工具。
  然而,舞蹈是一种艺术形式,即使是人类,也需要专业培训才能使舞蹈演员掌握丰富的舞蹈动作曲目,创造出富有表现力的舞蹈编排。从计算方面来讲更具有挑战性,因为该任务需要有能力生成一个连续的高运动学复杂度动作,捕捉与伴奏音乐的非线性关系。
  在这项研究中,来自南加州大学、谷歌研究院、加州大学伯克利分校的研究者提出了一个基于 transformer 的跨模态学习架构和一个新的 3D 舞蹈动作数据集 AIST++,该数据集用来训练一个生成 3D 舞蹈动作的模型。
  具体来说,给定一段音乐和一个短的(2 秒)种子动作(seed motion),本文模型能够生成一个长序列的逼真 3D 舞蹈动作。该模型有效地学习了音乐动作的相关性,并且可以生成不同输入音乐的舞蹈序列。研究者将舞蹈表示为一个由关节旋转和全局平移组成的 3D 动作序列,这使得输出可以很容易地迁移至动作重定向等应用,具体流程如下图 1 所示:
  在学习框架方面,该研究提出了一种新的基于 transformer 的跨模态架构来生成基于音乐的 3D 动作。该架构建立在已被证明对长序列生成特别有效的基于注意力的网络 [15, 62, 3, 71]上,并从视觉和语言的跨模态文献 [71] 中获得灵感,设计了一个使用三个 transformer 的框架,分别用于音频序列表示、动作表示和跨模态音频 - 动作表示。其中动作和音频 transformer 对输入序列进行编码,而跨模态 transformer 学习这两种模态之间的相关性,并生成未来的动作序列。
  该研究精心设计的新型跨模态 transformer 具有自回归特性,但需要全注意力(full-attention)和 future-N 监督,这对于防止 3D 运动在多次迭代后冻结或漂移非常关键,正如先前关于 3D 运动生成所述[4,3]。由此生成模型为不同的音乐生成不同的舞蹈序列,同时生成长时间的逼真动作,在进行推理时不受漂移冻结的影响。
  AIST++ 数据集
  为了训练模型,该研究还创建了一个新的数据集:AIST++。该数据集在 AIST(多视角舞蹈视频库) [78]基础上进行构建。研究者利用多视角信息从数据中恢复可靠的 3D 动作。注意,虽然这个数据集具有多视角照片,但相机并未校准,这使得 3D 重建非常具有挑战性。
  AIST++ 数据集包含高达 110 万帧伴有音乐的 3D 舞蹈动作,据了解,这是此类数据集中最大的一个。AIST++ 还跨越了 10 种音乐类型、30 个主题和 9 个视频序列,并具有恢复的相机内在特性,这对于其他人体和动作研究具有很大的潜力。
  数据集地址:https://google.github.io/aistplusplus_dataset/
  该研究创建的 AIST++ 是一个大规模 3D 舞蹈动作数据集,包含大量伴随音乐的 3D 舞蹈动作。其中每一帧都具备以下额外标注:
  9 种视角,包括摄像机的内外参数; 17 种 COCO 格式的人类关节位置,包含 2D 和 3D 形式; 24 个 SMPL 姿势参数,以及全局扩展和平移。
  下表 1 对比了 AIST++ 和其他 3D 动作与舞蹈数据集,AIST++ 对于现有的 3D 动作数据集是一种补充。
  此外,AIST++ 数据集包含 10 个舞种:Old School(Break、Pop、Lock 和 Waack)和 New School(Middle Hip-hop、LA-style Hip-hop、House、Krump、Street Jazz 和 Ballet Jazz),参见下图 3:
  基于音乐的 3D 舞蹈生成
  问题描述:给定一个 2 秒的动作种子示例 X = (x_1, . . . , x_T) 和音乐序列 Y = (y_1, . . . , y_T"),生成时间步 T + 1 到 T" 期间的未来动作序列 X"= (x_T+1, . . . , x_T"),T" >> T。
  跨模态动作生成 Transformer
  该研究提出一种基于 Transformer 的网络架构,它可以学习音乐 - 动作关联,生成不凝滞的逼真动作序列。架构图参见下图 2:
  该模型具备三个 transformer:
  动作 transformer f_mot(X):将动作特征 X 转换为动作嵌入 h^x_1:T; 音频 transformer f_audio(Y):将音频特征 Y 转换为音频嵌入 h^y_1:T"; 跨模态 transformer f_cross(h^xy_1:T +T"):学习动作和音频两个模态之间的对应,并生成未来动作 X"。
  为了更好地学习两个模态之间的关联,该研究使用了一个深度为 12 层的跨模态 transformer。研究者发现,跨模态 transformer 的深度越大,模型对两种模态的关注越多(参见下图 6)。
  实验
  定量评估
  研究者报告了该方法与两种基线方法在 AIST++ 测试集上的定量评估结果,见下表 2:
  动作质量:从上表中可以看出,该方法生成的动作序列关节和速度分布更接近真值动作。
  动作多样性:表 2 展示了,相比基线方法,该研究提出的方法能够生成更多样的舞蹈动作。控制变量研究结果表明,网络设计,尤其跨模态 transformer,是带来这一差异的主要原因。研究者将该方法生成的多样化舞蹈动作进行了可视化,参见下图 7:
  动作 - 音乐关联:从表 2 中还可以看出,该方法生成的动作与输入音乐的关联性更强。下图 5 中的示例展示了生成动作的运动节拍与音乐节拍能够实现很好地匹配。
  但是,在与真实数据进行对比时,这三种方法都有很大的改进空间。这表明,音乐动作关联仍然是一个极具挑战性的问题。
  控制变量研究
  跨模态 Transformer:该论文利用三种不同设置研究跨模态 Transformer 的功能:1)14 层动作 transformer;2)13 层动作 / 音频 transformer 和 1 层跨模态 Transformer;3)2 层动作 / 音频 transformer 和 12 层跨模态 Transformer。
  下表 3 表明跨模态 Transformer 对于生成与输入音乐关联性强的动作至关重要。
  如图 6 所示,更深的跨模态 Transformer 能够更加关注输入音乐,从而带来更好的音乐 - 动作关联度。
  因果注意力或完全注意力 Transformer:研究者还探索了完全注意力机制和 future-N 监督机制的效果。从下表 4 中可以看出,在使用因果注意力机制执行 20 秒长程生成时,生成动作和真值动作的分布差异很大。对于 future-1 监督设置下的完全注意力机制而言,长程生成期间的结果会出现快速漂移,而在 future-10 或 future-20 监督设置下,模型可以生成高质量的长程动作。

最具实力的中国戏剧之王,代表作闲情偶寄让他名垂青史李渔能编能写能演能交谈,他既是那个时代的畅销书作家,创作了大量风靡一时的戏剧,又亲任班主,招募演员组织戏班,带着演出队四处演出。他还根据自己的实践进行梳理,形成完备的戏剧理论体系。武丁盛世,要不是甲骨文,这两个女人的功劳永远淹没在历史长河中武丁是商王盘庚之侄,商王小乙之子,商朝第二十二任君主,后尊为商高宗,他在位59年,励精图治,征战四方,无论是疆土还是人口,都达到了商王朝的最高峰,史称武丁盛世。幸亏1936年6月1赤峰草原四次文化辉煌日出红山古韵青铜契丹王朝黄金长河赤峰博物馆外观红山岩画红山文化,石雕女性人像赵宝沟文化的凤形陶杯,这是最早的凤的形象小河沿文化彩陶钵小河沿文化彩陶钵小伙伴们都惊呆了!彩陶瓮彩陶器嵌贝彩绘陶鬲夏家店上层文化青铜器夏赤峰玉龙沙湖,沙漠驼队冰川巨石绿洲湿地,还有红山文化境祠,里面就是红山羽神红山羽神刻像境祠上一棵生命力顽强的树湖中水鸟玉龙沙湖巨石甚是壮观可以骑骆驼,去滑沙沙漠驼队沙漠驼队投影这匹骆驼载我一程,有缘北雁南归巨石下蛋冰臼,冰川时代的痕使罗布泊复活的水,是从哪来的?死亡之海变碧波荡漾死亡之地罗布泊罗布泊是一个相当神秘的地方,如果说在中国要列举一个死亡之地名单,那么罗布泊绝对会在这个名单中。作为中国有名的干旱地区,不能种植农作物的罗布泊向来是不被中国人民这个农耕一条放在博物馆的大腿,揭开盗贼ampamp39燕子李三飞檐走壁的原因相信燕子李三这个传奇人物在民国时期,可谓是家喻户晓,有人说他劫富济贫,有人说他打家劫舍,但如今却最终只留下一条供人观摩的腿。燕子李三,究竟谁是正宗?听闻燕子李三能够飞檐走壁,对他的SiTime官宣SiTime航空航天和国防Endura时序解决方案强调l4万亿分之每克加速度的力比石英更好50倍l支持55C和125C操作l关键时序规范符合MILPRF55310l最大选择500万个可能的零件号SANTACLARA,2019年7月我是一只小小小小鸟平凡的人该怎么调整心态,接受自己很有可能将度过碌碌无为的一生这个事实?看到这里,你肯定会说严老师又要给我们洗脑灌鸡汤了,鄙视,不看!等一下,严老师怎么可能那么无聊。严老师认为这个问神舟十二号回归!中国空间站有多先进?天和拥有世界首创黑科技50年前,我们只可以将200公斤的东方红卫星送上了太空。50年后,我们已能够把重22吨,相当于16辆汽车重量的天和核心舱送上了太空中。然后神舟十二号载人飞船与天和空间站实现了自主快小鸟撞飞机猛如炮弹?用数据来告诉你,其中的力量有多大空中飞行的小鸟竟然能成为飞行员的噩梦?小小的鸟儿竟然让飞行员生死攸关!飞行员王建东在一次飞行训练时不慎撞击到鸟类。虽只有短短几秒,但飞机舱内就立马响起警报,飞机开始急速下降。面对此研究发现绿叶蔬菜对增强肌肉力量至关重要根据埃迪斯科文大学的一项新研究,每天只吃一杯绿叶蔬菜就可以提高肌肉功能。周三发表在营养学杂志上的研究发现,摄入富含硝酸盐饮食(主要来自蔬菜)的人,其下肢肌肉功能明显改善。肌肉功能差