一个数学博士的深度学习方法(第7部分)
到目前为止,我们已经讨论了 MLP、CNN 和 RNN 架构。这些是判别模型,即可以做出预测的模型。
前面,我们连载了六次数学博士的深度学习方法(点击直达):
一个数学博士的深度学习方法(第 6 部分):神经网络架构RNN
一个数学博士的深度学习方法(第 5 部分)
一个数学博士的深度学习方法(第 4 部分)
一个数学博士的深度学习方法(第 3 部分)
一个数学博士的深度学习方法(第 2 部分)
一个数学博士的深度学习方法(第 1 部分)
博士的更多学习方法和算法可以直接打开整个系列:「链接」
这次我们将讨论生成模型,例如自动编码器和 GAN,以及其他有趣的神经网络架构。
判别模型本质上是学习估计条件概率分布 p( | x);也就是说,给定一个值,他们尝试根据他们对 x 的概率分布的了解来预测结果。生成模型是学习数据的概率分布并学习如何生成似乎来自该概率分布的数据的神经网络架构。一个例子是一个用很多人的面孔训练的网络,并学习如何生成不存在的人的面孔,例如这个网站上的面孔: https://this-person-does-not-exist. com/en
创建合成数据是生成模型的一种用途,但不是唯一的用途。
自动编码器 (AE)
为了更好地理解自动编码器的工作原理,让我们看一个自动编码器的一种简单表示。
自动编码器的一个简单示例。
本质上,自动编码器是两部分的组合:编码器和解码器。编码器获取高维输入数据并映射到低维空间(潜在空间),解码器获取潜在空间中的数据并尝试在原始高维空间中重建这些数据。
这样做的一个好处是自动编码器可以拍摄一张图片并映射到潜在空间,并且在这个过程中,只保留最重要的部分,因此将消除噪声并压缩图片。
如果我们将编码器表示为 z = f(x),将解码器表示为 x"=g(z),则自动编码器为 x"=g(f(x)),我们希望 x x"。权重不同但一起学习,通常使用 MSE 损失函数来衡量自编码器的质量。用更数学的术语来说,编码器在点(输入数据)所在的流形(高维表面)中学习向量场,并将向量场投影到低维空间"保留"向量场;而解码器采用低维向量场并在高维空间中重建它们。
去噪自编码器 (DAE)
它是自动编码器的一种变体,因为它学习重建损坏或嘈杂的输入。本质上,我们使用条件分布 C(x₂|x) 从原始数据生成损坏的数据,并且使用损坏的数据,我们的自动编码器必须学习如何重建未损坏的数据。在这种情况下,用于训练的数据将采用 (x, x₂) 的形式,其中 x 是原始数据,x₂ 是相应的损坏数据。
变分自动编码器 (VAE)
这是另一种自动编码器的变体。在这种情况下,VAE 不是学习函数 f 和 g,而是学习输入数据的概率密度函数。如果先验概率密度函数是p(z)(假设的概率密度),似然p(x|z)(给定潜在空间的输入分布),那么学到的概率密度函数就是后验概率密度p (z|x),即 p(z|x) = p(z)p(x|z)。这就是贝叶斯推理的方法。
这种方法更好,因为真实数据是嘈杂的。
在这种情况下,当 VAE 试图学习概率分布时,我们可以使用 Kullback-Liebler 散度作为损失函数。
生成对抗网络 (GAN)
这是一种受博弈论启发的神经网络架构;它由 Ian Goodfellow 于 2014年 创建。 它由两个网络(一个生成器网络和一个批评者网络)组成,相互竞争。 从这里 可以看出,GAN 已经取得了显著的成果。
生成器网络试图通过生成看起来像真实数据的合成数据来欺骗评论家网络,而评论家网络试图找出另一个网络产生的数据是否是假的。
当然,GAN 很难训练,因为不能保证两个网络会收敛。一个网络的梯度下降不会影响另一个网络的梯度,并且两者必须收敛在一起,否则参数可能会振荡和不稳定。
现在我们将讨论其他类型的神经网络。
迁移学习
训练一个深度神经网络不是一件容易的事,它需要大量好的数据、计算能力和时间(你知道,时间就是金钱),所以迁移学习是一种尝试使用经过训练的网络(即针对一项特定任务进行训练,例如识别猫品种)并将其适应于另一但类似的任务(例如识别狗品种)。
考虑猫/狗的例子,假设我们有一个训练有素的 CNN,所以第一层可以检测基本特征,最后一层可以检测一些更高级的特征,最后一层传递给三个全连接网络。我们可以保留层,但只训练完全连接的部分。当然,对于这项工作,我们需要猫和狗的图像具有相同的大小。这就是迁移学习背后的想法。它节省了大量资源并允许一些非常酷的事情,例如将斑马条纹放在马身上,视频请私信联系。
元学习
另一种更新的(和有前途的)技术是元学习。元学习是学习如何自己学习新任务的能力,这是达到通用人工智能 (AGI) 的一项要求。
人类可以通过几个例子来了解猫和狗之间的区别,并且有一些技术可以尝试用人工神经网络做同样的事情,这些被称为小样本学习。
与元学习相关的架构有一些,例如记忆增强神经网络 (MANN)、神经图灵机 (NTM)、元网络 (MetaNet)。
几何深度学习
直到这里看到的所有架构都有一个共同点:它们都是用表格数据训练的。但并非现实世界中的所有数据都可以正确放入表格数据中,例如来自社交网络的数据。社交网络可以更恰当地建模为图,只需将每个人视为一个节点,并且两个人在社交网络中相关,因此有一条连接两个节点的边。
即使在邻接矩阵中考虑,如果我们想在边上放置不同的权重并保留一些其他信息,表格数据也不是保存这种关系的好东西。在这种情况下,有一个更好的架构:图神经网络。
出现几何深度学习这个术语是因为一般来说,我们可以将数据视为某个流形(高维表面)中的点,如果这些点连接起来,我们就会在这个流形中获得一个图。这样,如果方便的话,我们可以忘记流形并只使用图形。
这是所有的了!
这是一系列关于深度学习数学的文章的结尾,共7个部分。
关于它还有很多,这是一个很大的研究领域,但一切都有尽头。然而,我的学习还没有结束!我希望尽快写一些有趣的话题。
感谢您的陪伴,很快再见!
任正非戴上了一副黑框眼镜文风马牛(微信公众号冯仑风马牛)01hr黑框眼镜的学问戴着黑框眼镜的任正非看起来至少年轻了十岁,也差点让人没认出来。顶着这个新造型,任正非出席了不久前华为的第二批军团组建成立大会。
工信部将加快出台移动互联网应用程序个人信息保护管理规定北京商报讯(记者金朝力王柱力)4月14日,工信部网络安全管理局局长隋静在发布会上表示,将加快出台工信领域数据安全管理办法移动互联网应用程序个人信息保护管理规定,研究制定APP收集使
严打非法采挖保护个人信息安全来源光明日报当前,我国互联网用户规模已超过10亿,形成了全球规模最大的数字社会。随着云计算大数据5G等新一代信息技术的迅猛发展,数据逐步成为推动社会经济发展的重要生产要素。网民的海
SEO助手一款免费SEO助手覆盖全网所有SEO功能SEO助手,什么是SEO助手,顾名思义SEO助手就是帮助网站快速SEO优化排名。常见的SEO助手的工具有很多种,有SEO关键词助手工具有SEO网站查询助手工具SEO点击助手工具SE
台积电英特尔纷纷传来消息,高端芯片市场或将洗牌能参与高端芯片制造的企业少之又少,台积电,三星之外,还有英特尔也在进军高端。前两者已经积累了大量的高端芯片技术,而英特尔也在加快高端芯片市场布局。并且传来消息,从ASML采购的EU
无偿加班4小时!996和200年前的资本主义到底有何区别?200年前的工人,在暗无天日的工厂里被资本家用力榨取最后一滴剩余价值经过百年的不懈奋斗,8小时工作制终于在世界各地确立起来了。但是,200年后的今天,依旧有很大一部分的打工人,也活
五个条件让大家知道负债后做美团好不好,并且聊聊应该怎么做负债后我们应该干什么工作来还债比较快呢?很多人第1个想法就是做美团,因为大家都知道美团是现在唯一一个能够让普通人月入过万的途径。但是我想说并不是所有人都适合做美团,点个赞支持下,我
中国移动推出5G新通话定义5G时代的通话产品中国移动12日推出5G新通话,定义5G时代的通话产品。5G新通话具备超低时延超清画质不占流量一键视频四大优势。试商用期间,5G视频通话按时长计费(按分钟数),不收流量费,5月1日起
跑腿日入过万所以没人送快递了?有小哥说及时送药,比小费更有成就感近日,一则顺丰同城骑士日入过万的消息在网上引发热议,有网友猜测,因跑腿收入很高,现在正常的快递物流没人做,即使有货也缺运力,都去做跑腿了。还有网友认为,跑腿群体无人管理,来送的这个
微信农场,第二个QQ秀?图片来源视觉中国文新熵,作者嘉荣樱木,编辑伊页你更新微信状态了吗?可以养小动物的那种?今天一早,沉匿许久的微信状态在微信农场的热搜下再一次进入了人们的视野。仅逾半天,话题阅读量达5
木头姐最新发言特斯拉和比特币改变人们生活方舟投资管理公司创始人凯茜伍德当地时间周二在迈阿密的ExchangeETF大会上发言,在谈到她专注于创新的投资策略最近遭遇的挫折时称,在评估颠覆性创新的价值时,私募市场似乎比股票市