童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

金融中的三种深度学习用例及这些模型优劣的证据

3月11日 不将就投稿
  在今天我们发布的这篇文章中,作者SonamSrivastava介绍了金融中的三种深度学习用例及这些模型优劣的证据。
  我们跟随SonamSrivastava的分析,并展望深度学习在金融领域的运用前景。虽然金融是计算密集型最多的领域,但广泛使用的金融模型:监督和无监督模型、基于状态的模型、计量经济学模型甚至随机模型都受到过度拟合和启发式问题带来的影响,抽样结果很差。因为金融生态圈异常复杂,其非线性充斥着大量的相互影响的因素。
  要解决这个问题,如果我们考虑到深度学习在图像识别、语音识别或情感分析方面所做的研究,我们就会看到这些模型能够从大规模未标记数据中学习,形成非线性关系的递归结构,可以轻松予以调整以避免发生过度拟合。
  如果金融生态圈能够使用这些网络进行建模,应用领域就会深远而广泛。这些模型可用于定价、投资组合构建、风险管理甚至高频交易等领域,让我们来解决这些问题。
  收益预测
  以预测每日黄金价格的抽样问题为例,我们首先看看传统的方法。
  ARIMA模型
  ARIMA模型(AutoregressiveIntegratedMovingAveragemodel),差分整合移动平均自回归模型,又称整合移动平均自回归模型(移动也可称作滑动),时间序列预测分析方法之一。ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。“差分”一词虽未出现在ARIMA的英文名称中,却是关键步骤。
  ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。现代统计方法、计量经济模型在某种程度上已经能够帮助企业对未来进行预测。利用整合移动平均自回归模型,来尝试预测季节性平稳时间序列,我们得到结果如下图所示:
  VAR模型
  VAR模型,(VectorAutoregressionmodel)向量自回归模型,是一种常用的计量经济模型,由计量经济学家和宏观经济学家ChristopherSims提出。它扩充了只能使用一个变量的自回归模型(简称:AR模型),使容纳大于1个变量,因此经常用在多变量时间序列模型的分析上。
  如果我们将相关的预测变量添加到我们的自回归模型中并移动到向量自回归模型,我们得到结果如下图所示:
  深度回归模型
  如果在数据上使用简单的深度回归模型,使用相同的输入,会得到更好的结果,如下图所示:
  卷积神经网络
  卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。
  卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(poolinglayer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网络,卷积神经网络需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。
  修改我的架构,使用卷积神经网络来解决同一个问题,得到结果如下图所示:
  所得结果大为改善。但最好的结果还在后头。
  长短期记忆网络
  长短期记忆网络(LongShortTermMemory,LSTM)是一种时间递归神经网络(RNN),论文首次发表于1997年。由于独特的设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。
  LSTM的表现通常比时间递归神经网络及隐马尔科夫模型(HMM)更好,比如用在不分段连续手写识别上。2009年,用LSTM构建的人工神经网络模型赢得过ICDAR手写识别比赛冠军。LSTM还普遍用于自主语音识别,2013年运用TIMIT自然演讲数据库达成17。7错误率的纪录。作为非线性模型,LSTM可作为复杂的非线性单元用于构造更大型深度神经网络。
  使用循环神经网络(RNN)的变种后,我得到结果如下所示:
  因此,整体来说均方误差的趋势出乎意料。
  投资组合构建
  我们尝试使用深度学习解决的第二个金融问题是投资组合构建。在这个问题上,深度学习的实际应用效果很好。我的研究灵感来自这篇论文:《深度投资组合》(https:0x9。me8uOBt)
  这篇论文的作者尝试构建自动编码器,将时间序列映射到自身。使用这些自动编码器的预测误差成为股票测试版(与市场相关)的代用指标,自动编码器用作市场的模型。
  自动编码器(autoencoder),是一种无监督的学习算法,主要用于数据的降维或者特征的抽取,在深度学习中,自动编码器可用于在训练阶段开始前,确定权重矩阵W的初始值。基于上述自动编码器的误差选择不同的股票,我们可以使用另一个深度神经网络来构建深度指标,结果相当不错,如下图所示:
  深度神经网络已成为利用股票复制指数的指数构建方法。
  但这只是它的开始!如果我们应用智能索引,在我去掉指数的极端下降期,并在智能索引上训练我的指数映射深度神经网络时,我就能以惊人的速度超过指数!
  这种技术在证券投资组合领域有着巨大的潜力!
  结论
  目前金融业的趋势是朝更复杂、更健全的的模式发展。随着大量数据科学家涌入该行业,对所有银行来说,技术是一个巨大的压力。像RelTec、Worldquant这样的对冲基金,在其交易中已经使用这种技术。由于这些复杂模型在其他领域所表现出的优异结果,以及在金融建模领域的巨大差距,将会有一系列的戏剧性的创新涌现!
  更好地解决金融和贸易领域的关键问题,将会提高效率、提高透明度、加强风险管理和新的创新。
  译者感言:
  深度学习的一大优势在于可以大幅减少人工参与的特征工程去“拟合”训练数据,但这也不是说完全不需要人去参与特征的选取,尤其是金融市场,数据简直是海量,并且大都高噪声,非稳定,所以除非你能够清楚哪些数据具有潜在价值、如何做适当的预处理和如何转化并达成哪些目标,否则深度学习在金融领域是无法应用的。
  如果设计得当,增加神经网络的深度可以对更复杂的模式进行映射,因此可对金融数据的训练产生更好效果。
  例如CNN适合处理图像一类的大数据,不一定直接适用于金融数据。金融数据虽然也可以很大,但通常不在一个数量级上一幅图像中的样本数(像素、颜色)很容易上百万,要训练一个模型又要用到成千上万个图像,为了找到高效办法提取特征,于是计算机科学家想出了卷积神经网络通过抽取特征值来简化运算复杂度。而我们处理的金融时间序列数据,单组样本的数量常在百万以下,规模上往往不需要卷积。进一步比较,相对于金融数据,图像识别的特点是数据量庞大、特征明显、特征重复次数多、特征组合性强、出现的次序性、特征呈现的方向性有时不强,这与金融数据噪音大、数量较小的特点有所不同。因此,在训练金融数据时很有必要设计有针对性的深度机器学习模型。
  本文涉及到的代码可在作者的GitHubRepo中找到https:0x9。meP5ahd
  
  原文地址:https:medium。comtowardsdatasciencedeeplearninginfinance9e088cb17c03
  原文作者:SonamSrivastava
投诉 评论

“云”上之争,互联网巨头的筋斗怎么翻?在这个技术与资本赛跑的时代,“云”上的斗争,各家的玩法,将一次次突破我们的想象力。2017年,云计算的“战争”依旧如火如荼。从去年就燃起来的价格硝烟依旧没熄灭,此起……从B2B时代到S2B时代,决胜点在“供给物”上从B2B时代进入到S2B时代后的关键在于供给侧产品和服务组成的”供给物”的改变上,而非供给方式的改变上。“互联网”时代的落幕让人们开始寻找新的市场突破口。新零售、新金融、……彩票头条玩得6,全靠大忽悠?来自互联网彩票一线的报告本调研共选取了29个粉丝数超过5万的彩票头条号及其内容进行分析,并对新浪彩票、彩票小诸葛、彩票大师、双色球大师、德亿规律等业内优秀头条号案例进行了进一步分析。调研背景……为什么支付宝账单能刷屏朋友圈?支付宝今年的“晒账单”比去年做得更好,核心原因恰恰就是它激发了更多维度的分享心理,发行了更多种类型的社交货币。去年年初,支付宝账单刷爆了朋友圈,一年后的今天,微信又一次被……互联网还有机会吗?互联网正在不再年轻,那么互联网还有机会吗?都说互联网是个年轻的行业。毕业生争先恐后的想要进入这个行业,其实身边现在也不乏十几年从业经验的老互联网人,当然了相比传统行业动不……短视频下半场:关键在变现活下来才能走得更远。互联网几乎一年一个风口,瞬息万变,O2O、共享经济、短视频等,其中,以短视频为代表的内容是一个非常特殊的行业,它既是一个独立的领域同时与各个行业相互融……短租民宿的生意经:从内打破才是成功的必经之路2018年已至,短租平台如何破局将成为发展的重要课题。短租行业东风再起。2017年末,新一轮的融资浪潮让国内三家主要短租平台拥有足够的资金储备,能够大展拳脚。……漫谈短视频平台概况,全面解读头部内容本文系网易薄荷直播产品经理、前花椒直播内容方向产品经理章少轩于MCtalkLive泛娱乐产品峰会系列讲座短视频平台如何打造头部内容和做好用户留存?上的分享内容,由网易MCtal……知乎的旧学问与新引擎都说2016是知识付费的元年,2017年这个市场格局初定,接下来的一年注定是知识市场形成巨头关键一年1:早期的知识变现,更像是头部明星名人的特权,罗振宇、李翔、马东……新零售启示录:Costco为何能留住90的会员?不管是内部模式改良还是外部技术加持,零售的变革终将在用户体验上迎来正面对决。作为全球第二大零售品牌,Costco也是全球最大的连锁会员制仓储量贩店,年销售额接近1300亿……金融中的三种深度学习用例及这些模型优劣的证据在今天我们发布的这篇文章中,作者SonamSrivastava介绍了金融中的三种深度学习用例及这些模型优劣的证据。我们跟随SonamSrivastava的分析,并展望深度……如何看待近几年网页设计发展与前途?是否网页设计已死成事实?认清自己的角色,站好自己的角度,才能感觉网页设计真正的内在。有很多朋友和我讨论过类似的web前途的问题,大家其实和我一样,在web上短时间或长时间都会有迷茫的时候,有选择……
挑战IntelAMD!三星计划推出适用WindowsPC处理快科技10月25日消息,三星目前正在考虑推出适用于WindowsPC的处理器。多年来,x86架构几乎是PC平台唯一的选择,PC处理器市场主要由Intel和AMD主导。20……全球首款卫星通信折叠屏!华为MateXs2官方翻新机开售:7快科技10月25日消息,从华为商城获悉,华为MateXs2官方翻新机正式上架开售,8GB256GB版本7399元,12GB512GB典藏版9499元。根据官方宣传海报,应……华为不忘老用户:6款荣耀手机开启鸿蒙4公测含4年前老机型快科技10月25日消息,与荣耀分家”之后,华为并未忘记荣耀的老用户。今日,HarmonyOS官微公布了鸿蒙4对最新升级进展华为MatePad2023等4款平板即日起开启H……SK海力士LPDDR5T完成骁龙8Gen3平台验证:速率高达快科技10月25日消息,SK海力士宣布,其LPDDR5T已在高通第三代骁龙8移动平台上完成了性能及兼容性的验证,速率高达9。6Gbps,这是世界上最快的商业化移动DRAM。……不预热藏大招!发布会雷军现场介绍小米14Pro:产品很强快科技10月25日消息,小米将于10月26日晚举行新品发布会,带来年度旗舰新机小米14系列。在这两天的预热中,小米14标准版外观和部分配置已经公布,但小米14Pro却迟迟……小米米兔儿童电话手表U1Pro上架:内置小爱同学、支持视频通快科技10月25日消息,小米米兔儿童电话手表U1Pro目前已经上架,到手价999元。据介绍,米兔儿童电话手表U1Pro搭载微信、QQ双社交平台,可与手机微信、手机QQ、其……第三届元宇宙共享大会甘华鸣:高屋建瓴地认识Web3。0元宇宙2023年9月26日,“趋势与未来”第三届元宇宙共享大会暨Web3。0链改绿色积分资产化实践项目签约发布会及汇来购全生态3。0启动盛典在广东惠州金海湾成功举办。该活动由中国移动……元宇宙彻底熄火中国VR设备销量腰斩AR火速崛起快科技10月15日消息,根据洛图科技(RUNTO)线上监测数据显示,2023年18月,中国XR设备线上销量为17。3万台,同比下降38。8;销额为5。4亿元,同比下降36。2。……第三届元宇宙共享大会共探链改积分Web3。0趋势与未来2023年新一轮科技革命再起狂澜,ChatGPT带来的惊艳还未消散,元宇宙产业已然开启了纪元之门。第三届元宇宙共享大会暨Web3。0链改绿色积分资产化实践项目签约发布会及汇来购……特斯拉2023年Q3财报:大举投资人工智能,保持持有比特币站长之家(ChinaZ。com)10月19日消息:根据Cointelegraph的最新报道,特斯拉在第三季度继续保持其大额比特币持有,这已经是连续第五个季度了。与此同时,特斯拉……Meta重磅更新,小扎在元宇宙里养了会做家务的狗!人形化身超【新智元导读】今天,Meta重磅发布了Habitat3。0,经它训练的AI智能体,学会了找人,还能帮人打扫房间。社交智能机器人,进入下一个里程碑!今天开始,人类离帮忙做家……百度大模型加持,元宇宙竟然还能卷出新玩法!AI一键作画、智能【新智元导读】元宇宙,竟然还能卷出新玩法?这次,乘着大模型的快车,百度又在元宇宙里开启了不一样的极致体验。乘着大模型的浪潮,元宇宙再度升级!2023年的元宇宙看似冷……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界