范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

一文读懂如何在金融网站运用算法交易AI?

  在这篇文章中,我们将重点关注bars:它们有什么问题?如何正确地处理以用于机器学习模型?在重新认识bars之后,你会发现几种从bars构建输入和输出的新方法。我们将会以统计和试验的方式来进行比较。
  K线图(蜡烛图)的问题是什么?
  我们习惯用所谓的"蜡烛图"来表示特定时间段(几分钟到几天不等)的开盘价,最高价,最低价和收盘价。
  蜡烛图的主要问题是:市场并不遵循这一时间规则,人们不会在特定的时间或每隔N分钟/小时之后进行交易。此外,现代市场是由算法驱动的,人们必定是在需要的时候下注,而不是在特定的N秒后。若是根据固定的时间间隔对历史数据进行采样——当交易非常活跃时,我们会取样过少,交易低迷时则取样过多。
  最后,根据上面提到的,可以得出下列结论(实证结论):根据时间采样的bars具有"糟糕"的统计特性,即较低的序列相关性,存在异常值,常态分布测试不成功。
  解决办法是根据其他规则对bars取样:
  · Tick:当出现N个Tick时,对OHLC(开高低收价) bar采样
  · 成交量:当某项资产成交量达X股时,对OHLC bar采样
  · 成交额:当某项资产成交额达Y美元(或其他货币)时,对OHLC bar采样
  · 不平衡:当价格的涨跌率或买卖比率与期望值有偏差时,对OHLC bar采样
  在下面的时间序列例图中,可以直观地看到如何获取这些bars:
  用以上提到的方法对香港专业教育学院(IVE)的bars采样的比较图
  上面提到的所有方法都是为了创建包含相同数量信息的bars:每个tick bars的交易数量相同,但是成交量却大有不同,因此采样成交量bars会更好,这样每笔交易的成交股数就相同了。成交额bars则更进一步,每一个bar的交易的市场价值相等。不平衡bars可用于tick,成交量和成交额bars。对于不平衡的tick bars,我的解释是,它是从N个ticks采集的样本,且遵循类似的价格趋势。
  正如你所看到的,所有的方法都非常依赖市场的微观结构来重建时间序列。让我们检查一下这些bars是否名副其实。这里的时间bar为十分钟,每100个bars采样一个tick bar,每达到10000股交易采样一次成交量bar,成交额每达到1000000美元采样一次成交额bar(从数个月的数据中采集样本)。
  根据不同的bars采样规则得到的收益分布比较图
  它们的统计特性如何呢?根据其序列相关性,标准偏差和正态性检验等不同参数得到的bars的比较图如下。
  可以看到,对于每一个参数,用其他规则采样bars比根据时间采样bars效果要好(方差除外,所有的方差都很低)。
  如何正确标记数据集?
  有人曾经预测过N个bars之后的价格变化,例如,预测下一个30分钟后的价格变化,然后根据预测来买进或卖空,但从业者和交易员真的会像预测的那样做吗? 他们会在收到一些信号后开仓,牢记自己的获利和止损目标。这表示我们要更关注在这30分钟里发生的事,而不是30分钟后。其次,获利和止损目标可能会随时间变化,因为市场是会波动的。另外,因为我们是根据市场价格动向下注,我们要知道应该投多少钱。最后,我们更关注预测的可信度,让我们可以根据模型的建议,不需要在随机的信号上浪费时间。
  因此,我们选用全新的标记方法:
  · 考虑收益的波动性
  · 考虑获利和利润
  · 不仅要知道下哪支注,还要知道下注的大小
  动态阈值
  我们先从收益的波动性开始讨论。考虑一个简单的框架,框架中仍有固定的预测值,然后标记三个级别:现时价和远期价的收益(r)超过某个阈值T(比如r=0.2, T=0.1),小于-T(比如r=-0.12, T=0.1),或者差别不大(有迹象显示r小于T,比如 r=0.05, T=0.1)。我们可以将整个数据集的T值固定,也可以根据收益的标准差来计算T。让我们试验一下,选定60个tick bars的收益的阈值T=0.025,然后将其与T比较,这将与上100个收益的绝对值的标准差相等。
  固定阈值的标记直方图
  固定预测值根据市场波动标记的直方图
  可以看到,根据波动来标记的结果分布仍相差较大,但根据固定阈值标记时,基本上大部分的结果都分布在标签0(-1表示下降, 1 表示上升,0表示差别不大)。要强调的是,这些标签是在用滑动窗口循环遍历bars的时候创建的,这并不是对数据点进行采样的最佳方法,我们后面再讨论这个问题。
  三大壁垒标记法
  现在研究另一种标记数据集的方法,在书中这一方法被称为"三大壁垒标记法(triple barrier method)"。我们想知道在下一个N个bars期间会发生什么——会遇到止损的情况吗?或许我们可以获利?或许价格将只是稍稍变化,最好不要下注?也许会遇到以上所用的情况?可以将这三种情况称为"三大壁垒(three barriers)":两个横向壁垒(分别代表止损和获利),一个垂直壁垒,表示最终的横向结果(前面例子中的固定预测值)。当然,横向壁垒不是对称的(例如,你是个有野心的投资者,相对于利润目标,你的止损目标较低)。
  下注大小和元标记
  好了,考虑到市场的波动以及止损和获利目标,我们已经有了实用的方法来标记价格的涨跌,但是还是不知道到底应该投多少钱(以及该不该投钱)。 Lopez de Prado提出了两步标记法( two-step labeling),一个标记是针对价格涨跌动向,另一个则是关于是否要下注(当然,还有下注的大小)。
  · 将每一个样本标记为1,将动态阈值设置为初始的止损或获利壁垒(基本上,我们得知道价格是涨还是跌),标记首先会上涨或下跌。
  · 知道价格涨跌之后,是否要下注就取决于预先确定的止损和获利目标,因此,如果第一个标记显示"涨",我们要确认是否能达到获利目标,确认后,将第二个标记设为1。如果第一个标记显示"跌",而且有可能要止损, 仍然将第二个标记记为1。 只有当第一个标记的涨跌方向和止损或获利之间没有相关性时,才将其标记为0。
  接下来是最酷的部分。在准备数据集的时候,训练一组特性,建一个可预测一边的模型(标记1),再训练第二个模型,在模型中也输入所有之前的特征,并将其标记为1。在第一个模型预测了方向之后,用第二个模型确认,根据第二个模型输出的0到1之间的数值,可以得出合适的下注数额。例如,如果第一个模型显示"涨",但是第二个模型显示的数字是0.05,这代表虽然价格会上涨,但我们很可能达不到预期的获利目标。
  记忆和平稳性又如何呢?
  我们知道,在将数据传输到机器学习模型之前,需要以其他方式将其规范化或标准化或让其保持平稳。对于金融时间序列,在大多数情况下,我们使用延迟微分(通常延迟1秒,称为收益)。这确实让时间序列稳定,但如果时间序列内的信息有记忆的时候会怎么样呢?这些信息被删掉了,为什么?因为1秒的延迟微分看起来只是延迟了1个bar, 而且不知道之前发生的事。
  在历史时间窗口中,为了数据的稳定,我们对所有的bars都这样做。但我们仍然想得到一个稳定的,没有删除全部有用信息的时间序列,要怎么做?要是只能用小于1的微分处理会怎样?这就是所谓的分数微分(fractional differentiation)。更多的细节可以在相关的书或其他资源找到。现在假设可以用0.1,0.3,或0.75的延迟微分处理时间序列,这能给我们更多的记忆。
  任意阶的滞后算子(来自维基百科)
  对数价格和不同的微分以及稳定性之间的相关性的信息有多少保存下来了呢?用ADF检验得到的结果如下:
  Tick bars的相关性和ADF检验结果
  时间bars的相关性和ADF检验结果
  可以看到,在tick bars时间序列中,分数微分不能带来更好的平稳性,但确实有更多的相关性的记忆。在时间bars序列中,用0.5-0.75阶的微分可以稍微改善数据。
  将其全部输入神经网络
  好了,是时候看看用新的目标来为新bars建模会怎么样了。我们将使用非常简单的softma回归函数作为分类算法(用dropout函数实现正规化),并通过历史窗口将收盘价、成交量和收益标准化来作为特征。用Keras建的模型如下:
  main_input = Input(shape=shape, name="main_input")x = Flatten()(main_input)x = Dropout(0.25)(x)output = Dense(3, activation = "softmax")(x)
  长窗长度为100,短窗长度为50,预期值为25个bars。阈值T=0.01,数据集由tick bars组成:
  用于训练的tick bars(蓝色),验证(黄色)测试集(绿色)
  可以看到,在数据集之间有空白区,这被称为"禁止区(embargo)",可以帮助确认模型在未来仍能工作。之后会详细介绍它。现在先将其视为一个更真实的分裂场景。为了处理级别的不平衡的问题,根据训练和测试数据集将各个级别的比重计算出来。
  固定阈值VS波动阈值VS三大壁垒
  我们的基线仅是预测价格涨跌或预测其不超过阈值T。级别分类说明如下:(0代表下降,1表示差别不大,2表示上升)
  差别没有很大对吧?精确度/记忆以及数据集标记都没有很不平衡。波动阈值如何呢?
  得到的数字更好了。在精确性/记忆没有不平衡(这说明分类算法是公平的,随着算法和特征的改进,可以确实提高准确性),现在数据集的不平衡没有那么重要了。好了,现在让我们用三大壁垒对基于波动的滚动阈值T,并且有对称的获利和止损目标的例子进行试验。
  平均结果差不多一样,因为在这里,第二类别代表的垂直壁垒是非常少的,如果忽视它们,那么基于止损和获利的涨跌动向的准确率会比之前的例子的要高,但精确性/记忆会稍有不平衡。这些预测可作为二进制预测模型的元标记,有了它们就可以预测标记的一边,它们具有下列的准确性:
  分数微分VS整数微分
  现在用已分数微分的对数价格代替特征集中的收益,设d=0.5, 然后看同样的试验下其结果如何。基线(仍然差别不大)
  横向的波动已比用"平常"的微分得到结果要好了:
  最后是三大壁垒以及元标记法:
  现在我们可以确定,分数微分是非常有用的转换工具,可以从原始时间序列中保存更多的信息。
  结语
  在这篇文章中,我们回顾金融网站上的bars的创建方法,并提出新的创建方式。我们讨论了它们的统计特性,并得出结论,成交量bars和成交额bars比标准的基于时间的bars要更加实用。根据不断波动的市场以及预先确定的获利和止损目标,发现标记输出的更实用的方式。最后,我们回顾了可使金融时间序列稳定而又不失去全部记忆的方法。我们还评估了所有的数据和标记试验,从中可以看到,所有的具有意义的提高都可以让预测结果更稳定,更准确。
  完整代码:
  https://github.com/Rachnog/Advanced-Deep-Trading/tree/master/bars-labels-diff

用什么卡流量多又实惠,腾讯大王,米粉还是其他的?我是大伽侃电商,现在市场电话卡太多,至于流量优惠与否还不好说,大多数人喜欢上网,流量就是根本,所以急需一张好的流量卡。移动电信阿里腾讯小米等,移动的网络比较稳定,但费用不便宜,小米中科院用58小时讲完的python!整整675集,拿走不谢兄弟,毫无套路!福利分享本套视频一共1200集,共分4季第一季Python基础第二季Python深入和扩展第三季网络编程多线程扩展库第四季算法Python源码函数式编程手工实现神经下一代Windows发布会于6月24日进行微软宣布,将于北京时间6月24日2300举行公布下一代Windows的线上活动。Windows桌面版的UI将全面革新。Windows的UI改造已经进行了一段时间了,代号为太阳谷(S李楠评华为发布鸿蒙OS2挽澜于极危的确佩服CNMO新闻作为原魅族科技高级副总裁,李楠在离开魅族后创立了怒喵科技,虽然跟手机行业关联度不大,但他经常会在微博上对手机圈的热点事件和产品发表评论。在6月2日晚,华为召开备受瞩目的鸿蒙来了,升级太热入口崩溃昨天晚上,我们中国自己的操作系统鸿蒙,来了!在直播里,我们系统的感受了鸿蒙系统所带给我们的万物互联的便捷和单纯手机操控体验的顺滑。发布会的结语,有一种悲壮却又豪气干天的英雄气概今天华为鸿蒙系统真来了,完整升级名单曝光,荣耀也能用大家好,欢迎来到黑马公社。就在昨晚,华为终于推出了鸿蒙系统和一些搭载了鸿蒙系统的设备。怎么说呢,整场发布会的风格黑马是越看越眼熟。其实像华为这种体量,真的没有必要在这些方面向友商学鸿蒙正式发布!打破美国20年系统垄断,还有啥理由不支持呢?文毛毛华为放大招了!正式发布HarmonyOS2,我们自己的操作系统,问世了!鸿蒙,本指盘古开天地前,天地不分,一片混沌,2019年5月,贸易摩擦正激烈,西方开始制裁华为,切断华为什么值得买618无线耳机篇文丨悠哉悠哉平泽唯bigfun社区大家好,我是爱音乐的平泽唯。在前几天分享过自己选无线耳机的一些方法和经验,但相信大家肯定喜欢看哪种直接给你选好的购买攻略。所以,今天它来了!在本篇鸿蒙系统,发布在众多的期待中,华为的鸿蒙发布了。6月2日晚8点,华为发布了新一代智能终端操作系统HarmonyOS2及多款搭载HarmonyOS2的新产品。同时,华为鸿蒙OS将正式开启规模化推送关于鸿蒙的六大疑问,搞清楚才算弄懂鸿蒙昨晚,属于中国人自己的手机操作系统,准确来讲是包括手机在内的智能终端操作系统正式到来鸿蒙系统HarmonyOS2发布,随即在全球受到广泛关注。鸿蒙系统的这次发布,意味着我们在5G万华为WATCH3Pro上手实测,到底值不值得买?以我现在在用的CT2的体验非常棒睡眠监测呼吸监测心率监测血氧监测心脏异常报警等功能,新品会增加心电图血压监测血糖控制引导等,佩戴华为手表等于是每天体检。随着老龄化的到来,增加血压功
vivo新款旗舰机相关信息曝光,或首发两项新技术随着如今智能手机产品在影像技术方面的不断提升,也使得其在这一功能上有了越来越好的表现,甚至于使得传统的卡片相机已经在市场中消失。而作为在这一方面有着诸多技术储备的厂商,vivo方面小米618发力,小米11直降500元,小米10S高配版2999元又到618,在诸多降价中,怎么能少得了小米呢,要知道小米的性价比一直是十分犀利的。果然,我们看到小米确实有所行动,而且幅度不小,其中小米11直降500元,小米10S高配版也从349中企打破日企垄断,芯片材料突破封锁,成功拿下首个订单众所周知,光刻机在芯片的生产过程中起着举足轻重的作用。只要拥有一台EUV光刻机,芯片制造企业就可以研制出更加先进的芯片工艺。除了光刻机之外,光刻胶等半导体材料对于芯片的光刻环节发挥央行数字货币回到未来摘要央行数字货币发展的全球概况及启示关键要点各国金融当局正在研究中央银行数字货币(CBDC),这可以使支付和结算系统更高效。一旦发行,CBDC和现金及储备金将成为第三类中央银行的负2021。05。26数字货币快讯美联储理事夸尔斯央行数字货币是否会在美国推行尚未有定论。证券时报比特币挖矿与碳达峰目标背道而驰。区块链初创企业奇亚Chia估值5亿美元,计划进行IPO。古根海姆CIO一种新加密货币比特币经常暴跌,可是暴跌不下去,4大原因支持虚拟币价格有没有发现,咱们隔3差5的,就会在新闻和媒体网络中看到比特币又崩盘了。一个月就能崩盘好几次,有时候崩30,有时候崩20。特别是2021年的前4个月比特币为代表的虚拟货币,价格越崩越21深度丨全球央行围堵比特币与法定货币终将开战?作者胡天姣,辛继召比特币市场悬念注定是一波接一波?去年持续发烧的比特币,自今年5月以来,也全无消夏之意,关注度持续引领虚拟币市场风骚。尤其是每枚价格在陆续刷新至62000美元高位,虚拟货币乱象调查挖矿耗能巨大价格暴涨暴跌新华社北京5月25日电题挖矿耗能巨大价格暴涨暴跌虚拟货币乱象调查新华社记者吴雨陈健毛振华一夜暴跌30一个月价格几近腰斩爆仓者两手空空近期,比特币等虚拟货币价格暴涨暴跌,激起围观者惊中国广电将推5G业务,能否搅动5G发展新格局?(记者叶菁)近日,国家知识产权局公示信息显示,中国广电正在申请共12项商标信息,涉及一项图形及一项文字LOGO图形。另据中国广电党委副书记总经理梁晓涛最新披露,中国广电将积极开展广性价比破新高!骁龙8705000mAh,价格跌至1799元在5G网络建设日趋完善的今天,一部性能给力,续航同样也要跟得上的5G机型无疑才是当下乃至于未来的新锐消费者所真正需要的。而且到了2021年的市场中之后,出现了非常多的新品,同时也有程序员是进信息技术公司好,还是进互联网公司好hello,大家好,我是一名java程序员,从业有五年的时间,今天留给大家讲一下互联网公司与信息技术公司有哪些区别,帮助入行者做一些自己的职业规划。互联网公司像百度,阿里巴巴,携程