打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
[量化]LARA: 一种可以获得高胜率的入场信号的方法

代码压缩包(复制到浏览器直接下载) | https://tinyurl.com/LARA-KDD2022

一 问题描述

量化中的价格预测是指在根据当前市场状况和其他相关信息预测金融资产的未来价格趋势。近年来,机器学习方法在学术界和工业界越来越流行,并在价格走势预测任务上取得了很好的结果。大多数现有机器学习方法将预测问题表述为整个训练数据集上的分类(预测价格变化方向)或回归(预测价格变化量)问题。然而由于金融数据的极低信噪比和较大的随机性,良好的交易机会极少出现。因此,如果不仔细选择可能有益的样本,机器学习的方法很容易捕获噪声模式,而不是使用真实有效的信号去构建模型。

二 本文贡献

本文作者用一个直观的类比来解释LARA框架的提出动机,即评估学生的学业表现。根据学生表现的历史,可以将优秀学生视为正样本,普通学生视为负样本,如图1所示。优秀学生通常在一次考试中获得比普通学生更高的分数,就像金融数据集中潜在盈利的样本一样。它启发我们首先提取潜在的盈利样本(优秀学生),然后构建一个更具竞争力的模型。如果只观察一次历史考试,很难做出全面的评价,从而可能会错过一些优秀的学生,而错误地选择普通的学生。但是通过多次考试,就可以很容易地将学生进行区分。因此,它启发LARA通过多次迭代评估来进一步去除信噪比低的样本。基于这一观察结果,LARA希望训练一个强大且可推广的模型,用于在噪音极端嘈杂的市场数据上进行价格运动预测。


为了获得上述的模型,LARA需要解决两个问题。


问题1:如何提取潜在盈利样本?
为此, LARA提出了局部感知注意方法,该方法有两个主要模块:一个是用于构造更好度量的度量学习模块,另一个用于显式提取潜在盈利样本的注意力模块。具体来说,由于金融数据集不同特征之间的复杂内部关系,许多算法在很大程度上依赖于在其输入上给定一个良好的度量。这促使在LARA引入度量学习模块,该模块可以学习更兼容的距离度量,辅助注意力模块。注意力模块旨在建模输入和历史数据标签之间的辅助关系。LARA引入了掩码注意力机制,通过局部集成标签信息来提取潜在盈利样本的更好子集来。

问题2:如何自适应区分噪声样本,然后对其标签进行去噪?
在实际金融市场中,由于金融数据集的随机性和混沌性,两个样本可能具有相似的特征,但产生完全相反的标签。此类噪声样本,即具有相反标签的相似样本,排除了模型的推断。LARA提出了一种新方法,称为迭代细化标记,根据其监督损失自适应区分它们,并将其标签重置为相反的标签,以提高预测器的性能。该方法迭代地细化噪声样本的标签,然后将学习到的预测因子结合起来,对未知和噪声金融样本具有鲁棒性。

image.png

总的来说,本文提出了一种新的价格移动预测框架,称为LARA( Locality-Aware Attention and Adaptive Refined Labeling),该框架由两个主要组件组成:
(1)局部感知注意力模块:通过关注周围的类感知标签信息自动提取潜在盈利样本。通过引入度量学习,局部感知注意力模块可以进行任务的距离度量,以更有效的方式将注意力分布在潜在盈利的样本上。
(2) 迭代细化标记模块:求精标记进一步迭代求精噪声样本的标签,然后将学习的预测器结合起来,对未知和噪声样本具有鲁棒性。

本文提出的方法在三个真实金融市场(ETF、股票和加密货币)上的大量实验中,与传统的时间序列分析方法和一组基于机器学习的Qlib平台上的基线方法相比,LARA取得了优异的性能。大量的的实验也表明,LARA确实可以抓住了更可靠的交易机会。

三 算法分析




算法分为训练阶段和测试阶段,训练阶段又可以分为两部分:

  1. 使用等式(3)估计每个样本的𝑝_𝑥,挑选大于阈值的样本;
  2. 使用迭代细化标记的方法(算法(1))迭代训练k个分类器。

测试阶段:

  1. 使用等式(3)估计测试集中每个样本的𝑝_𝑥,挑选大于阈值的样本;
  2. 使用训练的k个分类器构建集成分类器对第一步挑选出的样本进行分类,如果类别为正,则进行做多(或做空)操作。

四 实验结果







五 总结展望

本文提出了LARA框架以尝试抓住优秀的交易机会。从实验结果来看,LARA可以提高单次交易的胜率和平均回报。需要注意的是,本文只使用了简单的交易策略进行实验,LARA只能给出入场信号,并不能给出合适的出场信号。LARA可以被认为是一个保守的模型,只在置信度比较高的时候给出入场信号,入场信号有可能触发会比较少,导致资金长时间在场外闲置。本文也并没有给出长期的回测结果展示长期的表现。

「核桃量化」
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
ICCV 2021 | Transformer再助力!用CWT进行小样本语义分割
【图像分类】 标签噪声对分类性能会有什么样的影响?
如何做一个“实用”的图像数据集
噪声总是有害吗?西工大李学龙教授提出基于任务熵的数学分析框架
既是自编码器,也是RNN,DeepMind科学家八个视角剖析扩散模型
女朋友问我什么是最优化原理(上)——系列连载(9)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服