昨天我们成功让一个算法模型帮我们跑出了一个预测值,我用2022年7月-2022年12月的样本数据进行了训练。
那么大家肯定也想知道,在2023年1月到4月份的收益情况是如何的吧。这是不做任何处理(二板涨停之后)能买的进去的无脑竞价买的模式的收益。
这个收益是什么意思呢?就是当你出现一只目标股,买1万,然后按照不涨停次日就卖策略,最终4个月时间可以获得1400收益。
所以整体这个策略还是可以赚钱的。
那么通过我们昨天训练的随机模型,我们来看看他的结果!
结果,不但没有赚钱,反而还亏了,这是什么烂模型!年初到现在还能亏3400元。
后面我考虑的是样本集比较少,显著性没那么强,对于样本少的我重新换了一个算法
最终我用贝叶斯的算法新生成了预测方法。
明显更优了,主要是回撤控制住了,截至到4月份,赚了有1万块钱,这个结果,就可以接受了。这里面唯一的区别在于,对于特征贝叶斯进行了特征处理。
标准化之后,可能显得的模型的噪音会小一点,当然,这个也不是绝对,毕竟从评估模型的角度参数来看,可能随机森林算法调参后效果会更好。所以在剩下的工作中,就是不断调参的一个工作了。
后续调好参数,直接跑实盘来验证策略。但是这个中间有很多工作量,我也希望大家可以一起来调参。
代码和数据文件我会放到星球上,给大家一个作业就是看谁可以调出牛逼的参数,使得测试的数据集能跑出N倍的收益。
这个过程中,可以通过删减因子,可以对因子组合加权生成新的因子,当然有啥不懂,还是问chatGPT,数据还是这份数据,因为二板的这套逻辑是相对朴素和可挖掘的。唯一要做的就是择时的因子再细化一下,通过模型再优化一下,从而发现潜在的规律。
------------分割线---------
我再总结一下,调参的步骤和代码
第一步:准备核心数据文件
文件1:20220701-20221231因子记录
其中B列,主要是根据return的值来判断的,因为我们是在处理一个择时问题他是一个分类问题,这里大家也可以自己更改,你可以修改为只要负的我就不买,正的我就买,我的规则是只要不大亏我就买,因为博的是机会吗(调参点1)
文件2:20230103-20230421因子记录(用于测试模型)
这里主要验证模型的有效性
文件3:可运行代码
第二步:注册一个同花顺量化平台在研究环节跑代码,将文件CSV下载下来导入进去。
然后复制代码运行,这个时候,你可以对数据进行各种处理,可以删除因子个数训练(调参点2)
可以改变模型训练(调参点3)
第三步:分享和讨论你调出的优质模型
第四步:针对已经调好的,我会生成自动的信号,供大家自己用。
希望这个系列的分享对大家学习量化投资有帮助。
联系客服