打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
交易接口如何进行行情数据处理?

行情数据又可分为日内行情和日间行情,以及A股和美股市场,根据不同粒度抽取不同的特征。

1. 市场

· A股市场

· 主要指数:上证50、沪深300、中证500、中证1000

· 成分股:沪深300+中证500+中证1000,共1800支股票

· ETF: 主要行业ETF以及宽基ETF

· 美国市场:

· 成分股: 标普500大盘股+标普400中盘股+ARK基金成分股+主流中概股,约1200只股票

· ETF: 主要行业ETF以及宽基ETF

2. 日内和日间技术特征提取

主要使用pandas-ta提取RSIKDJWillr等技术因子,以及日内涨跌速度、涨跌幅等统计因子。相关实现见文后往期文章。

3. 日间财务特征提取

目前使用财务数据-估值有关指标,进行必要的放缩处理后供机器学习模型使用。

一个小技巧是,使用log变换可将数据有效平滑,例如下面的市盈率因子:

df['pe_ratio_lyr_clip'] = (np.sign(df['pe_ratio_lyr']) * np.log1p(df['pe_ratio_lyr'].abs()) / 10).clip(-3, 3)

4. 数据存储

这里将行情数据进行上述加工后,存储到数据库clickhouse中,需要注意的是,使用默认的Float32格式存储,会消耗相当大的空间,尤其是分钟级的日内因子特征。因此,这里处理的技巧是将数据放缩到Short类型(-2^15 ~ 2^15 -1),使用Int16类型节省一半空间。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
ETF五年翻倍,可以轻松实现 今天,从另一个角度讨论ETF五年翻倍的可行性。 翻倍的理论基础 ETF...
指环王:创成长ETF(基金评测) 写在前面这篇文章来自于正念读者的诉求,想要抄底创成长ETF(159967)这只指数基金,希望我们分析一下。让我们来看看什...
顺势牛牛: 沪深300价值、基本面60和基本面120大比拼 沪深300价值、基本面60和基本面120...
全指信息技术:风口上的科技类指数 1.基本信息 全指信息 ,全称为 中证全指 信息技术指数。 对于指...
富国中证500: 超全总结|2019上半年中证500怎么样了? 2019年已经过半,回顾上半年,中证...
医药指数测评:跟踪11个医药指数得出2个最赚钱的基金
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服