打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
七天学会「股票数据分析软件」的开发(中)


LSGO软件技术团队 

贡献人:马燕鹏

如果喜欢这里的内容,你能够给我最大的帮助就是转发,告诉你的朋友,鼓励他们一起来学习。

If you like the content here, the greatest help you can give me is forwarding, so tell your friends and encourage them to learn together.

两天前,我写了 七天学会「股票数据分析软件」的开发(上),号召大家尝试着写写代码,不知道大家进度如何。

如果存在掌握一种技能的刚需,而且知道正确的学习方法,经过刻意练习,这门技能很快就能玩儿的有模有样,但想精进这门技能,就需要靠时间的积累了。有关学习编程的方法,可以参考我的另外一篇图文 学不会编程?试试我的方法

言归正传,我们继续 「股票数据分析软件」的开发第二部分 -- 数据的分析。

由于我们使用的量化模型非常简单,可以参考图文 赚钱是刚需,如何正确的交易股票?。所以 数据分析部分 主要解决两个问题,第一个,计算 沪深300交易数据的分位数。第二个,数据的读取与更新。

我们先说 计算 沪深300交易数据的分位数。由于两年沪深300交易数据的数量大概 490 条左右(远远超过100条),所以我在另一篇图文 如何通过Matlab验证自己的交易策略? 中给出的计算分位数的方法 GetPer(Data) 是简化的版本。

如果数据量小只有两条。比如 double[] = new doulbe[]{0,1},25分位数应该是 0.25 而非 0,75分位数应该是 0.75 而非1。严密的求解算法,应该在对数组由小到大排序后,计算分位数对应位置的前后两个数值,然后按照比例折算求得。具体的求解方法参见维基百科相应部分 https://en.wikipedia.org/wiki/Percentile。

有了算法,我们就可以进入编程实现环节,首先构造一个对 double 数组的扩展方法 Quartiles,给定分位数 p,得到该分位数对应的数值。参数 alreadySorted 用来说明数据 double[] values 是否已经由小到大排序。

public static double Quartiles(this double[] values, double p, bool alreadySorted)
{
    if (!alreadySorted)
    {
        values = (double[]) values.Clone();
        Array.Sort(values);
    }

    if (values.Length == 1return values[0];
    if (p >= 100return values[values.Length - 1];
    if (p < 1return values[0];

    int len = values.Length;
    double pos = p*(len - 1.0)/100;

    double fpos = Math.Floor(pos);
    double dif = pos - fpos;

    int intPos = (int) fpos;
    double lower = values[intPos];
    double upper = values[intPos + 1];
    return lower + dif*(upper - lower);
}

我们接着构造另外一个 double 数组的扩展方法 Percentile,给定数值 value,得到该数值对应的分位数。参数 alreadySorted 含义同上。

public static int Percentile(this double[] values, double valuebool alreadySorted)
{
    if (values.Length < 2)
    {
        throw new Exception("values数组元素个数需要大于等于2.");
    }
    if (!alreadySorted)
    {
        values = (double[]) values.Clone();
        Array.Sort(values);
    }
    if (value <= values[0]) return 1;
    if (value >= values[values.Length - 1]) return 100;

    int i;
    for (i = 0; i < values.Length; i++)
    {
        if (values[i] >= value)
        {
            break;
        }
    }
    double lower = values[i - 1];
    double lowerp = i == 1 ? 0.01 : (i - 1.0)/(values.Length - 1.0);
    double upper = values[i];
    double upperp = i/(values.Length - 1.0);
    double dif = (value - lower)/(upper - lower);
    double result = lowerp + (upperp - lowerp)*dif;
    return (int) (result*100);
}

第一个问题到这里就结束了,我们来解决第二个问题 -- 数据的读取与更新。为了避免重复计算,我也建立了一张数据表 Stock_AnalysisLog 用来记录数据分析的日志。该表包含字段如下:

  • 股票代码

  • 年份

  • 季度

  • 开始日期

  • 结束日期

  • 备注

数据分析与更新的步骤如下:

Step1:读取数据分析日志,确定需要分析的数据。

Step2:确定分析所需的历史数据是否完备。即数据库中已经存储了计算两年分位数的全部数据,如果数据不完备则提示先要下载历史数据。下载历史数据的功能我们已经在 七天学会「股票数据分析软件」的开发(上) 中介绍完毕。

Step3:分析数据并把结果写入数据库。即把数据取出,计算分位数,然后把计算结果存回数据库。

Step4:记录分析数据的日志。

经过以上四个步骤,数据的分析与更新就全部搞定了。最后,看看我做的Demo:

分析数据:对选中年份、季度的数据进行分位数计算,并显示结果。如下图所示:

分析数据

查看日志:查看分析和更新数据的日志。如下图所示:

查看日志

查看数据:查看数据库中选中年份、季度的所有数据。如下图所示:

查看数据

导出数据:把计算的结果导出到EXCEL表格中。如下图所示:

导出数据

到此,七天学会「股票数据分析软件」的开发 第二部分就结束了,如果大家遇到什么问题给我留言,我给大家答疑。

经过第一部分,我们从 新浪财经 把股票的数据爬取下来并存入数据库中。经过第二部分,我们把爬取下来的数据进行分析处理,并把分析的结果存入数据库中。就剩下第三部分,把这些分析的结果可视化展示就OK啦。 See You 我们下次见。


经过8年多的发展,LSGO软件技术团队在地理信息系统、数据统计分析、计算机视觉领域积累了丰富的研发经验,也建立了人才培养的完备体系。

欢迎对算法设计与实现感兴趣的同学加入,与我们共同成长进步。

本微信公众平台长期系统化提供有关机器学习、软件研发、教育及学习方法、数学建模的知识,并将以上知识转化为实践。拒绝知识碎片化、耐心打磨技能、解决实际问题是我们的宗旨和追求。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
一篇文章带你搞懂非关系型数据库MongoDB
java基本类型的长度
java int short long float double 大整理(不要错过)
Elasticsearch 8.X 可以按照数组下标取数据吗?
php复选框、多选框提交数据处理办法
对Double型数据四舍五入取指定位数
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服