打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
104. 冥冥之中,自有天意

这周读了很多关于分形和幂律分布的文章,算是打开了新世界。很多我们不自知的行为,冥冥之中已经被数学决定。

1.股价

用分形模拟股价波动

学金融时最大的一个困惑是,股价每时每刻的波动,背后到底是什么在起作用?

在我看来,股票市场是一个天然的行为实验平台。这个平台由人们自己创造,又吸引成千上万的人参与其中。世界各地的人们博弈互动,最终反映在一根上上下下的曲线上。我以为,这跟曲线一定可以体现出一种群体行为背后的规律。这种规律是不以某个人的意志为转移的,并且冥冥之中早已被决定的。

传统的教科书会讲股价的走势是随机游走的。但是,最近在阅读一篇1999年的老文章A Multifractal Walk down Wall Street时,发现分形理论的创始人,美国数学家Mandelbrot分形理论更好的模拟了股票市场,解答了我的困惑。

什么是分形

分形是一种几何图案。这种几何图案的特点是,在放大后者缩小以后都会呈现同样的样式。这种特点被叫做自相似self-similarity)。Mandelbrot认为,股票和货币的波动都是类似的。当我们打开一张股价走势图并把它放大或缩小,我们会发现同样的模式出现。

该图是一个计算机产生的分形模拟。可以看到,从第一张图到第四张图,图形在缩小或者放大的过程中,呈现出同样的模式。这种模式就可以模拟股价走势。

你能看出这八张图哪一张时真的股价波动,哪一张是作者做的分形模拟吗?

第一行:显然走势太过单调。实际上这是根据著名的路易·巴舍利耶(Louis Bachelier)提出的服从钟形曲线的随机游走产生的图像;

第二行的图更加的不真实,因为大多数时候相对平缓,少数时候却有非常高的突出;

第三行的图综合了图一图二的优点和缺点,但是缺少一些股价波动的突出点。实际上,图二图三是Mandelbrot在早些时候对于随机游走模型做出的改进。

但是接下来从第四幅到第八幅图像就不是那么好判断了。其中5IBM的股价,6是美元与德国马克的汇率。4.7.8是作者做的多重分形模拟。可以看出这几张图的差别和模式已经非常接近了。

成千上万的交易者做出不同决策,最终影响到一条线的上下波动。这条线却如此服从数学的分形的模型。

2.词频

莎士比亚作品服从幂律分布

莎士比亚怎么也不会想到,自己所有作品中的用词词频,竟然精准的服从幂律分布。这就是著名的Zipf定律Zipf's law)。

美国哈佛大学语言学家齐夫(G.Zipf)在1935年对莎士比亚的所有作品的用词词频做过一次统计。这里采用卓克老师在课程里提到的数据。

莎士比亚在作品中一共用了10000个单词。如果按照词频统计,the出现了318次,and出现了294次,I出现了235次,to出现了215次,of出现了195次等等,一直排到最后一名。如果计算词频和排位的几次幂的比值,就会发现他们全部相等。并且可以求得β=1.132

也就是说,排序为r的单词出现次数f(r)反比于r的几次幂f(r)~r^β)。


卓克老师的课里还提到,如果考察莎士比亚的中文译本,会发现如果统计字频,那么幂律分布会消失,如果统计词频幂律分布又会显现。(暂时还没找到这篇论文)

还有人对中国的文学作品进行了统计。从甲骨文,青铜器铭文,到唐诗宋词,再到《红楼梦》《毛选》《邓选》甚至莫言小说,《亮剑》等,发现秦朝以前字频的幂律分布存在,越到近代词频幂律分布越明显。

文学作品中呈现幂律分布的原因主要是语法。英语中,由于语法要求,定冠词,介词,代词应该在固定的位置出现。但对于中文来说,秦朝以前单字就可以代表一个意群。但是越到近代,词语之间越互相绑定。

幂律分布出现最主要的原因是,样本之间不独立。

 

3. 28法则 

28法则也是一种幂律分布

符合幂律分布的事件,绝大多数事件规模极小,只有少数事件规模极大。另一种更著名的描述方法是二八定律

莎士比亚作品的词频统计还可以得出另一个结论——百分之二十的词占用了百分之八十的篇幅。这也就是为什么学习一门新语言只需要认识两千词左右,就基本可以看懂文章内容。

幂律分布在词频中的定律叫做齐夫定律,在经济发展领域则叫做帕累托定律Pareto’s law)。他发现,如果统计个人收入,20%的人瓜分了80%的社会财富。

同样,打开支付宝可以看到我们的本年度理财收益率。我有时候竟然可以排到全国98%,但其实收益率也并不高。可想而知,支付宝的收益率也可能服从幂律分布,极少数的人的收益率远高于绝大多数人。

(类似的,Gutenberg Richter以及其他研究还发现了地震等自然灾害的严重程度和频次一样服从幂律分布)

 

4.城市规模

一举一动,难逃天意

我们看似自发建立了城市。有的人在这盖房子,有的人在那开超市,可是冥冥之中,城市的规模和人口之间的关系也早以被确定。

万维钢老师在讲《规模》这本书的时候提到了城市的标度率,即幂律分布的那个幂指数。其中,城市的基础设施建设和人口的0.85次方成正比,城市的产出和人口的1.15次方成正比。

另外,地球城市灯光的卫星图和星系图也惊人的相似。

这是Mandelbrot用分形模拟的一张1/8天空图。灯光的建设者对于分形和可能一无所知,但是最终我们不得不服从自然的定律。原因就在于,城市是一个社交网络,城市不是独立分布的样本,人与人之间互相影响。

不论是之前说的最优停止理论,还是这次说的股票市场,词频,收入水平,城市规模,我们自以为自己可以决定的事情,冥冥之中,早已被数学定律决定。


总结一下,

1.股价的波动可以用分形来模拟

2.日常语言的词频服从幂律分布,即齐夫定律

3.幂律分布在经济领域的应用是帕累托定律,即二八法则

4.城市的规模与人口的关系服从幂律分布

5.幂律分布的成因是样本之间不独立

参考,

Mandelbrot, B.B., 1999. A multifractal walkdown Wall Street. Scientific American, 280(2), pp.70-73.

Mandelbrot, B.B., 1983. The fractal geometry of nature (Vol. 173, p. 51). New York: WH freeman.

Mandelbrot, B., 1967. How long is the coast of Britain? Statistical self-similarity and fractional dimension. science, 156(3775), pp.636-638.

卓克《科学思维课》幂律揭示生活规律
万维钢精英日课第二季 《为什么城市越大越好》

Wang,D., Li, M., Di, Z., 2005. True reason for Zipf’s law in language. Physica A,pp.358-545.

Zipf,G.K., 2013. Thepsycho-biology of language: An introduction to dynamic philology. Routledge.

https://www.docin.com/p-1549084317.html

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
可推导出幂律分布的模型的文献小结
[笔记+整理]随机网络和无标度网络
ZIPF分布、PARETO分布和幂律分布
幂律分布背后的数学逻辑,了解一下?
从幂律分布说开去
异夫的世界
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服