【每天几分钟,从零入门python编程的世界!】
我们平常工作中处理数据、做一些统计之类的事情,一般都是使用Excel,尤其是财务等岗位的人员,使用Excel非常方便,输入什么数据就显示什么数据,所见即所得。但是Excel的缺点就是,它能够处理的数据是很有限的,如果里面的数据很多,就会非常非常慢,如果用它去计算大量的数据,那更是会令人崩溃。
但是用Python的pandas去做科学计算以及数据处理是非常快速的。我们可以把pandas想象成一个对Excel表格进行精准数据处理的更高级的工具,它是通过代码对里面的数据做精确的计算。比如说如果要拿到一个上市公司的财务报表进行分析,如果用Excel的话,你就会完全看不出哪里有数据缺失,但是用Python的pandas这些工具的话,就能够快速的进行数据的整理和计算,财务报表还是数据量相对比较小的,如果是更大的数据量,用Excel就会非常崩溃。
●对照Excel设置pandas
我们可以把Spyder中的IPython的console显示区域看做是一个Excel。
当数据量比较大的时候,在console区域就会把其中的某些列或者某些行的数据省略掉,用三个点...表示。我们为了让数据显示的更加全面,就对pandas做一些简单的设定。这样就可以知道这些数据整体是什么样的格式和排版,每一列代表什么东西,就会看的清楚一点,也方便对数据进行精准的控制。
设置pandas:
数据显示:
我们看到数据显示出来跟Excel还是比较相似的,都是通过每一行每一列进行显示。
代码说明:
pd.set_option('display.max_rows',100)
pd.set_option('display.max_columns',100)
这两行代码就是对pandas进行设置:设置显示的最大行为100,最大列数为100,当然你也可以自定义显示的行数和列数,不一定要用100。
比如说,当你行数设置最大显示1000时,如果数据不超过1000行,就不会有行数据被...代替,大家自己试试,感受一下。
关于pandas的设置很简单,只是为了方便我们看数据的整体格式。
联系客服