打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Pandas的数据结构

1、Series

Series是一种类似与一维数组的对象,由下面两个部分组成:

values:一组数据(ndarray类型)
index:相关的数据索引标签

1)Series的创建

两种创建方式:

 

(1) 由列表或numpy数组创建

默认索引为0到N-1的整数型索引
还可以通过设置index参数指定索引
s.index = list('abcdef')
Series中的存放的数据必须是一维的
特别地,由ndarray创建的是引用,而不是副本。对Series元素的改变也会改变原来的ndarray对象中的元素。(列表没有这种情况)

2)Series的索引和切片

可以使用中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时返回的仍然是一个Series类型)。分为显示索引和隐式索引:

(1) 显式索引:

- 使用index中的元素作为索引值
- 使用.loc[](推荐)
   #显式索引
  s.loc[0]

  #进行切片
  s.loc['1':'5']

  #隐式索引
  s.iloc[0]

注意,此时是闭区间

3)Series的基本概念

可以把Series看成一个定长的有序字典

可以通过shape,size,index,values等得到series的属性

可以通过head(),tail()快速查看Series对象的样式

当索引没有对应的值时,可能出现缺失数据显示NaN(not a number)的情况

可以使用pd.isnull(),pd.notnull(),或自带isnull(),notnull()函数检测缺失数据

4)Series的运算

(1) 适用于numpy的数组运算也适用于Series

(2) Series之间的运算

在运算中自动对齐不同索引的数据
如果索引不对应,则补NaN
2、DataFrame

DataFrame是一个【表格型】的数据结构,可以看做是【由Series组成的字典】(共用同一个索引)。DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引,也有列索引。

行索引:index
列索引:columns
值:values(numpy的二维数组)
1)DataFrame的创建

最常用的方法是传递一个字典来创建。DataFrame以字典的键作为每一【列】的名称,以字典的值(一个数组)作为每一列。

此外,DataFrame会自动加上每一行的索引(和Series一样)。

同Series一样,若传入的列与字典的键不匹配,则相应的值为NaN。

DataFrame属性:values、columns、index、shape

2)DataFrame的索引

(1) 对列进行索引

- 通过类似字典的方式
- 通过属性的方式
可以将DataFrame的列获取为一个Series。返回的Series拥有原DataFrame相同的索引,且name属性也已经设置好了,就是相应的列名。

(2) 对行进行索引

- 使用.ix[]来进行行索引 #对于行的检索,返回值,也是Series
- 使用.loc[]加index来进行行索引 #!!! ['A','B'],如果检索多行返回的数据,是DataFrame
- 使用.iloc[]加整数来进行行索引 #左闭右开
同样返回一个Series,index为原来的columns。

(3) 对元素索引的方法

- 使用列索引
- 使用行索引(iloc[3,1]相当于两个参数;iloc[[3,3]] 里面的[3,3]看做一个参数)
- 使用values属性(二维numpy数组)


3)DataFrame的运算

(1) DataFrame之间的运算

同Series一样:

在运算中自动对齐不同索引的数据
如果索引不对应,则补NaN
(2) Series与DataFrame之间的运算

【重要】

使用Python操作符:以行为单位操作(参数必须是行),对所有行都有效。(类似于numpy中二维数组与一维数组的运算,但可能出现NaN)

使用pandas操作函数:

axis=0:以列为单位操作(参数必须是列),对所有列都有效。
axis=1:以行为单位操作(参数必须是行),对所有行都有效。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
数据分析之pandas基础操作
Python数据分析笔记——Numpy、Pandas库
pandas和numpy有什么关系?
Python数据分析-Pandas
python基础1| 索引与切片
Pandas数据处理方法(包括数据库数据和普通文件数据)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服