打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略

Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略


pandas-profiling库的简介

        从pandas数据路由生成配置文件报告。pandas df.describe()函数很棒,但对于严肃的探索性数据分析来说有点基础。pandas_profiling通过php .profile_report()扩展了pandas DataFrame,用于快速数据分析。对于每一列,以下统计数据-如果与列类型相关-在一个交互式HTML报告中显示:

  • 类型推断:检测数据流中的列类型。
  • 基本要素:类型、唯一值、缺失值
  • 分位数统计如最小值,Q1,中位数,Q3,最大值,范围,四分位数范围
  • 描述统计,如平均值,众数,标准差,总和,中位数绝对偏差,变异系数,峰度,偏度
  • 最常见的价值观
  • 柱状图
  • 高度相关变量的相关性突出,Spearman, Pearson和Kendall矩阵
  • 缺失值矩阵,计数,热图和缺失值的树状图
  • 学习文本数据的分类(大写,空格),脚本(拉丁语,西里尔字母)和块(ASCII)。
  • 文件和图像分析提取文件大小,创建日期和尺寸和扫描截短的图像或那些包含EXIF信息。

pandas-profiling库的安装

pip install pandas-profiling

pandas-profiling库的使用方法

1、基础用法

import numpy as np
import pandas as pd
from pandas_profiling import ProfileReport

df = pd.DataFrame(
    np.random.rand(100, 5),
    columns=["a", "b", "c", "d", "e"]
)

profile = ProfileReport(df, title="Pandas Profiling Report")
profile.to_file("your_report.html")


profile = ProfileReport(large_dataset, minimal=True)
profile.to_file("output.html")

profile = df.profile_report(title='Pandas Profiling Report', plot={'histogram': {'bins': 8}})
profile.to_file("output.html")
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
特别实用的详解:Python pandas库中的isnull()问题(建议收藏)
python中三个不常见但是非常有用的数据科学库
【Python数据清洗】这些非标准库,让你的数据处理更加高效!
这4款数据自动化探索 Python 神器,解决99%的数据分析问题!
python中判断一个dataframe非空
关于在python中如何使用pandas库读取excel表格后 删除含有空值的列
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服