打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
高维数据可视化利器--更快从高维度数据中挖掘隐藏模式。
kaggle竞赛宝典技巧
作者:杰少

高维数据可视化--Hypertools

简 介

平时我们可以通过seaborn,matplotlib,plotly等工具包进行二维,三维数据等可视化,但是高维度数据的可视化一直是一大难点,如果能对高维数据进行可视化,可以帮助我们更容易识别不同数据列之间的隐藏模式、关联性等。今天和大家分享一个有趣的高维数据可视化工具--Hypertools。

Hypertools是建立在matplotlib、sklearn 和 seaborn 之上的,Hypertools通过降低数据维度来对高维数据集进行可视化。

 

HyperTools的功能主要包括:

  • 在2/3D 中绘制高维数据集的;
  • 可以绘制静态图和动画图;
  • 自定义绘图样式的简单API;
  • 一组强大的数据操作工具,包括超对齐、k均值聚类、归一化等;
  • 支持Numpy数组、Pandas DataFrame、文本或(混合)列表;
  • 可以将主题模型和其他文本矢量化方法应用于文本数据;
示例代码
  • 代码摘自:https://towardsdatascience.com/visualizing-high-dimensional-data-f59eab85f08b

01


Basic Plot

# pip install hypertools 
import hypertools as hyp
%matplotlib inline
# data loading
basic = hyp.load('weights_sample')
basic
basic.plot(fmt='.')

 

02


Cluster Plot

clust = hyp.load('mushrooms')
# Creating plot
clust.plot(n_clusters=10)

 

03


Corpus Plots

text = ['i am from India''India is in asia''Asia is the largest continent',
        'There are 7 continents''Continents means earth surfaces ''Surfaces covers land area',
        'land area is largest in asia'
hyp.plot(text, '*', corpus=text)

04


UMAP


from sklearn import datasets
data = datasets.load_digits(n_class=6)
df = data.data
hue = data.target.astype('str')
hyp.plot(df, '.', reduce='UMAP', hue=hue, ndims=2)

 

05


Animated Plots

ani = hyp.load('weights_avg'
ani.plot(animate=True, chemtrails=True)

  
参考文献
  1. https://hypertools.readthedocs.io/en/latest/
  2. Visualizing High Dimensional Data

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
机器学习可视化利器--Yellowbrick
09-选择适合你的Python可视化工具(续)
Python如何完美地适合大数据?
Python数据分析,如何掌握常用的数据分析包,看这篇就够了
70多个方法,轻松入门Python可视化编程
利用Python Matplotlib实现数据动态可视化
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服