打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
大数据IMF传奇行动绝密课程第66课:Spark SQL下Parquet中PushDown的实现

Spark SQL下Parquet中PushDown的实现

1、Spark SQL下的PushDown的价值
2、Spark SQL下的Parquet下的PushDown实现

SQL角度讲有基本的过滤、语法树。语法树过滤也有2个层次,一个是基本的过滤,一个是真正的解析。优化是对各种filter进行合并,而且会调整顺序。最后从Catalyst角度,它会变成RDD进行操作,最后会装入到DataSourceStrategy。DataSourceStrategy会通过Parquet高层的API来操作Parquet。Parquet内部再收到上层的过滤条件的时候底层如何映射。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Spark技术解析及其在百度最大千台单集群的应用实践
Python之pyspark:pyspark的简介、安装、使用方法之详细攻略
spark范例
开源IndexR:如何对上千亿的数据进行秒级探索式分析
spark sql根本使用方法介绍
Apache Spark 1.5新特性介绍
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服