在学过了Python爬虫、数据分析之后,曾几何时,这样一个问题一直缠绕着我。
Python爬虫能用来干点什么?Python数据分析能不能让这剪不断理还乱的数据变得更有意义?
也许,想来想去,只有用来干这个,才会让Python爬虫和数据分析,变得更有意思,尤其最后得出来的结论,绝对是满满的情趣。
额,本来想要用整篇文章来写一下如何爬取电商平台的信息并且做出相应分析的,但是现在看来,是我想得太简单了,如果把整个爬取的过程和分析数据的过程全都写出来,没有上万字怕是不可能的。
但是我们可以看一下经过数据抓取和分析之后,得出来的一些数据和结论。
1、分析避孕套标题高频关键字 与 商品数量关系
分析结论:
1. 包含情趣二字的商品有1150款,占到总数(2500款 )的46%。
2. 前三甲是:情趣、尿酸、颗粒
2、分析避孕套高频关键字 与 平均销量关系
分析结论:
1. 螺纹功能平均销量最高
2. 功能平均销量前三分别是:螺纹、颗粒、狼牙
3、分析避孕套标题高频关键字 与 平均售价关系
分析结论:
1. 可以看到前排几个基本都是关于材质的
2. 凝胶、透明质、免洗这三项均价最贵,超过100大洋
4、分析避孕套商家全国平均销量关系
分析结论:
出乎意料的是山西39个商家平均销量竟然是第一为1535。
汇总后其他数据结论:
用户偏爱螺纹、颗粒、狼牙等功能
凝胶、透明质、免洗这三项均价最贵,超过100大洋
价格区间在21-40的商品最多为778款,大约占比31%
销量在1000以内的最多,大概占比90%
定价在31.9-39这个区间平均销量最高,为893
避孕套商家数量前三甲:广东、上海、浙江
山西省平均销量最高为山西
所以,根据以上结论,可能推出一款这样的产品,并标题带有螺纹、颗粒、狼牙,设置价格在31-40元之间,会更佳的畅销。
联系客服