1# 数据提炼库
2
3import pandas as pd
4
5# 数据可视化库
6
7from matplotlib import pyplot as plt
1# 读取数据
2
3data_frame = pd.read_excel('/usr/load/movie.xls')
4
5# 截取票房数据
6
7data_frame['累计票房'] = data_frame['累计票房'].str[4:-1]
8
9# 将数据转换为浮点型
10
11data_frame['累计票房']=data_frame['累计票房'].astype('float')
12
13# 截取日期
14
15data_frame['上映时间'] = data_frame['上映时间'].str[:9]
16
17# 将'('替换为空值
18
19data_frame['上映时间'] = data_frame['上映时间'].str.replace("(", "")
20
21# 转化为时间格式
22
23data_frame['上映时间'] = pd.to_datetime(data_frame['上映时间'])
1# 提取上映时间年份,添加新的一列movie_year
2
3data_frame['movie_year'] = data_frame['上映时间'].dt.year
4
5# 根据年份汇总电影数量
6
7movie_years = data_frame.groupby('movie_year')['电影名'].count()
1# 设置图例
2
3plt.figure(figsize=(22,10),dpi=70)
4
5# X轴列表(年份)
6
7data_x = movie_years.index.tolist()
8
9# Y轴列表(电影数量)
10
11data_y = movie_years
12
13# 绘图
14
15plt.plot(data_x,data_y,color= 'b')
16
17plt.xlabel('年份')
18
19plt.ylabel('数量')
20
21plt.title('近年电影上映趋势')
22
23plt.show()
联系客服