air = pd.read_csv('data/AirPassengers.csv',parse_dates=['date'])
air['year'] = air['date'].dt.year
air['month']=air['date'].dt.month
对于时间序列数据,折线图很自然是最适合的表现形式之一,以年份为分类变量,可以展示在一年中的各个月份下航空乘客的变化关系,发现无论在哪一年,几乎都呈现夏季航空出行量最高的规律。
palette = sns.color_palette('hls',12)
fig=sns.lineplot(x='month',y='value',data=air,hue='year',palette=palette)
fig.set_xticks(range(1,13))
fig.set_xticklabels(["Jan", "Feb", "Mar", "Apr","May", "Jun", "Jul", "Aug","Sep", "Oct", "Nov", "Dec"])
plt.show()
fig=sns.lineplot(x='year',y='value',data=air,hue='month',palette=palette)
plt.show()
air_mat= air.pivot(index='year', columns='month',values='value')
sns.heatmap(data=air_mat,annot=True,fmt='d',linewidths=0.5)
plt.show()