数据可视化

视图相关知识点:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import matplotlib.pyplot as plt
#曲线图
input_values=[1,2,3,4,5]
squares=[1,4,9,6,25]
#设置线条的
plt.plot(input_values,squares,linewidth=5)
#设置图标标题,并给坐标轴加上标签
plt.title("salery of the year",fontsize=24)
plt.xlabel("year",fontsize=14)
plt.ylabel("salery",fontsize=14)
#设置刻度标记的大小
plt.show()
#散点图
#plt.scatter(2,4)
#plt.show()
#导入多个点
x=list(range(1,20))
y=[n**2 for n in x]
plt.scatter(x,y,s=10,c=y,cmap=plt.cm.Reds)
plt.show()

将数据存入.csv文件里

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
import pandas as pd #数据框导入数据.to_csv
import matplotlib.pyplot as plt #绘图
import matplotlib as mpl #配置字体
mpl.rcParams["font.sans-serif"]=["SimHei"] #绘图中文字符解决
将爬取下来的数据进行保存到本地的方法之一
import pandas as pd
通过数组里的中,含有数组类型的
data=pd.DataFrame(arr)
data.to_csv('d:/show_data/lagou_python.csv',header=True,index=False,mode="a+")
这个表示的是创建csv文件(to_csv('路径',是否保留头标记,是否保留列标记,a+表示文件会继续添加数据,不覆盖之前的数据))
#读取文件
data3=pd.read_csv('D:/show_Date/lagou_python.csv')
#表示的是数据的前几(10)行
data3.head(10)
#表示数据的后几行(后10行)
data3.tail(10)
#表示第几列,表示的是第2列
data3.iloc[:,2]
#统计每一列中相同名称的个数 kind表示形式bar是直的,barh表示但是横向的
data3['学历要求'].value_counts().plot(kind='bar')
plt.title("学历要求",fontsize=24)
plt.show()
#统计工作时的工作经验
data3['工作经历'].value_counts().plot(kind='barh')
plt.title("工作经历",fontsize=24)
plt.show()
#饼状图
data3['工作地区'].value_counts().plot(kind='pie',autopct='%1.2f%%')
plt.title("工作地区",fontsize=24)
plt.show()

存入的数据形式

1
2
3
4
5
6
7
8
9
10
11
info={
'公司代号':rs['companyId'],
'公司名字':rs['companyFullName'],
'职位':rs['positionName'],
'工资待遇':rs['salary'],
'学历要求':rs['education'],
'工作地区':rs['city'],
'工作经历':rs['workYear']
}
# print(info)
arr.append(info)
Fork me on GitHub