当前位置:
首页 > temp > python入门教程 >
-
利用Python对招聘信息数据分析
作者 | 小何学长 |
---|---|
专业 | 软件工程 |
开发环境准备
导入开发所需相应的类库
1. 数据归纳整理
1.1 文件合并
合并后的CSV文件如下,包含了所有给定的数据:
合并文件后将合并后的文件上传,合并好的数据表名字为:data.csv
2. 载入数据,获取数据
2.1 预览数据
3. 数据处理与加工
一般而言salary列的值比较混乱,有数字有字符串,我们需要加工薪水数据,把薪水的上限下限隔离出来,以便于统计。观察可得,大部分的薪水是含有上下限的,单位为小写的千或万,中间用“-”作为连接的字符串,个别职位会出现“面议”的描述。这里用apply方法传入自定义的函数进行数据加工。
3.1 处理薪资字段
处理后以千(K)作为基本单位
3.2 获取薪资的上下界限值
3.3 增加平均薪资
3.4 将公司的规模数据化
3.5 增加公司的平均规模
4. 数据分析与可视化
4.1岗位和人才需求分析
4.1.1 分析岗位需求量排名前10的职业
4.1.2 岗位需求城市分布
4.1.3 分析各地区招聘的人才需求
4.2 职位和学历的分析
4.3 薪资分析
4.3.1 平均薪资柱状图
4.3.2 箱线图—不同城市的平均薪资分布情况
4.3.3 各地区岗位需求前10的平均薪资情况
4.4 公司类型分析
4.5 公司职位分析
4.5公司人数规模分析
分析总结
1.就业去向可以根据当地的人才需求和岗位需求量作为指引方向之一,人才需求越大,就业的机会也就越大
2.根据岗位排名的分析已经知道,从事计算机,管理等工程师或经理,其待遇和薪资都比较丰厚
3.民营企业占大多数招聘公司的比重
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数