-
pandas数据分析美国各区人口普查案例
需求:
- 导入文件,查看原始数据
- 将人口数据和各州简称数据进行合并
- 将合并的数据中重复的abbreviation列进行删除
- 查看存在缺失数据的列
- 找到有哪些state/region使得state的值为NaN,进行去重操作
- 为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN
- 合并各州面积数据areas
- 我们会发现area(sq.mi)这一列有缺失数据,找出是哪些行
- 去除含有缺失数据的行
- 找出2010年的全民人口数据
- 计算各州的人口密度
- 排序,并找出人口密度最高的五个州 df.sort_values()
1. 导入文件,查看原始数据
import numpy as np from pandas import DataFrame,Series import pandas as pd
2. 将人口数据和各州简称数据进行合并
3. 将合并的数据中重复的abbreviation列进行删除
4. 查看存在缺失数据的列
5. 找到有哪些state/region使得state的值为NaN,进行去重操作
6. 为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN
7. 合并各州面积数据areas
8. 我们会发现area(sq.mi)这一列有缺失数据,找出是哪些行
9. 去除含有缺失数据的行
10. 找出2010年的全民人口数据
11. 计算各州的人口密度
12. 排序,并找出人口密度最高的五个州 df.sort_values()
转载自:https://www.cnblogs.com/aitree/p/14304326.html
最新更新
王炸!!IDEA 2021.1 推出语音、视频功能,
并发编程之ThreadLocal
为什么 DNS 协议使用 UDP?只使用了 UDP 吗
死磕Spring之AOP篇 - Spring AOP注解驱动与XM
学习笔记:Java中的数据结构——数组
Mybatis的日志工厂
rabbitmq五种模式详解(含实现代码)
rabbitmq五种模式详解(含实现代码)
ArryaList源码浅析
jasypt在springboot项目中遇到异常:Error cr
JAVA oa 办公系统模块 设计方案
MongoDB vs MySQL,哪个效率更高?
NoSql非关系型数据库之MongoDB应用(三):M
10分钟系列:NetCore3.1+EFCore三步快速完成数
NoSql非关系型数据库之MongoDB应用(一):安
NoSql非关系型数据库之MongoDB应用(二):安
【干货】SqlServer 总结几种存储过程分页的
SQLServer存储过程自制数据字典
MYSQL事务篇(高级篇)
mysql常用语句 3
Taro 3.4 beta 发布: 支持 Preact 为应用开辟
前端---梳理 http 知识体系 2
Java入门到架构师全新课程之JavaScript数据
构造函数与实例化之间的关系和原型的引
Vue库的使用
IIS安装和ASP.NET Web应用程序开发期间部署
ASP.NET MVC IOC依赖注入之Autofac系列开篇
ASP.NET中WebService的创建和部署以及通过反
ASP.NET Core Web 应用程序开发期间部署到I
ASP.NET Core Web 应用程序系列(一)- 使用