当前位置:
首页 > Python基础教程 >
-
【pandas小技巧】--DataFrame的显示样式
上一篇介绍了DataFrame
的显示参数,主要是对DataFrame
中值进行调整。
本篇介绍DataFrame
的显示样式的调整,显示样式主要是对表格本身的调整,
比如颜色,通过颜色可以突出显示重要的值,观察数据时可以更加高效的获取主要信息。
下面介绍一些针对单个数据和批量数据的样式调整方式,让DataFrame
的数据信息更加的一目了然。
1. 多列显示格式
每个DataFrame
都有个style
属性,通过这个属性可以来调整显示的样式。
下面的示例,一次调整多个类型的列的显示。
import pandas as pd
df = pd.DataFrame(
{
"日期": ["2022-10-01", "2022-11-11",
"2022-12-12", "2023-01-01", "2023-02-02"],
"单价": [1099.5, 8790.0, 12.55, 10999.0, 999.5],
"数量": [1, 3, 1200, 4, 5],
}
)
df["日期"] = pd.to_datetime(df["日期"])
col_format = {
"日期": "{:%Y/%m/%d}",
"单价": "¥{:,.2f}",
"数量": "{:,} 件"
}
df.style.format(col_format)
调整之后:
-
日期格式改成用
/
来分割 - 单价前加了人民币符号,并且用逗号作为千位分隔符
- 数量用逗号作为千位分隔符,加了单位 件
调整之后,表格中的内容放入报告中会更加美观。
2. 背景色样式
除了调整数值的显示样式,更强大的功能是,我们可以调整单元格的颜色。
比如,下面的数据,我们先计算出总价,
然后用红色背景标记出总价最小的订单,用绿色背景标记出总价最大的订单。
df = pd.DataFrame(
{
"订单号": ["0001", "0002",
"0003", "0004", "0005"],
"单价": [1099.5, 8790.0,
12.55, 10999.0, 999.5],
"数量": [1, 3, 1200, 4, 5],
}
)
df["总价"] = df["单价"] * df["数量"]
col_format = {
"单价": "¥{:,.2f}",
"总价": "¥{:,.2f}",
}
df.style.format(col_format).highlight_min(
"总价", color="red"
).highlight_max(
"总价", color="lightgreen"
)
3. 渐变色样式
添加背景色之后,只能看出哪个订单总价最高,哪个订单总价最低。
对于其他的订单,没有直观的印象,所以,下面我们更进一步用渐变色来标记总价列。
总价越高,背景色越深,这样就对所有订单的总价有了直观的印象。
df = pd.DataFrame(
{
"订单号": ["0001", "0002", "0003", "0004", "0005"],
"单价": [1099.5, 8790.0, 12.55, 10999.0, 999.5],
"数量": [1, 3, 1200, 4, 5],
}
)
df["总价"] = df["单价"] * df["数量"]
col_format = {
"单价": "¥{:,.2f}",
"总价": "¥{:,.2f}",
}
df.style.format(
col_format
).background_gradient(
subset="总价", cmap="Greens"
)
4. 条形图样式
再进一步,用条形图+渐变色的方式显示总价信息。
这样,不仅可以看出总价的高低,还能大致看出究竟高了多少。
df = pd.DataFrame(
{
"订单号": ["0001", "0002", "0003", "0004", "0005"],
"单价": [1099.5, 8790.0, 12.55, 10999.0, 999.5],
"数量": [1, 3, 1200, 4, 5],
}
)
df["总价"] = df["单价"] * df["数量"]
col_format = {
"单价": "¥{:,.2f}",
"总价": "¥{:,.2f}",
}
df.style.format(
col_format
).bar(
subset="总价", cmap="Wistia"
)
5. 总结回顾
通过pandas
本身的样式参数,可以美化分析的结果,直接用于最后的报告或者PPT
中。
pandas
小技巧系统至此暂时告一段落,接下来,准备开始另一个关键的数据分析库:numpy
。
出处:https://www.cnblogs.com/wang_yb/p/17656039.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式