-
Python数据分析绘图过程详细讲解(附代码)
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
作者:小汤豆
来源:汤豆道课
Python爬虫、数据分析、网站开发等案例教程视频免费在线观看
https://www.xin3721.com/eschool/pythonxin3721/
一. 数据准备
数据说明
示例数据,其中数据均为虚拟数据,与实际生物学过程无关
文件名:dataset_volcano.txt
列分别为基因 (gene),差异倍数(logFC),t-test的P值(P.Value)
二. 绘制火山图
先上效果图:
Step 1: 导入数据:
import pandas as pd # Data analysis import numpy as np # Scientific computing import seaborn as sns # Statistical visualization # 读取数据 df = pd.read_csv('./dataset_volcano.txt', sep='\t') result = pd.DataFrame() result['x'] = df['logFC'] result['y'] = df['P.Value'] result['-log10(pvalue)']=-df['P.Value'].apply(np.log10)
Step2: 设置阈值
# 设置pvalue和logFC的阈值 cut_off_pvalue = 0.0000001 cut_off_logFC = 1
Step3: 设置分组
#分组为up, normal, down result.loc[(result.x> cut_off_logFC )&(result.y < cut_off_pvalue),'group'] = 'up' result.loc[(result.x< -cut_off_logFC )&(result.y < cut_off_pvalue),'group'] = 'down' result.loc[(result.x>=-cut_off_logFC )&(result.x<=cut_off_logFC )|(result.y >= cut_off_pvalue),'group'] = 'normal'
Step4: 绘制散点图
#绘制散点图 ax = sns.scatterplot(x="x", y="-log10(pvalue)", hue='group', hue_order = ('down','normal','up'), palette=("#377EB8","grey","#E41A1C"), alpha=0.5, s=15, data=result)
Step5: 设置散点图
#确定坐标轴显示范围 xmin=-6 xmax=10 ymin=7 ymax=13 ax.spines['right'].set_visible(False) #去掉右边框 ax.spines['top'].set_visible(False) #去掉上边框 ax.vlines(-cut_off_logFC, ymin, ymax, color='dimgrey',linestyle='dashed', linewidth=1) #画竖直线 ax.vlines(cut_off_logFC, ymin, ymax, color='dimgrey',linestyle='dashed', linewidth=1) #画竖直线 ax.hlines(-np.log10(cut_off_pvalue), xmin, xmax, color='dimgrey',linestyle='dashed', linewidth=1) #画竖水平线 ax.set_xticks(range(xmin, xmax, 4))# 设置x轴刻度 ax.set_yticks(range(ymin, ymax, 2))# 设置y轴刻度 ax.set_ylabel('-log10(pvalue)',fontweight='bold') # 设置y轴标签 ax.set_xlabel('log2(fold change)',fontweight='bold') # 设置x轴标签
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
JavaScript判断两个数组相等的四类方法
js如何操作video标签
React实战--利用甘特图和看板,强化Paas平
【记录】正则替换的偏方
前端下载 Blob 类型整理
抽象语法树AST必知必会
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程