当前位置:
首页 > temp > python入门教程 >
-
Python 利用Pandas把数据直接导入Mysql
需要把txt文件数据导入mysql数据库,中间需要经过一些数据处理,在经过相关查找后,pandas自带的to_sql(),可以实现把DataFrame直接导入数据库。
虽然mysql有其他的方式导入数据,但是在导入前需要对数据进行一些处理,这些任务无法完成,所以可以借助python来一步实现所有需求。
pandas在处理表格数据有很多优点:API多比较方便、速度快;可循环每行,对每个值进行处理;也可对整列进行处理等
在导入数据库时用的是如下API:
Pandas.DataFrame.to_sql()
参数介绍及注意事项
官方文档:[https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_sql.html]
DataFrame.to_sql(name, con, schema=None, if_exists='fail', index=True, index_label=None, chunksize=None, dtype=None, method=None)
常用参数:
-
name:
导入到mysql时表的名字
如果mysql里面已经用CREATE TABLE创建好了表,那么就是该表名字
如果mysql没有创建好表,那么可以自己起一个合适的表名 -
con:
数据库连接,需要安装sqlalchemy库,目前仅支持sqlalchemy库创建的连接,pymysql库创建的连接不支持
engine = create_engine("mysql+pymysql://root:z123456@127.0.0.1:3306/routeapp?charset=utf8")
2#SQLALCHEMY_DATABASE_URI = '%s+%s://%s:%s@%s:%s/%s' % (DB_TYPE, DB_DRIVER, DB_USER,DB_PASS, DB_HOST, DB_PORT, DB_NAME)
-
if_exists:以下三个选项,是如果数据库里面已经存在该表的意思
"fail":直接报错,不再操作,类似mysql创建表时的IF NOT EXISTS才创建表
"replace":先删除该表,然后再创建
"append":直接在表后面添加数据 -
index:bool
是否把DataFrame的索引列写入表中 -
index_label:
如果要把DataFrame的索引列写入表中,那么需要给出该索引列的名字,如果没给的话,那就会用DataFrame的列索引名
注意事项:
con 参数一定要仔细核对,否则数据库会连接失败,可参照上面给出的例子按自己的实际数据库位置进行更改
案例
首先电脑上已安装:mysql软件、sqlalchemy库、pandas库
现在有一些城市之间的火车车次信息,需要导入数据库
import pandas as pd
data=pd.read_table('./data_pandas.txt')
data.head()
假如数据库里面已经创建好该表,并且已经指定好各列的数据类型,现在只需把数据导入到里面
CREATE TABLE IF NOT EXISTS train (
start_city VARCHAR (100) NOT NULL COMMENT '始发城市',
start_city_id int COMMENT '始发城市id',
end_city VARCHAR (100) NOT NULL COMMENT '到达城市',
end_city_id int COMMENT '到达城市id',
train_code VARCHAR (20) NOT NULL COMMENT '车次',
arrival_time VARCHAR (20) NOT NULL COMMENT '到达时间',
departure_time VARCHAR (20) NOT NULL COMMENT '出发时间',
run_time INT NOT NULL COMMENT '运行时间(分钟)',
P1 FLOAT COMMENT '硬座票价',
P2 FLOAT COMMENT '软座票价',
P3 FLOAT COMMENT '硬卧票价',
P4 FLOAT COMMENT '软卧票价',
P5 FLOAT COMMENT '商务座票价',
P6 FLOAT COMMENT '一等座',
P7 FLOAT COMMENT '二等座'
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '城市之间火车信息';
借助sqlalchemy库来导入数据
from sqlalchemy import create_engine
engine = create_engine("mysql+pymysql://root:z123456@127.0.0.1:3306/routeapp?charset=utf8")
#SQLALCHEMY_DATABASE_URI = '%s+%s://%s:%s@%s:%s/%s' % (DB_TYPE, DB_DRIVER, DB_USER,DB_PASS, DB_HOST, DB_PORT, DB_NAME)
with engine.begin() as conn:
data.to_sql(name='routeapp_train_line_tb_new_2',con=conn,if_exists='append',index=False)
这里用with语句可以实现mysql的roallback功能,建议最好用with来导入数据
出 处:
https://www.cnblogs.com/python147/p/14523486.html
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数