当前位置:
首页 > temp > python入门教程 >
-
Python造“假”数据,用扩展库Faker足够了!(附源码)
前言
今天用Python给大家造“假”数据,直接开整~
开发工具
Python版本:3.6.4
相关模块:Faker
Faker扩展库
这时,Python扩展库Faker来了,带着它那各种各样的数据来了。
先安装faker
pip install Faker
创建faker对象
from faker import Faker
fake = Faker()
随机生成一个名字
fake.name() # 'Nancy Horton'
上边生成的名字是英文的,如果想要个中文名字,在创建Faker对象的时候,指定语言“中文”就可以。
fake = Faker("zh_CN")
一些常用的语言包括以下等等:
- 简体中文:zh_CN
- 繁体中文:zh_TW
- 美国英文:en_US
- 英国英文:en_GB
- 德文:de_DE
- 日文:ja_JP
- 韩文:ko_KR
- 法文:fr_FR
都有什么样的数据
faker 提供了一些Standard Providers,列出了一些较为较为常用的数据。
- address
- company
- date_time
- job
- person
- phone_number
- profile
- python
- user_agent
比如生成“地址”信息
In [1]: fake.address()
Out[1]: '北京市大冶市海陵赵路x座 941837'
这里给出的是一整条“地址”的信息,你也可以通过building_number()、city()、street_address()等获取单个信息
这些字段其实记不住也没什么,需要用哪个的时候查阅官方文档就行。
文档链接
https://faker.readthedocs.io/en/master/providers.html
再比如生成“职位”信息
In [2]: fake.job()
Out[2]: '教育/Python工程师'
生成python的数据类型
# 生成一个字典
In [3]: fake.pydict()
Out[3]:
{'生产': 'OlmMWPfQMJYxeiJtZSFC',
'有些': 'jUYzbWgDEqvzjiAsubSX',
'资源': 7670,
'应用': 804210265906561.0,
'国际': 9113,
'电影': 'https://yangtang.cn/homepage.jsp',
'方面': 'RGfbqIgxqTbnjkGDpoVO',
'为什': 1947,
'地址': 7021,
'时候': 'oxia@hotmail.com'}
生成user_agent
In [4]: fake.chrome()
Out[4]: 'Mozilla/5.0 (iPad; CPU iPad OS 4_2_1 like Mac OS X) AppleWebKit/531.2 (KHTML, like Gecko) CriOS/55.0.807.0 Mobile/62B715 Safari/531.2'
生成个人信息
In [5]: fake.profile()
Out[5]:
{'job': '代码管理员',
'company': '文亭传媒有限公司',
'ssn': '370302198922223749',
'residence': '广东省深圳市沈北新王路k座 203394',
'current_location': (Decimal('32.942244'), Decimal('95.029663')),
'blood_group': 'O-',
'website': ['https://www.minyan.cn/'],
'username': 'yangwen',
'name': '蒋璐',
'sex': 'M',
'address': '宁夏回族自治区宁德县丰都长沙街b座 685258',
'mail': 'oliao@yahoo.com',
'birthdate': datetime.date(1971, 2, 13)}
如果想生成多条个人信息,可以利用for循环,把每个字典在添加到列表里,导出一个DataFrame
文章到这里就结束了,感谢你的观看,Python数据分析系列,下篇文章分享Python 爬取鲁迅先生《经典语录》
为了感谢读者们,我想把我最近收藏的一些编程干货分享给大家,回馈每一个读者,希望能帮到你们。
出处:https://www.cnblogs.com/tsp728/p/15137568.html
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数