当前位置:
首页 > Python基础教程 >
-
Python第十三章-网络编程(2)
)
2.
3.
2. parse.urlunparse()
是把各个部分组合成url
字符串.
from urllib.parse import *
o = urlparse('http://www.cwi.nl:80/%7Eguido/Python.html')
urlstr = urlunparse(o)
print(urlstr)
3. parse.urljoin()
urljoin()
实现了url
的连接功能.
urljoin(base, new_url, allow_fragments=True)
说明:
取得base
的根路径(不包括路径中末端的文件), 然后与new_url
连接起来.
from urllib.parse import *
newUrl = urljoin('http://www.cwi.nl/abc/Python.html', 'FAQ.html')
print(newUrl)
5.4 request模块
urllib.request
模块提供了许多函数, 可用于从指定URL加载数据, 同时也可以对字符串进行编码解码工作, 以便再URL中以正确的形式显示出来.
request.urlopen()
urlopen(url, data=None[, timeout])
说明:
- 该函数, 打开指定的url并返回类文件对象, 可使用该对象读取返回的数据.
-
对所有HTTP请求, 最常用的是
GET
请求, 向服务器发送的请求参数应该是url
的一部分. 注意使用到的参数应该是已经经过url编码的(使用parse.urlencode()
编码). -
如果是
post
请求, 请求的字符串(包括表单数据)应该放在第二个参数data
中.
from urllib.request import *
with urlopen("http://www.yztcedu.com") as r:
print(r)
urlopen()
的返回值类文件对象
一旦连接成功, urlopen()
会返还一个类文件对象, 就像在目标路径下打开了一个可读文件。
urlopne()类文件对象方法 | 描述 |
---|---|
f.read([bytes]) | 从文件中读取所有或bytes个字节 |
f.readline() | 从f中读取一行 |
f.readlines() | 从f中读取所有行, 作为列表返回 |
f.close() | 关闭f的url连接 |
f.fileno() | 返回f的文件句柄 |
f.info() | 返回f的mime头文件 |
f.geturl() | 返回f的真正url |
from urllib.request import *
with urlopen("http://www.yztcedu.com") as r:
for line in r.readlines():
print(line.decode("utf-8"))
作者:平仄平仄平平仄 |
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式