-
python入门教程之Python爬虫是如何遍历文档树呢?一招教你(3)
运行结果
1
2
|
<list_iterator object at 0x008FF950> <title>The Dormouse's story</title> |
相关推荐:《Python相关教程》
2.所有子孙节点:.descendants属性
上面讲的.contents和.children属性仅包含Tag的直接子节点,.descendants属性可以对所有Tag的子孙节点进行递归循环,和children类似,我们也需要通过遍历的方式获取其中的内容。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
#!/usr/bin/python3 # -*- coding:utf-8 -*- from bs4 import BeautifulSoup html = "" " <html><head><title>The Dormouse's story</title></head> <body> <p class = "title" name= "dromouse" ><b>The Dormouse's story</b></p> <p class = "story" >Once upon a time there were three little sisters; and their names were <a href= "http://example.com/elsie" class = "sister" id= "link1" ><!-- Elsie --></a>, <a href= "http://example.com/lacie" class = "sister" id= "link2" >Lacie</a> and <a href= "http://example.com/tillie" class = "sister" id= "link3" >Tillie</a>; and they lived at the bottom of a well.</p> <p class = "story" >...</p> "" " # 创建 Beautiful Soup 对象,指定lxml解析器 soup = BeautifulSoup(html, "lxml" ) # 输出方式为列表生成器对象 print (soup.head.descendants) # 通过遍历获取所有子孙节点 for child in soup.head.descendants: print (child) |
栏目列表
最新更新
如何使用OS模块中的stat方法
Python os 模块
seek() 方法
python打开文件实例1
Python写入文件
什么是流?
文件操作如何进制逐行读取
Python相对路径
with创建临时运行环境
Python文件操作
.Net Standard(.Net Core)实现获取配置信息
Linux PXE + Kickstart 自动装机
Shell 编程 基础
Shell 编程 条件语句
CentOS8-网卡配置及详解
Linux中LVM逻辑卷管理
1.数码相框-相框框架分析(1)
Ubuntu armhf 版本国内源
Linux中raid磁盘阵列
搭建简易网站
access教程之Access简介
mysql 安装了最新版本8.x版本后的报错:
Mysql空间数据&空间索引(spatial)
如何远程连接SQL Server数据库的图文教程
复制SqlServer数据库的方法
搜索sql语句
sql中返回参数的值
sql中生成查询的模糊匹配字符串
数据定义功能
数据操作功能