-
python入门教程之Python爬虫是如何遍历文档树呢?一招教你(4)
运行结果
1
2
3
|
<generator object descendants at 0x00519AB0> <title>The Dormouse's story</title> The Dormouse's story |
3.节点内容:.string属性
如果Tag只有一个NavigableString类型子节点,那么这个Tag可以使用.string得到子节点。如果一个Tag仅有一个子节点,那么这个Tab也可以使用.string方法,输出结果与当前唯一子节点的.string结果相同。
通俗点来讲就是:如果一个标签里面没有标签了,那么.string就会返回标签里面的内容。如果标签里面只有唯一的一个标签了,那么.string也会返回里面的内容。例如:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
#!/usr/bin/python3 # -*- coding:utf-8 -*- from bs4 import BeautifulSoup html = "" " <html><head><title>The Dormouse's story</title></head> <body> <p class = "title" name= "dromouse" ><b>The Dormouse's story</b></p> <p class = "story" >Once upon a time there were three little sisters; and their names were <a href= "http://example.com/elsie" class = "sister" id= "link1" ><!-- Elsie --></a>, <a href= "http://example.com/lacie" class = "sister" id= "link2" >Lacie</a> and <a href= "http://example.com/tillie" class = "sister" id= "link3" >Tillie</a>; and they lived at the bottom of a well.</p> <p class = "story" >...</p> "" " # 创建 Beautiful Soup 对象,指定lxml解析器 soup = BeautifulSoup(html, "lxml" ) print (soup.head.string) print (soup.head.title.string) |
栏目列表
最新更新
如何使用OS模块中的stat方法
Python os 模块
seek() 方法
python打开文件实例1
Python写入文件
什么是流?
文件操作如何进制逐行读取
Python相对路径
with创建临时运行环境
Python文件操作
.Net Standard(.Net Core)实现获取配置信息
Linux PXE + Kickstart 自动装机
Shell 编程 基础
Shell 编程 条件语句
CentOS8-网卡配置及详解
Linux中LVM逻辑卷管理
1.数码相框-相框框架分析(1)
Ubuntu armhf 版本国内源
Linux中raid磁盘阵列
搭建简易网站
access教程之Access简介
mysql 安装了最新版本8.x版本后的报错:
Mysql空间数据&空间索引(spatial)
如何远程连接SQL Server数据库的图文教程
复制SqlServer数据库的方法
搜索sql语句
sql中返回参数的值
sql中生成查询的模糊匹配字符串
数据定义功能
数据操作功能