Python爬虫之selenium库使用详解(5)|python爬虫|python入门|python教程

当前位置:

首页 > 编程开发 > python爬虫 >

python爬虫之Python爬虫之selenium库使用详解(5)

本站最新发布 Python从入门到精通|Python基础教程
试听地址 https://www.xin3721.com/eschool/pythonxin3721/

等待

当使用了隐式等待执行测试的时候，如果 WebDriver没有在 DOM中找到元素，将继续等待，超出设定时间后则抛出找不到元素的异常, 换句话说，当查找元素或元素并没有立即出现的时候，隐式等待将等待一段时间再查找 DOM，默认的时间是0

隐式等待

到了一定的时间发现元素还没有加载，则继续等待我们指定的时间，如果超过了我们指定的时间还没有加载就会抛出异常，如果没有需要等待的时候就已经加载完毕就会立即执行

1

2

3

4

5

6

						from selenium import webdriver

						browser = webdriver.Chrome()

						browser.implicitly_wait(10)

						browser.get('https://www.zhihu.com/explore')

						input = browser.find_element_by_class_name('zu-top-add-question')

						print(input)

显示等待

指定一个等待条件，并且指定一个最长等待时间，会在这个时间内进行判断是否满足等待条件，如果成立就会立即返回，如果不成立，就会一直等待，直到等待你指定的最长等待时间，如果还是不满足，就会抛出异常，如果满足了就会正常返回

						from selenium import webdriver

						from selenium.webdriver.common.by import By

						from selenium.webdriver.support.ui import WebDriverWait

						from selenium.webdriver.support import expected_conditions as EC

						browser = webdriver.Chrome()

						browser.get('https://www.taobao.com/')

						wait = WebDriverWait(browser, 10)

						input = wait.until(EC.presence_of_element_located((By.ID, 'q')))

						button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '.btn-search')))

						print(input, button)

上述的例子中的条件：EC.presence_of_element_located（）是确认元素是否已经出现了

EC.element_to_be_clickable（）是确认元素是否是可点击的

常用的判断条件：

title_is 标题是某内容

title_contains 标题包含某内容

presence_of_element_located 元素加载出，传入定位元组，如(By.ID, 'p')

visibility_of_element_located 元素可见，传入定位元组

visibility_of 可见，传入元素对象

presence_of_all_elements_located 所有元素加载出

text_to_be_present_in_element 某个元素文本包含某文字

text_to_be_present_in_element_value 某个元素值包含某文字

frame_to_be_available_and_switch_to_it frame加载并切换

invisibility_of_element_located 元素不可见

element_to_be_clickable 元素可点击

staleness_of 判断一个元素是否仍在DOM，可判断页面是否已经刷新

element_to_be_selected 元素可选择，传元素对象

element_located_to_be_selected 元素可选择，传入定位元组

element_selection_state_to_be 传入元素对象以及状态，相等返回True，否则返回False

element_located_selection_state_to_be 传入定位元组以及状态，相等返回True，否则返回False

alert_is_present 是否出现Alert

更多操作参考：http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.support.expected_conditions

浏览器的前进和后退

back()

forward()

						import time

						from selenium import webdriver

						browser = webdriver.Chrome()

						browser.get('https://www.baidu.com/')

						browser.get('https://www.taobao.com/')

						browser.get('http://www.pythontab.com/')

						browser.back()

						time.sleep(1)

						browser.forward()

						browser.close()

栏目列表

首页 > 编程开发 > python爬虫 >

python爬虫之Python爬虫之selenium库使用详解(5)

等待

隐式等待

显示等待

浏览器的前进和后退