爬虫(4)

当前位置:

首页 > temp > 简明python教程 >

爬虫(4)

四、利用爬虫获取2017中国大学排名：

			
									import requests

									from bs4 import BeautifulSoup

									import bs4

									info = []#用来存放爬取信息

									url ="http://www.zuihaodaxue.com/Greater_China_ranking2017_0.html"

									try:

									    r=requests.get(url,timeout=100)

									    r.raise_for_status()

									    r.encoding=r.apparent_encoding

									    soup  = BeautifulSoup(r.text,"html.parser")

									    for tr in soup.find("tbody").children:

									        if isinstance(tr,bs4.element.Tag):

									            tds=tr.find_all("td")

									            info.append([tds[0].string,tds[1].string,tds[3].string])

									    print("{0:^10}\t{1:{3}^10}\t{2:^10}".format("排名","学校名称","总分",chr(12288)))

									    for i in range(50):

									        print("{0:^10}\t{1:{3}^10}\t{2:^10}".format(info[i][0],info[i][1],info[i][2],chr(12288)))

									except Exception as e :

									    print(e)