VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > temp > 简明python教程 >
  • 爬虫(4)

 

四、利用爬虫获取2017中国大学排名:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import requests
from bs4 import BeautifulSoup
import bs4
 
info = []#用来存放爬取信息
url ="http://www.zuihaodaxue.com/Greater_China_ranking2017_0.html"
try:
    r=requests.get(url,timeout=100)
    r.raise_for_status()
    r.encoding=r.apparent_encoding
    soup  = BeautifulSoup(r.text,"html.parser")
    for tr in soup.find("tbody").children:
        if isinstance(tr,bs4.element.Tag):
            tds=tr.find_all("td")
            info.append([tds[0].string,tds[1].string,tds[3].string])
    print("{0:^10}\t{1:{3}^10}\t{2:^10}".format("排名","学校名称","总分",chr(12288)))
    for in range(50):
        print("{0:^10}\t{1:{3}^10}\t{2:^10}".format(info[i][0],info[i][1],info[i][2],chr(12288)))
except Exception as e :
    print(e)

相关教程