首页 > temp > 简明python教程 >
-
重庆火锅哪家强,Python 帮你探探店
大家好,随着国内疫情逐步好转,一些美食店铺又渐渐开张了,疫情结束你最想吃什么?来一顿痛快的火锅肯定是少不了的活动吧。可是对于选择困难症的我来说,吃饭一小时,挑店一下午,所以今天本文将再次爬取美团网相关数据,以一个消费者的角度去分析如何选择店铺。
数据获取与说明
本文将基于重庆市火锅数据进行分析,为啥是重庆的火锅,除了辣之外还因为其他城市的火锅店数量相比重庆的火锅店数量就是小巫见大巫。
除此之外,相信重庆人民对于火锅的评价会更加地道,所以我们打开重庆市美团网选择火锅进入店铺列表。接下来的操作就和之前类似了:F12—>找到数据包—>requests请求数据—>pandas清洗。
但是本文需要爬取两层数据,首先需要在店铺列表取得店铺id、店铺名和销量等相关数据,第二步还需要根据刚刚的店铺id进入每一个店铺请求评论数据,相关代码如下:
for k in url_list:
url = k
r = requests.get(url,headers = headers,proxies=proxies)
data = r.json()['data']['poiInfos']
for i in range(len(data)):
ID = data[i]['poiId']
biaoti = data[i]['title']
junfen = data[i]['avgScore']
pingjia = data[i]['allCommentNum']
dizhi = data[i]['address'][0:3]
junjia = data[i]['avgPrice']
youhui = 1 if len(data[i]['dealList']) > 0 else 0
df.loc[s] = [ID,biaoti,junfen,pingjia,dizhi,junjia,youhui]
s = s + 1
来看下最终爬取并清洗完毕的数据,经过提取共有评论数据、店铺基本信息数据、评论标签数据