前言 大家好,随着国内疫情逐步好转,一些美食店铺又渐渐开张了,疫情结束你最想吃什么?来一顿痛快的火锅肯定是少不了的活动吧。可是对于选择困难症的我来说,吃饭一小时,挑店一下午,所以今天本文将再次爬取美团网相关数据,以一个消费者的角度去分析如何选择店铺。 数据获取与说明 本文将基于重庆市火锅数据进行分析,为啥是重庆的火锅,除了辣之外还因为其他城市的火锅店数量相比重庆的火锅店数量就是小巫见大巫 除此之外,相信重庆人民对于火锅的评价会更加地道,所以我们打开重庆市美团网选择火锅进入店铺列表。接下来的操作就和之前类似了:F12—>找到数据包—>requests请求数据—>pandas清洗 但是本文需要爬取两层数据,首先需要在店铺列表取得店铺id、店铺名和销量等相关数据,第二步还需要根据刚刚的店铺id进入每一个店铺请求评论数据,相关代码如下 来看下最终爬取并清洗完毕的数据,经过提取共有评论数据、店铺基本信息数据、评论标签数据👇 去哪吃 首先看下重庆市不同地区的火锅店分布,找火锅店嘛,总要找火锅店多的地区,这样能选择的店铺也更多 从上图可以看到,重庆市的火锅店基本集中在渝中区、渝北区、沙坪坝区、南岸区,并且经过进一步的计算可以得到这四个区的火锅店总数为388家,在所有进入统计的重庆市27个区县共750家店铺中占到了超过一半,所以优先去这四个区,十步一家火锅店,总有你要的! 什么时候吃 在对地点分析之后,我们来对吃火锅的时间进行分析,以评论数量代替同时吃火锅的人数,并使用Pandas提取含有时间的评论并进行整理得到不同时间的人流量与平均评分 从上图可以看到,重庆人民吃火锅的时间集中在下午和晚上,并且高峰期集中在晚上7点至11点,所以想安安静静吃火锅可以避开这段时间。不过从整体评价来看下午的评价不太好,反而晚上10点之后的评价比较高,可能是大家对于老板也耐心等候表示认可👇 选什么标签 每个店铺下的评价都有顾客评价的标签 本节我们通过绘制好评用户的矩形数图来看下带有哪些标签的火锅店获得的好评更多 从上图可以看出除了味道赞,重庆人更喜欢去回头客多、上菜快的店铺,所以当我们寻找一家火锅店的时候,点开店铺评价,按照带有上面标签找准没错。 选什么价格 在挑选一家火锅店的时候,价格也是很重要的一项参考指标,本节对人均价格绘制直方图同时添加对应价格的平均分曲线👇 可以看到,虽然重庆火锅店多,但是人均价格超过一百的并不多,大多集中在50—80之间,并且不是越便宜得到的评分越高,反而平均分最高的一个价格区间为100-110,其次是70-80,所以想要火锅吃的爽,至少准备一百块。 要不要优惠 相信大家都会在去吃火锅之前看下商家是否有代金券/团购,所以本节使用箱线图对重庆市火锅店的优惠信息进行分析 图中箱子越宽说明数量越多,可以看到大部分商家是出售代金券的,是否有代金券对于高分评价没啥影响,但是有代金券的最低分是0分而没有代金券的商家最低分是3+,所以并不是一定要选有优惠的,有时没有优惠可能体验更好哦。 吃什么菜 假设通过上面的分析,我们已经找到了一家火锅店准备开吃,本节继续通过提取评论关键词来看看网友爱点什么菜 从上图可以看到,最受重庆人民喜爱的肉是牛肉,蔬菜爱选豆芽,喜欢吃油碟的人更多,当然羊肉、毛肚也不能少。 大家都在说什么 在对店铺的影响因素分析完之后,本节对采集到的近万条评论数据进行词云分析,看看大家都在说什么 可以看到除了味道,大家评论的热点还有服务、服务员、环境,看来重庆火锅的服务相关还是很重要的参考指标。 高分用户怎么说 在我们获取的评论数据中,用户是有等级的,根据查找美团相关资料知道这些等级是根据用户的消费次数、评价质量等多个维度计算得到,相信他们的评价更具有参考价值 我们看看高分用户怎么说 可以看到除了味道和服务,份量、新鲜、团购、配菜等都是他们喜欢点评的,所以我们也可以根据这些标签选择,可是等等,怎么老板娘也成了热词… 结束语 以上就是一次爬取重庆市火锅数据并分析的过程,当然这些数据可以进行的分析远不止这些,如果近期有打算来一顿重庆火锅的读者可以试着自己去分析一下,记得在看哦,拜拜~ 注1:数据采集于美团网公开数据,采集时间为4月16日,数据内容及其解释权归美团网所有。注2:因本次数据含有商家、用户等信息故不再提供。 以上文章相关爬取与作图操作可以参考历史文章或者在公众号:早起Python中获取
for k in url_list: url = k r = requests.get(url,headers = headers,proxies=proxies) data = r.json()['data']['poiInfos'] for i in range(len(data)): ID = data[i]['poiId'] biaoti = data[i]['title'] junfen = data[i]['avgScore'] pingjia = data[i]['allCommentNum'] dizhi = data[i]['address'][0:3] junjia = data[i]['avgPrice'] youhui = 1 if len(data[i]['dealList']) > 0 else 0 df.loc[s] = [ID,biaoti,junfen,pingjia,dizhi,junjia,youhui] s = s + 1
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox网页视频下载器 下载地址: ImovieBox网页视频下载器-最新版本下载
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算