Python爬虫数据分析之影评分析

爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

Python爬虫数据分析之影评分析

　　本次通过猫眼电影，对春节贺岁大片【满江红】进行数据分析。而本次我们通过动态接口形式获取评论信息，静态HTML解析需要额外的字体解析，网上的教程也已经很全了，有兴趣的小伙伴们也可以多多冲浪或和本人探讨哈！
　　满江红影图一、接口分析
　　1。目标站点：猫眼H5
　　接口列表
　　2。通过滑动查看评论信息，或点击评论进入评论子页面滑动，即可抓取到相关接口（浏览器F12工具中只能抓取到子评论接口，如果要整个评论的需要抓包工具配合或使用手机抓包）
　　接口详情
　　3。评论接口（已加密处理）
　　aHR0cHM6Ly9tLm1hb3lhbi5jb20vYXBvbGxvL2Fwb2xsb2FwaS9tbWRiL3JlcGxpZXMvY29tbWVudC8xMTY3MTI5MDg5Lmpzb24X3ZfPXllcyZvZmZzZXQ9NDA
　　二、响应分析通过子评论接口，可以分析出来相关字段（昵称、性别、评分、评论内容、评论点赞量、用户等级等）｛cmts：〔｛approve：0，assistAwardInfo：｛avatar：，celebrityId：0，celebrityName：，rank：0，title：｝，avatarurl：https：img。meituan。netmaoyanusere6f7600fa2980a929accb602fde5abaa2776。jpg，channelId：70001，content：在电影院看真的很有氛围！背景音乐也很加分，deleted：false，id：1171602285，ipLocName：福建，nickName：腿小菇，time：2023022710：24，userId：1322748722，userLevel：3，vipInfo：，vipType：0｝〕，ocm：｛approve：8657，approved：false，assistAwardInfo：｛avatar：，celebrityId：0，celebrityName：，rank：0，title：｝，authInfo：，avatarurl：https：img。meituan。netavatar66fb6e3ef190201864c732a03b5d9be924014。jpg，content：刚看完满江红，真的好看，这是我看过最值的一部电影，反转反转再反转，真的是永远想不到下一步是什么，而且还很搞笑，搞笑又宏伟，真的描述不出来这个电影的好，都给我去看！满江红！入股不亏！！！！，id：1167129089，ipLocName：辽宁，isMajor：false，juryLevel：0，majorType：0，mvid：1462626，nick：Gpc126688235，nickName：Gpc126688235，oppose：0，pro：false，reply：680，score：5，spoiler：0，supportComment：true，supportLike：true，sureViewed：1，tagList：｛fixed：〔｛id：1，name：购票好评｝，｛id：4，name：购票｝，｛id：6，name：优质评价｝〕｝，time：2023012212：19，userId：3164097169，userLevel：2，videoDuration：0，vipInfo：，vipType：0｝，total：60｝
　　2。完整comment接口响应示例｛data：｛hotIds：〔1167280609，1167187803〕，total：16521，comments：〔｛avatarUrl：https：img。meituan。netmaoyanuser80cdf9a184d40eb9ecc0e5d170f3e45d11928。png，buyTicket：false，channelId：3，content：还行吧，没有看开心，delete：false，follow：false，gender：1，id：1171756165，imageUrls：〔〕，ipLocName：山东，likedByCurrentUser：false，major：false，movie：｛id：0，sc：0｝，movieId：1462626，nick：淘嘉豪，replyCount：0，score：9，showApprove：false，showVote：false，spoiler：false，startTime：1677923460000，tagList：〔｛id：1，name：购票好评｝，｛id：4，name：购票｝〕，time：1677923460000，ugcType：11，upCount：0，userId：71317227，userLevel：2，vipType：0｝，〕，t2total：0，myComment：｛｝｝，paging：｛｝，ts：1677956823197｝三、数据解析构造请求头，模拟数据请求defgetfilmdata（offset0，filenamefilm）：urlfaHR0cHM6Ly9tLm1hb3lhbi5jb20vYXBvbGxvL2Fwb2xsb2FwaS9tbWRiL3JlcGxpZXMvY29tbWVudC8xMTY3MTI5MDg5Lmpzb24X3ZfPXllcyZvZmZzZXQ9NDAheaders｛UserAgent：Mozilla5。0（iPhone；CPUiPhoneOS110likeMacOSX）AppleWebKit604。1。38（KHTML，likeGecko）Version11。0Mobile15A372Safari604。1｝cookies｛uuidnv：v1，iuuid：942C12B0DF4311E9ADA9C1C3B540BA45F066B2B3028841B8A0BC3544E4C0AD17，ci：12CE58C97E4BAAC，lxsdkcuid：16d6c9b401ec80c6c86354bd8a95b12321110020016d6c9b401ec8，webp：true，lxsdk：942C12B0DF4311E9ADA9C1C3B540BA45F066B2B3028841B8A0BC3544E4C0AD17｝开始页面请求，返回响应内容responserequests。get（url，headersheaders，cookiescookies）。json（）总评论数totalresponse〔total〕print（total）评论信息列表cmtsresponse〔cmts〕pprint（cmts）forcommentincmts：data〔〕评论ididcomment〔id〕评论内容contentcomment〔content〕用户昵称nickNamecomment〔nickName〕用户评分scorecomment〔score〕评论时间startTimecomment〔time〕用户iduserIdcomment〔userId〕用户等级userLevelcomment〔userLevel〕用户性别gendercomment。get（gender，None）data〔nickName〕nickNamedata〔gender〕genderdata〔score〕scoredata〔content〕contentdata〔userId〕userIddata〔userLevel〕userLevelsavedatacsv（data，filename）returntotal
　　2。数据存储（这里为以csv演示）defsavedatacsv（data，filename）：withopen（filename，a，encodingutf8sig，newline）asfp：创建写对象writercsv。writer（fp）title〔nickName，gender，score，content，userId，userLevel〕解决循环存储，表头重复问题withopen（filename，r，encodingutf8sig，newline）asfp：创建读对象readercsv。reader（fp）ifnot〔rowforrowinreader〕：writer。writerow（title）writer。writerow（〔data〔i〕foriintitle〕）else：writer。writerow（〔data〔i〕foriintitle〕）print（10保存完毕10）
　　影评结果四、数据可视化影评分词defwordcloudanalysis（filename）：dfpd。readcsv（filename，encodingutf8）contentdf〔content〕。tostring（）开始分词使用jieba进行精确分词获取词语列表wordsjieba。lcut（content）使用空格拼接获得字符串words。join（words）生成词云读取图片，生成图片形状maskpicnp。array（Image。open（1。jpg））wordscloudWordCloud（backgroundcolorwhite，词云图片的背景颜色width800，height600，词云图片的宽度，默认400像素；词云图片的高度，默认200像素fontpathmsyh。ttf，词云指定字体文件的完整路径maxwords200，词云图中最大词数，默认200maxfontsize80，词云图中最大的字体字号，默认None，根据高度自动调节minfontsize词云图中最小的字体字号，默认号fontstep1，词云图中字号步进间隔，默认randomstate30，设置有多少种随机生成状态，即有多少种配色方案maskmaskpic词云形状，默认None，即方形图）。generate（words）有jieba分词拼接的字符串生成词云wordscloud。tofile（comment。png）保存词云为图片使用plt显示词云plt。imshow（wordscloud，interpolationbilinear）消除坐标轴plt。axis（off）plt。show（）
　　分词
　　2。观看人群性别及评分占比分析（由于取得部分数据，不代表最终现实结果，勿纠）defgenderpieanalysis（filename）：dfpd。readcsv（filename，encodingutf8）print（df）1。观看人群性别genderdf〔gender〕。valuecounts（）print（gender）饼图，标题：观看人群性别占比调用自定义饼图函数创建画布和轴fig，axplt。subplots（figsize（6，6），dpi100）plt。figure（）size0。5labelsdata。indexax。pie（gender，labels〔女，男，未知〕，startangle90，autopct。1f，colorssns。colorpalette（husl，len（gender）），radius1，饼图半径，默认为1pctdistance0。75，控制百分比显示位置wedgepropsdict（widthsize，edgecolorw），控制甜甜圈的宽度textpropsdict（fontsize10）控制字号及颜色）ax。settitle（【满江红】观看人群性别占比，fontsize15）plt。title（title）plt。show（）
　　性别占比
　　评分占比
　　3。用户等级分析defuserlevelbaranalysis（filename）：dfpd。readcsv（filename，encodingutf8）print（df）userLeveldf〔userLevel〕。valuecounts（）。sortindex（）print（userLevel）xuserLevel。indexyuserLevelfig，axplt。subplots（）plt。bar（x，y，colorDE85B5）柱状图标题plt。title（评论用户等级数量分布柱状图）plt。grid（True，axisy，alpha1）fori，jinzip（x，y）：plt。text（i，j，dj，horizontalalignmentcenter，）ax。spines〔right〕。setvisible（False）ax。spines〔top〕。setvisible（False）plt。show（）
　　等级数量分布
　　该篇文章只是从评分角度去做的数据分析，其实还可以从影视类型、年度电影Top、票房等角度进一步做数据分析。该篇文章来自本人知乎号：梓羽Python
　　文章链接：https：zhuanlan。zhihu。comp611295606

肯德基全套标准化运营体系（45大板块，10000个节点及流程步骤）肯德基由哈兰山德士上校于1952年创建，主要出售炸鸡汉堡薯条汽水等西式快餐食品。截止2022年肯德基的全球店铺24104家。肯德基总部位于肯德基州路易斯维尔市，是全球最受欢迎的炸鸡最家常的家常菜番茄鸡蛋炒土豆的做法冬日生活打卡季大家好，我是周周，今天给大家分享一个用我们最常见的番茄和土豆做成的一道美味番茄鸡蛋炒土豆。番茄，又叫西红柿，含有蛋白质，脂肪，维生素等等多种营养成分，具有助消化，抗衰冬天这3种汤的做法学起来，冬天一碗汤，医生不用帮汤，是大量的水和各种煮熟蔬菜肉类以及一些其他的佐料经长时间的文火慢炖，从而味道外泄，和水混合在一起，便形成了美味的汤。不含防腐剂。大量水分和长时间的烹调使汤混合了很多滋味和香味成分积分换购6瓶茅台？20万没了现在回想起来，骗子从让我换购茅台酒，就已经开始设圈套了，一步步把我往陷阱里引。12月6日下午，说起此事，恍然大悟的江苏镇江丹阳男子周某追悔莫及。可能是自己真的收到了茅台，所以后面对冬天分享这几道家常小菜，荤素搭配，很美味豉香回锅肉用料五花肉适量蒜苗适量红辣椒适量蒜子适量姜片适量胡萝卜适量豆豉酱适量辣椒酱适量盐适量蒸鱼豉油适量糖适量料酒适量宴友食用油味精适量香油适量做法1五花肉用花椒桂皮水煮熟，用凉游汝城厚坊垅随想冬日，周末清晨，沉睡床上的人儿被婉转悠扬的的鸟鸣声惊醒。或是因今天不用忙碌其它事情，才有闲心雅兴回味这大半年走过的岁月。当然，这离不开昨日野外趣游的功劳。而这个野外，其实是县城周边爱达邮轮携手中免建造中国海上大型免税店，购物空间近2000平方米12月12日，中船邮轮旗下中船嘉年华邮轮有限公司所属的全新中国邮轮自主品牌爱达邮轮正式宣布与中免集团旗下全资子公司中免邮轮服务有限公司达成战略合作，双方将携手为爱达邮轮首艘国产大型克罗地亚队表态不会对梅西盯人防守，要限制他的传球和空间12月14日凌晨3点，阿根廷队与克罗地亚队将在世界杯半决赛中狭路相逢。展望这场大战，克罗地亚队上下充满了对胜利的渴望。在赛前新闻发布会上，克罗地亚主帅达利奇表示，将不会对梅西进行盯宁波东钱湖旅游学校为高三学生举行宋韵特色成人礼中国教育报中国教育新闻网讯（记者史望颖通讯员吴彦）日前，宁波东钱湖旅游学校面向高三学生举行了以十八而志，责有攸归为主题的成人礼，展现出浓浓的宋韵文化。宁波东钱湖旅游学校校领导为学生兴凯湖畔女民警中俄边境冰凌花在祖国的东北边陲密山中俄边境，有这样两个身穿藏蓝警服的女孩，迎风冒雪，不畏严寒，巡逻辖区，以女性独有的细心耐心坚守在边境一线，被称为中俄边境的冰凌花。她俩，就是鸡西市公安局兴凯湖公绍兴又一县瞬息万变，或将撤县划区，是勾践复国旧址一生很短，你要大胆。随着旅游业的不断发展，我们选择外出旅行的方式也越来越多，我们对于旅行的态度也从打卡拍照慢慢的变成慢下来欣赏风景。其实无论是在哪里在做什么，只有静下来慢慢去感受，

<<<<<<－>>>>>>

小住古城，带娃温习最美春天天气越来越暖和，春天的脚步越来越近。经历了疫情以后，想必会格外珍惜能出门的日子，尤其是面对着这美好又短暂的春天！这一次，给大家推荐一种别致的带娃寻春玩法，实在是因为，在这几个人极少我每次进这个洞窟，全身起鸡皮疙瘩，像被扒光了我每次进到这个洞窟的时候，全身都起鸡皮疙瘩，特别难受，感觉好像是全身的皮肤都被扒光了。这是新疆龟兹研究院研究员赵莉，每次走进克孜尔石窟178窟的感受。整个主室的正壁两侧壁券顶的壁画福州无限江山笔底收新加坡早期中文报业与星闽记忆展览吸引参观者来源中国新闻网展览吸引参观者拍照留念。吕明摄展览吸引市民和游客前去参观。吕明摄展览吸引市民和游客前去参观。吕明摄市民和游客正在参观展览。吕明摄市民正在参观展览。吕明摄展览吸引参观者诸葛亮死后，蜀汉为何没有马上灭亡，刘禅到底是明君还是昏君？诸葛亮死后，蜀汉没有马上灭亡，并不能说明刘禅是明君。一一个国家的灭亡是需要一定时间的诸葛亮的死给蜀汉带来一定的打击，但是这份打击并不能让蜀汉灭亡，一个国家的存在和灭亡不能是一个人的西方体制下的养老难题太无解！日本这八百万人奋斗一生却晚景凄凉二战结束后日本被美军占领，数百万侵略军返乡后无事可做，只能待在家里等通知。从1946年秋天开始，日本婴儿出生率直线上升。据统计，19471949年这三年时间，日本共出生806万人，古代的皇帝们，都是怎么挂的？自公元前221年秦始皇确立帝制，到公元1912年宣统帝退位，皇帝制度在中国存在了2132年。在这两千多年间，一共有376人（一说有400多人）做过皇帝。其中，有生卒年记载的皇帝大约11年内剐3000刀，石达开与5岁儿子均被慈禧凌迟处死1863年，慈禧下令，对石达开年仅5岁的儿子石定忠动用剐刑。所谓剐刑，就是以刀割肉，不是一次杀死，而是慢慢一点肉一点肉的割掉致死。千刀万剐之谓也。疼痛凄惨可想而知！晚清的时候，太平大唐帝国是如何从巅峰走向陨落的？罪魁祸首真的是杨贵妃吗？我常常在想啊，那个光耀万年万国来朝的大唐帝国，到底是如何从巅峰走向陨落的呢？罪魁祸首真的是命丧马嵬坡的杨贵妃吗？恐怕不是。开元盛世其实这一切都是唐玄宗李隆基种下的恶果，是他的励精图张家界旅游或将提前迎来旺季数字化营销成行业发展新动能2月16日，在张家界从事旅游行业6年的王家齐见到了久未谋面的商家同行们。在主题为凝心聚力提速狂飙的交流活动上，他用忙到飞起形容最近两个月的生意。王家齐透露，春节以来，来自全国的咨询江阴出境旅游市场正加快复苏来源江阴日报江阴网随着我国试点恢复全国旅行社及在线旅游企业经营中国公民赴有关国家出境团队旅游和机票酒店业务不少江阴市民已经行动起来或是报名参加团队游或是选择自由行江阴出境旅游市场正旅游局策划针对性多形式推广香港网红掀游澳热话旅游局持续推进香港市场的宣传攻势及各项优惠，其中透过香港旅游媒体及博客网红（KOL）的渗透力和影响力，协助发掘有效推广客制化和精品化的深度游模式，着力吸引港人首选到澳门旅游，扩展多

友情链接：快好找快生活快百科快传网中准网文好找聚热点快软网