范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

python谁还能抵挡我的脚步,VIP也抵挡不住啦

  前言
  嗨喽!大家好呀,这里是魔王~**  知识点:爬虫基本流程  parsel数据解析模块的简单使用  os文件操作的简单使用  拼接图片  开发环境:Python 3.8 解释器  Pycharm  模块使用:requests >>> pip install requests 发送请求  parsel >>> pip install parsel 解析数据  os 文件操作 内置模块  爬虫基本流程: 发送请求(请求页面) 获取数据 解析数据 保存数据 实现步骤一. 分析数据来源找请求页面或者请求url地址是什么 / 想要数据内容在哪里可以获取  通过开发者工具抓包分析, 我们想要图片url地址来自于哪里  1  . 找到漫画对应图片url >>>   图片url的数据包是什么(会有数据包专门存储所有图片url的) 2  . 找到图片的数据包url之后(仅仅一话的内容)
  通过分析对比可得, 只要获取所有漫画章节ID就可以获取所有漫画内容....
  ID类参数, 都可以去列表页面获取(目录列表)  想要获取所有漫画内容获取得到所有漫画章节ID  把章节ID传入图片数据包里面  获取所有图片url地址  二. 代码实现步骤:发送请求, 对于漫画目录页面发送请求  获取数据, 获取服务器返回响应数据内容  解析数据, 提取我们想要漫画ID以及漫画标题名字  发送请求, 把ID传入图片数据包里面发送请求  获取数据, 获取服务器返回响应数据内容  解析数据, 提取我们想要图片url  保存数据....  代码爬取漫画import requests import parsel  # 解析数据模块 没有办法直接对于字符串数据进行提取 import os # 1. 发送请求, 对于漫画目录页面发送请求 url = "https://www.mkzhan.com/216191/"  # 确定请求url地址 headers = {     "cookie": "__login_his_sync=0; UM_distinctid=18007d5fd5f75-0dd953d0f62cee-1a343370-1fa400-18007d5fd60753; CNZZDATA1262045698=1849049383-1649398645-%7C1649398645; tourist_expires=1; readMode=scroll; CNZZDATA1261814609=1771138736-1649393424-https%253A%252F%252Fwww.mkzhan.com%252F%7C1649393279; redirect_url=%2F216191%2F; cn_1262045698_dplus=%7B%22distinct_id%22%3A%20%2218007d5fd5f75-0dd953d0f62cee-1a343370-1fa400-18007d5fd60753%22%2C%22%24_sessionid%22%3A%200%2C%22%24_sessionTime%22%3A%201649400570%2C%22%24dp%22%3A%200%2C%22%24_sessionPVTime%22%3A%201649400570%7D",     "referer": "https://www.mkzhan.com/category/?order=2&is_vip=1",     "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36", } response = requests.get(url=url, headers=headers)  #  200表示请求 # 2. 获取数据 # print(response.text)  # response.text 得到html字符串的数据内容 # 3. 解析数据,提取章节ID以及章节名字 selector = parsel.Selector(response.text)  # 为什么要写这行代码 把html数据内容转成可解析对象 selector # css选择器, 就是根据标签属性内容提取数据 分开两次提取 第一次提取 提取所有li标签 lis = selector.css(".chapter__list-box li") for li in list(reversed(lis))[1:]:     chapter_id = li.css("a::attr(data-chapterid)").get()     # strip() 去除字符串[左右]两端的空格     chapter_title = li.css("a::text").getall()[-1].strip()     print(chapter_id, chapter_title)     filename = f"{chapter_title}"     if not os.path.exists(filename):         os.mkdir(filename)     link = "https://comic.mkzcdn.com/chapter/content/v1/"     data = {         "chapter_id": chapter_id,         "comic_id": "216191",         "format": "1",         "quality": "1",         "sign": "bcd29b22b3ab8e7baa284ed431975a95",         "type": "1",         "uid": "53013317",     }     json_data = requests.get(url=link, params=data, headers=headers).json()["data"]["page"]     page = 1     for index in json_data:         img_url = index["image"]         print(img_url)         img_content = requests.get(url=img_url, headers=headers).content         with open(filename + str(page) + ".jpg", mode="wb") as f:             f.write(img_content)         page += 1
  解答、资料、源码点击领取~
  长图from PIL import Image from os import listdir  """ result_path_target  图片存放目标路径 cut_pictures 待拼接图片存放路径 num 图片命名以数字按序增加  """   def get_picture(cut_pictures, title):     # cut_pictures = r"D:自游漫画第1话 重生"     ims = [Image.open(cut_pictures + "" + fn) for fn in listdir(cut_pictures) if fn.endswith(".jpg")]  # 打开路径下的所有图片     width, height = ims[0].size  # 获取拼接图片的宽和高     result = Image.new(ims[0].mode, (width, height * len(ims)))     for j, im in enumerate(ims):         result.paste(im, box=(0, j * height))     result.save(cut_pictures + "%s.jpg" % title)    get_picture("第1话上 三个相宫", "第1话上 三个相宫")
  图片查看器import tkinter as tk import glob  from PIL import Image, ImageTk  current_photo_no = 0  root = tk.Tk() # 加载本地图片 photos = glob.glob("第1话上 三个相宫/*.jpg") photos = [ImageTk.PhotoImage(Image.open(file)) for file in photos]  """在下面实现代码"""  root.title("图片浏览器") root.geometry("1024x1080+100+100")  photo_label = tk.Label(root, image=photos[current_photo_no], width=800, height=1249) photo_label.pack()  number_var = tk.StringVar() number_var.set(" 1 of 4") tk.Label(root, textvariable=number_var, bd=1, relief=tk.SUNKEN, anchor=tk.CENTER).pack(fill=tk.X)  button_frame = tk.Frame(root) button_frame.pack()  # 布局到页面上 prev_photo = tk.Button(button_frame, text="上一页") next_photo = tk.Button(button_frame, text="下一页") # 根据键盘 点击一下 prev_photo.pack(side=tk.LEFT, anchor=tk.CENTER) next_photo.pack(side=tk.RIGHT, anchor=tk.CENTER)   def _calculation_photo_no(next_no):     global current_photo_no     current_photo_no += next_no      # 如果序号小于 0,就设置为最后一张     if current_photo_no < 0:         current_photo_no = len(photos) - 1     # 如果序号大于最大长度,就修改为序号 0     if current_photo_no == len(photos):         current_photo_no = 0      # 设置当前图片的序号信息     number_var.set(f"{current_photo_no + 1} of {len(photos)}")     # 修改显示的图片内容     photo_label.configure(image=photos[current_photo_no])   # 绑定点击事件 prev_photo.configure(command=lambda: _calculation_photo_no(-1)) next_photo.configure(command=lambda: _calculation_photo_no(1))  root.mainloop() 视频教程
  Python爬取当当网图书畅销榜书籍信息数据保存csv并做数据可视化展示_哔哩哔哩_bilibili尾语
  好了,我的这篇文章写到这里就结束啦!
  有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง
  喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

realme本月第二款新机入网信息曝光国创IP联动或命名为GTNeo2T继国庆长假前,realme副总裁全球产品线总裁王伟Derek陆续透露了将于10月份发布的realme真我手机新品将被命名为Q3s等消息之后,网间又陆续曝光了疑似该机的外观和基本配置智能网联车发展路径升维伴随着全球汽车产业向电动化智能化网联化共享化的趋势迈进,智能网联汽车已经成为全球汽车产业转型发展的主要方向和促进未来世界经济持续增长的重要引擎。积极推动双碳行动落实落地聚焦碳达峰碳专访哲源科技联合创始人兼COO赵宇超算上跑出计算医学为医药产业赋能科创板日报(上海,记者朱洁琰)讯,现在关于医学方面的论文超过3500万篇,这个体量的学习是人力无法穷尽的,基于超级计算机的人工智能却可以做到。中科院计算所哲源图灵达尔文实验室副主任工业富联专利数量达到4966件浪潮云智能运维2。0新品发布过去一周工业互联网领域各种大会接踵而至与此同时各企业的布局和进展也有所透露比如工业富联已经积累了超300件工业互联网相关专利浪潮云智能运维2。0新品正式发布还有哪些热点让我们一起回步OV后尘的智商检测机?你会花2599元买小米Civi吗?新发布的小米Civi手机主打的卖点就是自拍轻薄,小米Civi为手机加入前置3200万高清镜头以及双柔光灯,搭配GAN对抗神经网络学习算法来提升成像的细节,同时让自拍更自然,所以严格小米百度投资L4自动驾驶服务商几何伙伴文福布斯中国近日,据企业信息公开查询系统显示,上海几何伙伴智能驾驶有限公司发生工商变更,新增小米关联公司湖北小米长江产业基金合伙企业(有限合伙)百度关联公司三亚百川致新私募股权投资配置看齐MIX4,价格却要看齐千元机?RedmiNote系列新品配置曝光距离双11还有一个多月的时间,近期有不少数码博主证实近期将有多款新品手机陆续发布亮相,而有消息透露小米将于10月11月会发布多款新品,其中还会有两款搭载高通骁龙870的机型。其中有多款RadeonRX6600显卡曝光,包括XFX华擎和PowerColor的产品AMD将会在10月13日发布RadeonRX6600,采用Navi23XL核心,其拥有28个CU,即1792个流处理器,显存位宽为128位,显存为8GB的GDDR6,显存速率为145G为智能网联汽车产业提速智能网联汽车是5G与垂直行业深度融合的典型应用领域之一。5G网络凭借其低时延高可靠等特征,有效提升智能网联汽车信息采集传播处理和利用能力,提高道路交通安全水平。近年来,我国一直把智放弃鸿蒙OS,荣耀60Pro已确定,6000mAh150倍变焦很豪横近期华为鸿蒙系统的热度高涨,全球已经有1。3亿以上的用户在使用鸿蒙系统,备受大家的认可和青睐。但目前与华为合作的国产友商却并不多,此前的子品牌荣耀便是其中之一。可比较让人感动的是,OPPO爆发,2K高刷屏双主摄LTPO技术,从4499跌至3299元OPPO除了K系列和子品牌realme的真我手机,其他系列产品的手机确实没有什么性价比而言,比如Reno系列和FindX系列就是,Reno系列是主打线下市场,最大不足的性能不到位,
小身形却强悍!大疆发布DJIMini3Pro无人机,4198元起售DJI大疆于5月10日正式推出新一代DJIMini3Pro,以创新构型设计全方位革新249克无人机的飞行与航拍性能。DJIMini3Pro在创新构型下将轻小便携影像实力避障系统智能2022年了,苹果11还值得购买吗?早上来的一位客人,点单苹果11128紫色,说要送给家人用。今天11128紫色报价3970,在我的建议下,4700大洋选择了12128紫色。苹果11,这个2019年上市快三年的手机还联通半夜清空用户余额,全网道歉昨天我们跟大家聊了每月手机月租的话题。本以为我的22块月租已经够低了,没想到评论区的小伙伴直接开秀,一个个8块10块的月租,而且还送一堆的流量,是真滴羡慕。不过手机套餐这东西,够用中消协发报告,特斯拉lululemon腾讯被点名中新财经5月12日电(记者谢艺观)5月12日,中消协发布五一消费维权舆情分析报告,特斯拉lululemon腾讯等企业被点名。中消协监测发现,今年五一促销活动期间消费负面信息主要集中大事件!泰国军队,对Lazada下手了一个国家最主流的网购平台,为何遭到大批国民的愤怒抵制?一个国家的国防力量,为何会对这家网购平台,举起抵制的闸刀?泰国,一场乌龙的闹剧,正在演变成一场惊天动地的风潮。以至于选择哪个A行业认可亿达信息入选2021年软件行业典型示范案例2022年5月,由中国软件行业协会主办的2022中国国际软件发展大会暨第五届中国软件产业年会在北京举行。会上,由亿达信息自主研发基于大数据的智能充电运营管理平台荣膺2021年软件行紫光国微公司在手订单充沛中证网讯(记者董添)5月12日,紫光国微宣布,公司在手订单充沛,集成电路产业链供需紧张的状态有望在2022年依然持续。紫光国微产业链上下游的合作关系有望不断加强。展望2022年,紫ThinkCentreneoP780台式机今晚开卖12代酷睿RTX30显卡IT之家5月12日消息,上个月,联想发布了新款ThinkPadX1系列旗舰笔记本,同时宣布新款ThinkCentreneoP780台式机。今晚0点,ThinkCentreneoP7爱回收宣布5月24日美股盘前发布2022年第一季度业绩金融界5月13日消息,中国领先的技术驱动型二手消费电子交易和服务平台爱回收今日宣布,公司将于2022年5月24日美股盘前发布2022年第一季度业绩数据。业绩数据发布后,爱回收公司管网站限免福利,可不可以长期并优质地存在?来源工人日报艺评限免福利,可不可以长期并优质地存在?5月1日,视频网站哔哩哔哩宣布将其库存的3000多部纪录片全部对公众开放免费观看,免费期限为7天。由于近段时间新冠肺炎疫情在全国花13元就能改IP属地?IP代理浮出水面来源北京青年报海外博主的IP归属地却在国内,各省吃喝玩乐博主的IP归属地都在湖南随着IP归属地功能的上新,在各网红大V惨遭翻车的同时,IP代改业务也随之出现,北京青年报记者发现甚至