python爬取网络图片保存到本地
python 爬取网络图片保存到本地
这里把爬取的网站地址处理掉了。直接展示不好。
经常找壁纸的童鞋,应该会知道我爬的是哪个网站(找不到狗头) from typing import List, Any, Union # import requests import random import string import urllib.request from bs4 import BeautifulSoup import os,stat from PIL import Image from io import BytesIO from util.accessWebContent import accessWebContent class _4kpicSpider: # 下载 def download(self): pass # 进入网站 - 爬动漫图片 def linkWebSit(self, page): result: List[Union[str, Any]] = [] _base_url = "....." file_path="D:/book/img" if not os.path.exists(file_path): #创建路径 os.makedirs(file_path) url = "" if (page is None) or (page == 1): # 首页 url = "....." else: url = "....."+ str(page) +".html" content = accessWebContent().accessContent(url) soup = BeautifulSoup(content, "html.parser") pics = soup.find("ul", class_="clearfix").find_all("img") num = pics.__len__() if num > 0: for index in range(0, num): next_url = _base_url + pics[index].attrs["src"] result.append(next_url) # 下载图片 # pic = requests.get(next_url, timeout=10) ran_str = "".join(random.sample(string.ascii_letters + string.digits, 10)) filename = "x" + ran_str + ".jpg" print(filename) # urllib.request.urlretrieve(next_url,filename=filename) with urllib.request.urlopen(next_url, timeout=30) as response, open("D:/book/img/"+filename , "wb") as f_save: f_save.write(response.read()) f_save.flush() f_save.close() """ 下面是访问链接后在进行爬取,想爬取相对高清一点的但是失败了,request无法爬取使用js渲染的,因此想要搞的需要使用 selenium linkList = soup.find("ul", class_="clearfix").find_all("a") num = linkList.__len__() if num > 0: for index in range(0, num): next_url = _base_url + linkList[index].attrs["href"] result.append(next_url) next_content = accessWebContent().accessContent(next_url) next_html = BeautifulSoup(content, "html.parser") imgEle = next_html.find("#img") print(imgEle) """ # print(result) return result if __name__ == "__main__": spider = _4kpicSpider() for i in range(1,147): res = spider.linkWebSit(i) import requests import logging class accessWebContent: # 无需请求头 def accessContent(self, url): req = requests.get(url) if req.encoding == "ISO-8859-1": encodings = requests.utils.get_encodings_from_content(req.text) if encodings: encoding = encodings[0] else: encoding = req.apparent_encoding # encode_content = req.content.decode(encoding, "replace").encode("utf-8", "replace") global encode_content #如果设置为replace,则会用?取代非法字符; encode_content = req.content.decode(encoding, "replace") # 默认日志级别为 warning logging.debug(encode_content) return encode_content
爬取效果展示:
华为nova9系列2699元起,10亿色臻彩环幕屏展现真实画面2021年9月23日,华为新品发布会上华为nova9系列手机正式发布,并在9月23日21点08分开启预售,华为nova系列手机每一代都是技术美学和智能摄影的完美结合每一款产品也都代
什么神仙手机啊!华为nova9系列鸿蒙神技能了解一下?当下,买一款华为nova手机就是一种品味的体现,尤其是具备诸多硬核实力的nova9系列手机,更是让人爱不释手。作为首款年轻人的鸿蒙影像旗舰,华为nova9系列一经上市就受到了诸多年
零跑汽车发布C11零跑汽车是一个新能源汽车品牌,自成立以来,在技术方面不断进行突破,也为我们带来了三款优秀的车型,其中的SUV汽车上市之后,打出了要树立20万元以内智能电动汽车性能新标准的口号。那么
中型纯电SUV的潜力股试驾零跑C11零跑汽车旗下首款高端智能纯电SUV零跑C11已于去年年底正式上市,售价区间为15。9819。98万元。不得不承认,这一定价给了所有人一个不大不小的惊喜。毕竟从此前公布的信息来看,对
麻雀虽小五脏俱全零跑T03首先,我们按照常规套路来了解下这款零跑T03。零跑T03的外观采用了呆萌可爱的设计风格。大量的圆形元素有望获得更多女性消费者的青睐,特别是在细节方面,零跑T03采用了新能源汽车常有
15到20万元区间中型SUVC11哪款适合你零跑C11的动力系统,在实际驾驶中的表现还是让人非常满意的,豪华版和尊享版的单电机虽然和性能版相比,性能低了一些,但已经达到了超越2。0T燃油车的水准,甚至和部分3。0LV6发动机
零跑C11一款有备而来的新能源汽车随着新能源汽车产品的不断涌入,电车市场已经接近饱和状态,如果一款新能源汽车想要在饱和的市场中取得一席之地,一定要有备而来,这样才能更快地在市场中站稳脚跟,成为人们关注的那一款汽车,
零跑汽车发布C11零跑汽车是一个新能源汽车品牌,自成立以来,在技术方面不断进行突破,也为我们带来了三款优秀的车型,其中的SUV汽车上市之后,打出了要树立20万元以内智能电动汽车性能新标准的口号。那么
IE浏览器退役再见了,初代网民的青春记忆日前,微软在官方技术论坛中宣布,将于2022年6月15日删除个人版Win10中的InternetExplorer(IE)浏览器。而由于企业需要,LTSC长期服务版Windows10
电动牙刷竟比手动牙刷便宜!IPX7级防水,送3个刷头,不输大牌都说爱笑的人运气好,笑起来的时候露出一口洁白无瑕的牙齿那么迷人,运气当然就好了但现实中很多人还是被黄黄的牙齿打败,每天都刷牙,为什么牙齿还是黄黄的?据调查显示,多数人刷牙不到三分钟
需要自己组合拼装的八音盒,机芯钢材来自日本,360度可旋转发声都说童年充满了五彩缤纷好比小时候爱不释手的八音盒听着柔和的音乐声缓缓地流淌看着盒子上穿着芭蕾舞裙的小女孩翩翩转动幸福感便油然而生著名的教育家陶行知曾提出,小孩有创造力,要解放儿童的