范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

Python带你采集抖音无水印视频内容,把你喜欢的视频保存

  前言
  嗨喽!大家好呀,这里是python茜吖~
  一个帮助用户表达自我,记录的视频平台。 记录美好、智能匹配音乐、一键卡点视频,超多原创、滤镜、场景切换帮你...
  今天我们就来用Python 采集无水印视频内容  环境介绍:python 3.8 解释器  pycharm 2021专业版 >>> 激活码 编辑器  谷歌浏览器  谷歌驱动  selenium >>> 驱动 >>> 浏览器  模块使用]:采集一个视频requests >>> pip install requests  re  采集多个视频selenium >>> pip install selenium==3.141.0 (3.141.0) 指定模块版本去安装
  使用这个模块安装浏览器驱动  time  模块安装问题:如果安装python第三方模块:    1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车     2. 在pycharm中点击Terminal(终端) 输入安装命令安装失败原因失败一: pip 不是内部命令
  解决方法: 设置环境变量
  失败二: 出现大量报红 (read time out)
  解决方法: 因为是网络链接超时, 需要切换镜像源
  清华:https://pypi.tuna.tsinghua.edu.cn/simple
  阿里云:https://mirrors.aliyun.com/pypi/simple/
  中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
  华中理工大学:https://pypi.hustunique.com/
  山东理工大学:https://pypi.sdutlinux.org/
  豆瓣:https://pypi.douban.com/simple/
  例如:pip3 install -i https://pypi.doubanio.com/simple/ 模块名
  失败三: cmd里面显示已经安装过了, 或者安装成功了, 但是在pycharm里面还是无法导入
  解决方法: 可能安装了多个python版本 (anaconda 或者 python 安装一个即可) 卸载一个就好
  或者你pycharm里面python解释器没有设置好  如何配置pycharm里面的python解释器?
  选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)点击齿轮, 选择add添加python安装路径pycharm如何安装插件?
  选择file(文件) >>> setting(设置) >>> Plugins(插件)点击 Marketplace 输入想要安装的插件名字 比如:翻译插件 输入 translation / 汉化插件 输入 Chinese选择相应的插件点击 install(安装) 即可安装成功之后 是会弹出 重启pycharm的选项 点击确定, 重启即可生效  爬虫实现思路流程: (****)一. 数据来源分析确定爬取的内容是什么?
  爬取抖音视频内容通过开发者工具进行抓包分析 F12 或者 鼠标右键点击插件选择network
  I. 通过分析已经找到播放地址
  II. 去分析, 播放地址可以从什么获取
  对于视频播放url地址 进行一次转码 *** >>> 等会提取的时候 需要进行解码
  二. 代码实现步骤
  过程发送请求, 用python代码模拟浏览器去发送请求
  获取数据, 获取服务器返回响应数据
  解析数据, 提取视频url地址 以及 视频标题
  保存数据, 保存数据到本地开始我们的代码导入模块# 导入数据请求模块 import requests  # pip install requests  win + R 输入cmd # 导入正则 import re  # 内置模块 不需要大家去安装 import time  # 时间模块 from selenium import webdriver  # pip install selenium==3.141.0代码def drop_down():     """执行页面滚动的操作"""  # javascript     for x in range(1, 30, 4):  # 1 3 5 7 9  在你不断的下拉过程中, 页面高度也会变的         time.sleep(1)         j = x / 9  # 1/9  3/9  5/9  9/9         # document.documentElement.scrollTop  指定滚动条的位置         # document.documentElement.scrollHeight 获取浏览器页面的最大高度         js = "document.documentElement.scrollTop = document.documentElement.scrollHeight * %f" % j         driver.execute_script(js)   # 人怎么去操作浏览器的, 就怎么写代码... # 1. 打开一个浏览器或者下载一个浏览器吧 创建浏览器对象(实例化一个浏览器对象) driver = webdriver.Chrome() # 2. 输入一个网址 请求网址 driver.get("https://www.douyin.com/user/MS4wLjABAAAA4N4OrZzTSmCPp8vVAqCeyU215Kav2JgFv2Lfy4DNWRs") driver.implicitly_wait(10) # 3. 提取所有li标签 返回列表 # drop_down() lis = driver.find_elements_by_css_selector(".ECMy_Zdt") for li in lis:     html_url = li.find_element_by_css_selector("a").get_attribute("href")     print(html_url)     #  1. 发送请求, 用python代码模拟浏览器去发送请求     # url = "https://www.douyin.com/video/7066324040335592738"     # headers 作用 伪装python代码 伪装成浏览器 user-agent: 用户代理 浏览器基本身份标识  cookie 用于检测用户信息, 是否有登陆账号     headers = {         "cookie": "douyin.com; ttcid=444dfe8e89ff4d99b0662076ad171c8775; ttwid=1%7CTnFKlrGi3lHjKf5bshFdP9Nwu_Vsiwo-TxvX9NISgj8%7C1642083887%7Cfbfa904ea2900763eb6ac090bdd09014d80840da1ca485bbfea193d5401b330e; MONITOR_WEB_ID=6d75c626-96a0-4270-ac18-aa0090b5bdb8; MONITOR_DEVICE_ID=341246a2-17c2-4c11-9c70-3ffd2cda0ffa; MONITOR_WEB_ID=c27b9f4a-4917-4256-be93-e948308467e3; odin_tt=0510c3c4196f54b541a96ac64e8b585b3a755be85057da8a1f3fa068e3f7b75ca2de4345e2b856f1e7b3f9455d86079731fe7d07a9f10890f26855d3674858e1; _tea_utm_cache_6383=undefined; douyin.com; strategyABtestKey=1648291293.035; passport_csrf_token=e0b90cb756903c370592bd558c2b0cf5; passport_csrf_token_default=e0b90cb756903c370592bd558c2b0cf5; AB_LOGIN_GUIDE_TIMESTAMP=1648291292963; s_v_web_id=verify_l17q2u00_kNENOykG_BIPh_4VLs_AVDZ_yMj0GtFSNH1u; _tea_utm_cache_1300=undefined; _tea_utm_cache_2285=undefined; THEME_STAY_TIME=299042; IS_HIDE_THEME_CHANGE=1; msToken=5X5W_7rY6cmo_SaaiMyCREV1hCZs-Jd9b7whX5gNCZsd9FU0zCTWYYAl0VhqGGUCjKS3bQf0f191VXdWHPNgqUz08MHEhk6qWhu4wVOlxhLyh3Vliaw37NU=; __ac_nonce=0623f02e00009007ea9bb; __ac_signature=_02B4Z6wo00f010eZ3RAAAIDCJJMde2RciUNHvdmAALPkmrPh1wY1Ey-OtTubjdK69ub9bqUt9DNRx8aP7dPtbOjyxcxyyK6yToF.7c4e615hiM5fYGwFCq0x8jHiY7BYLt6JZLIH8y38eMikd9; home_can_add_dy_2_desktop=1; msToken=fSBhJysNLifNHon5sgM-8n_3ZzJD49mCn9GUHLQydo7g52tCvrhNEKMFhxKEKlAxdE-z7er6yxwoJyO7-C_RdyslJnPejx9AAnkluZ22tSxM4siS7FUuO8E=; tt_scid=T-Exmos8oZiW6Wkb0uEjKsqAdjzxSnn4nznfku9EUmnDmpgq6Me7VDpIiYW4Fv805451; pwa_guide_count=3",         "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.82 Safari/537.36"     }     response = requests.get(url=html_url, headers=headers)  #  表示的是响应对象 200状态码 请求成功     # 2. 获取数据     # print(response.text)  # 获取html字符串数据  服务器返回response响应文本数据     # 3. 解析数据     # findall 找到所有, 从什么哪里去找什么数据  正则匹配出来数据返回都是列表数据 [] 列表 [0] 取第一个元素     title = re.findall("(.*?) - 抖音", response.text)[0]     video_url = re.findall("src(.*?)vr%3D%2", response.text)[0]     # print(video_url)     video_url = requests.utils.unquote(video_url).replace("":"", "https:")  # 解码 并且使用replace字符串替换     # print(title)     # print(video_url)     # 4. 保存数据 视频数据内容     video_content = requests.get(url=video_url, headers=headers).content  # 对于视频播放地址发送请求,获取二进制数据内容     with open("video" + title + ".mp4", mode="wb") as f:         f.write(video_content)     print(title, "保存完成")视频地址
  python采集抖音孙一宁所发小视频~简单爬虫小案例_哔哩哔哩_bilibili尾语
  好了,我的这篇文章写到这里就结束啦!
  有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง
  喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

4款好用到舍不得分享的黑科技app,让你的手机更强大手机上的app很多,但是真正好用的,可能很多手机用户都不知道。这里就来分享4款好用到舍不得分享的黑科技app,可以让你的手机变得更强大实用,不知道这几款有没有你正在用的呢?1自动跳诺基亚新机现身ANATEL认证,有望为旗下最便宜的5G手机IT之家8月15日消息一款全新的诺基亚智能手机出现在了巴西电信局ANATEL认证中,型号为TA1394。该机之前从未出现在任何资料中。外媒NokiaPowerUser认为,这款新机时隔一周,比亚迪没说过刀片电池将供应特斯拉,网友都散了吧没想到大名鼎鼎的特斯拉也要向比亚迪索要刀片电池?前段时间,有媒体表示,从明年的第二季度开始,比亚迪将向特斯拉提供刀片电池,这一说法引起了不少媒体及吃瓜网友的关注,有网友表示,特斯拉失不失望?卢伟冰暗评荣耀Magic3不如红米K40!网友荣耀稳了要说每一次手机新品发布会最期待的是什么,小编从来都不期待新产品的本身,而是期待新产品发布之后各大友商的反应,尤其是比较期待小米高管反应,因为多半会引发一场口水战。结果这一次荣耀Ma三色随心变,办公利器,双飞燕飞时代系列无线蓝牙键盘FBK25体验游戏键盘追求敲击感与灯效,那么办公键盘就追求简洁安静与高颜值。所谓简洁就是办公桌面简洁,键鼠没有多余的线材约束,一款键鼠就可以在多平台多设备中实现无线连接无缝切换。那么作为国民级的荣耀X20Max官宣,7英寸巨屏来了,是否值得期待?随着现在用户对大屏手机的需求越来越高,以至于现在小屏手机已经逐渐减少,大屏的手机好处很多,在娱乐办公它都可以表现得很出色,小屏手机的好处就是便捷,只能说各有各的好处,各有各的优势,红米K50系列配置曝光,6000mAh骁龙8952K屏,价格依旧感人小米在转型的路上把性价比的重任交到了红米手中,在卢伟冰的带领下红米取得了非常不错的成绩,并且稳稳地接过了性价比的大旗。就在去年小米数字系列冲击高端成功,红米就继续延续小米之前的精神荣耀发布旗舰新品,小米总裁卢伟冰发文讽刺,网友你真low同行是冤家,但是同行竞争还是要公平竞争,而不是互相贬低!8月12日,荣耀发布了从华为独立之后的首款旗舰手机Magic3系列。手机搭载了高通骁龙888Plus芯片,售价是4599元起手机摄影越来越得到更多的人认可,大家能否分享下手机拍摄的最好的照片呢?是的,当下,随着手机的普及,手机摄影以其便携快捷和拍摄功能不断改进越来越受到绝大多数人的青睐。但拍照容易拍好难,我主要体会有三一是学的进。想拍好照片,必须学习了解,甚至是掌握手机中中兴通讯未来会怎么发展?中兴通讯显然不符合独角兽企业的定义,原因可自行搜索,贴上来怕说我抄袭。所以,这两个问题完全可以归结为一个问题,就是预测中兴通讯的股票长线走势。下面,从两个角度来分析基本面遥想当年,华为Mate50Pro再被爆料!新技术将要震撼来袭,喜欢吗?感谢您的阅读。华为Mate50Pro再被爆料!新技术将要震撼来袭,喜欢吗?最近关于Mate50Pro的消息开始变得多了起来,对支持华为的消费者来讲,确实是好事情,这意味着华为手机业
健身房线上微信营销活动制作,引用户报名的h5页面现在越来越多的人都参与到健身行列中,健身不仅可以塑造外型,还可以强身健体。这也就导致了健身行业在市场中需求量大,在以往中,健身房机构宣传方式采用的是宣传单,这样不仅浪费资源,宣传对抖音如何做原创好视频?专业制作抖音短视频的流程是怎样的?作为一个想要长期做短视频的up主,原创视频才是王道,所以我么尽量要使用一些原创素材,去做视频,这也是抖音鼓励我们去做的事情。下面我就给大家分享一下,我日常做视频的一些经验,希望能够央妈表扬的世界一流智能工厂,来自小米科技?米粉中国崛起未来智能手机的生产方式是怎样的?还会是人工生产模式吗?小米科技为你揭晓!为了能够生产出前十街消费者都喜欢的高端手机,小米改变了人工生产方式,转为一种未来生产模式无人工厂。但让小米没实例说明淘宝直通车图片保存到电脑的技巧很多淘宝直通车的产品图片制作精美,特别吸引人,可将这些图片批量保存到电脑作为素材,以前保存图片操作步骤特别麻烦,有没有方法将淘宝直通车图片保存到电脑呢?其实有一款工具可实现批量保存漫步者LolliPodsPro蓝牙耳机,降噪挺狠降价更狠随着手机厂商相继取消3。5mm耳机孔之后,有线耳机逐渐退出市场,取而代之的则是更为便捷的真无线蓝牙耳机。不过当下市面上的蓝牙耳机,五花八门价格高低不同,很容易让用户挑花了眼,但今天一加9RT上手测评性能顶级体验流畅,3000左右能买到的最好手机众所周知,下半年最重要的节日之一,就是电商平台的年终大促双十一。如今双十一已是近在咫尺,考虑到这一关键的时间点,手机厂商们都于近段时间及时地发布了自家的新机型,包括后起之秀一加,也818临近,盘点各价位段最值得推荐的手机,有些竟比618还香?每年都不缺电商活动,这不刚送走618,又迎来了个818电商大促。一般这个时候数码爱好者都比较活跃,因为手机等数码产品会有优惠活动。作为其中的一员,个人就比较关注手机,趁此机会给大家国产手机好用在哪里?618抄底一加9,半个月后我有了答案作为今年618期间剁手的第一个数码产品,一加9算得上是我蓄谋已久的购机计划。因为,在这之前手里的那台小米10已经是难堪大用,尤其是屏幕和影像方面的表现更是相当的拉胯。所以,这次换手怎样获取淘宝直通车商品详情图我们在浏览淘宝直通车时会发现大多数商品都会有用以展示商品数据的详情图,通过这些商品详情图我们得以了解到商品的大部分信息。而作为商家,要想制作这些商品详情图,就需要对照每个具体的商品余额不足,15002000该买什么手机呢?现在的手机越来越多,如何选择一部高性价比的手机呢?小编就给大家整理了两款性价比超高的手机,我们一起来看看吧红米K305G6128G1599元8128G1799元8256G1999元掌握电流艺术,HIKS1银线耳机测评对于很多的音乐发烧友和音乐从业者来说,其实有一个好的耳机真的非常重要,能够时时刻刻的感受最佳的音乐享受一直是大家所追求的,但是理想很丰满现实很骨感,现在几乎所有的耳机都只能做到尽可