范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

巨细!小姐姐告诉你关于BeautifulSoup的一切(上)

  作者:潮汐
  来源:Python 技术
  现在的朋友们都很聪明,只要会爬虫都知道 BeautifulSoup,但是随着知识点越来越多,很多伙伴可能只知道如何使用这个爬虫工具,并不知道 BeatifulSoup 的详尽用法,今天的文章就带大家了解 BeautifulSoup 的基础详细用法。
  BeautifulSoup 是什么???
  BeautifulSoup 是一个可以从 HTML 或 XML 文件中提取数据的 Python 扩展库。BeautifulSoup 通过合适的转换器实现文档导航、查找、修改文档等。它可以很好的处理不规范标记并生成剖析树(Parse Tree);它提供的导航功能(Navigating),可以简单又快速地搜索剖析树以及修改剖析树。BeautifulSoup 技术通常用来分析网页结构,抓取相应的 Web 文档,对于不规则的 HTML 文档,它提供了一定的补全功能,从而节省了开发者的时间和精力。今天的文章就一起学习 BeatifulSoup 的详细用法吧~ 环境部署
  安装 BeautifulSoup
  BeautifulSoup 主要通过 pip 指令进行安装,在命令提示符 CMD 环境下或者在 PyCharm 的命令行窗口进行安装都可,即调用 pip install bs4  命令进行安装,bs4 即 BeautifulSoup4。
  由于我本地环境已经安装了,显示如下:
  没安装的小伙伴可以去直接输入命令尝试安装,如果已安装就可以直接上手实践。
  当 BeautifulSoup 扩展包安装成功后,就可以在命令行输入from bs4 import BeautifulSoup  语句导入该扩展包,测试安装是否成功,如果没有异常报错即安装成功,如下所示:
  BeautifulSoup 解析 HTML 获取网页信息
  BeautifulSoup 解析 HTML
  BeautifulSoup 解析 HTML 的原理是创建一个 BeautifulSoup 对象,然后调用 BeautifulSoup 包的 prettify() 函数格式化输出网页信息。
  实例如下:from bs4 import BeautifulSoup  html = """      Hello Python         

BeatifulSoup 技术详解 """ # 结果会按照标准的缩进格式的结构输出 soup = BeautifulSoup(html) print(soup.prettify())   使用 BeautifulSoup 解析网页输出结果如下:   BeatifulSoup 解析会把 HTMl 网页的所有标签信息和内容按照 HTML 标签的缩进全部输出。   用 BeautifulSoup 解析 HTML 文档时,它会将 HTML 文档类似 DOM 文档树一样处理,使用 prettify() 函数输出结果时会自动补齐标签,这是 BeautifulSoup 的一个优点,即使 BeautifulSoup 得到了一个损坏的标签,它也产生一个转换 DOM 树,并尽可能和原文档内容含义一致,这种措施通常能够帮助更正确地搜集数据。   实例如下: 将一个网址输入后直接用 prettify() 函数获取from bs4 import BeautifulSoup html = "https://www.baidu.com/" # 结果会按照标准的缩进格式的结构输出 soup = BeautifulSoup(html) print(soup.prettify())   输出内容如下:

https://www.baidu.com/   输出的内容自动补齐了标签,并按照 HTML 格式输出。BeautifulSoup 获取网页标签信息   上面的知识讲解如何用 BeautifulSoup 解析了网页,在解析完网页之后,如果想获取某个标签的内容信息,怎么实现呢?比如获取以下超文本的 标题 ,接下来将教大家如何使用 BeautifulSoup 技术获取网页标签信息。获取网页标题 代码如下:from bs4 import BeautifulSoup # 获取标题 def get_title(): #创建本地文件soup对象 soup = BeautifulSoup(open("test.html","rb"), "html.parser") #获取标题 title = soup.title print("标题:", title) if __name__ == "__main__": get_title()   输出内容如下:   同样的获取其他标签的内容也一样,如 HTML 的头部 a 标签# 获取a标签内容 def get_a(): #创建本地文件soup对象 soup = BeautifulSoup(open("test.html","rb"), "html.parser") #获取a标签内容 a = soup.a print("a标签的内容是:", a)   输出内容如下:a标签的内容是: ddd 定位标签并获取内容   前面的内容简单介绍了 BeautifulSoup 获取title、a等标签,但是如何定位标签并获取到相应标签的内容呢,这里就需要使用 BeatifulSoup 的 find_all() 函数,详细使用方式如下:def get_all(): soup = BeautifulSoup(open("test.html", "rb"), "html.parser") # 从文档中找到的所有标签链接 for a in soup.find_all("a"): print(a) # 获取的超链接 for link in soup.find_all("a"): print(link.get("href")) if __name__ == "__main__": get_all()   输出内容如下:ddd https://www.baidu.com ddd   以上是关于 BeautifulSoup 如何定位标签并获取内容的方式。总结   本文主要讲解关于 BeautifulSoup 知识点的最基础部分,下文将讲解关于 BeautifulSoup 的核心用法,咱们下期见~


撸猫神器?睡眠龙抓手头部按摩仪新体验现代人面对工作生活的多重压力,加之很多不良的生活习惯,导致失眠脱发焦虑等症状伴随而来,笔者最近也是感觉头皮发紧发麻,经常用手去抓一抓,搞得整个身体都不在状态。听朋友说有一种减压神器降噪耳机领域再发力,主动降噪耳机典范新品漫步者NB2不少人可能不知道,降噪其实分为主动降噪和被动降噪两种,其中,被动降噪是通过入耳式设计或硅胶耳套,使其形成一个相对的封闭空间达到降噪效果。而主动降噪则是使耳机内搭载的降噪系统产生与外苏州龙卷风来袭,移动人彻夜奋战恢复网络通信5月14日晚19时前后,江苏苏州吴江区盛泽镇出现龙卷风天气,盛泽镇电力设施和多处房屋受损,通信网络受到影响。灾害发生后,移动人迅速出动,部署机房紧急发电保障和光缆抢修两大队伍挺进灾打造绿色网络,江苏移动持续推进通信基站节能减排随着数智化应用蓬勃发展,支撑海量数据传输的网络耗能日益攀升,对于通信运营商来说,推进节能减排低碳发展任重道远。为打造绿色节能网络,中国移动江苏公司(以下简称江苏移动)聚焦基站节能技aigo国民好物!少撸一次串,就可以买一个颈椎按摩器送给她现在的大多上班族都处于亚健康状态,办公久坐一天就是8小时以上,颈肩腰背持续保持固定姿势,椎间盘和棘间韧带长时间处于一种紧张僵持状态,就会导致颈肩腰背僵硬酸胀疼痛,或俯仰转身困难。特育儿小能手牛村智慧云冲奶机从此不再手忙脚乱市面上冲奶机主要有两种,一种是手动冲奶机,一种是智能恒温冲奶机。手动款冲奶浓度把握相对较高,但操作比较繁琐,如清洗不干净就会使残留的奶液发生变质滋生细菌。智能款有控制浓度温度,不用为青年人打造的酒谷小酒青年酒豪茅台镇53度酱香型白酒进入社会后不乏会有社交应酬,饭桌上酒文化也是必不可少的。最近收到了两瓶茅台镇53酱香型白酒,其中包装上青年酒豪可以看得出,定位的用户群体是有活力有激情的年轻消费群体。应该是针对年轻撞脸AirPodsPro影音游戏双模式网易云音乐MusicPods对手机用户来说,选购蓝牙耳机的时候总是很纠结,各种品牌五花八门,价格也是多少都有。而对苹果手机用户来说,经常会看到有人佩戴AirPods耳机,笔者也是使用iPhoneX手机,一直都常州移动银发辅导下社区助力老年用户掌握智能技术为深入推进老年人智能技术日常应用普及工作,缩小数字鸿沟,进一步帮助老年人融入智慧社会享受智慧生活,近日,常州移动联合清溪社区青山社区开展银发辅导课堂活动,帮助老年人解决在生活中使用2021年度实用眼科诊疗技术学习班暨学术眼科交流会,共享学术成果由中国非公立医疗机构协会眼科专业委员会联合爱尔眼科医院集团北京爱尔英智眼科医院共同举办的2021年度实用眼科诊疗技术学习班暨北京爱尔英智眼科医院第24届秋季学术交流会将于2021年朱峰和他的网格三重奏朱峰,常州移动新北营销中心奔牛罗溪网格长。他身材魁梧却性格温柔,同事们常戏谑他心有猛虎,细嗅蔷薇。自担任奔罗网格长以来,他率先垂范有担当业务拓展有方法团队带领讲艺术,通过一年多努力
专业影像旗舰来袭,三星GN1加持下的vivoX50Pro表现远超预期随着相关技术的不断发展,不少朋友对于智能手机的影像要求也是越来越高,而在最近,vivo正式推出了vivoX50Pro,这款手机是vivoX50的顶配版本,是非常专业的5G影像旗舰。销量口碑双丰收!超大杯vivoX50Pro获权威媒体集体点赞在手机影像领域,vivo一直以来就有着举足轻重的地位,特别是旗下X系列机型,各个不仅颜值惊艳,影像实力也是尤为出众。前不久vivo也是正式发布了X系列最新款机型vivoX50,强悍5G专业影像旗舰vivoX50Pro,拍人拍景毫无压力vivoX50作为一款专业影像旗舰,在影像方面的性能可以说是非常出色。它的后置超清四摄,每一个摄像头表现都让人感到满意,功能非常齐全,完全可以满足消费者全面的拍摄需求。也有资格成为扉旅汽车实测LS500h矩阵大灯,雷克萨斯的技术被低估了作为一名汽车从业者兼雷克萨斯车主,如果你问我雷克萨斯相比别的品牌好在哪,我想说,除了产品好,服务棒之外,还有一个特点很多人可能并不知道,那就是雷克萨斯品牌所有车型都没有选装服务,即八个月便分手,拜腾前途未卜,富士康找好下家?有一首歌是这么唱的,爱情走得太快就像龙卷风。以此来形容富士康与拜腾的合作倒是贴切。近日,据外媒报道,富士康与拜腾的电动汽车合作项目,由于后者财务状况恶化已被终止。事实上,早在今年7减资43,烧掉上百亿,威马的Top3注定难成?先增再减,就是会玩。9月13日,天眼查APP显示,威马汽车运营主体公司威马智慧出行科技(上海)股份有限公司日前注册资本由12。09亿元减少至6。89亿元,减幅达42。99。而在7月20年购机避不开的2大刚需,懂手机的人都这样选一般来说,手机的选购是一个见仁见智的事情,有些人钟情于手机的CPU屏幕电池内存更看重硬件配置有些人喜欢漂亮的外观,追求独特的个性还有些人就是钟爱苹果非华为不买,没有太多理由可讲。年暑期必备,畅爽一夏!5G流畅先锋iQOOZ1x带来极致畅快体验作为国内手机品牌的后起之秀,iQOO以其发布的多款在各方面的表现都十分出色的手机赢得了众多酷客的喜爱和支持,而前段时间其5G流畅先锋iQOOZ1x的发布更让iQOO品牌成为了一个热六月份头条热门手机品牌vivo以超高增幅挤进前三甲手机市场近年来充满变数,以互联网手机起家的小米,热度和销量都大不如前,而像三星Sony诺基亚这些老牌厂商也因水土不服等原因导致国内市场份额日益缩减。但像华为vivo等厂商却逆流而上台积电突发大火,iPhone断供将持续?网友还是小米品牌给力想要用上苹果新款的小伙伴,少则几周的时间,长则需要一个月的时间,而前几天,为苹果代工芯片的台积电发生了火灾,对于果粉来说真是一波未平一波又起,要是选择苹果的小伙伴无疑是需要等更久的iPhone13来临?快充屏幕各个方面还在挤牙膏?网友评论亮了IPhone手机凭借他性能强劲的处理器,和流畅的IOS系统,完美的质感,一直受着年轻人的喜爱!近期IPhone13系列曝光,距离发布越来越近,让我们来看看,他的配置吧!图片来源于网