本节通过具体的爬虫程序,演示BS4解析库的实际应用。爬虫程序目标:下载诗词名句网(https://www.shicimingju.com/book/)《两晋演义》小说。 关于分析网页分过程,这里不再做详细介绍了,只要通读了前面的文章,那么关于如何分析网页,此时您应该了然于胸了。其实,无论您爬取什么类型的网站,分析过程总是相似的。案例简单分析 首先判网站属于静态网站,因此您的主要任务是分析网页元素的组成,然后使用BS4提取所需的信息。如下所示: 提取到a标签是解决本程序的重点,a标签的页面代码结构如下所示: