Python爬虫学习笔记_目录
通过这些类的查找我们可以快速筛选出我们需要的元素
在Python中使用CSS选择器也很简单
分析一下网页结构,我们会发现所有的列表都是放在li tag中
那么我们在soup对潒使用find_all方法的时候就可以寻找li标签
很不错但是存在一些问题
它既得到了我们想要的月份标签,也返回了我们不太需要的日期标签
再进行仔细观察我们发现网站作者的本性
所有的月份都会放在一个class="month"
的CSS类里面这个时候我们就可以使用CSS选择器
使用方法是在find_all函数的第二个传入参數传入一个字典,选择需要的类名
值得注意的是CSS选择器会选择一切包括传入参数类名的类
比如这里我们传入的只month它依然选择出来了feb month类
比洳我们在进行一下操作的时候:
接着,我们用for循环遍历了整个列表这样每次循环jan就是一个BeautifulSoup对象
当然,返回值依然是一个列表
最后我们呢遍历所有的列表就可以得到所有的日期了。