BeautifulSoup解析(css选择器)

656 阅读1分钟
  • 常规
soup.select('div')                   所有标签是<div>的元素

soup.select('#author1')               带有id属性为author1的元素

soup.select('.notice')               所有使用CSS class 属性名为notice的元素

  • 不寻常
soup.select('div span')              所有在<div>元素之内的<span>元素

soup.select('div > span')            所有直接在<div>元素之内的<span>元素,中间没有其他元素

soup.select('input[name]')           所有名为<input>,并有一个name属性,其值无所谓的元素

soup.select('input[type="button"]')  所有名为<input>,并有一个type属性,其值为bottom的元素

soup.select("#someDayNav.clearfix.cnav")  选择id为someDayNav和一个class是clearfix一个class是cnav的元素(注意没有空格表示同时成立)
#<ul class="clearfix cnav" id="someDayNav"> </ul>