首先,我们需要初始化驱动和指定使用特定的流量器。
代码如下:
from selenium import webdriver
wd = webdriver.Firefox()
上面的代码可以简单的理解为启动一个 Firefox 的实例。
使用 css 选择器
可以把程序读取的 HTML 理解为一个 Doc。
我们需要在 Doc 中选择我们的元素,这个叫做选择器,通常来说 HTML 很多不同的选择器。
elem = wd.find_element_by_css_selector('#my-id')
上面的代码是使用 css 的选择器。
获得属性
但我们使用选择器获得元素后,下一步就是我们需要获得属性了。
Python 的代码为:
element.get_attribute('innerHTML')
这样我们就可以通过元素获得属性了。
Python 爬虫使用 Selenium 如何在 WebElement 获得属性 - Python - iSharkFly