2024 一天掌握python爬虫【基础篇】 涵盖 requests、beautifulsoup、selenium:
https://www.bilibili.com/video/BV1Ju4y1Y7k6/
主要text属性和三个方法get_attribute(),get_property(),get_dom_attribute()
text属性获取元素的文本信息;
get_attribute(),get_property(),get_dom_attribute()三个方法都是获取元素的属性值
区别是property是DOM中的属性,是JavaScript里的对象;
attribute是HTML标签上的属性,
dom_attribute则只能是HTML标签规范定义的属性(自定义的属性获取不到)。
我们一般开发用的是get_attribute()方法。
import time
from selenium import webdriver
from selenium.webdriver.common.by import By
browser = webdriver.Chrome()
url = "http://www.java1234.com/"
browser.get(url)
time.sleep(2)
input = browser.find_element(By.ID, "time")
print(input.text)
print(input.get_attribute('id'))
print(input.get_property('id'))
print(input.get_dom_attribute('id'))
print(input.get_attribute('class'))
print(input.get_property('class'))
print(input.get_dom_attribute('class'))