python + selenium + chrome headless 的一些備忘

Elle 發(fā)布于2019-07-30 15:35 / 1698人閱讀

摘要：使用在中進行了一項使用瀏覽器的工作在此記錄下遇到的問題以及解決方法入門參考中如何安裝瀏覽器以及參考啟動瀏覽器時常用的屬性指定瀏覽器分辨率谷歌文檔提到需要加上這個屬性來規(guī)避隱藏滾動條應(yīng)對一些特殊頁面不加載圖片提升速度

使用python3.6在Ubuntu中進行了一項使用Chrome headless瀏覽器的工作, 在此記錄下遇到的問題以及解決方法.

入門?

參考 unning-selenium-with-headless-chrome

Ubuntu中如何安裝chrome瀏覽器, 以及chromedriver?

參考 Installing ChromeDriver on Ubuntu

selenium啟動瀏覽器時常用的屬性

from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_argument("window-size=1920x3000") #指定瀏覽器分辨率
chrome_options.add_argument("--disable-gpu") #谷歌文檔提到需要加上這個屬性來規(guī)避bug
chrome_options.add_argument("--hide-scrollbars") #隱藏滾動條, 應(yīng)對一些特殊頁面
chrome_options.add_argument("blink-settings=imagesEnabled=false") #不加載圖片, 提升速度
chrome_options.add_argument("--headless") #瀏覽器不提供可視化頁面. linux下如果系統(tǒng)不支持可視化不加這條會啟動失敗
chrome_options.binary_location = r"/Applications/Google Chrome Canary.app/Contents/MacOS/Google Chrome Canary" #手動指定使用的瀏覽器位置

selenium如何連接到已經(jīng)開啟的瀏覽器?

需要在打開瀏覽器后, 獲取瀏覽器的command_executor url, 以及session_id

opener.command_executor._url, opener.session_id #opener為webdriver對象

之后通過remote方式鏈接

from selenium import webdriver
opener = webdriver.Remote(command_executor=_url,desired_capabilities={}) #_url為上面的_url
opener.close() #這時會打開一個全新的瀏覽器對象, 先把新的關(guān)掉
opener.session_id = session_id #session_id為上面的session_id

之后對opener的任何操作都會反映在之前的瀏覽器上.

selenium 的 desired_capabilities 如何傳遞--headless這樣的瀏覽器參數(shù)

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
capabilities = DesiredCapabilities.CHROME
capabilities.setdefault("chromeOptions", {"args":["--headless", "--disable-gpu"]})

selenium 使用 crontab等環(huán)境啟動時提示chromedriver not in PATH

初始化的時候, 傳入chromedriver絕對路徑

opener = webdriver.Chrome(r"/usr/local/bin/chromedriver", chrome_options=chrome_options)

selenium使用cookies

獲得cookies
opener.get_cookies()

寫入cookies
opener.add_cookie(cookie) #需要先訪問該網(wǎng)站產(chǎn)生cookies后再進行覆寫

selenium 等待頁面所有異步函數(shù)完成

opener.implicitly_wait(30) #30是最長等待時間

selenium 打開新標簽頁

偏向使用js函數(shù)來執(zhí)行

opener.execute_script("""window.open("http://baidu.com","_blank");""")

selenium 獲得頁面的網(wǎng)絡(luò)請求信息

有些時候頁面在你點擊后會異步進行請求, 完成一些操作, 這時可能就會生成輸出數(shù)據(jù)的url, 只要抓到這個url就可以跳過token驗證等安全監(jiān)測, 直接獲得數(shù)據(jù).

script =  "var performance = window.performance || window.mozPerformance || window.msPerformance || window.webkitPerformance || {}; var network = performance.getEntries() || {}; return network;"
performances = opener.execute_script(script)

script里是js代碼, 一般用來進行性能檢查, 網(wǎng)絡(luò)請求狀況, 使用selenium執(zhí)行這段js就可以獲得所有的請求信息.

おわり.

云服務(wù)器 GPU云服務(wù)器 Python_selenium_phan 一些python程序 Headless java的一些代碼

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.hztianpu.com/yun/41342.html

發(fā)表評論

登陸后可評論

0條評論

Elle

男|高級講師

我要關(guān)注我要私信

TA的文章

Linux——Linux驅(qū)動之完整的驅(qū)動操作硬件基礎(chǔ)實踐，Linux下如何像裸機那樣通過GPIO控制

閱讀 1352·2021-10-08 10:04
編碼之道（一）：程序員的“圣經(jīng)“

閱讀 1983·2021-09-04 16:40
css 實現(xiàn)各種基本圖形

閱讀 2598·2019-08-30 13:21
前端每日實戰(zhàn)：2# 視頻演示如何用純 CSS 創(chuàng)作一個矩形旋轉(zhuǎn) loader 特效

閱讀 2349·2019-08-29 15:10
教你認清這8大殺手锏

閱讀 2920·2019-08-29 12:35
ES6標準——學習及應(yīng)用 1

閱讀 1253·2019-08-26 17:41
如何自學前端框架？

閱讀 3125·2019-08-26 17:03
關(guān)于Vue頁面JS+JQ無法調(diào)用頁面方法與data

閱讀 1235·2019-08-26 12:01

成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲中文字幕日韩无码

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

python + selenium + chrome headless 的一些備忘

相關(guān)文章

在headless模式下運行selenium

**使用瀏覽器的HEADLESS模式進行自動化測試**

Scrapy+Chromium+代理+selenium

**使用 headless chrome進行測試**

selenium+chrome headless完成自動百度八斗平臺的錄入問題（python版本為2

發(fā)表評論

0條評論

Elle

男|高級講師

TA的文章

Linux——Linux驅(qū)動之完整的驅(qū)動操作硬件基礎(chǔ)實踐，Linux下如何像裸機那樣通過GPIO控制

編碼之道（一）：程序員的“圣經(jīng)“

css 實現(xiàn)各種基本圖形

前端每日實戰(zhàn)：2# 視頻演示如何用純 CSS 創(chuàng)作一個矩形旋轉(zhuǎn) loader 特效

教你認清這8大殺手锏

ES6標準——學習及應(yīng)用 1

如何自學前端框架？

關(guān)于Vue頁面JS+JQ無法調(diào)用頁面方法與data

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

python + selenium + chrome headless 的一些備忘

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！