当前位置: 首页 > news >正文

python selenium 打开网页

selenium工具类 - 文件名 seleniumkit.py

代码如下

# -*- coding:utf-8 _*-from selenium import webdriverimport os
import timefrom selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import Byfrom selenium.webdriver.chrome.service import Service# 打开网页,会呼出浏览器
def seleniumOpenUrl(initUrl):chrome_options = webdriver.ChromeOptions()chrome_options.add_argument('---ignore-certificate-errors-spki-list')chrome_options.add_argument('--ignore-ssl-errors')chrome_options.add_argument('--ignore-ssl-error')chrome_options.add_argument('log-level=2')# 解决谷歌堆栈溢出问题chrome_options.add_experimental_option('useAutomationExtension', False)# https://blog.csdn.net/huashao0602/article/details/124322123# 解决遇到反爬虫 获取不到数据问题 Selenium绕过检测 & 隐藏特征chrome_options.add_argument("--disable-blink-features=AutomationControlled")# chromedriver.exe 放在根目录下path = os.path.join(os.getcwd(), 'chromedriver.exe')print('chromePath:', path)service = Service(executable_path=path)driver = webdriver.Chrome(options=chrome_options,service=service)driver.get(initUrl)driver.maximize_window()return driver# 打开网页,无浏览器模式
def seleniumOpenUrlHeadless(initUrl):chrome_options = webdriver.ChromeOptions()chrome_options.add_argument('---ignore-certificate-errors-spki-list')chrome_options.add_argument('--ignore-ssl-errors')chrome_options.add_argument('--ignore-ssl-error')chrome_options.add_argument('log-level=2')# 解决谷歌堆栈溢出问题chrome_options.add_experimental_option('useAutomationExtension', False)# https://blog.csdn.net/huashao0602/article/details/124322123# 解决遇到反爬虫 获取不到数据问题 Selenium绕过检测 & 隐藏特征chrome_options.add_argument("--disable-blink-features=AutomationControlled")# chromedriver.exe 放在根目录下path = os.path.join(os.getcwd(), 'chromedriver.exe')print('chromePath:', path)browser_locale = 'fr'chrome_options.add_argument("--lang={}".format(browser_locale))chrome_options.add_argument("--headless")chrome_options.add_argument('headless')service = Service(executable_path=path)driver = webdriver.Chrome(options=chrome_options, service=service)driver.get(initUrl)driver.maximize_window()return driver

测试打开百度 - test.py

# -*- coding:utf-8 _*-from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from seleniumkit import *def openBaiDu():initUrl = "https://www.baidu.com/"driver = seleniumOpenUrl(initUrl)return driverif __name__ == "__main__":openBaiDu()time.sleep(10)

打开百度的效果

在这里插入图片描述

相关文章:

  • Unity解决报错:Execution failed for task ‘:unityLibrary:BuildIl2CppTask‘
  • 淘客返利平台的API设计与安全
  • 在postgrel中使用hints
  • 等保2.0安全计算环境解读
  • 【0299】Postgres内核之哈希表(Hash Tables)
  • FIO压测磁盘性能以及需要注意的问题
  • 下标引用操作符;函数调用操作符;结构成员访问操作符
  • MySQL-核心知识要点
  • 基于大语言模型的本地知识库问答(离线部署)
  • vue3开发过程中遇到的一些问题记录
  • C++ 彻底搞懂指针(1)
  • golang 1.22特性之for loop
  • 确保家电安全无忧:可燃气体报警器检验的重要性与必要性
  • 【小程序静态页面】猜拳游戏大转盘积分游戏小程序前端模板源码
  • word图题表题公式按照章节编号(不用题注)
  • [NodeJS] 关于Buffer
  • [分享]iOS开发-关于在xcode中引用文件夹右边出现问号的解决办法
  • 345-反转字符串中的元音字母
  • IDEA常用插件整理
  • JSDuck 与 AngularJS 融合技巧
  • Next.js之基础概念(二)
  • PAT A1092
  • Promise面试题2实现异步串行执行
  • Terraform入门 - 3. 变更基础设施
  • vue和cordova项目整合打包,并实现vue调用android的相机的demo
  • 阿里云容器服务区块链解决方案全新升级 支持Hyperledger Fabric v1.1
  • 从零开始的无人驾驶 1
  • 马上搞懂 GeoJSON
  • 如何用Ubuntu和Xen来设置Kubernetes?
  • 推荐一个React的管理后台框架
  • 温故知新之javascript面向对象
  • ​2021半年盘点,不想你错过的重磅新书
  • ​ubuntu下安装kvm虚拟机
  • # Apache SeaTunnel 究竟是什么?
  • #pragma data_seg 共享数据区(转)
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • (1)(1.8) MSP(MultiWii 串行协议)(4.1 版)
  • (ctrl.obj) : error LNK2038: 检测到“RuntimeLibrary”的不匹配项: 值“MDd_DynamicDebug”不匹配值“
  • (Matlab)基于蝙蝠算法实现电力系统经济调度
  • (八)c52学习之旅-中断实验
  • (分享)一个图片添加水印的小demo的页面,可自定义样式
  • (附源码)ssm高校社团管理系统 毕业设计 234162
  • (未解决)macOS matplotlib 中文是方框
  • (学习日记)2024.04.10:UCOSIII第三十八节:事件实验
  • (一)Mocha源码阅读: 项目结构及命令行启动
  • (正则)提取页面里的img标签
  • (转)甲方乙方——赵民谈找工作
  • .aanva
  • .NET MVC第三章、三种传值方式
  • .Net 知识杂记
  • .NET/C# 检测电脑上安装的 .NET Framework 的版本
  • .NET/C# 解压 Zip 文件时出现异常:System.IO.InvalidDataException: 找不到中央目录结尾记录。
  • .NET业务框架的构建
  • .pings勒索病毒的威胁:如何应对.pings勒索病毒的突袭?
  • [ MSF使用实例 ] 利用永恒之蓝(MS17-010)漏洞导致windows靶机蓝屏并获取靶机权限