当前位置: 首页 > news >正文

Python使用Xpath轻松爬虫(脑残式)

1.在PyCharm安装lxml.

2.找到源码

3.F12、copy源码的xpath

4.代码

from lxml import etree
import requests

wb_data = requests.get("https://www.baidu.com/").text
html = etree.HTML(wb_data)
html_data = html.xpath('//*[@id="lh"]/a[2]');
for i in html_data:
    print(i.text)

  

转载于:https://www.cnblogs.com/ZaraNet/p/9938347.html

相关文章:

  • 在实验静态块等时遇到到关于main函数的问题
  • 解读微软开源MMLSpark:统一的大规模机器学习生态系统
  • DAX2012 R3安装
  • GIS中栅格数据结构的显示与计算
  • ORM::联表查询
  • Flume学习之路 (二)Flume的Source类型
  • 【struts2】Struts2的系统架构
  • STM32中用 stop 模式 配合低功耗模式下的自动唤醒(AWU) 能否实现FreeRTOS tickless 模式...
  • ECMAScript中所有的函数的参数都是按值传递的
  • 《快学 Go 语言》第 3 课 —— 分支与循环
  • spark中的动态executor分配
  • zeroclipboard无法正常使用的解决办法
  • Sublime Text 2 安装Package Control和插件的两种方法
  • SpringBoot整合RabbitMQ之典型应用场景实战一
  • MetaMask/provider-engine-3-test
  • Angular4 模板式表单用法以及验证
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • HashMap ConcurrentHashMap
  • Hibernate【inverse和cascade属性】知识要点
  • HTTP那些事
  • IndexedDB
  • Java 最常见的 200+ 面试题:面试必备
  • JS 面试题总结
  • PAT A1092
  • 浅谈JavaScript的面向对象和它的封装、继承、多态
  • 异步
  • 智能合约Solidity教程-事件和日志(一)
  • 走向全栈之MongoDB的使用
  • 继 XDL 之后,阿里妈妈开源大规模分布式图表征学习框架 Euler ...
  • ​批处理文件中的errorlevel用法
  • ​七周四次课(5月9日)iptables filter表案例、iptables nat表应用
  • # 执行时间 统计mysql_一文说尽 MySQL 优化原理
  • #{}和${}的区别是什么 -- java面试
  • (Matalb时序预测)WOA-BP鲸鱼算法优化BP神经网络的多维时序回归预测
  • (Redis使用系列) SpirngBoot中关于Redis的值的各种方式的存储与取出 三
  • (Redis使用系列) Springboot 使用Redis+Session实现Session共享 ,简单的单点登录 五
  • (八)c52学习之旅-中断实验
  • (第8天)保姆级 PL/SQL Developer 安装与配置
  • (附源码)计算机毕业设计ssm本地美食推荐平台
  • (十八)三元表达式和列表解析
  • (转)Android学习系列(31)--App自动化之使用Ant编译项目多渠道打包
  • .Net Framework 4.x 程序到底运行在哪个 CLR 版本之上
  • .NET MAUI学习笔记——2.构建第一个程序_初级篇
  • @AutoConfigurationPackage的使用
  • [ Linux ] git工具的基本使用(仓库的构建,提交)
  • [ 隧道技术 ] 反弹shell的集中常见方式(四)python反弹shell
  • [ 云计算 | AWS ] 对比分析:Amazon SNS 与 SQS 消息服务的异同与选择
  • [2018][note]用于超快偏振开关和动态光束分裂的all-optical有源THz超表——
  • [Assignment] C++1
  • [BZOJ1040][P2607][ZJOI2008]骑士[树形DP+基环树]
  • [Hive] INSERT OVERWRITE DIRECTORY要注意的问题
  • [HNOI2008]玩具装箱toy
  • [java基础揉碎]关系运算符(比较运算符)逻辑运算符赋值运算符三元运算符运算符的优先级
  • [JS] node.js 入门
  • [LeetCode] 196. 删除重复的电子邮箱