2.爬虫数据提取——Xpath环境配置
爬虫数据提取——Xpath环境配置
一、什么是Xpath语法?
xpath(XML Path Language)是一门在XML和HTML文档中查找信息的语言,可用来在XML和HTML文档中对元素和属性进行遍历。简单来说,我们的数据是超文本数据,想要获取超文本数据里面的内容,就要按照一定规则来进行数据的获取,这种规则就叫做Xpath语法。
二、通过规则怎样定位数据?
XPath 用于在 HTML 文档中通过元素【HTML标签】和属性【HTML标签的属性】进行数据的定位。
举例如下:
三、安装Xpath环境
(1)谷歌浏览器
进入谷歌浏览器的扩展程序,将xpath插件直接拉到插件栏即可,然后重启谷歌浏览器,即可发现已经将xpath插件安装成功。
(2)qq浏览器
直接在应用中心搜索Xpath,然后找到安装即可,重启浏览器即可使用。【不再详细演示】
扫描二维码即可参与该课程,解锁更多爬虫知识: