当前位置: 首页 > news >正文

python自动化小技巧08——从剪贴板读取数据(快速复制粘贴)

从网页获取数据,对于爬虫等方法是很快,但是网页文件通常对新手不友好,结构格式什么的很复杂,对于无写爬虫代码能力的小白就只能复制粘贴数据了,一点点从网页上把数据复制,然后粘贴到excel里面。

但是对于复制粘贴,也有快速的方法。

主要依靠pandas库里面的pd.read_clipboard()实现,该函数可以读取剪贴板,变为数据框。

具体使用方法演示如下:

首先我找了一个案例网站,还是东方财富网,财报数据:

2022年中报业绩大全 _ 数据中心 _ 东方财富网 (eastmoney.com)

 到这个网站我们先复制一下第一页的数据。

 注意我这里复制的时候没有复制标题,因为东方财富网这个标题不规范,行数不一样,所以我们复制的时候就复制下面的数据就行。

当然存储下来的数据也没有标题,不过标题就一行,可以后面再去手动加。

写一个Python脚本,运行:

import pandas as pd
data=pd.DataFrame()

while True:
    a=input('退出就输入n,回车或任意键继续')
    if a=='n':
        break
    df=pd.read_clipboard(header=None)
    data=data.append(df)

data.to_excel('复制粘贴的数据.xlsx',index=False)

 每一次我们复制了新的数据,就按一次回车就行,然后再去复制下一页,回车让数据进去,然后循环往复.........当然回车前输入任意别的字符也可以,如果复制完了就输入“n”然后回车退出。

退出后该目录下就会自动多出一个excel文件:

 

 我这里复制了四次,然后存储下来,看看结果:

效果还不错,列名没有后面可以自己加。然后复制了4页就是200条数据,也是对得上,没问题。 

 

 


复制什么别的数据也是可以的,只要列数都是一样,每次回车新复制的数据都会追加进去。

如果感觉要复制的量太多也可以分批完成,先复制1-5页存下来看看效果,然后继续复制6-10....最后合并一下就行。

相关文章:

  • 【Linux】之Jumpserver堡垒机的部署/搭建
  • 学习信奥要不要先学python
  • Yolov7训练自己的数据集(超详细)
  • 常见网络知识面试题总结
  • 当前行情下,真的还能“跳进”进大厂吗?
  • Vue入门【五】-- 组件通信
  • Golang并发-Go优雅的退出程序(同步等待组 sync.WaitGroup)
  • 520.检测大写字母
  • 分位数回归的求解
  • Hadoop 完全分布式(3.1.3)部署(清爽版)
  • 【.Net实用方法总结】 整理并总结文件和流、异步文件IO、处理IO错误
  • LeetCode力扣刷题——千奇百怪的排序算法
  • django基于python的疫情防控下医院人员调动系统--python-计算机毕业设计
  • 详解字符串比较函数:strcmp函数及其模拟实现
  • 【Linux】安装Tomcat以yum方式安装
  • css选择器
  • Linux CTF 逆向入门
  • node-sass 安装卡在 node scripts/install.js 解决办法
  • NSTimer学习笔记
  • Python - 闭包Closure
  • Python十分钟制作属于你自己的个性logo
  • Vue2.x学习三:事件处理生命周期钩子
  • 安装python包到指定虚拟环境
  • 闭包--闭包之tab栏切换(四)
  • 来,膜拜下android roadmap,强大的执行力
  • 用Visual Studio开发以太坊智能合约
  • 【云吞铺子】性能抖动剖析(二)
  • Java数据解析之JSON
  • puppet连载22:define用法
  • 扩展资源服务器解决oauth2 性能瓶颈
  • 新年再起“裁员潮”,“钢铁侠”马斯克要一举裁掉SpaceX 600余名员工 ...
  • ​configparser --- 配置文件解析器​
  • ​二进制运算符:(与运算)、|(或运算)、~(取反运算)、^(异或运算)、位移运算符​
  • ###C语言程序设计-----C语言学习(3)#
  • #HarmonyOS:软件安装window和mac预览Hello World
  • #Linux(帮助手册)
  • #大学#套接字
  • #我与Java虚拟机的故事#连载05:Java虚拟机的修炼之道
  • (4)通过调用hadoop的java api实现本地文件上传到hadoop文件系统上
  • (6)设计一个TimeMap
  • (c语言版)滑动窗口 给定一个字符串,只包含字母和数字,按要求找出字符串中的最长(连续)子串的长度
  • (附源码)springboot美食分享系统 毕业设计 612231
  • (附源码)计算机毕业设计ssm本地美食推荐平台
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (求助)用傲游上csdn博客时标签栏和网址栏一直显示袁萌 的头像
  • (十三)Flask之特殊装饰器详解
  • (四) 虚拟摄像头vivi体验
  • (循环依赖问题)学习spring的第九天
  • (转)重识new
  • (最优化理论与方法)第二章最优化所需基础知识-第三节:重要凸集举例
  • .net企业级架构实战之7——Spring.net整合Asp.net mvc
  • /bin/bash^M: bad interpreter: No such file or directory
  • ?.的用法
  • [ 数据结构 - C++] AVL树原理及实现
  • [ 云计算 | AWS 实践 ] Java 如何重命名 Amazon S3 中的文件和文件夹