当前位置: 首页 > news >正文

AIGC简化文件管理:Python自动重命名Word和PDF文件

1.背景

大家应该也有遇到,自己电脑有很多文件命名不合理的文件,比如:文件1、想法3 ,当你长时间再看到这个文件的时候,已经很难知道文件内容。 今天我们将借助AIGC的编码能力,帮我们生成一个批量改文件名的程序。

2.环境准备

1)通义千问 :https://tongyi.aliyun.com/qianwen

它的主要作用是帮助我们编写和调试代码

2)Python环境搭建:https://blog.csdn.net/qq_36918149/article/details/141833545?spm=1001.2014.3001.5501

3)PDF、Word 文件各准备1份,例如这样:
在这里插入图片描述

3. 步骤

1)怎么开始? 让Ai 给个方案

在这里插入图片描述

prompt:你是一位资深的程序员,帮我写一个Python程序,用于提取word、pdf 标题,然后将文件改为提取后的标题

2)安装Python依赖库

python-docx来处理Word文档,PyPDF2来处理PDF文档,以及os来重命名文件。

pip install python-docx PyPDF2

在这里插入图片描述

3) 执行Ai 生成的Python代码

在这里插入图片描述

关键点:

  • 请注意,对于PDF文件,我们假设标题位于第一页的第一行文本;对于Word文档,我们假设标题是文档中的第一个段落。

  • 这个脚本将遍历指定目录中的所有文件,并尝试根据文件类型(.docx 或 .pdf)提取标题。标题中不允许出现的字符会被替换为空格。如果成功提取到标题,它将把文件重命名为新标题加上原来的文件扩展名。

  • 请确保您替换directory_to_process变量为实际的文件路径,并且在运行脚本前备份您的文件以防万一。此外,此脚本仅适用于包含纯文本标题的情况,如果您的标题格式更为复杂,可能需要调整提取逻辑。

4)成果

以前命名自动命名后
在这里插入图片描述在这里插入图片描述

4. 总结

本次只是通过Python代码去取了文件第一行作为标题,若第一行数据错误,会导致标题错误。后续,会结合AIGC 阅读文档能力,总结汇总出标题。

相关文章:

  • 配置Microsoft Exchange接受域的详细指南
  • 【数据结构】排序算法系列——序言(附源码+图解)
  • Vue——Diff算法
  • 9.8通宵速通javascript
  • 图论(2)
  • 微信小程序uniappvue3版本-控制tabbar某一个的显示与隐藏
  • jmeter之ForEach控制器使用
  • Java | Leetcode Java题解之第386题字典序排数
  • 高压挑战:新能源汽车换电连接器的技术革新
  • 【机器人工具箱Robotics Toolbox开发笔记(十九)】机器人工具箱Link类函数参数说明
  • 时间同步服务
  • 基于yolov8的焊缝质量好坏系统python源码+onnx模型+评估指标曲线+精美GUI界面
  • JavaScript 知识点总结
  • [数据集][目标检测]鲜花检测数据集VOC+YOLO格式25215张106类别
  • 哪些无线通信系统没用OFDM系统
  • 【JavaScript】通过闭包创建具有私有属性的实例对象
  • dva中组件的懒加载
  • Java 内存分配及垃圾回收机制初探
  • Java-详解HashMap
  • JAVA之继承和多态
  • java中具有继承关系的类及其对象初始化顺序
  • JS变量作用域
  • Linux下的乱码问题
  • Perseus-BERT——业内性能极致优化的BERT训练方案
  • springboot_database项目介绍
  • Traffic-Sign Detection and Classification in the Wild 论文笔记
  • Webpack 4x 之路 ( 四 )
  • Web标准制定过程
  • 从0搭建SpringBoot的HelloWorld -- Java版本
  • 开发了一款写作软件(OSX,Windows),附带Electron开发指南
  • 可能是历史上最全的CC0版权可以免费商用的图片网站
  • 深度学习中的信息论知识详解
  • 试着探索高并发下的系统架构面貌
  • 详解移动APP与web APP的区别
  • ​​​【收录 Hello 算法】9.4 小结
  • ​软考-高级-系统架构设计师教程(清华第2版)【第9章 软件可靠性基础知识(P320~344)-思维导图】​
  • ​香农与信息论三大定律
  • ‌U盘闪一下就没了?‌如何有效恢复数据
  • # AI产品经理的自我修养:既懂用户,更懂技术!
  • (Java实习生)每日10道面试题打卡——JavaWeb篇
  • (LeetCode 49)Anagrams
  • (Python第六天)文件处理
  • (windows2012共享文件夹和防火墙设置
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (佳作)两轮平衡小车(原理图、PCB、程序源码、BOM等)
  • (十二)springboot实战——SSE服务推送事件案例实现
  • (一)utf8mb4_general_ci 和 utf8mb4_unicode_ci 适用排序和比较规则场景
  • (一)使用IDEA创建Maven项目和Maven使用入门(配图详解)
  • (转)重识new
  • .bat批处理(六):替换字符串中匹配的子串
  • .NET CF命令行调试器MDbg入门(一)
  • .NET Core中Emit的使用
  • .NET/C# 使用反射注册事件
  • .NET中两种OCR方式对比
  • @KafkaListener注解详解(一)| 常用参数详解