当前位置: 首页 > news >正文

【Python初级人工智能精讲】用Paddlehub给一段没有标点符号的文字加上合适的标点符号

Python初级人工智能精讲

文章目录

  • Python初级人工智能精讲
  • 一、写在前面
  • 二、七步精讲
  • 三、模型介绍
  • 四、进入实战
    • 1.源代码
    • 2.运行效果
      • (1) cmd方面
      • (2) txt文件运行前后对比
  • 五、休吃霸王餐
  • 六、每日一句

一、写在前面

今天给分享的程序是:给一段文字自动加上合适的标点符号,使用的是飞桨的AI算法模型:auto_punc,可以智能的分析文字中的情感并在每段文字中加上适合的标点符号。

二、七步精讲

代码我已调试过了,下面是操作步骤:

  1. 将代码复制到你的py文件中,存放在本地C盘根目录下,名为:auto_punc.py
  2. 安装所需要的Python 模块:
pip install paddlehub
  1. 准备好要加标点的文字,把文字放在一个 txt中,把txt路径放到代码中相应位置;
  2. 指定一个保存加好标点的文字的文件路径,路径放到代码中相应位置;
  3. Win+R运行cmd,在命令行中输入:python C:/auto_punc.py查看结果;
  4. 稍等一会后,所有没有加标点的文字,都自动加上了合适的标点;
  5. 至此,我们就完成了Python 给一段文字自动加上合适的标点符号的程序执行,大家喜欢的记得支持一下,有遇到问题的随时找我沟通。

三、模型介绍

Ernie百度提出的基于知识增强的持续学习语义理解模型,该模型将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇结构语义等方面的知识,实现模型效果不断进化。

四、进入实战

1.源代码

'''
Paddlehub给一段没有标点符号的文字加上合适的标点符号
'''
# 导入包
import paddlehub as hub

model = hub.Module(name='auto_punc', version='1.0.0')

# 定义方法
def addpunc(txtpath, savetxt):
    f = open(txtpath, encoding = "utf-8")
    # 输出读取到的数据
    txtstr = f.read().split("\n")
    punc_texts = model.add_puncs(txtstr)
    f.close()
    str1 = "\n"
    print('转换成功:', str1)
    with open(savetxt, "a", encoding='utf-8') as fc:
        fc.write(str1)  # 写入文件
        fc.write("\n\n")
        fc.close()

if __name__ == '__main__':
    # 存放要加标点符号的文字
    txtpath = r'D:\A\Project_1\source.txt'
    # 保存加号标点符号的文字
    savetxt = r'D:\A\Project_1\punc.txt'
    # 调用方法
    addpunc(txtpath, savetxt)

2.运行效果

(1) cmd方面

cmd的运行效果如下:

在这里插入图片描述

(2) txt文件运行前后对比

运行前:

在这里插入图片描述

运行后:

在这里插入图片描述

五、休吃霸王餐

这篇文章里有我创作的第一个人工智能项目,望各位赏脸,来了,就把您的三连留下呗~

六、每日一句

💖你努力样子像星辉、像野风,既美又酷~💖

在这里插入图片描述

相关文章:

  • idea使用fiddler抓包分析,fiddler抓取https
  • (附源码)python旅游推荐系统 毕业设计 250623
  • 泛型 和 IO流 和 网络编程
  • js 复制内容到剪切板
  • redis中的锁,通过UUID防止误删
  • 生命在于折腾——浅谈羊了个羊
  • 微雪树莓派PICO笔记——6. I2C(集成电路总线)
  • 容斥原理
  • RealityCapture摄影测量软件
  • TransBigData:一款基于 Python 的超酷炫交通时空大数据工具包
  • 矩阵理论复习部分——线性代数(1)行列式
  • 3 MyBatis 级联操作
  • Vue项目的部署(服务器)
  • 什么是 Docker 镜像层?
  • 0922 理论知识
  • 【剑指offer】让抽象问题具体化
  • Android优雅地处理按钮重复点击
  • Android组件 - 收藏集 - 掘金
  • ES6语法详解(一)
  • ES学习笔记(10)--ES6中的函数和数组补漏
  • golang 发送GET和POST示例
  • Java到底能干嘛?
  • MySQL常见的两种存储引擎:MyISAM与InnoDB的爱恨情仇
  • SpringBoot几种定时任务的实现方式
  • UEditor初始化失败(实例已存在,但视图未渲染出来,单页化)
  • Yii源码解读-服务定位器(Service Locator)
  • 创建一种深思熟虑的文化
  • 分布式事物理论与实践
  • 欢迎参加第二届中国游戏开发者大会
  • 看完九篇字体系列的文章,你还觉得我是在说字体?
  • 深入 Nginx 之配置篇
  • 提醒我喝水chrome插件开发指南
  • 推荐一款sublime text 3 支持JSX和es201x 代码格式化的插件
  • 小程序上传图片到七牛云(支持多张上传,预览,删除)
  • 一、python与pycharm的安装
  • 一加3T解锁OEM、刷入TWRP、第三方ROM以及ROOT
  • 在Unity中实现一个简单的消息管理器
  • 正则与JS中的正则
  • 好程序员web前端教程分享CSS不同元素margin的计算 ...
  • ​​​​​​​ubuntu16.04 fastreid训练过程
  • ​Linux Ubuntu环境下使用docker构建spark运行环境(超级详细)
  • ​Linux·i2c驱动架构​
  • #我与Java虚拟机的故事#连载10: 如何在阿里、腾讯、百度、及字节跳动等公司面试中脱颖而出...
  • #预处理和函数的对比以及条件编译
  • (1/2) 为了理解 UWP 的启动流程,我从零开始创建了一个 UWP 程序
  • (1综述)从零开始的嵌入式图像图像处理(PI+QT+OpenCV)实战演练
  • (C++)栈的链式存储结构(出栈、入栈、判空、遍历、销毁)(数据结构与算法)
  • (ros//EnvironmentVariables)ros环境变量
  • (安卓)跳转应用市场APP详情页的方式
  • (简单) HDU 2612 Find a way,BFS。
  • (一)硬件制作--从零开始自制linux掌上电脑(F1C200S) <嵌入式项目>
  • (转)IIS6 ASP 0251超过响应缓冲区限制错误的解决方法
  • (转载)深入super,看Python如何解决钻石继承难题
  • .gitignore文件_Git:.gitignore
  • .gitignore文件设置了忽略但不生效