当前位置: 首页 > news >正文

python数据预处理工作记录

检测string数据有nan值的情况

报错场景

titles = json.loads(row[‘titles’].replace(“'”, ‘"’))
^^^^^^^^^^^^^^^^^^^^^^^^^^^^
AttributeError: ‘float’ object has no attribute ‘replace’

检测

import pandas as pdstring = pd.NAif pd.isna(string):print("The string is NaN.")
else:print("The string is not NaN.")

python 将文本数据保存为json、csv、jsonl文件方法

pandas数据保存为.csv文件

df.to_csv('data.csv', index=False, encoding='utf-8')

json列表数据保存为.json文件

import json# 示例数据
data = [{"value": {"start": 268,"end": 273,"text": "博士生导师","labels": ["title"]}}
]# 保存数据到 .json 文件
with open('data.json', 'w', encoding='utf-8') as file:json.dump(data, file, ensure_ascii=False, indent=4)print("数据已保存到 data.json 文件中")

相关文章:

  • C++ Primer:3.6 多维数组
  • 人工智能前沿讲座——融合知识的自然语言处理
  • 用python写一个爬虫,爬取google中关于蛇的照片
  • OpenLayers学习笔记-点位聚合
  • python爬虫豆瓣电影TOP250
  • FakeNewsGPT4:通过知识增强的大规模视觉语言模型推进多模态假新闻检测
  • Python和C++骨髓细胞进化解析数学模型
  • prometheus+grafana应用监控配置
  • 基于springboot+vue+uniapp的超市购物系统小程序
  • 【Java--数据结构】二叉树oj题(上)
  • Nuxt.js头部魔法:轻松自定义页面元信息,提升用户体验
  • LeetCode 92. 反转链表 II
  • Hi3861 OpenHarmony嵌入式应用入门--华为 IoTDA 设备接入
  • 堆、栈和队列(数据结构)
  • PGCCC|【PostgreSQL】PCA+PCP+PCM等IT类认证申报个税退税指南
  • es6
  • nfs客户端进程变D,延伸linux的lock
  • vue--为什么data属性必须是一个函数
  • 阿里中间件开源组件:Sentinel 0.2.0正式发布
  • 关于 Cirru Editor 存储格式
  • 关于 Linux 进程的 UID、EUID、GID 和 EGID
  • 每个JavaScript开发人员应阅读的书【1】 - JavaScript: The Good Parts
  • 前端
  • 06-01 点餐小程序前台界面搭建
  • Unity3D - 异步加载游戏场景与异步加载游戏资源进度条 ...
  • 阿里云API、SDK和CLI应用实践方案
  • ​软考-高级-系统架构设计师教程(清华第2版)【第1章-绪论-思维导图】​
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • #我与Java虚拟机的故事#连载09:面试大厂逃不过的JVM
  • $forceUpdate()函数
  • (1)STL算法之遍历容器
  • (55)MOS管专题--->(10)MOS管的封装
  • (C++17) std算法之执行策略 execution
  • (办公)springboot配置aop处理请求.
  • (二十六)Java 数据结构
  • (翻译)Entity Framework技巧系列之七 - Tip 26 – 28
  • (附源码)python旅游推荐系统 毕业设计 250623
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (每日一问)设计模式:设计模式的原则与分类——如何提升代码质量?
  • (十二)devops持续集成开发——jenkins的全局工具配置之sonar qube环境安装及配置
  • (转)Android学习系列(31)--App自动化之使用Ant编译项目多渠道打包
  • (自用)网络编程
  • ./include/caffe/util/cudnn.hpp: In function ‘const char* cudnnGetErrorString(cudnnStatus_t)’: ./incl
  • .net 4.0发布后不能正常显示图片问题
  • .NET 跨平台图形库 SkiaSharp 基础应用
  • .NET平台开源项目速览(15)文档数据库RavenDB-介绍与初体验
  • .pub是什么文件_Rust 模块和文件 - 「译」
  • @Not - Empty-Null-Blank
  • [ 数据结构 - C++] AVL树原理及实现
  • [17]JAVAEE-HTTP协议
  • [ACTF2020 新生赛]Include
  • [BSidesCF 2019]Kookie1
  • [C++] 多线程编程-thread::yield()-sleep_for()
  • [CareerCup][Google Interview] 实现一个具有get_min的Queue
  • [ComfyUI]Flux+MiniCPM-V强强联手艺术创意,媲美GPT4V级国产多模态视觉大模型