文章目录
- 比较两列差异性并降序排列
- 数据清洗
- 机器学习
- 机器学习预测
- 深度学习
-
- bert环境配置太麻烦 ,改用飞浆的bert
- 飞浆失败-接着bert,用谷歌AI
- bert的使用
- bert批量对excel使用
- 批量训练多个模型,对比准确率变化情况
- 机器学习部分
- bert批量训练
- bert批量预测五节课
- 机器学习批量预测五节课
- 画图部分
- 比较一致性和差异性
- 一致率打印前三高和后三高的类别和比例
- battle一致率
比较两列差异性并降序排列
import pandas as pd
import numpy as np# 读取Excel文件
file_path = 'last-all.xlsx'
df = pd.read_excel(file_path)# 指定要比较的列名
column1 = '标注'
column2 = '不含72b'# 将两列内容尝试转换为数字,无法转换的标记为 NaN
df[column1 + '_num'] = pd.to_numeric(df[column1], errors='coerce')
df[column2 + '_num'] = pd.to_numeric(df[column2], errors='coerce')# 比较数字列的内容是否一致,非数字内容标记为 NaN
differences = df[column1 + '_num'] != df[column2 + '_num']# 找出不一致的部分及其行号
diff_df = df[differences].copy()
diff_df['差异'] = df[column1].astype(str) + ' → ' + df[column2].astype(str)# 统计每类不一致的部分及其比例
diff_count