当前位置：首页 > news >正文

pandas中的concat函数：详尽指南

news 来源：原创 2024/9/20 17:36:31

concat

- 目录
- - 1. `concat`简介
  - 2. 语法和参数
  - 3. 连接DataFrame
  - - 按行连接（axis=0）
    - 按列连接（axis=1）
  - 4. 处理索引
  - - 忽略索引
    - 使用键
  - 5. 添加层次索引
  - 6. 合并DataFrame
  - 7. 最佳实践和提示
  - 8. 结论

concat函数是pandas库中一个强大的工具，用于沿特定轴连接多个DataFrame或Series对象。本指南将深入介绍concat函数，涵盖其语法、参数和实际示例。

objs：一个Series或DataFrame对象的序列或映射。如果传递的是字典，键将用作keys参数。
axis：{0或‘index’，1或‘columns’}，默认0。沿着哪个轴连接。
join：{‘inner’，‘outer’}，默认‘outer’。如何处理其他轴上的索引。
ignore_index：布尔值，默认False。如果为True，不使用连接轴上的索引值。结果轴将被标记为0, …, n - 1。
keys：序列，默认None。如果传递多个级别，应包含元组。使用传递的键构建外部级别的层次索引。
levels：序列列表，默认None。用于构建MultiIndex的特定级别（唯一值）。
names：列表，默认None。结果层次索引中级别的名称。
verify_integrity：布尔值，默认False。检查新轴是否包含重复值。
sort：布尔值，默认False。按字典顺序对非连接轴进行排序。
copy：布尔值，默认True。如果为False，不复制数据（默认总是复制）。

3. 连接DataFrame

按行连接（axis=0）

这是最常见的连接方式，将多个DataFrame按行组合在一起。

import pandas as pddf1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', 'B3']
})df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],'B': ['B4', 'B5', 'B6', 'B7']
})result = pd.concat([df1, df2])
print(result)

输出：

    A   B
0  A0  B0
1  A1  B1
2  A2  B2
3  A3  B3
0  A4  B4
1  A5  B5
2  A6  B6
3  A7  B7

按列连接（axis=1）

将多个DataFrame按列组合在一起。

df3 = pd.DataFrame({'C': ['C0', 'C1', 'C2', 'C3'],'D': ['D0', 'D1', 'D2', 'D3']
})result = pd.concat([df1, df3], axis=1)
print(result)

输出：

    A   B   C   D
0  A0  B0  C0  D0
1  A1  B1  C1  D1
2  A2  B2  C2  D2
3  A3  B3  C3  D3

4. 处理索引

忽略索引

可以使用ignore_index=True来重新索引结果DataFrame。

result = pd.concat([df1, df2], ignore_index=True)
print(result)

输出：

    A   B
0  A0  B0
1  A1  B1
2  A2  B2
3  A3  B3
4  A4  B4
5  A5  B5
6  A6  B6
7  A7  B7

使用键

可以使用keys参数为每个DataFrame添加一个键，从而构建层次索引。

result = pd.concat([df1, df2], keys=['df1', 'df2'])
print(result)

输出：

        A   B
df1 0  A0  B01  A1  B12  A2  B23  A3  B3
df2 0  A4  B41  A5  B52  A6  B63  A7  B7

5. 添加层次索引

levels和names参数允许在多级索引中指定级别和值的名称。

result = pd.concat([df1, df2], keys=['df1', 'df2'], names=['DataFrame', 'Row ID'])
print(result)

输出：

                  A   B
DataFrame Row ID          
df1       0      A0  B01      A1  B12      A2  B23      A3  B3
df2       0      A4  B41      A5  B52      A6  B63      A7  B7

6. 合并DataFrame

concat函数也可以用来合并DataFrame，类似于SQL中的联合操作。

df4 = pd.DataFrame({'A': ['A8', 'A9', 'A10', 'A11'],'B': ['B8', 'B9', 'B10', 'B11']
})result = pd.concat([df1, df4], ignore_index=True)
print(result)

输出：

     A    B
0   A0   B0
1   A1   B1
2   A2   B2
3   A3   B3
4   A8   B8
5   A9   B9
6  A10  B10
7  A11  B11

7. 最佳实践和提示

选择正确的轴：根据数据的结构选择适当的轴（行或列）进行连接。
注意索引：使用ignore_index或keys参数来处理索引，以确保结果的可读性和可操作性。
检查数据一致性：确保连接的数据结构一致，特别是列名和数据类型。
性能优化：尽量减少不必要的数据复制，可以通过设置copy=False来优化性能。

8. 结论

pandas的concat函数是数据处理过程中非常有用的工具，灵活且强大。通过掌握其语法和参数，可以轻松应对各种数据连接需求，从而提高数据处理效率和代码的可读性。

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

HTTP简单概述

QML中的Date将时间戳和指定格式时间互转

人工智能与机器学习的相关介绍

速盾：cdn防盗链

【C++标准模版库】模拟实现vector+迭代器失效问题

Flume系列之：把flume配置写入到zookeeper节点

net 工控机字节转换字符，ToString 格式化

前端HTML+CSS复习

AIGC平台创业启示录：从Airbnb的成功经验中汲取灵感

反制攻击者-蚁剑低版本

腾讯OCR签名算法

EDI是什么：EDI系统功能介绍

Depth Anything——强大的单目深度估计模型

北京崇文门中医院贾英才主任解读头晕：症状与根源

[Unity] ShaderGraph实现DeBuff污染溶解叠加效果

0基础学习移动端适配

express.js的介绍及使用

HashMap ConcurrentHashMap

JavaScript设计模式与开发实践系列之策略模式

Laravel5.4 Queues队列学习

Linux链接文件

python 学习笔记 - Queue Pipes，进程间通讯

ReactNativeweexDeviceOne对比

UEditor初始化失败（实例已存在，但视图未渲染出来，单页化）

Vim Clutch | 面向脚踏板编程……

vue-cli在webpack的配置文件探究

Webpack 4 学习01（基础配置）

简析gRPC client 连接管理

七牛云假注销小指南

使用 Xcode 的 Target 区分开发和生产环境

用Visual Studio开发以太坊智能合约

软考-高级-系统架构设计师教程（清华第2版）【第15章面向服务架构设计理论与实践（P527~554）-思维导图】

# 服务治理中间件详解：Spring Cloud与Dubbo

#etcd#安装时出错

(2022 CVPR) Unbiased Teacher v2

（HAL）STM32F103C6T8——软件模拟I2C驱动0.96寸OLED屏幕

（笔试题）分解质因式

(创新)基于VMD-CNN-BiLSTM的电力负荷预测—代码+数据

（二）构建dubbo分布式平台-平台功能导图

（二）基于wpr_simulation 的Ros机器人运动控制，gazebo仿真

（七）Appdesigner-初步入门及常用组件的使用方法说明

（一）Linux+Windows下安装ffmpeg

（一）springboot2.7.6集成activit5.23.0之集成引擎

（一一四）第九章编程练习

(转载)在C#用WM_COPYDATA消息来实现两个进程之间传递数据

.mp4格式的视频为何不能通过video标签在chrome浏览器中播放？

.Net 代码性能 - (1)

.NET/C# 在 64 位进程中读取 32 位进程重定向后的注册表

.net2005怎么读string形的xml，不是xml文件。

.net遍历html中全部的中文,ASP.NET中遍历页面的所有button控件

.NET和.COM和.CN域名区别

.net下简单快捷的数值高低位切换

/proc/interrupts 和 /proc/stat 查看中断的情况

:如何用SQL脚本保存存储过程返回的结果集

@DateTimeFormat 和 @JsonFormat 注解详解