Python合并多个Excel文件
1. 导入包
在进行Excel文件合并之前,首先需要导入所需的包。使用以下代码导入`os`、`pandas`和`openpyxl`包:
```python
import os
import pandas as pd
import openpyxl
import warnings
("ignore")
```
2. 添加源文件地址,获取文件名
通过指定源文件目录,并使用`()`函数获取该目录下所有文件的文件名列表。例如,将源文件目录设置为`./源文件`,则可以使用以下代码获取文件名列表:
```python
dir "./源文件"
filenames (dir)
print(filenames)
```
3. 新增空list,遍历文件append到空列
为了存储从每个Excel文件中读取的数据,我们创建一个空的列表`dfs`。然后,使用`_excel()`函数遍历文件名列表,并将每个文件的数据存储在一个临时DataFrame中。接着,我们将文件名作为新的一列添加到临时DataFrame中,并将其添加到`dfs`列表中。以下是实现上述操作的代码:
```python
dfs []
df1 []
for name in filenames:
print(name)
df1 _excel((dir, name))
username name
df1['文件名'] username
(df1)
```
4. 合并文件名列,表示数据来源,后保存合并后的文件
最后一步是将所有临时DataFrame合并成一个大的DataFrame,用于表示数据的来源。使用`()`函数将`dfs`列表中的所有DataFrame进行合并,并将结果保存为Excel文件。以下是合并文件和保存的代码:
```python
df (dfs, ignore_indexTrue)
_excel('./合并文件.xlsx', indexFalse)
```
这样,你就成功地合并了多个Excel文件,并保存了合并后的文件。这在处理大量数据时非常有用,可以节省时间和精力。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。