pandas获取指定数据的行和列 用pandas导入csv表格后,怎么指定那一列是index?
用pandas导入csv表格后,怎么指定那一列是index?
介绍panda并使用panda下的readucsv方法,读取CSV文件,参数是文件的路径,它是一个相对路径,是相对于当前工作目录的,那么如何知道当前工作目录呢?使用操作系统getcwd()方法在读取前三个工作目录后,获取当前工作目录的数据,检查读取是否正确,是否有明显的乱码,是什么问题?我们需要设置参数编码,即编码方法。如果不设置编码方法,则默认值为utf8。现在CSV文件是GBK编码的,所以我们需要使用encoding=“GBK”我的编辑器是eric4。请注意,eric4默认情况下不支持中文。如果您想显示中文,前提是要设置正确的编码,并在首选项中将其设置为utf8
1。前提:加载numpy、pandas和series、dataframe。生成一个序列并删除索引为“C”的项,如图所示。
2. 如果要连续删除多个指定项,可以在下拉列表中添加这些项的列表。
3. 接下来,让我们看看dataframe如何删除数据,并将其转换为具有四行四列的DF1。
4. 如果你直接使用DF1。Drop([“Beijing”、“Shanghai”]),可以删除索引为“Beijing”、“Shanghai”的数据。这就完成了操作。
pandas如何删除指定行?
分享一篇关于熊猫如何选择特定索引行的文章,希望对您有所帮助:
>>>>导入numpy作为NP
>>>导入pandas作为PD
>>>索引=np.数组([2,4,6,8,10])
>>>>数据=np.数组([3,5,7,9,11])
>>>>数据=pd.数据帧({“num”:data},index=index)
>>>打印(数据)
num
2 3
4 5
67
8 9
10 11
>>>选择索引=索引[索引> 5
]>>>打印(选择索引)
[6 8 10
]>>>数据[“num”]。loc[选择索引
]6 7
8 9
10 11
名称:num,数据类型:int32
>>
请注意不能使用iloc。Iloc以数组的形式访问序列,下标从0:]>>>> data[“num”]开始。Iloc[2:5
]6 7
8 9
10 11
名称:num,数据类型:int32
>>>>数据[“num”]。Iloc[[2,3,4
6 7
8 9
10 11
名称:num,数据类型:int32
>>>>数据[“num”]
>>>
试试
使用Python panda库,十行代码。
建议安装Anaconda或使用PIP install panda直接安装panda。
合并工作表数据,遍历每个工作表页面,并使用concat函数合并所有工作表数据。
重复数据消除,使用drop Duplicate()函数删除重复数据。
要写入合并结果,请使用uExecl()写入合并结果。
希望以上分享能对您有所帮助。欢迎评论和留言。
pandas获取指定数据的行和列 pandas选取特定列 pandas读取csv文件指定列
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。