发布于2023-06-19 21:22 阅读(5005) 评论(0) 点赞(16) 收藏(4)
Pandas是Python中一个非常流行的数据处理库,它提供了一些强大的数据结构和数据分析工具,可以帮助我们更方便、快捷地处理数据。下面我们来介绍一下Pandas的使用方法。
1.导入Pandas库
在使用Pandas之前,需要先导入Pandas库。通常的做法是使用import语句导入Pandas库,并给它起一个别名。
import pandas as pd
Pandas中最常用的数据结构是DataFrame,它类似于Excel中的表格,可以用来存储二维数据。我们可以通过多种方式来创建DataFrame,比如从CSV文件、Excel文件、SQL数据库、Python字典等。
# 从Python字典创建DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
3.查看DataFrame
创建了DataFrame之后,我们可以使用head()、tail()、info()、describe()等方法来查看它的基本信息。
# 查看前5行数据
print(df.head())
# 查看后5行数据
print(df.tail())
# 查看DataFrame的基本信息
print(df.info())
# 查看DataFrame的描述性统计信息
print(df.describe())
4.选择数据
在DataFrame中,我们可以使用loc[]、iloc[]、at[]、iat[]等方法来选择数据。
# 选择第一行数据
print(df.loc[0])
# 选择前两行数据
print(df.iloc[:2])
# 选择name列数据
print(df['name'])
# 选择第一行、name列数据
print(df.at[0, 'name'])
5.筛选数据
我们可以使用布尔索引来筛选数据。
# 筛选年龄大于30的数据
print(df[df['age'] > 30])
# 筛选性别为男性的数据
print(df[df['gender'] == 'M'])
6.排序数据
我们可以使用sort_values()方法对DataFrame进行排序。
# 按照年龄升序排序
print(df.sort_values('age'))
# 按照年龄降序排序
print(df.sort_values('age', ascending=False))
7.处理缺失值
在实际数据处理中,我们经常会遇到缺失值。Pandas提供了一些方法来处理缺失值,比如dropna()、fillna()等。
# 删除含有缺失值的行
df.dropna(inplace=True)
# 用平均值填充缺失值
df.fillna(df.mean(), inplace=True)
原文链接:https://blog.csdn.net/weixin_46991302/article/details/129764373
作者:676yyj
链接:https://www.pythonheidong.com/blog/article/1991032/8a44627fe19a4bfaedc2/
来源:python黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
---无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事,而不是让内心的烦躁、焦虑,坏掉你本来就不多的热情和定力
Copyright © 2018-2021 python黑洞网 All Rights Reserved 版权所有,并保留所有权利。 京ICP备18063182号-1
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!