Pandas读取行列数据最全方法(高考年份)

1、读取方法有按行（单行，多行连续，多行不连续），按列（单列，多列连续，多列不连续）；部分不连续行不连续列；按位置（坐标），按字符（索引）；按块（list）；函数有 df.iloc(), df.loc(), df.iat(), df.at(), df.ix()。

2、转换为DF，赋值columns，index，修改添加数据，取行列索引

data = {'省份': ['北京', '上海', '广州', '深圳'],
  '年份': ['2017', '2018', '2019', '2020'],
  '总人数': ['2200', '1900', '2170', '1890'],
  '高考人数': ['6.3', '5.9', '6.0', '5.2']}
df = pd.DataFrame(data, columns=['省份', '年份', '总人数', '高考人数', '高数'],
index=['one', 'two', 'three', 'four'])
df['高数'] = ['90', '95', '92', '98']
print("行索引：{}".format(list(df.index)))
print("列索引：{}".format(list(df.columns)))
print(df.index[1:3])
print(df.columns[1])
print(df.columns[1:3])
print(df)

行索引：['one', 'two', 'three', 'four']
列索引：['省份', '年份', '总人数', '高考人数', '高数']
Index(['two', 'three'], dtype='object')
年份
Index(['年份', '总人数'], dtype='object')
省份年份总人数高考人数高数
one 北京 2017 2200 6.3 90
two 上海 2018 1900 5.9 95
three 广州 2019 2170 6.0 92
four 深圳 2020 1890 5.2 98

3、iloc不能通过[:, [1:3]]取连续数据，取连续数据只能通过 df[df.columns[1:4]]，先获取列索引，再取数据。

print(df['省份'])  #按列名取列
print(df.省份)  #按列名取列
print(df[['省份', '总人数']])  #按列名取不连续列数据
print(df[df.columns[1:4]])  #按列索引取连续列数据
print(df.iloc[:, 1])  #按位置取列
print(df.iloc[:, [1, 3]])  #按位置取不连续列数据

one 北京
two 上海
three 广州
four 深圳
Name: 省份, dtype: object
one 北京
two 上海
three 广州
four 深圳
Name: 省份, dtype: object
省份总人数
one 北京 2200
two 上海 1900
three 广州 2170
four 深圳 1890
年份总人数高考人数
one 2017 2200 6.3
two 2018 1900 5.9
three 2019 2170 6.0
four 2020 1890 5.2
one 2017
two 2018
three 2019
four 2020
Name: 年份, dtype: object
年份高考人数
one 2017 6.3
two 2018 5.9
three 2019 6.0
four 2020 5.2

4、通过df.iloc[]（数字）取行数据，取部分行部分列时，要先写行，再写列；有条件的取数据

print(df[1:3])  #按行取数据，这行代码结果没在下面输出
print(df[df.高数>90])  #按行有条件的取数据，结果没输出
print(df.iloc[1])  #按行取行数据
print(df.iloc[1, 3])  #按坐标取
print(df.iloc[[1], [3]])  #按坐标取
print(df.loc[df.index[1:3]])  #按行索引取行，但没必要
print(df.iloc[1:3])  #按行取连续数据
print(df.iloc[[1, 3]])  按行取不连续数据
print(df.iloc[[1,2,3], [2,4]])  取部分行部分列数据

省份上海
年份 2018
总人数 1900
高考人数 5.9
高数 95
Name: two, dtype: object
5.9
高考人数
two 5.9
省份年份总人数高考人数高数
two 上海 2018 1900 5.9 95
three 广州 2019 2170 6.0 92
省份年份总人数高考人数高数
two 上海 2018 1900 5.9 95
three 广州 2019 2170 6.0 92
省份年份总人数高考人数高数
two 上海 2018 1900 5.9 95
four 深圳 2020 1890 5.2 98
总人数高数
two 1900 95
three 2170 92
four 1890 98

5、通过df.loc[]索引（字符）取行数据。

print(df.loc['two'])
print(df.loc['two', '省份'])
print(df.loc['two':'three'])
print(df.loc[['one', 'three']])
print(df.loc[['one', 'three'], ['省份', '年份']])

省份上海
年份 2018
总人数 1900
高考人数 5.9
高数 95
Name: two, dtype: object
上海
省份年份总人数高考人数高数
two 上海 2018 1900 5.9 95
three 广州 2019 2170 6.0 92
省份年份总人数高考人数高数
one 北京 2017 2200 6.3 90
three 广州 2019 2170 6.0 92
省份年份
one 北京 2017
three 广州 2019

6、ix，iat，at取行列数据，此方法不常用，可以使用上面方法即可。

print(df.ix[1:3])
print(df.ix[:, [1, 3]])
print(df.iat[1,3])
print(df.at['two', '省份'])

省份年份总人数高考人数高数
two 上海 2018 1900 5.9 95
three 广州 2019 2170 6.0 92
年份高考人数
one 2017 6.3
two 2018 5.9
three 2019 6.0
four 2020 5.2
5.9
上海

到此这篇关于Pandas读取行列数据最全方法的文章就介绍到这了,更多相关Pandas读取行列内容请搜索本站以前的文章或继续浏览下面的相关文章希望大家以后多多支持本站！

香港服务器租用

动态拨号：关键词排名下降是啥缘故，快速提高排名怎样做

排名优化：网站排名优化方法有什么，如何做有效果

老域名：怎样才算老域名，老域名建站有什么影响

内容优化：关键字排名要做哪些方面的优化，怎样做

技巧：网站转化率究竟是什么，有什么提升的技巧

一下吧：外贸站优化有哪些基本的做法和注意事项

概要：竞价推广费用大概要多少呢，竞价推广好不好

一下吧：SEO中site是什么意思，作用和应用是怎样的

邮箱：付费邮箱有哪些优势，付费邮箱挑选要考虑什么

集群是什么意思：集群是什么意思，都有哪些优势呢

服务器配置数据库配置服务器运维服务器安全
互联网资讯服务器公司 IDC数据中心
免费服务器香港服务器租用美国服务器租用

公司动态

产品资讯

行业资讯

Pandas读取行列数据最全方法

epoll实现服务器

利用Python实现端口扫描器的全过程

实时开通

免备案

全天候客户服务

专属顾问服务