原标题:Pandas:DataFrame数据选择方法(索引)
原文来自:博客园 原文链接:https://www.cnblogs.com/geeksongs/p/11072433.html
#首先创建我们的Series对象,然后合并到dataframe对象里面去
import pandas as pd
import numpy as np
area=pd.Series({'ChongQing':188888,'BeiJing':92387928,'Shanghai':8374583746,'Sydney':82734})
population=pd.Series({'ChongQing':1000,'BeiJing':2000,'Shanghai':2900,'Sydney':3000})
data=pd.DataFrame({'area':area,'population':population})#备注:创建字典的结构时一定要遵循字典的数据结构
#也就是创建完字典之后一定要在字典的前后写上花括号,这个是一个很重要的习惯
print(data)
输出结果:
area population
ChongQing 188888 1000
BeiJing 92387928 2000
Shanghai 8374583746 2900
Sydney 82734 3000
输入代码增加我们colums上的对象:
data['area']
输出:
ChongQing 188888
BeiJing 92387928
Shanghai 8374583746
Sydney 82734
Name: area, dtype: int64
输入:
#利用属性的形式来列出一个columns的数据,上面是使用了索引的形式,这种形式并不太常用
data.area
输出:
ChongQing 188888
BeiJing 92387928
Shanghai 8374583746
Sydney 82734
Name: area, dtype: int64
输入:
data.values#其实dataframe是一个十分显然的二维数组,我们可以用这个公式来验证它
输出:
array([[1.88888000e+05, 1.00000000e+03, 1.88888000e+02],
[9.23879280e+07, 2.00000000e+03, 4.61939640e+04],
[8.37458375e+09, 2.90000000e+03, 2.88778750e+06],
[8.27340000e+04, 3.00000000e+03, 2.75780000e+01]])
免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。
合作及投稿邮箱:E-mail:editor@tusaishared.com