1、什么是Series?
Pandas Series就像表格中的一列。
它是一维数组,可保存任何类型的数据。
例如:
从列表中创建一个简单的Pandas Series:
import pandas as pda = [1, 7, 2]myvar = pd.Series(a)print(myvar)
2、标签(Labels)
如果未指定其他任何内容,则这些值将用其索引号标记。 第一个值的索引为0,第二个值的索引为1,依此类推。
该标签可用于访问指定值。
例如:
返回Series的第一个值:
print(myvar[0])
3、创建
标签(Labels)
使用index
参数,可以命名自己的标签。
例如:
创建自己的标签:
import pandas as pda = [1, 7, 2]myvar = pd.Series(a, index = ["x", "y", "z"])print(myvar)
创建标签后,可以通过参考标签来访问项目。
例如:
返回值“y”:
print(myvar["y"])
4、Key/Value Objects as Series
创建Series时,还可以使用键/值对象,例如,字典。
例如:
从字典创建一个简单的Pandas Series:
import pandas as pdcalories = {"day1": 420, "day2": 380, "day3": 390}myvar = pd.Series(calories)print(myvar)
注意:字典的键将成为标签。
要仅选择词典中的某些项目,请使用index
参数,并仅指定要包括在Series中的项目。
例如:
仅使用“day1”和“day2”中的数据创建Series:
import pandas as pdcalories = {"day1": 420, "day2": 380, "day3": 390}myvar = pd.Series(calories, index = ["day1", "day2"])print(myvar)
5、DataFrames
Pandas中的数据集通常是多维表,称为DataFrames。
Series就像一列,DataFrame是整个表。
例如:
从两个Series创建一个DataFrame:
import pandas as pddata = {"calories": [420, 380, 390],"duration": [50, 40, 45]}myvar = pd.DataFrame(data)print(myvar)
将在下一个文档中学习有关DataFrames的知识。