class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
具有标记轴(行和列)的二维大小可变、可能异构的表格数据结构。算术运算在行和列标签上对齐。可以将其看作是系列对象的类似于dict的容器。主要的panda数据结构。
参数: | data : Dict可以包含序列、数组、常量或类似列表的对象 在版本0.23.0中进行了更改:如果数据是dict, 则Python 3.6及更高版本将维护参数顺序 index :指数或类数组 用于生成frame的索引。如果输入数据中没有索引信息, 也没有提供索引,那么默认值为 columns : 指数或类数组 用于生成frame的列标签。如果没有提供列标签, 默认值为 dtype : 要强制执行的数据类型。只允许一个 如果 copy : 从输入复制数据。只影响 |
例子,
从dictionary构造DataFrame
>>> d = {'col1': [1, 2], 'col2': [3, 4]}>>> df = pd.DataFrame(data=d)>>> df col1 col20 1 31 2 4
推断的dtype是int64
>>> df.dtypescol1 int64col2 int64dtype: object
强制执行单个dtype
>>> df = pd.DataFrame(data=d, dtype=np.int8)>>> df.dtypescol1 int8col2 int8dtype: object
从numpy ndarray构造DataFrame
>>> df2 = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),... columns=['a', 'b', 'c'])>>> df2 a b c0 1 2 31 4 5 62 7 8 9
官方文档:http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html#pandas.DataFrame