Python numpy.nanquantile函数方法的使用

NumPy（Numerical Python的缩写）是一个开源的Python科学计算库。使用NumPy，就可以很自然地使用数组和矩阵。NumPy包含很多实用的数学函数，涵盖线性代数运算、傅里叶变换和随机数生成等功能。本文主要介绍一下NumPy中nanquantile方法的使用。

numpy.nanquantile

numpy.nanquantile(a, q, axis=None, out=None, overwrite_input=False, interpolation='linear', keepdims=) [source]

沿指定轴计算数据的第q个分位数，而忽略nan值。返回数组元素的第q个分位数。

1.15.0版中的新功能。

参数：

a ：array_like

输入数组或可以转换为数组的对象，其中包含要忽略的nan值

q ：array_like of float

要计算的分位数或分位数序列，必须在0到1之间（含0和1）。

axis ：{int, tuple of int, None}, 可选

用于计算分位数的一个或多个轴。

默认值是沿数组的展平版本计算分位数。

out ：ndarray, 可选

用于放置结果的可选输出数组。

它的形状和缓冲区长度必须与预期的输出相同

，但是（必要时）将强制转换（输出的）类型。

overwrite_input ：bool, 可选

如果为True，则允许通过中间计算来修改输入数组a，

以节省内存。在这种情况下，

此功能完成后输入a的内容是不确定的。

interpolation ：

{‘linear’, ‘lower’, ‘higher’, ‘midpoint’, ‘nearest’}

这个可选参数指定了当需要的分位数位于两个数据点

i < j之间时使用的插值方法:

1）linear: i + (j - i) * fraction,

fraction 是由i和j包围的索引的分数部分。

2）lower: i。

3）higher: j。

4）nearest: i或j，以最接近的为准。

5）midpoint: (i + j) / 2。

keepdims ：bool, 可选

如果将其设置为True，

那么被缩减的轴将在结果中保留尺寸为1的维度。

使用此选项，结果将针对原始数组a正确传递。

如果这不是默认值，

它将通过（在空数组的特殊情况下）

传递到基础数组的mean函数。

如果数组是子类，并且mean没有kwarg keepdims，

则将引发RuntimeError。

返回值：

quantile ：scalar 或 ndarray

如果q是单个百分位数，而axis = None，

则结果是标量。如果给出了多个分位数，

则结果的第一轴对应于分位数。其他轴是a减小后剩余的轴。

如果输入包含小于float64的整数或浮点数，

则输出数据类型为float64。

否则，输出数据类型与输入的数据类型相同。

如果指定了out，则返回该数组。

例子

>>> a = np.array([[10., 7., 4.], [3., 2., 1.]])>>> a[0][1] = np.nan>>> aarray([[10.,  nan,   4.],      [ 3.,   2.,   1.]])>>> np.quantile(a, 0.5)nan>>> np.nanquantile(a, 0.5)3.0>>> np.nanquantile(a, 0.5, axis=0)array([6.5, 2. , 2.5])>>> np.nanquantile(a, 0.5, axis=1, keepdims=True)array([[7.],       [2.]])>>> m = np.nanquantile(a, 0.5, axis=0)>>> out = np.zeros_like(m)>>> np.nanquantile(a, 0.5, axis=0, out=out)array([6.5, 2. , 2.5])>>> marray([6.5,  2. ,  2.5])>>> b = a.copy()>>> np.nanquantile(b, 0.5, axis=1, overwrite_input=True)array([7., 2.])>>> assert not np.all(a==b)