Pandas Interpolate

» Интерполяция » — это подход или метод, который оценивает неуказанные точки данных между двумя известными. Этот метод используется для заполнения нулевых или нулевых значений DataFrames или Series в Python. Метод «DataFrame.interpolate()» с несколькими параметрами используется для выполнения интерполяции данных DataFrame или серий.

Содержание

Что такое метод DataFrame.interpolate() в Python?
Пример 1. Использование метода DataFrame.interpolate() для заполнения пропущенного значения
Пример 2. Использование метода DataFrame.interpolate() для заполнения отсутствующего значения в обратном направлении
Пример 3. Использование метода DataFrame.interpolate() для заполнения максимального количества пропущенных значений
Пример 4. Использование метода DataFrame.interpolate() для заполнения отсутствующего значения путем указания области для интерполяции
Заключение

Что такое метод DataFrame.interpolate() в Python?

В Python метод DataFrame.interpolate() используется для заполнения отсутствующих значений или значений Nan в Series или DataFrame. Этот метод заменил значения Null или Nan на основе указанных методов.Загрузка рекламы

Синтаксис

DataFrame.interpolate(method=‘linear’, *, limit_direction=None, limit_area=None,axis=0, limit=None, inplace=False, downcast=_NoDefault.no_default, **kwargs)

Параметры

В приведенном выше синтаксисе:

Параметр » метод » указывает метод интерполяции, который будет использоваться при заполнении отсутствующего значения. Некоторые из значений включают «линейный», «площадочный», «нулевой», «кубический», «полиномиальный» и другие. Здесь каждое значение имеет различное значение и влияет на то, как заполняются значения Nan.
Параметр » axis» — это ось, по которой будет выполняться интерполяция. Это может быть 0 для индекса и 1 для столбцов.
Параметр » limit» указывает наибольшее количество последовательных Nans для заполнения.
Параметр » inplace» имеет значение «True» или «False», которое указывает, следует ли обновлять данные на месте, если это возможно.
Параметр » limit_direction» — это направление заполнения последовательных Nans, если указан предел.
Параметр » limit_area» — это область, в которой заполняются последовательные Nans, если указан предел.
Наконец, параметр » downcast» — это необязательный аргумент, который указывает, следует ли понижать типы dtypes, если это возможно.

Читайте также: Особенности Java

Для дальнейшего понимания вы можете просмотреть эту официальную документацию.

Возвращаемое значение

Метод «DataFrame.interpolate()» извлекает DataFrame или Series или None из тех же фигур, интерполированных в NaN.

Пример 1. Использование метода DataFrame.interpolate() для заполнения пропущенного значения

В приведенном ниже коде мы сначала импортировали и создали DataFrame со значениями None в столбцах. Затем метод «df.interpolate()» используется для заполнения значений Nan числом между предыдущей и следующей строкой, игнорируя индекс. Строка, не содержащая значения в первой строке, не может быть заполнена, поскольку направление значения заполнения прямое и предыдущего значения нет.

import pandas
df = pandas.DataFrame({‘Team’: [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’],
‘Score_1’: [12, 32, None ,None, 45, None],
‘Score_2’: [None, 23, 33, None, 45, 55],
‘Score_3’: [23, 32, 31, None, None, None]})
print(df, ‘\n‘)
df1 = df.interpolate(method=‘linear’)
print(df1)

Интерполяция DataFrame на основе линейного метода по умолчанию показана ниже:

Пример 2. Использование метода DataFrame.interpolate() для заполнения отсутствующего значения в обратном направлении

Мы также можем найти интерполяцию в обратном направлении, как и в предыдущем примере для прямого направления. Параметр » limit_direction= » со значением » назад » передается в метод «DataFrame.interpolate()». В ограничении обратного направления недостающее значение в конечной строке не может быть заполнено, поскольку после той, из которой значение может быть интерполировано, нет строки:

import pandas
df = pandas.DataFrame({‘Team’: [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’],
‘Score_1’: [12, 32, None ,None, 45, None],
‘Score_2’: [None, 23, 33, None, 45, 55],
‘Score_3’: [23, 32, 31, None, None, None]})
print(df, ‘\n‘)
df1 = df.interpolate(method=‘linear’,limit_direction =‘backward’)
print(df1)

Обратная интерполяция Pandas в DataFrame, показанная ниже:

Пример 3. Использование метода DataFrame.interpolate() для заполнения максимального количества пропущенных значений

Мы также можем указать максимальное количество последовательных пропущенных значений для интерполяции. Если это значение не установлено, то по умолчанию все последовательные значения Nan будут интерполированы. Здесь, в этом коде, метод «df.interpolate()» принимает параметр «limit=1» в качестве аргумента и заполняет только одно последовательное пропущенное значение для каждого столбца DataFrame:

import pandas
df = pandas.DataFrame({‘Team’: [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’],
‘Score_1’: [12, 32, None ,None, 45, None],
‘Score_2’: [None, 23, 33, None, 45, 55],
‘Score_3’: [23, 32, 31, None, None, None]})
print(df, ‘\n‘)
df1 = df.interpolate(method=‘linear’,limit_direction =‘backward’)
print(df1)

Выход

Пример 4. Использование метода DataFrame.interpolate() для заполнения отсутствующего значения путем указания области для интерполяции

В этом коде мы указываем область интерполяции с помощью параметра » limit_area= «. Метод DataFrame.interpolate() принимает значение параметра limit_area „внутри“, чтобы заполнить только недостающие значения, окруженные существующими значениями в том же столбце. » limit_area=outside » передается методу для заполнения только отсутствующих значений, которые не окружены существующими значениями в том же столбце:

import pandas
df = pandas.DataFrame({‘Team’: [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’],
‘Score_1’: [12, 32, None ,None, 45, None],
‘Score_2’: [None, 23, 33, None, 45, 55],
‘Score_3’: [23, 32, 31, None, None, None]})
print(df, ‘\n‘)
df1 = df.interpolate(limit_area=‘inside’)
print(df1, ‘\n‘)
df2 = df.interpolate(limit_area=‘outside’)
print(df2)

Выполнение приведенного выше кода получит следующий вывод:

Заключение

Метод DataFrame.interpolate() используется в Python для заполнения недостающего значения DataFrame/Series или значений Nan на основе указанного метода. Мы можем использовать этот метод для заполнения недостающего значения в прямом или обратном направлении, используя параметр «limit_direction». Мы также можем ограничить максимальное количество прямых значений Nan, которые должны быть заполнены во время интерполяции, используя параметр «limit». В этой статье представлено подробное руководство по интерполяции Panda на многочисленных примерах.