Функция cumsum() в Pandas позволяет вычислить совокупную сумму по заданной оси.
Накопленная сумма относится к общей сумме данного набора данных в данный момент времени. Это означает, что общая сумма продолжает меняться по мере добавления или удаления новых данных.
Давайте обсудим, как использовать функцию cumsum() в Pandas.
Синтаксис функции
Синтаксис функции показан ниже:
DataFrame.cumsum(axis=None, skipna=True, *args, **kwargs)
Параметры функции
Функция принимает следующие параметры:
- axis— по какой оси выполняется накопительное сложение. По умолчанию ноль или столбцы.
- skipna— разрешает или запрещает нулевые строки или столбцы.
- **kwargs— Дополнительные аргументы ключевого слова.
Возвращаемое значение функции
Функция возвращает кумулятивную сумму DataFrame по указанной оси.
Пример
В приведенном ниже примере показано, как использовать функцию cumsum() в Pandas DataFrame.
Предположим, у нас есть образец DataFrame, как показано:
# import pandas
import pandas as pd
df = pd.DataFrame({
«student_1»: [80, 67, 55, 89, 93],
«student__2»: [76, 77, 50, 88, 76],
«student_3»: [88, 67, 80, 90, 92],
«student_4»: [70, 64, 70, 45, 60],
«student_5»: [98, 94, 92, 90, 92]},
index=[0,1,2,3,4])
df
Чтобы выполнить кумулятивную сумму по столбцам, мы можем сделать следующее:
df.cumsum(axis=0)
Приведенный выше код должен вернуть:
Обратите внимание, что значения в каждом столбце включают сумму предыдущих значений.
Чтобы работать со строками, вы можете установить ось как одну. Пример показан ниже:
Заключение
В этой статье обсуждалось, как выполнить кумулятивную сумму по определенной оси в Pandas DataFrame с помощью функции cumsum().