Скользящая средняя в Pandas

«Pandas», являющаяся библиотекой «Python», предоставляет множество встроенных функций, которые помогают нам легко выполнять различные задачи, используя эти функции. Он дает различные методы, которые мы использовали для расчета скользящих средних. Он используется для анализа информации о временных рядах путем создания средних значений отдельных подмножеств всего набора данных. Мы также можем использовать название скользящей средней вместо скользящей средней. С информацией о временных рядах скользящее среднее обычно используется для захвата краткосрочных изменений, концентрируясь на более длительных тенденциях. Мы обсудим все его методы в этом руководстве и объясним, как это работает в «пандах».

Содержание

Методы скользящей средней
Пример 1
Пример 2
Пример 3
Пример 4
Заключение

Методы скользящей средней

«Панды» помогают нам с тремя различными методами этого метода «скользящего среднего панд». Мы также подробно обсудим все три метода в этом руководстве. Эти методы:

Простая скользящая средняя.
Экспоненциальная скользящая средняя.
Кумулятивная скользящая средняя.

Давайте перейдем к практической демонстрации всех этих методов в коде «панд» здесь.

Пример 1

Поскольку мы используем инструмент «Spyder» для практического использования этих методов в «пандах». Для применения метода «скользящего среднего» мы должны создать DataFrame в «пандах». Для этого мы сначала генерируем здесь словарь, который называется «Group_data», и вставляем «Group_leader», в который вводятся «Олив, Роуэн, Джулиан, Говард, Нова, Джульетта, Элла и Ава». Затем у нас есть «Надзиратель», в котором есть «Амина, Ашер, Феликс, Уильям, Бромли, Нора, Коллинз и Фрейя». Затем мы помещаем «Презентацию», которая содержит отметки презентации: «15, 18, 16, 10, 19, 11, 15 и 14». У нас также есть «Задания», в которые мы добавили оценки заданий, и эти оценки «29, 26, 25, 27, 28, 28, 25 и 26».

После отметок о назначении мы добавили внутренние отметки в «Внутренние»: «5, 6, 9, 8, 5, 7, 2 и 6». Затем мы должны преобразовать этот словарь «Group_data» в DataFrame «Group_df». Для этого мы использовали метод «панды», который помогает нам преобразовать словарь в DataFrame. Этот метод здесь «pd.DataFrame()», и мы вводим в него имя словаря в качестве параметра. После этого мы печатаем «Group_df», используя метод «print()».

Мы запускаем этот код в инструменте «Spyder», нажав «Shift+Enter». После выполнения вышеуказанного кода DataFrame отображается на терминале. Теперь мы продолжим и применим метод скользящего среднего к столбцам этого DataFrame.

Здесь мы используем «Простую скользящую среднюю», и мы применили эту простую скользящую среднюю к двум столбцам DataFrame. Сохраняем значения в переменной «Group_df1», которую получаем после применения скользящего среднего по двум столбцам. Эти два столбца добавляются после помещения имени DataFrame в две квадратные скобки. Эти две колонки здесь «Презентация и задания». Затем мы размещаем скользящее окно, которое здесь равно «2», а затем используем метод «mean ()». Это скользящее окно используется для получения средних значений по заранее определенному количеству временных интервалов. После этого «Group_df1» добавляется в метод «print()» для печати на терминале.

Значения, которые мы получаем после применения метода скользящего или скользящего среднего к столбцам «Презентация» и «Назначения», отображаются ниже. Отображаемые здесь значения являются скользящими средними значениями обоих столбцов.

Пример 2

Мы снова используем «Group_df», и на этот раз мы применяем «Экспоненциальное скользящее среднее». Когда мы хотим применить экспоненциальное скользящее среднее, мы используем метод «ewm()». В этом методе «ewm()» мы должны передать значение «span». Мы применяем этот метод к столбцу «Интервалы» и сохраняем новые значения в столбце «EWM_30», который также добавляется в этот кадр данных «Group_df» после применения метода «ewm()». Значение «span», которое мы установили здесь, равно «30», а также мы поместили метод «mean()» с этим методом «ewm()».

Здесь отображается DataFrame до применения метода «ewm()» и после применения метода «ewm()». Столбец «EWM_30» добавлен в кадр данных ниже, который создается здесь для хранения значений скользящего среднего значения столбца «Интервалы» после применения к этому столбцу метода «ewm()».

Пример 3

Здесь импортируются библиотеки «pandas» и «numpy», потому что мы должны использовать методы обеих библиотек в «pandas». Созданный здесь DataFrame содержит четыре столбца. Первый столбец «ColA» содержит «0, 1, 2, 3, 4, np.nan, 7, np.nan и 9». Здесь находится «ColB», в который мы добавили «7, 8, 9, 10, 4, 17, 14, 12 и 22». Затем у нас есть «ColC», в который мы помещаем «10, 21, 12, np.nan, 14, 15, 17, 11 и 33». Теперь добавлен «ColD», в который мы вставили «20, 31, 2, 14, 11, np.nan, 24, 10 и np.nan».

Затем мы используем «print (df)», который напечатает этот DataFrame. Мы применим скользящее среднее, но сначала отобразим здесь этот DataFrame.

DataFrame перед применением любого метода скользящего среднего показан ниже. Вы можете легко заметить, что здесь отображаются все столбцы. Теперь мы применим скользящее среднее ко всем этим столбцам и отобразим результат.

Здесь мы применяем простое скользящее или скользящее среднее, и мы знаем, что в этом методе скользящего окна необходимо передать значение скользящего окна. Итак, мы передаем здесь «2», а затем применяем метод «sum()» с этим методом скользящего среднего. Мы сохранили значения, которые мы получили после применения метода «rolling()» к столбцам; значения «ColA» хранятся в «Sum A», значения «ColB» в «Sum B» и значения «ColC» в «Sum C», а также значения «ColD» в переменной «Sum D».

Мы также применили здесь метод «fillna ()» и передали «0» в качестве параметра, который изменит все нулевые значения, которые мы получаем после применения метода прокрутки, на «0» и сохраним новый DataFrame в «df2» и также отображает «df2». Давайте запустим этот код и увидим результат после применения этих скользящих средних ко всем столбцам отдельно.

Вот результат этого кода, в котором отображаются значения, которые мы получаем после использования метода «rolling ()» для всех столбцов и отображения значений скользящего среднего в новом столбце. После этого он заменяет все нулевые значения на «0», а также отображает новый кадр данных ниже, который содержит «0» вместо «NaN», которые являются нулевыми значениями.

Пример 4

Мы также можем рассчитать скользящие средние CSV-файла после чтения данных в файл. Здесь мы читаем файл «Courses.csv», помещая метод «pd.read_csv()», а затем сохраняя данные как DataFrame в «Courses_df». Здесь мы применяем метод «кумулятивной скользящей средней». В этом методе нам не нужно добавлять фиксированный размер окна, потому что размер окна меняется со временем. Чтобы использовать это, мы должны поместить метод «expanding()», а после этого мы поместим «mean()». Мы применили этот метод к столбцу «Скидка», который присутствует в CSV-файле, и сохранили результат в столбце «Среднее_CMA».

DataFrame, который мы получили после чтения файла «Courses.csv», отображается первым. Затем здесь применяется метод кумулятивного скользящего среднего, и результат, который мы получаем после применения этого метода, также отображается ниже в столбце «Average_CMA».

Заключение

Концепция «скользящего среднего» для «панд» подробно обсуждается в этом руководстве. Мы обсудили три разных метода, которые мы использовали в «пандах» для расчета «скользящих средних». Мы применили все три метода по отдельности в наших примерах и объяснили, как эти методы работают и как использовать эти методы в «пандах». Мы применили эти методы к столбцам после создания DataFrame здесь, и мы также применили этот метод к данным CSV-файла после чтения CSV-файла. Мы подробно объяснили все методы здесь.