Как извлечь год из даты и времени в Pandas?

Pandas Cumsum () Программирование и разработка

«Pandas» — это мощный пакет Python, который используется для обеспечения высокой эффективности и скорости вычислений. Столбец даты и времени в «Pandas» предоставляет обширный источник данных временных рядов, которые могут быть полезны. Например, вы можете просматривать данные за год или за месяц. Изучение того, как быстро извлекать такую ​​информацию, может быть очень полезным при работе с фреймами данных, которые содержат столбцы даты и времени. В этой статье мы рассмотрим, как использовать pandas для извлечения данных года из столбца даты и времени фрейма данных.

Pandas извлекают год из даты и времени

Столбцы даты и времени «Pandas» содержат такие атрибуты, как год, месяц, день и т. д. Чтобы получить год из столбца даты и времени фрейма данных, просто обратитесь к его атрибуту «год». «Pandas» имеет множество простых методов для извлечения компонентов из объекта datetime, два из которых мы реализуем в этом руководстве. Синтаксис этих методов приведен ниже:

Pd.DatetimeIndex().год

Pd.DatetimeIndex()

df.dt.год

df.dt.год

Теперь мы увидим практическую реализацию этих методов Python.

Пример 1: Использование метода «Pd.DatetimeIndex().year» для извлечения лет из столбца Datetime в Dataframe

На этом рисунке мы будем использовать первый упомянутый выше метод «Pd.DatetimeIndex().year», чтобы извлечь годы из фрейма данных.

Для практической реализации этого метода в программе Python мы использовали инструмент «Spyder». Мы начали писать скрипт в файле python. Первое и основное здесь — активировать инструментарий Pandas. Python получает указание загрузить библиотеку Pandas в нашу текущую рабочую среду с помощью раздела кода import pandas. Раздел кода «pd» указывает Python назначить Pandas псевдоним «pd». Вот как мы можем получить доступ ко всем функциям Pandas. Затем мы создали фрейм данных.

Фрейм данных генерируется с использованием метода pandas «pd.DataFrame ()». Мы вызвали этот метод и инициализировали его четырьмя столбцами: «Название», «Лекции», «Оценка» и «Дата_начала». В первом столбце «Название» хранятся названия разных языков программирования. Это «C++», «Python», «Java» и «R». Второй столбец, который мы создали во фрейме данных, называется «Лекции» и содержит количество лекций для каждого курса: «30», «26», «35» и «20». В столбце «Уровень» указан уровень, на котором предлагаются эти курсы, т. е. «12», «10», «14» и «16». Последний столбец — это основные данные этого фрейма данных, поскольку в нем хранятся значения даты и времени, на которых основано это руководство. В этом столбце есть значения «02-02-2022», «01-09-2023», «29-07-2024» и «24-11-2025» в качестве дат начала каждого курса.

Длина столбца, который мы взяли для каждого столбца, равна четырем. Нам нужен объект фрейма данных для хранения содержимого фрейма данных. Итак, мы создали объект фрейма данных «извлечение» и присвоили ему результат, который можно было бы получить, вызвав метод «pd.DataFrame()». Здесь вызывается наиболее часто используемый метод Python для отображения вывода, «print()», чтобы отобразить содержимое объекта фрейма данных «extract».

Длина столбца, который мы взяли для каждого столбца

Когда мы выполняем упомянутую выше программу, мы получаем кадр данных, отображаемый на консоли, который имеет четыре столбца. Здесь вы можете видеть, что столбец «Start_date» хранит значения даты и времени.

Когда мы выполняем упомянутую выше программу, мы

Теперь нам нужно сделать шаг вперед, чтобы приступить к нашей основной задаче, для которой мы создали фрейм данных. Мы извлечем год из столбца даты и времени нашего фрейма данных, используя параметр «pd. DatetimeIndex().year» здесь.

Мы вызвали метод «Pd.DatetimeIndex().year» сразу после создания и печати фрейма данных. «.year» указывает, что мы используем этот метод для извлечения года из определенного столбца даты и времени. У него могут быть и другие атрибуты, например, «.month» для извлечения месяцев, «.week» для получения недель, «.day» для получения дней и многие другие. Мы вызвали функцию и в скобках указали имя фрейма данных с именем столбца, к которому применяется функция для извлечения из него лет.

Имя фрейма данных «extract» поставляется со столбцом «Start_date», имеющим значения даты и времени. Когда эта функция вызывается, она попадает во фрейм данных «extract» и из столбца «Start_date» извлекает годы. Теперь, чтобы сохранить эти годы, мы создали новый столбец «год» в нашем фрейме данных «извлечение». Таким образом, годы, извлеченные из вызова «Pd.DatetimeIndex().year», будут храниться в столбце «year». Затем мы использовали метод «print()» для отображения обновленного фрейма данных.

Имя фрейма данных «extract» поставляется со столбцом

Здесь у нас есть результирующий фрейм данных. Мы видим, что в этом кадре данных есть новый столбец «год», в котором явно указаны годы, извлеченные из столбца «Начальная дата», соответствующего каждому содержащемуся в нем значению.

Мы видим, что в этом кадре данных есть новый столбец

Пример 2: Использование метода «df.dt.year» для извлечения лет из столбца даты и времени фрейма данных

Эта демонстрация объяснит, как извлечь год из столбца datetime, используя метод Pandas «df.dt.year». Давайте посмотрим, как это работает.

Мы просто открыли инструмент «Spyder» и начали писать код. Мы загрузили библиотеку Pandas, потому что метод, который мы хотим использовать здесь, является функцией Pandas, и мы можем использовать его, только если эта библиотека загружена в наш текущий файл Python. Затем мы создали фрейм данных с помощью метода «pd.DataFrame()». Мы вызвали функцию и создали в ней три столбца: «Имя», «дата_рождения» и «Возраст». В столбце «Имя» хранятся имена некоторых людей: «Паркер», «Джек», «Лео» и «Рабекка». «Дата рождения» хранит даты рождения этих людей как «02-02-1989», «01-09-1996», «29-07-1981» и «24-11-2001».

В столбце «Возраст» указан их текущий возраст: «32», «26», «40» и «21» соответственно. Мы создали объект фрейма данных «biodata» для хранения выходных данных функции «pd.DataFrame()». Затем вызывается метод «print()» для отображения результирующего фрейма данных, хранящегося в объекте «биоданные».

В столбце «Возраст» указан их текущий возраст

Когда мы запускаем этот фрагмент кода, мы получаем фрейм данных с тремя предоставленными столбцами, которые можно увидеть на снимке, прикрепленном ниже.

Когда мы запускаем этот фрагмент кода, мы получаем фрейм

Теперь мы будем использовать этот фрейм данных для извлечения года из его столбца даты и времени с помощью метода «df.dt.year». Здесь столбец «дата_рождения» содержит даты с годом, поэтому нам нужно применить функцию к этому конкретному столбцу, чтобы извлечь год. Чтобы использовать этот столбец, мы должны сначала преобразовать его в формат даты и времени. Потому что функция, которую мы здесь используем, содержит атрибут «dt», который предназначен для даты и времени. Таким образом, он будет выполняться только в том случае, если указанный столбец будет преобразован в дату и время. Для этого мы использовали метод pandas «to_datetime ()» и предоставили имя фрейма данных с именем столбца в скобках.

Теперь тип данных столбца «дата_рождения» был изменен на дату и время. Затем мы вызвали функцию «df.dt.year». Мы упомянули имя фрейма данных с именем столбца и расширением «.dt.year». Чтобы сохранить этот извлеченный год значения во фрейме данных, мы создали новый столбец «Год» в «биоданных». Наконец, мы отобразили фрейм данных с помощью функции «print ()».

Теперь тип данных столбца «дата_рождения»

Это дает следующий результат.

Теперь мы будем использовать этот фрейм данных для извлечения

Заключение

Извлечение года из столбца datetime из фрейма данных Pandas — полезное упражнение. Панды учат нас некоторым очень полезным и практичным методам достижения желаемого результата. В этом руководстве мы познакомили вас с двумя методами Pandas для извлечения года из столбца даты и времени во фрейме данных. Мы подробно рассмотрели каждую деталь в практической реализации кодов примеров. Мы описали и объяснили все, что использовали, на примерах, чтобы у вас не возникло никаких трудностей при использовании этих методов для изучения панд.

Читайте также:  Как использовать вычисляемые поля Pydantic?
Оцените статью
bestprogrammer.ru
Добавить комментарий