Pandas DataFrame Groupby()

Веб-разработка на Ruby Изучение

Чтобы сгруппировать данные по категориям и применить функцию к категориям, мы используем метод Pandas «groupby ()». Это также способствует эффективной агрегации данных. Функция groupby() используется для разделения данных на группы на основе определенных критериев. Объекты «панд» можно разделить по любой оси. Можно сказать, что в методе «groupby()» объект разбивается, применяется функция и их результаты объединяются. Большие данные могут быть сгруппированы с помощью метода «groupby()», и операции также могут быть вычислены над этими группами. В этом руководстве подробно объясняется метод «groupby()» и даются надлежащие рекомендации по методу «groupby()».

Пример 1

Мы также реализуем эту функцию «groupby()» в коде «pandas» в этом руководстве, чтобы вы быстрее узнали о функции «groupby()». Сначала мы импортируем «панды как pd» в инструмент «Spyder», а затем создаем здесь список с именем «данные» и вставляем в него некоторую информацию. Мы помещаем название «Команда» в качестве заголовка столбца и добавляем к нему команды «Всадники, Всадники, Дьяволы, Дьяволы, Короли, короли, Короли, Короли, Всадники, Члены королевской семьи, Члены королевской семьи, Всадники». Следующий столбец, который мы создаем здесь, — это столбец «Год», в который мы добавляем данные года как «2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2014».

Теперь это наш список, и мы меняем этот список «данных» на DataFrame. Итак, для этого мы использовали функцию «pd.DataFrame()», которая преобразует этот список в DataFrame «pandas». Созданный здесь DataFrame сохраняется в переменной «df», и мы печатаем его, помещая «df» в качестве параметра «print()». Теперь основная цель написания этого кода — реализовать метод «groupby()» для этих данных. Мы используем метод «groupby ()» и применяем его к «Году». Это сгруппирует данные на основе вставленных лет. После группировки он применяет к этой группе метод «count()». Он будет считать те же годы, а затем сохранять их в «df1». После этого у нас есть «печать», которая будет отображать это.

Чтобы получить результат, просто нажмите кнопку «Выполнить»

Чтобы получить результат, просто нажмите кнопку «Выполнить» в приложении «spyder». Сначала визуализируется кадр данных, содержащий команды и годы, а затем он группирует те же годы, подсчитывает их и отображает число счетчиков перед каждой группой годов. Поскольку он группирует год «2014» и отображает «5», это означает, что год «2014» появляется в этом DataFrame пять раз. Эта группировка выполняется, потому что мы используем метод «groupby ()» в этом DataFrame.

Сначала визуализируется кадр данных, содержащий команды и годы

Пример 2

После импорта «панд как pd» мы напрямую генерируем DataFrame с именем «Животные», и он содержит два столбца: «Животное» и «Максимальная скорость». В столбце «Животное» есть «Воробей, Сокол, Попугай, Попугай, Воробей и Сокол». Столбец «Максимальная скорость» содержит «210, 30, 37, 24, 260 и 390». Он создает DataFrame, содержащий эти столбцы, поскольку мы использовали файл «pd. DataFrame()» здесь.

Читайте также:  NumPy np.absolute()

Затем мы отображаем этот DataFrame «Животное». После этого мы применяем метод «groupby()» к DataFrame «Животные» и вставляем столбец «Животное» в качестве параметра. Это сделает группы зависимыми от одних и тех же названий животных. Затем мы также используем здесь функцию «mean ()», которая найдет среднее значение тех групп, которые здесь созданы, и мы инициализируем переменную «Group» с помощью этого метода «groupby ()», поэтому результат, который мы получаем после группировки будет храниться в нем. Мы также хотим показать результат, который хранится в «Группе», поэтому для этого мы снова используем функцию «print ()».

Затем мы отображаем этот DataFrame «Животное»

Животные и их максимальная скорость отображаются в первом кадре данных без группировки. После этого здесь применяется функция «groupby()», которая группирует всех животных с одинаковым названием и, затем находит их среднее значение и отображает их внизу.

После этого здесь применяется функция «groupby(

Пример 3

В этом коде мы создаем новый список, который является списком «Летние_курсы», и добавляем в него четыре уникальных столбца. Имена заголовков столбцов: «Тема, Sub_Fee, Days и Dis_Amount». Мы также добавляем названия предметов, плату за предмет, продолжительность курса в днях и сумму скидки на плату в этих столбцах. В поле «Тема» добавляем «Веб-разработка, WEngineering, CSS, Html, CSS, Веб-разработка, CSS, Html, а также NA». «Sub_Fee» содержит комиссию, которая составляет «22000, 25000, 23000, 24000, 25000, 26000, 25000, 25000, 22000 и 15000». Здесь мы вводим дни «30, 50, 55, 40, 60, 35, 30, 50 и 40», а также столбец «Dis_Amount» содержит «1000, 2300, 1000, 1200, 2500, None, 1400, 1600 и 0».

Теперь мы должны изменить этот список на DataFrame. Итак, чтобы преобразовать список в DataFrame, мы используем функцию «pd.DataFrame()» и называем DataFrame «Summer_Course_df». Здесь мы также визуализируем «Summer_Course_df». Переменная «Летний_Курс1» инициализируется по методике «groupby()», чтобы в ней сохранялись результаты группировки. Затем к столбцу «Тема» применяется метод «groupby()».

В результате будут созданы группы на основе похожих названий субъектов. Затем функция «сумма ()» используется для вычисления суммы только что сформированных групп субъектов. Эта «сумма ()» вычисляет сумму сборов, дней и сумм скидок для одних и тех же предметов. Мы также хотим отобразить результат, который был сохранен в «Summer_Course1», поэтому мы еще раз воспользуемся функцией «print ()».

В результате будут созданы группы на основе похожих названий субъектов

Здесь вы можете заметить, что он отображает все объекты отдельно в первом кадре данных. Затем он объединяет одни и те же предметы или создает группы с одинаковыми именами предметов, а также один раз отображает предмет с одним и тем же именем. Он применяет функцию суммы к столбцам sub_Fee, Days и Dis_Amount для тех же имен субъектов и отображает их суммы здесь.

Он применяет функцию суммы к столбцам sub

Пример 4

В этом коде мы используем DataFrame из предыдущего примера, но здесь мы выполняем функцию «groupby()» для нескольких столбцов. Мы передаем в функцию «groupby()» два названия столбцов: «Тема» и «Дни». Затем поместите «сумму ()», которая будет выполнять суммирование групп, которые здесь созданы, и сохраните их в переменной «Summer_Courses2». После этого мы рендерим «Summer_Courses2» в конце.

В этом коде мы используем DataFrame из предыдущего примера

Этот результат показывает, что он выполняет функцию «groupby ()» как в столбцах «тема», так и в столбцах «Дни» и отображает результат здесь после группировки.

Этот результат показывает, что он выполняет функцию «groupby

Заключение

Вы можете использовать это руководство, чтобы узнать, как использовать функцию «groupby ()» в «пандах», а также узнать о синтаксисе этого метода «groupby ()» здесь. Наша главная цель — дать вам краткое и понятное объяснение идеи метода «groupby()» в «пандах». Мы объяснили, что этот метод помогает нам формировать группы в зависимости от определенных критериев. В этом руководстве мы сделали четыре примера, в которых мы создаем группы, используя метод «groupby ()» в «пандах». После прочтения этого руководства у вас будет скромный уровень знаний, от которого вы сможете перейти к более высокому уровню.

Оцените статью
bestprogrammer.ru
Добавить комментарий