Карта Pandas DataFrame

Pandas Cumsum () Программирование и разработка

Удивительно быстрый и эффективный метод управления и изучения данных предлагает библиотека Pandas. Pandas может эффективно комбинировать разные наборы данных, так что мы даже не сталкиваемся с какими-либо проблемами при оценке данных. Pandas предоставляет серию, словарь и кадры данных. Столбцы DataFrame также называются сериями. Мы используем метод «map ()», чтобы обновить столбец и назначить его обратно в DataFrame. Метод «map ()» используется для сопоставления значений серии с соответствующими входными данными. Мы также можем отобразить две серии одинаковой длины. Мы не применяем этот метод «map()» для сопоставления двух DataFrames. В этом руководстве рассматривается метод «map()», чтобы вы узнали, как этот метод «map()» работает в Pandas.

Синтаксис:

Series.map(arg, na_action=None)

Пример 1

Мы практически используем метод «map()» в нашем коде Pandas. Мы импортируем метод, который предоставляет Pandas, с помощью ключевого слова «import» и устанавливаем «pandas as pd». Это помогает нам в нашем коде, где мы должны получить доступ к методам Pandas. Для этого мы ставим только «pd». Теперь этот список или серия, которая создается здесь, называется «score_data». Мы вставляем «first_name», которое включает «Эмма, Роберт, Леонард, Ховард и Джессика». Затем у нас есть «last_name», который содержит «Эдвард, Сэмюэл, Херри, Уильям и Фаулер». Добавляем «42, 36, 46, 45 и 39» в список «возраст».

После этого у нас есть «Score_1 и Score_2», куда мы добавляем «9, 8, 6, 7, 5» и «28, 45, 59, 62, 70» соответственно. Мы меняем эти «score_data» на «score_df» и упоминаем «first_name, last_name, age, Score_1 и Score_2» в качестве столбцов. Таким образом, он устанавливается в качестве заголовка DataFrame. Мы печатаем «score_df» на терминале. После этого мы делаем словарь «Темы» и вставляем имена субъектов, упоминая first_name с именем субъекта. В словарь мы добавляем «Компьютер, химия, математика, астронавт и наука», упоминая вместе с этим «имя». Теперь мы сопоставляем этот словарь с ранее упомянутым «score_df».

Мы создаем новый столбец с именем «Темы». Мы упоминаем столбец «first_name» и используем метод «map ()», чтобы сопоставить предметы с этим «score_df». После сопоставления столбца темы с «score_df» мы отображаем «score_df». Это отображается только тогда, когда мы используем метод «print ()».

Мы создаем новый столбец с именем «Темы»

Теперь мы компилируем и выполняем этот код Pandas в «Spyder». Есть два способа выполнить этот код. Один из них — нажать клавиши «Shift + Enter», а другой — выполнить код, нажав кнопку «Выполнить» в приложении «Spyder». После выполнения мы получаем заданный вывод. Первый DataFrame содержит пять столбцов. Мы сопоставляем столбец с этим «score_df» с помощью метода «map()», который также показан на следующем рисунке:

Читайте также:  Что такое вектор в C++?

Теперь мы компилируем и выполняем этот код Pandas в «Spyder»

Пример 2

Теперь мы начинаем новый пример, импортируя «панды как pd» и создавая вложенный список с именем «AC_list». Этот вложенный список состоит из трех столбцов с именами «AC_Name, AC_Num, Joining». «AC_Name» имеет имена «Джеймс, Мелисса, Фарнхем, Сэмюэл, Бромли, Когхилл и Фуллер». «AC_Num» содержит номера учетной записи «AC4319, AC1234, AC3498, AC4525, AC4439, AC2624 и AC1501». При присоединении мы добавляем месяц присоединения: «июнь, апрель, май, август, февраль, январь и декабрь». «AC_list» заменяется на «AC_df» DataFrame, потому что мы используем «pd.DataFrame». Мы помещаем этот «AC_df» в метод «print ()». Он отображается, когда мы выполняем код.

После этого мы генерируем словарь и сохраняем его в «genders». Мы поставили «мужской и женский» пол для тех данных, которые мы вставили в предыдущий список. Мы также сопоставляем этот словарь с созданным нами DataFrame. Чтобы сопоставить «полы» с этим «AC_df», мы сначала создаем новый столбец с именем «пол», упоминаем столбец «имя», а затем используем метод «map()». В этом методе мы вставляем «гендеры». Мы отображаем «AC_df» после сопоставления с ним столбца «пол». Это отображается только тогда, когда мы используем метод «print ()».

После этого мы генерируем словарь и сохраняем его в «genders»

Мы получаем указанный вывод при запуске вышеупомянутого кода. Три столбца составляют первый DataFrame. Затем мы сопоставляем столбец «gender» с этим «AC_df», используя метод «map()», который также демонстрируется здесь. Отображается «NaN», что указывает на то, что мы не вставляли никакого значения.

Мы получаем указанный вывод при запуске вышеупомянутого кода

Пример 3

В этом примере мы создаем серию Pandas после импорта Pandas. Мы генерируем эту серию Pandas, используя метод «pd.Series» Pandas. Этот «pd» обращается к этому методу «Series». Вставляем некоторые данные в эту серию и сохраняем серию в переменной «Животные». В этой серии есть «кролик, корова, крыса, собака, мышь и медведь».

Затем мы показываем эту серию. После отображения серии «Животные» мы сопоставляем строку со всеми значениями серии. Мы используем метод «map ()» и вставляем «Я {}». Вставьте названия животных по одному в эти фигурные скобки. Затем распечатайте их, что означает, что он отображает эту строку со всеми именами животных. Он отображает серию после отображения, как это написано внутри метода «print ()».

После отображения серии «Животные» мы сопоставляем строку со всеми значениями серии

Вы можете видеть, что названия животных отображаются последовательно. Затем он сопоставляет строку, которую мы написали ранее, со всеми именами животных и печатает строку «I am a» со всеми именами животных.

Затем он сопоставляет строку, которую мы написали ранее, со всеми именами

Пример 4

Теперь мы импортируем Pandas, а также библиотеку NumPy, потому что в этом примере мы используем функцию или метод как Pandas, так и NumPy. Мы генерируем «C_list», который содержит «C_Fee» и «C_Dur». В «C_Fee» ставим «22000, 25000, 23000, np.NaN и 26000». Здесь «np.NaN» означает, что мы получаем это значение из библиотеки NumPy. Затем мы помещаем данные в «C_Dur»: «20 дней, 50 дней, 40 дней, 35 дней и 45 дней». Этот «C_list» преобразуется в «C_df».

Затем мы применяем некоторые функции в этом методе «map()». Здесь мы используем метод «лямбда» и подставляем 10% от значений «C_Fee». Это сохраняется в другом столбце, который мы добавили здесь под названием «Плата». Мы сопоставляем эту «Комиссия» со столбцом «C_Fee». Затем мы используем метод «print ()». «C_df» отображается после сопоставления с ним столбца «пол».

Затем мы применяем некоторые функции в этом методе «map()»

Перед отображением здесь появились два столбца. Когда применяется метод «map()», с этими двумя столбцами вставляется новый столбец «Плата». Он отображает значение после замены 10% от значений «C_Fee». Вместо «NaN» он также отображает «NaN» в столбце «Fee», поскольку в «C_Fee», к которому применяется расчет, нет значения.

Перед отображением здесь появились два столбца

Заключение

Основная цель этого руководства — предоставить очень хорошую, простую и наглядную информацию о функции «map ()» в Pandas. В этом руководстве вежливо объясняется концепция функции «map ()». Мы показали вам, как использовать функцию «map ()» в кодах здесь. Как мы объяснили, метод «map ()» используется для сопоставления значений Series с соответствующими входными данными. В этом руководстве мы проиллюстрировали четыре примера, в которых мы использовали метод «map()». Мы надеемся, что после тщательного изучения этого руководства вы сможете легко использовать этот метод «map ()» в Pandas.

Оцените статью
bestprogrammer.ru
Добавить комментарий