Индексация Pandas Dataframe

выучить язык программирования Изучение

В pandas индексация включает в себя выбор определенных столбцов и строк данных из DataFrame. Выбор всех строк и даже некоторых столбцов, части строк и всех столбцов или некоторых строк и столбцов — вот что влечет за собой индексация. Выбор подмножества — это другое название индексации. Когда мы создаем объект Pandas DataFrame в Python с помощью функции pd.DataFrame() из модуля Pandas, автоматически создается адрес в индексах строки или столбца, чтобы символизировать каждый элемент/точку данных внутри DataFrame. Однако индексы строк являются индексами DataFrame, а индексы столбцов просто называются столбцами. Индекс объекта Pandas DataFrame по существу идентифицирует определенные строки. Давайте посмотрим, как изменить объект DataFrame индекса Panda.

Пример 1

Параметр index в Python можно использовать для установки индекса DataFrame по мере его создания. Мы создадим список и передадим его в параметр индекса метода pd.DataFrame(). Давайте применим это на практике с кодом Python. Мы импортировали модуль pandas сюда. После этого мы сделали словарь и список Python. Словарь использовался для начала разработки DataFrame. Как видите, мы использовали функцию DataFrame с параметром index, чтобы сделать столбец «rr» индексом.

import pandas as pd
dd = {‘Name’[‘Alex’, ‘Ramen’, ‘Zayn’, ‘Travis’, ‘Scott’],
‘Marks’[33, 66, 88, 67, 78],
‘City’[‘New York’, ‘Los Angeles’, ‘Chicago’, ‘San Diego’, ‘Dallas’]}
rr = [1, 2, 3, 4, 5]
ff = pd.DataFrame(dd, index = rr)
print(ff)

См. результат на следующем изображении.

езультат на следующ

Пример 2

В Python мы можем использовать различные методы для создания индекса любого существующего столбца или столбцов объекта Pandas DataFrame. В этом сценарии мы будем использовать inplace аргумент метода set index() модуля Python Pandas. Аргумент inplace по умолчанию имеет значение False. Однако в этом случае мы установим значение inplace равным True. Существующий столбец передается методу pd.set index(), поскольку новый индекс заменяет старый индекс DataFrame. Давайте посмотрим, как это работает.

import pandas as pd
dd = {‘Name’[‘Alex’, ‘Ramen’, ‘Zayn’, ‘Travis’, ‘Scott’],
‘Rollnum’[‘1’, ‘2’, ‘3’, ‘4’, ‘5’],
‘City’[‘New York’, ‘Los Angeles’, ‘Chicago’, ‘San Diego’, ‘Dallas’]}
ff = pd.DataFrame(dd)
print(«\nInitial DataFrame:»)
print(ff)
ff = ff.set_index(‘Rollnum’)
print(«\nFinal DataFrame:»)
print(ff)

Результат показан на следующем снимке экрана.

Читайте также:  Как плавно превратить рекламные системы в большие данные

Результат показан на следую

Пример 3

В этом случае мы будем использовать аргумент drop функции set index() модуля Python Pandas. Однако в этом случае мы установим для аргумента drop значение False. Чтобы DataFrame не потерял столбец, назначенный в качестве нового индекса. Давайте применим это на практике с помощью приведенного ниже кода.

import pandas as pd
dd = { ‘Rollnum’ : [‘1’, ‘2’, ‘3’, ‘4’, ‘5’],
‘Name’[‘Alex’, ‘Ramen’, ‘Zayn’, ‘Travis’, ‘Scott’],
‘Marks’[33, 66, 88, 67, 78]}
ff = pd.DataFrame(dd)
print(«\nInitial DataFrame:»)
print(ff)
ff = ff.set_index(‘Name’, drop = False)
print(«\nFinal DataFrame:»)
print(ff)

Вот результат.

Вот рез

Пример 4

Создав список имен столбцов DataFrame и передав его функции set index(), мы можем установить несколько столбцов объекта Pandas DataFrame точно так же, как его индекс. В результате в этом сценарии индекс называется мультииндексным.

import pandas as pd
dd = {‘Rollnum’[1, 2, 3, 4, 5],
‘Name’[‘Alex’, ‘Ramen’, ‘Zayn’, ‘Travis’, ‘Scott’],
‘Marks’[33, 66, 88, 67, 78],
‘City’[‘New York’, ‘Los Angeles’, ‘Chicago’, ‘San Diego’, ‘Dallas’]}
ff = pd.DataFrame(dd)
print(«\nInitial DataFrame:»)
print(ff)
ff = ff.set_index([‘Rollnum’, ‘Name’])
print(«\nFinal DataFrame:»)
print(ff)

Здесь вы можете увидеть вывод кода, приведенного выше.

Здесь вы можете увидеть вывод кода, привед

Пример 5

Можно использовать несколько методов, чтобы установить позицию объекта Pandas DataFrame для любого объекта Python, такого как список, диапазон или даже ряд. Используя функции pd.Index(), set index() и range(), мы можем установить индекс объекта DataFrame (Pandas) в этом подходе. Во-первых, мы будем использовать функцию range() для построения последовательности целых чисел Python, которую мы затем отправим в функцию pd.Index(). Этот метод создает объект индекса DataFrame. Возвращаемый объект индекса DataFrame затем устанавливается в качестве нового индекса DataFrame с помощью функции set index(). Давайте реализуем этот код.

import pandas as pd
dd = {‘Rollnum’[1, 2, 3],
‘Name’[‘Alex’, ‘Ramen’, ‘Zayn’],
‘Marks’[33, 66, 88],
‘City’[‘New York’, ‘Los Angeles’, ‘Chicago’]}
ff = pd.DataFrame(dd)
print(«\nInitial DataFrame:»)
print(ff)
my_list = [‘I’, ‘II’, ‘III’]
idx = pd.Index(my_list)
ff = ff.set_index(idx)
print(«\nFinal DataFrame:»)
print(ff)

См. вывод ниже.

вывод ниж

Пример 6

Индекс объекта Pandas DataFrame можно установить с помощью методов set index() и pd.Index(). Мы начнем с создания списка Python, который затем отправим в функцию pd.Index(). Эта функция даст объект индекса DataFrame. Возвращаемый объект индекса DataFrame затем устанавливается в качестве нового индекса DataFrame с помощью функции set index().

import pandas as pd
dd = {‘Rollnum’[1, 2, 3, 4, 5],
‘Name’[‘Alex’, ‘Ramen’, ‘Zayn’, ‘Travis’, ‘Scott’],
‘Marks’[33, 66, 88, 67, 78],
‘City’[‘New York’, ‘Los Angeles’, ‘Chicago’, ‘San Diego’, ‘Dallas’]}

ff = pd.DataFrame(dd)
print(«\nInitial DataFrame:»)
print(ff)
indx = pd.Index(range(1, 6, 1))
ff = ff.set_index(indx)
print(«\nFinal DataFrame:»)
print(ff)

Результат представлен на прикрепленном скриншоте.

ультат представлен на прикрепленном скрин

Пример 7

Используя функции pd.Series() и set index(), мы можем установить индекс объекта DataFrame Pandas в предыдущем методе. Создайте список и передайте его функции pd.Series(), которая вернет серийный номер Pandas, который можно использовать в качестве объекта индекса DataFrame. Результирующий ряд Pandas передается методу set index(), который устанавливает его как новый индекс DataFrame. Давайте посмотрим на следующий код и поймем, как это работает.

import pandas as pd
dd = {‘Rollnum’[1, 2, 3, 4, 5],
‘Name’[‘Alex’, ‘Ramen’, ‘Zayn’, ‘Travis’, ‘Scott’],
‘Marks’[33, 66, 88, 67, 78],
‘City’[‘New York’, ‘Los Angeles’, ‘Chicago’, ‘San Diego’, ‘Dallas’]}
ff = pd.DataFrame(dd)
print(«\nInitial DataFrame:»)
print(ff)

ser_indx = pd.Series([5, 4, 3, 2, 1])
ff = ff.set_index(ser_indx)
print(«\nFinal DataFrame:»)
print(ff)

Здесь вы можете увидеть результат.

вы можете увидеть результ

Заключение

Индексирование — это процесс выбора значений из определенных строк и столбцов в DataFrame. Мы можем выбрать все строки и некоторые столбцы или строки и все столбцы, используя индексацию. На этом сеансе обсуждались такие темы, как что такое индекс и как вы можете установить индекс при создании DataFrame, как вы можете установить существующие столбцы DataFrame в качестве индекса или даже мультииндекса, и как вы можете установить такие объекты Python, как диапазон, список, или даже серия в качестве индекса.

Оцените статью
bestprogrammer.ru
Добавить комментарий