Pandas Reindex

Pandas Cumsum () Программирование и разработка

«В „Pandas“ мы можем хранить много информации в табличной форме, которая также известна как DataFrame. „Панды“ помогают нам с методом „DataFrame ()“ для построения DataFrame. DataFrame содержит индексы, и мы также можем изменить индексы DataFrame, используя функции „панд“. Метод, который мы используем для переиндексации DataFrame, — это метод „reindex()“. Этот метод помогает изменить значения индекса строки, а также значения индекса столбцов. Используя этот метод, мы можем изменить индекс DataFrame по умолчанию, а также мы можем изменить индекс, который мы установили при создании DataFrame. Мы будем использовать метод „reindex ()“ в наших примерах „панд“ в этом руководстве и подробно объясним эту концепцию здесь».

Пример 1

Инструмент «Spyder» помогает нам в разработке кода «панд» здесь, в этом руководстве, и мы начинаем наш код с ключевого слова «импорт», которое поможет импортировать функцию «панды». Мы размещаем «панды как pd» после ввода «импорт». После этого мы создаем DataFrame, набрав «pd.DataFrame()». Мы пишем здесь «pd», потому что «DataFrame()» — это метод «панд». «value_df» — это имя переменной, в которой сохраняется DataFrame. Мы добавляем «RandomName», которое является именем столбца, а «RandomName» содержит «Томас, Оскар, Лилли, Роуэн, Джон, Бромли, Питер, Александр и Сэмюэл».

Затем у нас есть «Value_1», в которое мы вставили «16, 29, 24, 35, 44, 50, 69, 74 и 88». Затем идет «Value_2», и мы добавили «25, 38, 42, 56, 54, 65, 78, 89 и 99». Теперь следует «Value_3», и мы помещаем в него «36, 48, 52, 69, 74, 75, 87, 91 и 69». После этого присутствует столбец «Value_4», куда мы вставили «52, 64, 72, 88, 82, 95, 97, 21 и 39». Последний столбец — это столбец «Value_5», и в этом столбце мы добавили значения «66, 78, 82, 99, 34, 45, 57, 61 и 89». После этого мы используем функцию «print()», в которую добавлено «Values_df». Он будет напечатан на терминале.

После нажатия «Shift+Enter»

После нажатия «Shift+Enter» мы можем легко получить результат наших кодов в приложении «Spyder». Здесь этот код возвращает DataFrame с индексом по умолчанию. Теперь мы применим метод «reindex ()» для переиндексации этого DataFrame в «пандах».

Функция «reindex()» используется здесь

Функция «reindex()» используется здесь для переиндексации значения индекса строки. В приведенном выше DataFrame вы можете видеть, что отображаются значения индекса строки по умолчанию, и теперь мы применяем метод «reindex ()» для переиндексации этих индексов строк. Мы помещаем имя DataFrame, а затем метод «reindex ()», в котором мы размещаем те значения индекса, которые мы хотим добавить в указанный выше DataFrame. Мы помещаем «ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H и ind_I» в функцию «reindex()». Таким образом, индексы этих строк будут обновлены в DataFrame, когда мы выполним этот код.

Читайте также:  Подсчитайте размер вектора в C ++

Функция «reindex()» используется здесь для переиндексации значения

В этом результате отображаются значения индекса строки, и вы можете заметить, что значения DataFrame здесь не отображаются, а появились значения «NaN». Это связано с тем, что новые значения индекса не соответствуют предыдущим значениям индекса DataFrame. Когда новый индекс и старый индекс не совпадают, то там отображается «Nan». Эти значения «NaN» появляются по умолчанию, когда мы изменяем индекс, и он не соответствует предыдущему индексу.

В этом результате отображаются значения индекса строки

Пример 2

Теперь мы изменяем значения индекса столбца «Value_df», которые мы ранее создали в примере 1. После печати «Value_df» мы помещаем переменную «column» и добавляем к ней некоторые значения. Мы добавляем «a_1, b_1, c_1, d_1 и e_1». Теперь мы хотим настроить эти значения как индекс столбцов, поэтому для этого мы используем метод «reindex ()» и помещаем имя переменной «столбец», в которой хранятся новые значения индекса столбца и также установите «ось» на «столбцы», чтобы обновить индекс оси столбца. Мы помещаем метод «reindex()» в «print()», чтобы он также отображался на терминале.

Поскольку мы использовали метод «переиндексировать

Поскольку мы использовали метод «переиндексировать ()», значения индекса столбца, которые присутствуют в первом кадре данных, обновляются, а новые значения добавляются в обновленный кадр данных. Вы также можете заметить, что все значения DataFrame преобразуются в «NaN», потому что оба значения индекса столбцов различны.

Вы также можете заметить, что все значения DataFrame

Пример 3

«Programming_data» в этом коде содержит «P_Languages», куда мы добавили «JavaScript, CSS, Web Engineering, OOP, C#, AI, Java и JavaScript». Затем у нас есть «Часы», в которые мы помещаем «4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs и 6_hrs». После этого вводится «P_Code», и мы вставляем «11523, 12423, 12321, 11456, 11454, 12267, 13106 и 14123». Мы добавляем переменную «p_index» и ставим «Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G и Pro_H».

Эти значения будут использоваться в качестве значений индекса строк. Мы меняем «Programming_data» в «Programming_df» DataFrame. Мы также добавляем «p_index» в этот DataFrame, используя метод «index». Ставим «Programming_df», а затем метод «index» и присваиваем этому «p_index». Теперь приведенные выше значения индекса добавляются в качестве значений индекса строк в DataFrame. Мы также печатаем «Programming_df».

После этого мы добавляем несколько новых значений индекса в переменную «new_index», а это «P_1, P_2, P_3, P_4, P_5, P_6, P_7 и P_8». Поскольку мы хотим обновить значения индекса строк, мы используем метод «reindex()» и помещаем «new_index» в качестве параметра этой функции, а также сохраняем обновленный DataFrame в «newProgramming_df» и помещаем «newProgramming_df» в » print()» для отображения.

После этого мы добавляем несколько новых значений индекса

Значения индекса обновляются, и мы также можем сказать, что мы переиндексировали созданный нами DataFrame. Все значения DataFrame также преобразуются в «NaN», поскольку оба значения индекса различны.

Значения индекса обновляются, и мы также можем сказать

Пример 4

В настоящее время мы изменяем значения индекса «Programming_df» для столбцов, которые мы ранее разработали в примере 3. Мы размещаем переменную «column» и вставляем в нее новые значения. «P_Code, P_Languages, Hours и New» добавляются в переменную «column». Затем мы снова используем метод «reindex ()», в котором мы устанавливаем переменную «column», которая будет обновлять предыдущие значения индекса столбца и добавлять эти новые значения индекса столбца в DataFrame.

Здесь вы можете заметить, что новые значения, которые мы добавили в «столбец», такие же, как мы добавили в вышеприведенный DataFrame, но последовательность другая, поэтому она изменит последовательность столбцов и настроит все столбцы по мере того, как мы упоминается в переменной «column». Кроме того, мы добавляем еще одно значение индекса, которого нет в приведенном выше DataFrame, которое здесь «Новое», поэтому в этом столбце появятся значения «NaN».

Здесь вы можете заметить, что новые значения, которые мы добавили

Последовательность столбцов здесь изменена, и все значения отображаются так, как они присутствуют в исходных столбцах DataFrame, а столбец «Новый» в обновленном DataFrame содержит все значения «NaN», поскольку этот столбец отсутствует в исходном DataFrame.

Последовательность столбцов здесь изменена, и все значения отображаются

Заключение

Мы представили этот учебник, который помогает нам подробно понять понятие «переиндексации панд». Мы обсудили, как мы можем переиндексировать столбец DataFrame, а также значения индекса строки. Мы объяснили, что для этого используется функция «переиндексировать ()» «панд». Мы сделали разные примеры, в которых мы изменили значения индекса строк DataFrame, а также значения индекса индекса столбца DataFrame. Мы визуализировали результаты всех кодов, которые мы сделали здесь, в этом уроке, а также подробно объяснили их.

Оцените статью
bestprogrammer.ru
Добавить комментарий