Pandas DataFrame — это двумерная (двухмерная) аннотированная структура данных, в которой данные выровнены в табличной форме с разными строками и столбцами. Для облегчения понимания DataFrame ведет себя как электронная таблица, содержащая три разных компонента: индекс, столбцы и данные. Pandas DataFrames — наиболее распространенный способ использования объектов панды.
Pandas DataFrames можно создавать разными способами. В этой статье будут объяснены все возможные методы, с помощью которых вы можете создать Pandas DataFrame на python. Мы запустили все примеры с помощью инструмента pycharm. Приступим к реализации каждого метода по очереди.
- Базовый синтаксис
- Способы создания фреймов данных Pandas
- Метод # 01: Создание Pandas DataFrame из словаря списков
- Метод # 02: Создать Pandas DataFrame из словаря массива NumPy
- Метод # 03: Создание pandas DataFrame с использованием списка списков
- Метод # 04: создание pandas DataFrame с использованием списка словарей
- Метод # 05: Создание фрейма данных pandas из dict of pandas Series
- Метод № 06: Создайте фрейм данных Pandas с помощью функции zip ().
- Вывод
Базовый синтаксис
Следуйте следующему синтаксису при создании DataFrames в Python Pandas:
pd.DataFrame(Df_data)
Пример : объясним на примере. В этом случае мы сохранили данные об именах и процентах студентов в переменной «Students_Data». Далее, используя pd.DataFrame (), мы создали DataFrames для отображения результатов ученика.
import pandas as pd
Students_Data = {
‘Name’:[‘Samreena’, ‘Asif’, ‘Mahwish’, ‘Raees’],
‘Percentage’:[90,80,70,85]}
result = pd.DataFrame(Students_Data)
print (result)
Способы создания фреймов данных Pandas
Pandas DataFrames можно создавать разными способами, которые мы обсудим в оставшейся части статьи. Мы распечатаем результаты курсов студента в виде DataFrames. Итак, используя один из следующих методов, вы можете создать похожие DataFrames, которые представлены на следующем изображении:
Метод # 01: Создание Pandas DataFrame из словаря списков
В следующем примере DataFrames создаются из словарей списков, связанных с результатами курса студента. Сначала импортируйте библиотеку панды, а затем создайте словарь списков. Клавиши dict представляют имена столбцов, такие как «Student_Name», «Course_Title» и «GPA». Списки представляют данные или содержимое столбца. Переменная «dictionary_lists» содержит данные об учениках, которые в дальнейшем присваиваются переменной «df1». Используя оператор печати, распечатайте все содержимое DataFrames.
Пример :
# Import libraries for pandas and numpy
import pandas as pd
# Import panda’s library
import pandas as pd
# Create a dictionary of list
dictionary_lists = {
‘Student_Name’: [‘Samreena’, ‘Raees’, ‘Sara’, ‘Sana’],
‘Course_Title’: [‘SQA’,‘SRE’,‘IT Basics’, ‘Artificial intelligence’],
‘GPA’: [3.1, 3.3, 2.8, 4.0]}
# Create the DataFrame
dframe = pd.DataFrame(dictionary_lists)
print(dframe)
После выполнения вышеуказанного кода будет отображаться следующий вывод:
Метод # 02: Создать Pandas DataFrame из словаря массива NumPy
DataFrame может быть создан из массива / списка. Для этого длина должна быть такой же, как у всех нарреев. Если передан какой-то индекс, то длина индекса должна быть равна длине массива. Если ни один индекс не передан, то в этом случае индексом по умолчанию будет диапазон (n). Здесь n представляет длину массива.
Пример :
import numpy as np
# Create a numpy array
nparray = np.array(
[[‘Samreena’, ‘Raees’, ‘Sara’, ‘Sana’],
[‘SQA’, ‘SRE’, ‘IT Basics’,‘Artificial Intelligence’],
[3.1, 3.3, 2.8, 4.0]])
# Create a dictionary of nparray
dictionary_of_nparray = {
‘Student_Name’: nparray[0],
‘Course_Title’: nparray[1],
‘GPA’: nparray[2]}
# Create the DataFrame
dframe = pd.DataFrame(dictionary_of_nparray)
print(dframe)
Метод # 03: Создание pandas DataFrame с использованием списка списков
В следующем коде каждая строка представляет одну строку.
Пример :
# Import library Pandas pd
import pandas as pd
# Create a list of lists
group_lists = [
[‘Samreena’, ‘SQA’, 3.1],
[‘Raees’, ‘SRE’, 3.3],
[‘Sara’, ‘IT Basics’, 2.8],
[‘Sana’, ‘Artificial Intelligence’, 4.0]]
# Create the DataFrame
dframe = pd.DataFrame(group_lists, columns = [‘Student_Name’, ‘Course_Title’, ‘GPA’])
print(dframe)
Метод # 04: создание pandas DataFrame с использованием списка словарей
В следующем коде каждый словарь представляет одну строку и ключи, которые представляют имена столбцов.
Пример :
# Import library pandas
import pandas as pd
# Create a list of dictionaries
dict_list = [
{‘Student_Name’: ‘Samreena’, ‘Course_Title’: ‘SQA’, ‘GPA’: 3.1},
{‘Student_Name’: ‘Raees’, ‘Course_Title’: ‘SRE’, ‘GPA’: 3.3},
{‘Student_Name’: ‘Sara’, ‘Course_Title’: ‘IT Basics’, ‘GPA’: 2.8},
{‘Student_Name’: ‘Sana’, ‘Course_Title’: ‘Artificial Intelligence’, ‘GPA’: 4.0}]
# Create the DataFrame
dframe = pd.DataFrame(dict_list)
print(dframe)
Метод # 05: Создание фрейма данных pandas из dict of pandas Series
Клавиши dict представляют имена столбцов, а каждая серия представляет содержимое столбца. В следующих строках кода мы взяли три типа серий: Name_series, Course_series и GPA_series.
Пример :
# Import library pandas
import pandas as pd
# Create the Series of student names
Name_series = pd.Series([‘Samreena’, ‘Raees’, ‘Sara’, ‘Sana’])
Course_series = pd.Series([‘SQA’, ‘SRE’, ‘IT Basics’, ‘Artificial intelligence’])
GPA_series = pd.Series([3.1, 3.3, 2.8, 4.0])
# Create a Series Dictionary
dictionary_of_nparray\
‘] = {‘Name’: Name_series, ‘Age’: Course_series, ‘Department’: GPA_series}
# DataFrame creation
dframe = pd.DataFrame(dictionary_of_nparray)
print(dframe)
Метод № 06: Создайте фрейм данных Pandas с помощью функции zip ().
Различные списки могут быть объединены с помощью функции list (zip ()). В следующем примере pandas DataFrame создаются путем вызова функции pd.DataFrame (). Создаются три разных списка, которые объединяются в виде кортежей.
Пример :
import pandas as pd
# List1
Student_Name = [‘Samreena’, ‘Raees’, ‘Sara’, ‘Sana’]
# List2
Course_Title = [‘SQA’, ‘SRE’, ‘IT Basics’, ‘Artificial Intelligence’]
# List3
GPA = [3.1, 3.3, 2.8, 4.0]
# Take the list of tuples from three lists further, merge them by use of zip().
tuples = list(zip(Student_Name, Course_Title, GPA))
# Assign data values to tuples.
tuples
# Converting tuples list into pandas Dataframe.
dframe = pd.DataFrame(tuples, columns=[‘Student_Name’, ‘Course_Title’, ‘GPA’])
# Print data.
print(dframe)
Вывод
Используя вышеуказанные методы, вы можете создать Pandas DataFrames на Python. Мы распечатали средний балл студенческого курса, создав Pandas DataFrames. Надеюсь, вы получите полезные результаты после выполнения вышеупомянутых примеров. Все программы хорошо прокомментированы для лучшего понимания. Если у вас есть другие способы создания Pandas DataFrames, не стесняйтесь поделиться ими с нами. Спасибо, что прочитали это руководство.