График разброса Matplotlib в Python

scatter_default_arguments Изучение

Человек может понять визуальное больше, чем текстовую форму. Вот почему люди всегда предлагают нарисовать граф больших данных, чтобы очень легко понять его. На рынке доступны различные типы графиков, такие как гистограммы, гистограммы, круговые диаграммы и т.д. Эти разные графики используются в соответствии с набором данных и требованиями. Например, если у вас есть набор данных о деятельности компании за последние 10 лет, то гистограмма даст больше информации о росте компании. Таким образом, выбор графика зависит от набора данных и требований.

Если вы специалист по данным, то иногда вам приходится обрабатывать большие данные. В этих больших данных вы обрабатываете данные, анализируете данные, а затем генерируете по ним отчет. Чтобы сгенерировать отчет по этому поводу, вам нужно какое-то четкое изображение данных, и здесь появляются графики.

В этой статье мы собираемся объяснить, как использовать график разброса matplotlib в python.

График рассеяния широко используется анализ данных, чтобы выяснить отношения между двумя числовыми наборами данных. В этой статье будет показано, как использовать matplotlib.pyplot для построения диаграммы рассеяния. Эта статья предоставит вам полную информацию, необходимую для работы над диаграммой рассеяния.

Matplotlib.pypolt предлагает разные способы построения графика. Чтобы построить график в виде разброса, мы используем функцию scatter ().

Синтаксис использования функции scatter ():

matplotlib.pyplot.scatter(x_data, y_data, s, c, marker, cmap, vmin, vmax,alpha,linewidths, edgecolors)

Все вышеперечисленные параметры мы увидим в следующих примерах, чтобы лучше понять.

import matplotlib.pyplot as plt
plt.scatter(x_data, y_data)

Данные, которые мы передали на разбросе x_data, принадлежат оси x, а y_data принадлежит оси y.

Примеры

Теперь мы построим график scatter () с разными параметрами.

Пример 1: Использование параметров по умолчанию

Первый пример основан на настройках функции scatter () по умолчанию. Мы просто передаем два набора данных, чтобы создать между ними связь. Здесь у нас есть два списка: один относится к высотам (h), а другой соответствует их весам (w).

# scatter_default_arguments.py

# import the required library
import matplotlib.pyplot as plt

# h (height) and w (weight) data
= [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
= [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]

# plot a scatter plot
plt.scatter(h, w)
plt.show()

Вывод: scatter_default_arguments.py

В приведенном выше выводе мы можем видеть данные веса (w) по оси y и высоты (h) по оси x.

Пример 2: график Scatter () со значениями меток (ось x и ось y) и заголовком

В example_1 мы просто рисуем диаграмму рассеяния напрямую с настройками по умолчанию. Теперь мы собираемся настроить функцию диаграммы рассеяния по очереди. Итак, прежде всего, мы добавим метки к графику, как показано ниже.

# labels_title_scatter_plot.py

# import the required library
import matplotlib.pyplot as plt

# h and w data
= [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
= [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]

# plot a scatter plot
plt.scatter(h, w)

# set the axis lables names
plt.xlabel(«weight (w) in Kg»)
plt.ylabel(«height (h) in cm»)

# set the title of the chart name
plt.title(«Scatter plot for height and weight»)
plt.show()

Строки с 4 по 11: мы импортируем библиотеку matplotlib.pyplot и создаем два набора данных для оси x и оси y. И мы передаем оба набора данных в функцию точечной диаграммы.

Строки с 14 по 19 : мы устанавливаем имена меток оси X и оси Y. Мы также устанавливаем заголовок для графика рассеяния.

Вывод: labels_title_scatter_plot.py

labels_title_scatter_plot

В приведенном выше выводе мы видим, что диаграмма рассеяния имеет имена меток оси и заголовок диаграммы рассеяния.

Пример 3. Используйте параметр маркера, чтобы изменить стиль точек данных

По умолчанию маркер имеет сплошную круглую форму, как показано в выходных данных выше. Итак, если мы хотим изменить стиль маркера, мы можем изменить его через этот параметр (маркер). Даже мы также можем установить размер маркера. Итак, мы увидим это в этом примере.

# marker_scatter_plot.py

# import the required library
import matplotlib.pyplot as plt

# h and w data
= [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
= [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]

# plot a scatter plot
plt.scatter(h, w, marker=«v», s=75)

# set the axis lables names
plt.xlabel(«weight (w) in Kg»)
plt.ylabel(«height (h) in cm»)

# set the title of the chart name
plt.title(«Scatter plot where marker change»)
plt.show()

Приведенный выше код такой же, как объяснено в предыдущих примерах, за исключением строки ниже.

Строка 11 : мы передаем параметр маркера и новый знак, используемый точечной диаграммой для рисования точек на графике. Также устанавливаем размер маркера.

Нижеприведенный вывод показывает точки данных с тем же маркером, который мы добавили в функцию разброса.

Вывод : marker_scatter_plot.py

marker_scatter_plot

Пример 4: изменение цвета диаграммы рассеяния

Мы также можем изменить цвет точек данных по нашему выбору. По умолчанию он отображается синим цветом. Теперь мы изменим цвет точек данных точечной диаграммы, как показано ниже. Мы можем изменить цвет диаграммы рассеяния, используя любой цвет, который вы хотите. Мы можем выбрать любой кортеж RGB или RGBA (красный, зеленый, синий, альфа). Диапазон значений каждого элемента кортежа будет между [0.0, 1.0], и мы также можем представить RGB или RGBA в шестнадцатеричном формате, например # FF5733.

# scatter_plot_colour.py

# import the required library
import matplotlib.pyplot as plt

# h and w data
= [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
= [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]

# plot a scatter plot
plt.scatter(h, w, marker=«v», s=75,c=«red»)

# set the axis lables names
plt.xlabel(«weight (w) in Kg»)
plt.ylabel(«height (h) in cm»)

# set the title of the chart name
plt.title(«Scatter plot colour change»)
plt.show()

Этот код похож на предыдущие примеры, за исключением строки ниже, где мы добавляем настройку цвета.

Строка 11 : мы передаем параметр «c» для цвета. Мы присвоили цвету название «красный» и получили результат в том же цвете.

Если вам нравится использовать кортеж цвета или шестнадцатеричный формат, просто передайте это значение ключевому слову (c или color), как показано ниже:

plt.scatter(h, w, marker=«v», s=75,c=«#FF5733»)

В приведенной выше функции разброса мы передали шестнадцатеричный код цвета вместо названия цвета.

Вывод : scatter_plot_colour.py

scatter_plot_colour

Пример 5: изменение цвета точечной диаграммы в зависимости от категории

Мы также можем изменить цвет точек данных в соответствии с категорией. Итак, в этом примере мы собираемся это объяснить.

# colour_change_by_category.py

# import the required library
import matplotlib.pyplot as plt

# h and w data gather from two country
= [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
= [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]

# set the country name 1 or 2 which shows the height or weight
# data belongs to which country
country_category = [‘country_2’, ‘country_2’, ‘country_1’,
‘country_1’, ‘country_1’, ‘country_1’,
‘country_2’, ‘country_2’, ‘country_1’, ‘country_2’]

# color mapping
colours = {‘country_1’:‘orange’, ‘country_2’:‘blue’}
colour_list = [colours[i] for i in country_category]

# print the colour list
print(colour_list)

# plot a scatter plot
plt.scatter(h, w, marker=«v», s=75,c=colour_list)

# set the axis lables names
plt.xlabel(«weight (w) in Kg»)
plt.ylabel(«height (h) in cm»)

# set the title of the chart name
plt.title(«Scatter plot colour change for category wise»)
plt.show()

Приведенный выше код похож на предыдущие примеры. Строки, в которых мы внесли изменения, объясняются ниже:

Строка 12 : Мы помещаем все точки данных в категорию country_1 или country_2. Это всего лишь предположения, а не истинная ценность демонстрации.

Строка 17 : Мы создали словарь цветов, представляющих каждую категорию.

Строка 18 : Мы сопоставляем категорию стран с их цветовыми названиями. И приведенный ниже оператор печати покажет такие результаты.

[‘blue’, ‘blue’, ‘orange’, ‘orange’, ‘orange’, ‘orange’, ‘blue’, ‘blue’, ‘orange’, ‘blue’]

Строка 24 : Наконец, мы передаем colour_list (Строка 18) функции разброса.

Вывод : colour_change_by_category.py

colour_change_by_category

Пример 6: изменение цвета края точки данных

Мы также можем изменить цвет края точки данных. Для этого мы должны использовать ключевое слово цвета края («цвет края»). Мы также можем установить ширину линии края. В предыдущих примерах мы не использовали никакой цвет кромки, по умолчанию это None. Таким образом, он не показывает цвета по умолчанию. Мы добавим цвет краев точки данных, чтобы увидеть разницу между графиком точечной диаграммы в предыдущих примерах и графиком точек данных цвета краев.

# edgecolour_scatterPlot.py

# import the required library
import matplotlib.pyplot as plt

# h and w data
= [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
= [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]

# plot a scatter plot
plt.scatter(h, w, marker=«v», s=75,c=«red»,edgecolor=‘black’, linewidth=1)

# set the axis lables names
plt.xlabel(«weight (w) in Kg»)
plt.ylabel(«height (h) in cm»)

# set the title of the chart name
plt.title(«Scatter plot colour change»)
plt.show()

Строка 11 : в этой строке мы просто добавляем еще один параметр, который мы называем цветом края и шириной линии. После добавления обоих параметров наш график рассеяния выглядит примерно так, как показано ниже. Вы можете видеть, что внешняя часть точки данных теперь обведена черным цветом с шириной линии = 1.

Выход : edgecolour_scatterPlot.py

edgecolour_scatterPlot

Заключение

В этой статье мы увидели, как использовать функцию точечной диаграммы. Мы объяснили все основные концепции, необходимые для построения диаграммы рассеяния. Может быть другой способ нарисовать диаграмму рассеяния, например, более привлекательный, в зависимости от того, как мы используем разные параметры. Но большинство параметров, которые мы рассмотрели, были призваны сделать сюжет более профессиональным. Кроме того, не используйте слишком много сложных параметров, которые могут сбить с толку фактическое значение графика.

Читайте также:  11 лучших ИТ-компаний мира 2023
Оцените статью
bestprogrammer.ru
Добавить комментарий