Создание гистограмм PostgreSQL с использованием данных

PostgreSQL с использованием данных База данных

В процессе обработки и анализа данных гистограммы помогают отображать частотное распределение и легко получать информацию. Мы рассмотрим несколько различных методов получения частотного распределения в PostgreSQL. Чтобы построить гистограмму в PostgreSQL, вы можете использовать различные команды PostgreSQL Histogram. Мы объясним каждый отдельно.

Сначала убедитесь, что в вашей компьютерной системе установлены оболочка командной строки PostgreSQL и pgAdmin4. Теперь откройте оболочку командной строки PostgreSQL, чтобы начать работу с гистограммами. Он немедленно попросит вас ввести имя сервера, над которым вы хотите работать. По умолчанию выбран сервер localhost. Если вы не введете один из них при переходе к следующему параметру, он останется с настройками по умолчанию. После этого вам будет предложено ввести имя базы данных, номер порта и имя пользователя для работы. Если вы его не предоставите, он будет продолжать использовать значение по умолчанию. Как вы можете видеть на изображении, добавленном ниже, мы будем работать над «тестовой» базой данных. Наконец, введите свой пароль для конкретного пользователя и готовьтесь.

Сначала убедитесь, что в вашей компьютерной системе установлены оболочка командной

Пример 1

У нас должны быть некоторые таблицы и данные в нашей базе данных для работы. Итак, мы создали таблицу «продукт» в базе данных «test», чтобы сохранить записи о продажах различных продуктов. Эта таблица занимает два столбца. Один — «order_date», чтобы сохранить дату, когда заказ был выполнен, а другой — «p_sold», чтобы сохранить общее количество продаж на конкретную дату. Попробуйте выполнить приведенный ниже запрос в командной оболочке, чтобы создать эту таблицу.

>> CREATE TABLE product( order_date DATE, p_sold INT);

У нас должны быть некоторые таблицы и данные в нашей базе данных для работы

Сейчас таблица пуста, поэтому нам нужно добавить в нее несколько записей. Итак, попробуйте следующую команду INSERT в оболочке, чтобы сделать это.

>> INSERT INTO product VALUES (‘2021-03-01’,1250), (‘2021-04-02’,555), (‘2021-06-03’,500), (‘2021-05-04’,1000), (‘2021-10-05’,890), (‘2021-12-10’,1000), (‘2021-01-06’,345), (‘2021-11-07’,467), (‘2021-02-08’,1250), (‘2021-07-09’,789);

Сейчас таблица пуста, поэтому нам нужно добавить в нее несколько записей

Теперь вы можете проверить, есть ли в таблице данные, используя команду SELECT, как указано ниже.

>> SELECT * FROM product;

Теперь вы можете проверить, есть ли в таблице данные

Использование пола и мусорного ведра

Если вы хотите, чтобы ячейки гистограммы PostgreSQL предоставляли аналогичные периоды (10-20, 20-30, 30-40 и т. Д.), Выполните приведенную ниже команду SQL. Мы оцениваем номер ячейки из приведенного ниже утверждения, разделив продажную стоимость на размер ячейки гистограммы, 10.

Преимущество этого подхода заключается в динамическом изменении бункеров при добавлении, удалении или изменении данных. Он также добавляет дополнительные ячейки для новых данных и / или удаляет ячейки, если их количество достигает нуля. В результате вы можете эффективно генерировать гистограммы в PostgreSQL.

В результате вы можете эффективно генерировать гистограммы в PostgreSQL

Пол переключения (p_sold / 10) * 10 с полом (p_sold / 100) * 100 для увеличения размера бункера до 100.

100 для увеличения размера бункера до 100

Использование предложения WHERE

Вы построите частотное распределение, используя объявление CASE, пока вы понимаете, какие ячейки гистограммы должны быть сгенерированы или как меняются размеры контейнера гистограммы. Для PostgreSQL ниже приведен еще один оператор гистограммы:

>> SELECT ‘100-300’ AS price_between, COUNT(p_sold) AS COUNT FROM product WHERE p_sold BETWEEN 100 AND 300 UNION (SELECT ‘300-600’ AS price_between, COUNT(p_sold) AS COUNT FROM product WHERE p_sold BETWEEN 300 AND 600) UNION (SELECT ‘600-900’ AS price_between, COUNT(p_sold) AS COUNT FROM product WHERE p_sold BETWEEN 600 AND 900) UNION (SELECT ‘900-1300’ AS price_between, COUNT(p_sold) AS COUNT FROM product WHERE p_sold BETWEEN 900 AND 1300);

Выходные данные показывают распределение частот гистограммы для значений общего диапазона столбца «p_sold» и числа счетчиков. Цены варьируются от 300-600 до 900-1300, всего 4 отдельно. Для диапазона продаж 600-900 было 2 счета, а для диапазона 100-300 — 0 продаж.

Пример 2

Рассмотрим еще один пример для иллюстрации гистограмм в PostgreSQL. Мы создали таблицу «student» с помощью приведенной ниже команды в оболочке. В этой таблице будет храниться информация о студентах и ​​количестве имеющихся у них сбоев.

>> CREATE TABLE student(std_id INT, fail_count INT);

В этой таблице будет храниться информация о студентах и ​​количестве имеющихся у них сбоев

В таблице должны быть какие-то данные. Итак, мы выполнили команду INSERT INTO, чтобы добавить данные в таблицу «student» как:

>> INSERT INTO student VALUES (111, 30), (112, 60), (113, 90), (114, 3), (115, 120), (116, 150), (117, 180), (118, 210), (119, 5), (120, 300), (121, 380), (122, 470), (123, 530), (124, 9), (125, 550), (126, 50), (127, 40), (128, 8);

В таблице должны быть какие-то данные

Теперь таблица заполнена огромным количеством данных в соответствии с отображаемым выводом. Он имеет случайные значения для std_id и fail_count студентов.

>> SELECT * FROM student;

Теперь таблица заполнена огромным количеством данных

Когда вы попытаетесь выполнить простой запрос, чтобы собрать общее количество неудач одного студента, вы получите результат, указанный ниже. Выходные данные показывают только отдельное количество неудачных попыток каждого студента один раз из метода count, используемого в столбце std_id. Это выглядит не очень удовлетворительно.

>> SELECT fail_count, COUNT(std_id) FROM student GROUP BY 1 ORDER BY 1;

Когда вы попытаетесь выполнить простой запрос

В этом случае мы снова будем использовать метод пола для аналогичных периодов или диапазонов. Итак, выполните в командной оболочке указанный ниже запрос. Запрос делит «fail_count» студентов на 100.00, а затем применяет функцию floor для создания корзины размером 100. Затем он суммирует общее количество студентов, проживающих в этом конкретном диапазоне.

Заключение

Мы можем сгенерировать гистограмму с помощью PostgreSQL, используя любой из методов, упомянутых ранее, в зависимости от требований. Вы можете изменить сегменты гистограммы на любой желаемый диапазон; равномерные интервалы не требуются. В этом руководстве мы пытались объяснить лучшие примеры. Чтобы прояснить вашу концепцию создания гистограмм в PostgreSQL. Надеюсь, следуя любому из этих примеров, вы сможете легко создать гистограмму для своих данных в PostgreSQL.

Читайте также:  Фактор заполнения SQL и производительность
Оцените статью
bestprogrammer.ru
Добавить комментарий