Таблица частот с интервалами в R

Абсолютное руководство по компьютерам и программированию для новичков Программирование и разработка

Data frame в R может содержать дискретные данные в виде целых чисел или значений с плавающей запятой. Значения могут быть различными или повторяющимися по своей природе. Таблицу частот для дискретных данных можно легко создать с помощью метода table() в R, который возвращает значения вместе с их соответствующими счетчиками.

Получите таблицу частот с интервалами в R

Таблицу интервалов можно легко создать с помощью метода cut(). Метод cut имеет следующий синтаксис:

Syntax: cut ( vec , bins-to-divide)

Arguments :

  • vec – The vector to divide the bins of
  • bins-to-divide – The number of classes to create the vector.

Встроенный метод seq() используется для создания последовательности, начиная с первого аргумента и заканчивая вторым аргументом, каждый из которых отличается от третьего аргумента.

Syntax: seq( st, end, diff )

Here,

st – The starting integer of the sequence
end – The ending integer of the sequence
diff – The difference between each bin value

Указанный вектор затем разрезается на указанные интервалы, и соответствующие счетчики каждого из интервалов возвращаются методом table() в R.

R

#creating a data frame
data_frame <- data.frame(col1 = c(1,3,5,6,23,6,2,5,7,
                                  16,8,9,36,7,12,1,
                                  6,4,14,23,19,18,
                                   14,2,20,30))
print("Original Data")
print(data_frame)
# creating intervals between 1 to 30 with a gap of 5 each
interval_table <- table(cut(data_frame$col1,seq(1,30,5)))
print("Data in Intervals")
print(interval_table)

Выход:

Указанный вектор затем разрезается на указанные интервалы

Получите частоту на основе интервалов в R на выборочных данных

Случайная выборка также может быть сгенерирована между указанным набором чисел с фиксированной длиной, связанной с ним. Это избавляет нас от создания списка образцов вручную. Он возвращает вектор значений в качестве вывода.

Syntax: sample(range , length)

Arguments: 

  • range – The values within which the sample values will be taken
  • length – The length of the sample vector

Затем интервалы снова создаются с помощью метода cut(), как показано ранее. Выбор размера ячеек зависит от пользователя. Небольшой размер бинов для большого набора данных менее предпочтителен, однако мы можем легко использовать его с большим набором данных.

Читайте также:  Возврат массива из функции C++

R

#creating a sample vector of values
vec <- sample(11:50,20)
#creating a data frame
data_frame <- data.frame(col1 = vec)
print("Original Data")
print(data_frame)
#creating intervals between 10 to 50 with a gap of 10 each
interval_table <- table(cut(data_frame$col1,seq(10,50,10)))
print("Data in Intervals")
print(interval_table)

Выход:

Затем интервалы снова создаются с помощью метода cut

Получите частоту на основе интервалов в R на векторных данных

Функции также можно использовать для генерации вектора целых чисел или строковых значений. Метод rpois() в R используется для рисования случайно вычисленной плотности Пуассона. Метод rpois имеет следующий синтаксис:

Syntax: rpois(num-of-observations, rate=rate )

Arguments: 

  • num-of-observations – Number of observations
  • rate – The rate of events for the distribution

Однако, поскольку значения рисуются случайным образом, используя только количество наблюдений, вместо того, чтобы вручную выбирать ячейки, мы можем извлечь минимальное и максимальное значения возвращаемых значений в векторе плотности, используя встроенные функции min() и max(). методы.
Затем между этими интервалами может быть сгенерирована последовательность для получения точных результатов. Затем с помощью метода table() в R рисуется таблица частот.

R

#using a func to generate values
vec <- rpois(10,30)
#creating a data frame
data_frame <- data.frame(col1 = vec)
print("Original Data")
print(data_frame)
#getting the min and max intervals in the vec
min<- min(vec)
max <- max(vec)
#creating intervals between 10 to 50 with a gap of 10 each
interval_table <- table(cut(data_frame$col1,seq(min,max,2)))
print("Data in Intervals")
print(interval_table)

Выход:

Однако, поскольку значения рисуются случайным образом

Оцените статью
bestprogrammer.ru
Добавить комментарий

Adblock
detector