Data frame в R может содержать дискретные данные в виде целых чисел или значений с плавающей запятой. Значения могут быть различными или повторяющимися по своей природе. Таблицу частот для дискретных данных можно легко создать с помощью метода table() в R, который возвращает значения вместе с их соответствующими счетчиками.
Получите таблицу частот с интервалами в R
Таблицу интервалов можно легко создать с помощью метода cut(). Метод cut имеет следующий синтаксис:
Syntax: cut ( vec , bins-to-divide)
Arguments :
- vec – The vector to divide the bins of
- bins-to-divide – The number of classes to create the vector.
Встроенный метод seq() используется для создания последовательности, начиная с первого аргумента и заканчивая вторым аргументом, каждый из которых отличается от третьего аргумента.
Syntax: seq( st, end, diff )
Here,
st – The starting integer of the sequence
end – The ending integer of the sequence
diff – The difference between each bin value
Указанный вектор затем разрезается на указанные интервалы, и соответствующие счетчики каждого из интервалов возвращаются методом table() в R.
R
#creating a data frame
data_frame <-
data.frame
(col1 =
c
(1,3,5,6,23,6,2,5,7,
16,8,9,36,7,12,1,
6,4,14,23,19,18,
14,2,20,30))
(
"Original Data"
)
(data_frame)
# creating intervals between 1 to 30 with a gap of 5 each
interval_table <-
table
(
cut
(data_frame$col1,
seq
(1,30,5)))
(
"Data in Intervals"
)
(interval_table)
Выход:
Получите частоту на основе интервалов в R на выборочных данных
Случайная выборка также может быть сгенерирована между указанным набором чисел с фиксированной длиной, связанной с ним. Это избавляет нас от создания списка образцов вручную. Он возвращает вектор значений в качестве вывода.
Syntax: sample(range , length)
Arguments:
- range – The values within which the sample values will be taken
- length – The length of the sample vector
Затем интервалы снова создаются с помощью метода cut(), как показано ранее. Выбор размера ячеек зависит от пользователя. Небольшой размер бинов для большого набора данных менее предпочтителен, однако мы можем легко использовать его с большим набором данных.
R
#creating a sample vector of values
vec <-
sample
(11:50,20)
#creating a data frame
data_frame <-
data.frame
(col1 = vec)
(
"Original Data"
)
(data_frame)
#creating intervals between 10 to 50 with a gap of 10 each
interval_table <-
table
(
cut
(data_frame$col1,
seq
(10,50,10)))
(
"Data in Intervals"
)
(interval_table)
Выход:
Получите частоту на основе интервалов в R на векторных данных
Функции также можно использовать для генерации вектора целых чисел или строковых значений. Метод rpois() в R используется для рисования случайно вычисленной плотности Пуассона. Метод rpois имеет следующий синтаксис:
Syntax: rpois(num-of-observations, rate=rate )
Arguments:
- num-of-observations – Number of observations
- rate – The rate of events for the distribution
Однако, поскольку значения рисуются случайным образом, используя только количество наблюдений, вместо того, чтобы вручную выбирать ячейки, мы можем извлечь минимальное и максимальное значения возвращаемых значений в векторе плотности, используя встроенные функции min() и max(). методы.
Затем между этими интервалами может быть сгенерирована последовательность для получения точных результатов. Затем с помощью метода table() в R рисуется таблица частот.
R
#using a func to generate values
vec <-
rpois
(10,30)
#creating a data frame
data_frame <-
data.frame
(col1 = vec)
(
"Original Data"
)
(data_frame)
#getting the min and max intervals in the vec
min<-
min
(vec)
max <-
max
(vec)
#creating intervals between 10 to 50 with a gap of 10 each
interval_table <-
table
(
cut
(data_frame$col1,
seq
(min,max,2)))
(
"Data in Intervals"
)
(interval_table)
Выход: