Los datos cuantitativos, también conocidos como continuos, son datos con los que se puede hacer operaciones matemáticas.
Los cálculos en esta unidad se basaran en el set de datos faithful. Esta es una colección de observaciones de las erupciones y los periodos de descanso del Old
Faithful el geyser más grande del Yellowstone National Park.
Comandos para cargar los datos
-
head(faithful)
#Visualizamos los datos
-
duracion
= faithful$eruptions #Creamos el vector duracion
-
range(duracion) #Veamos el rango de la duracion
La frecuencia de distribución es el resumen de la ocurrencia de una variable en un grupo de categorías
que no se sobre-posicionen.
-
breaks = seq(1.5, 5.5, by=0.5)
#Hacemos una secuencia de 0.5
-
breaks
# Visualizamos
-
duracion.cut = cut(duracion, breaks, right=FALSE) #Creamos un set de datos agrupados
-
duracion.freq = table(duracion.cut) #Visualizamos el agrupamiento
-
cbind(duracion.freq)
# Ahora en forma vertical
Encuentre la frecuencia de
distribución de la variable waiting en el set de datos faithful.
La frecuencia relativa es el resumen de la ocurrencia de una variable en un grupo de categorías que no se
sobre-posicionen, en relación al tamaño de la muestra. FR=Frecuencia/Tamaño de la muestra.
-
duracion.relfreq = duracion.freq / nrow(faithful)
-
old = options(digits=1) #Reduce el número de decimales
-
cbind(duracion.freq, duracion.relfreq) #Presenta datos de forma vertical
Encuentre la frecuencia relativa de la variable waiting en el set de datos faithful.
La frecuencia acumulada de una variable cuantitativa es un resumen de la
frecuencia de distribución debajo de un nivel dado.
-
duracion.cumfreq = cumsum(duracion.freq) #Calculamos la frecuencia acumulada
-
cbind(duracion.cumfreq)
# Ahora en forma vertical
Gráfico de la frecuencia acumulada
-
cumfreq0 = c(0, cumsum(duracion.freq))
-
plot(breaks, cumfreq0, main=" Erupciones del
Old Faithful", xlab="Duración (minutos)", ylab="Erupciones acumuladas")
-
lines(breaks, cumfreq0)
Encuentre la frecuencia acumulada de la
variable waiting en el set de datos faithful.
La frecuencia relativa acumulada de una variable cuantitativa
es un resumen de la frecuencia relativa debajo de un nivel dado.
-
duracion.cumrelfreq = duracion.cumfreq / nrow(faithful)
-
cbind(duracion.cumfreq, duracion.cumrelfreq)
La Tabla de frecuencias muestra la frecuencia, la
frecuencia relativa, la frecuencia acumulada y la frecuencia relativa acumulada de una
variable cuantitativa.
-
cbind (duracion.freq, duracion.relfreq,duracion.cumfreq, duracion.cumrelfreq)
Histograma
-
hist (duracion,right=FALSE) # Usamos
la función hist
-
colors = c("red", "yellow", "green", "violet", "orange","blue", "pink", "cyan")
-
hist (duracion,right=FALSE,col=colors, main="
Erupciones Old Faithful", xlab="Duración en minutos")
Diagramas
Es un gráfico de
texto que clasifica datos de acuerdo con sus dígitos más significativos.
-
stem(duracion) #
Hacemos un diagrama simple
-
pie (duracion.freq) #Hacemos un diagrama de pastel
Diagrama de dispersión
-
espera = faithful$waiting # Creamos la variable espera
-
plot (duracion, espera, xlab="Duración de las
erupuciones (min)", ylab="Tiempo de espera
(min)") #Hacemos el gráfico
-
abline (lm(espera~ duracion)) # Añadimos
la línea de regresión