El Old Faithful, geyser localizado en el parque de Yellowstone, Wyoming ,EEUU.
El Old Faithful, geyser localizado en el parque de Yellowstone, Wyoming ,EEUU.

Los datos cuantitativos, también conocidos como continuos, son datos con los que se puede hacer operaciones matemáticas.

Los cálculos en esta unidad se basaran en el set de datos faithful. Esta es una colección de observaciones de las erupciones y los periodos de descanso del Old Faithful el geyser más grande del  Yellowstone National Park. 

Comandos para cargar los datos

  • head(faithful)                   #Visualizamos los datos 
  • duracion = faithful$eruptions   #Creamos el vector duracion
  • range(duracion)                  #Veamos el rango de la duracion

La frecuencia de distribución es el resumen de la ocurrencia de una variable en un grupo de categorías que no se sobre-posicionen.

  • breaks = seq(1.5, 5.5, by=0.5)          #Hacemos una secuencia de 0.5 
  • breaks                                                  # Visualizamos
  • duracion.cut = cut(duracion, breaks, right=FALSE) #Creamos un set de datos agrupados
  • duracion.freq = table(duracion.cut)    #Visualizamos el agrupamiento
  • cbind(duracion.freq)                             # Ahora en forma vertical

                       Encuentre la frecuencia de distribución de la variable waiting en el set de datos faithful.

 

La frecuencia relativa es el resumen de la ocurrencia de una variable en un grupo de categorías que no se sobre-posicionen, en relación al tamaño de la muestra. FR=Frecuencia/Tamaño de la muestra.

  • duracion.relfreq = duracion.freq / nrow(faithful)
  • old = options(digits=1)     #Reduce el número de decimales  
  • cbind(duracion.freq, duracion.relfreq)     #Presenta datos de forma vertical 

                                   Encuentre la  frecuencia relativa de la variable waiting en el set de datos faithful.

 

La frecuencia acumulada de una variable cuantitativa es un resumen de la frecuencia de distribución debajo de un nivel dado.  

  • duracion.cumfreq = cumsum(duracion.freq)  #Calculamos la frecuencia acumulada
  • cbind(duracion.cumfreq)        # Ahora en forma vertical

     Gráfico de la frecuencia acumulada

  • cumfreq0 = c(0, cumsum(duracion.freq)) 
  • plot(breaks, cumfreq0,  main=" Erupciones  del Old Faithful", xlab="Duración (minutos)", ylab="Erupciones acumuladas")  
  •  lines(breaks, cumfreq0)          

     Encuentre la frecuencia acumulada de la variable waiting en el set de datos faithful.

 

La frecuencia relativa acumulada de una variable cuantitativa es un resumen de la frecuencia relativa debajo de un nivel dado.  

  • duracion.cumrelfreq = duracion.cumfreq / nrow(faithful)
  • cbind(duracion.cumfreq, duracion.cumrelfreq) 

La Tabla de frecuencias muestra la frecuencia, la frecuencia relativa, la frecuencia acumulada y la frecuencia relativa acumulada de una variable cuantitativa. 

  • cbind (duracion.freq, duracion.relfreq,duracion.cumfreq, duracion.cumrelfreq) 

Histograma

  • hist (duracion,right=FALSE)    # Usamos la función hist
  • colors = c("red", "yellow", "green", "violet", "orange","blue", "pink", "cyan")
  •  hist (duracion,right=FALSE,col=colors, main=" Erupciones Old Faithful", xlab="Duración en minutos") 

Diagramas

 Es un gráfico de texto que clasifica datos de acuerdo con sus dígitos más significativos.

  • stem(duracion)   # Hacemos un diagrama simple
  • pie (duracion.freq)  #Hacemos un diagrama de pastel

Diagrama de dispersión 

  • espera = faithful$waiting      # Creamos la variable espera
  • plot (duracion, espera, xlab="Duración de las erupuciones (min)",  ylab="Tiempo de espera (min)")    #Hacemos el gráfico
  • abline (lm(espera~ duracion))     # Añadimos la línea de regresión