Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
APLICADA AL
LABORATORIO
TALLER DE
Estadística Descriptiva
Ing. Andrés Mauricio Castillo
Contenido
• Generalidades de estadística descriptiva
• Variables
• Medidas de posición
• Medidas de dispersión
• Medidas de forma
• Covarianza
• Coeficiente de correlación
Los ejemplos de este taller
• Se van a desarrollar ejemplos de este taller en lenguaje R
Su objetivo es organizar y describir las Sirve para modelar patrones en los datos
características sobre un conjunto y extraer inferencias acerca de la
de datos con el propósito de facilitar población bajo estudio. Su objetivo es
su aplicación, generalmente con el obtener conclusiones útiles para lograr
apoyo de gráficas, tablas o medidas hacer deducciones acerca de la
numéricas. totalidad de todas las observaciones
hechas, basándose en la información
numérica.
Generalidades de la estadística
descriptiva
Estadística Descriptiva
Una distribución de probabilidad es una función que describe la relación entre el resultado de un evento
y su frecuencia de ocurrencia. Existen varias distribuciones, aquí las mas comunes:
Contenido
• Generalidades de estadística descriptiva
• Variables
• Medidas de posición
• Medidas de dispersión
• Medidas de forma
• Covarianza
• Coeficiente de correlación
Variables - cualitativa
Las variables estadísticas, se pueden clasificar en:
Ejemplos:
Ejemplo en R:
y <- factor(c("Y", "Y", "N", "N", "Y", "N", "Y", "Y", "Y", "N"))
y
plot(y)
Discretos
Número de muestras (0, 1, 2,…).
Continuos
Temperatura de la disolución (19.5 ; 22.2 ; 21.4 ;…). Continua.
Variables - cuantitativa
Ejemplo cuantitativa:
datos=unlist(datos)
desvest=sd(datos)
promedio=mean(datos)
promedio
hist(datos, freq= F, breaks=9, col="lightblue",border="red")
curve(dnorm(x,promedio,desvest),add=T,col="orange" )
Medidas de posición
Para comenzar a describir este conjunto de datos existen las medidas de
posición que nos indican que tan uniforme es su distribución, entre las
principales medidas de posición se tienen:
• Media
• Mediana
• Moda
• Cuantiles
Medidas de posición
Media aritmética, promedio, o media. Es la
Media sumatoria del conjunto de valores divididos
por la cantidad n de valores.
promedio=mean(datos)
[1] 5.040915
Medidas de posición
La moda estadística de un conjunto de datos, es el número que
Moda presenta una mayor frecuencia absoluta dentro de la muestra. El
dato que mas se repite.
Primero se tienen que redondear los datos porque el algoritmo para hallar la moda buscara el mas común.
Dependiendo la cantidad se debe cambiar el numero de “digits”. En el ejemplo se usaron 2 dígitos.
datosT=round(datos,digits=2)
datosT
moda=mfv(datosT)
moda
Medidas de posición
La mediana ubica el centro de una
Mediana distribución de datos. 50% quedan a la
izquierda y 50% quedan a la derecha
mediana=median(datos)
mediana
[1] 5.017061
• Mediana
• Moda
• Promedio
Medidas de posición
Los cuantiles son puntos de probabilidad tomados a
• Cuantiles
intervalos regulares en una distribución.
• Rango
• Varianza
• Desviación estándar
• Coeficiente de variación
Medidas de dispersión
• Rango Esta medida indica los limites del conjunto de datos:
Varianza=var(datos)
Varianza
[1] 0.04761985
Medidas de dispersión
• Desviación La desviación estándar esta estrechamente relacionada con
estándar la varianza. También es una medida de dispersión o
variabilidad. Es la raíz de la varianza
DesviacionS1=sqrt(Varianza)
DesviacionS1
[1] 0.2182197
DesviacionS2=sd(datos)
DesviacionS2
[1] 0.2182197
Medidas de dispersión
• Desviación Dependiendo la distribución con la desviación estándar se
estándar puede saber la cantidad de datos que se tienen en
determinado intervalo.
DesviacionS1=sqrt(Varianza)
DesviacionS1 1 DS ~68%
[1] 0.2182197
DesviacionS2=sd(datos)
DesviacionS2
[1] 0.2182197
Medidas de dispersión
• Desviación Dependiendo la distribución con la desviación estándar se
estándar puede saber la cantidad de datos que se tienen en
determinado intervalo.
DesviacionS1=sqrt(Varianza)
DesviacionS1
[1] 0.2182197
DesviacionS2=sd(datos)
2 DS ~95%
DesviacionS2
[1] 0.2182197
Medidas de dispersión
• Coeficiente Se utiliza para relacionar conjuntos de datos
de variación pertenecientes a poblaciones distintas. Si se observa
la formula, este tiene en cuenta el valor de la media y
la desviación estándar.
Medidas de dispersión
• Coeficiente Se utiliza para relacionar conjuntos de datos
de variación pertenecientes a poblaciones distintas. Si se observa
la formula, este tiene en cuenta el valor de la media y
la desviación estándar.
CoefV=DesviacionS1/abs(promedio)
CoefV
[1] 0.04326904
Contenido
• Generalidades de estadística descriptiva
• Variables
• Medidas de posición
• Medidas de dispersión
• Medidas de forma
• Covarianza
• Coeficiente de correlación
Medidas de forma
• Simetría Este grupo de estadísticos que resulta importante para el análisis
• Curtosis estadístico de datos y variables. Este grupo describe la forma
general que asume la distribución de una variable.
• Normalidad
Medidas de forma
• Simetría La simetría, indica si una distribución gira entorno a un centro, o si
posee asimetría.
Skewness=skew(DistrAsimetrica)
Skewness
[1] -0.9772349
Skewness=skew(DistrAsimetricaD)
Skewness
[1] 0.9772349
Kplana=kurtosi(DistrPlana) Kpunta=kurtosi(DistrPunta)
Kplana Kpunta
[1] 0.06566281 [1] 3.483026
Al evaluar la curtosis
en las distribuciones
de ejemplo se
observa la diferencia
entre la plana y la
apuntada.
Medidas de forma
• Normalidad Para evaluar la normalidad se tiene la prueba de Shapiro-Wilk
El test de Shapiro-Wilks plantea la hipótesis nula que una muestra proviene de una
distribución normal, a su vez se tiene una hipótesis alternativa que sostiene que la
distribución no es normal. Se toma también un nivel de significancia, por ejemplo 0.05,
Si Cov ~ 0 se interpreta como la no existencia de una relación lineal entre las dos variables.
x=c(1,2,3,4,5,6,7)
y=c(1,0.8,0.6,0.4,0.2,0,-0.2)
CeC=cor(x,y)
CeC
plot(x,y, type = "o", main="Correlacion
negativa -1")
[1] -1
Coeficiente de correlación
• Ejemplos:
x=c(1,2,3,4,5,6,7)
y=c(2,4,6,8,10,12,14)
CeC=cor(x,y)
CeC
plot(x,y, type = "o", main="Correlacion
positiva 1")
[1] 1
Coeficiente de correlación
• Ejemplos:
x=c(1,2,3,4,5,6,7)
y=c(3,4,5,2,4,7,3)
CeC=cor(x,y)
CeC
plot(x,y, type = "o", main= "Correlacion
debil, 0.23")
[1] 0.2362278
TALLER VIRTUAL
ESTADÍSTICA
APLICADA AL
LABORTORIO
GRACIAS