Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA INFERENCIAL I
Ingeniería Industrial
1
ÍNDICE
Página
Bibliografía…………………………………………………………………………………… 31
2
4.1.- Utilidad e importancia de la bondad de ajuste en la ingeniería
La bondad de ajuste de un modelo estadístico describe lo bien que se ajusta un
conjunto de observaciones. Las medidas de bondad en general, resumen la
discrepancia entre los valores observados y los k valores esperados en el modelo de
estudio.
Las pruebas de bondad de ajuste son pruebas de hipótesis para verificar si los datos
observados en una muestra aleatoria se ajustan con algún nivel de significancia a
determinada distribución de probabilidad (uniforme, exponencial, normal, poisson, u
otra cualquiera).
3
4.1.1.- La utilidad, importancia y en cuales distribuciones de probabilidad se
utiliza las pruebas de independencia y tablas de contingencia en la ingeniería
Pruebas de independencia
4
Una prueba de independencia usa la pregunta de si la ocurrencia del evento X es
independiente a la ocurrencia del evento Y, por lo que el planteamiento de las hipótesis
para esta prueba de independencia es;
Una tabla que clasifica datos de acuerdo a dos o más categorías, relacionados con
cada una de las variables cualitativas, que pueden ser o no estadísticamente
independientes, se llama tabla de contingencias. Dicha tabla muestra todas las posibles
combinaciones de categorías, o contingencias, que explican su nombre.
A la suma de todas las razones que se puedan construir al tomar la diferencia entre
cada frecuencia observada y esperada, en una tabla de contingencia, elevándola al
cuadrado, y luego dividiendo esta desviación cuadrada entre la frecuencia esperada, se
le llama estadístico ji cuadrada.
5
𝐻0 : Independencia
𝐻1 : Dependencia
6. Construir las áreas de aceptación y rechazo.
7. Calcular ji-Cuadrada 𝑋 2
8. Tomar una decisión y emitir una conclusión en términos del problema.
Distribución binomial
Distribución de poisson
Distribuciones de probabilidad de variables aleatorias
Distribución hipergeometrica
Aplicación a ji cuadrada.
Aplicación a t- student
Tablas de contingencia
Una tabla de contingencia es una de las formas más comunes de resumir datos
categóricos. En general, el interés se centra en estudiar si existe alguna asociación
entre una variable denominada fila y otra variable denominada columna y se calcula la
intensidad de dicha asociación.
6
del segundo método de clasificación. En general, los datos aparecerán como se
muestra en la siguiente tabla. Una tabla de este tipo usualmente se conoce como tabla
de contingencia r x c.
El interés recae en probar la hipótesis de que los dos métodos de clasificación renglón-
columna son independientes. Si se rechaza esta hipótesis, entonces se concluye que
existe alguna interacción entre los dos criterios de clasificación. Los procedimientos de
prueba exactos son difíciles de obtener, pero puede obtenerse un estadístico de prueba
aproximado válido para n grande.
7
Por lo tanto, la frecuencia esperada de la celda es:
8
3. Calcular la Frecuencia Esperada.
9
6. Construcción de las áreas de aceptación y rechazo.
7. Calculando ji-cuadrada.
Existen varios procedimientos para probar la bondad de ajuste de una distribución a los
datos observados en una muestra, uno de ellos es la prueba Ji-cuadrada, que se basa
en el estadístico de prueba:
10
El cual tiene distribución Ji-cuadrada con k-r-1 grados de libertad. Si las diferencias 𝑜¡ −
𝑒¡ son pequeñas, el valor del estadístico es pequeño, por el contrario si esas
diferencias son grandes (lo observado no se ajusta a lo propuesto), el valor del
estadístico es grande, por lo tanto, la región de rechazo de la hipótesis nula se ubica en
la cola superior de la distribución Ji-cuadrada al nivel de significancia 𝛼.
11
La utilidad e importancia de la prueba de bondad de ajuste con ji cuadrada
“La prueba ji cuadrada nos permite formular una pregunta para probar si existe una
diferencia significativa entre una distribución observada y de frecuencia y una
distribución teórica de frecuencias”.
12
7. Calcular ji-cuadrada
Distribución normal
Distribución chi-cuadrada
Distribución de probabilidad uniforme
Distribución Binomial
Distribución de variable aleatoria
Distribución de Poisson
Las pruebas no paramétricas que son pruebas cuya hipótesis no corresponde a una
afirmación sobre un parámetro, y las pruebas de libre distribución donde su aplicación
no depende de la distribución de la variable de interés en la población de estudio.
Las pruebas no paramétricas tienen algunas limitaciones, entre ellas se encuentra que
no son lo suficientemente fuertes cuando se cumple una hipótesis normal. Esto puede
provocar que no sea rechazada aunque sea falsa. Otra de sus limitaciones es que
13
necesitan que la hipótesis se cambie cuando la prueba no corresponde a la pregunta
del procedimiento si la muestra no es proporcional.
Ventajas Desventajas
Las declaraciones de probabilidad Fundamentalmente cuando las muestras
obtenidas de la mayoría de estas pruebas son muy grandes estas pruebas tienen
son probabilidades exactas, una eficiencia relativamente baja con
independientemente de la forma de la relación a las paramétricas, cuando se
distribución de la que se tomó la muestra. cumplen los supuestos.
Si los tamaños de las muestras son tan Su aplicación en muestras grandes se
pequeños como n=6, se debe realizar una hace muy laboriosa.
prueba estadística no paramétrica, a
menos que se conozca exactamente la
naturaleza de la distribución.
Son útiles para los datos clasificatorios, No hay métodos no paramétricos para
medidos en una escala nominal. Ninguna probar las interacciones dentro del
técnica paramétrica se puede aplicar a modelo de análisis de varianza, a menos
tales datos. que se hagan suposiciones especiales
14
acerca de la adaptabilidad.
Las pruebas estadísticas no paramétricas Las hipótesis que se plantean en éstas
son típicamente mucho más fáciles de pruebas son menos precisas, lo que hace
aplicar que las pruebas paramétricas. que la interpretación de los resultados sea
más ambigua.
Tienen mayor eficiencia que los métodos Si los supuestos del modelo estadístico
paramétricos en distribuciones paramétrico se cumplen, las pruebas no
asimétricas, o sea cuando hay valores paramétricas disipan los datos.
atípicos o datos aberrantes.
Tienen validez en el sentido de que su Estos métodos son preferencialmente
nivel de confiabilidad es realmente el orientados hacia las Pruebas de Hipótesis
especificado en la mayoría de las que a la Estimación. Suele ser posible
pruebas. obtener estimaciones no paramétricas y
sus intervalos de confianza asociados,
pero generalmente no es sencillo.
Estas pruebas son mucho menos Para un problema particular pueden existir
exigentes que las paramétricas, y se varias pruebas, por lo que en ocasiones
consideran de distribución libre, en cuanto es difícil seleccionar la mejor.
que no plantean suposiciones con
relación a la distribución de las
puntuaciones en la población.
Algunos de los procesos sólo requieren Puede ser limitado el software para este
los rangos de las observaciones y no de tipo de métodos, así como su
sus magnitudes, mientras que los procedencia. Además, la manera en que
procesos paramétricos las necesitan el software le da tratamiento a los valores
forzosamente. ajustados o cómo es que se obtiene
adecuadamente el valor p puede ser no
tan evidente
15
4.2.1.- Definición de escala de medición y un resumen de las diferentes escalas
de medición y dos ejemplos de cada una y su utilidad en la ingeniería
Una escala de medición es el conjunto de los posibles valores que una cierta variable
puede tomar. Es un continuo de valores ordenados correlativamente, que admite un
punto inicial y otro final. El nivel en que una variable puede ser medida determina las
propiedades de medición de una variable, el tipo de operaciones matemáticas que
puede usarse apropiadamente con dicho nivel, las fórmulas y procedimientos
estadísticos que se utilizan para el análisis de datos y la prueba de hipótesis teóricas.
Las escalas o niveles de medición se utilizan para medir variables o atributos. Por lo
general, se distinguen cuatro escalas o niveles de medición: nominal, ordinal, intervalos
y escalas de proporción, cociente o razón. Las dos primeras (nominal y ordinal) se
conocen como escalas categóricas, y las dos últimas (intervalo y razón) como escalas
numéricas. Las escalas categóricas se usan comúnmente para variables cualitativas,
mientras que las numéricas son adecuadas para la medición de variables cuantitativas.
Son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las
escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las
características de las variables.
Tipos de escalas:
Escala nominal
Ejemplos
16
Escala ordinal
Una escala de medición ordinal se logra cuando las observaciones pueden colocarse
en un orden relativo con respecto a la característica que se evalúa, es decir, las
categorías de datos están clasificadas u ordenadas de acuerdo con la característica
especial que poseen. Aquí, las etiquetas o símbolos de las categorías sí indican
jerarquía.
Ejemplos:
Escala de intervalo
En una escala de intervalo, los datos tienen las propiedades de los datos ordinales,
pero a su vez la separación entre las variables tiene sentido. Este tipo de datos siempre
es numérico, y el valor cero no indica la ausencia de la propiedad.
17
Ejemplos
Escala de razón
En una escala de razón, los datos tienen todas las propiedades de los datos de
intervalo, y la proporción entre ellos tiene sentido. Para esto se requiere que el valor
cero de la escala indique la ausencia de la propiedad a medir.
Ejemplos
2. La evaluación del CI, sin embargo, no tiene la cualidad de proporción: si María tiene
un CI de 125 y Elvia tiene un CI de 100, no se puede decir que María es 25% más
inteligente que Elvia.
18
4.2.2.- Comparación de métodos estadísticos paramétricos y no paramétricos
Paramétricos No paramétricos
Es una rama de la estadística inferencial Es una rama de la estadística que estudia
que comprende los procedimientos las pruebas y modelos estadísticos cuya
estadísticos y de decisión que están distribución subyacente no se ajusta a los
basados en distribuciones conocidas. llamados criterios paramétricos. Su
Estas son determinadas usando un distribución no puede ser definida a priori,
número finito de parámetros. pues son los datos observados los que la
determinan.
La variable de estudio ha de ser Son más fáciles de aplicar y son
numérica. aplicables a los datos jerarquizados.
19
Comparación de aplicaciones estadísticas de estudios paramétricos versus
estudios no paramétricos
Paramétricos No paramétricos
Levene para igualdad de varianzas Kolmogorov-smirnov
T de igualdad de medias Wilcoxon de los signos
Anova de factor Rachas de Wald-Wolfowitz
Correlación Pearson Kruskal-Wallis
Prueba T de student para datos Prueba Binomial
relacionados (muestras dependientes)
Prueba T de student para datos no Anderson-Darling
relacionados (muestras dependientes)
Prueba del Valor Z de la Distribución Rachas
Normal
Prueba F (Análisis de Varianza a ANOVA Ji-cuadrada
para más de dos muestras
independientes)
Se trata de una prueba de bondad de ajuste, es decir, sirve para verificar si las
puntuaciones que hemos obtenido de la muestra siguen o no una distribución normal.
Es decir, permite medir el grado de concordancia existente entre la distribución de un
conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los
20
datos provienen de una población que tiene la distribución teórica especificada, es
decir, lo que hace es contrastar si las observaciones podrían razonablemente proceder
de la distribución especificada.
21
Coeficiente de correlación
Al igual que todos los contrastes de hipótesis que involucran estadísticos, es importante
contar con un gran volumen de datos para tener resultados estadísticamente
significativos. Es posible que rechacemos por error una hipótesis nula debido a que la
muestra es pequeña.
Hipótesis
El primer paso será comprobar si ambas muestras tienen la misma distribución. Para
ello realizamos un contraste de hipótesis suponiendo que ambas muestras tienen la
misma distribución contra la hipótesis alternativa de que son distintas.
Contraste de hipótesis
Estadístico
22
Estadístico de K -S.
Dónde:
Valor crítico
Para muestras grandes existe la aproximación al valor crítico para K-S que depende del
nivel de significación (%):
23
Regla de rechazo
Regla de rechazo K – S
Estadístico de prueba
Sea S(x) la función de distribución muestral; esto es, S(x) es la función de probabilidad
acumulada calculada a partir de los datos muéstrales.
Específicamente,
24
Aplicación
Distribución normal
Distribución binomial
𝐴2 = −𝑁 − 𝑆
Donde
25
está probando, en cuyo caso la prueba y su conjunto de valores críticos siguen una
distribución libre. Sin embargo, la prueba se utiliza con mayor frecuencia en contextos
en los que se está probando una familia de distribuciones, en cuyo caso deben ser
estimados los parámetros de esa familia y debe tenerse estos en cuenta a la #ora de
ajustar la prueba estadística y sus valores críticos.
Esta prueba es una versión mejorada de la prueba K-S, ya que detecta mejor las
diferencias entre las distribuciones acumuladas empírica y teórica en las colas de las
gráficas. Se recomienda usar solamente para distribuciones continuas.
26
Los pasos de la prueba son:
Distribución empírica
Distribución bilateral
Distribución unilateral
27
4.2.5.- La utilidad, importancia y en cuales distribuciones de probabilidad se
utiliza la prueba de Ryan-Joiner en la ingeniería
Esta prueba evalúa la normalidad calculando la correlación entre sus datos y las
puntuaciones normales de sus datos. Si el coeficiente de correlación se encuentra
cerca de 1, es probable que la población sea normal. La estadística de Ryan-Joiner
evalúa la solidez de esta correlación; si se encuentra por debajo del valor crítico
apropiado, se rechazara la hipótesis nula de normalidad en la población.
Fórmula
Notación
Yi observaciones ordenadas
s2 varianza de la muestra
Aplicaciones
Distribución normal
28
4.2.6.- La utilidad, importancia y en cuales distribuciones de probabilidad se
utiliza la prueba de Shappiro-Wilk
Donde
Siendo 𝑚1 ,..., 𝑚𝑛 son los valores medios del estadístico ordenado, de variables
aleatorias independientes e identicamente distribuidas, muestreadas de distribuciones
normales. V es la matriz de covarianzas de ese estadístico de orden.
Interpretación
29
Siendo la hipótesis nula que la población está distribuida normalmente, si el p-valor es
menor a alfa (nivel de significancia) entonces la hipótesis nula es rechazada (se
concluye que los datos no vienen de una distribución normal). Si el p-valor es mayor a
alfa, se concluye que no se puede rechazar dicha hipótesis.
Distribución normal
30
Bibliografía
https://es.slideshare.net/carlosbehe/pruebas-de-bondad-de-ajuste
http://dcb.fi-c.unam.mx/profesores/irene/Notas/PruebaBondad.pdf
http://www.upvm.edu.mx/Licenciaturas/Industrial/Plan/Cuatrimestre4/Estadistica_industr
ial.pdf
http://asesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica/CARPETA%203%
20INFERENCIA_ESTADISTICA/DOC_%20INFERENCIA/TEMA%204/08%20PRUEBA
%20DE%20CHICUADRADA.pdf
http://www.samiuc.es/estadisticas-variables-binarias/valoracion-inicial-pruebas-
diagnosticas/chi-cuadrado/
http://virtual.usalesiana.edu.bo/web/conte/archivos/1856.pdf
http://www.chihuahua.tecnm.mx/academic/industrial/estadistica1/cap04b.html#cuatro_b
ondad
http://www.chihuahua.tecnm.mx/academic/industrial/estadistica1/cap04c.html#cuatro_ta
blas_contingencia
https://es.slideshare.net/carlosbehe/pruebas-de-bondad-de-ajuste
http://dcb.fi-c.unam.mx/profesores/irene/Notas/PruebaBondad.pdf
http://virtual.usalesiana.edu.bo/web/conte/archivos/1856.pdf
https://www.alceingenieria.net/bioestadistica/noparame.pdf
https://www.questionpro.com/blog/es/pruebas-no-parametricas/
http://ri.uaemex.mx/bitstream/handle/20.500.11799/94447/TIPO%20DE%20CAMBIO%
20NOMINAL%20Y%20REAL%20DE%20M%C3%89XICO%20UNA%20MODELACI%C
3%93N%20A%20PARTIR%20DE%20LA%20DISTRIBUCI%C3%93N%20DE%20VALO
RES%20EXTREMOS%20GENERALIZADA.pdf?sequence=1&isAllowed=y
31
https://es.slideshare.net/ClaribelParababire/escala-de-medicin-79294687
file:///C:/Users/52656/Downloads/Dialnet-EscalasDeMedicion-4942056.pdf
https://mauricioanderson.com/escalas-de-medicion-
estadistica/#:~:text=Escalas%20de%20medici%C3%B3n%20en%20estad%C3%ADstic
a,-
Como%20hemos%20dicho&text=Dichas%20escalas%20tendr%C3%A1n%20diferentes
%20propiedades,de%20intervalo%20y%20de%20raz%C3%B3n.
https://es.slideshare.net/ricardooberto/cuadro-comparativo-estadstica-paramtrica-y-no-
paramtrica#:~:text=Es%20una%20rama%20de%20la%20estad%C3%ADstica%20que
%20estudia%20las%20pruebas,observados%20los%20que%20la%20determinan.
https://www.actaodontologica.com/ediciones/2016/1/art-6/
https://psicologiaymente.com/miscelanea/prueba-kolmogorov-smirnov
https://economipedia.com/definiciones/prueba-de-kolmogorov-smirnoff-k-s.html
http://ri.uaemex.mx/bitstream/handle/20.500.11799/94447/TIPO%20DE%20CAMBIO%
20NOMINAL%20Y%20REAL%20DE%20M%C3%89XICO%20UNA%20MODELACI%C
3%93N%20A%20PARTIR%20DE%20LA%20DISTRIBUCI%C3%93N%20DE%20VALO
RES%20EXTREMOS%20GENERALIZADA.pdf?sequence=1&isAllowed=y
https://imt.mx/archivos/Publicaciones/PublicacionTecnica/pt545.pdf
https://www.academia.edu/22371161/Pruebas_no_parametricas
https://support.minitab.com/es-mx/minitab/19/help-and-how-to/statistics/basic-
statistics/how-to/normality-test/methods-and-formulas/methods-and-formulas/#ryan-
joiner
32