Está en la página 1de 32

INSTITUTO TECNOLÓGICO DE CIUDAD JUÁREZ

TECNOLÓGICO NACIONAL DE MÉXICO

ESTADÍSTICA INFERENCIAL I

Elemento de competencia IV: Pruebas de bondad de ajuste y pruebas


no paramétricas

Anahi Briones Dominguez

Número de control: 19111218

Grupo A (7:00 – 8:00)

Maestro: Ing. José García Sánchez

Ingeniería Industrial

Ciudad Juárez, Chihuahua México. 24 de noviembre del 2020

1
ÍNDICE

Página

4.1.- Utilidad e importancia de la bondad de ajuste en la ingeniería…………………….. 3

4.1.1.- La utilidad, importancia y en cuales distribuciones de probabilidad se


utiliza las pruebas de independencia y tablas de contingencia en la ingeniería…4

4.1.2.- La utilidad, importancia y en cuales distribuciones de probabilidad se


utiliza la prueba de bondad de ajuste con ji cuadrada en la ingeniería………… 10

4.2.- La utilidad e importancia de las pruebas no paramétricas en la ingeniería……… 13

 Ventajas y desventajas de las Pruebas de Bondad de ajuste no Paramétricas..14

4.2.1.- Definición de escala de medición y un resumen de las diferentes escalas de


medición y dos ejemplos de cada una y su utilidad en la ingeniería………………...16

4.2.2.- Comparación de métodos estadísticos paramétricos y no paramétricos…. 19

 Comparación de aplicaciones estadísticas de estudios paramétricos versus


estudios no paramétricos……………………………………………………………. 20

4.2.3.- La utilidad, importancia y en cuales distribuciones de probabilidad se utiliza


la prueba de Kolmogorov-smirnov en la ingeniería…………………………………... 20

4.2.4.- La utilidad, importancia y en cuales distribuciones de probabilidad se utiliza


la prueba de Anderson-Darling en la ingeniería……………………………………… 25

4.2.5.- La utilidad, importancia y en cuales distribuciones de probabilidad se utiliza la


prueba de Ryan-Joiner en la ingeniería……………………………………………….. 28

4.2.6.- La utilidad, importancia y en cuales distribuciones de probabilidad se utiliza la


prueba de Shappiro-Wilk………………………………………………………………… 29

Bibliografía…………………………………………………………………………………… 31

2
4.1.- Utilidad e importancia de la bondad de ajuste en la ingeniería
La bondad de ajuste de un modelo estadístico describe lo bien que se ajusta un
conjunto de observaciones. Las medidas de bondad en general, resumen la
discrepancia entre los valores observados y los k valores esperados en el modelo de
estudio.

Las pruebas de bondad de ajuste son pruebas de hipótesis para verificar si los datos
observados en una muestra aleatoria se ajustan con algún nivel de significancia a
determinada distribución de probabilidad (uniforme, exponencial, normal, poisson, u
otra cualquiera).

En los últimos años la importancia de la bondad de ajuste en la ingeniería, ha ido en


aumento ya que se encarga de hacer comparaciones de rendimiento y producción
generados y asociados a la ingeniería. Y su uso y utilidad es de mucha importancia ya
que de ella se puede basar para tomar decisiones de cambio o aceptación en los
procesos industriales y de manufactura, es tanta la relación que se puede relacionar
con el uso de los materiales también.

Por ende la estadística aplicada a la Ingeniería Industrial es una herramienta básica en


negocios y producción. Utilizada para entender la variabilidad de sistemas de medición,
control de procesos (como control estadístico de procesos (CEP), para compilar datos,
y para tomar decisiones. Es una herramienta clave y probablemente la única.

3
4.1.1.- La utilidad, importancia y en cuales distribuciones de probabilidad se
utiliza las pruebas de independencia y tablas de contingencia en la ingeniería

Utilidad e importancia de las pruebas de independencia

La Prueba de Independencia, es una prueba estadística de proporciones de


frecuencias; que se utiliza para determinar si la pertenencia de una variable a
categorías, es diferente como función de la pertenencia a la categoría de una segunda
variable. En muchas ocasiones, las gerencias necesitan saber si las diferencias que
observan entre varias proporciones de muestra son significativas o solamente son
resultado del azar.

Su utilidad es precisamente evaluar la independencia entre dos variables nominales u


ordinales, dando un método para verificar si las frecuencias observadas en cada
categoría son compatibles con la independencia entre ambas variables. Para evaluarla
se calculan los valores que indicarían la independencia absoluta, lo que se denomina
frecuencias esperadas, comparándolos con las frecuencias de la muestra. Como
habitualmente, 𝐻0 indica que ambas variables con independientes, mientras que 𝐻1
indica que las variables tienen algún grado de asociación.

Pruebas de independencia

La prueba de independencia Chi-cuadrado, nos permite determinar si existe una


relación entre dos variables categóricas. Es necesario resaltar que esta prueba nos
indica si existe o no una relación entre las variables, pero no indica el grado o el tipo de
relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la
variable que causa la influencia.

“Dos eventos aleatorios, A y B, son eventos independientes, si la probabilidad de un


evento no está afectada por la ocurrencia del otro evento; por lo tanto p(A) = p(A/ B).”

“Dos eventos aleatorios, A y B, son eventos dependientes si la probabilidad de un


evento está afectada por la ocurrencia del otro; por lo tanto, p(A) ≠ p(A/ B).”

4
Una prueba de independencia usa la pregunta de si la ocurrencia del evento X es
independiente a la ocurrencia del evento Y, por lo que el planteamiento de las hipótesis
para esta prueba de independencia es;

𝐻0 ; La ocurrencia del evento X es independiente del evento Y.

𝐻1 ; La ocurrencia del evento X no es independiente del evento Y.

En las pruebas de independencia se utiliza el formato de la tabla de contingencia, y por


esa razón a veces se le llama prueba de tabla de contingencia, o prueba con tabla de
contingencia.

Una tabla que clasifica datos de acuerdo a dos o más categorías, relacionados con
cada una de las variables cualitativas, que pueden ser o no estadísticamente
independientes, se llama tabla de contingencias. Dicha tabla muestra todas las posibles
combinaciones de categorías, o contingencias, que explican su nombre.

A la suma de todas las razones que se puedan construir al tomar la diferencia entre
cada frecuencia observada y esperada, en una tabla de contingencia, elevándola al
cuadrado, y luego dividiendo esta desviación cuadrada entre la frecuencia esperada, se
le llama estadístico ji cuadrada.

Procedimiento para elaborar una prueba de independencia

1. Obtener la frecuencia observada (F.O), proveniente de una encuesta, estudio o


experimento.
2. Resumir los datos obtenidos, es decir, la frecuencia observada, en un cuadro de
contingencia.
3. Calcular la frecuencia esperada (F.E), y se calcula con la siguiente formula:
(𝑇𝑜𝑡𝑎𝑙 𝑐𝑜𝑙𝑢𝑚𝑛𝑎)(𝑇𝑜𝑡𝑎𝑙 𝑟𝑒𝑛𝑔𝑙ó𝑛)
𝐹. 𝐸 =
𝐺𝑟𝑎𝑛 𝑡𝑜𝑡𝑎𝑙
4. Determinar el nivel de significancia (α), y los grados de libertad, con la siguiente
formula:
𝑔. 𝑙 = (# 𝑟𝑒𝑛𝑔𝑙𝑜𝑛𝑒𝑠) (# 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠)
5. Plantear las hipótesis.

5
𝐻0 : Independencia
𝐻1 : Dependencia
6. Construir las áreas de aceptación y rechazo.
7. Calcular ji-Cuadrada 𝑋 2
8. Tomar una decisión y emitir una conclusión en términos del problema.

Distribuciones de probabilidad en las que se utilizan las pruebas de


independencia

 Distribución binomial
 Distribución de poisson
 Distribuciones de probabilidad de variables aleatorias
 Distribución hipergeometrica
 Aplicación a ji cuadrada.
 Aplicación a t- student

Tablas de contingencia

Una tabla de contingencia es una de las formas más comunes de resumir datos
categóricos. En general, el interés se centra en estudiar si existe alguna asociación
entre una variable denominada fila y otra variable denominada columna y se calcula la
intensidad de dicha asociación.

De manera formal, se consideran X e Y dos variables categóricas con i y j categorías


respectivamente. Una observación puede venir clasificada en una de las posibles i x j
categorías que existen. Cuando las casillas de la tabla contienen las frecuencias
observadas.

Elaboración de una tabla de contingencia

En muchas ocasiones, los n elementos de una muestra tomada de una población


pueden clasificarse con dos criterios diferentes. Por tanto, es interesante saber si los
dos métodos de clasificación son estadísticamente independientes. Supóngase que el
primer método de clasificación tiene r niveles, y que el segundo tiene c niveles. O sea
𝑂𝑖𝑗 la frecuencia observada para el nivel i del primer método de clasificación y el nivel j

6
del segundo método de clasificación. En general, los datos aparecerán como se
muestra en la siguiente tabla. Una tabla de este tipo usualmente se conoce como tabla
de contingencia r x c.

El interés recae en probar la hipótesis de que los dos métodos de clasificación renglón-
columna son independientes. Si se rechaza esta hipótesis, entonces se concluye que
existe alguna interacción entre los dos criterios de clasificación. Los procedimientos de
prueba exactos son difíciles de obtener, pero puede obtenerse un estadístico de prueba
aproximado válido para n grande.

Sea 𝑝𝑖𝑗 la probabilidad de que un elemento seleccionado al azar caiga la


ij-ésima celda, dado que las dos clasificaciones son independientes. Entonces, 𝑝𝑖𝑗 =
𝑢𝑖 𝑣𝑗 , donde 𝑢𝑖 es la probabilidad de que un elemento seleccionado al azar pertenezca
al renglón de la clase i, y 𝑣𝑗 es la probabilidad de que un elemento seleccionado
pertenezca a la columna de la clase j. Ahora bien, si se supone independencia, los
estimadores de 𝑢𝑖 𝑦 𝑣𝑗 son:

7
Por lo tanto, la frecuencia esperada de la celda es:

Entonces, para n grande, el estadístico

Tiene una distribución aproximada ji-cuadrada con (r-1)(c-1) grados de libertad si la


hipótesis nula es verdadera. Por consiguiente, la hipótesis de independencia debe
rechazarse si el valor del estadístico de prueba 𝑋 2 calculado es mayor que 𝑋 2 crítico o
de tabla.

Ejemplo de pruebas de independencia y tablas de contingencia

Una agencia de publicidad desea saber si el género de los consumidores es


independiente de sus preferencias de cuatro marcas de café. La respuesta determinará
si se deben diseñar diferentes anuncios dirigidos a los hombres y otros diferentes para
las mujeres. Realice la prueba con un nivel de significancia del 5%

1. Los resultados obtenidos de la encuesta realizada a 139 personas fue:

2. Elaboración de la tabla de contingencia.

8
3. Calcular la Frecuencia Esperada.

4. Calcular los grados de libertad.

5. Plantear las hipótesis.

𝐻0 : 𝐿𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑎𝑓é 𝑞𝑢𝑒 𝑠𝑒 𝑐𝑜𝑛𝑠𝑢𝑚𝑒 𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒𝑙 𝑠𝑒𝑥𝑜 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎.

𝐻1 : 𝐿𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑎𝑓é 𝑞𝑢𝑒 𝑠𝑒 𝑐𝑜𝑛𝑠𝑢𝑚𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑒 𝑑𝑒𝑙 𝑠𝑒𝑥𝑜 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎.

9
6. Construcción de las áreas de aceptación y rechazo.

7. Calculando ji-cuadrada.

8. Tomar una decisión y concluir.

Con un nivel de confianza del 5% se encontró que la marca de café es


independiente del sexo de la persona. Por lo que se recomienda elaborar un sólo
tipo de anuncio.

4.1.2.- La utilidad, importancia y en cuales distribuciones de probabilidad se


utiliza la prueba de bondad de ajuste con ji cuadrada en la ingeniería

Existen varios procedimientos para probar la bondad de ajuste de una distribución a los
datos observados en una muestra, uno de ellos es la prueba Ji-cuadrada, que se basa
en el estadístico de prueba:

10
El cual tiene distribución Ji-cuadrada con k-r-1 grados de libertad. Si las diferencias 𝑜¡ −
𝑒¡ son pequeñas, el valor del estadístico es pequeño, por el contrario si esas
diferencias son grandes (lo observado no se ajusta a lo propuesto), el valor del
estadístico es grande, por lo tanto, la región de rechazo de la hipótesis nula se ubica en
la cola superior de la distribución Ji-cuadrada al nivel de significancia 𝛼.

Dónde: k = No. de clases.

r = no. de parámetros estimados en 𝑓0 (𝑥) para encontrar 𝑒¡

Recomendaciones para realizar la prueba

 El tamaño de la muestra deberá ser moderadamente grande, pues si la muestra


es muy pequeña no se podrá formar un número suficiente de clases y si la
muestra es muy grande la prueba conducirá al rechazo casi con seguridad. Se
sugiere que n sea aproximadamente igual a 5 veces el número de clases.
 Se recomienda clasificar la muestra en mínimo cinco clases y máximo diez.
 Hacer que toda frecuencia observada o esperada no sea menor que cinco, esto
puede lograrse combinando clases vecinas, pero para cada par de clases que se
combinan, el número de grados de libertad debe reducirse en uno (k es el
número de clases efectivas en la tabla de frecuencias).
 Si 𝑓0 (𝑥) es continúa:
1. Para la primera clase, calcular 𝑝1 considerando el intervalo desde −∞
hasta el límite superior de la clase.
2. Para la última clase, calcular 𝑝𝑘 considerando el intervalo desde el
límite inferior de la clase hasta +∞.

11
La utilidad e importancia de la prueba de bondad de ajuste con ji cuadrada

La prueba de ji cuadrada también se puede utilizar para decidir si una distribución de


probabilidad, como la binomial, la de poisson o la normal, es la distribución apropiada.

“La prueba ji cuadrada nos permite formular una pregunta para probar si existe una
diferencia significativa entre una distribución observada y de frecuencia y una
distribución teórica de frecuencias”.

De esta manera, estamos en condiciones de determinar la bondad y ajuste de una


distribución teórica; en otras palabras, podemos precisar hasta qué punto encaja en la
distribución de los datos que hemos observado. Así pues podemos determinar si
debemos creer que los datos observados constituyen una muestra extraída de la
supuesta distribución teórica.

Procedimiento para elaborar una prueba de bondad y ajuste

1. Obtener la frecuencia observada (F.O), proveniente de una encuesta, estudio o


experimento.
2. Determinar la frecuencia esperada (F.E),
3. Establecer el nivel de significancia
4. Determinar los grados de libertad. De la siguiente manera:
𝑔. 𝑙 = 𝐾 − 1
Donde k es el número de categorías
 La regla general para el cálculo de los grados de libertad en una prueba de
bondad y ajuste, consiste en primero “emplear la regla (K-1) y luego se resta un
grado adicional de libertad para cada parámetro de población que tenga que ser
estimado de los datos de la muestra.

5. Plantear las hipótesis

𝐻0 : Lo que se sostiene el supuesto valor del parámetro.

𝐻1 : Lo que contradice al supuesto valor del parámetro.

6. Construir las áreas de aceptación y rechazo.

12
7. Calcular ji-cuadrada

8. Tomar una decisión y emitir una conclusión, en términos del problema.

Distribuciones de probabilidad en las que se utiliza la prueba de bondad de


ajuste con ji cuadrada

 Distribución normal
 Distribución chi-cuadrada
 Distribución de probabilidad uniforme
 Distribución Binomial
 Distribución de variable aleatoria
 Distribución de Poisson

4.2.- La utilidad e importancia de las pruebas no paramétricas en la


ingeniería

Se denominan pruebas no paramétricas aquellas que no presuponen una distribución


de probabilidad para los datos, por ello se conocen también como de distribución libre.
En la mayor parte de ellas los resultados estadísticos se derivan únicamente a partir de
procedimientos de ordenación y recuento, por lo que su base lógica es de fácil
comprensión.

Las pruebas no paramétricas que son pruebas cuya hipótesis no corresponde a una
afirmación sobre un parámetro, y las pruebas de libre distribución donde su aplicación
no depende de la distribución de la variable de interés en la población de estudio.

Las pruebas no paramétricas tienen algunas limitaciones, entre ellas se encuentra que
no son lo suficientemente fuertes cuando se cumple una hipótesis normal. Esto puede
provocar que no sea rechazada aunque sea falsa. Otra de sus limitaciones es que

13
necesitan que la hipótesis se cambie cuando la prueba no corresponde a la pregunta
del procedimiento si la muestra no es proporcional.

En el ámbito de la ingeniería es habitual el uso de pruebas no paramétricas para las


pruebas en los procedimientos.

Las pruebas no paramétricas reúnen las siguientes características:

 Es un método de medición difícil de aplicar.


 Es necesario realizar pruebas de hipótesis.
 Las hipótesis son estrictas.
 Las observaciones deben de ser independientes.

Ventajas y desventajas de las Pruebas de Bondad de ajuste no Paramétricas

Elabora un cuadro de doble entrada de ventajas y desventajas de las Pruebas de


Bondad de ajuste no Paramétricas

Ventajas Desventajas
Las declaraciones de probabilidad Fundamentalmente cuando las muestras
obtenidas de la mayoría de estas pruebas son muy grandes estas pruebas tienen
son probabilidades exactas, una eficiencia relativamente baja con
independientemente de la forma de la relación a las paramétricas, cuando se
distribución de la que se tomó la muestra. cumplen los supuestos.
Si los tamaños de las muestras son tan Su aplicación en muestras grandes se
pequeños como n=6, se debe realizar una hace muy laboriosa.
prueba estadística no paramétrica, a
menos que se conozca exactamente la
naturaleza de la distribución.
Son útiles para los datos clasificatorios, No hay métodos no paramétricos para
medidos en una escala nominal. Ninguna probar las interacciones dentro del
técnica paramétrica se puede aplicar a modelo de análisis de varianza, a menos
tales datos. que se hagan suposiciones especiales

14
acerca de la adaptabilidad.
Las pruebas estadísticas no paramétricas Las hipótesis que se plantean en éstas
son típicamente mucho más fáciles de pruebas son menos precisas, lo que hace
aplicar que las pruebas paramétricas. que la interpretación de los resultados sea
más ambigua.
Tienen mayor eficiencia que los métodos Si los supuestos del modelo estadístico
paramétricos en distribuciones paramétrico se cumplen, las pruebas no
asimétricas, o sea cuando hay valores paramétricas disipan los datos.
atípicos o datos aberrantes.
Tienen validez en el sentido de que su Estos métodos son preferencialmente
nivel de confiabilidad es realmente el orientados hacia las Pruebas de Hipótesis
especificado en la mayoría de las que a la Estimación. Suele ser posible
pruebas. obtener estimaciones no paramétricas y
sus intervalos de confianza asociados,
pero generalmente no es sencillo.
Estas pruebas son mucho menos Para un problema particular pueden existir
exigentes que las paramétricas, y se varias pruebas, por lo que en ocasiones
consideran de distribución libre, en cuanto es difícil seleccionar la mejor.
que no plantean suposiciones con
relación a la distribución de las
puntuaciones en la población.
Algunos de los procesos sólo requieren Puede ser limitado el software para este
los rangos de las observaciones y no de tipo de métodos, así como su
sus magnitudes, mientras que los procedencia. Además, la manera en que
procesos paramétricos las necesitan el software le da tratamiento a los valores
forzosamente. ajustados o cómo es que se obtiene
adecuadamente el valor p puede ser no
tan evidente

15
4.2.1.- Definición de escala de medición y un resumen de las diferentes escalas
de medición y dos ejemplos de cada una y su utilidad en la ingeniería

Una escala de medición es el conjunto de los posibles valores que una cierta variable
puede tomar. Es un continuo de valores ordenados correlativamente, que admite un
punto inicial y otro final. El nivel en que una variable puede ser medida determina las
propiedades de medición de una variable, el tipo de operaciones matemáticas que
puede usarse apropiadamente con dicho nivel, las fórmulas y procedimientos
estadísticos que se utilizan para el análisis de datos y la prueba de hipótesis teóricas.

Las escalas o niveles de medición se utilizan para medir variables o atributos. Por lo
general, se distinguen cuatro escalas o niveles de medición: nominal, ordinal, intervalos
y escalas de proporción, cociente o razón. Las dos primeras (nominal y ordinal) se
conocen como escalas categóricas, y las dos últimas (intervalo y razón) como escalas
numéricas. Las escalas categóricas se usan comúnmente para variables cualitativas,
mientras que las numéricas son adecuadas para la medición de variables cuantitativas.

Son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las
escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las
características de las variables.

Tipos de escalas:

Escala nominal

Cuando un dato identifica una etiqueta (o el nombre de un atributo) de un elemento, se


considera que la escala de medición es una escala nominal. En esta carecen de
sentido el orden de las etiquetas, así como la comparación y las operaciones
aritméticas. La única finalidad de este tipo de datos es clasificar a las observaciones.

Ejemplos

1. Color de los ojos (negros, pardos, azules, verdes, etc.)


2. Estado civil (soltero, casado, viudo, divorciado, unión libre).
3. Sexo (masculino, femenino).

16
Escala ordinal

Una escala de medición ordinal se logra cuando las observaciones pueden colocarse
en un orden relativo con respecto a la característica que se evalúa, es decir, las
categorías de datos están clasificadas u ordenadas de acuerdo con la característica
especial que poseen. Aquí, las etiquetas o símbolos de las categorías sí indican
jerarquía.

Para que pueden usarse:

 Podemos clasificar familias de acuerdo con su condición socio-económica


 Estudiantes de acuerdo con el orden en que terminan un examen, miembros
militares por su rango y participantes en un reinado de belleza según sus
atractivos.

Ejemplos:

1. Notas escolares cualitativas (I - insuficiente; A - aceptable; B - bueno; S -


sobresaliente; E - excelente)
2. Preferencia a la compra de productos de consumo (siempre, frecuentemente,
ocasionalmente, nunca)
3. Etapa de desarrollo de un ser vivo (recién nacido, bebe, niño, joven, adulto,
anciano)

Escala de intervalo

En una escala de intervalo, los datos tienen las propiedades de los datos ordinales,
pero a su vez la separación entre las variables tiene sentido. Este tipo de datos siempre
es numérico, y el valor cero no indica la ausencia de la propiedad.

La medición en una escala de intervalos se basa en suponer que puede conocerse


exactamente la diferencia entre los objetos medidos según esta escala. Esto es, debe
ser posible asignar un número a cada objeto de modo tal que la diferencia entre los
objetos quede reflejada por la diferencia entre los números asignados.

17
Ejemplos

1. La diferencia entre los valores 4 y 5 es la misma que entre los valores 1 y 2, o


entre 9 y 10.

2. Lapsos de tiempo transcurridos entre 1995-1999 y 2000-2004.

Escala de razón

En una escala de razón, los datos tienen todas las propiedades de los datos de
intervalo, y la proporción entre ellos tiene sentido. Para esto se requiere que el valor
cero de la escala indique la ausencia de la propiedad a medir.

Para que pueden usarse:

 Estatura de las personas


 Litros de agua consumidos por persona al día
 Velocidad de un auto de carreras
 Nivel de productividad.
 Ventas de un producto

Ejemplos

1. Si Carlos mide 1.52 m de altura y Rodrigo 1.27 m, entonces Carlos es 119%


(1.52/1.27=1.19) tan alto como Rodrigo o Carlos es 20% más alto que Rodrigo.

2. La evaluación del CI, sin embargo, no tiene la cualidad de proporción: si María tiene
un CI de 125 y Elvia tiene un CI de 100, no se puede decir que María es 25% más
inteligente que Elvia.

18
4.2.2.- Comparación de métodos estadísticos paramétricos y no paramétricos

En un cuadro de doble entrada consulta la comparación de métodos estadísticos


paramétricos y no paramétricos.

Paramétricos No paramétricos
Es una rama de la estadística inferencial Es una rama de la estadística que estudia
que comprende los procedimientos las pruebas y modelos estadísticos cuya
estadísticos y de decisión que están distribución subyacente no se ajusta a los
basados en distribuciones conocidas. llamados criterios paramétricos. Su
Estas son determinadas usando un distribución no puede ser definida a priori,
número finito de parámetros. pues son los datos observados los que la
determinan.
La variable de estudio ha de ser Son más fáciles de aplicar y son
numérica. aplicables a los datos jerarquizados.

Requiere conocer la forma de distribución Son aplicables a los datos jerarquizados.


para las mediciones resultantes de la Son útiles a un nivel de significancia
población estudiada. previamente especificado.
Se aplica a variables de tipo nominal o de Solo está permitido en variables
intervalo. categóricas.
Son requeridas como mínimo una escala Son la única alternativa cuando el tamaño
de intervalo. de muestra es pequeño.
Las hipótesis se basan en valores Las hipótesis se redactan sobre rangos,
numéricos, especialmente en 4 mediana o frecuencia de los datos.
promedios.
No consideran valores perdidos como Asume los valores perdidos como fuentes
fuente de información. de información.
Parten del supuesto de una distribución Se desconoce cómo están distribuidos los
normal. datos.

19
Comparación de aplicaciones estadísticas de estudios paramétricos versus
estudios no paramétricos

En un cuadro de doble entrada consulta la comparación de aplicaciones estadísticas de


estudios paramétricos versus estudios no paramétricos.

Paramétricos No paramétricos
Levene para igualdad de varianzas Kolmogorov-smirnov
T de igualdad de medias Wilcoxon de los signos
Anova de factor Rachas de Wald-Wolfowitz
Correlación Pearson Kruskal-Wallis
Prueba T de student para datos Prueba Binomial
relacionados (muestras dependientes)
Prueba T de student para datos no Anderson-Darling
relacionados (muestras dependientes)
Prueba del Valor Z de la Distribución Rachas
Normal
Prueba F (Análisis de Varianza a ANOVA Ji-cuadrada
para más de dos muestras
independientes)

4.2.3.- La utilidad, importancia y en cuales distribuciones de probabilidad se


utiliza la prueba de Kolmogorov-smirnov en la ingeniería

La prueba de Kolmogórov-Smirnov es una propia perteneciente a la estadística,


concretamente a la estadística inferencial. La estadística inferencial pretende extraer
información sobre las poblaciones.

Se trata de una prueba de bondad de ajuste, es decir, sirve para verificar si las
puntuaciones que hemos obtenido de la muestra siguen o no una distribución normal.
Es decir, permite medir el grado de concordancia existente entre la distribución de un
conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los

20
datos provienen de una población que tiene la distribución teórica especificada, es
decir, lo que hace es contrastar si las observaciones podrían razonablemente proceder
de la distribución especificada.

La prueba de Kolmogorov–Smirnoff (K-S) es un contraste no paramétrico que tiene


como objetivo determinar si la frecuencia de dos conjuntos de datos distintos siguen la
misma distribución alrededor de su media.

El método K-S se basa en la comparación entre las frecuencias acumuladas de la


distribución de los datos ordenados de la muestra y la distribución teórica propuesta en
la hipótesis nula. De calcular previamente la distancia entre ambas funciones de
distribución, se observa cuál es la distancia máxima, es decir, el punto que presenta
mayor diferencia al que se denominará 𝐷𝑜𝑏𝑠 entonces:

La distribución del estadístico es independiente del modelo planteado en la hipótesis


nula, éste depende únicamente de los grados de libertad y está tabulado cuando Ft es
cierta.

21
Coeficiente de correlación

El coeficiente de correlación asume que las distribuciones son normales, si nos


saltamos esta asunción, el resultado del coeficiente de correlación es erróneo. Para los
contrastes de hipótesis y los intervalos de confianza también asumimos que la
población se distribuye mediante una distribución normal.

Al igual que todos los contrastes de hipótesis que involucran estadísticos, es importante
contar con un gran volumen de datos para tener resultados estadísticamente
significativos. Es posible que rechacemos por error una hipótesis nula debido a que la
muestra es pequeña.

Procedimiento del test

Hipótesis

El primer paso será comprobar si ambas muestras tienen la misma distribución. Para
ello realizamos un contraste de hipótesis suponiendo que ambas muestras tienen la
misma distribución contra la hipótesis alternativa de que son distintas.

Contraste de hipótesis

Estadístico

Trabajamos con las funciones de distribución acumuladas de dos muestras,


𝐹1 (𝑥) 𝑦 𝐹2 (𝑥):

22
Estadístico de K -S.

Dónde:

 La parte importante de la fórmula es el signo de diferencia (-). Estamos


buscando diferencias verticales en las distribuciones. Entonces, restaremos
ambas funciones de distribución acumulada.
 El operador “max”. Nos interesa encontrar la diferencia mayor o máxima para ver
cómo de diferentes pueden llegar a ser ambas distribuciones.
 El valor absoluto. Empleamos el valor absoluto para que el orden de los
operadores no altere el resultado. En otras palabras, no importa qué F(x) tenga
el signo negativo:

Forma alternativa de expresar el estadístico

Valor crítico

Para muestras grandes existe la aproximación al valor crítico para K-S que depende del
nivel de significación (%):

Fórmula valor crítico K – S

Donde n1 y n2 son el tamaño de la muestra para la muestra de F1(x) y F2(x)


respectivamente

23
Regla de rechazo

Regla de rechazo K – S

Estadístico de prueba

Sea S(x) la función de distribución muestral; esto es, S(x) es la función de probabilidad
acumulada calculada a partir de los datos muéstrales.

Específicamente,

S(x) = la proporción de observaciones muéstrales menores o iguales que x = (número


de observaciones muéstrales menores o iguales que x) / n

El estadístico de prueba depende de la hipótesis bajo consideración.

1. Para la prueba bilateral, el estadístico de prueba es D = sup S(x) – 𝐹0 (x) ; es


decir, D es igual al supremo, sobre todo x, del valor absoluto de la diferencia
S(x) – 𝐹0 (x). Cuando las dos funciones son representadas gráficamente, D es la
distancia vertical más grande entre S(x) y 𝐹0 (x).
2. Para la prueba unilateral donde la hipótesis alternativa especifica que F(x) <
𝐹0 (x), el estadístico de prueba es 𝐷+ = sup 𝐹0 (x) - S(x). Gráficamente éste
estadístico denota la distancia vertical más grande entre 𝐹0 (x) y S(x), donde la
función hipotética 𝐹0 (x) es arriba la función muestral S(x).
3. Para la prueba donde la hipótesis alternativa especifica que F(x) > 𝐹0 (x), el
estadística de prueba es 𝐷− = sup  S(x) - F0(x). Cuando se gráfica, este
estadístico es la distancia vertical más grande entre S(x) y 𝐹0 (x) cuando S(x) es
arriba 𝐹0 (x).

24
Aplicación

Muy a menudo queremos probar si dos distribuciones son lo suficientemente diferentes


ente ellas cuando queremos construir escenarios de predicción (trabajamos con dos
muestras) o cuando queremos evaluar qué distribución se adapta mejor a los datos
(trabajamos con una sola muestra).

Distribuciones de probabilidad se utiliza la prueba de Kolmogorov-smirnov

 Distribución normal
 Distribución binomial

4.2.4.- La utilidad, importancia y en cuales distribuciones de probabilidad se


utiliza la prueba de Anderson-Darling en la ingeniería

En estadística, la prueba de Anderson-Darling es una prueba no paramétrica sobre si


los datos de una muestra provienen de una distribución específica. La fórmula sobre el
estadístico A determina si los datos {𝑌1 < ⋯ < 𝑌𝑁 } que vienen de una distribución con
función acumulativa 𝐹.

𝐴2 = −𝑁 − 𝑆

Donde

La prueba de Anderson-Darling es una prueba estadística que permite determinar si


una muestra de datos se extrae de una distribución de probabilidad. En su forma
básica, la prueba asume que no existen parámetros a estimar en la distribución que se

25
está probando, en cuyo caso la prueba y su conjunto de valores críticos siguen una
distribución libre. Sin embargo, la prueba se utiliza con mayor frecuencia en contextos
en los que se está probando una familia de distribuciones, en cuyo caso deben ser
estimados los parámetros de esa familia y debe tenerse estos en cuenta a la #ora de
ajustar la prueba estadística y sus valores críticos.

La prueba de Anderson-Darling (𝑨𝑫) se utiliza para probar si una muestra de datos


proviene de una población con una distribución específica, basada en la función de
distribución empírica (FDE). Las estadísticas FDE son medidas de discrepancia entre la
FDE y una función de distribución dada, y son usadas para probar el ajuste de la
muestra a la distribución.

Esta prueba es una versión mejorada de la prueba K-S, ya que detecta mejor las
diferencias entre las distribuciones acumuladas empírica y teórica en las colas de las
gráficas. Se recomienda usar solamente para distribuciones continuas.

26
Los pasos de la prueba son:

Distribuciones de probabilidad se utiliza la prueba de Anderson-Darling

 Distribución empírica
 Distribución bilateral
 Distribución unilateral

27
4.2.5.- La utilidad, importancia y en cuales distribuciones de probabilidad se
utiliza la prueba de Ryan-Joiner en la ingeniería

En estadística, la prueba de Ryan-Joiner es una prueba no paramétrica sobre si, los


datos de una muestra provienen de una distribución específica. La fórmula para el
estadístico determina si los datos (observar que los datos se deben ordenar) vienen de
una distribución con función acumulativa F.

Esta prueba evalúa la normalidad calculando la correlación entre sus datos y las
puntuaciones normales de sus datos. Si el coeficiente de correlación se encuentra
cerca de 1, es probable que la población sea normal. La estadística de Ryan-Joiner
evalúa la solidez de esta correlación; si se encuentra por debajo del valor crítico
apropiado, se rechazara la hipótesis nula de normalidad en la población.

Fórmula

El coeficiente de correlación se calcula de la siguiente manera:

Notación

Yi observaciones ordenadas

bi puntuaciones normales de los datos ordenados

s2 varianza de la muestra

Aplicaciones

La prueba de Ryan-Joiner es usada para probar si una muestra viene de una


distribución específica.

Distribuciones de probabilidad se utiliza la prueba de Ryan-Joiner

 Distribución normal

28
4.2.6.- La utilidad, importancia y en cuales distribuciones de probabilidad se
utiliza la prueba de Shappiro-Wilk

En estadística, la prueba de Shappiro-Wilk se usa para contrastar la normalidad de un


conjunto de datos. Se plantea como hipótesis nula que una muestra 𝑋1 , … , 𝑋𝑁 proviene
de una población normalmente distribuida.

El estadístico de la prueba es:

Donde

 𝑥(𝑖) (Con el subíndice i entre paréntesis) es el número que ocupa la i-ésima


posición en la muestra (con la muestra ordenada de menor a mayor);
 𝑥̅ = (𝑥1 + ⋯ + 𝑥𝑛 )/𝑛 es la media muestral;
 las variables 𝑎𝑖 se calculan

Siendo 𝑚1 ,..., 𝑚𝑛 son los valores medios del estadístico ordenado, de variables
aleatorias independientes e identicamente distribuidas, muestreadas de distribuciones
normales. V es la matriz de covarianzas de ese estadístico de orden.

La hipótesis nula se rechazará si W es demasiado pequeño. El valor de W puede


oscilar entre 0 y 1.

Interpretación

29
Siendo la hipótesis nula que la población está distribuida normalmente, si el p-valor es
menor a alfa (nivel de significancia) entonces la hipótesis nula es rechazada (se
concluye que los datos no vienen de una distribución normal). Si el p-valor es mayor a
alfa, se concluye que no se puede rechazar dicha hipótesis.

La normalidad se verifica confrontando dos estimadores alternativos de la varianza σ²:

 Un estimador no paramétrico al numerador,


 Un estimador paramétrico (varianza muestral), al denominador.

Distribuciones de probabilidad se utiliza la prueba de Shappiro-Wilk

 Distribución normal

30
Bibliografía

https://es.slideshare.net/carlosbehe/pruebas-de-bondad-de-ajuste

http://dcb.fi-c.unam.mx/profesores/irene/Notas/PruebaBondad.pdf

http://www.upvm.edu.mx/Licenciaturas/Industrial/Plan/Cuatrimestre4/Estadistica_industr
ial.pdf

http://asesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica/CARPETA%203%
20INFERENCIA_ESTADISTICA/DOC_%20INFERENCIA/TEMA%204/08%20PRUEBA
%20DE%20CHICUADRADA.pdf

http://www.samiuc.es/estadisticas-variables-binarias/valoracion-inicial-pruebas-
diagnosticas/chi-cuadrado/

http://virtual.usalesiana.edu.bo/web/conte/archivos/1856.pdf

http://www.chihuahua.tecnm.mx/academic/industrial/estadistica1/cap04b.html#cuatro_b
ondad

http://www.chihuahua.tecnm.mx/academic/industrial/estadistica1/cap04c.html#cuatro_ta
blas_contingencia

https://es.slideshare.net/carlosbehe/pruebas-de-bondad-de-ajuste

http://dcb.fi-c.unam.mx/profesores/irene/Notas/PruebaBondad.pdf

http://virtual.usalesiana.edu.bo/web/conte/archivos/1856.pdf

https://www.alceingenieria.net/bioestadistica/noparame.pdf

https://www.questionpro.com/blog/es/pruebas-no-parametricas/

http://ri.uaemex.mx/bitstream/handle/20.500.11799/94447/TIPO%20DE%20CAMBIO%
20NOMINAL%20Y%20REAL%20DE%20M%C3%89XICO%20UNA%20MODELACI%C
3%93N%20A%20PARTIR%20DE%20LA%20DISTRIBUCI%C3%93N%20DE%20VALO
RES%20EXTREMOS%20GENERALIZADA.pdf?sequence=1&isAllowed=y

31
https://es.slideshare.net/ClaribelParababire/escala-de-medicin-79294687

file:///C:/Users/52656/Downloads/Dialnet-EscalasDeMedicion-4942056.pdf

https://mauricioanderson.com/escalas-de-medicion-
estadistica/#:~:text=Escalas%20de%20medici%C3%B3n%20en%20estad%C3%ADstic
a,-
Como%20hemos%20dicho&text=Dichas%20escalas%20tendr%C3%A1n%20diferentes
%20propiedades,de%20intervalo%20y%20de%20raz%C3%B3n.

https://es.slideshare.net/ricardooberto/cuadro-comparativo-estadstica-paramtrica-y-no-
paramtrica#:~:text=Es%20una%20rama%20de%20la%20estad%C3%ADstica%20que
%20estudia%20las%20pruebas,observados%20los%20que%20la%20determinan.

https://www.actaodontologica.com/ediciones/2016/1/art-6/

https://psicologiaymente.com/miscelanea/prueba-kolmogorov-smirnov

https://economipedia.com/definiciones/prueba-de-kolmogorov-smirnoff-k-s.html

http://ri.uaemex.mx/bitstream/handle/20.500.11799/94447/TIPO%20DE%20CAMBIO%
20NOMINAL%20Y%20REAL%20DE%20M%C3%89XICO%20UNA%20MODELACI%C
3%93N%20A%20PARTIR%20DE%20LA%20DISTRIBUCI%C3%93N%20DE%20VALO
RES%20EXTREMOS%20GENERALIZADA.pdf?sequence=1&isAllowed=y

https://imt.mx/archivos/Publicaciones/PublicacionTecnica/pt545.pdf

https://www.academia.edu/22371161/Pruebas_no_parametricas

https://support.minitab.com/es-mx/minitab/19/help-and-how-to/statistics/basic-
statistics/how-to/normality-test/methods-and-formulas/methods-and-formulas/#ryan-
joiner

32

También podría gustarte