Está en la página 1de 17

Instituto Tecnológico Superior de Coatzacoalcos

División de Ingeniería Industrial


Nombre de la asignatura: Estadística Inferencial 1
Semestre: Agosto 2021 – Enero 2022

Investigación Unidad 4
Pruebas de bondad de ajuste y pruebas no
paramétricas
Nombre del Alumno: Villegas Maldonado Karla Estrella
No. de control: 20080529 Semestre: 3º. Grupo: DI
Nombre de la docente: ING. C. Bricio Jiménez Ventura
Índice

Introducción .......................................................................................... 2 pág.

4.1. Bondad de ajuste ........................................................................... 3 pág.

4.1.1. Análisis Ji-Cuadrada ................................................................... 4 pág.

4.1.2. Prueba de independencia……………………………………………5 pág.

4.1.3. Prueba de la bondad del ajuste .................................................. 6 pág.

4.1.4. Tablas de contingencia ...............................................................7 pág.

4.2. Pruebas no paramétricas .............................................................. 8 pág.

4.2.1. Escala de Medición .................................................................... 9 pág.

4.2.2. Métodos estadísticos contra no paramétricos ............................. 10 pág.

4.2.3. Prueba de Anderson – Darling .................................................... 11 pág.

4.2.4. Prueba de Ryan – Joiner .......................................................... .12pág.

Conclusión ......................................................................................... 13 pág.

Glosario ……………………………………………………………………. 14 pág.

Bibliografía, ........................................................................................ 15 pág

1
Introducción

El término estadística no paramétrica se refiere a un conjunto de método,


inferenciales válidos para formas muy diversas de distribución de la población La
aplicación de estos métodos no requiere modelo de población, en el sentido de un
parámetro específico relacionado con la forma de la curva que representa a la
población en estudio, como sí es necesario, por ejemplo, en el caso de la
distribución normal. En el contraste de hipótesis, las pruebas estadísticas no
paramétricas usualmente emplean algunos datos más simples de la muestra, como
los signos de las mediciones, las relaciones de orden o las categorías de las
frecuencias.

2
4.1. Bondad de ajuste.

La bondad de ajuste de un modelo estadístico describe lo bien que se ajusta


un conjunto de observaciones. Las medidas de bondad en general resumen la
discrepancia entre los valores observados y los valores esperados en el modelo de
estudio. Tales medidas se pueden emplear en el contraste de hipótesis. el test de
normalidad de los residuos, comprobar si dos muestras se obtienen a partir de dos
distribuciones idénticas si las frecuencias siguen una distribución específica. (Vera,
2017)

Estas pruebas permiten verificar que la población de la cual proviene una


muestra tiene una distribución especificada o supuesta. Sea X: variable aleatoria
poblacional f0 (x) la distribución (o densidad) de probabilidad especificada o
supuesta para X Se desea probar la hipótesis: Ho: f(x) = f0(x). En contraste con la
hipótesis alterna: Ha: f(x) no= f0(x) (negación de Ho).

3
4.1.1. Análisis Ji-Cuadrada.

El estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de


probabilidad del mismo nombre, sirve para someter a prueba hipótesis referidas a
distribuciones de frecuencias. En términos generales, esta prueba contrasta
frecuencias observadas con las frecuencias esperadas de acuerdo con la hipótesis
nula. (Quevedo Ricardi, 2016)

El uso del estadístico ji-cuadrado para probar la asociación entre dos


variables utilizando una situación hipotética y datos simulados. Luego se describe
su uso para evaluar cuán buena puede resultar una distribución teórica, cuando
pretende representar la distribución real de los datos de una muestra determinada.
A esto se le llama evaluar la bondad de un ajuste. Probar la bondad de un ajuste es
ver en qué medida se ajustan los datos observados a una distribución teórica o
esperada. Para esto, se utiliza una segunda situación hipotética y datos simulados.

4
Prueba de independencia

La prueba de independencia de ji cuadrado es una prueba estadística de


hipótesis que se usa para determinar si dos variables categóricas o nominales
pueden estar o no relacionadas. Puede usar esta prueba cuando tenga conteos de
valores de dos variables categóricas.

La prueba de independencia ji cuadrado comprueba si es probable que dos


variables estén o no relacionadas. Tenemos conteos de dos variables nominales o
categóricas. También tenemos la noción de que ambas no están relacionadas. Esta
prueba nos da una forma de decidir si esta noción es plausible o no. (JMP, 2018)

La prueba de independencia ji cuadrado comprueba si es probable que dos


variables estén o no relacionadas. Tenemos conteos de dos variables nominales o
categóricas. También tenemos la noción de que ambas no están relacionadas. Esta
prueba nos da una forma de decidir si esta noción es plausible o no.

Las siguientes secciones repasan lo que necesitamos para la prueba, cómo


llevarla a cabo, cómo entender los resultados, detalles estadísticos y cómo
interpretar valores p.

¿Qué necesito?

Para la prueba de independencia de ji cuadrado necesitamos dos variables.


Nuestra idea es que ambas no guardan relación. He aquí un par de ejemplos:

Tenemos una lista de géneros cinematográficos; es nuestra primera variable.


La segunda variable es si los espectadores de estos géneros compran snacks en el
cine o no. Nuestra idea (o en términos estadísticos, nuestra hipótesis nula) es que
el tipo de película y la compra de snacks no guardan relación. El propietario del cine
quiere estimar cuántos snacks comprar. Si género y snacks son independientes, la
estimación será más sencilla que si el tipo de película afecta a las ventas de
aperitivos.

Una clínica veterinaria tiene una lista de las razas de perros que atienden. La
segunda variable es si sus dueños les dan comida seca, enlatada o una

5
combinación de ambas. Nuestra idea es que la raza de perro y el tipo de dieta son
independientes. Si es el caso, la clínica puede hacer pedidos de alimento solo en
función del número de perros, sin atender a su raza.

• Para realizar una prueba válida necesitamos:


• Valores de datos que son una muestra aleatoria simple de la población
de interés.
• Dos variables categóricas o nominales. No use la prueba de
independencia en variables continuas que definen las combinaciones
de categoría. Sin embargo, los conteos de combinaciones de las dos
variables categóricas serán continuos.
• Para cada combinación de niveles de las dos variables, necesitamos
por lo menos cinco valores esperados. Cuando tenemos menos de
cinco valores para cualquier combinación, los resultados de la prueba
no son fiables.

4.1.3 Prueba de la bondad del ajuste.

Una prueba de bondad de ajuste permite docimar la hipótesis de que una


variable aleatoria sigue cierta distribución de probabilidad y se utiliza en situaciones
donde se requiere comparar una distribución observada con una teórica o hipotética,
compararla con datos históricos o con la distribución conocida de otra población

Para realizar la prueba, se clasifican los datos observados en k clases o


categorías, y se contabiliza el número de observaciones en cada clase, para
posteriormente comparar la frecuencia observada en cada clase con la frecuencia
que se esperaría obtener en esa clase si la hipótesis nula es correcta Las pruebas
de bondad de ajuste comparan la frecuencia observada con la frecuencia esperada
en cada clase. (htt)

6
4.1.4 Tablas de contingencia.

Una tabla de contingencia es una herramienta utilizada en la rama de la


estadística, la cual consiste en crear al menos dos filas y dos columnas para
representar datos categóricos en términos de conteos de frecuencia.

Esta herramienta, que también se conoce como tabla cruzada o como tabla
de dos vías, tiene el objetivo de representar en un resumen, la relación entre
diferentes variables categóricas. La tabla de contingencia es una de las
herramientas analíticas más útiles y un pilar de la industria de la investigación de
mercados. (QuestionPro, s.f.)

La tabla permite medir la interacción entre dos variables para conocer una
serie de información “oculta” de gran utilidad para comprender con mayor claridad
los resultados de una investigación. La tabla sólo mostrará los encuestados que
respondieron ambas preguntas, lo que significa que las frecuencias mostradas
pueden diferir de una tabla de frecuencias estándar.

El informe que ofrece también mostrará las Estadísticas Chi-cuadrado de


Pearson, el cual representa el grado de correlación entre las variables que usan el
chi-cuadrado, el valor p y el grado de libertad.

Los objetivos de la tabla de contingencia son los siguientes:

• Ordenar la información recolectada para un estudio cuando los datos


se encuentran divididos de forma bidimensional, esto significa a que
se relaciona con dos factores cualitativos.
• El otro objetivo de la tabla de contingencia es analizar si hay una
relación entre las variables cualitativas, ya sean dependientes o
independientes.

7
4.2. Pruebas no paramétricas

Se denominan pruebas no paramétricas aquellas que no presuponen una


distribución de probabilidad para los datos, por ello se conocen también como de
distribución libre (distribución free). En la mayor parte de ellas los resultados
estadísticos se derivan únicamente a partir de procedimientos de ordenación y
recuento, por lo que su base lógica es de fácil comprensión. Cuando trabajamos
con muestras pequeñas (n < 10) en las que se desconoce si es válido suponer la
normalidad de los datos, conviene utilizar pruebas no paramétricas, al menos para
corroborar los resultados obtenidos a partir de la utilización de la teoría basada en
la normal. (scientific, 2019)

En estos casos se emplea como parámetro de centralización la mediana, que


es aquel punto para el que el valor de X está el 50% de las veces por debajo y el
50% por encima.

Son las que se basan en determinadas hipótesis, pero lo datos observados


no tienen una organización normal. Generalmente, las pruebas no paramétricas
contienen resultados estadísticos que provienen de su ordenación, lo que las vuelve
más fáciles de comprender. Las pruebas no paramétricas tienen algunas
limitaciones, entre ellas se encuentra que no son lo suficientemente fuertes cuando
se cumple una hipótesis normal.

8
4.2.1 Escala de Medición

Es el conjunto de los posibles valores que una cierta variable puede tomar.
Por lo general, se distinguen cuatro escalas o niveles de medición: nominal, ordinal,
intervalos y escalas de proporción, cociente o razón. Desde el punto de vista de las
propiedades matemáticas y estadísticas, la escala de medición más rudimentaria es
la nominal, siendo la más completa la escala de razón.

En matemáticas y estadística, el nivel de medida (también, nivel de medición,


escala de medida o escala de medición) de una variable es una clasificación
acordada con el fin de describir la naturaleza de la información contenida dentro de
los números asignados a los objetos y, por lo tanto, dentro de una variable. Según
la teoría de las escalas de medida, son posibles varias operaciones matemáticas
diferentes dependiendo del nivel en el que se mide la variable. (Ing. Jorge Coronado,
2007

9
4.2.2. Métodos estadísticos contra no paramétricos.

¿Qué es un método no paramétrico? Una prueba no paramétrica es una


prueba de hipótesis que no requiere que la distribución de la población sea
caracterizada por ciertos parámetros. Por ejemplo, muchas pruebas de hipótesis
parten del supuesto de que la población sigue una distribución normal con los
parámetros μ y σ. Las pruebas no paramétricas no parten de este supuesto, de
modo que son útiles cuando los datos son considerablemente no normales y
resistentes a transformaciones. Los métodos no paramétricos son útiles cuando no
se cumple el supuesto de normalidad y el tamaño de la muestra es pequeño. Sin
embargo, las pruebas no paramétricas no están completamente libres de supuestos
acerca de los datos Limitaciones de las pruebas no paramétricas.

Las pruebas no paramétricas tienen las siguientes limitaciones: Las pruebas


no paramétricas por lo general son menos potentes que la prueba paramétrica
correspondiente cuando se cumple el supuesto de normalidad. Por lo tanto, es
menos probable que usted rechace la hipótesis nula cuando sea falsa si los datos
provienen de la distribución normal.

Las pruebas no paramétricas suelen requerir que se modifiquen las hipótesis.


Por ejemplo, la mayoría de las pruebas no paramétricas acerca del centro de la
población son pruebas sobre la mediana y no sobre la media. La prueba no
responde a la misma pregunta que el procedimiento paramétrico correspondiente si
la población no es simétrica. (Minitab 18 , 2018)

10
4.2.3. Prueba de Anderson – Darling

El estadístico Anderson-Darling mide qué tan bien siguen los datos una
distribución específica. Para un conjunto de datos y distribución en particular,
mientras mejor se ajuste la distribución a los datos, menor será este estadístico. Por
ejemplo, usted puede utilizar el estadístico de Anderson Darling para determinar si
los datos cumplen el supuesto de normalidad para una prueba t.

Las hipótesis para la prueba de Anderson-Darling son:

• H0: Los datos siguen una distribución especificada


• H1: Los datos no siguen una distribución especificada

Utilice el valor p correspondiente (si está disponible) para probar si los datos
provienen de la distribución elegida. Si el valor p es menor que un nivel de
significancia elegido (por lo general 0.05 o 0.10), entonces rechace la hipótesis nula
de que los datos provienen de esa distribución. Minitab no siempre muestra un valor
p para la prueba de Anderson-Darling, porque este no existe matemáticamente para
ciertos casos.

También puede utilizar el estadístico de Anderson-Darling para comparar el


ajuste de varias distribuciones con el fin de determinar cuál es la mejor. Sin
embargo, para concluir que una distribución es la mejor, el estadístico de Anderson-
Darling debe ser sustancialmente menor que los demás. Cuando los estadísticos
están cercanos entre sí, se deben usar criterios adicionales, como las gráficas de
probabilidad, para elegir entre ellos.

11
4.2.4. Prueba de Ryan – Joiner

La estadística de Ryan-Joiner evalúa la fuerza de esta correlación; si es


menos que el valor apropiado crítico, usted rechazará la hipótesis nula de
normalidad demográfica. Esta prueba es similar a la prueba de normalidad Shapiro-
Wilk.

En estadística, la prueba de Ryan-Joiner es una prueba no paramétrica sobre


si los datos de una muestra provienen de una distribución normal.Se puede hacer
una prueba de normalidad y producir un argumento de probabilidad normal en el
mismo análisis. La prueba de normalidad y el argumento de probabilidad son por lo
general los mejores instrumentos para juzgar la normalidad, sobre todo para
muestras pequeñas.

La prueba de Ryan-Joiner proporciona un coeficiente de correlación, que


indica la correlación entre los datos y las puntuaciones normales de los datos. Si el
coeficiente de correlación está cerca de 1 los datos se encuentran cerca de la
gráfica de probabilidad normal. Si es menor que el valor crítico adecuado, usted
rechazará la hipótesis nula de normalidad.

Fórmula:

El coeficiente de correlación se calcula de la siguiente manera:

12
4.2.5. Prueba de Shappiro – Wilk

En estadística, el Test de Shapiro–Wilk se usa para contrastar la normalidad


de un conjunto de datos. Se plantea como hipótesis nula que una muestra
{\displaystyle x_{1}, \dots, x_{n}} proviene de una población normalmente
distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk.

El test de Shapiro-Wilks plantea la hipótesis nula que una muestra proviene


de una distribución normal.Elegimos un nivel de significanza, por ejemplo 0,05, y
tenemos una hipótesis alternativa que sostiene que la distribución no es normal. Las
hipótesis estadísticas son las siguientes:

H0: La variable presenta una distribución normal

H1: La variable presenta una distribución no normal.

13
Conclusión

Para el desarrollo de esta unidad nuevamente llevamos a cabo la formulación


de hipótesis, y a partir de ello se realizan diversas pruebas, de las cuales hablare a
continuación. Como pudimos notar el trabajo anterior trato a cerca de las pruebas
de bondad de ajuste y las pruebas no paramétricas, a partir de ello puedo concluir
que, una prueba de bondad de ajuste mide como su nombre lo indica, el grado o
nivel de ajuste que existe entre una distribución obtenida a partir de una muestra y
una distribución teórica que se supone debe seguir dicha muestra. Ambas pruebas
están basadas en la hipótesis nula. Para probar la bondad de ajuste se utiliza un
procedimiento basado en la distribución ji-cuadrada, y al obtener el valor de ji-
cuadrada, mientras más cercano a cero esté, más ajustadas estarán las
distribuciones.

14
Glosario

• “C” Contraste: se define como la diferencia relativa en la intensidad entre un


punto de una imagen. Un ejemplo es el contraste entre un objeto de brillo
constante sobre un fondo de un brillo constante.
• “D” Discrepancia: Falta de acuerdo entre dos o más personas o falta de
aceptación de una situación, una decisión o una opinión.
• Denotado: es lo contrario de connotación, tal como aparece definido en los
diccionarios con una forma de expresión formal y objetiva.
• “I” Independencia: es la formación o la restauración de un país
inmediatamente después de la separación de otro del que solo formaba una
parte.
• “F” Fabulación: Invención o imaginación de una historia.
• “R” Rudimentaria: Que se limita a los rudimentos o aspectos más básicos y
elementales.
• “V” Verificar: Comprobar o ratificar que es verdadera una cosa.

15
Bibliografía

(s.f.). Obtenido de http://dcb.fi-


c.unam.mx/profesores/irene/Notas/PruebaBondad.pdf
Ignacio, P., Basterretxea, J. J., & Robles, F. A. (octubre de 2015). Pruebas de
bondad de ajuste en distribuciones simétricas. Obtenido de
https://www.redalyc.org/journal/647/64739086029/html/
Ing. Jorge Coronado, P. (2007). ESCALAS DE MEDICIÓN. Paradigmas, Vol
2,Corporación Universitaria Unite, 104-125.
JMP. (2018). Prueba de independencia. Obtenido de Portal de formación
estadística: https://www.jmp.com/es_cl/statistics-knowledge-portal/chi-
square-test/chi-square-test-of-independence.html
Minitab 18 . (2018). Explicación de los métodos no paramétricos. Obtenido de
https://support.minitab.com/es-mx/minitab/18/help-and-how-
to/statistics/nonparametrics/supporting-topics/understanding-nonparametric-
methods/
QuestionPro. (s.f.). ¿Qué es una tabla de contingencia? Obtenido de
https://www.questionpro.com/blog/es/que-es-una-tabla-de-contingencia/
Quevedo Ricardi, F. (2016). ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN
SALUD. Revista Biomédica Revisada Por Pares.
scientific. (2019). PRUEBAS NO PARAMÉTRICAS. scientific.
Vera, C. G. (2017). Pruebas de bondad de ajuste. Hidalgo: Universidad Autónoma
del Estado de Hidalgo.

16

También podría gustarte