Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA INFERENCIAL I
PORTAFOLIO DE EVIDENCIAS
GRUPO: 3I1.
INTRODUCCION. ................................................................................................... 3
CONCLUSION. ..................................................................................................... 27
REFERENCIAS. .................................................................................................... 29
INTRODUCCION.
En este portafolio, haremos la recopilación de los temas ya asignados en la
planeación del curso, enfocándonos en la unidad 4, pruebas de bondad de ajuste y
pruebas no paramétricas, las cuales son de gran importancia para el uso de
hipótesis y en diferentes casos de la vida cotidiana e industrial en el que la
estadística se convertirá en una herramienta de alto impacto, ayudándonos a
resolver diferentes tipos de problemas de cualquier ámbito en el cual se nos de una
serie de datos estándar o datos base, y consecuente a eso realizar las operaciones
correspondientes para llegar al resultado.
Cabe recalcar que, de todos los temas antes mencionados, haremos un ejemplo de
cada uno, teniendo así una investigación más completa y así poder facilitarnos el
estudio al momento de presentar las evaluaciones.
4. Pruebas de bondad de ajuste y pruebas no paramétricas.
Las pruebas de bondad de ajuste tratan de verificar si el conjunto de datos se
puede ajustar o afirmar que proviene de una determinada distribución.
Miden, como el nombre lo indica, el grado de ajuste que existe entre la distribución
obtenida a partir de la muestra y la distribución teórica que se supone debe seguir
esa muestra.
Se debe señalar que hay desventajas asociadas con las pruebas no paramétricas.
En primer lugar, no utilizan la información que proporciona la muestra, y por ello una
prueba no paramétrica será menos eficiente que el procedimiento paramétrico
correspondiente, cuando se pueden aplicar ambos métodos. En consecuencia, para
lograr la misma eficiencia, una prueba no paramétrica requerirá la correspondiente
prueba paramétrica.
4.1. Bondad de ajuste.
Hablamos de bondad de ajuste cuando tratamos de comparar una distribución de
frecuencia observada con los valores correspondientes de una distribución
esperada o teórica. Algunos estudios producen resultados sobre los que no
podemos afirmar que se contribuyen normalmente, es decir con forma acampanada
concentradas sobre la media.
Su fórmula es:
𝑘
2
[𝑓𝑜𝑖 − 𝑓𝑒𝑖 ]2
𝑋 =∑
𝑓𝑒𝑖
𝑖=1
𝑘 = 𝐶𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑎𝑠 𝑜 𝑐𝑒𝑙𝑑𝑎𝑠.
2
Se rechaza H0 cuando 𝑋 2 ≥ 𝑋𝑡; 𝐾−𝑚−1 . En caso contrario, se acepta. Donde t
representa el valor proporcionado por las tablas, según el nivel de significancia
elegido.
¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende del
nivel socioeconómico? Usaremos un nivel de significación alfa=0,05.
Los pasos del análisis estadístico en este caso son los siguientes:
En esta prueba estadística siempre la hipótesis nula plantea que las variables
analizadas son independientes.
Estas son las frecuencias que debieran darse si las variables fueran independientes,
es decir, si fuera cierta la hipótesis nula.
Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera
verdadera y, por consiguiente, las variables fueran independientes.
Estos valores los anotamos en una tabla con las mismas celdas que la anterior; así
tendremos una tabla con los valores observados y una tabla con los valores
esperados, que anotaremos en cursiva, para identificarlos bien.
De este modo el valor del estadístico de prueba para este problema será:
Ho : f(x)=fo (x)
H1 : f(x)¹fo (x)
ei = n*pi , donde:
n=tamaño de la muestra,
El cual tiene distribución Ji-cuadrada con k-r-1 grados de libertad. Si las diferencias
oi -ei son pequeñas, el valor del estadístico es pequeño, por el contrario, si esas
diferencias son grandes (lo observado no se ajusta a lo propuesto), el valor del
estadístico es grande, por lo tanto, la región de rechazo de la hipótesis nula se ubica
en la cola superior de la distribución Ji-cuadrada al nivel de significancia a.
Siendo n=∑i, nij la suma total de individuos observados. El estadístico X2X2 tiene
distribución asintótica χ2 de (I−1) (J−1) grados de libertad, por lo que es
aconsejable comprobar que todas las casillas tienen un número mayor o igual a
cinco. Como siempre, cuanto menor sea la probabilidad crítica pc, más evidencia
habrá para rechazar la hipótesis nula.
En el programa que sigue, las tablas admitidas son para las dimensiones 2×32×3,
aunque también sirve para las de 3×23×2, ya que la transposición de la matriz lleva
a los mismos resultados.
tab = matrix(c(27,25,38,35,30,31),
nr=2, byrow=TRUE,
dimnames = list(Linea = c("L1","L2"),
Fallos = c("A", "B","C")))
chisq.test(tab)
Fallos
Linea A B C
L1 27 25 38
L2 35 30 31
chisq.test(tab)
data: tab
X-squared = 2.0055, df = 2, p-value = 0.3669
En una tabla 2×2×K, en la que las dos primeras entradas corresponden a dos
variables binarias X e Y y la tercera entrada a una variable
explicativa Z de K categorías, interesa contrastar si X e Y son independientes para
cualquier valor de Z.
n11k
θXY(k) = n12k
n21k/n22k
El estadístico de contraste es
∑𝑘(𝑛11𝑘 − 𝐸[𝑁11𝑘])2
𝐶𝑀𝐻 = ∼ 𝑎𝜒2(1),
∑𝑘𝑉[𝑁11𝑘]
Siendo
Departamento B:
Departamento C:
,,1
[,1] [,2]
[1,] 219 473
[2,] 399 412
,,2
[,1] [,2]
[1,] 17 353
[2,] 8 207
,,3
[,1] [,2]
[1,] 202 120
[2,] 391 205
# contraste
mantelhaen.test(tab, correct=F)
data: tab
Mantel-Haenszel X-squared = 34.3927, df = 1, p-value = 4.504e-09
alternative hypothesis: true common odds ratio is not equal to 1
95 percent confidence interval:
0.5198121 0.7215105
sample estimates:
common odds ratio
0.6124132
Prueba Binomial: Esta prueba permite averiguar si una variable dicotómica sigue o
no un determinado modelo de probabilidad. Permite contrastar la hipótesis de que
la proporción observada de aciertos se ajusta a la proporción teórica de una
distribución binomial.
Se trata de una prueba de bondad de ajuste, es decir, sirve para verificar si las
puntuaciones que hemos obtenido de la muestra siguen o no una distribución
normal. Es decir, permite medir el grado de concordancia existente entre la
distribución de un conjunto de datos y una distribución teórica específica. Su objetivo
es señalar si los datos provienen de una población que tiene la distribución teórica
especificada, es decir, lo que hace es contrastar si las observaciones podrían
razonablemente proceder de la distribución especificada.
Por otro lado, la media y la desviación estándar de la muestra son los parámetros
de una distribución normal, los valores mínimo y máximo de la muestra definen el
rango de la distribución uniforme, la media muestral es el parámetro de la
distribución de Poisson y la media muestral es el parámetro de la distribución
exponencial.
En resumen, tendremos:
Hipótesis:
Ejemplo:
Las puntuaciones obtenidas por una muestra de sujetos en una prueba de habilidad
han sido las siguientes: 48,1; 47,8; 45.1; 46,3; 45,4; 47,2; 46,6; y 46.
Solución: 1. Hipótesis:
Utilice el valor p correspondiente (si está disponible) para probar si los datos
provienen de la distribución elegida. Si el valor p es menor que un nivel de
significancia elegido (por lo general 0.05 o 0.10), entonces rechace la hipótesis nula
de que los datos provienen de esa distribución. Minitab no siempre muestra un
valor p para la prueba de Anderson-Darling, porque este no existe
matemáticamente para ciertos casos.
Donde:
n es el número de datos
Para definir la regla de rechazo para esta prueba es necesario, también, obtener el
estadístico ajustado para luego compararlo con los valores críticos de la tabla de
Anderson- Darling
Una vez obtenido el estadístico ajustado, la regla de rechazo se realiza
análogamente a la utilizada en la prueba de K-S.
Este tema fue de vital para refozar nuestro conocimiento en cuanto a las pruebas
de bondad de ajuste como trabajar con la ji cuadrada para Inferir si la población
muestreada, cuyos datos se clasifican en una escala nominal o son agrupados en
intervalos, sigue una cierta distribución teórica. De igual manera se vio el método
de Fisher El estadístico G sigue la misma distribución que 2 c No es tan sensible
como la prueba de Chi las frecuencias esperadas bajas y otros métodos que nos
servirán para realizar los cálculos necesarios al momento de aplicarlo a problemas
de la vida real.
REFERENCIAS.
Dantes, G. (s. f.). PRUEBAS DE BONDAD DE AJUSTE - Bing. Pruebas de Bondad.
Recuperado 8 de mayo de 2021, de
https://www.bing.com/search?q=PRUEBAS+DE+BONDAD+DE+AJUSTE&qs=n
&form=QBRE&msbsrank=5_5__0&sp=-
1&ghc=1&pq=pruebas+de+bondad+de+ajuste&sc=5-
27&sk=&cvid=0E997FDBF8AD4F51956ADE15095F4D53
Quevedo, F. (2011, 1 diciembre). La prueba de ji-cuadrado - Medwave. Prueba de
la Ji-Cuadrada. https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266
http://riotorto.users.sourceforge.net/R/noparam_tabl/index.html
Villasante, P. (2019, 28 enero). Pruebas no paramétricas: definición y tipos.
Recuperado abril de 2021, de https://lamenteesmaravillosa.com/pruebas-no-
parametricas-definicion-y-tipos/
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Categor/Tema2Cate.pdf
Marqués dos Santos, María José; Estadística Básica: un enfoque no parametrico,
Universidad Nacional Autonoma de México, Facultad de Estudios Superiores
Zaragoza.