Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Final Inferencia-Estadistica
Final Inferencia-Estadistica
Por
Eliana Vasquez
Código:
Sandy Torres
Código:
Ana Silvia Espinosa Ramírez
Código: 1118122381
Sonia Fuentes
Código:
María Zulma Alarcón Ávila
Código: 52996069
Inferencia Estadística
551112- 5
Presentado a
Freddy Yesid Villamizar
La estadística como rama de las matemáticas que con sus métodos y técnicas de muestreo
esta requiera.
que se encarga de generalizar al total de la población las características obtenidas al analizar una
las medidas de dispersión, diferentes tipos de ejercicios donde nos permiten interactuar con
Objetivo general
formular hipótesis sobre una población objeto de estudio partir de una muestra, mediante la
Objetivos específicos
Consultar la definición, propiedades, cuando o para qué se utiliza de las siguientes palabras
punto de interés es la muestra, la cual debe ser representativa de la población objeto de estudio.
Una población está formada por la totalidad de las observaciones en las cuales se tiene cierto
(parámetros), o estadísticos para estimar valores poblacionales, pueden ocurrir dos tipos
misma población. Aún si se ha tenido gran cuidado para asegurar que dos muestras del mismo
tamaño sean representativas de una cierta población, no esperaríamos que las dos sean idénticas
en todos sus detalles. El error muestral es UN concepto importante que ayudará a entender mejor
la naturaleza de la estadística inferencial. Los errores que surge al tomar las muestras y que no
promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parámetro real. Ejemplo:
la longitud del dedo índice de personas de la misma edad y sexo. El sesgo muestral puede
población en el que la selección es imparcial o no está sesgada; una muestra elegida con
El muestreo estratificado.
El muestreo sistemático.
Si una muestra aleatoria se elige de tal manera que todos los elementos de la población
La distribución muestral resulta de considerar todas las muestras posibles tomadas de una
población.
Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de
El muestreo puede hacerse con o sin reposición y la población de partida puede ser
infinita o finita.
Una población finita en la que se efectúa muestreo con reposición puede considerarse
infinita teóricamente. Una población muy grande puede considerarse como infinita.
En todas las posibles muestras de tamaño n en una población. Para cada muestra es
posible calcular un estadístico (media, desviación típica, proporción) que variará de una a
otra. Así se obtiene una distribución del estadístico que se llama distribución muestral.
Las dos medidas fundamentales de esta distribución son la media y la desviación típica,
griega minúscula sigma σ o la letra latina s, así como por las siglas SD (de standard desviation,
de datos numéricos.
Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media (también denominada el valor esperado), mientras
que una desviación estándar alta indica que los datos se extienden sobre un rango de valores más
amplio.
aunque en la práctica menos robusta, que la desviación media. Una propiedad útil de la
desviación estándar es que, a diferencia de la varianza, se expresa en las mismas unidades que
la media" (cuando se refiere a una media). Se calcula como la desviación estándar de todas las
medias que se calcularían a partir de esa población si se extrajera un número infinito de muestras
partir de esa población (como la media) son bastante diferentes pero están relacionados
El margen de error de una encuesta se calcula a partir del error estándar de la media (o
doble de la desviación estándar: la mitad del ancho de un intervalo de confianza del 95 por
ciento.
Cuando solo está disponible una muestra de datos de una población, el término
mencionada anteriormente aplicada a esos datos o también a una cantidad sobre la que se realiza
un ajuste que sirve de estimación no sesgada de la desviación estándar de la población (es decir,
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre
generalmente por μ y σ .
fundamentales:
la distribución normal proporciona las bases para la estadística inferencial clásica por su
La desviación estándar indica que tan agrupados o dispersos están los datos alrededor de
extremos esto debido a que los datos se encuentran más alejados de la media.
N (μ,σ)
μ= Mediade la poblacion
σ =Desviación estándar
Propiedades o Características
deviación estándar σ .
alrededor del valor medio. Es decir, a mayor σ la forma de campana es más
abierta. En cambioσ pequeño indica que los dados se ciñen a la media y la forma
Se utiliza muy a menudo porque hay muchas variables asociadas a fenómenos naturales
como; personas, animales, plantas, entre otros. Se realizan análisis como por ejemplo de peso,
talla, diámetro, distancia, perímetro, entre otros. Características fisiológicas como, por ejemplo:
examen. En cuanto los fenómenos psicológicos, por ejemplo: cociente intelectual, grado de
adaptación a un medio, fenómenos relacionados con la violencia familiar, abuso sexual a niños,
entre otros.
obtenerse de las diferentes muestras de igual tamaño que conforman una población determinada.
Es una distribución de probabilidades de una estadística muestral calculada a partir de todas las
calculada a partir de todas las muestras posibles de tamaña “n” elegidas al azar de una población
determinada. Generalmente nos interesa conocer una o más de las siguientes características de la
distribución muestral.
Propiedades o Características
Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si
consideramos cada una de estas medias como valores de una variable aleatoria podemos
σ
N (μ, )
√n
Distribución de la varianza
varianza muestral S ², es posible hacerlo para una función S ². [ CITATION Lóp06 \l 3082 ]
variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una
distribución binomial y cuando la extensión de la población es grande la distribución binomial
√ pq
(
distribución normal N p ,
n ) donde p es la proporción de uno de los valores que
diferencia entre las medias de las muestras sigue la distribución normal con media m 1−m2=0 y
2 2
error estándar √(σ /n )+(σ /n ) CITATION Alf99 \l 3082 (Alfons Sarria Arrufat, 1999)
1 1 2 2
respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución
( n−1 ) S 21 ( n−1 ) S 22
2
y 2
σ1 σ2
Tiene distribución X 2 con n−1y m−1 grados de libertad respectivamente, siendo ambas
Una distribución de frecuencia relativa describe los porcentajes del número total de
La distribución o tabla de frecuencias es una tabla de los datos estadísticos con sus
subíndice representa cada uno de los valores. La suma de las frecuencias absolutas es igual al
f 1+ f 2 + f 3+ f 4+ f 5 +…+ f n
Equivalente a
∑ fi
i=1
entre el número total de datos, se representa por ni. La suma de las frecuencias relativas es
fi
ni =
N
3) Frecuencia acumulada: la suma de frecuencias absolutas de todos los valores iguales o
Ejemplo 1:
Se realiza una tabla de frecuencia con los datos del problema número 2. “La siguiente tabla muestra
σ =Desviación estándar.
Sus características
estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por σ x ,
es 1.58. Con esto se puede demostrar que, si de una población se eligen muestras de
En general se tiene: σ x =σ e
Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la
σ N −n
σ x=
√
√ n N −1
donde σ x es la desviación estándar de la población de donde se toman las muestras, n es el
N −n
El factor
√ N −1
se denomina factor de corrección para una población finita.
Calcule la antigüedad media para cada muestra, la media de la distribución muestral y el error
Solución: Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras
2+ 4+6
La media poblacional es: μ= =4
3
5+4 +3
La media de la distribución muestral es: μ X = =4
3
Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que:
σ 1,63
σ x= = =1.152
√ n √2
Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección
σ N −n 1,63 3−2
σ x=
√ =
√ n N −1 √ 2 3−1 √
=0,816
Imagen 5. Diagrama de flujo de las decisiones que deben tomarse cuando se calcula el
límite central) que la fdp de la media muestral es también normal con media m y varianza s2/n.
Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30) para
1º problema: No hay tablas para cualquier normal, sólo para la normal m=0 y s=1 (la
X́ −μ
z= una normal de media m y desviación s se transforma en unaz.
σ / √n
Llamando z a al valor de una variable normal tipificada que deja a su derecha un área bajo
la curva de a, es decir, que la probabilidad que la variable sea mayor que ese valor es a (estos son
X́ −μ
z 1−σ < <z
2 σ / √n σ2
σ σ σ
X́ −Z = < μ< X́ + ¿Z = ¿ La cual también se puede escribir X́ ∓ Z = o, haciendo énfasis en
a/2
√n √n
a /2
√n a/2
σ
que es el error estándar de la media, X́ ∓ Z EE( X́ )
a
√n 2
estimador de m.
Ejemplo: Si de una población normal con varianza 4 se extrae una muestra aleatoria de
tamaño 20 en la que se calcula X́ =5,3 se puede decir que m tiene una probabilidad de 0,95 de
2
5,3 ∓ 1,96 =(4,42 6,18)
√ 20
Que sería el intervalo de confianza al 95% para m
En general esto es poco útil, en los casos en que no se conoce m tampoco suele
s
X́ ∓t =
a/2
√n
s
o, haciendo énfasis en que es el error estándar estimado de la media,
√n
^ ( X́ )
X́ ∓t E E
a
2
Esta manera de construir los intervalos de confianza sólo es válida si la variable es normal.
1.7. Estimación, estimación puntual, estimación real y estimador del parámetro objetivo
qué valor debe tener un parámetro según deducciones que realizamos a partir de
poblacional (es decir, X = µˆ) y la varianza muestral como estimador de la varianza poblacional
( s ²=σˆ ²) Para una distribución Bi(m, p), donde m denota el número de pruebas de Bernoulli, la
proporción p se puede estimar a partir de la proporción poblacional (que denotaremos por pˆ).
Por tanto, X́ , s ² y pˆ son estimadores puntuales de µ ,σ ² (en distribución Normal) y p (en
Un estimador es una regla, a menudo expresada como una fórmula, que indica como calcular
el valor de una estimación con base en las mediciones contenidas en una muestra. Sáez, A.
(2010).
1.7.2. Estimación puntual: Una estimación puntual consiste en establecer un valor concreto
(es decir, un punto) para el parámetro. El valor que escogemos para decir “el
Como ese estadístico sirve para hacer esa estimación, en lugar de estadístico suele
Algunos estimadores frecuentes son: media muestral, proporción muestral, Varianza muestral,
Imagen 7: https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9GcQmAip9MywqitUZRRhFW5qxFKlRLH8MVPQlbA&usqp=CAU
No podemos evaluar la bondad de un procedimiento de estimación puntual en base
en el valor de una sola estimación; más bien, debemos observar los resultados cuando
agrupa esta distribución alrededor del parámetro objetivo. Sáez, A. (2010). Pag,392.
puntual, una estimación de intervalo o amabas. En cualquier caso, la estimación real se logra
¿cuál podríamos considerar mejor? Aquel que tenga menor varianza es más probable que dé
lugar a estimaciones que estén más próximas al verdadero valor del parámetro. Llamamos
Cuando damos un valor estimado de un parámetro, sería lógico dar una medida de la precisión
de esa estimación Error estándar del estimador El error estándar de un estimador es la desviación
típica de dicho estimador: Si la desviación típica depende del parámetro, la sustitución del
distribución en el muestreo)
Estimación por intervalo: Valores numéricos concretos que toma el estimador por
el error de estimación
términos de las distancias entre la estimación que genera y el parámetro objetivo. Esta cantidad,
que varia aleatoriamente en muestreo repetido, se denomina Error de estimación. Por supuesto
que nos gustaría que el Error de estimación fuera tan pequeño como fuera posible.
^ |.
ε =|θ−θ
Como θ es una variable aleatoria, el valor de estimación también es una cantidad aleatoria y no
podemos decir que tan grande o pequeña será para una estimación particular , pero podemos
Uno, que comprende la teoría de colas (líneas de espera), se refiere al número de personas
hospitales y clínicas.
La teoría estadística brinda cálculos probabilísticos del tamaño deseado del error muestral para
una estadística en particular o estimación; estos usualmente son expresados en términos de error
estándar
inferior
permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación
calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores
van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el
parámetro poblacional.
El intervalo de confianza no sirve para dar una estimación puntual del parámetro poblacional,
si nos va a servir para hacernos una idea aproximada de cuál podría ser el verdadero de este. Nos
consideraciones:
muestral.
denominado "intervalo de confianza".
desde la imagen 9
inferiores.
Parte B
Realizar los siguientes ejercicios y comparar cada uno de ellos con ayuda de un
Software, ya sea GeoGebra, R o RStudio, presentar evidencias del apoyo de este y justificar
Desarrollado por
DATOS ORDENADOS
25 28 32 33 35 36
38 42 44 44 47 48
48 49 51 52 53 56
57 58 58 59 61 63
66 67 69 72 76 78
Media
25+28+32+… .+72+76+78
=51.67
30
Mediana
Se ordenan los datos de menor a mayor y se encuentra el que queda en el medio. En este caso
como el dato es par se ubica los números que están en el medio y se saca el promedio.
Mediana = 51.5
Moda
Desviación Estándar
∑ ¿ x−μ∨¿2 ¿
σ=
√ N
Haciendo el cálculo
σ =14.82
compañía de computadoras.
Desarrollo
1. Primero se ordenan los datos en una tabla, para poder apreciar mejor cada uno de ellos.
Datos Ordenados
25,1 25,4 26,9 28,7 29,3
31,7 32,3 35,6 35,6 36,8
37,8 39,7 40,2 42,9 44,2
45,2 50,6 55,2 88,2 99,8
a. Calcular la media
Para calcular la media es de recordar que esta se halla al sumar todos los datos y dividir el
X́ =
∑ xi
N
851,2
X́ = =42,56
20
X́ =42,56
Por lo tanto y de acuerdo a lo anterior se puede identificar que la media para los datos en
miles de dólares sobre las ventas realizadas por 20 vendedores en una compañía de
b. Calcular la mediana
Para el caso de la mediana se tiene presente que es el valor que ocupa el lugar central de
todos los datos una vez estos están ordenados; cuando el número de datos es impar solo es tomar
exactamente el que ocupa el lugar central, pero como en este caso que el número de datos es par,
se toman los dos datos centrales (estando ordenados) y se halla el promedio, es decir;
~ 36,8+37,8
X= =37,3
2
~
X =37,3
los cuadrados de los valores y el cuadrado del promedio. Por tales motivos es que antes se
tiene que hallar la varianza recordando que esta es; promedio de los cuadrados de las
desviaciones medias alrededor de la media. Esta se halla teniendo presente los tipos de datos
Formula
σ=
√ ∑ ( x−μ )
n
n=Tamaño de la poblaciòn
μ= Media poblacional
Primer paso:
852,2
μ= =42,56
20
Se halla la varianza, esta se halla tomando cada uno de los datos, menos el promedio
σ 2
=
∑ ( X−μ )
n
7195,768
σ 2= =359,7884
20
Tercer paso:
σ =√ 359,7884=18,9680
7195,768
s2= =378,7246
19
s= √378,7246=19,4608
En cuanto a medidas de tendencia central elegiría; la media, la mediana; estas sirven como
punto de referencia para la interpretación de datos, además que se necesitan para sacar otros; en
el caso de la media es la suma de cada uno y todos los valores dividida entre el total de los datos,
sin embargo, no se debe fiar de esta únicamente para un análisis mas exacto puesto que esta
puede ser afectada por los valores de los datos extremos. La mediana; es la que ocupa el valor
central en un conjunto de datos para lo que los datos deben estar ordenados, de esta manera la
mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, es
muy recomendado y apropiado el uso de la media cunado se tienen que hacer observaciones
extremas.
varianza y la deviación estándar se realizan de pendiendo de si los datos que se tienen son de una
población o de una muestra lo que indica que los datos obtenidos son más precisos. El rango es
indicando por medio de números, se las diferentes puntuaciones de una variable están muy
alejadas de la media. Cuando mayor sea ese valor, mayor será la variabilidad, cuando menor sea,
mas homogénea será la media. Así se puede identificar si todos los datos son parecidos o si por
horas y una desviación típica de 40 horas. La población sigue una distribución normal. Si
∑ ( x−x )2
s2=
n−1
∑ ( x −x )2
σ=
n−1
σ =40 horas
σ 2=402
σ 2=1.600 horas
σ 40
σ x= = =13,333
√ n √9
0,95
95 %= =0,475 valor z=1,96
2
Datos:
n=25
x́=2,1
σ =0,45
1−∝=95 %
z=1,96
σ
formula: x́ ± z
√n
0,45
2,1 ±1,96
√ 25
0,45
μ=2,1± 1,96
5
μ=2,1± 1,96(0,09)
μ=2,1± 0,1764
μ=2,1+ 0,1764=2,2764
μ=2,1−0,1764=1,9236
μ=(1.9236 ; 2.2764)
0,99
99 %= =0,4950 valor z=2,58
2
Datos:
n=25
x́=2,1
σ =0,45
1−∝=99 %
z=2,58
σ
formula: x́ ± z
√n
0,45
2,1 ±2,58
√ 25
0,45
μ=2,1± 2,58
5
μ=2,1± 2,58(0,09)
μ=2,1± 0,2318
μ=2,1+ 0,2318=2,3318
μ=2,1−0,2318=1,8682
μ=(1.8682 ; 2.3318)
5. Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra.
hilos del proceso seleccionados aleatoriamente. Las tensiones son 20.8, 20.6, 21.0, 20.9,
19.9, 20.2, 19.8, 19.6, 20.9, 21.1, 20.4, 20.6, 19.7, 19.6, 20.3, 20.7. Supóngase que la
tensión de ruptura de una fibra se encuentra modelada por una distribución normal con
desviación estándar de 0.45 libras. Construir un intervalo de confianza estimado del 98%
Datos:
n=16
x́=20.38
σ =0,45
1−∝=98 %
z=2,3263
σ
formula: x́ ± z
√n
0,45
20,38 ±2,33
√ 16
0,45
μ=20,38± 2,3263
4
μ=20,38± 2,3263(0,1125 )
μ=20,38± 0,2617
μ=20,38+0,2617=20,6417
μ=20,38−0,2617=20.1183
μ=(20.1183 ; 20.6417)
Conclusiones
El anterior trabajo fue muy importante para reforzar los conocimientos previos sobre
estadística abordados en otros cursos. Su contenido puede ser transportado al contexto real, ya
utilizando intervalos, aspectos que pueden vincularse a nuestra vida cotidiana. Como futuros
aplicarlos en el proceso la enseñanza-aprendizaje dentro y fuera del aula a partir de una muestra
Las medidas de tendencia central, nos permiten interpretar los valores más
representativos de los datos de acuerdo a la forma como se tienden a concentrar; la media indica
el promedio de los datos, en otras palabras, indica el valor que obtendrá cada una de las unidades
de análisis si se distribuyen los valores en partes iguales, la media indica es el valor que separa
los datos en partes iguales, cada una de las cuales cuenta con el cincuenta de por ciento de los
datos.
Se puede concluir que este trabajo es muy importante porque aporta a nuestra vida cotidiana,
utilizando intervalos. El cual nos permite como futuros licenciados matemáticos llevarlos a cabo
Canavos, G., Meyer, P., Spiegel, M., & Mendenhall, S. (1988). Probabilidad y estadística.
canavos-g-probabilidad-y-estadistica-aplicaciones-y-metodos.pdf
Herrerias Pleguezuelo , R., & Palacios Gonzalez, F. (2007). Cursom de Inferencia Estadistica y
Educación.
de https://cran.r-project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf
http://asignatura.us.es/dadpsico/apuntes/EstimacionEstadistica.pdf
Wackerly, D., Mendenhall, W., & Scheaffer, R. (2009). Wackerly, D.D. and Mendenhall, W. and
Scheaffer, R.L. Estadística Matemática Con Aplicaciones, Séptima Edición, Cengage Learning.
Recuperado de https://docs.google.com/viewer?
a=v&pid=sites&srcid=Y2llbmNpYXMudW5hbS5teHxtLWVzdGFkaXN0aWNhMXk
WedGrafia
https://moodle2.unid.edu.mx/dts_cursos_mdl/pos/ME/TD/AM/07/La_distribucion_normal.pdf
https://www.youtube.com/watch?v=CuKr7GzohbI
https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/
https://www.youtube.com/watch?v=VTTqr5cAzvw
https://es.khanacademy.org/math/statistics-probability/sampling-distributions-library
https://commons.wikimedia.org/wiki/File:Normal_distribution_pdf.png
https://es.slideshare.net/djpachoncito/distribucion-normal-por-wallter-lopez
https://economipedia.com/definiciones/intervalo-de-confianza.html
https://www.uv.es/webgid/Inferencial/5_estimacin_por_intervalos.html#:~:text=b)%20Si%20conoci
%C3%A9ramos%20el%20valor,se%20establece%20alrededor%20del%20estimador.