R30405251184705389653f0c068d7ea0 28642825

MUESTRAS
GRANDES
Y PEQUEÑAS
Estadística Inferencial
Bloque 2
ESTADÍSTICA INFERENCIAL
El presente material recopila una serie de definiciones, explicaciones, ejemplos y ejercicios prácticos de autores
especializados que te ayudarán a comprender los temas principales de este bloque.
Las marcas empleadas en la antología son única y exclusivamente de carácter educativo y de investigación, sin
fines lucrativos ni comerciales.
2
Muestras grandes y pequeñas
3. Inferencia estadística con muestras grandes

En la teoría de muestreo se tienen dos casos de acuerdo con el tamaño de la muestra:
Figura 1. Tamaños de muestra
Fuente: Elaborado a partir de Rojo (2017).
En ambos casos, el estadístico de prueba sigue un comportamiento normal y en la t student se tiene una
curva normal o campana de Gauss escalada a menos de 30 datos, ésta es ideal para muestras iniciales
donde se quiere inferir, así como estimar los principales parámetros poblacionales con la menor cantidad
de datos; ahora bien, si se requiere mayor precisión, exactitud y confianza debe ampliarse el tamaño de
muestra a más de 30 cifras.
3.1. Inferencia estadística, tipos de estimadores, evaluación de la

bondad de un estimador puntual y de un estimador por intervalo
Los parámetros estadísticos definen las características de interés de una población, ya sea la tendencia
central (media, moda o mediana) o su dispersión (varianza, desviación estándar, error estándar o rango).
Los estimadores estadísticos permiten inferir el valor aproximado de un parámetro poblacional, a partir
de una muestra extraída de esta población. Dentro del campo de estudio de la inferencia estadística se
tienen dos tipos de estimadores, a saber:
3
Figura 2. Características de los estimadores
Estimador muestral Estimador puntual Estimador por intervalo
Insesgado: es Es el cálculo de un sólo Es el cálculo de dos valores:

decir, cercano al valor para estimar el uno máximo y otro mínimo que
valor del parámetro correspondiente al definen un intervalo, en donde,
poblacional. parámetro poblacional. de acuerdo con cierto nivel de
confianza o significancia
Varianza mínima: generalmente establecida en el
para no tener 95%, puede encontarse el
tamaños de parámetro poblacional.
muestra grandes.
Fuente: Elaborado a partir de Escudero (2016).
Los estimadores puntuales tienen la desventaja de que, al tener un sólo valor, están sujetos a la
variación que sufra el tamaño de la muestra. En el caso de los estimadores por intervalo se posee la
ventaja de que, con un cierto grado de confianza (normalmente del 95%), el parámetro poblacional se
concentre en alguno de estas dos cifras, lo que permite disponer de un grado de confianza mayor, como
consecuencia de la definición de un intervalo. Por lo tanto, se cuenta con los siguientes parámetros y
estimadores:
Cuadro 1. Principales estimadores muestrales y parámetros poblacionales puntuales
Parámetro Muestra Población

estadístico Estimador Parámetro
Media  μ
Varianza S2 σ2
Desviación estándar S σ
Proporción p π
Fuente: Escudero (2016).
En este caso, sólo hay un valor calculado que se estima igual o muy cercano al parámetro poblacional.
4
Cuadro 2. Principales estimadores muestrales y parámetros poblacionales de intervalo
Intervalos de confianza
Muestras grandes Muestras pequeñas Proporciones
Donde
 = media muestral
σ = desviación estándar poblacional
p = proporción del éxito
Zα/2 = distribución normal
n = tamaño de la muestra
α = nivel de significancia (1-α)
Para determinar este aspecto, se tienen al menos dos valores, entre los cuales, el parámetro poblacional
puede encontrarse con un cierto nivel de confianza. La pregunta central al estimar mediante muestras el
parámetro proporcional, es la exactitud y el grado de error que puede tener dicha estimación. A este tipo
de evaluaciones se les conoce como bondad de ajuste o confiabilidad de ajuste y están determinadas
por los siguientes elementos:
Nivel de significancia o confianza definido por Z para muestras grandes y que define los siguientes
valores para Z:
Figura 3. Principales valores para estadístico Z de acuerdo con los niveles de confianza
Para un intervalo de confianza del 90% el valor de Z es 1.64
Error experimental que está asociado directamente al nivel de confianza, que se identifica con la
letra griega alfa (α), y para los valores ya definidos:
Si el intervalo de confianza es 90%, α es igual a 10%.
5

El valor p o p-value: permite definir si el estimador muestral y el parámetro poblacional en cuestión

son iguales o diferentes, con lo cual se definen así dos hipótesis para la bondad de ajuste:
H0(hipótesis nula o cero): el estimador muestral y el parámetro son iguales.
Ha(hipótesis alterna): el estimador muestral y el parámetro no son iguales.
A partir de lo anterior, se puede decir que si el valor de p > α, el estimador y el parámetro son iguales; por
el contrario, si p < α, el estimador y el parámetro son diferentes.
Otra forma de definir si el estimador y el parámetro son iguales, es mediante la ubicación del valor p
calculado en la región de aceptación o rechazo de la hipótesis cero o nula. Si el valor p está en la sección
de aceptación, el estimador y el parámetro son iguales; sin embargo, si está en la de rechazo, el estimador
y el parámetro son diferentes.
Figura 4. Regiones de aceptación y rechazo de hipótesis nula Ho
Esto se revisará con más detalle en los siguientes temas.
3.2. Estimación puntual de la media de una población,

estimación por intervalo de la media de una población
Consideremos el siguiente caso, una empresa productora de arroz en bolsas de 1 kg, ha recolectado una
muestra de 33 bolsas (muestra grande) de 1 kg en una población de 450 bolsas para verificar si siempre
se empacan “kilos de a kilo”, teniendo los siguientes datos en gramos:
6
Cuadro 3. Tabla de datos de la muestra de gramos
1023 1002 1003
1000 1001 1058
999 1056 1049
1054 1047 1040
1045 1038 1007
1036 1005 1009
1003 1007 1013
1005 1011 1014
1009 1012 1029
1010 1027 1006
1025 1004 1005
Calculemos el estimador de la media muestral puntual y el indicador de la media por intervalo; para ello,
debes tener en cuenta que el nivel de confianza o significancia es del 95%. Por lo que, primero debes
obtener la media muestral puntal mediante la siguiente fórmula:
Figura 5. Fórmulas de cálculo de los estimadores muestrales para medias y error estándar
Fuente: Cornejo (2018).
7
El promedio es igual a (1023+1000+ 999+1054+1045+ 1036+1003+ +1005+1009+1010+…+1005) /

33, es decir, 1019.75 gramos. Esto quiere decir, que tenemos la media puntual de 1019.75 gramos,
ahora nos falta estimar la desviación estándar de los datos. Para ello se empleará el comando de
Excel = desvest(rango de datos); de dicha operación resultan 18.853 gramos.
Para computar el estimador por intervalo de la media, usaremos la fórmula de Guamán (2017) para
intervalos de la media y con Z del 95%, lo cual nos arrojará un valor de 1.96. Con estos datos se
posee el siguiente cálculo de intervalos:
1019.75 ± 1.96 * 18.853 / 33 ^ 0.5 = 1019.75 ± 6.432.
El intervalo resultante es (1025.81, 1013.32), dato que posibilita el afirmar, con un 95% de confianza,
que la media poblacional está entre los valores de 1013.32 a 1025.81 gramos, en otras palabras, que
sí se surten (en general) “kilos de a kilo”.
3.3. Estimación de la diferencia de dos medias
En ocasiones será necesario evaluar el estimador muestral de la diferencia de las medias de dos
poblaciones. Inicialmente se tendrá el indicador muestral de la diferencia, mismo que se calculará de
acuerdo con esta fórmula:
Figura 6. Fórmulas de cálculo de la diferencia de dos medias
Fuente: Mmteresass (2012).
Ahora bien, si se requiere la estimación por intervalo de la diferencia de dos medias, pero se conocen
las desviaciones estándar de la población, se utiliza la fórmula:
Figura 7. Fórmulas de cálculo del intervalo de la diferencia de dos medias
Fuente: Mmteresass (2012).
8
Hagamos un ejercicio, para ello considera las siguientes muestras tomadas de dos poblaciones:
Cuadro 4. Tabla de datos para el cálculo de la diferencia de dos medias
Datos Muestra 1 Muestra 2
n 36 40
σ 5 3
 75 55
1.Calculemos el estimador puntual de la diferencia de medias.

2. Computemos el estimador por intervalos de la diferencia de medias con un nivel de confianza del 90%.
Para el primer caso, se sustituyen los valores en la fórmula con el fin de obtener los siguientes
datos:
µ1-µ2 = 75 - 55 = 20
Para el segundo, es necesario remplazar las cifras de la fórmula, sin dejar de considerar que Z para
el 90% es igual a 1.64, por consiguiente:
(75 - 55) – 1.64* (25 / 36 + 9/40) ^ 0.5 < µ1- µ2 < (75 - 55) + 1.64 * (25 / 36 + 9 / 40) ^ 0.5
20 - 1.64 * (0.694 + 0.225) ^ 0.5 < µ1- µ2 < 20 + 1.64*(0.694 + 0.225) ^ 0.5
20 - 1.64 * (0.919) < µ1- µ2 < 20 + 1.64 * (0.919)
20 - 1.507 < µ1 - µ2 < 20 + 1.507
18.493 < µ1- µ2 < 21.507
Finalmente, se obtiene que el intervalo de la diferencia de las medias poblacionales se encuentra entre
los valores de 18.427 al 21.573.
3.4. Estimación del parámetro de una población binomial,

estimación de la diferencia entre dos proporciones
Ahora bien, el análisis de las proporciones binomiales o que presentan sólo dos resultados posibles:
éxito o fracaso, aprobación o rechazo, y que se pueden observar, por ejemplo, en el lanzamiento de una
moneda o en la inspección de piezas para detectar algunas con defectos, normalmente se caracterizan
por la proporción sin defecto (p) y por la que sí lo tiene (q), razón por la cual:
p=1-q
9
La fórmula para calcular la diferencia de dos proporciones binomiales o de aceptación / rechazo es:
Figura 8. Fórmulas de cálculo del intervalo de la diferencia de dos proporciones
Fuente: Estadística útil (2018).
Donde p es la proporción sin defecto y q la porción con imperfectos, n el tamaño de la muestra y Z el

nivel de confianza.
Consideremos un caso, se quiere conocer el intervalo por diferencia de proporciones entre dos procesos
de fabricación que generan piezas rechazadas con un 90% de confianza:
Cuadro 5. Tabla de datos para el cálculo de la diferencia de dos proporciones
Datos Muestra 1 Muestra 2
n 1500 2000
piezas defectuosas 75 80
p 0.95 0.96
q 0.05 0.04
De acuerdo con la formula, el intervalo se calcula:
(0.95 - 0.96) ± 1.64* ((0.95*.05 / 1500) + (0.96 * 0.04 / 2000)) ^ 0.5

- 0.01 ± 1.64 * ((0.475 / 1500) + (0.384/ 2000)) ^ 0.5
- 0.01 ± 1.64 * 0.0226 igual a - 0.01 ± 0.0370
La diferencia de las proporciones estará entre los valores: ( - 0.047,0.094).
3.5. Selección del tamaño de la muestra
La selección del tamaño de muestra está íntimamente relacionada con la distribución binomial, ya que
por lo general su cálculo involucra probabilidades de éxito o fracaso, nivel de confianza y tamaño de
muestra poblacional:
10
Figura 9. Fórmula. Cálculo óptimo del tamaño de muestra
Fuente: Ramos (2009).
Ya se ha realizado un ejercicio con esta fórmula en el bloque 1 para el caso de los iPhone con defecto.
Ahora bien, la precisión normalmente se sitúa entre el 1 y 3 % para no afectar el nivel de confianza
de la muestra, ya que entre más grande sea la precisión, el tamaño de la muestra óptima disminuye,
por lo que es importante mantenerla en estos niveles y tener una muestra representativa, así como con
un buen nivel de precisión.
3.6. Utilización de software de estadística para la solución de problemas
Para la resolución de los problemas de este bloque, se podrán utilizar los siguientes softwares de estadística:
Cuadro 6. Tabla del software más utilizado para la solución de problemas
Herramientas Características Funciones Descargas
Hoja de cálculo
electrónica
con funciones
estadísticas Incluido en
Excel suite
básicas y la suite de
de microsoft
avanzada y Microsoft 365.
apoyo con
la ayuda del
software.
11
Software
estadístico
para
Minilab ver 19
aplicaciones
industriales y
académicas.
Software
estadístico
para
SPSS IBM ver aplicaciones
en ciencias
sociales y
académicas.
Fuente: Elaborado a partir de Aplicación Excel, software Minitab y software SPSS de IBM.
12
4. Inferencia estadística con muestras pequeñas
4.1. La distribución t de Student
La distribución t student es una manera de analizar muestras con valores de datos menores a 30, mientras
que la distribución Z o normal, se emplea para hechos mayores a esta cantidad. La t student también se
denomina: distribución de muestras pequeñas continuas y su fórmula involucra una comparación entre
las medias muestrales y las poblacionales contrastadas con la desviación estándar, entre la raíz cuadrada
del tamaño de la muestra n.
Figura 10. Fórmula de distribución t student
Fuente: Rustom (2012).
Esta distribución es muy usada en la industria para establecer si la media muestral y poblacional son
iguales o si dos medias muestrales son iguales entre sí, para lo cual, se considera un porcentaje de
error denominado α (alfa) y que por lo general equivale a 0.05. Al hacer un supuesto o hipótesis de
que las medias son iguales, se tienen dos alternativas:
1. (hipótesis nula): la media muestral y poblacional son iguales.

2. (hipótesis alterna): la media muestral y poblacional son diferentes.
Se debe construir una gráfica que defina las regiones de aceptación y rechazo para la hipótesis nula,
y con el valor calculado, definir en cuál de las dos secciones se encuentra.
4.2. Inferencia con muestras pequeñas para la media de la población
Se desea saber si la media de calificaciones de la asignatura estadística descriptiva de un grupo de

licenciatura de administración es igual a la media poblacional de toda la escuela. Para descubrirlo se
tienen los siguientes datos:
Media de la población μ = 8.5

Media de la muestra o de la licenciatura de administración x = 7.9
Tamaño de la muestra n = 35 alumnos.
13
Desviación estándar muestral s = 5.6

Error estadístico de la muestra α = 0.05
t es igual a (7.9 - 8.5) / (5.6 / (35 ^ 0.5)), es decir, (- 0.6) / (5.6 / 5.91)
t = - 0.6 / 0.946 = - 0.633
Ahora bien, se debe construir el gráfico, por lo que es necesario considerar que α = 0.05 para una cola y
para dos colas α/2 = 0.025 Una vez conocidos estos datos, se tomarán dos colas para los valores en la
tabla de t student para α/2 = 0.025 y n - 1 = 35 - 1 = 34 grados de libertad (gl):
Cuadro 7. Tablas t student
Fuente: Romero (2014).
14
Una vez construida la gráfica y ubicado el valor de t (- 0.633), se tiene:
Figura 11. Gráfica de aceptación t student
Como el valor de t = - 0.0633 está dentro de la región de aceptación de la hipótesis nula, se puede
concluir, con un error de 5% o 0.05, que la media muestral del promedio de calificaciones de los
estudiantes de administración y la media de la población de la escuela son iguales.
4.3. Inferencia con muestras pequeñas para la diferencia entre dos medias
A continuación, se revisará el caso de la diferencia de medias para muestras pequeñas, mediante el uso
de la forma del estadístico de prueba t:
Figura 12. Fórmulas de diferencia de medias para muestras pequeñas
Fuente: Leandro (2017)
15
En este caso, δ representa la diferencia de las medias. Ahora bien, consideraremos los siguientes
supuestos básicos:
Tenemos medias muestrales iguales, por lo que delta δ = 0.

Tenemos desviaciones estándar muestrales iguales, así que sólo calcularemos las medias y
desviaciones muestrales.
Tenemos las siguientes hipótesis:
H0 µ1 = µ2 ó < µ1 - µ2 = 0
Ha µ1 - µ2 > 0 ó < µ1 > µ2
Para efectos prácticos, trabajemos el caso de dos vendedores cuyas transacciones se presentan a
continuación:
Cuadro 8. Tabla de ventas en millones
Ventas en millones de USD

Vendedor
Desviación
Ene Feb Mar Abr May Jun Jul Ago Sep Promedio
Estandar
1 59 68 44 71 63 46 69 54 48 58 10.44
2 50 36 62 52 70 41 51.83 12.69
Elaborado a partir de Leandro (2017)
Una vez calculados los promedios de cada muestra, así como sus desviaciones estándar, y con el
supuesto de que las desviaciones estándar poblacionales son iguales, procedamos a determinar la
varianza:
Figura 13. Cálculo de la varianza
16
Ya con la varianza, computemos el estadístico de prueba t, para ello, consideremos que delta δ = 0:
Figura 14. Cálculo de la varianza
Por último, debemos construir el gráfico, por lo cual es importante considerar que α = 0.05 para una cola.
En este sentido, tomaremos sólo una cola por la hipótesis alterna de µ1 > µ2 de los valores en la tabla de
t student para α / 2 = 0.025 y n1+ n2 - 2 = 9 + 6 - 2 = 13 grados de libertad (gl):
Cuadro 9. Tablas t student
Fuente: Romero (2014)
17
Una vez concluida la gráfica y situado el valor de t (1.031), se puede observar lo siguiente:
Figura 15. Gráfica de aceptación t student
Como 1.031 está en la región de aceptación, es posible concluir que las medias poblacionales no son
diferentes estadísticamente, pese a que en el estimador puntual lo son.
4.4. Prueba para diferencias pareadas
Cuando en la práctica se tienen datos de situaciones muy parecidas o casi idénticas, se aplica el concepto
de t pareada o comparación de medias, cuyos hechos son iguales o lo más cercano a lo equivalente, sin
embargo, se debe considerar que dos procesos, aun cuando tengan los mismos operadores, las máquinas
sean similares y produzcan un producto parecido, no ofrecerán resultados exactos porque existe una
variación inherente en los procedimientos.
Del ejercicio que realizamos al comparar las medias de dos vendedores diferentes, pese a que ambos
presentan tamaños de muestra distintos y medias diferentes (comerciante 1 [10.44] y comerciante 2
[12.69]), estadísticamente poseen la misma media por la varianza calculada, lo que puede implicar que
los métodos de venta y los resultados obtenidos en esta comparación por pares o pareada, nos dé la
igualdad estadística por la región de aceptación de la hipótesis nula.
Otros experimentos clásicos de la t pareada pueden ser:
Comparar la velocidad alcanzada por 2 corredores mientras usan dos marcas de tenis en un
maratón.
Confrontar la durabilidad de dos focos para proyector de diferentes empresas que funcionen
alrededor de 1,500 horas o más.
4.5. Inferencias acerca de la varianza de una población
Ahora revisarás el caso de calcular el estimador de la varianza poblacional a partir de la varianza muestral.
Para este computo se usará la distribución chi cuadrada que, al depender de los grados de libertad que
son el tamaño de muestra menos 1, se tendrá un comportamiento normal. Veamos la fórmula:
18
Figura 16. Fórmula de cálculo del estimador de desviación estándar poblacional a partir de la desviación estándar muestral
a través de la distribución de la chi cuadrada
Fuente: Quantitative shop (2018).
Pensemos el caso de tener 20 datos de una muestra, una varianza muestral de 0.0025 y un nivel de
confianza de 95%. ¿Cuál será el intervalo de la media poblacional al utilizar la distribución chi cuadrada?
Normalmente se buscan los valores de cada chi cuadrada por medio de tablas, pero también se puede
realizar mediante los siguientes comandos de Excel:
Cuadro 10. Cálculo de comandos de Excel para los valores de intervalo de la cola derecha e izquierda de la chi cuadrada
n 20 32.85232686 = PRUEBA.CHI.INV(0.025,19)
S2 0.0025 8.906516548 = PRUEBA.CHI.INV(0.975,19)
IC 95%
Fuente: Elaborado a partir de Quantitative shop (2018).
Para computar el intervalo de la cola derecha de la distribución se usa el comando = PRUEBA.CHI.INV

(0.025,19), ya que 0.025 es el error de 0.05 para la cola izquierda y = PRUEBA.CHI.INV (0.975,19) para
la cola derecha, así como 19 por los grados de libertad de n-1 (20 - 1), lo que da un valor de 32.852 y
8.907.
Veámoslo gráficamente:
Figura 17. Valores del intervalo de la varianza poblacional calculadas por medio de la distribución chi cuadrada
Fuente: Quantitative shop (2018).
19
El estimador por intervalos de la varianza poblacional, a partir de la media muestral, se encuentra entre
8.907 y 32.852 con un 95% de confianza.
4.6. Comparación de las varianzas de dos poblaciones
Finalmente, se abordará el caso de tener que definir la diferencia de dos varianzas poblacionales, mediante
el uso de las varianzas muestrales; para ello se tendrá en cuenta el siguiente problema.
Figura 18. Datos para el cálculo de la diferencia de varianzas poblacionales y las pruebas de hipótesis
Fuente: Jurado (2018).
Interesa conocer si la desviación estándar 1 es menor o igual que la desviación estándar 2. Como
hipótesis nula o y como alterna o , se tendrá que la desviación estándar 1 sea mayor que la
desviación estándar 2. Para este caso, emplearemos la prueba F o distribución F de Fisher para la
estimación de este intervalo de desviaciones poblacionales.
Figura 19. Fórmula para el cálculo de la diferencia de medias muestrales
Calculemos el valor del estadístico F. La prueba F es igual a / , lo cual después de la operación

es igual a 2.848. Computemos ahora el valor en tablas de la F con 20 y 22 grados de libertad.
20
Cuadro 11. Tabla de Fisher al 95% de confianza para dos muestras
Fuente: Valdez (2019).
En la tabla de Fisher para 95% y con 20 para la muestra 1, y 22 para la muestra 2, se obtiene un valor
de 2.071. Una vez construida la gráfica de aceptación y rechazo, se puede visualizar lo siguiente:
Figura 20. Gráfica de región de aceptación
Como el valor de 2.848 del estadístico F está en la zona de rechazo de , se acepta la hipótesis
alterna. Con un 95% de confianza es posible afirmar que la desviación estándar poblacional 1 es
mayor que la desviación estándar poblacional 2 , es decir, > .
21
4.7. Utilización de software de estadística para la solución de casos
Para la resolución de los problemas de este bloque se pueden emplear los siguientes softwares de
estadística, algunos ellos son:
Cuadro 12. Tabla de softwares para la solución de problemas
Softwares Función
Es un sistema de programas para el análisis de datos.

sas (Statistical Consiste en un conjunto de módulos capaces de entregar
Analysis resultados de diferentes procesos como regresión,
System) análisis de varianza, estadística básica, distribución de
frecuencias y procedimientos multivariados. (p. 3).
spps
Es la herramienta estadística más utilizada a nivel mundial
(Statistical
en el entorno académico. Puede trabajar con bases de datos
Package for
de gran tamaño. Además, de permitir la recodificación de las
the Social
variables y registros según las necesidades del usuario. (p. 4).
Sciences)
Es utilizado principalmente por instituciones académicas

y empresariales dedicadas a la investigación,
Stata
especialmente en economía, sociología, ciencias
políticas, biomedicina y epidemiología. (p. 4).
Es un programa de computadora diseñado para

ejecutar funciones estadísticas básicas y avanzadas.
Minitab Uno de los más usados a nivel mundial. Combina lo
amigable del uso de Microsoft Excel con la capacidad
de ejecución de análisis estadísticos. (p. 4).
Es una aplicación de software libre para el análisis

de datos. Se presenta en modo gráfico y está escrita
pspp en el lenguaje de programación C. Usa la biblioteca
científica gnu para sus rutinas matemáticas, y
plotutils para la generación de gráficos. (p. 5).
Este programa es desarrollado y distribuido por Microsoft, y es

Excel
utilizado normalmente en tareas financieras y contable. (p. 5).
22
Es una herramienta de software matemático que

ofrece un entorno de desarrollo integrado (ide)
con un lenguaje de programación propio.
Matlab Entre sus prestaciones básicas se hallan: la manipulación

de matrices, la representación de datos y funciones, la
implementación de algoritmos, la creación de interfaces de
usuario (gui) y la comunicación con programas en otros
lenguajes y con otros dispositivos hardware. (p. 5).
Es un software para análisis estadístico de aplicación

general desarrollado bajo la plataforma Windows.
Cubre, tanto las necesidades elementales para la
InfoStat
obtención de estadísticas descriptivas y gráficos para
el análisis exploratorio, como métodos avanzados de
modelación estadística y análisis multivariado. (p. 5).
Fuente: Elaborado a partir de Universidad de la República de Uruguay (s.f).
23
REFERENCIAS
Cornejo, M. [Universidad Austral]. (2018). Distribuciones muestrales [Archivo de video]. Recuperado de
Escudero, I. (2016). Taller Estadística Aplicada con estudios para la Investigación Biométrica. Recuperado
de
Estadística útil. (2018, abril 12). Intervalo de confianza para la diferencia de proporciones [Archivo de
video]. Recuperado de
Jurado, S. (2018, enero 24). Prueba de hipótesis para dos varianzas [Archivo de video]. Recuperado de
Leandro, G. (2017, septiembre 18). Estadística prueba de hipótesis diferencia de medias para muestras
pequeñas- parte 8 [Archivo de video]. Recuperado de
Mmteresass. (2012, octubre 27). Estimación de diferencias de medias [Archivo de video]. Recuperado
de
Quantitative shop. (2018, enero 24). Inferencia sobre varianzas poblacionales [Archivo de video]. Recu-
perado de
Ramos, A. (2009). Cálculo tamaño óptimo de la muestra. Recuperado de
Rojo, A. (2017). Principios de estadísticas inferenciales prueba de hipótesis: muestras pequeñas.

Recuperado de
Romero, A. (2014). Estadística. Tablas t student. Recuperado de
Rustom, A. (2012). Estadística descriptiva, probabilidad e inferencia [versión electrónica]. Recuperado

de
Universidad de la República de Uruguay. (S.f). Softwares Estadísticos. Recuperado de
Valdez, I. (2019). Tabla 5. Valores F de la distribución F de Fisher. Recuperado de
24

R30405251184705389653f0c068d7ea0 28642825

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

R30405251184705389653f0c068d7ea0 28642825

Cargado por

Copyright:

Formatos disponibles

MUESTRAS

Muestras grandes y pequeñas

3. Inferencia estadística con muestras grandes

Figura 1. Tamaños de muestra

Fuente: Elaborado a partir de Rojo (2017).

3.1. Inferencia estadística, tipos de estimadores, evaluación de la

Figura 2. Características de los estimadores

Estimador muestral Estimador puntual Estimador por intervalo

Insesgado: es Es el cálculo de un sólo Es el cálculo de dos valores:

Fuente: Elaborado a partir de Escudero (2016).

Cuadro 1. Principales estimadores muestrales y parámetros poblacionales puntuales

Parámetro Muestra Población

Fuente: Escudero (2016).

Cuadro 2. Principales estimadores muestrales y parámetros poblacionales de intervalo

Muestras grandes Muestras pequeñas Proporciones

σ = desviación estándar poblacional

p = proporción del éxito

Zα/2 = distribución normal

α = nivel de significancia (1-α)

Fuente: Escudero (2016).

Para un intervalo de confianza del 90% el valor de Z es 1.64

Para un intervalo de confianza del 95% el valor de Z es 1.96

Para un intervalo de confianza del 99% el valor de Z es 2.58

Fuente: Escudero (2016).

Si el intervalo de confianza es 95%, α es igual a 5%.

 El valor p o p-value: permite definir si el estimador muestral y el parámetro poblacional en cuestión

Figura 4. Regiones de aceptación y rechazo de hipótesis nula Ho

Fuente: Escudero (2016).

Esto se revisará con más detalle en los siguientes temas.

3.2. Estimación puntual de la media de una población,

Cuadro 3. Tabla de datos de la muestra de gramos

1023 1002 1003

1000 1001 1058

999 1056 1049

1054 1047 1040

1045 1038 1007

1036 1005 1009

1003 1007 1013

1005 1011 1014

1009 1012 1029

1010 1027 1006

1025 1004 1005

Fuente: Cornejo (2018).

El promedio es igual a (1023+1000+ 999+1054+1045+ 1036+1003+ +1005+1009+1010+…+1005) /

1019.75 ± 1.96 * 18.853 / 33 ^ 0.5 = 1019.75 ± 6.432.

3.3. Estimación de la diferencia de dos medias

Figura 6. Fórmulas de cálculo de la diferencia de dos medias

Fuente: Mmteresass (2012).

Figura 7. Fórmulas de cálculo del intervalo de la diferencia de dos medias

Fuente: Mmteresass (2012).

Cuadro 4. Tabla de datos para el cálculo de la diferencia de dos medias

Datos Muestra 1 Muestra 2

1.Calculemos el estimador puntual de la diferencia de medias.

3.4. Estimación del parámetro de una población binomial,

Figura 8. Fórmulas de cálculo del intervalo de la diferencia de dos proporciones

Fuente: Estadística útil (2018).

Donde p es la proporción sin defecto y q la porción con imperfectos, n el tamaño de la muestra y Z el

Cuadro 5. Tabla de datos para el cálculo de la diferencia de dos proporciones

Datos Muestra 1 Muestra 2

De acuerdo con la formula, el intervalo se calcula:

(0.95 - 0.96) ± 1.64* ((0.95*.05 / 1500) + (0.96 * 0.04 / 2000)) ^ 0.5

La diferencia de las proporciones estará entre los valores: ( - 0.047,0.094).

El valor p o p-value: permite definir si el estimador muestral y el parámetro poblacional en cuestión

(0.95 - 0.96) ± 1.64* ((0.95.05 / 1500) + (0.96 0.04 / 2000)) ^ 0.5

Media de la población μ = 8.5

Desviación estándar muestral s = 5.6

Tenemos medias muestrales iguales, por lo que delta δ = 0.