Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2021
TEMARIO_U2
1.- INTRODUCCIÓN_________________________________________2
2.1 Conceptos básicos__________________________________________4
2.2 Distribuciones de muestreo.__________________________________7
2.3 Estimación puntual._______________________________________12
2.4 Estimación de intervalo.____________________________________17
Cómo calcular el intervalo de confianza_____________________36
2.5 Intervalos de confianza para medias._________________________39
2.6 Intervalos de confianza para diferencia entre medias.____________42
2.7 Intervalos de confianza para proporciones.____________________43
2.8 Intervalos de confianza para diferencias entre proporciones.______44
2.9 Intervalos de confianza para varianzas._______________________45
2.10 Intervalos de confianza para razones de dos varianzas__________46
1.- INTRODUCCIÓN
La Estadística descriptiva y la teoría de la Probabilidad van a ser los pilares de un
nuevo procedimiento (Estadística Inferencial) con los que se va a estudiar el
comportamiento global de un fenómeno. La probabilidad y los modelos de distribución
junto con las técnicas descriptivas, constituyen la base de una nueva forma de interpretar
la información suministrada por una parcela de la realidad que interesa investigar.
En el siguiente esquema representa el tema a tratar y que será desarrollado
a continuación.
Estadística Puntual
Estimación
Descriptiva
INFERENCIA
Probabilidad y
Contraste
modelos
Por tanto, algunos de los objetivos que se persiguen en este tema son:
muestral.
estimaciones realizadas.
de los individuos de la población ya sea por el coste que supondría, o por la imposibilidad
efectuados sobre la base informativa extraída de una muestra de dicha población. Por
La media poblacional: X
Total poblacional: X
Proporción: P
ESTIMADOR: Un estimador θ* de un parámetro θ, es un estadístico que se emplea para
conocer el parámetro θ desconocido.
ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable aleatoria,
cuyos valores dependen de la muestra seleccionada. Su distribución de probabilidad, se
conoce como “Distribución muestral del estadístico”.
ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un
resumen estadístico con las medidas que conocemos de Descriptiva) se extrapola o
generaliza dicho resultado muestral a la población total, de modo que lo estimado es el
valor generalizado a la población. Consiste en la búsqueda del valor de los parámetros
poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:
- Puntual: cuando buscamos un valor concreto.
- Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se supone que
va a estar el valor del parámetro que se busca con una cierta probabilidad.
CONTRATE DE HIPÓTESIS: Consiste en determinar si es aceptable, partiendo de datos
muestrales, que la característica o el parámetro poblacional estudiado tome un
determinado valor o esté dentro de unos determinados valores.
NIVEL DE CONFIANZA: Indica la proporción de veces que acertaríamos al afirmar que el
parámetro θ está dentro del intervalo al seleccionar muchas muestras.
2.2 Distribuciones de muestreo.
El objetivo de la inferencia es efectuar una generalización de los resultados de la
muestra de la población. La tarea que nos ocupa ahora es conocer las distribuciones de la
probabilidad de ciertas funciones de la muestra, es decir, variables aleatorias asociadas al
muestreo o estadísticos muestrales. Éstos serán útiles para hacer inferencia respecto a
los parámetros desconocidos de una población. Por ello se habla de distribuciones
muestrales, ya que están basados en el comportamiento de las muestras.
El primer objetivo es conocer el concepto de distribución muestral de un estadístico;
su comportamiento probabilístico dependerá del que tenga la variable X y del tamaño de
las muestras.
Sea x1.......xn, una muestra1 aleatoria simple (m.a.s) de la variable aleatoria X, con función
de distribución de la muestra que no contiene ninguna cantidad conocida.
Sea una población donde se observa la variable aleatoria X. Esta variable X, tendrá
una distribución de probabilidad, que puede ser conocida o desconocida, y ciertas
características o parámetros poblacionales. El problema será encontrar una función que
proporcione el mejor estimador de θ. El estimador, T, del parámetro θ debe tener una
distribución concentrada alrededor de θ y la varianza debe ser lo menor posible.
Los estadísticos más usuales en inferencia y su distribución asociada considerando
una población P sobre la que se estudia un carácter cuantitativo son:
Si se seleccionan muestras aleatorias de n observaciones de una población con media
medias tendrá aproximadamente una distribución normal con una media igual a y una
desviación estándar de . La aproximación será cada vez más exacta a medida de
que n sea cada vez mayor.
Ejemplo
Para el cálculo de la distribución muestral de: las medias, varianza y la muestra total
muestral de la distribución:
Dados los valores de una muestra:(
(0,0 (0,2 (0,4 (0,6 (2,0 (2,2 (2,4 (2,6 (4,0 (4,2 (4,4 (4,6 (6,0 (6,2 (6,4 (6,6
) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )
Conceptos:
Intervalo de confianza: Si P(a < X < b) = 0'95 tenemos el intervalo de confianza (a, b)
Nivel de confianza o coeficiente de confianza: 1 − α = γ, en nuestro ejemplo, 0’95
Nivel de significación o de riesgo: α, en nuestro ejemplo, 0’05
Valor crítico: k1 y k2, que dejan a la derecha (o a la izquierda) un área α/2.
En la N(0, 1) son −1’96 y 1’96 para α = 0’05.
Margen de error: Diferencia entre los extremos del intervalo de confianza.
Máximo error admisible: Valor prefijado que no puede superar el valor absoluto de la diferencia
entre el estimador y el parámetro.
conceptos ya definidos:
Población. Parámetro de la población (media, proporción)
Muestra. Estadístico de la muestra. Tamaño de la muestra.
Puntualizando:
“Un Intervalo de confianza es un conjunto de valores formado a partir de una muestra de
datos de forma que exista la posibilidad de que el parámetro poblacional ocurra dentro de
dicho conjunto con una probabilidad específica. La probabilidad específica recibe el
nombre de nivel de confianza.”
Basandonos en el teorema del limte central, los procedimientos de calculo se darán en
ámbito de las distribuciones normales y para las muestras pdqueñas en l distribución t
Student.
Ahora procederemos queremos, a partir de una muestra de tamaño n, estimar el valor de
un parámetro de la población dando un intervalo en el que confiamos que esté dicho
parámetro. A este intervalo lo denominamos, intervalo de confianza, y se calcula la
probabilidad de que eso ocurra a la que se denomina nivel de confianza.
Antes de concretarse en un valor para una muestra determinada, cualquier estadístico
puede ser tratado como una variable aleatoria cuya distribución de probabilidad dependerá
de la distribución de la variable que represente el comportamiento de la población objeto
de estudio. Parece razonable aprovechar la distribución de probabilidad del estadístico
utilizado como estimador puntual de un parámetro para, basándose en ella, llegar a
determinar un intervalo de confianza para el parámetro que se desea estimar. El método
que se utiliza para la obtención del intervalo se conoce como método del estadístico pivote
y consta básicamente de los siguientes pasos:
Se elige un estadístico t(X), denominado estadístico pivote, que cumpla los siguientes
requisitos:
o Su expresión debe depender del parámetro θ que se quiere estimar.
o Por último, su distribución de probabilidad ha de ser conocida (y en muchos casos
tabulada) y no debe depender del valor de θ.
Para un determinado nivel de confianza, γ, utilizando la distribución de probabilidad de
t(X;θ) se calculan los valores k1 y k2, conocidos como valores críticos.
En el siguiente apartado se muestran los desarrollos necesarios con vistas a obtener
intervalos de confianza para estimar uno de los parámetros de distribución normal, es
decir, la media. También se detalla el cálculo de intervalos de confianza para la proporción
de éxitos en pruebas binomiales (1, p).
Para ejemplificar:
Conceptos:
Intervalo de confianza: Si P(a < X < b) = 0.95 tenemos el intervalo de confianza
(a, b)
Nivel de confianza o coeficiente de confianza: 1 − α = ., en nuestro ejemplo, 0’95
Nivel de significación o de riesgo: α, en nuestro ejemplo.0’05
Valor crítico: k1 y k2, que dejan a la derecha (o a la izquierda) un área α/2.
En la N(0, 1) son −1.96 y 1.96 para α = 0.05.
Margen de error: Diferencia entre los extremos del intervalo de confianza.
Máximo error admisible: Valor prefijado que no puede superar el valor absoluto de la
diferencia entre el estimador y el parámetro.
conceptos ya definidos:
Población. Parámetro de la población (media, proporción)
Muestra. Estadístico de la muestra. Tamaño de la muestra.
Importante:
Para establecer un intervalo de confianza para la media de una población determinada
utilizaremos una de dos distribuciones: distribución normal estándar o
distribución t de Student, cada una de ellas se utilizará en función de los supuestos que
se hagan de la población investigada, de la información que de ella se tenga y del tamaño
de la muestra elegida.
Un detalle importante es conocer el significado práctico del término Nivel de confianza,
por ejemplo, un nivel de confianza de 95% significa que el 95% de las observaciones
estarán ubicadas en el centro de la distribución y el 5% restante se ubicarán en partes
iguales en “las colas” de la distribución, esto es, 2.5% a cada lado.
2.5% significa que cada “cola” representa un 0.025 del área debejo de la curva de la
distribución normal estándar. El valor señalado se localiza en la tabla Z, entonces Z α/2 =
1.96 para la cola derecha y Zα/2 = -1.96 para la coa izquierda.
2.4 Estimación de intervalo.
Si es desconocida.
2
Xn
n 1 t n
En este caso tenemos que
sn
1
tn 1
Ptn 1 x 1
Student tal que
2 , el intervalo de confianza al nivel de significación (o
equivalentemente, al nivel de confianza 1- ) será:
sn sn
Xn tn
, X t
1
1
2 n 1 n n 1
1
2 n 1
Ejemplo: Extraemos una m.a.s. de 61 estudiantes universitarios. Responden a una prueba
de inteligencia espacial, en la que alcanzan una media de 80 y una varianza de 100.
¿Entre qué límites se hallará la verdadera inteligencia espacial media de los estudiantes, a
un nivel de confianza del 99%?
1 0' 99 0' 01 1 0' 995
2
La varianza poblacional es desconocida y la población no es normal, pero el tamaño
muestral es mayor que 30, por tanto, el intervalo correspondiente será:
sn sn
Xn tn
, X t
1
1
2 n 1 n n 1
1
2 n 1
t60 2' 66
Buscamos en las tablas la distribución t de Student 0 ,995 .
por tanto, 76' 57, 83' 43con un nivel de confianza del 99%.
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN
Si en una población Bernouilli de parámetro p definimos la v.a. X= nº éxitos en la muestra,
X sigue una distribución binomial de parámetros (n,p). Si la muestra es grande, tenemos
que la proporción muestral P=X/n se distribuye aproximadamente como una normal
pq
N p,
n y podremos usar el teorema central del límite.
= [0.2102 ; 0.3898]
Por tanto, la verdadera proporción está en el intervalo 0.3 – 1.96 (√(0.3)(0.7)/100 con un
nivel de confianza del 95%.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS.
Suponemos dos poblaaciones independientes
12 22
Xn Yn N 1 2 ,
1 2
n n2
a) Si 1 y 2 son conocidas, como
2 2
1
, el
intervalo de confianza será:
1 1 2
n1 n2 2 n1 n2
, el intervalo de confianza será:
X Y t n1 s12 n 2 s 22 1 1 n1 s12 n 2 s 22 1 1
, X n1 Y n 2 t n1 n 2 21
n1 n 1 n 2 2 n1 n 2 2
n2 n1 n 2 2
1
2
n
1 n 2
2 n1 n 2
Ejemplo: Dos universidades públicas tienen dos métodos distintos para inscribir a sus
alumnos. Los dos desean comprobar el tiempo promedio que toma la inscripción de los
alumnos. En cada universidad se tomaron los tiempos de inscripción de 31 alumnos
tomados al azar. Las medias y desviaciones típicas muestrales fueron: x 20 ' 3 , s x 2' 5 ,
y 23 , s y 3 . Si se supone que el muestreo se llevó a cabo en dos poblaciones normales
a) suponiendo que las varianzas poblacionales son x 9 , y 10 .
2 2
9 10 9 10
1 2 20 ' 3 23 1' 96 , 20' 3 23 1' 96
31 31 31 31
p1 q1 p2 q2
P1 P2 N p1 p2 ,
n1 n2 y desconocemos los valores de p1 y p2 ,
aproximaremos las proporciones poblacionales por las proporciones muestrales
correspondientes. Por tanto, el intervalo de confianza será:
P1 Q1 P2 Q2 P1 Q1 P2 Q2
p1 p2 P1 P2 z , P1 P2 z
n1 n2 n1 n2
1
2
1
2
16 22
P1 0' 4 P2 0' 55
40 40
Sustituyendo en el intervalo:
0' 4 0 ' 6 0' 55 0 ' 45 0 ' 4 0' 6 0' 55 0' 45
0 ' 4 0 ' 55 2 ' 05 , 0' 4 0' 55 2' 05
40 40 40 40
=
=0 ' 15 0' 2265 , 0 ' 15 0 ' 2265
0' 3765 , 0' 0765
n 1 sn21
2n 1
2
Despejando tenemos:
2
(n 1) s 2 2
(n 1) sn1
P 2
n 1
2
2
1
n1 n1
1
2 2
Es decir,
( n 1)sn21 (n 1)sn21
2
2
,
n 1 2n 1
1
2 2
Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura superior a las
mujeres en la población española. Según las últimas tablas en el servicio militar, los
varones entre 18 y 20 años presentan una varianza de 0'0529. de las mujeres no tenemos
información, por ello tomamos una muestra de 101 mujeres entre 18 y 20 años y
s
obtenemos n1
0'18 ¿Entre qué valores se encontrará la verdadera varianza a un nivel
de 0'95 de confianza?
2
1 0'95 1 0'975 100 74'22
2 0 ' 025
Sustituyendo en el intervalo tendremos:
s n21
12
Fn 1,m 1
s m2 1
22
Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de confianza para
el cociente de varianzas al nivel de confianza 0'95. ¿Podríamos aceptar la suposición de
que las varianzas poblacionales son iguales?
1 0'95 1 0'975 F30,300 '975 2'07
2 y
1 1
0'025 F30,300 '025
2 F30,300 '975 2'07
n 2 31 2 m 2 31 2
s n21 sn 2'3 5'47 s m2 1 s m 3 9'3
n 1 30 m 1 30
INTERVALO.CONFIANZA.NORM(alfa;desv_estándar;tamaño)
Donde:
INTERVALO.CONFIANZA.NORM(0.05;5;49) = 1.3999
20 ± 1.3999
Cuando desconocemos la desviación estándar de la población (en la vida real es lo más probable) si el tamaño de
muestra es lo suficientemente grande (n ≥ 30), el teorema del Límite Central nos permite utilizar la distribución
normal como la distribución de muestreo, teniendo en cuenta lo siguiente:
Jon Jackobsen, un pasante de posgrado muy dedicado, acaba de terminar una primera versión de su tesis
de 700 páginas. Jon mecanografió el trabajo por sí mismo y está interesado en conocer el número promedio
de errores tipográficos por página, pero no quiere leer todo el documento. Como sabe algo acerca de
estadística para la administración, Jon leyó 40 páginas seleccionadas de manera aleatoria y encontró que el
promedio de errores tipográficos por página fue de 4.3 y la desviación estándar de la muestra fue de 1.2
errores por página.
b. Calcule un intervalo de confianza del 90% para el número promedio verdadero de errores por página en
su trabajo.
En Excel no existe una función directa para calcular el intervalo de confianza de este escenario particular, pero
podemos utilizar la función mostrada en el ejercicio anterior y calculando manualmente el factor de
corrección:√(N-n)/(N-1)
El propietario de Britten’s Egg Farm desea calcular la cantidad media de huevos que pone cada gallina.
Una muestra de 20 gallinas indica que ponen un promedio de 20 huevos al mes, con una desviación estándar
de 2 huevos al mes.
b. Explique por qué necesita utilizar la distribución t. ¿Qué suposiciones necesita hacer?
Utilizamos la distribución t porque se desconoce la desviación estándar de la población, pero para aplicarla,
debemos suponer que la población sigue una distribución normal.
c. ¿Cuál es el valor t para un intervalo de confianza de 95%?
INTERVALO.CONFIANZA.T(alfa;desv_estándar;tamaño)
Donde:
INTERVALO.CONFIANZA.NORM(0.05;2;20) = 0.9360
20 ± 0.9360
Pasos
σ = √Σ(X – X)2/n
1.
4 Elige el nivel de confianza que desees. Los niveles de confianza usados con mayor
frecuencia son 90 %, 95 % y 99 %. Al resolver un problema, es posible que tengas este
dato a tu disposición. Supongamos que escogiste 95 %.
Za/2 σ/√(n)
a = nivel de confianza,
σ = desviación estándar,
n = tamaño de muestra.
Esta es otra forma de decir que deberías multiplicar el valor crítico por el error estándar.
Así es como puedes resolver esta fórmula al dividirla en partes:
Para hallar el valor crítico, o Za/2: en este caso el nivel de confianza es de 95 %. Convierte
el porcentaje a un número decimal 0.95 y divídelo entre 2 para tener 0.025. Luego, revisa
la tabla de valores z para encontrar el valor que corresponde a 0.025. Verás que el valor
más cercano es -1.96 en la intersección de la fila 1.9 y la columna 0.6.
Calcula el error estándar: toma la desviación estándar, 14 kg (30 lb), y divídela entre la
raíz cuadrada del tamaño de la muestra, 1000. Obtendrás 14/31,6 o 0,44 kg (0,95 lb).
Multiplica 1,96 por 0,44 (tu valor crítico por tu error estándar) para obtener 0,86; tu
margen de error.
X ± Zα/2 (σ/√n)
o Tanto los valores t como los valores z se pueden calcular de forma manual, así como con una
calculadora gráfica o tablas estadísticas, las cuales se encuentran a menudo en los textos de
estadística. Los valores z también se pueden encontrar utilizando una calculadora de
distribución normal, mientras que los valores t se pueden encontrar usando una calculadora de
distribución T. También encontrarás herramientas de cálculo en Internet y en los software
estadísticos.
o Tu población de muestra debe seguir una distribución normal para que tu intervalo de
confianza sea válido.
o El valor crítico que se usa para calcular el margen de error es una constante que se expresa,
ya sea como un valor t o como un valor z. Generalmente se prefiere usar los valores t cuando
la desviación estándar de la población es desconocida o cuando se usa una muestra pequeña.
o Hay muchos métodos, como: el muestreo simple aleatorio, el muestreo sistemático o el
muestreo por estratos, con los cuales podrás seleccionar una muestra representativa que
permita analizar tu hipótesis.
o Un intervalo de confianza no indica la probabilidad de un resultado posible. Por ejemplo, si
estás 95 % seguro de que el promedio de tu población está entre 75 y 100, el intervalo de
confianza de 95 % no significa que haya 95 % de probabilidades de que la media se encuentre
dentro del rango que calculaste.
2.5 Intervalos de confianza para medias.
INTERVALOS DE CONFIANZA MUESTRAS GRANDES
Intervalo de confianza para la media de una población con σ, Desviación
Estándar conocida y Muestras Grandes (n > 30).
Al acepta (OK)
12 22
Xn Yn N 1 2 ,
a) Si 1 y 2 son conocidas, como
2 2 1 2
n1
n2 , el
intervalo de confianza será:
12 22 12 22
1 2 Xn Y n z , Xn Y n z
n1 n2 n1 n2
1
1 2 1 1 2
2 2
1 1 2
n1 n2 2 n1 n2
, el intervalo de confianza será:
X Y t n1 s12 n 2 s 22 1 1 n1 s12 n 2 s 22 1 1
, X n1 Y n 2 t n1 n 2 21
n1 n 1 n 2 2 n1 n 2 2
n2 n1 n 2 2
n1 n 2 n1 n 2
1
2 2
Ejemplo: Dos universidades públicas tienen dos métodos distintos para inscribir a sus
alumnos. Los dos desean comprobar el tiempo promedio que toma la inscripción de los
alumnos. En cada universidad se tomaron los tiempos de inscripción de 31 alumnos
tomados al azar. Las medias y desviaciones típicas muestrales fueron: x 20 ' 3 , s x 2' 5 ,
y 23 , s y 3 . Si se supone que el muestreo se llevó a cabo en dos poblaciones normales
a) suponiendo que las varianzas poblacionales son x 9 , y 10 .
2 2
9 10 9 10
1 2 20 ' 3 23 1' 96 , 20' 3 23 1' 96
31 31 31 31
pq
N p,
n y podremos usar el teorema central del límite.
= [0.2102 ; 0.3898]
Por tanto, la verdadera proporción está en el intervalo 0.3 – 1.96 (√(0.3)(0.7)/100 con un
nivel de confianza del 95%.
p1 q1 p2 q2
P1 P2 N p1 p2 ,
n1 n2 y desconocemos los valores de p1 y p2 ,
aproximaremos las proporciones poblacionales por las proporciones muestrales
correspondientes. Por tanto, el intervalo de confianza será:
P1 Q1 P2 Q2 P1 Q1 P2 Q2
p1 p2 P1 P2 z , P1 P2 z
1
2 n1 n2 1
2 n1 n2
16 22
P1 0' 4 P2 0' 55
40 40
Sustituyendo en el intervalo:
0' 4 0 ' 6 0' 55 0 ' 45 0 ' 4 0' 6 0' 55 0' 45
0 ' 4 0 ' 55 2 ' 05 , 0' 4 0' 55 2' 05
40 40 40 40
=
=0 ' 15 0' 2265 , 0 ' 15 0 ' 2265
0' 3765 , 0' 0765
El intervalo contiene al cero, pero el extremo inferior se aleja bastante de cero.
n 1 sn21
2n 1
2
Despejando tenemos:
2
(n 1) s 2 2
(n 1) sn1
P 2
n 1
2
2
1
n1 n1
1
2 2
Es decir,
( n 1)sn21 (n 1)sn21
2
2
,
n 1 2n 1
1
2 2
Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura superior a las
mujeres en la población española. Según las últimas tablas en el servicio militar, los
varones entre 18 y 20 años presentan una varianza de 0'0529. de las mujeres no tenemos
información, por ello tomamos una muestra de 101 mujeres entre 18 y 20 años y
s
obtenemos n1
0'18 ¿Entre qué valores se encontrará la verdadera varianza a un nivel
de 0'95 de confianza?
2
1 0'95 1 0'975 100 74'22
2 0 ' 025
s n21
12
Fn 1,m 1
s m2 1
22
Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de confianza para
el cociente de varianzas al nivel de confianza 0'95. ¿Podríamos aceptar la suposición de
que las varianzas poblacionales son iguales?
1 0'95 1 0'975 F30,300 '975 2'07
2 y
1 1
0'025 F30,300 '025
2 F30,300 '975 2'07
n 2 31 2 m 2 31 2
s n21 sn 2'3 5'47 s m2 1 s m 3 9'3
n 1 30 m 1 30
5'47 1 5'47 1
9'3 2'07 9'3 1 2'07 0'284,1'218
,