Está en la página 1de 25

UNIVERSIDAD DEL DESARROLLO PROFESIONAL

ALUMNO: Alberto Adriano Martinez


MATRICULA: 64222148
SESION: 1
ACTIVIDAD: Presentación.
TEMA: Inferencia estadística con muestras grandes.
MATERIA: Estadística inferencial.
PLAN DE ESTUDIOS: Lic. Admón. De empresas Turísticas.
DOCENTE: Ing. Marco Antonio Hernández Hernández.

ENSENADA B.C. 03/12/2023


INTRODUCCION

• En el presente trabajo elaboraremos una Presentación la cual nos mostrara la “Inferencia estadística
con muestras grandes”, tema ligado a la asignatura Estadística Inferencial. Se expresara de manera
precisa y argumentativa cada concepto correspondiente al tema.

• En este tema ampliaremos esta idea de acompañar conclusiones sobre la población basadas en la
muestra con medidas de su precisión. En general, sólo diremos que estamos haciendo inferencia sobre
una población (a partir de una muestra) si acompañamos nuestras conclusiones con medidas de
incertidumbre de este tipo.

• En este tema introduciremos herramientas de inferencia que son independientes de la distribución de


la población. Por tanto, pueden emplearse para cualquier tipo de distribución de nuestra variable
aleatoria de interés X. El precio que vamos a pagar por tener herramientas tan generales es que
tenemos que utilizar muestras grandes (n > 30). Cuanto menor sea la muestra, menos fiables serán los
resultados que expongamos en este tema.
Intervalos de confianza para μ con muestras grandes.
• El intervalo de confianza describe la variabilidad entre la
medida obtenida en un estudio y la medida real de la
población (el valor real).

• Corresponde a un rango de valores, cuya distribución es


normal y en el cual se encuentra, con alta probabilidad, el
valor real de una determinada variable. Esta «alta
probabilidad» se ha establecido por consenso en 95%. Así, un
intervalo de confianza de 95% nos indica que dentro del rango
dado se encuentra el valor real de un parámetro con 95% de
certeza5-8.
Ejemplos Resueltos de Intervalos de Confianza
• Ejemplo 1. Intervalo de confianza para la media con ¨O¨ Conocida

• Se ha obtenido una muestra de 25 alumnos de una Facultad para


estimar la calificación media de los expedientes de los alumnos en la
Facultad. Se sabe por otros cursos que la desviación típica de las
puntuaciones en dicha Facultad es de 2.01 puntos.

La media de la muestra fue de 4.9.


• 1. Intervalo de confianza al 90 %.
• 2. Intervalo de confianza al 99 %.
Solución ejemplo 1
• 1. Intervalo de confianza al 90 %. Usamos la formula:

• Los cuantiles de orden 0.05 y 0.95, que encierran en el centro de la


distribución normal un área igual a 0.9 se muestran en el grafico
siguiente:
• Por ultimo, sustituyendo los datos en la formula del intervalo,
tenemos:

• 2. Intervalo de confianza al 99 %.
• De modo similar obtenemos los cuantiles de orden 0.005 y 0.995 que
describen en el modelo normal una confianza del 99 %

• Por ´ultimo, sustituyendo los datos en la formula del intervalo,


tenemos:
Determinación del tamaño de muestra

• Del intervalo (6.6) puede verse que si aumentamos n reducimos la


amplitud el intervalo y por tanto nuestra incertidumbre sobre μ para
un mismo nivel de confianza. El intervalo de confianza para muestras
grandes puede escribirse como

• La longitud del intervalo será entonces 2L. Si queremos un valor de L


determinado ¿cuál debe ser el tamaño muestral n?
• Si σ es desconocido lo estimamos en una muestra piloto, obteniendo
ˆσ0. Entonces
Ejemplo
• Sea X el consumo unitario de cierto material en un proceso productivo
(miligramos por unidad de producto obtenido). Se sabe que X tiene
desviación típica σ = 20 mg. Se toma una muestra aleatoria de 200
observaciones obteniéndose una media muestral del consumo de ¯X =
120 mg.
• (a) A partir de esta información muestral, estimar mediante un
intervalo con un 95 % de confianza el consumo medio de este
producto.
• (b) ¿Qué tamaño muestral sería necesario tomar para que un
intervalo del 95 % de confianza tuviese una longitud de 2mg?
(longitud del intervalo=diferencia entre sus extremos).

• SOLUCIÓN:
• (a) Nos piden el intervalo de confianza para la media de una
distribución normal con σ = 20mg.
• conocida. Sabemos que, al ser un tamaño muestral grande, la media
muestral verifica que
• y para un nivel de confianza del 95 % coeficiente de confianza;

• El intervalo para el consumo medio del material es;

• (b) Se quiere garantizar una amplitud del intervalo como máximo de 2


mg. con el mismo nivel
• de confianza. Es decir, que el intervalo del 95 % sea ¯X ± 1. De (6.11)
tenemos que L = 1, y entonces,
Contraste de hipótesis.

• Es un procedimiento para juzgar si una propiedad que se supone en una


población estadística es compatible con lo observado en una muestra de dicha
población.

• Si sospechamos que una moneda ha sido trucada para que se produzcan más
caras que cruces al lanzarla al aire, podríamos realizar 30 lanzamientos,
tomando nota del número de caras obtenidas. Si obtenemos un valor
demasiado alto, por ejemplo 25 o más, consideraríamos que el resultado es
poco compatible con la hipótesis de que la moneda no está trucada, y
concluiríamos que las observaciones contradicen dicha hipótesis.
• La aplicación de cálculos probabilísticos permite determinar a partir
de qué valor debemos rechazar la hipótesis garantizando que la
probabilidad de cometer un error es un valor conocido a priori. Las
hipótesis pueden clasificarse en dos grupos, según:

• Especifiquen un valor concreto o un intervalo para los parámetros del


modelo.

• Determinen el tipo de distribución de probabilidad que ha generado


los datos.

• Un ejemplo del primer grupo es la hipótesis de que la media de una


variable es 10, y del segundo que la distribución de probabilidad es la
distribución normal.
Contraste de hipótesis de la medición con muestras
grandes.

• El estadístico de contraste es la operación que realizaremos con los datos y que


contendrá toda la información relevante para el contraste. El estadístico de
contraste se basa siempre en las propiedades del estimador del parámetro que
estemos contrastando.

• En el caso de contrastes sobre μ, el contraste se basará en las siguientes


propiedades de la media muestral ¯X obtenida con una muestra aleatoria
simple de tamaño n. Para cualquier variable X de media μ y varianza σ2, si el
tamaño muestral es suficientemente grande se cumple que
• y si σ2 es desconocido, y utilizamos la cuasivarianza ˆS2 como
estimador de σ2 tenemos, si el tamaño muestral es suficientemente
grande,

• Como estadístico de contraste utilizaremos (6.12) y (6.13), pero


imponiendo el valor μ0, es decir,

• para el caso de σ conocida, y


• cuando estimemos σ con la cuasidesviación típica. Estos
estadísticos d miden la distancia entre el valor de la hipótesis
nula μ0 y el obtenido en la muestra ¯x.
• Para interpretar el valor de d necesitamos una distribución de
referencia que nos ayude a determinar cuando d toma un valor
alto o bajo, y así poder valorar la distancia entre ¯x y μ0. La
elección de la distribución de referencia, que nos ayudará a
evaluar d, es similar para cualquier parámetro θ y se elige de la
siguiente manera:
Interpretación de un contraste usando el p-valor

• Con este procedimiento, el resultado del contraste es sólo si


rechazamos o no rechazamos H0. Si por ejemplo concluimos que se
rechaza H0 no sabremos si el valor del estadístico estaba cerca del
valor crítico, y por lo tanto ha sido rechazado ’por los pelos’, o por el
contrario el valor del estadístico de contraste estaba muy dentro de la
región de rechazo, y el rechazo ha sido con mucha seguridad.
Ejemplos

• En la figura de la izquierda (Caso 1), el valor del estadístico t0 (-1.7)


está muy próximo al valor crítico (-1.65), rechazándose H0 por escaso
margen. En la figura de la derecha (Caso 2) el estadístico de contraste
(t0 = −3) está mucho más dentro de la región de rechazo,
rechazándose la hipótesis nula con más seguridad que en el Caso 1.
En este segundo caso, la muestra refleja más claramente que la
población no verifica dicha hipótesis
Inferencia sobre una proporción en muestras grandes.
• Sea p una proporción poblacional. Es decir, la probabilidad de que un elemento
de la población elegido al azar tenga alguna característica, o bien la proporción
de individuos de la población que tiene dicha característica.

• Por ejemplo, la probabilidad de que un artículo sea defectuoso, la


• proporción de individuos que votarán a cierto candidato, la probabilidad de
que cierta variable supere cierto valor, etc. Esta probabilidad p, es también el
parámetro de un proceso de Bernoulli.
• Sea Xi una variable aleatoria de Bernoulli que toma el valor 0 si el elemento no
tiene el atributo de interés, y el valor 1 cuando el elemento sí tiene el atributo.
Entonces p es la probabilidad de que una variable Xi tome valor 1. Recordemos
que E(Xi) = p, Var(Xi) = p(1 − p).
• La proporción o probabilidad poblacional p la estimaremos con la proporción
muestral, es decir
Inferencia con estimadores de máxima verosimilitud.

• Sea ˆθM V es estimador de maxima verosimilitud del parámetro θ.


Vimos en el tema anterior que
• este estimador es asintóticamente normal con las siguientes
características

• Donde

• siendo L(θ) la función soporte. Al poder utilizar esta propiedad de


normalidad asintótica, se pueden utilizar los resultados (6.3) y (6.6)
para construir intervalos de confianza de θ en muestras grandes.
• Se tiene entonces que el intervalo de confianza de θ para muestras
grandes, con nivel de confianza (1 − α) será
• La varianza asintótica Var(ˆθMV ) dependerá de θ, por lo que habrá
que reemplazarla por un estimador dVar(ˆθMV ) que utilice ˆθ en lugr
de θ. Un intervalo de confianza asintótico de θ basado en estimadores
de máxima verosimilitud será entonces
Ejemplo

• La velocidad de una molécula, según el modelo de Maxwell, es una


variable aleatoria con función de densidad,

• Donde α > 0, es el parámetro de la distribución. Se desea estimar el


parámetro α. Si calculásemos E(X) veríamos que no guarda una
relación sencilla con α, que permita estimar a patir de ¯X.
• Queremos construir un intervalo de confianza para α. Este problema
ya se planteó en el tema anterior obteniéndose que
• Por tanto, podemos calcular la expresión de la varianza asintótica:
Conclusiones

 En conclusión, la estadística inferencial es una herramienta crucial para la toma de


decisiones informadas y basadas en datos en una amplia variedad de campos.

 Al permitir la generalización precisa de una muestra a una población más grande, la


estadística inferencial puede ayudar a los investigadores a obtener información valiosa que
de otro modo sería imposible de obtener. Sin embargo, la precisión de los resultados de la
estadística inferencial depende en gran medida de la selección de una buena muestra.

 Es importante que los investigadores seleccionen una muestra representativa y adecuada


para su investigación. Al hacerlo, pueden mejorar la validez y fiabilidad de sus resultados, lo
que a su vez puede ayudar a garantizar que las decisiones que tomen estén respaldadas por
datos precisos y confiables.
Referencias bibliográficas

 Candia B, R., & Caiozzi A., G. (2005). Intervalos de confianza. Revista Medica de Chile, 133(9), 1111–
1115. https://doi.org/10.4067/s0034-98872005000900017

 Cómo Interpretar Correctamente los Valores P. (n.d.). Minitab.com. Retrieved December 4, 2023, from
https://blog.minitab.com/es/como-interpretar-correctamente-los-valores-p

 Estadistica inferencial. (2014, October 25). SlideServe. https://


www.slideserve.com/druce/estadistica-inferencial

 Ortiz, M. T. (n.d.). 9.1 Máxima verosimilitud. Github.Io. Retrieved December 4, 2023, from https://
tereom.github.io/est-computacional-2018/maxima-verosimilitud.html

Wikipedia contributors. (n.d.). Contraste de hipótesis. Wikipedia, The Free Encyclopedia. https://
es.wikipedia.org/w/index.php?title=Contraste_de_hip%C3%B3tesis&oldid=154572393

También podría gustarte