Está en la página 1de 34

Estadistica

Computacional
Estimación de
muestras
grandes
¿Qué es la estimación de muestras
grandes?
Este tema es un concepto estadístico que hace referencia a la técnica utilizada
para inferir conclusiones sobre alguna población tomando como punto de partida
una muestra grande de esa población.

Cuando hacemos uso de este tipo de estimación con muestras grandes se pueden
llegar a hacer suposiciones más precisas sobre la distribución de los datos y se
pueden obtener también las estimaciones más confiables de los parámetros
poblacionales.
¿Cómo realizamos la
estimación de muestras
grandes?
Esta se realiza mediante la construcción de intervalos de confianza
para un parámetro poblacional como la media basados en el uso de
muestras grandes. Son utilizados los estimadores en este contexto
ya que proporcionan un valor numérico como estimación del
parámetro de interés.
La precisión de los mencionados está enlazada con la probabilidad
de que proporcionen un valor cercano al verdadero parámetro
poblacional. Hablando siempre dentro del tema de muestras grandes
se busca no solo ofrecer el valor estimado, sino que también una
medida de la incertidumbre asociada a esa estimación debido al uso
de una muestra finita.
Ejemplo de estimación de muestras
grandes
Supongamos que queremos estimar la altura media de todos los estudiantes de una
universidad. En lugar de medir la altura de cada estudiante, tomamos una muestra
aleatoria de 1000 estudiantes y calculamos la altura media de esta muestra. Luego,
utilizamos esta estimación puntual de la media muestral para hacer inferencias sobre la
altura media de todos los estudiantes de la universidad.

Además, podríamos calcular un intervalo de confianza para esta estimación puntual. Por
ejemplo, podríamos calcular un intervalo de confianza del 95%, lo que significa que hay
un 95% de probabilidad de que la altura media de todos los estudiantes de la universidad
caiga dentro de este intervalo.
Para calcular la estimación puntual de la altura media y el intervalo de confianza, primero necesitarías
los datos de altura de los 1000 estudiantes en la muestra. Luego, podrías calcular la media muestral y
la desviación estándar muestral. Con la media muestral y la desviación estándar muestral, podrías
calcular el intervalo de confianza para la media poblacional utilizando la fórmula del intervalo de
confianza para la media:

 Donde x es la media muestral

 s es la desviación estándar muestral.

 n es el tamaño de la muestra.

 Z es el valor crítico de la distribución normal estándar, que depende del nivel de confianza
deseado.
Inferencia estadística
Es el conjunto de métodos mediante las cuales se pueden obtener una conclusión
sobre una población a través de la información proporcionada por una muestra o
bien se pueden hacer predicciones sobre una población basándose únicamente en la
información que fue recopilada a partir de una muestra representativa de la
población seleccionada.

Busca es poder generalizar los resultados obtenidos de una muestra a toda la


población de interés lo cual implica un proceso el cual es: implementar tecnicas
estadísticas para poder estimar parámetros desconocidos, probar hipótesis, predecir
valores futuros y evaluar la incertidumbre asociada a las conclusiones obtenidas
Formas de aplicación de inferencia en forma de
decisiones
3
1 Pruebas de
Estimación de hipótesis
Para poder probar si una hipotesis sobre una
parámetros
Son utilizados estimadores para realizar poblacion es verdera o no
conjeturas informadas sobre los parametros de
una población
2 4
Selección de
Intervalos de
modelos
confianza
Para poder tener estimaciones por Selección facilitada del modelo más
adecuado a nuestros datos
intervalos de los parametros
seleccionados
Pasos para aplicar en toma de
decisiones?
Se deben de seguir varios pasos los cuales nos permiten
usar datos de manera efectiva:

● Elaboración de premisas
● Identificación de alternativas
● Evaluación de alternativas
● Seleccion de la alternativa más viable

Al seguir estos pasos nos resultará más fácil la


selección de una mejor alternativa y respaldada.
0
1 de
Ejemplo
inferencia
estadística
Supongamos que un investigador está interesado en determinar la media de horas que los estudiantes
universitarios pasan estudiando por semana en UMG. Debido a limitaciones de tiempo y recursos, el
investigador no puede encuestar a todos los estudiantes de la universidad. En cambio, decide tomar
una muestra aleatoria de 100 estudiantes y registrar el número de horas que cada uno de ellos estudia
por semana.

Después de recolectar los datos, el investigador calcula la media muestral de horas de estudio por
semana y encuentra que es de 15 horas, con una desviación estándar muestral de 3 horas.

Ahora, el investigador quiere hacer inferencias sobre la media de horas de estudio por semana en toda
la población de estudiantes universitarios en la universidad, no solo en la muestra de 100 estudiantes.
Utilizando la inferencia estadística, el investigador puede hacer estas inferencias utilizando la muestra
obtenida.
Para ello, el investigador podría construir un intervalo de confianza para la media poblacional de
horas de estudio por semana. Supongamos que el investigador utiliza un nivel de confianza del 95%.
Con los datos de la muestra, puede calcular el intervalo de confianza utilizando la fórmula:

• ˉxˉ es la media muestral (15 horas en nuestro ejemplo).


• s es la desviación estándar muestral (3 horas en nuestro ejemplo).
• n es el tamaño de la muestra (100 estudiantes en nuestro ejemplo).
• Z es el valor crítico de la distribución normal estándar para el nivel de confianza deseado (para
un nivel de confianza del 95%, Z es aproximadamente 1.96).

Con esta fórmula, el investigador puede calcular el intervalo de confianza para la media de horas de
estudio por semana en toda la población de estudiantes universitarios. Esto proporcionará al
investigador una estimación de rango donde es probable que se encuentre la verdadera media de la
población.
Estimación puntual
Método utilizado en estadística para poder proporcionar una única estimación del valor de un
parámetro poblacional desconocido. Como bien lo dice su nombre esta es puntual es decir que sólo nos
ofrece un único número como mejor estimación del parámetro en cuestión.

La estimación puntual está basada en la información que se recopilo de una muestra y es utilizada para
hacer inferencias sobre la población en su conjunto, la estimación puntual puede estar sujeta a cierto
grado de error debido a la variabilidad inherente a la muestra utilizada para realizar la estimación.

Siguiendo el contexto de la inferencia estadística que ya se abarcó la estimación puntual es


fundamental ya que esta proporciona una estimación especifica y concreta del parámetro poblacional lo
que permite tomar las decisiones basadas en datos concretos.
Objetivos de la estimación puntual
• Es encargada de diferenciar los conceptos de estimador y
estimación.
• comprender las propiedades más relevantes de los estimadores
puntuales.
• Conocer la definición de la función de verosimilitud y el método de
máxima verosimilitud.
Pasos que debemos seguir para obtener resultados
precisos
Utilizar una muestra representativa de la pblación
objetivo
Aplicar técnicas de estadisticas adecuadas para el cálculo de la
estimación puntual
Asegurarse de que la muestra sea lo suficientemente grande
para que los resultados sean confiables

Realizar analisis de sensibilidad para evaluar la robustez de los


resultados obtenidos
Ejemplo de estimación puntual
Estimación de la estatura promedio de una población: Si se realiza un estudio sobre la
estatura promedio de los habitantes de una ciudad y se obtiene una media de estatura de 170 cm
en una muestra de 100 personas, ese valor se convierte en una estimación puntual de la estatura
promedio de la población.

Estimación del porcentaje de apoyo a un candidato político: Al medir la opinión pública


sobre el apoyo a un candidato político mediante una encuesta a una muestra representativa, por
ejemplo, si el 60% de una muestra apoya a un candidato, ese porcentaje se convierte en una
estimación puntual del apoyo en la población total.
Estimación de intervalo
Es un método que permite estimar un rango de valores dentro del cual es probable que
encontremos un parámetro poblacional.
Es una herramienta valiosa en inferencia estadística ya que nos permite comprender mejor
la variabilidad y la fiabilidad del parámetro estimado.
Es un enfoque basado en la distribución de estadísticas muestrales y busca proporcionar
una medida de incertidumbre alrededor de la estimación puntual.
En que se basa la obtencion del
intervalo:
Si conocemos la distribución muestral del estimador podemos obtener las
1 probabilidades de ocurrencia de los estadísticos muestrales

2 Si conociéramos el valor del parámetro poblacional, podríamos establecer la


probabilidad de que el estimador se halle dentro de los intervalos de la
distribución muestral.

3 El problema es que el parámetro poblacional es desconocido, y por ello el


intervalo se establece alrededor del estimador.
Ejemplo
INTERVALO DE CONFIANZA PARA LA MEDIA CON σ
CONOCIDA
Se ha obtenido una muestra de 25 alumnos de una Facultad para
estimar la calificación media de los expedientes de los alumnos en
la Facultad. Se sabe por otros cursos que la desviación típica de las
puntuaciones en dicha Facultad es de 2.01 puntos.
 La media de la muestra fue de 4.9.
 Intervalo de confianza al 90%.
 Intervalo de confianza al 99%.
Solución:
Intervalo de confianza al 90%. Usamos la fórmula:

Los cuantiles de orden 0.05 y 0.95, que encierran en el centro de la distribución normal un área
igual a 0.9 se muestran en el grafico siguiente:
Sustituyendo los datos en la fórmula del intervalo, tenemos:

(4,24,5,56)
Intervalo de confianza al 99%.

De modo similar obtenemos los cuantiles de orden 0.005 y 0.995 que describen en el modelo
normal una confianza del 99%

De modo similar obtenemos los cuantiles de orden 0.005 y 0.995 que describen en el modelo
normal una confianza del 99%
Por último, sustituyendo los datos en la fórmula del intervalo, tenemos:
Diferencia entre dos medias
poblacionales

50% 75%
Es un concepto clave en estadística que ayuda a comparar
las tendencias centrales de dos poblaciones distintas. Esto
implica calcular la discrepancia entre los valores promedio
de dos grupos o poblaciones distintas.

La comparación de dos medias poblacionales independientes


es muy común y proporciona una forma de probar la
hipótesis de que los dos grupos difieren entre sí. Una
diferencia observada entre dos medias muestrales depende
tanto de las medias como de las desviaciones típicas de la
muestra. Pueden producirse medias muy diferentes por azar
si hay una gran variación entre cada una de las muestras.
¿Cuál es la diferencia entre dos medias
poblacionales?
La diferencia entre dos medias poblacionales es la disparidad en los valores promedio de dos
poblaciones distintas y esta diferencia se puede calcular para comparar las tendencias centrales de los
grupos o poblaciones en estudio.

(μ1 - μ2) es de la forma:


Cómo podemos llegar a interpretar la diferencia
entre dos medias poblacionales
Significancia Confianza en la
estadistica estimación
Sugiere que hay una disparidad
real en los valores promedio de Este intervalo proporciona
las dos poblaciones de estudio una estimación de la precisión
de la diferencia calculada y
ayuda a determinar la certeza
Impacto en la magnitud de la
Crítico
Evalúa si la diferencia es
disparidad entre las medias.

significativa desde un punto


de vista práctico
Factores que influyen
en la difrencia entre
dos medias
Variabilidad de los Desviaciones estandar de
datos las poblaciones

Tamaño de Diseño de
muestras estudio
Ejemplo
Comparación de la productividad laboral: Se pueden analizar las diferencias en la productividad entre
dos turnos de trabajo en una fábrica para determinar si existe una disparidad significativa en el
rendimiento promedio de los empleados.

Rendimiento de inversiones: Comparar las tasas de rendimiento de dos tipos de inversiones, como
activos fijos y acciones ordinarias, para evaluar si hay diferencias significativas en los retornos
financieros obtenidos

Estudio de eficacia de tratamientos médicos: Investigar si hay una diferencia en la eficacia de dos
tratamientos médicos para una enfermedad específica, analizando las medias de los resultados de los
pacientes tratados con cada método.
(muestras grandes)
Ejemplo. El dueño del restaurante RESUMG tiene información de la cantidad de dinero que gastan sus
clientes cuando visitan el sitio. De la sucursal A selecciona aleatoriamente 50 clientes del restaurante.
Después de procesar los datos se encontró una media de $32.000 y una varianza de 2.560.000. De la
sucursal B selecciona aleatoriamente 50 clientes del restaurante. Después de procesar los datos se
encontró una media de $34.800 y una desviación estándar de $1.650.

• Construya un intervalo del 95,44% de confianza para estimar la diferencia de medias poblacionales
(muestras grandes)
Solución.
Se tienen dos muestras de tamaño n1 = 50 y n2 = 50, las medias son x1 = $32.000 y x2 = $34.800 , la
desviación estándar para cada muestra es : S1 = $1.600 y 2 S2 = $1.650 .
Tenemos que, 1 - a = 0,9544 a = 0,0456 a /2 = 0,0228 2 Za= 2,0 según valor de tabla.
Entonces:

Interpretación: Con un nivel de confianza del 95,44% se puede asegurar que la diferencia entre la
cantidad promedio que gastan cada uno de los clientes del restaurante RESUMG sucursal B con
respecto a los clientes de la sucursal A se encuentra entre $2.149,93 y $3.450,07, con un error de
estimación no mayor de $650 aproximadamente.

También podría gustarte