Está en la página 1de 15

1.

1 Introducción a la Estadística Inferencial


 La Estadística Inferencial permite analizar y estudiar datos de una población a
partir de una muestra de esta. A diferencia de la estadística descriptiva, donde la
toma de decisiones descansa en la descripción de la información de una muestra,
en la estadística inferencial el fundamento son las pruebas estadísticas que
permiten inferir alguna característica de interés de una población con base en la
información de una muestra. Su objetivo es obtener conclusiones útiles para hacer
deducciones sobre una totalidad, basándose en la información numérica de la
muestra. La Estadística Inferencial se dedica a la generación de los modelos y
predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la
aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y
extraer inferencias acerca de la población bajo estudio.

¿Qué es la estadística?
 La estadística consiste en métodos, procedimientos y fórmulas que permiten
recolectar información para luego analizarla y extraer de ella conclusiones
relevantes. Se puede decir que es la Ciencia de los Datos y que su principal
objetivo es mejorar la comprensión de los hechos a partir de la información
disponible.
 La estadística es la ciencia encargada de estudiar los datos. Esta incluye
recolectar, analizar y describir los datos para llegar a conclusiones sobre un
fenómeno en particular. 
 La estadística emplea herramientas matemáticas y de probabilidades, con las
cuales desarrolla métodos y modelos para analizar los datos. Estos métodos
estadísticos se aplican en diversas áreas de las ciencias naturales y sociales, la
publicidad y el mercadeo, en las industrias y el entretenimiento.
 De allí que tras un análisis estadístico se pueda comprender un hecho, tomar
decisiones, estudiar problemas sociales, ofrecer soluciones en determinados
casos, deducir relaciones en una población, entre otros.

¿Qué es la estadística inferencial?


 La estadística inferencial es el campo de la estadística que estudia el
comportamiento de unas variables y sus consecuencias, y las extiende hacia
grupos más amplios. Es una de las ramas más importantes de la estadística y su
implementación es útil a la hora de establecer rutas de acción en distintos
escenarios.
¿Qué es la estadística descriptiva?
 La estadística descriptiva es una disciplina que se encarga de recoger, almacenar,
ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto
de datos.
 La estadística descriptiva es, junto con la inferencia estadística o estadística
inferencial, una de las dos grandes ramas de la estadística. Su propio nombre lo
indica, trata de describir algo. Pero no describirlo de cualquier forma, sino de
manera cuantitativa. Pensemos en el peso de una caja de verduras, en la altura de
una persona o en la cantidad de dinero que gana una empresa. De estas variables
podríamos decir muchas cosas. Por ejemplo, podríamos indicar que esta o aquella
caja de tomates pesan mucho o pesan menos que otras. Siguiendo con otro
ejemplo, podríamos decir que el ingreso de una empresa varía mucho a lo largo
del tiempo o que una persona tiene una altura promedio.
 En la interpretación de los datos recopilados en el estudio, se diferencian dos tipos
de variables:
Variable cuantitativa: hace referencia a todos aquellos valores numéricos, con
los     cuales se pueden realizar cálculos.
Variable cualitativa: son todos aquellos valores no numéricos que constituyen
las  características de los objetos de estudio. 
 Estas variables se tienen en cuenta en la posterior representación gráfica del
conjunto de datos, al describir sus características y exponerlas de manera
comprensible. Con respecto a las variables cuantitativas, constituyen el eje
analítico y matemático de la estadística descriptiva.

 ¿Qué es la población?
 Una población estadística es el conjunto de elementos que son de interés para un
experimento, un estudio o una consideración de algún tipo. Los elementos que lo
componen pueden ser por ejemplo individuos, animales, fenómenos y eventos
 Dentro de las poblaciones estadísticas, fundamentalmente dos tipos de
poblaciones:
Población estadística finita: Es aquella en la que el número de valores que la
componen tiene un fin. Por ejemplo, la población estadística que nos indica la
cantidad de árboles de una ciudad es finita. Es cierto que puede variar con el
tiempo, pero en un instante determinado es finita, tiene fin.
Población estadística infinita: Se trata de aquella población que no tiene fin. Por
ejemplo, el número de planetas que existen en el universo. Aunque puede que sea
finito, el número es tan grande y desconocido que estadísticamente se asume
como infinito. 
¿Qué es la muestra?
 Se entiende como un subconjunto más o menos representativo de una población
estadística, aislado del resto con fines de evaluación y estudio. Es decir, se trata
de un fragmento de la totalidad de elementos a estudiar, compuesta por un
número más manejable de ellos, seleccionados (idealmente) al azar.
 Dichas muestras se obtienen a través de diferentes técnicas estadísticas, que
garantizan a través de distintos mecanismos una aleatoriedad adecuada para el
menor sesgo posible en la selección, es decir, la mayor posible objetividad que
permita obtener aproximaciones válidas al universo estadístico. Si, por el contrario,
se obtiene una muestra sesgada, las conclusiones posibles serán menos
fidedignas y por lo tanto menos útiles.
 Forma parte de un conjunto mayor, que es la población estadística o universo
estadístico, de la cual es, idealmente, representativa.
 Posee un número reducido y por lo tanto manejable de elementos de interés
estadístico, en comparación con la población entera.
 Se elige al azar y a través de distintas técnicas de muestreo. Puede ser más o
menos fidedigna, dependiendo de esto último.
 Su tamaño es objeto de estudio matemático, a fin de garantizar las proporciones
justas para que resulte representativa del total.

¿Qué es el censo?
 El censo es el recuento de individuos que conforman una población estadística,
definida como un conjunto de elementos de referencia sobre el que se realizan las
observaciones. En otras palabras, consiste básicamente en obtener mediciones
del número total de personas mediante diversas técnicas de recuento y se realiza
cada determinado período.
 El censo es una de las operaciones estadísticas que no trabaja sobre una muestra
estadística, sino sobre la población total; mientras que el período de realización
depende de los objetivos para los que se necesiten los datos. Por ejemplo, en
diversos países se llevan a cabo censos poblacionales por lo general cada 4 años,
el mismo período utilizado para censos agropecuarios.
 Desde el punto de vista del trabajo de investigación, se considera al censo como
técnica que usa como instrumento a la cédula de censo o ficha censal de la
población.
¿Qué es el parámetro estadístico?
 Es un valor, un número, que resume y permite interpretar los datos extraídos en el
estudio de una muestra estadística. Imaginemos que hablamos de una población
determinada que queremos analizar. En este caso, el parámetro estadístico podría
ser la edad media de la población en cuestión.
 El cálculo de este parámetro, está definido mediante una fórmula aritmética. En el
caso de la población, la media presenta una fórmula que se utiliza para calcular y
extraer dicho parámetro.

Diferencias
 Una población es un todo y una muestra es una fracción o segmento de ese todo.
Es el elemento que describe una muestra y sirve como una estimación del
parámetro de la población correspondiente.
 El estadístico sirve como una estimación del parámetro.
 Una muestra debe ser definida en base de la población determinada, y las
conclusiones que se obtengan de dicha muestra solo podrán referirse a la
población en referencia. Una muestra representativa contiene las características
relevantes de la población en las mismas proporciones que están incluidas en tal
población.
 Un censo es donde todos son encuestados.
 Un parámetro es algo en una ecuación que se transmite en una ecuación.
Significa algo diferente en las estadísticas. Es un valor que te dice algo sobre una
población y es lo opuesto a una estadística, que te dice algo sobre una pequeña
parte de la población.

¿Qué es un error de muestreo?


 Se produce cuando la muestra utilizada en el estudio no es representativa de toda
la población. A menudo se producen errores de muestreo y, por lo tanto, los
investigadores siempre calculan un margen de error durante los resultados finales
como práctica estadística. El margen de error es la cantidad de error permitida
para que un error de cálculo represente la diferencia entre la muestra y la
población real.
 Algunos de los errores de muestreo más comunes son:

Error de especificación de la población: Un error de especificación de población


ocurre cuando los investigadores no saben exactamente a quién encuestar.
Error en el marco de la muestra: Los errores del marco de muestreo surgen
cuando los investigadores apuntan a la subpoblación erróneamente al seleccionar
la muestra.
Error de selección: Un error de selección ocurre cuando los encuestados se
autoseleccionan para participar en el estudio. Sólo los interesados responden.
Errores de muestra: Los errores de muestreo se producen debido a una
disparidad en la representatividad de los encuestados. Ocurre principalmente
cuando el investigador no planifica su muestra cuidadosamente.

¿Qué es un error muestral?


 Es el error que surge a causa de observar una muestra de la población completa.
La estimación de valor de interés, como la media o el porcentaje, estará
generalmente sujeta a una variación entre una muestra y otra.1 Estas variaciones
en las posibles muestras de una estadística pueden, teóricamente, ser expresadas
como errores muestrales, sin embargo, normalmente, en la práctica el error exacto
es desconocido. El error muestral se refiere en términos más generales al
fenómeno de la variación entre muestras. Cuando este no es mencionado se
considera que el margen de error base es el 0.02%

¿Qué es un error no muestral?


 Un error no muestral es un término estadístico que se refiere a un error que ocurre
durante la recopilación de datos, lo que hace que los datos difieran de los valores
reales.
 Es un término utilizado en estadística que se refiere a un error que ocurre durante
la recopilación de datos, lo que hace que los datos difieran de los valores reales.
 Se refiere a errores aleatorios o sistemáticos, y estos errores pueden ser difíciles
de detectar en una encuesta, muestra o censo.

¿Que es un error sesgo muestral?


 Se produce cuando los miembros de la población prevista se seleccionan de forma
incorrecta, ya sea porque tienen una probabilidad menor o mayor de ser
seleccionados.
 Tipos de sesgo de muestreo:
Sesgo de respuesta voluntaria: El sesgo de respuesta voluntaria también se
conoce como sesgo de autoselección, en el que los encuestados que poseen
características específicas están más dispuestos a participar en la investigación
que otros. Esto ocurre cuando tienen control sobre la participación en el estudio.
Sesgo de supervivencia: El sesgo de supervivencia también es un tipo común de
sesgo de muestreo en el que el investigador se concentra sólo en la muestra que
pasa los criterios de selección e ignora a los que no pasaron.
Sesgo de falta de respuesta: Los encuestados que se niegan a participar en los
estudios y abandonan la investigación provocan un sesgo de falta de respuesta.
La falta de respuesta se debe a que una parte de la población objetivo no puede
participar en la encuesta porque decide no hacerlo.
Sesgo de recuerdo: El sesgo de recuerdo simplemente ocurre cuando los
encuestados no pueden recordar las cosas correctamente. No se puede hacer
mucho para mitigar el sesgo de recuerdo, sino sólo se puede considerar como un
error común en la recolección de datos.
Sesgo del observador: El sesgo del observador lo provocan los investigadores
cuando ellos mismos influyen en las expectativas de la investigación, ya sea de
forma consciente pero en gran medida inconsciente. Se produce por la selección
de un grupo específico de estadísticas o por influir en los participantes durante las
entrevistas. Un buen diseño de encuesta puede mitigar este sesgo y puede ser
totalmente controlado por el investigador.

¿Que es el nivel de confianza?


 El nivel de confianza representa el porcentaje de intervalos que incluirían el
parámetro de población si usted tomará muestras de la misma población una y
otra vez. Por lo general, un nivel de confianza de 95% funciona adecuadamente.

¿Que es la población finita?


 Es aquella que indica que es posible alcanzarse o sobrepasarse al contar, y que
posee o incluye un número limitado de medidas y observaciones
¿Qué es la población infinita?
 Imposible de medir. Es infinita ya que incluye un gran conjunto de medidas y
observaciones. Suele tener más de 100.000 individuos y suele haber un mayor
margen de confianza y error de muestreo al tener que extrapolar los resultados del
estudio obtenido a la muestra de la población total.

¿Que es una variable continua?


 Es aquella que acepta un número infinito de un conjunto de valores. Es decir, no
es posible mencionar una cantidad concreta de posibles elementos para los cuales
existe una variable de este tipo.
Generalmente, las variables continuas hacen referencia a magnitudes físicas o
valores económicos (como lo pueden ser el precio, los ingresos y egresos y otros
índices financieros y contables), información que se puede expresar mediante
números decimales. En general, describen las características de un objeto de
estudio.
Ejemplos de variables continuas:
 El valor monetario de las pinturas que hay en un museo.
 La cantidad de sal que consumen las personas por día.
 El ancho que tienen los ríos de un bosque.
 La longitud de las avenidas de una ciudad.
 La cantidad (en kilogramos) de basura que se recicla.
 El tamaño (en km²) de los distintos tipos de catamaranes que
existen.
 La velocidad del viento.
 El tiempo que duran las óperas.
 La temperatura de las comidas.
 La cantidad de energía eléctrica que consumen los
electrodomésticos.
 La cantidad (en kilogramos) de bronce que se utiliza para fabricar
monumentos.
 El peso de las silo bolsas de un campo.
 La presión atmosférica.
 La cantidad de milímetros de agua que caen con las lluvias.
 El valor de las acciones financieras.

¿Que es una variable discreta?


 Una variable discreta es aquella que acepta un número finito de valores de un
conjunto. Es decir, se puede decir una cantidad concreta de posibles datos, sea
esta extensa o no.
Este tipo de variable se refiere a la cantidad de elementos que conforman una
población, muestra u objeto de estudio. Por esta razón, generalmente se dice que
las variables discretas aceptan números enteros, los cuales indican el número de
unidades que hacen parte de dicho grupo.
 Ejemplos de variables discretas:
 La edad de los egresados de una carrera.
 La cantidad de mascotas que tienen los habitantes de una ciudad.
 La cantidad de animales que hay en las distintas reservas ecológicas de un
país.
 La cantidad de ventas realizadas por cada empleado de una tienda.
 La cantidad de anotaciones que hacen los jugadores de baloncesto.
 La cantidad de panes que se fabrican cada día en una panadería.
 La cantidad de propiedades que posee cada ciudadano de un país.
 La cantidad de clientes de una compañía que brinda el servicio de Internet.
 La cantidad de prendas que aparecen en un desfile de moda.
 La cantidad de premios que tiene un actor.
 La cantidad de celulares que tienen las personas de una región.
 La cantidad de barcos que hay en un puerto por día.
 La cantidad de manzanas que produce un árbol.
 La cantidad de hojas que se pueden fabricar con cada árbol.
 La cantidad de senadores que votaron en contra de una ley.

¿Que es una variable aleatoria continua?


 Una variable aleatoria continua es aquella que puede tomar cualquier valor (al
menos teóricamente) entre 2 fijados. Los valores de la variable (al menos
teóricamente) no se repiten. 
 Se dice que una variable aleatoria es continua cuando toma valores en cualquier
punto de un intervalo (a, b) de la recta real. En este caso no tiene sentido
preguntarse por la probabilidad de que la variable tome un valor determinado (en
teoría puede tomar un conjunto infinito de valores).
 Ejemplos de variables aleatorias continuas:
 Tiempo observado al recorrer una cierta distancia.
 Estatura.
 Peso.
 Nivel de colesterol en sangre.

¿Que es una variable aleatoria discreta?


 Una variable aleatoria es discreta cuando sólo puede tomar unos ciertos valores
enteros en un número finito de valores o infinito numerable. 
 Por ejemplo, el número de caras obtenidas al lanzar tres monedas: 0, 1, 2, 3. Las
variables discretas representan algo que podemos contar, y no suelen llevar
decimales.

¿Por que a la estadística descriptiva se le llama “estadística paramétrica"  y cuales


son sus principales medidas de centralización y dispersión?
 Porque utiliza cálculos y procedimientos asumiendo que conoce cómo se
distribuye la variable aleatoria a estudiar.
 Las medidas de tendencia central más utilizadas son: media, mediana y moda.
 Ejemplo:
 Media: 
Para calcular la media se deben sumar todos los datos ingresados y
dividirlos entre el total de datos:

 Mediana:
Para calcular la mediana, se debe ordenar el conjunto de datos de forma
ascendente e identificar el valor en la posición central. Si la cantidad de
datos evaluados es impar, la mediana es el valor intermedio. Si la cantidad
de datos es par, la mediana es el promedio de los números del medio. Es
así que para los valores ingresados tenemos:

Artículos Relacionados  Ejercicios resueltos sobre productividad laboral


Posición 1 2 3 4 5 6 7 8
Valor             0          0         8.1       10      13.6      14.2     19.4     20.7
 Moda:
La moda es el número (o los números) con mayor frecuencia en el conjunto
de datos. Si todos los valores tienen la misma frecuencia se considera que
el conjunto de datos no tiene moda.

Valor Frecuencia
0 2
10 1
8.1 1
13.6 1
14.2 1
19.4 1
20.7 1

La moda del conjunto de datos es 0

1.2 Muestreo: Introducción al muestreo y tipos de


muestreo.
Introducción al muestreo
 Se denomina muestreo al proceso por el que generamos las muestras. Una
muestra es una parte (un subconjunto) de la población, y se desea que la
muestra sea lo más representativa posible de la población de la que
procede. Sin embargo, por muy cuidadosa que sea la selección de la
muestra difícilmente será una representación exacta de la población. Esto
significa que su tendencia central, variabilidad, etc., aproximan las de la
población, pero habrá cierta diferencia, que interesa sea lo menor posible.
Un concepto clave de muestreo es el de representatividad: Los
procedimientos de muestreo tienen por objeto generar muestras lo más
representativas posible de las poblaciones dados los objetivos de la
investigación y las circunstancias que afectan al muestreo.
 Las muestras singulares generadas para investigación con sujetos suelen
utilizarse para obtener algunos estadísticos (Media, proporción,
cuasivarianza, etc.) con los que se realiza el proceso de inferencia. En
cambio, las muestras simuladas por ordenador suelen ser utilizadas para
obtener distribuciones muestrales y realizar inferencia. Esto es de interés
cuando se dan circunstancias especiales que no aconsejan utilizar los
procedimientos habituales. Las distribuciones muestrales son las
distribuciones de estadísticos de muestras que pertenecen a la misma
población. Por ejemplo, la distribución muestral de la Media es la
distribución de las medias de muestras de un mismo tamaño extraídas de
la misma población.
 Ejemplo:
Sea un curso con 40 estudiantes (el número de datos es pequeño para
facilitar la comprensión del ejemplo). Queremos conocer la media de las
puntuaciones del curso, pero por diversas razones no tenemos acceso a
todos los datos (que se denomina población). Pero supongamos que
podemos seleccionar cinco puntuaciones aleatoriamente y obtener la
media de la muestra. Si repetimos el proceso y generamos más muestras
tendremos más Medias muestrales y podremos ver cómo se distribuyen:

La Media de los datos seleccionados aleatoriamente (son las señaladas en


negrita) es

:
Si repetimos el procedimiento 25 veces generamos 25 muestras. Las
Medias de cada muestra son:

El Histograma de la distribución de las Medias de las 25 muestras es

Tipos de muestreo.
 Muestreo aleatorio o probabilístico
Este tipo de muestreo es uno de los más utilizados en las investigaciones. Se 
comprende que aquí todos los sujetos o elementos de la población  pueden pasar
a formar parte de la muestra, pues tienen la misma probabilidad de ser escogidos.
Muestreo aleatorio simple.
En este método de muestreo lo principales es tener una idea clara de cuántos
sujetos serán necesarios para completar el tamaño de la muestra que se va a
investigar, pues este consiste en que a cada sujeto de la población se le debe
asignar un número, para que posteriormente mediante algún sorteo, o generando
números aleatorios con ayuda de rifas o algún ordenador se logre dar a conocer
los números de los sujetos seleccionados que serán tomados como muestra.
Muestreo sistemático.
Pues en este método como en el primero, los sujetos que conforman a la
población son enumerados, pero en lugar de dar a conocer los que serán incluidos
mediante el azar en este caso incluyen otra técnica. Posteriormente de que son
enumerados, los investigadores dividen el total de la población que se presenta
entre el total de sujetos que requieren para la muestra; para después elegir a uno
de los primeros de estos sujetos al azar (ya enumerados) y posteriormente se va
sumando de una forma secuencial o constante el mismo valor para elegir a los
sujetos requeridos.
Muestreo estratificado.
Mediante este método de investigación, los investigadores dividen a la población
en grupos o estratos que tengan relación o compartan características similares y
posteriormente se selecciona al azar o aleatoriamente a los sujetos finales de los
grupos o estratos formados. Este método es utilizado para cuando los
investigadores pretenden que dentro de la muestra se encuentren incluidos todos
los grupos de interés que puedan representar significancia para la investigación.

La distribución de la muestra tomada de la población es llamada “Fijación” y se


pueden conocer los tres que se muestran a continuación:
 Afijación simple: Donde cada grupo formado cuenta con la misma
cantidad de número de elementos.
 Afijación proporcional: Donde las distribuciones se hacen de acuerdo al
tamaño de la población o sujetos de cada estrato.
 Afijación óptima: Fijando la cantidad de sujetos que pueden ser admitidos
en la muestra.

Muestreo por Conglomerados.


En este método, la población ya se encuentra dividida en grupos o estratos
formados naturalmente y a partir de estos se toman la cantidad de sujetos que
sean necesarios de cada uno para así formar la muestra. Este es similar al método
por estratificación, sin embargo se facilita más, pues los grupos ya están formados
y solo se requieren los datos de esos elementos que lo integran.

 Muestreo no aleatorio o no probabilístico.


Mediante esta técnica de muestreo, en comparación del muestreo probabilístico
las muestras no se recogen por medio de procesos donde a los sujetos se les
brinden las mismas posibilidades de ser seleccionados.
Muestreo por cuotas.
Mediante este método los investigadores se encargan de incluir en la muestra solo
a un grupo determinado de sujetos que cumplen con ciertos requisitos o
condiciones específicas.
Muestreo intencional o de conveniencia.
Mediante este método, el investigador se encarga de elegir de acuerdo a sus
propios criterios o alcances a los sujetos que formarán parte de la muestra.
Muestreo por bola de nieve.
En este método se hace contacto con algún sujeto en específico y este se
encargara de buscar a otros sujetos o nuevos participantes consecutivamente.
Haciéndolo de esta forma hasta cumplir con el tamaño de muestra o cantidad de
sujetos que se necesitan.
Muestreo discrecional.
Mediante este método, se aplica una técnica parecida a la del método intencional,
pues el investigador recluta a los sujetos según sus criterios; pero en este caso,
los busca de acuerdo a lo que piensen que estos sujetos puedan aportar a la
investigación.

1.3 Teorema del límite central.


El teorema del límite central es un teorema fundamental de probabilidad y
estadística. El teorema describe la distribución de la media de una muestra
aleatoria proveniente de una población con varianza finita. Cuando el tamaño de la
muestra es lo suficientemente grande, la distribución de las medias sigue
aproximadamente una distribución normal. El teorema se aplica
independientemente de la forma de la distribución de la población. Muchos
procedimientos estadísticos comunes requieren que los datos sean
aproximadamente normales. El teorema de límite central le permite aplicar estos
procedimientos útiles a poblaciones que son considerablemente no normales. El
tamaño que debe tener la muestra depende de la forma de la distribución original.
Si la distribución de la población es simétrica, un tamaño de muestra de 5 podría
producir una aproximación adecuada. Si la distribución de la población es
considerablemente asimétrica, es necesario un tamaño de muestra más grande.
Por ejemplo, la distribución de la media puede ser aproximadamente normal si el
tamaño de la muestra es mayor que 50. Las siguientes gráficas muestran ejemplos
de cómo la distribución afecta el tamaño de la muestra que se necesita.
El teorema central del límite o teorema del límite central indica que, en condiciones
muy generales, si Sn es la suma de n variables aleatorias independientes, con
media y varianza finitas, entonces la función de distribución de Sn «se aproxima
bien» a una distribución normal (también llamada distribución gaussiana, curva de
Gauss o campana de Gauss). Así pues, el teorema asegura que esto ocurre
cuando la suma de estas variables aleatorias e independientes es lo
suficientemente grande.
Este teorema asegura, de manera esquemática, que, cuando sumamos un número
grande de variables, la variable resultante sigue una distribución normal.
De manera general, si  
X1, X2,..., Xn son variables de media o esperanza  μi=E(Xi)  y varianza 
σ2i=Var(Xi), i=1,.., n,  se verifica que la variable suma  Y=X1+X2+..+Xn (si n es un
número tendiendo a infinito) se puede aproximar por una variable normal, de
media la suma de las medias y varianza la suma de varianzas (desviación típica =
raíz de la suma de varianzas).
Este teorema establece la importancia de la distribución normal. Su resultado es
que, cuando se suma un número grande de variables aleatorias, la variable
resultante es una variable con distribución aproximadamente igual a la distribución
normal. Incluso, el término número grande(porque matemáticamente el teorema se
establece cuando  n tiende a infinito) no lo es tanto, porque, en la práctica, con
tener que  n sea un número mayor o igual a  30, la aproximación ya proporciona
buenos resultados.
 Permite averiguar la probabilidad de que la media de una muestra concreta esté
en un cierto intervalo.
 Permite calcular la probabilidad de que la suma de los elementos de una muestra
esté, a priori, en un cierto intervalo.

 Inferir la media de la población a partir de una muestra.

1.4 Distribuciones fundamentales para el muestreo.

 Esta distribución depende del tamaño de la población, el tamaño de las muestras y


el método de elección de las muestras.  Existen distribuciones muestrales de X y
S2, que son el mecanismo a partir del cual se hace inferencias de los parámetros
μ y σ2
Es la descripción de una característica particular de un fenómeno a partir de datos
numéricos; por ejemplo, la estatura de estudiantes, tamaño de plantas, tiempo de
reacción de animales a cierto estímulo, edad de la población escolar entre otros.
En palabras más simples, supongamos que de una determinada población tomar
todas las muestras posibles de tamaño n y calcular una estadística (por ejemplo,
media) de todas las muestras. Si luego preparas una distribución de probabilidad
de esta estadística, obtendrás una distribución de muestreo.
Las propiedades de la distribución de muestreo pueden variar dependiendo de
cuán pequeña sea la muestra en comparación con la población. Se supone que la
población se distribuye con normalidad como generalmente sucede. Si el tamaño
de la muestra es lo suficientemente grande, la distribución de muestreo también
estará cerca de lo normal.
Si éste es el caso, entonces la distribución de muestreo puede ser totalmente
determinada por dos valores: la media y la desviación estándar. Estos dos
parámetros son importantes para calcular la distribución de muestreo si se nos da
la distribución normal de toda la población.
 Distribuciones Muestrales de Medias.
Suponga que se tiene una muestra aleatoria de observaciones que se toma de
una población normal con media μ y varianza σ 2.
Cada observación Xi, i = 1, 2, …, n, de la muestra aleatoria tendrá entonces la
misma distribución normal que la población que se muestrea.
Teorema. Si X1, X2, …, Xn son variables aleatorias independientes que tienen
distribuciones normales con medias μ1, μ 2, … μ n y varianzas σ1 2, σ 2 2, … σ n 2
respectivamente, entonces la variable aleatoria
YaXaXanXn
tiene una distribución normal con media

y varianza

Según el teorema donde se establece la propiedad reproductiva de la distribución normal,


se concluye que

tiene distribución normal con media y varianza

 Distribución Muestral de S2.


Si S2 es la varianza de la muestra aleatoria de tamaño n que se toma de una población
normal que tiene la varianza σ 2 , entonces la estadística
La tabla A.5 da los valores de χ2 α para diversos valores de α y v. Las áreas α son los
encabezados de las columnas; los grados de libertad v se dan en la columna izquierda; y las
entradas de las tabla son lo valores χ2.

 Ejemplo:

 1.4.1 Distribución muestral de la media.


La distribución muestral de la media (o distribución muestral de medias) es la distribución
que resulta de calcular la media muestral de cada muestra posible de una población. Es
decir, el conjunto de medias muestrales de todas las muestras posibles de una población
forma la distribución muestral de la media.
Si tenemos una muestra aleatoria de una población N (m,s  ), se sabe (Teorema del límite
central) que la fdp de la media muestral es también normal con media m y varianza s2/n.
Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30)
para poblaciones cualesquiera. Es decir  es el error típico, o error estándar de la
media.
 Ejemplo:
la media muestral vale 1,5 en dos casos de los nueve posibles, por lo tanto, P(1,5)=2/9.

1.4.2 Distribución muestral de la diferencia de medias.


La distribución muestral de la diferencia de medias sirve para calcular la probabilidad de
que la diferencia entre dos medias de las muestras seleccionadas al azar de dos poblaciones
distintas se acerque a la diferencia de las medias de las poblaciones.
En estadística, la distribución muestral es lo que resulta de considerar todas las muestras
posibles que pueden ser tomadas de una población. Su estudio permite calcular la
probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población.
Mediante la distribución muestral se puede estimar el error para un tamaño de muestra
dado.

 Ejemplo:
En un estudio estadístico se quiere analizar la diferencia entre la estatura de los chicos y las
chicas de una determinada edad. Se sabe que la distribución que define la población de los
chicos de esa edad tiene una media de 157 cm y una desviación estándar de 9 cm y, por otro
lado, la distribución que define la población de las chicas de esa edad tiene una media de
148 cm y una desviación estándar de 7 cm. Si se selecciona una muestra de 30 chicos de esa
edad y una muestra de 35 chicas de esa edad ¿cuál es la probabilidad de que la estatura
media de la muestra de chichos sea 12 cm más grande que la estatura media de la muestra
de chicas?

Por lo tanto, la probabilidad de que la estatura media de la muestra de chicos sea 12 cm


mayor que la estatura media de las chicas es equivalente a la probabilidad de que la variable
Z sea mayor que 1,48.

Así pues, buscamos la probabilidad de Z>1,48 en la tabla de Z:


1.4.3 Distribución muestral de la proporción.
La distribución muestral de proporciones permite investigar la proporción de algún atributo
en una muestra (variables cualitativas), se genera como la distribución muestral de medias,
a excepción de que al extraer las muestras de la población se calcula el estadístico
proporción en lugar del estadístico promedio.
 Ejemplo:
Una fábrica de pasteles fabrica, en su producción habitual, un 3 % de pasteles
defectuosos. Un cliente recibe un pedido de 500 pasteles de la fábrica.
Calcula la probabilidad de que encuentre más del 5 % de pasteles defectuosos.
Estamos tomando una muestra de tamaño n=500, de una población donde la proporción de
pasteles defectuosos es de p=0.03. Podemos usar las Distribución Muestral de
Proporciones, que se ajusta a una normal

En nuestro ejemplo, si sustituimos los valores de p y n y calculamos, sería N(0.03 , 0.0076)

Se ha tipificado la variable y se ha hecho uso de la tabla de la N(0,1)

También podría gustarte