Está en la página 1de 6

Inferencia estadística.

Conceptos
básicos
Generalidades
Las diferencias más importantes entre estadística y probabilidad son:
• En la probabilidad se razona a partir de la población a la muestra.
• En la estadística, el razonamiento parte de la muestra para llegar al conocimiento Conceptos clave
de toda la población.
Muestreo
El estudio de una población, tomando como base las muestras, se llama estadística Estimación puntual y por
inferencial o estadística inductiva, algunos autores la citan como teoría de muestras. intervalos
La inferencia estadística trata de conocer, o explicar, el comportamiento de la Prueba de hipótesis
población mediante los datos obtenidos de una muestra, e incluye: Muestreo aleatorio con y
sin reemplazo
• Muestreo
Muestreo por
• Estimación puntual y por intervalos conglomerados
Muestreo estratificado
• Prueba de hipótesis
Muestreo sistemático
Dado que no podemos estar absolutamente seguros de la veracidad de las inferencias Distribución de las medias
obtenidas, las denominamos probabilidades. de las muestras
Para predecir a partir de una muestra es necesario haberla seleccionado y recopilado Estimador
cuidadosamente; si la muestra no se selecciona adecuadamente, es incorrecta o Estima del intervalo del
hay desviaciones en los datos, aún con cualquier tipo de análisis estadístico que se parámetro
aplique, no se llegará a buenas conclusiones. Intervalos de confianza
Hipótesis de trabajo
Muestreo Hipótesis de estadística
Cursos de acción
El proceso para obtener una muestra debe ser el más económico, el más rápido y el Ensayos de hipótesis
que asegure ser el más representativo de toda la población.
Al seleccionar una muestra debemos especifi car claramente:
1. El método de selección de los individuos de la población y el tipo de muestra que
se va a aplicar.
2. Tamaño de la muestra.
3. El grado de fi abilidad de las conclusiones que pensamos obtener.
4. Las características de la población de acuerdo a su grado de homogeneidad o
heterogeneidad, respecto a la variable que se está analizando.
Puede ocurrir que una muestra represente a una población para determinadas variables
y no sea representativa para otras.
Otros dos conceptos a tomar en consideración en el muestreo son:

PROBABILIDAD CAP 15.indd 253 7/19/07 7:51:04 PM


254 Probabilidad y estadística

Fracción de muestreo
Es el cociente que resulta de dividir el tamaño de la muestra y el tamaño de la
población. Si se multiplica por 100, resulta ser el porcentaje de la población que
representa la muestra.
Problema 1

En un pueblo de 17 500 habitantes se escoge una muestra de 850 personas


para conocer el grado de seguridad ante delitos que las autoridades tratan
de disminuir. Calcula la fracción de muestreo.
Solución:
850
 0.0485
17500
0.04100  4.8 %
0.04(100) = 4.8 %
Se va a encuestar al 4% de la población.

Factor de elevación
Es el cociente entre el tamaño de la población y la muestra. El resultado representa el
número de elementos que hay en la población por cada elemento de la muestra.
Problema 2

Con los datos del problema anterior calcula el factor de elevación.


Solución:
17500
= 20.58
850
Cada persona de la muestra representa el 20.58 de la población
(aproximadamente 21 personas).

Procedimientos de muestreo
Al decidir qué tipo de muestra o muestras se quieren, se tendrá en cuenta el número
y características de la población.
Ejemplo:

Para expresar los colores que los adolescentes prefieren usar se podría
usar la variable y = “Colores favoritos de los adolescentes”; sin embargo,
los datos obtenidos no serían útiles para el estudio de las variables
aleatorias = “Reacción de los propietarios de automóviles ante el pago de
la tenencia”.
En general, se consideran dos tipos de muestreo.
a) Probabilístico. Cada muestra tiene la misma probabilidad de ser
elegida.
b) Intencional. La persona que obtiene la información es quien procura
que la pregunta sea representativa de lo que se desea saber. Su
representatividad es subjetiva.

PROBABILIDAD CAP 15.indd 254 7/19/07 7:51:04 PM


Capítulo 15 Inferencia estadística. Conceptos básicos 255

El muestreo probabilístico puede ser:


•  Aleatorio con y sin reemplazo
•  Por conglomerados
•  Estratificado
•  Sistemático

Muestreo aleatorio con y sin reemplazo


Es aquel en que el proceso de selección de la muestra garantiza que todas las
muestras posibles por obtener de la población pueden tener la misma probabilidad
de ser elegidas.
Una vez que un elemento es seleccionado y las características del objeto de estudio
son cuantificadas, vuelve a formar parte de la población y en consecuencia, puede
volver a ser elegido. Éste es un muestreo aleatorio con reemplazo o reposición; se le
cita con el nombre de aleatorio simple.
Si el elemento no vuelve a formar parte de la población, es un muestreo sin reposición
o reemplazo. Se le identifica con el nombre de muestreo irrestrictamente aleatorio.
Los dos métodos son distintos, sin embargo, cuando el tamaño de la población es tan
grande que puede considerarse como infinito; por ejemplo, la población del Distrito
Federal mayor de 18 años, si se aplican los dos métodos no habrá diferencia en sus
conclusiones.
Si la población es pequeña, por ejemplo, al revisar un pedido de mercancía, se
recomienda el muestreo sin reemplazamientos para evitar que un elemento sea
seleccionado más de una vez.

Muestreo por conglomerados


La población se divide en áreas que se llaman conglomerados, cada uno de éstos será
lo más heterogéneo posible internamente y lo más homogéneo entre sí. A continuación
se selecciona, al azar, uno o algunos conglomerados que forman la muestra.
Este método se utiliza cuando resulta muy costoso elaborar una lista completa
de todos los elementos de la población; el inconveniente se presenta cuando los
conglomerados no son homogéneos entre sí, ya que la muestra final puede no
ser representativa de la población. Sin embargo, tiene la ventaja de simplificar el
levantamiento de la población.

Ejemplo:

Sea la variable aleatoria x: “Intención de voto en las elecciones generales


de una nación”.
Para hacer el muestreo por conglomerados, el país se divide en regiones y
éstas, a su vez, en ciudades con una población no mayor a 150 mil habitantes.
Las localidades con más habitantes, se dividirán en municipios o barrios.
La suma de estas divisiones representa a toda la población del país.
Las encuestas sobre tres candidatos pueden incluir, entre otras, preguntas
como las siguientes:

PROBABILIDAD CAP 15.indd 255 7/19/07 7:51:04 PM


256 Probabilidad y estadística

1. De los candidatos propuestos, por cuál de ellos piensa votar. La res-
puesta podría ser condicionada por el temor al manifestar preferencia
por un candidato.

2. De los problemas que sufren usted y sus familiares: inseguridad, falta
de empleo, corrupción, encubrimiento, impunidad, ¿cuál de ellos le
preocupa más y en qué orden le interesa sean resueltos?

3. De los gobiernos que hay en las diferentes entidades, ¿cuál o cuáles
considera que están gobernados mejor? Explique brevemente por qué.

Se puede presentar el caso de que alguno de los partidos contendientes


decida utilizar los resultados de encuestas anteriores y así favorecer su
posición.

Muestreo estratificado
La población se divide en estratos homogéneos internamente y los más heterogéneos
externamente entre sí. De cada estrato se selecciona un número de elementos
proporcional al tamaño del estrato o según algún otro criterio (nivel económico,
cultural, etcétera).
Si consideramos una población N y la dividimos en h subpoblaciones de tamaños
N1, .... Nh, éstas son disjuntas y cumplen N1 + N2 + … + Nk = N.
Cada una de las subpoblaciones es un estrato.
Si necesitamos obtener una muestra de tamaño n de la población inicial, la obtenemos
de cada estrato de manera que n1 + n2 + … nh, = n.
Este método permite obtener las características de la información motivo de estudio
y aumenta la precisión de las estimaciones sobre toda la población. En general,
brinda mejores resultados que el muestreo aleatorio, mientras más diversos sean los
estratos entre sí y sean más homogéneos internamente.
Las desventajas que presenta el muestro estratificado es que resulta difícil decidir
a qué estrato asignar cada uno de los elementos de la población y cómo elegir el
tamaño de la muestra de cada estrato para que el total sea n.

Problema 3

En una colonia con una población aproximada de 17 000 habitantes se


sabe, según el censo reciente, que 7 800 son adultos, 2 950 de la tercera
edad y 6 250 son niños. Calcula el tamaño de la muestra de cada estrato
si se desea saber las preferencias de 300 personas en sus programas de
televisión.

Solución:

Para las personas de la tercera edad:

¥ 2 950 ´
300 ¦  300 0.17  51
§ 17 000 µ¶

¥ 7 800 ´
300 ¦  300 0.45  135
§ 17 000 µ¶

PROBABILIDAD CAP 15.indd 256 7/19/07 7:51:04 PM


Capítulo 15 Inferencia estadística. Conceptos básicos 257
¥ 2 950 ´
300 ¥¦ 2 950 ´µ  300 0.17  51
300 §¦ 17 000 ¶µ  300 0.17  51
§ 17 000 ¶
Adultos:

¥ 7 800 ´
300 ¥¦ 7 800 ´µ  300 0.45  135
300 §¦ 17 000 ¶µ  300 0.45  135
§ 17 000 ¶
Niños:
¥ 6 250 ´
300 ¥¦ 6 250 ´µ  300 0.36  108
300 §¦ 17 000 ¶µ  300 0.36  108
§ 17 000 ¶

Nota: Se tomaron 2 cifras decimales en los valores de 0.17, 0.45 y 0.36. Se pueden
redondear para que la suma sea de 300.

Muestreo sistemático
En este caso se divide la población en subconjuntos de tamaño; a continuación, se
toma al azar un elemento del primer grupo que ocupa el lugar k y el resto de los
elementos de la muestra ocupan los lugares.
N n
k + , k + 2 , k,…
n N
N n N n
k + , k + 2 , k,… k + , k + 2 , k,…
Supongamos que la poblaciónn es de N N elementos ordenados y numerados del 1n hasta N,Ny
N n N
queremos obtener una
k + muestra ,=k ,n… n. Dividimos la población en n subconjuntos,
, k + 2delg tamaño
n N N N
cada uno de ellos con g = g = elementos
elementos. Cada subconjunto constará de tantos
n n
N
N elevación; además, despejando queda N = ng.
como indique el factor de
g= n
Nn N
Se toma al azar un elemento de los enumerados desde 1, 2, … hasta .
n n
N
Si el resultado de no es entero, se redondea al entero menor. Esto puede producir
n
una pequeña dificultad que no afecta y debe despreciarse cuando n > 50.
Este tipo de muestreo sistemático es semejante al aleatorio si los elementos se han
numerado en forma aleatoria.
El muestreo es de aplicación fácil y se extiende la muestra a toda la población.
La desventaja es que se presentan dificultades al tratar de calcular la varianza y su
aumento si existe periodicidad en la numeración de los elementos.
Problema 4

Se aplicará una encuesta en una pequeña ciudad de 8 060 habitantes. Se


seleccionará una muestra sistemática de 20 personas entre 1 200 padres de
familia para conocer el grado de aceptación de la gestión administrativa
de la ciudad por parte del presidente municipal.
Solución:
Calculamos el factor de elevación:

PROBABILIDAD CAP 15.indd 257 7/19/07 7:51:05 PM


258 Probabilidad y estadística

1 200
 60
20

A continuación, seleccionamos un elemento al azar entre el 1 y el 60. Su-


pongamos que elegimos el 27; así los demás elementos seleccionados son:
27, 87, 147, 207, 267, 327, 387, 447, 507, 567, 627, 687, 747, 807, 867,
927, 987, 1 047, 1 107, 1 167.
Se han seleccionado 20 personas, a las que les corresponden los números
citados. Al número 27, que seleccionamos al azar, le sumamos 60 y
continuamos del mismo modo hasta tener los 20:
(27, 27 + 60, 27 + 2(60), + 27 + 3(60),…)
Conclusión:
Para realizar encuestas más complejas, se utilizan los muestreos estratificados,
conglomerados y aleatorios.
Problema 5

Se desea conocer la opinión sobre el desempeño de los funcionarios


federales del gobierno de un país. Para lograr este objetivo, se solicita
una proposición para la solución correspondiente.
Solución:
Una proposición sería la siguiente:
La población del país se dividirá en conglomerados: delegaciones en
algunas ciudades o bien, municipios y barrios, los cuales pueden ser más
o menos homogéneos internamente pero heterogéneos entre sí.
Posteriormente, estos conglomerados se clasifican en estratos homogé-
neos, por ejemplo en barrios. Cada uno de estos estratos, que son unida-
des primarias, se dividirá en nuevas unidades, por ejemplo, un número de
manzanas o conjuntos habitacionales constituirán unidades secundarias.
Finalmente las muestras se tomarían así:
1. Se seleccionarían unas muestras estratificadas (al menos uno) de cada
estrato.
2.  De cada estrato seleccionado se eligen, al azar, varios bloques de casas.
3.  Se seleccionará, al azar, una o varias casas dentro de los bloques citados.

PROBABILIDAD CAP 15.indd 258 7/19/07 7:51:05 PM