Está en la página 1de 8

Cultura estadística para la investigación Sesión 4

INTRODUCCIÓN A LA ESTADÍSTICA PROBABILÍSTICA

Importancia de La Probabilidad
La importancia de la probabilidad radica en que, mediante este recurso matemático, es
posible ajustar de la manera más exacta posible los imponderables debidos al azar en los
más variados campos tanto de la ciencia como de la vida cotidiana.

En efecto, la probabilidad es una estrategia mediante la cual se intenta estimar la


frecuencia con la que se obtiene un cierto resultado en el marco de una experiencia en la
que se conocen todos los resultados posibles. Así, el ejemplo más tradicional consiste en
definir cuál es la prevalencia de obtener un número al arrojar un dado. Sobre seis
resultados posibles (todas las caras), sólo es posible lograr un número por cada vez que el
dado es arrojado. En este caso, la probabilidad puede expresarse como uno en seis, un
sexto, la sexta parte o, en términos matemáticos precisos, 0.16 ó 16%.

La teoría de la probabilidad, en especial en el marco de sistemas más complejos, se aplica


en áreas variadas del conocimiento, como las ciencias exactas (estadística, matemática
pura y aplicada, física, química, astronomía), las ciencias sociales (sociología, psicología
social, economía), la astronomía, la meteorología y, en especial en forma más reciente, la
biomedicina.

La importancia esencial de la aplicación de los métodos de cálculo de la probabilidad reside


en su capacidad para estimar o predecir eventos. Cuanto mayor sea la cantidad de datos
disponibles para calcular la probabilidad de un acontecimiento, más preciso será el
resultado calculado. Dada la complejidad de los sistemas en los que suele aplicarse la
teoría de la probabilidad, se requiere de modelos informáticos y estadísticos de gran
elaboración, que serían imposibles de no contarse con los modernos recursos tecnológicos
relacionados con la computación.

Un buen ejemplo de su aplicabilidad cotidiana lo constituyen los análisis del comercio de


las commodities (materias primas) en las relaciones internacionales actuales. Dado que
gran parte de los factores involucrados en la estimación de la producción son azarosos
(vientos, humedad ambiental, exposición solar, mano de obra real, condiciones
económicas y financieras locales, avatares políticos regionales, entre otros), la teoría de la
probabilidad resulta de gran importancia, ya que intenta ajustar en conceptos matemáticos
cual será el devenir de los acontecimientos para calcular, por ejemplo, la producción final
de cereales, combustibles fósiles y otros recursos de un área geográfica.

Por lo tanto, la probabilidad es una herramienta fundamental en la planificación estratégica


de los movimientos sociales, económicos y laborales de toda la comunidad.

Mg. Roberto Fiestas Flores 1


Cultura estadística para la investigación Sesión 4

Población, Muestra y Muestreo

Población

Johnson y Kuby (2012), mencionan que es una “colección o conjunto de individuos, objetos
o eventos cuyas propiedades se analizarán” (p.4).

De otro lado Martínez (2012), considera que la población es un conjunto de medidas o


también es un conjunto de unidades o elementos que tienen una característica en común.

Así mismo Anderson, Sweeney y Williams (2008) establecen que la población “es el
conjunto de todos los elementos de interés en un estudio determinado” (p.15).

Spiegel, Schiller y Alu (2003) y Valderrama (2013) mencionan que una población en
estadística se utiliza para denotar las observaciones o medidas y no los individuos u
objetos. Teniendo en cuenta que puede ser finita o infinita, al total se le llama el tamaño de
la población, representado con la letra N.

Muestra

Para Martínez (2012), la muestra se define como “un conjunto de medidas pertenecientes
a una parte de la población” (p.662) y debe ser representativa y adecuada.

Elementos o Unidad de análisis

Son aquellos sobre las cuales se obtendrá la información que luego será analizada para
obtener los resultados y conclusiones de la investigación (Martínez, 2012).

Muestreo

Spiegel, Schiller y Alu (2003) establece que el muestreo es el proceso de obtener muestras.
Con el propósito de inferir los resultados encontrados en la muestra, respecto a la
población.

Velasco, Martínez, Roiz, Huazano y Nieves (2003) mencionan que el muestreo es el


procedimiento para seleccionar un número de unidades a partir de una población definida,
con la finalidad de generalizar los resultados en la población.

Los mismos autores indican que las razones para establecer un muestreo son: rapidez y
reducir costos.

Para efectuar un muestreo tenemos que responder tres preguntas:


1. ¿Cuál es la población en estudio?
2. ¿Cuántas personas se requieren en la muestra?
3. ¿Cómo seleccionar a las personas que intervendrán en la muestra?

La primera pregunta se responde en función con el problema a investigar, la segunda


pregunta se refiere a que la muestra debe ser la adecuada y esta se calcula con las diversas

Mg. Roberto Fiestas Flores 2


Cultura estadística para la investigación Sesión 4

fórmulas que existen, en relación a la tercera pregunta, debemos tener en cuenta los tipos
de muestreo.

Tipos de muestreo
1. Muestreo aleatorio o probabilístico

Para Martínez (2012) una muestra es aleatoria cuando todos los elementos de la
población tienen la misma probabilidad de ser elegidos en la muestra.
a. Muestreo aleatorio simple (irrestricto)
Martínez (2012) indica que es recomendable utilizar este tipo de muestreo cuando
la población no es numerosa y las unidades se concentran en un área pequeña,
porque se debe enumerar a toda la población (marco muestral), además que la
característica en estudio no debe poseer gran variabilidad porque implicaría un
tamaño de muestra muy grande.
Velasco et al. (2003) agregan que se deben utilizar los números aleatorios para
seleccionar a los elementos de la muestra.
b. Muestreo aleatorio sistemático
Velasco et al. (2003) indican que los elementos se seleccionan a intervalos
regulares, cada k elementos, siendo k la división entre el total de elementos y el
tamaño de la muestra. Tener en cuenta que el primer elemento seleccionado es
menor o igual a K, luego se va sumando el valor K.
c. Muestreo aleatorio estratificado (restringido)
Martínez (2012) este procedimiento implica que la población sea divida en grupos
llamados estratos, teniendo en cuenta que cada elemento debe pertenecer a un
solo estrato. Considerar en la estratificación las características de la investigación
y los objetivos.
La conformación de la muestra se realizará mediante la selección de los elementos
en cada estrato, mediantes estos tres procedimientos:
Afijación igual o asignación igual: cuando los elementos quedan asignados o
repartidos por igual en cada estrato muestral.
Afijación proporcional o asignación proporcional: los elementos se distribuyen en
los estratos muestrales, en la misma proporción que en la población.
Afijación óptima: cuando el tamaño de muestra y de los estratos muestrales,
dependen del grado de variabilidad de la característica en cada estrato y del costo
minino.
d. Muestreo por conglomerados, áreas o etapas
Martínez (2012) se utiliza cuando no existe listado o las unidades están demasiado
dispersas y no permiten tomar la información. Esto obliga a sustituir las unidades
físicas o elementales, por grupos de unidades, que llamaremos conglomerados,
que generalmente son superficies o áreas en la que se ha dividido el espacio
ocupado por la población. Los conglomerados son unidades que contienen a los
elementos, tal es así que nos podemos encontrar un muestreo por etapas como
el biétapico, el triépatico y el multiétapico, por lo que cambia de elementos según
las etapas.
2. Muestreo no aleatorio o no probabilístico

Velasco et al. (2003), es aquel donde la probabilidad de selección de cada elemento


para la muestra no es igual ni conocida.

Mg. Roberto Fiestas Flores 3


Cultura estadística para la investigación Sesión 4

a. Por conveniencia
Velasco et al. (2003), las unidades de estudio se seleccionan al momento de la
recolección de datos. Es fácil, económico y accesible, pero es poco representativo.
b. Por casos consecutivos
Velasco et al. (2003), la selección se realiza sobre los elementos que cumplen
ciertas características para el estudio y estos se consiguen en forma consecutiva.
c. Por cuotas
Velasco et al. (2003), la selección se realizan sobre los subgrupos que componen
la población.

Tamaño de muestra

Martínez (2012), el tamaño de la muestra es un cálculo basado en fórmulas y es de suma


importancia para determinar el tamaño adecuado de la muestra, simbolizado por n. Una
muestra debe ser pequeña para que el costo sea bajo y suficientemente grande para que
el error de muestreo sea tolerable.

El mismo autor indica que para el cálculo se debe tener en cuenta los siguientes elementos:

E: error de muestreo, es la diferencia entre el valor poblacional (parámetro) y el valor de


muestra (estadígrafo).
∓𝐸 = 𝑥̅ − 𝜇

𝑥̅ : Media muestral

𝜇: Media poblacional

𝐸: Error de muestreo

Varianza 𝜎 2 , es una medida de dispersión, que depende en gran parte el tamaño de la


muestra, a mayor dispersión, mayor será el tamaño de la muestra. Lo ideal será que la
varianza se obtuviera de la población investigada, sin embargo en la realidad esto no es
posible y tiene que estimarse mediante una muestra piloto o utilizar la varianza de los
antecedentes. Cuando se aplica una muestra piloto no solo se calcula la varianza, además
se tiene en cuenta otros criterios como la redacción de las preguntas del instrumento, la
confiabilidad, etc.

La confianza (Z), depende del investigador y se selecciona entre el 95% y 99%.

Tamaño de la población (N), se utiliza cuando se trabaja con poblaciones finitas.

Fórmulas del tamaño de muestra (Muestreo Aleatorio Simple)

Mg. Roberto Fiestas Flores 4


Cultura estadística para la investigación Sesión 4

Variables cuantitativas (población Variables cualitativas (población

infinita) infinita)

𝑍2𝜎 2 𝑍 2 𝑃𝑄
𝑛= 𝑛=
𝐸2 𝐸2

Variables cuantitativas (población


Variables cualitativas (población finita)
finita)

𝑁 2𝑍2𝜎2 𝑁 2 𝑍 2 𝑃𝑄
𝑛= 𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝜎 2 (𝑁 − 1)𝐸 2 + 𝑍 2 𝑃𝑄

P: proporción de éxito

Q = 1-P: proporción de fracaso

Fórmulas del tamaño de muestra (Muestreo Aleatorio Estratificado)


Variables cuantitativas (población
Variables cualitativas (población finita)
finita)

𝑁𝑍 2 ∑ 𝑊ℎ 𝑆ℎ2 𝑁𝑍 2 ∑ 𝑊ℎ 𝑃ℎ 𝑄ℎ
𝑛= 𝑛=
𝑁𝐸 2 + 𝑍 2 ∑ 𝑊ℎ 𝑆ℎ2 𝑁𝐸 2 + 𝑍 2 ∑ 𝑊ℎ 𝑃ℎ 𝑄ℎ

𝑁ℎ 𝑁ℎ
𝑊ℎ = 𝑊ℎ =
𝑁 𝑁

𝑛ℎ = 𝑛(𝑊ℎ ) 𝑛ℎ = 𝑛(𝑊ℎ )

P: proporción de éxito

Q = 1-P: proporción de fracaso

TABLA DE APOYO AL CÁLCULO DEL TAMAÑO DE UNA MUESTRA


POR NIVELES DE CONFIANZA

Mg. Roberto Fiestas Flores 5


Cultura estadística para la investigación Sesión 4

Nivel de Confianza 99% 98% 97% 96% 95%

Z 2.58 2.33 2.17 2.05 1.96

Mg. Roberto Fiestas Flores 6


Cultura estadística para la investigación Sesión 4

Ejercicios:
1. Para efectos de planeación económica en Ancash, es necesario estimar entre 2500
dueños de ganado: a) el número de vacas lecheras por dueño, con un error de 10 vacas
lecheras y una confianza del 95%; b) el rendimiento medio de leche de vaca por dueño,
con un error de 27 litros y una confianza del 96%; c) la proporción de dueños de ganado
con un rendimiento medio de leche de vaca superior a los 250 litros, con error del 8%
y confianza del 97%. Una encuesta preliminar de tamaño 40, arrojó las siguientes
estimaciones: a) Promedio de vacas lecheras por dueño, 46 y desviación típica, 40. b)
Rendimiento medio de leche de vaca por dueño, 345 litros y varianza 9700 litros2. c)
60% de los dueños de ganado tienen rendimiento medio de leche superior a 250 litros.
d) ¿Qué tamaño de muestra recomendaría usted?
2. Si en el ejercicio anterior se desea estimar el número total de vacas lecheras en los
2500 dueños de ganado, con un error de 8000 vacas y una confianza del 95%. ¿Qué
tamaño de muestra se requeriría?
3. Se requiere determinar el tamaño de muestra para el estudio de gastos semestrales,
en ropa, en una zona de Chimbote. Para estimar la desviación típica de la población, el
investigador realiza una encuesta preliminar en 80 familias de dicha zona, encontrando
una desviación típica de S/.250. a) ¿Cuál es el valor de n si se desea que el error
estándar de la media inferida de la población no exceda de ±S/.35? b) ¿Cuál es el
tamaño de la muestra si se sabe que en la zona viven 1350 familias?
4. La consejería de trabajo planea un estudio con el interés de conocer el promedio de
horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será
extraída de una población de 10000 mujeres que figuran en los registros de la
Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza
es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a
admitir un error máximo de 0.5 horas, ¿Cuál debe ser el tamaño muestral que
empleemos?
5. Se desea realizar una investigación para estimar el peso medio de los recién nacidos
de madres fumadoras. Se admiten un error máximo de 100 gramos, con una confianza
del 96%. Si por estudios anteriores se sabe que la desviación típica del peso medio de
tales recién nacidos es de 400 gramos, ¿qué tamaño mínimo de muestra se necesita
en la investigación?
6. La desviación típica de la altura de los habitantes de un país es de 8 cm. Calcular el
tamaño mínimo que ha de tener una muestra de habitantes de dicho país para que el
error cometido al estimar la altura media sea igual o inferior a 1 cm con un nivel de
confianza del 97%.
7. Determinar el número de profesionales a encuestar en una región donde se estima en
500 el número de ellos. El objetivo del estudio es determinar entre otras cosas, la
internacionalidad de seguir estudios de maestría, con una prueba piloto de 20
profesionales, se determinó que la proporción de profesionales con afán de continuar
sus estudios era del 25%. La confiabilidad del estudio, dado que sus resultados serán
válidos con otras fuentes se definió en el 96%, el error puede estar entre el 4% y 6%,
dependiendo de los costos se definirá el tamaño a seleccionar.
8. Por estudios previos se tiene conocimiento que la distribución del peso al nacer de
niños que cumplen su período de gestación de 40 semanas es aproximadamente
normal con una media de 3550 gramos y una desviación estándar de s=400 gramos.
Se va a realizar un nuevo estudio para una población con características similares, con

Mg. Roberto Fiestas Flores 7


Cultura estadística para la investigación Sesión 4

el fin de estimar el peso promedio al nacer de los niños. Con base en el estudio previo
determine el tamaño de muestra. Además, se considera que un error de máximo 45
gramos logra una estimación valida, la confiabilidad del estudio es del 95%.
9. Se requiere obtener una muestra sistemática que seleccione egresados de un
programa de la Universidad que tienen 2520 de ellos. La variable clave del estudio es
categórica y se aduce que la proporción es del 35%, además, se quiere un error del 4%
y una confiabilidad del 98%.
10. Una Institución de Salud tiene 6100 empleados, se quiere determinar cómo es el clima
laboral en la organización, usando una confiabilidad del 95%, un error admisible de 6%
y considerando que la proporción de empleados no satisfechos es del 30%. Calcule el
número de empleados a consultar

Producto académico

Identificar la población, muestra y muestreo del informe estadístico (grupal).

Desarrollar los ejercicios del módulo.

Referencias bibliográficas

Johnson, R. y Kuby, P. (2012). Estadística elemental. 11ª ed. México, D.F.: Cengage
Learning Editores.

Martínez, C. (2012). Estadística y Muestreo. 13ª ed. Bogotá: Ecoe ediciones

Spiegel, M., Schiller, J. y Alu, R. (2003). Teoría y problemas de probabilidad y estadística.


2ª ed. México: McGraw-Hill/Interamericana editores.

Valderrama, S. (2013). Pasos para elaborar proyectos de investigación científica. 2ª ed.


Lima: San Marcos.

Velasco, V., Martínez, V., Roiz, J., Huazano, F. y Nieves, A. (2003). Muestreo y tamaño de
muestra. Una guía práctica para personal de salud que realiza investigación. Buenos
Aires: NY Editors.

Mg. Roberto Fiestas Flores 8