Unidad 1 Estadística Inferencial

UNIDAD 1.
CONCEPTO E IMPORTANCIA
DE LA ESTADÍSTICA INFERENCIAL,
DISTRIBUCIONES DE PROBABILIDAD
ASOCIADAS A VARIABLES ALEATORIAS
CONTINUAS
AÑO LECTIVO 2018-2019

UNIDAD 1. CONCEPTO E IMPORTANCIA DE LA
ESTADÍSTICA INFERENCIAL, DISTRIBUCIONES DE
PROBABILIDAD ASOCIADAS A VARIABLES
ALEATORIAS CONTINUAS
1 Concepto de la Estadística Inferencial y su importancia ............. 3
1.1 Términos Utilizados............................................................... 3
2 La función de la Estadística Inferencial ....................................... 5
2.1 Tipos de datos que analiza la estadística en la investigación.

6
3 Variables Aleatorias ...................................................................... 7
4 Parámetros y Estadísticos .......................................................... 10
5 Tipos de Distribuciones .............................................................. 15
5.1 Distribución Normal ............................................................ 15
5.2 Curva Normal estándar ....................................................... 16
5.2.1 Simétrica ........................................................................20
5.2.2 Asimétrica a derecha ..................................................... 21
5.2.3 Asimétrica a izquierda ................................................... 22
5.2.4 Con forma de campana .................................................. 22
5.2.5 Uniforme ........................................................................ 22
6 Distribución Normal a Probabilidades con variables aleatorias

discretas 24
6.1 Variables aleatorias discretas ........................................... 24

1
6.2 Parámetros de una variable aleatoria .................................. 25

Página
7 Medidas resumen ....................................................................... 27
7.1 Posición del centro de los datos ..........................................28

7.1.1 La media ......................................................................... 29
7.1.2 La mediana ..................................................................... 29
7.1.3 Medidas de dispersión o variabilidad ............................30
7.1.4 Rangos y distancia intercuartil ...................................... 31
7.1.5 Los cinco números resumen y el gráfico de caja y brazos

33
7.1.6 Desviación estándar ....................................................... 35
7.1.7 Centro y dispersión en diferentes tipos de distribuciones

37
8 Muestreo y estimación................................................................ 42
8.1 Tipos de Muestreo ............................................................... 43
8.1.1 Muestreos no probabilísticos. ........................................ 43
8.1.2 Muestreos probabilísticos: ............................................ 46
8.2 Cálculo del tamaño de la muestra ...................................... 60
8.2.1 Tamaño muestral para estimar una media poblacional62
8.2.2 Tamaño muestral para estimar una proporción

poblacional 64
8.2.3 Error de muestreo y nivel de confianza: evaluación de

muestras para la investigación profesional ......................................... 69
9 Bibliografía ............................ Error! Bookmark not defined.
10 Test ..................................... Error! Bookmark not defined.
11 Actividades de la Unidad ... Error! Bookmark not defined.

2
Página
1 Concepto de la Estadística Inferencial y su importancia
La estadística inferencial es una parte de la estadística que
comprende los métodos y procedimientos que por medio de la inducción
determina propiedades de una población estadística, a partir de una parte
de esta. Su objetivo es obtener conclusiones útiles para hacer deducciones
sobre una totalidad, basándose en la información numérica de la muestra.
Se dedica a la generación de los modelos, inferencias y predicciones

asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad
de las observaciones. Se usa para modelar patrones en los datos y extraer
inferencias acerca de la población bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis),
estimaciones de unas características numéricas (estimación), pronósticos
de futuras observaciones, descripciones de asociación (correlación) o
modelamiento de relaciones entre variables de Sam (análisis de regresión).
Otras técnicas de modelamiento incluyen análisis de varianza, series de
tiempo y minería de datos.
La inferencia estadística se encargará de sacar conclusiones acerca

de parámetros de la población basándose en muestras que podamos
recoger. Así su objetivo es sacar conclusiones para «cosas grandes» a partir
de las «pequeñas».
1.1 Términos Utilizados

Unidades A los objetos de interés de un estudio se los denomina unidades
muestrales muestrales o simplemente unidades. Muchas veces, las unidades
muestrales son individuos: tornillos, personas, tubos de pasta
dentífrica, lamparitas. Otras veces, las unidades están compuestas
3
por muchos individuos: ciudades, escuelas, lotes (de tornillos) etc.

Página
Variables Las variables son características que pueden cambiar de una unidad
muestral a otra, como la edad de las personas, la población de cada
ciudad, el porcentaje de alumnos reprobados de una escuela, la
preferencia de una comida balanceada para un animal, la intensidad
de emisión de rayos X de cada televisor, la capacidad de
almacenamiento de un disco rígido, la longitud de un tornillo, la
duración o el consumo de una lamparita.
Población Para cualquier pregunta que interese responder, primero es
necesario dirigir la atención a un grupo particular de unidades
muestrales: personas, ciudades, animales, televisores, tornillos o
lamparitas.
 ¿Qué piensan los porteños sobre el Sistema de Evaluación
Permanente de Conductores? ¿Qué porcentaje de familias
de la ciudad de Manta tienen mascotas?
 ¿Cuál es la expectativa de vida de los diabéticos?
 ¿Qué porcentaje de todos los tubos de pasta dentífrica son
llenados de acuerdo a sus especificaciones?
 ¿Cuál es la duración promedio de las lámparas de bajo
consumo de una determinada marca?
 ¿Los jóvenes deportistas consumen menos alcohol que los
sedentarios
En cada uno de los ejemplos, se plantea una pregunta y se puede
identificar uno o más grupos específicos de unidades que interesa
estudiar: los porteños (habitantes de la ciudad de Buenos Aires), las
familias de la ciudad de Santa Fe, los diabéticos, los tubos de pasta
dentífrica, las lámparas de bajo consumo, los deportistas y los
sedentarios.
Se llama población a todo el grupo de unidades muestrales
(generalmente son individuos) que interesa estudiar con el fin de
responder una pregunta de investigación. Las poblaciones, sin
embargo, pueden ser difíciles de definir. En un buen estudio, los
investigadores deben definir la población con toda claridad.
Muestra ¿Qué hacemos para probar la sopa? Revolvemos la olla con una
cuchara, sacamos una porción -una muestra- la saboreamos y
sacamos una conclusión sobre toda la sopa de la olla sin haber en
realidad probado toda. Si la muestra ha sido tomada
4
adecuadamente -sin elegir tramposamente la parte buena-

Página
tendremos una buena idea del sabor de la totalidad de la sopa. Esto

se hace en estadística, más específicamente en inferencia
estadística.
Los investigadores quieren averiguar algo sobre una población, pero
no tienen tiempo o dinero para estudiar a todos los individuos que
la conforman. Por lo tanto, ¿qué hacen? Seleccionan una cantidad
pequeña de unidades muestrales de la población (esto se llama una
muestra), estudian esas unidades, generalmente individuos, y
utilizan esa información para sacar conclusiones sobre toda de la
población.
Muestra Una buena muestra debe ser representativa de la población. Esto
representativa significa, que todas las características importantes de la población
tienen que estar en la muestra en la misma proporción que en la
población.
Una muestra tiene, en pequeño y lo más parecidas posibles, las
características de la población.
Podremos sacar conclusiones respecto de la población total a partir
de una muestra -esto es, realizar una inferencia-, para todas
aquellas características en las cuales la muestra representa a la
población.
2 La función de la Estadística Inferencial

La estadística inferencial se ocupa de predecir, sacar conclusiones,
para una población tomando como base una muestra de dicha población.
Como todas las predicciones, siempre han de hacerse bajo un cierto grado
de fiabilidad y confianza.
El propósito principal de los métodos estadísticos es legitimar

generalizaciones sobre poblaciones usando datos de muestras.
El uso principal de la inferencia estadística en la investigación del

comportamiento es hacer inferencia acerca de un número grande de
personas o de otras unidades observacionales, a partir de datos
concernientes a un grupo relativamente pequeño de personas.
5
Página
Los métodos estadísticos inferenciales emplean el razonamiento

inductivo, es decir, razonan de lo particular a lo general, razonamiento de
los estadígrafos de una muestra observada a los parámetros de la población
no observada.
3 Tipos de datos que analiza la estadística en la investigación.

En general, encontramos dos grandes tipos de variables:
cuantitativas y cualitativas que, a su vez se subdividen en subtipos. La forma
de distinguirlas va a ser que: las primeras vienen asociadas con cantidades
medidas en algún tipo de unidad y, las segundas, con cualidades o
categorías.
Variables cualitativas
Cuando no es posible asociar sus valores a medidas numéricas. Son

valores susceptibles de clasificación. Por ejemplo: sexo de las personas
(hombre, mujer); nacionalidad (española, de otro país); color preferido
(azul, blanco, rojo…); nivel de estudios (sin estudios finalizados, primarios,
secundarios, superiores, postgrado), etc.
Se suele hablar de dos tipos:
» Nominal: los valores son categorías que no pueden ordenarse. Son

valores distintos por una cualidad, no por una cantidad. En SPSS, el
software estadístico más popular, se las denomina nominal.
Por ejemplo: ¿Estado Civil?
 Soltero - Casado -Viudo - Divorciado
» Ordinal: sus valores son categorías, pero pueden ordenarse (de

menor a mayor). En SPSS se las denomina ordinal. Ejemplo: ¿Cuál es su
nivel de satisfacción con el servicio telefónico?
6
Página
 Muy Satisfecho – Satisfecho – Ni Satisfecho Ni Insatisfecho – Poco

Satisfecho – Insatisfecho.
Variables cuantitativas
Sus resultados son medidas numéricas. En SPSS se las denomina

variables escala.
Hay dos tipos:
» Variable cuantitativa discreta: los valores que toma son números

enteros. El número de valores entre dos valores dados es finito. Ejemplo:
número de hijos de una familia (1, 2, 3, 4…), número de habitantes de un
municipio.
» Variable cuantitativa continua: puede tomar cualquier valor en

una escala de medidas, ya sea entero o fraccionario. El número de valores
entre dos valores dados es infinito. Ejemplo: estatura de una persona (1,90
m.), ingresos anuales de una familia (60.000 euros), peso de un objeto (30
gramos).
Saber clasificar variables en cualitativas y cuantitativas y, dentro de

estas categorías, en nominales, ordinales, discretas o continuas es crítico. El
análisis estadístico de cada tipo de variable es diferente en cuanto a las
técnicas a aplicar dependiendo de su tipología. Por consiguiente, antes de
iniciar cualquier tipo de análisis, el analista debe clasificar mentalmente la
variable que vaya a estudiar y seleccionar la técnica adecuada para ello. A lo
largo de la asignatura de Investigación Cuantitativa, cada vez que se
presente una técnica de análisis, se hará referencia al tipo de variables a las
que se puede aplicar.
4 Variables Aleatorias
Frente al concepto de variable estadística, el concepto de variable
7
Página
aleatoria supone contar con información de la probabilidad asociada a cada

una de las modalidades de la variable, lo cual implica contar con datos para
la población pues, en otro caso, lo que tendríamos serían frecuencias
relativas, esto es, estimaciones de las probabilidades, no las probabilidades
en sí.
Ejemplo: Si medimos la variable “estado civil” en toda la población

de estudiantes de la UVEG (n = 45000) y obtenemos que 90 son viudos,
entonces la frecuencia relativa correspondiente a la modalidad ‘ser viudo’
(pviudo= 90/45000 = 0,002) será precisamente la probabilidad de ‘ser
viudo’ (Pviudo) en la población de estudiantes de la UVEG, y no una
estimación de la misma. Análogamente, si obtenemos las probabilidades
asociadas a las otras modalidades (sucesos) de la variable estado civil,
tendremos la distribución de probabilidades asociada a esta variable en la
citada población:
La distribución de probabilidad de una variable aleatoria -de forma

análoga a la distribución de frecuencias de una variable estadística- consiste
en la correspondencia entre los distintos valores que toma la variable y las
probabilidades asociadas a esos valores.
A esa correspondencia entre las modalidades de una variable y sus

probabilidades se le suele llamar función de probabilidad en el caso de
tratarse de una variable aleatoria discreta (variables categóricas, ordinales
o cuantitativas discretas) y función de densidad de probabilidad en el caso
de que sea continua (variables cuantitativas continuas).
8
Ejemplo: función de probabilidad correspondiente a la variable ‘Nº

Página
de contratos laborales en los 2 últimos años’ para la población de personas

en edad laboral de la comarca del Camp de Morvedre:
Y se llama función de distribución, ya sea la variable ordinal o
cuantitativa, a la que hace corresponder a cada valor de la variable, la
probabilidad de que se dé un valor como ese o inferior (concepto análogo al
de frecuencia relativa acumulada). Este concepto no es aplicable si la
variable es categórica. Ejemplo: función de distribución para el ejemplo
anterior:
La distribución de probabilidad de una variable no suele ser conocida

dado que, normalmente, no es factible contar con los datos de todas las
entidades de la población de interés para una determinada variable- Una
aproximación a la misma consiste en estimar las probabilidades
correspondientes a partir de los datos recogidos para una muestra de esa
población y la aplicación de la aproximación frecuencialista al cálculo de
probabilidades presentada antes. Otra vía de aproximación a la distribución
de probabilidad de una variable supone asumir, atendiendo a razones
sustantivas o a la experiencia práctica acumulada, que dicha variable se
distribuye de acuerdo a algún modelo teórico de características conocidas.
9
Página
5 Parámetros y Estadísticos
Cuando se obtiene un índice cualquiera -por ejemplo, la media- a
partir de la distribución de probabilidad de una variable, al valor resultante
se le denomina parámetro (mientras que si fuera a partir de una distribución
de frecuencias, sería un estadístico).
Se suelen utilizar letras griegas minúsculas para representar a los

parámetros. Así, por ejemplo, dada una variable X, se utiliza µx para
representar la media, σx para la desviación típica, πx para la proporción...
Es lo mismo para el caso de los índices estadísticos bivariados, por ejemplo,
σxy para la covarianza, ρxy para el coeficiente de correlación de Pearson, α
para la constante de la ecuación de regresión... Hay algún caso especial,
siendo el más notable el de la media aritmética que, como parámetro,
aparece también representada como E(X) y denominada, de forma
alternativa, como ‘valor esperado’ y también ‘esperanza matemática’. Por
último, para algunos índices no existe doble asignación simbólica en función
de que se traten de parámetros o de estadísticos, sea el caso de la mediana
(Md) o el coeficiente de variación (CV), entre otros muchos.
10
Página
La siguiente tabla resume algunos de los conceptos planteados hasta ahora
en función de que hagan referencia a una muestra o a una población:
PARÁMETRO En estadística se refiere a los valores o medidas que

caracterizan una población como por ejemplo la
media y la desviación típica de una población (…) Son
cantidades indeterminadas constantes o fijas
respecto a una condición o situación que caracteriza
a un fenómeno en un momento dado que ocurre en
una población.
En términos prácticos un parámetro es un valor que
resulta al emplear los valores que se obtiene de una
población.
Se suele representar a un parámetro mediante letras
griegas, por ejemplo la media poblacional se
representa mediante µx y se lee como media

poblacional de la variable aleatoria X, la varianza
poblacional se representa mediante σ2 x y se lee como
varianza poblacional de la variable aleatoria X.
En términos prácticos un parámetro es un valor que

11
resulta al emplear los valores que se

Página
obtiene de una población.

ESTADÍSTICO Se contrapone al parámetro, porque es un valor que
se obtiene a partir de los valores muestrales, se puede
obtener media y varianzas muéstrales, por ejemplo.
12
Los estadísticos son variables aleatorias por que

Página
están sujetos a la fluctuación de la muestra en

relación al valor poblacional que se asume es
constante.
Ejemplo:
Al seleccionar una muestra aleatoria de tamaño seis, una vez identificados

los seis alumnos, obtienen las siguientes calificaciones x1 = 13, x2 = 10,
x3=13, x4 = 14, x5 = 11, x6 = 10 la media obtenida de los seis alumnos es de
11,83, llamada media muestral y se representa mediante , cuya expresión

es:
El numerador de la expresión (2.3) es la suma de los seis valores, que
da 71, que dividido por 6, resulta = 11,83, es decir en promedio los

alumnos han obtenido 11,83 de calificación en la prueba de educación
ambiental.
La varianza de esta muestra aleatoria es 2,4722 y se representa mediante 2

S , cuya expresión es:
En la siguiente tabla se muestra paso a paso el uso de la expresión sabiendo
que = 11,83:
13
Página
El numerador de la expresión es la suma del cuadrado de las seis
desviaciones de cada valor que toma la variable, respecto a su media
aritmética, que es igual a 14,8334, que dividido por 6 es justamente 2,4722.
La raíz cuadrada, positiva, de la varianza se llama desviación estándar o

desviación típica, esto es:
Entonces, usando la expresión anterior la desviación estándar es S = 1,5723.

14
Página
6 Tipos de Distribuciones
6.1 Distribución Normal
Los histogramas y los diagramas tallo-hoja permiten visualizar cómo
se distribuyen los valores de una variable numérica. Muchas veces estos
gráficos tienen la forma de una campana, con una zona central en la cual los
valores de la variable son más frecuentes. A medida que nos alejamos de esa
zona central las frecuencias disminuyen simétricamente.
Figura 1. Conjunto de datos con distribución en forma de campana, denominada

Distribución Normal
Esta forma de campana también es llamada campana de Gauss. Fue

descubierta por Abraham de Moivre en 1720. En 1809, Carl Friedrich Gauss,
la utilizó para describir los errores de observación cometidos por los
astrónomos, al tomar medidas en forma repetida. Fue denominada curva de
error.
Su fórmula es: 15
En esta expresión matemática, aparecen e (un número

Página
aproximadamente igual a 2,718), π (el ya famoso 3,1415), μ (el centro de la

campana) y σ (que permite variar su ancho).
La campana de Gauss se obtiene graficando los pares (x, f (x)) en el
plano:
Cuando los datos se distribuyen en forma de campana decimos que tienen

distribución Normal o Gaussiana. En la práctica, los datos rara vez serán
“perfectamente Normales” pero muchas veces la campana de Gauss es una
muy buena aproximación al histograma de un conjunto de datos.
6.2 Curva Normal estándar

Consideremos un conjunto de datos cuyo histograma puede
aproximarse por la curva Normal con parámetros μ y σ. Si a cada dato se le
resta μ y se lo divide por σ, entonces el histograma del nuevo conjunto de
datos podrá aproximarse por la curva Normal Estándar.
16
Página
Figura 2. Curva Normal Estándar junto con su expresión matemática.

¿Cuándo se obtienen datos con variabilidad Normal y cuando no?
Insistimos, un conjunto de datos rara vez podrá tener una

distribución que se ajuste perfectamente a la curva Normal. Sin embargo,
en muchas situaciones, esta curva provee una excelente aproximación a los
histogramas de los datos. A continuación, presentamos algunos ejemplos en
los cuales la aproximación puede ser buena y algunos de cuando no puede
serlo.
Ejemplo: Variabilidad Normal entre unidades muestrales.
Piezas metálicas producidas con la misma máquina, por el mismo

operador y en el mismo turno, podrán parecer iguales, pero al medir su
dureza con cuidado se encontrarán diferencias. Cuando estas variaciones
se producen en condiciones normales (ahora con ene minúscula) – con
esto queremos decir: la máquina está funcionando como habitualmente, la
materia prima es la de siempre, las herramientas están como todos los días,
los operarios descansados y con el ánimo de siempre - entonces las piezas
serán parecidas. Las variaciones, respecto de alguna variable (dureza,
longitud, peso, elasticidad), darán muchos valores en el centro y pocos en
los extremos. A esto lo denominamos “variabilidad Normal” (aquí con ene
mayúscula). En cambio, si el producto se fabrica con materias primas
defectuosas o los operarios estaban distraídos y siguieron operando cuando
la herramienta estaba dañada, la distribución de las variables examinemos
ya no será Normal.
17
Figura 3. Variabilidad no normal.

Página
Variabilidad debido al error de medición.
Si evaluamos varias veces la dureza de un mismo producto, los

valores no serán idénticos, aunque la dureza sea siempre la misma. Habrá
muchos valores cercanos al valor verdadero de la dureza y la frecuencia de
los valores disminuirá al alejarse. Si estas mediciones son realizadas con
mucho cuidado, por el mismo operador, realizando desde el comienzo los
mismos pasos hasta obtener el resultado, su histograma tendrá la forma de
la curva Normal. En cambio, si hubo algún descuido al realizar las
mediciones, cambió el operador o alguna condición del proceso de
medición, estas no tendrán un histograma que pueda ser representado
mediante la curva de Gauss.
Variabilidad biológica normal
Si registramos las estaturas de las niñas de una división,

encontraremos unas pocas son muy bajitas, otras pocas muy altas y la
mayoría con alturas intermedias. Los datos, las mediciones, tendrán una
distribución aproximadamente Normal. En cambio, si consideramos las
alturas de todos los alumnos (varones y mujeres), los datos provienen de
muestras no homogéneas y no tendremos una “variabilidad Normal”. Pero
no todas las variables antropomórficas tendrán una buena aproximación
por la distribución gaussiana como creía Quetelet, por ejemplo, el peso de
las personas de una edad y género determinados no tiene distribución
simétrica, tampoco los niveles de los triglicéridos en sangre.
La distribución de los salarios de una población, el caudal de un río

de montaña, la precipitación diaria en cierta ciudad, son ejemplos de
distribuciones asimétricas.
18
Página
Formas que describen diferentes tipos de distribuciones.
Curvas de densidad.
La figura siguiente muestra un histograma de 400 datos de una

variable continua y una curva que describe la forma con la que se
distribuyen los datos a lo largo de sus valores. Vemos que las mayores
frecuencias se encuentran entre cero y cuatro. Para valores mayores que
cuatro se reduce constantemente la frecuencia. Podríamos pensar que la
curva se obtiene en dos pasos:
 dibujando el borde superior de cada rectángulo de clase y luego.

 suavizando los escalones.
Figura 4. Un histograma y su curva de densidad.
Existe una diferencia para resaltar entre histogramas y curvas de

densidad. Las curvas de densidad se grafican en escala de densidad y los
histogramas en escala de frecuencias o frecuencias relativas.
La mayoría de los histogramas muestran la cantidad (frecuencia) o

proporción (frecuencia relativa) de observaciones de cada intervalo de clase
mediante la altura del rectángulo. De esta manera, el área de cada
rectángulo es proporcional a la frecuencia relativa. En una escala
de densidad, el área de cada rectángulo es IGUAL a la frecuencia
19
relativa, y se obtiene graficando en el eje vertical la frecuencia relativa

Página
dividida la longitud del intervalo de clase. En escala de densidad, el área

total de los rectángulos del histograma es 1.
Para los datos de la Figura 4 la longitud de los intervalos es 2 y
tenemos:
En escala de densidad el área del rectángulo de clase es igual a la frecuencia

relativa y la suma de las áreas es 1.
Figura 5. Superposición de un histograma y una curva de densidad.
Los histogramas pueden tener distintas formas. Mostraremos

algunos patrones especiales en forma simplificada mediante curvas,
también llamadas curvas de densidad. La campana de Gauss es una de ellas.
20
Página
6.2.1 Simétrica
Una distribución es simétrica cuando sus dos mitades son imágenes
especulares una de la otra.
Por ejemplo, un histograma de las alturas de los mayores de 18 años de un
pueblo tendrá dos zonas más altas en espejo, una para los varones y otro
para las mujeres, mientras haya la misma cantidad de varones y mujeres.
Esto se debe a la superposición de dos curvas simétricas con distinto centro
e igual ancho.
6.2.2 Asimétrica a derecha

Una distribución es asimétrica a derecha cuando la mitad derecha es
más finita y más larga. Por ejemplo, la distancia de los domicilios de los
alumnos a la escuela mostrará muchos valores pequeños, en la mitad
izquierda del histograma, son las de los alumnos que viven cerca y habrá
pocos valores grandes de los alumnos que viven lejos.
21
Página
6.2.3 Asimétrica a izquierda
Una distribución es asimétrica a izquierda cuando la mitad izquierda
es más finita y más larga. En un examen fácil, la mayoría de las notas serán
altas y estarán amontonadas del lado derecho, con unas pocas notas bajas
(las del lado izquierdo).
6.2.4 Con forma de campana

Una distribución con forma de campana es simétrica con un
montículo en el centro y dos caídas como toboganes hacia los costados. Es
una de las distribuciones de datos que tal vez aparezca con más frecuencia
y es la más estudiada.
6.2.5 Uniforme
22
Página
Las frecuencias de la última cifra de los resultados de una lotería muestran
una distribución pareja sobre todos los dígitos de 0 a 9. Si el mecanismo que
genera los números de la lotería funciona correctamente, ninguno de los
dígitos tiene más chances de aparecer. Este tipo de distribuciones se llama
uniforme y se representa mediante una recta:
23
Página
7 Distribución Normal a Probabilidades con variables
aleatorias discretas
7.1 Variables aleatorias discretas
Una variable aleatoria se dirá discreta si el conjunto de valores que
toma es un conjunto numerable, es decir, que solo puede tomar unos valores
concretos. Dicho conjunto lo denotaremos por: {x1, x2, x3,...., xk}
Toda variable aleatoria discreta tiene asociada una función de

probabilidad, que a cada valor, le marca la probabilidad de que la variable
tome dicho valor. Esta probabilidad viene a jugar el mismo papel que la
frecuencia relativa en los temas de estadística.
Ejemplo 1: Obtener la función de probabilidad de la

variable "puntuación obtenida al lanzar un dado".
Definimos la variable aleatoria X= puntuación obtenida.
Los posibles resultados son: 1, 2, 3, 4, 5 y 6 y todos esos valores tienen

una probabilidad de 1 / 6.
Si ponemos en forma de tabla los resultados, la función de

probabilidad quedaría:
24
Página
Ejemplo 2: Obtener la función de probabilidad de la variable
"número de caras obtenidas al lanzar tres monedas"
Antes que nada, vamos al construir el espacio muestral del

experimento lanzar tres monedas. Éste sería:
E = {(c,c,c); (c,x,c); (x,c,c); (c,c,x); (c,x,x,); (x,c,x); (x,x,c); (x,x,x)}
Si definimos X = nº de caras obtenidas, vemos que los posibles

valores son: 0, 1, 2 y 3; y la función de probabilidad será:
Como puedes observar en los dos ejemplos, la suma de todas las

probabilidades tiene que ser 1, pues estaríamos considerando el espacio
muestral completo.
7.2 Parámetros de una variable aleatoria

La ventaja de trabajar con variables aleatorias es que podemos hacer
cálculos que adquieren significado sobre el comportamiento de la variable.
En una variable aleatoria, podemos calcular todos los parámetros vistos en
la estadística unidimensional: media, varianza moda, mediana, percentiles,
desviaciones, etc.
MEDIA: La media de una variable aleatoria se llama ESPERANZA

MATEMÁTICA, se representa por E(X) o por µ y viene a darnos el "valor
esperado" de la variable al realizar el experimento aleatorio. La fórmula
para calcularla es:
25
Página
VARIANZA: El significado es el mismo que en la estadística.
Aporta una medida sobre la dispersión de los valores de X. Para calcularla
usamos una de las dos fórmulas, aunque es más aconsejable la segunda:
Calcula la media y la varianza de la variable del ejemplo del dado
Calcula la esperanza y la varianza de la variable número de caras

del ejemplo
E(X) =0·0,125 + 1·0,375 + 2·0,375 + 3·0,125 = 1,5. Luego el

número de caras esperado en el lanzamiento de tres monedas es una y
media.
26
Var (X) =(02·0,125 + 12·0,375 + 2 2·0,375 + 32·0,125 ) - 1.52 =

Página
= 3 - 2.25 = 0.75
8 Medidas resumen
Media, mediana, rango, desvío estándar, distancia intercuartil
La mente humana puede captar la información que aportan diez

números, cien es difícil y con mil, estamos perdidos. Por esa razón, es muy
importante contar con pocos valores (medidas resumen), que de alguna
manera deben describir las características más sobresalientes del conjunto
que se está analizando.
Una medida resumen es un número. Se obtiene a partir de una

muestra y, en cierta forma, la caracteriza. Es el valor de un estadístico. Por
ejemplo, un porcentaje o una proporción son medidas resumen. Se utilizan
con datos categóricos o con datos numéricos categorizados previamente.
Las medidas resumen permiten tener una idea rápida de cómo son los datos.
Pero, un estadístico mal utilizado puede dar una idea equivocada respecto
de las características generales que interesa mostrar.
El cálculo de medidas resumen es el primer paso; se realiza cuando

se recolectan los datos en un estudio para tener una idea de qué está
pasando. Posteriormente, los investigadores pondrán a prueba sus hipótesis
respecto a algún parámetro poblacional, estimarán características de la
población y estudiarán posibles relaciones entre las variables. Cuando
presentan sus conclusiones al público en general, las medidas resumen
muestran los resultados en forma concisa y clara, volviendo a tener
importancia.
En principio, se pueden obtener muchísimas formas de resumir los

valores de un conjunto de datos numéricos. Es importante que sean fáciles
de interpretar.
27
Cualquier conjunto de datos tiene dos propiedades importantes: un

Página
valor central y la dispersión alrededor de ese valor. Vemos esta idea en los
siguientes histogramas hipotéticos:
Supongamos que tenemos un conjunto con n observaciones (datos), los
representamos así: x1, x2, x3, ..., xn
Se leen equis uno, equis dos, ..., equis ene y se pueden representar en una
tabla:
Ejemplo: Le preguntamos a 5 personas (n =5) cuántas cuadras camina por

día y obtenemos. Luego x1= 4, x2=15, x3= 8, x4=31, x5=17
8.1 Posición del centro de los datos

El promedio define el valor característico o central de un conjunto de
números. Existen varios métodos para calcular el promedio. El método
utilizado puede influir en las conclusiones. Cuando vemos un anuncio con
la palabra promedio, debemos alertarnos porque quien lo ha escrito,
probablemente eligió el método de cálculo para producir el resultado que le
interesa marcar.
28
Página
Veremos con detalle las dos formas principales para obtener un valor central
o promedio:
La media: Se obtiene sumando todos los valores del conjunto de datos y
dividiendo la suma por la cantidad de datos en ese conjunto.
La mediana: Es el valor central del conjunto de datos ordenados.
8.1.1 La media
La media se representa por 𝑥̅ (equis raya o equis barra). Se obtiene
sumando todos los datos y dividiendo por la cantidad total n de
observaciones,
En el ejemplo anterior, la media de las cuadras caminadas por día es 15:
8.1.2 La mediana
La mediana es otro tipo de centro. Es el punto central de los datos,
como la línea central que divide el campo de juego de fútbol en dos partes
iguales.
29
Página
La mediana deja la misma cantidad de datos a cada lado.

Para hallar la mediana del conjunto de datos (4, 15, 8, 31, 17) del ejemplo
 Primero los ordenamos de menor a mayor (4, 8, 15, 17, 31).

 Luego, la mediana es el valor central (15).
Para las cuadras que caminan por día las cinco personas elegidas al azar, el
valor central, la mediana, es 15. Quedan dos datos a cada lado de la mediana.
En este ejemplo, la media coincide con la mediana, pero puede no ocurrir.
Si la cantidad de datos es par (4, 15, 8, 17) no hay una observación central,
sino un par de observaciones centrales (8 y 15). La mediana (11,6) es el
promedio de estos dos valores.
La regla general para calcular la mediana de n datos ordenados es:
Si la cantidad de datos es impar, la mediana es el valor del centro, se

encuentra en la posición (n+1)/2.
Si la cantidad de datos es par, la mediana es el promedio de los dos valores

centrales, se encuentran en las posiciones n/2 y (n/2)+1.
8.1.3 Medidas de dispersión o variabilidad

Si todos los alumnos pesaran 58 kg, tendríamos un conjunto de datos
iguales.
30
Página
Otro conjunto de alumnos con mediana igual a 58kg podría tener pesos
diferentes y los datos estarían más dispersos.
Además de conocer el punto central de un conjunto de datos, también nos
interesa describir su dispersión, es decir cuán lejos tienden a estar los datos
de su centro.
La variabilidad está presente en todos los conjuntos de datos. Sea cual fuere
la característica, es casi imposible que dos mediciones sean idénticas. Esto
se debe a que:
 Diferentes individuos tienen diferentes características (peso, altura,

inteligencia, glóbulos rojos en sangre), al cuantificarlas resultan en
valores diferentes de las variables correspondientes.
 Diferentes mediciones de una misma característica dan como
resultado diferentes valores debido al inevitable error de medición.
Los métodos estadísticos son imprescindibles para analizar los datos

debido a su variabilidad. El truco consiste en tener medidas que la capten
de la mejor manera posible.
8.1.4 Rangos y distancia intercuartil

El rango de valores donde se encuentran los datos permite apreciar
su variabilidad o dispersión (cuán desparramados están).
31
La medida natural para evaluar dicha dispersión es la distancia entre

Página
el valor mínimo y el valor máximo de los datos (máximo-mínimo).
Tiene algunos inconvenientes:

 Es muy sensible a la presencia de valores atípicos.
 Como utiliza sólo dos datos, no puede distinguir dos conjuntos
con máximos y mínimos coincidentes, pero uno tendrá la
mayoría de sus valores mucho más concentrados que el otro.
La figura representa a los siguientes conjuntos de datos {1,0 4,2 4,5 4,7 4,9
5,0 5,3 5,5 5,7 5,9 6,110,0 } y {1,0 2,9 3,5 4,0 4,7 5,9 6,4 6,9 7,7 8,4 8,9
10,0}. La mayoría de los valores del primer conjunto están más
concentrados que la mayoría del segundo conjunto pero tienen el mismo
rango. El rango en este caso no distingue dos conjuntos de datos con
diferentes dispersiones.
Para corregir los problemas se utiliza la distancia entre el valor mínimo y el

valor máximo del 50% central de los datos, llamada distancia intercuartil.
32
Página
¿Cómo se calcula la distancia intercuartil?:
1. Se ordenan los datos.

2. Se calcula la mediana (C2), que los divide en 2 partes con igual
cantidad de datos de cada lado.
3. Se calcula la mediana de la mitad más baja (grupo inferior), es
el cuartil inferior (C1)
4. Se calcula la mediana de la mitad más alta (grupo superior),
es el cuartil superior (C3)
5. La distancia intercuartil (DIC) es la diferencia entre el cuartil
superior y el cuartil inferior: DIC = C3 - C1
Cuando la mediana coincide con uno de los datos se la puede considerar

parte de los dos grupos, el superior y el inferior (esta regla es arbitraria y
algunos autores no la cuentan en ninguno de los dos).
¿Qué mide la distancia intercuartil? Como medida de dispersión, la

distancia intercuartil mide la longitud del intervalo en el cual se encuentra
el 50% central de los datos. Cuanto más dispersos estén los datos, mayor
será la distancia intercuartil.
8.1.5 Los cinco números resumen y el gráfico de caja y brazos

El mínimo, el cuartil inferior, la mediana, el cuartil superior y el
máximo son cinco números. Dan una idea de cómo está distribuido un
conjunto de datos. Se los llama los cinco números resumen y se los
representa por:
Mínimo C1 M C3 Máximo
El 50% de los datos se encuentran entre el cuartil inferior y el

superior.
33
Los cinco números resumen de los pesos de los alumnos de 4to. año
Página
son:
El 50% de los alumnos tiene un peso entre 51 y 67 kg.
Los cinco números resumen se representan gráficamente en un

Gráfico de caja (Box-plot).
Los cuartiles forman los bordes de la caja y la mediana está dentro de la caja.
Dos líneas - los brazos- se extienden, una desde cada borde de la caja, hasta
el dato con valor máximo y mínimo respectivamente, mientras no sean
valores atípicos (es decir, se encuentren dentro de 1,5 DIC).
Si agregamos un peso de 97 kg a los datos de los pesos, el boxplot muestra

un valor atípico.
Los gráficos caja sirven especialmente cuando queremos comparar varios

conjuntos de datos. En el ejemplo de los pesos, comparemos los de varones
y de mujeres.
34
Página
Entre las mujeres hay 2 que pesan menos que la mayoría y otras 2 más (por
fuera de los brazos). Entre los varones se detectan 2 en los valores menores
y 4 en los valores mayores. El 75% de las mujeres son más livianas que los
hombres (excluyendo los 2 valores atípicos bajos de los hombres). Los cinco
números resumen muestran los detalles:
La mediana y los cuartiles son muy sencillos de calcular a mano cuando la

cantidad de datos es relativamente pequeña. Cuando se tienen muchos
datos, la dificultad se encuentra en ordenarlos. Por esa razón, aunque la
mediana era conocida casi no se utilizaba antes del advenimiento de las
computadoras.
8.1.6 Desviación estándar

La desviación estándar es una medida de dispersión basada en la
media y utiliza todos los datos. Durante muchos años la media y la
desviación estándar fueron, y tal vez sigan siendo, las medidas resumen más
utilizadas.
La desviación estándar representa una distancia típica de cualquier

punto del conjunto de datos a su centro (medido por la media). Es una
distancia promedio de cada observación a la media.
La desviación estándar de los datos de toda una población

(desviación estándar poblacional) se denota con la letra griega  (sigma
35
minúscula). Pero la mayoría de las veces los parámetros poblacionales son

Página
desconocidos. ¿Qué se hace? Se calcula un estimador (s, desvío estándar

muestral) utilizando una muestra.
La distinción entre la desviación estándar poblacional y la desviación
estándar muestral vale para todos los estadísticos descriptos (media,
mediana, cuartiles, distancia intercuartil, etc.). Si el cálculo de un estadístico
se realiza utilizando una muestra para estimar un parámetro, el resultado
tendrá un error de muestreo.
El desvío estándar se calcula promediando la diferencia entre cada dato y la

media, elevadas al cuadrado. Como este resultado tiene las unidades al
cuadrado, luego se saca la raíz cuadrada.
Para un conjunto de n datos:
36
Página
Cuanto más grande es la varianza muestral, más dispersos están los datos.
Una medida de dispersión debe tener las mismas unidades que los datos.
La varianza muestral, en nuestro ejemplo está en cuadras al cuadrado,

entonces por supuesto, debemos sacar la raíz cuadrada.
La desviación estándar es 10,37 cuadras
8.1.7 Centro y dispersión en diferentes tipos de distribuciones

La media y el desvío estándar son muy buenos para resumir datos
con histogramas razonablemente simétricos y sin valores atípicos.
Sin embargo, la media y el desvío estándar no son una buena

representación de la distribución de datos cuando tienen valores atípicos o
sus histogramas son asimétricos.
La figura siguiente muestra el histograma de un conjunto de datos

con distribución asimétrica a derecha. En este caso, es mejor utilizar la
mediana y la distancia intercuartil, y mejor aún, los 5 números resumen.
37
Página
El intervalo con extremos en 𝑥̅ -s y 𝑥̅ +s no es una buena representación de
los datos: 𝑥̅ -s se encuentra fuera del rango de los valores observados (está
a la izquierda del valor más pequeño) y quedan valores a la derecha de 𝑥̅ +s.
El gráfico caja (boxplot) describe más precisamente el rango donde se
encuentran los datos. El rango intercuartil que forma la caja contiene el 50%
de los datos y los brazos se extienden hasta el último dato de cada lado. Se
distinguen dos datos atípicos (en inglés: outliers, significa: yacen fuera).
En el ejemplo siguiente mostramos cómo las medidas resumen pueden

contar una parte muy parcial de la historia.
Ejemplo. “Admítelo una salchicha no es una zanahoria”. Así decía la revista

“El Consumidor” en un comentario sobre la baja calidad nutricional de las
salchichas. (Introduction to the practice of Statistics Moore mc Cabe pág.
28).
Hay tres tipos de salchichas:
1. carne vacuna,
2. mezcla (carne porcina, vacuna y de pollo)
3. pollo
¿Existe alguna diferencia sistemática entre estos tres tipos de

salchichas, en estas dos variables? Mirar directamente los datos sirve de
38
muy poco.
Página
Comparemos la cantidad de calorías entre los tres tipos de salchichas
utilizando gráficos caja. Recordemos que están basados en los números
resumen:
39
Página
Figura 6. Gráficos caja de la cantidad de sodio de tres tipos de salchichas.

Vemos una tendencia general en las salchichas de pollo a presentar
menor cantidad de calorías. Pero nos perdemos los detalles.
Figura 7. Diagrama de tallo hoja de las salchichas
Los diagramas tallo hoja de las salchichas de carne vacuna y mezcla

muestran la presencia de 2 grupos, y un valor aislado en la cola inferior. Sin
embargo, como cada cuartil se encuentra aproximadamente en el centro de
cada uno de los dos grupos, la distancia intercuartil refleja la distancia entre
los grupos y, por lo tanto, el valor inferior no es detectado como dato atípico.
Analicemos ahora la distribución de la cantidad de sodio en las

salchichas de pollo, cuyo diagrama tallo hoja tenemos a continuación:
40
Página
Tanto el diagrama tallo hoja como el histograma revelan la presencia
de dos grupos:
Figura 8. Histograma y gráfico caja de la cantidad de sodio de salchichas de pollo de

diferentes marcas.
Los valores ordenados de la cantidad de sodio en salchichas de pollo

son: 357 358 359 375 383 387 396 426 430 513 522 528 542 581 588
La media (449,66) se encuentra fuera de los datos, la mediana (426)

cerca del borde de uno de los dos grupos. El intervalo ( 𝑥̅ -s, 𝑥̅ +s ) no es una
buena representación de los datos y el gráfico caja tampoco.
Recomendamos realizar gráficos caja fundamentalmente para

comparar la distribución de varios
conjuntos de datos. Un diagrama de
tallo y hojas o un histograma son
mejores para analizar la distribución
de datos de una única variable.
Generalmente, los detalles agregan
poco, pero es importante estar
41
preparados para las ocasiones en que

Página
sí agregan mucho.
El significado de las medidas resumen está atado a la forma de la
distribución de los datos. Esto tiene especial importancia con el desvío
estándar pues se utiliza muchísimo en las descripciones de los datos.
9 Muestreo y estimación
El muestreo es una herramienta de la investigación científica. Su
función básica es determinar qué parte de una realidad en estudio
(población o universo) debe examinarse con la finalidad de hacer
inferencias sobre dicha población. Al muestrear se reducen los costos, los
gastos de recogida en recursos humanos, materiales y económicos y los de
tratamiento de los datos serán menores, se logra mayor rapidez.
Se llama muestreo al procedimiento estadístico que se utiliza para

seleccionar la muestra que será estudiada, es decir, es la recolección de
información en la que se trabaja solo con una parte de la población. En
dependencia del tipo de muestreo empleado las muestras pueden ser
probabilísticas y no probabilísticas.
Elegir entre una muestra probabilística o una no probabilística,

depende de los objetivos del estudio, del esquema de investigación y de la
contribución que se piensa hacer con ella. Las muestras probabilísticas
tienen muchas ventajas, quizás la principal es que puede medirse el tamaño
del error en las predicciones. Para este tipo de muestra es necesario
determinar el tamaño de la muestra para luego seleccionar los elementos
muestrales.
42
Página
9.1 Tipos de Muestreo
9.1.1 Muestreos no probabilísticos.

En los muestreos no probabilísticos, llamados también muestreos
dirigidos, no es posible establecer a priori la probabilidad que tienen los
miembros del universo, de ser seleccionados como parte de la muestra.
El proceso de selección de los miembros de la muestra es subjetivo, a

criterio y voluntad del investigador o del grupo de encuestadores.
Su mayor inconveniente es la desconocida relación entre estimadores

y parámetros, dificultando la estimación de estos últimos.
¿Cuándo aplicar muestreo no probabilístico?
Cuando se requiere una cuidadosa y controlada elección de sujetos

con ciertas características especificadas previamente en el planteamiento
del problema, cuando no hay un marco disponible para propósitos de
muestreo y cuando se considera que no se requieren cifras exactas sobre la
representatividad estadística de los resultados.
Debe tenerse bien claro que los resultados que se obtienen de

muestras no probabilísticas son generalizables a la muestra en sí o a
43
muestras similares. No son generalizables a la población. Entre los

Página
diferentes tipos de muestreo no probabilístico se pueden mencionar:
 Muestreo por cuotas.

 Muestreo casual o fortuito.
 Muestreo de selección experta.
 Muestreo de conveniencia.
9.1.1.1 Muestreo por cuotas.

También denominado en ocasiones "accidental". En este tipo de
muestreo se fijan unas "cuotas" que consisten en un número de individuos
que reúnen unas determinadas condiciones, por ejemplo: 20 estudiantes de
20 a 25 años, de sexo masculino y estudiantes universitarios residentes en
Tegucigalpa. Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación.
Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado,
pero no tiene el carácter de aleatoriedad de aquel.
Una vez determinada la cuota se eligen los primeros que se

encuentren que cumplan esas características. Este método se utiliza mucho
en las encuestas de opinión.
 Es el más popular de los muestreos no probabilísticos.

 Consiste en formar estratos de la población sobre la base de ciertas
características y en procurar que estén representadas en
proporciones semejantes a las que existen en la población.
 Principales características utilizadas para estratificar la población:
sexo, edad, ocupación, etc.
 Una vez determinada la cuota se eligen los primeros que se
encuentran y que cumplen esas características. Este tipo de muestreo
tiene como beneficio que se pueden realizar estudios exploratorios
rápidos y económicos.
44
Por ejemplo:
Página
Una empresa farmacéutica quiere estimar la aceptación del sabor de

un nuevo producto de cierta gama inocua, para lo cual invita a la
degustación del producto en un hospital utilizando un muestreo por cuotas
de sexo y edad, para estimar si hay diferencias entre hombres, mujeres,
niños, jóvenes, adultos de mediana edad y mayores de 64 años.
Los encuestadores y administradores del producto, van llenando

cuotas establecidas de personas con estas características hasta completar la
muestra y ellos son los que eligen a las personas según su criterio.
9.1.1.2 Muestreo casual o fortuito.

 Aquí las muestras se integran por voluntarios o unidades muestrales que
se obtienen en forma casual.
 La muestra está conformada por sujetos fácilmente accesibles y
presentes en un lugar determinado, y en un momento preciso.
 Los sujetos se incluyen en el estudio a medida que se presentan, y hasta
que la muestra alcance el tamaño deseado.
Por ejemplo:
 Encuestas en vía pública que se realizan en un día y horario

determinado.
 Encuestas de opinión a la salida de cines acerca de una programación
concreta.
 Un profesor investigador anuncia en su clase que va a hacer un
estudio sobre motivación del universitario e invita a aquellos que
acepten a someterse a determinadas pruebas.
9.1.1.3 Muestreo de selección experta.

Denominado también como muestreo de juicio, es una técnica
utilizada por expertos para seleccionar unidades representativas o típicas,
según el criterio del experto; por ejemplo: la selección de un conjunto con
determinadas características, para un experimento de laboratorio, o la
45
selección de determinadas semanas del curso para llevar a cabo algunas

Página
evaluaciones.
Es importante hacer notar que en este caso los criterios de selección
pueden variar de experto a experto, al determinar cuáles son las unidades
de muestreo representativas de la población
9.1.1.4 Muestreo de conveniencia.

Como su nombre lo indica son incluidos en la muestra los elementos
de acuerdo con la conveniencia del investigador. Se justifica su empleo en la
etapa exploratoria de la investigación como base para generar hipótesis.
9.1.1.5 Muestreo por redes (bola de nieve)

 Consiste en localizar a algunos individuos según determinadas
características.
 Se utiliza en poblaciones marginales o de difícil acceso.
 Se basa en redes sociales, en las amistades.
 Cuando se encuentra el primer representante, este puede conducir a
otro, y ese a un tercero, y así, sucesivamente hasta conseguir una
muestra suficiente.
Por ejemplo:
 Personas que padecen una determinada enfermedad.

 Personas que fueron sometidas a un tipo particular de intervención.
 Personas que forman parte de determinados grupos sociales, etnias,
refugiados y similares.
9.1.2 Muestreos probabilísticos:

En un muestreo de tipo probabilístico, a partir de la muestra se
pueden hacer inferencias sobre el total de la población. La selección de la
muestra se puede hacer mediante un proceso mecánico similar al de una
lotería, su equivalente práctico es la selección en las denominadas tablas de
46
números aleatorios. El tipo de muestreo probabilístico más importante es el

Página
muestreo aleatorio, en el que todos los elementos de la población tienen la

misma probabilidad de ser extraídos; Aunque dependiendo del problema y
con el objetivo de reducir los costos o aumentar la precisión, otros tipos de
muestreo pueden ser considerados como veremos más adelante: muestreo
sistemático, estratificado y por conglomerados.
9.1.2.1 Muestreos aleatorio simple.

 Es el más popular entre los muestreos probabilísticos.
 Se utiliza cuando se conocen (o se tiene un listado o registro)
todos los elementos que conforman la población.
 Cada elemento de la población tiene la misma probabilidad de
ser elegido para formar parte de la muestra.
 Es el más utilizado y el más recomendable junto con sus
variaciones.
En la práctica, aplicar un muestreo aleatorio simple para extraer una

muestra de n elementos de una población consiste en:
 Disponer de un censo o lista de todos los elementos que forman la

población.
 Tener asignado un número identificativo para cada elemento de la
población.
 Utilizar una tabla de números aleatorios, un bombo de lotería, un
software estadístico generador de números aleatorios o extractor de
muestras, o cualquier otro dispositivo que nos permita seleccionar de
forma aleatoria n números identificativos de los elementos de la
población para formar una muestra de tamaño n.
Una tabla de números aleatorios es una disposición, en filas y

columnas, de dígitos, números del cero al nueve, de modo tal que estos
números han sido ubicados al azar en dicha tabla.
 Escoger los casos que corresponden a los n números aleatorios e

47
identificar a los elementos de la población que los poseen: estos

Página
elementos son los que forman la muestra aleatoria simple.

Ejemplo:
Supongamos que sobre una población de 20 estudiantes universitarios

estamos investigado acerca de los que han tenido alguna experiencia
laboral.
Elija una muestra aleatoria simple de tamaño n = 8 de esta población. Use

la tabla de números aleatorios adjunta, empiece en la fila 2 columna 1 y
continúe seleccionando dígitos adecuados al caso hacia la derecha. Cuando
termine proporcione una lista con los integrantes de la muestra.
48
Página
 ¿Cuál es el parámetro poblacional que nos interesa estudiar en esta
población?
 ¿Qué resultado muestral nos proporciona la muestra extraída acerca
de este parámetro?
 ¿Se parece al poblacional?
Solución
Para generar la muestra aleatoria simple, tomamos 8 números de la

tabla de números aleatorios.
Comenzamos, tal como se nos indica, por la fila 2 de la columna 1,

que contiene el número 5 y continuamos hacia la derecha. El siguiente
número es el 34, pero como sólo tenemos 20 estudiantes, lo dejamos. El
siguiente es el 31, que tampoco nos sirve. El siguiente es el 15: lo tomamos.
Seguimos en la tercera fila. Tomamos el 17 y los otros no nos sirven.
Seguimos en la cuarta fila, que nos proporciona dos números válidos: el 12
y el 20. Seguimos en la quinta fila, que nos proporciona el 14 y el 2. Seguimos
en la sexta fila, que nos proporciona el 13. Con este número ya tenemos 8,
que son: 5, 15, 17, 12, 20, 14, 2, 13.
Ahora, para extraer la muestra, tomamos a los estudiantes de la lista

que se corresponden con estos números aleatorios, tal y como se ve en la
siguiente tabla.
49
Página
El parámetro poblacional que nos interesa estudiar acerca de esta población

es:
Parámetro poblacional = P = proporción de estudiantes que tienen
experiencia laboral en la población
La muestra extraída, proporciona una estimación de este parámetro, la

proporción muestral o número de casos de la muestra que tienen
experiencia laboral, que en este caso es:
Proporción muestral = p = 3/8 = 0,375
El resultado obtenido mediante la muestra aleatoria simple, indica que la

proporción de estudiantes que tiene experiencia laboral en esta población
está en torno al 37,5%.
En este caso, conocemos el parámetro poblacional, pues:
P = 7/20 = 0,35
Por consiguiente, el resultado real en la población es que hay un 35%

de estudiantes con experiencia laboral.
La muestra se ha aproximado bastante, pero se da una diferencia

entre p y P, que es el error muestral. En este caso, no hemos controlado el
error, pues simplemente queríamos experimentar la mecánica de la
extracción, pero en la realidad si se hace, ya que el tamaño de la muestra se
calcula para cometer un error concreto (el menor posible), para un nivel de
confianza determinado de las estimaciones. Al explicar el cálculo del tamaño
de la muestra se verá claro este aspecto del muestreo.
9.1.2.2 Muestreo aleatorio estratificado

50
El muestreo aleatorio estratificado es una ampliación del simple, que

Página
proporciona muestras más eficientes a partir de la utilización de más

información acerca de la población.
Al explicar el muestreo aleatorio simple, hemos considerado a la
población como un conjunto de individuos acerca de los que interesa
estudiar una característica, sin plantearnos la existencia de subgrupos
(denominados estratos) de interés dentro de la población.
Sin embargo, en la realidad, muchas poblaciones están subdivididas

en estratos que hay que tener en cuenta a la hora de diseñar muestras.
Ejemplo:
Supongamos que se desea realizar un estudio acerca de la intención

emprendedora de los estudiantes universitarios en Ecuador. La población
objetivo de este tipo de estudio es la población de estudiantes universitarios
de Ecuador. En este caso, para tener una muestra representativa de esta
población, hay que tener en cuenta que está formada por los estratos de las
especialidades:
Por supuesto, también será importante considerar otros estratos

tales como:
51
Página
 Universidad
 Curso
 Género
Y otros, pero la especialidad es fundamental, pues es un factor muy
determinante de la intención emprendedora. Si al diseñar una muestra
representativa de la población para un estudio cualquiera no se tiene en
cuenta la existencia de estratos, podríamos obtener como resultado lo que
se conoce como una muestra sesgada.
Una muestra sesgada sería aquella que mostraría un desequilibrio en

la composición: demasiados (o pocos) hombres o mujeres, demasiados (o
pocos) jóvenes o mayores, respecto de la población, y así sucesivamente.
Una muestra es representativa de la población cuando su

distribución reproduce la de la población en sus estratos relevantes. Si al
calcular la distribución muestral y compararla con la poblacional vemos que
hay diferencias notables entre los porcentajes de personas en cada estrato,
entonces estaremos ante una muestra sesgada que no representa bien a la
población.
Se denomina muestreo estratificado a aquel en el que los elementos

de la población se dividen en estratos, en que la muestra se toma asignando
un número determinado de miembros a cada estrato y escogiendo,
finalmente, por muestreo aleatorio simple a los elementos dentro de cada
estrato.
Una muestra estratificada puede ser proporcional o no serlo. En la

realidad, lo más habitual es diseñar muestras proporcionales, es decir,
muestras que se compongan de una proporción de elementos igual a la que
hay en la población para cada estrato. Por eso, cuando se realiza un
muestreo estratificado proporcional, lo que se hace es dividir el tamaño total
52
de la muestra proporcionalmente al tamaño relativo del estrato en la

población.
Página
Siendo:
 n el tamaño de la muestra total.

 ni el tamaño muestral de cada estrato.
 Ni el tamaño poblacional de cada estrato.
 N el tamaño de la población.
Por ejemplo, si en una población hay un 55% de mujeres y un 45% de

hombres, en la muestra mantendremos esta misma proporción. Sin
embargo, la muestra no proporcional puede ser la más eficiente en algunos
casos, como vamos a ver enseguida.
Este procedimiento es satisfactorio si no hay gran diferencia en dispersión

de un estrato a otro. Pero no es el procedimiento más eficiente cuando las
desviaciones estándares difieren sustancialmente en los distintos estratos,
ya que la consideración más importante para la representatividad de la
muestra no es el tamaño, sino la variación de la población.
Ejemplo:
Supongamos que tenemos una población de N = 500 individuos

dividida en cuatro grupos de edad (estratos) de tamaño: 10%, 20%, 30% y
40% de la población y que ha de extraerse una muestra de n = 200
individuos.
53
Página
Este procedimiento es satisfactorio si no hay gran diferencia en dispersión
de un estrato a otro. Pero no es el procedimiento más eficiente cuando las
desviaciones estándares difieren sustancialmente en los distintos estratos,
ya que la consideración más importante para la representatividad de la
muestra no es el tamaño sino la variación de la población.
Supongamos que tenemos una población de 500 personas

estratificada en grupos de edad como en el ejemplo anterior:
Supongamos que analizamos la distribución de la edad concreta de los

individuos en cada uno de los estratos y que obtenemos el siguiente
resultado:
54
Página
Observando los resultados, vemos que la desviación estándar del Estrato 1
es menor que la del Estrato 2, que a su vez es menor que la del Estrato 3. En
cambio, el Estrato 4 presenta una desviación estándar parecida a la del
Estrato 2. En consecuencia, la distribución de las edades es más dispersa en
el Estrato 3 que en los otros y, por consiguiente, para extraer una muestra
representativa de dicho estrato vemos, intuitivamente, que se necesitará un
tamaño muestral mayor que en algunos de los otros casos.
El tamaño inicial del estrato no es lo más importante, sino la variabilidad de

su contenido. El Estrato 3 tiene 150 individuos, 50 menos que el Estrato 4,
que tiene 200. Si aplicamos la proporcionalidad a la determinación de la
muestra, tomaríamos 80 individuos del Estrato 4 y 60 del Estrato 3. Sin
embargo, como veremos a continuación, si tenemos en cuenta que el Estrato
3 es más disperso la muestra más eficiente tomaría más elementos del
Estrato 3 que la proporcional y menos elementos del Estrato 4 que la
proporcional.
En definitiva, para obtener la máxima eficiencia en la estratificación,

55
debemos asignar mayor representación a los estratos con mayor dispersión

Página
y menor representación a los estratos con menor dispersión. Para ello,

podemos dividir el tamaño total de la muestra entre los estratos
proporcionalmente a la variabilidad del estrato, tomando menos elementos
de estratos donde la característica tenga menor dispersión. Esto se consigue
aplicando la asignación de Neyman:
Siendo:
 ni = tamaño muestral del estrato.

 n = tamaño de la muestra total a extraer.
 Ni = tamaño poblacional del estrato.
 σi = desviación estándar de la variable en cada estrato poblacional.
Ejemplo:
De la población anterior de N = 500 individuos dividida en cuatro

grupos de edad (estratos) de tamaño: 10%, 20%, 30% y 40% de la población,
ha de extraerse una muestra de n = 200 individuos. Se sabe que la
dispersión poblacional de cada estrato es: 1,82; 2,88; 3,38 y 2,78 años.
Determinar el tamaño muestral de cada estrato aplicando la asignación de
Neyman para lograr la máxima eficiencia. 56
Página
Comparemos las muestras:
En conclusión, necesitaríamos realizar menos entrevistas en los Estratos 1 y

4, las mismas en el Estrato 2 y más entrevistas en el Estrato 3.
¿Cuál es el obstáculo al que nos enfrentamos en la realidad para

aplicar la asignación eficiente de Neyman? El desconocimiento de la
variabilidad de los estratos de la población, que salvo excepciones no suele
estar disponible.
¿Cómo podemos solucionar este problema? Obteniendo estos datos a partir

de estudios previos si los hay, apelando al juicio de expertos, realizando
muestras piloto o, incluso, aplicando la intuición si se tiene mucha
experiencia. En caso de no ser factible llevar a cabo la determinación de la
variabilidad de los estratos, entonces se aplicará la asignación proporcional.
57
9.1.2.3 Muestreo por conglomerados o racimos

Página
Se utiliza cuando no es posible obtener una lista de todos los

elementos de la población y su empleo es adecuado si la población es muy
grande y dispersa.
Los conglomerados se caracterizan por ser homogéneos entre sí, pero
internamente presentan un alto grado de heterogeneidad en sus
componentes.
La técnica consiste en lo siguiente: se divide a la población en grupos

o racimos, luego se selecciona aleatoriamente algunos de esos grupos, por
considerar que cada uno de ellos es representativo de la población y,
posteriormente, se toma una muestra aleatoria de cada uno de los grupos
que se han seleccionado.
Este procedimiento produce una muestra más precisa a un menor

costo ya que se utiliza cuando hay una variación considerable dentro de cada
grupo, siendo los grupos similares entre sí.
El conglomerado es común en los diseños polietápicos y en las

muestras de zona geográfica. Cuando se muestrean conglomerados que
contienen números de unidades desiguales, pueden utilizar el muestreo
probabilístico proporcional al tamaño para que la probabilidad de selección
del conglomerado sea igual a la proporción de unidades que contiene.
Ejemplo:
Como hemos visto, en la muestra por conglomerados, los elementos

que componen una población se reúnen en unidades de muestreo de mayor
tamaño, llamadas conglomerados.
Para llevar a cabo una encuesta electoral, o de consumo, o de

opinión, podemos muestrear familias en lugar de votantes, consumidores u
opinantes individuales. En estos casos, las familias forman los
conglomerados y los miembros de las familias son las unidades de muestreo.
Otros casos típicos son los que se diseñan para analizar los gastos
58
familiares o para controlar el nivel de audiencia de los programas y cadenas

Página
de televisión. En estos casos, se utiliza un muestreo por conglomerados–

familias que han sido elegidas aleatoriamente. Las familias incluyen
personas de todas las edades, muy representativas de las mismas edades y
preferencias de la totalidad de la población.
9.1.2.4 Muestreo polietápico

Muestreo en el que se procede por etapas: se obtiene una muestra de
unidades primarias, más amplias que las siguientes; de cada unidad
primaria se toman, para una submuestra, unidades secundarias, y así
sucesivamente hasta llegar a las unidades últimas o más elementales.
Puede considerarse como una modificación del muestreo por

conglomerados.
En este caso, no forman parte de la muestra elementos o unidades

de todos los conglomerados, sino que, una vez seleccionados los
conglomerados aleatoriamente, se efectúan submuestras dentro de cada
uno de ellos.
Ejemplo:
Múltiples etapas, polietápico:
 1º etapa: muestra de ciudades.

 2º etapa: muestra de familias.
 3º etapa: muestra de individuos.
Por ejemplo, para la encuesta nacional de salud, en la que se capta la

opinión de los españoles sobre su salud y sobre el sistema nacional de salud,
se efectúa una selección de municipios, distritos, hogares y, finalmente, un
miembro del hogar.
9.1.2.5 Muestreo sistemático

59
Los elementos se seleccionan de la población en un intervalo

Página
uniforme que se mide respecto de tiempo, orden o espacio. Se emplea si

existe una lista ordenada sistemáticamente de los elementos de la
población, siendo imprescindible conocer cuántos elementos componen esa
población.
Es el muestreo más adecuado para llevar a cabo auditorías, por

ejemplo, ya que permite extraer muestras sistemáticas y aleatorias de
documentos de cualquier archivo documental organizado.
La técnica consiste en tomar cada k elementos de una lista que

contiene todos los elementos de una población, eligiéndose al azar el primer
elemento de la muestra. Para determinar el valor k se calcula el cociente
entre el tamaño de la población N y el tamaño de la muestra n.
Este resultado indica que habrá que tomar un documento de cada 5,

comenzando por uno que se determina tomando un número al azar entre 1
y 5.
Si el número escogido al azar fuese el 2, entonces, se tomaría el

segundo documento, después el número 7, después el número 12, después
el 17 y así, sucesivamente, hasta tener una muestra de 30 documentos.
El azar, en este caso, interviene en la selección del número por el cuál

comenzar la primera extracción. El resto de elementos de la muestra se
extrae de forma sistemática.
60
9.2 Cálculo del tamaño de la muestra

Página
Determinar el tamaño para que una muestra sea representativa y

proporcione estimaciones fiables es uno de los elementos clave del
muestreo.
Pero, ¿por qué es tan importante? Cuando queremos estimar un
parámetro poblacional utilizamos un estimador. Los mejores estimadores
para los casos más habituales de estimar una media (µ), una desviación
estándar (σ) o una proporción (P) poblacional son la media (𝑥̅ ), la desviación
estándar (s) y la proporción (p) muestral. Pero, aun trabajando con los
mejores estimadores, sabemos que se va a producir un error, es decir, una
diferencia entre el parámetro poblacional y el valor de la estimación
muestral. Este error se denomina error de muestreo.
Este error es desconocido, porque también lo es el parámetro

poblacional. Por esta razón, se construyen intervalos de confianza que nos
proporcionan los límites entre los cuales hay una probabilidad de que el
verdadero valor del parámetro esté contenido en ellos.
El tamaño muestral forma parte de la formulación de los intervalos

de confianza y, de hecho, si observamos el siguiente intervalo para la media
poblacional:
Donde:
1,96 = α/2 = valor de la distribución normal estándar que limita el área de

confianza del 95%.
61
Página
Es fácil darse cuenta de que el error muestral es ya que es la
cantidad en que el estimador muestral difiere del parámetro poblacional.
Teniendo en cuenta este hecho, un analista puede decidir cuál es el error
máximo que quiere cometer al estimar el parámetro con un nivel de
confianza dado. Es decir, puede fijar un valor para el error muestral y, a
partir de ese valor, determinar cuál debe ser el tamaño de la muestra (n)
para que se cumpla con la probabilidad asignada, es decir, para el nivel de
confianza fijado.
9.2.1 Tamaño muestral para estimar una media poblacional

Si conocemos la varianza poblacional:
Despejando de esta expresión la n o tamaño muestral, tenemos:
Entonces, se cumple que:

62
Página
Es decir, que, para un nivel de confianza dado, la media muestral

queda entre el parámetro poblacional menos y más el error muestral con la
probabilidad 1-α.
Ejercicio
Un punto de venta de «Verdifresh» quiere calcular el gasto medio

mensual en ensaladas de sus clientes. ¿Qué tamaño muestral, o, dicho de
otra forma, a cuántos clientes tiene que entrevistar para averiguar este gasto
medio con un nivel de confianza del 99% y sin cometer un error superior a
5 euros? Se supone que el gasto sigue una normal de desviación estándar de
12 euros.
Solución
Datos de los que disponemos: Conocemos la desviación estándar

poblacional (que es lo mismo que conocer la varianza) σ = 12 euros
Sabemos el nivel de confianza 1-α = 0,99 de donde el valor de zα/2 = 2,58
Sabemos el error que queremos cometer como máximo d = 5 euros
Por consiguiente, el tamaño muestral adecuado para estimar la

media poblacional en estas condiciones es:
En definitiva, si entrevistamos aleatoriamente a unos 38 clientes habituales

y representativos, tenemos una probabilidad del 95% de que la media
muestral que obtengamos cumpla que:
2. Si no conocemos la varianza:
63
La fórmula a aplicar para determinar el tamaño muestral es:

Página
Es la misma fórmula que para el caso de varianza conocida pero la varianza
poblacional se sustituye por una estimación (s) de dicha varianza (ya que es
desconocida) que se obtiene con lo que llamamos una muestra piloto, es
decir, entrevistando a unas pocas personas, o haciendo una medición para
unas cuantas unidades, o tomando un valor de un estudio anterior o
cualquier otro dato que nos permita obtener una varianza muestral.
9.2.2 Tamaño muestral para estimar una proporción poblacional

Al igual que en el caso de la media, partimos de la fórmula del
intervalo de confianza para estimar una proporción poblacional:
Despejando de esta expresión la n o tamaño muestral, tenemos:
Como desconocemos la proporción poblacional P, podemos

sustituirla por la proporción obtenida en una muestra piloto, o
directamente, como se hace la mayoría de las veces, por el valor p = 0,5 que
es el que corresponde al supuesto de máxima amplitud del intervalo de
confianza, también llamado de máxima indeterminación.
64
Es importante comprender el supuesto de máxima indeterminación,

Página
porque se aplica constantemente, ya que lo más habitual es desconocer

cómo se comporta una población en cuanto a la proporción de sus
integrantes que hacen o no alguna cosa, que poseen o no una cualidad y
similares.
Si, por ejemplo, estamos estudiando la proporción de personas que

comprarían un producto o no lo harían en una población, lo más normal, es
que no tengamos idea de cuál sería la proporción de los que comprarían.
Entonces, el «peor» supuesto o de máxima indeterminación, o de máxima
dispersión, es el de suponer que el 50% lo compre y el otro 50% no lo
compre.
En este caso:
p = 0,5 y q = (1-p) = 0,5
varianza p.q = 0,5·0,5 = 0,25
Cualquier otro supuesto que hiciésemos, nos daría una varianza

menor, es decir, una situación menos dispersa en la población.
Por ejemplo:
 Si p = 0,1 (lo compra un 10%) y q = 0,9, (no lo compra un 90%),

entonces p·q = 0,1·0,9 = 0,09.
 Si consideramos p= 0,4 (lo compra un 40%) y q= 0,6 (no lo compra
un 60%), entonces p·q = 0,4·0,6 = 0,24, etc.
Cualquier par de valores de p y q que probemos dará un valor de pq

menor que 0,25. Por eso, tomando 0,25, aseguramos que nos ponemos «en
el peor» de los casos, de forma que, la estimación que hagamos de P será
fiable porque abarcará todas las situaciones posibles, incluyendo la más
dispersa de todas.
65
Página
Por consiguiente, el tamaño muestral para estimar una proporción:

Entonces, se cumple que:
Es decir, que, para un nivel de confianza dado, la proporción

muestral queda entre el parámetro poblacional menos y más el error
muestral con la probabilidad 1-α.
Ejercicio
El jefe del departamento de marketing de «Verdifresh» quiere

averiguar qué proporción de clientes de una zona de Valencia visita la
página web de la empresa con un error máximo del 5%.
Se sabe que hace dos años un estudio similar dio un valor del 25% de
los clientes de la zona.
Determina el tamaño muestral mínimo necesario para obtener una

muestra que proporcione una estimación de la proporción poblacional de
clientes de la zona que visitan actualmente la web al 95% de confianza.
Solución
Sabemos que p = 0,25. Sabemos que 1-α = 0,95, por lo que los valores
66
de z son ±1,96. Sabemos que el error máximo que se quiere cometer es del
Página
5%, por lo que d = 5/100 = 0,05 (recordad que el error siempre se pone en
la fórmula en tanto por uno en el caso de estimación de proporciones)
Por consiguiente:
Para estimar la proporción de clientes de la zona que visitan la web con un

error máximo del 5% y un nivel de confianza del 95%, hay que entrevistar a
288 clientes como mínimo.
Si se hacen las entrevistas aplicando un muestreo aleatorio, entonces, se

cumplirá que:
Es decir, que para un nivel de confianza del 95%, la proporción

muestral quedará entre el parámetro poblacional menos y más el error
muestral del 5% con una probabilidad de 0,95.
Tamaño muestral para estimar una media o una proporción poblacional en

el caso de poblaciones finitas
Las fórmulas presentadas en el apartado anterior, se utilizan

habitualmente cuando no se conoce el tamaño de la población objetivo o
cuando se supone que es infinito.
En el caso de conocer el tamaño de la población objetivo, se

recomienda el uso de las siguientes fórmulas alternativas, ya que, en
muchos casos, reducen el tamaño de la muestra, lo cual implica una
reducción de costes para el cliente en la realización de trabajos de campo
Para el caso de estimación de una media poblacional:
67
Página
Para el caso de estimación de una proporción poblacional:
Ejercicio 1
¿A cuántas personas tenemos que entrevistar de una población de 50 000

habitantes para saber la edad media con un nivel de confianza del 99% y un
error máximo de 1 año si en una muestra piloto se obtuvo una varianza de
45 años al cuadrado?
Solución 1
Como se trata de estimar una media poblacional para una población finita,
aplicamos:
Redondeando, habría que entrevistar a 298 personas seleccionadas

aleatoriamente.
Ejercicio 2
¿A cuántas personas tendría que estudiar de una población de 15 000

habitantes para conocer cuántas compran fármacos al menos una vez por
semana con un nivel de confianza del 95% y un error muestral del 2%?
68
Página
Solución 2
Como se trata de estimar una proporción poblacional para una población

finita, aplicamos:
Redondeando, habría que entrevistar a 2 070 personas.
9.2.3 Error de muestreo y nivel de confianza: evaluación de muestras para la

investigación profesional
Jugando con el nivel de confianza y el error muestral
Cuando se elaboran presupuestos de trabajo de campo es importante

saber jugar con el nivel de confianza y el error muestral, para poder ofrecer
al cliente precios ajustados y entregar muestras de fiabilidad que puedan ir
desde una fiabilidad aceptable, a una estándar y a una excelente.
 Las muestras estándar son aquellas en las que se aplica un error

muestral máximo del ±5% para un nivel de confianza del 95%.
 Las muestras aceptables son aquellas en las que se aplica un
error muestral máximo del ±5% para un nivel de confianza de entre
el 90% y el 94%.
 Las muestras excelentes serían aquellas con errores inferiores al
±5% y niveles de confianza de entre el 95% y el 99%.
69
Teniendo esto presente, se puede jugar con el diseño y calcular varias

Página
alternativas de tamaño muestral, cuando hay problemas de presupuesto en

una negociación para realizar un trabajo de campo.
Los elementos con los que se puede jugar en la fórmula, son el error
y el nivel de confianza. También se puede jugar con la p y la q, siempre que
se realice una muestra piloto, pero esta, ya de por sí, supone un coste
adicional, aunque si sale favorable (es decir, si rebaja la máxima
indeterminación pq = 0,25), se pueden aprovechar las entrevistas piloto
llevadas a cabo, e incluirlas en la muestra.
Veamos un ejemplo para comprender mejor la importancia de esta

parte del diseño de muestras.
Ejercicio
Una empresa de reciclaje de escombros, que vende arena, grava y

otros productos derivados del reciclaje que se utilizan en el ámbito de la
construcción y adecuación de jardines y otros espacios, quiere llevar a cabo
un estudio de satisfacción de sus clientes, así como captar su opinión acerca
de diversos aspectos relacionados con esta actividad. La empresa tiene una
cartera de 2 300 clientes tras cinco años de andadura. Si las principales
estimaciones que desean que proporcione el estudio son las referentes a la
nota media de satisfacción con sus servicios en una escala de 9 puntos donde
1 = muy insatisfecho y 9 = muy satisfecho, más la de la proporción de
clientes que está comprando productos al menos una vez al mes, ¿qué
tamaño muestral puede recomendar la empresa de trabajo de campo sin
pasarse de un presupuesto de 3 500 euros, sabiendo que el coste unitario
de cada entrevista es de 10 euros?
Solución
La empresa de trabajo de campo considera los datos de partida y

efectúa algunos cálculos de tamaño muestral posible:
70
1. Cálculo del tamaño muestral para estimar la nota media de

Página
satisfacción
Para este cálculo, deciden aplicar un nivel de confianza del 95% y un
error muestral de ±0,5 puntos en la escala de 9. Como no se conoce la
desviación estándar, se decide aplicar una de 3 puntos, en base a la
experiencia de otros estudios de satisfacción de clientes, pues, aunque
pueda haber algún caso extremo de puntuación baja o alta, la mayoría de
clientes suele estar más satisfecho que insatisfecho, a menos que una
empresa lo haga muy mal, cosa que no parece aplicable al caso de la empresa
de reciclaje.
Bajo estos supuestos, el tamaño de la muestra se obtiene aplicando

valores a la fórmula:
2. Cálculo de la muestra necesaria para estimar la proporción de

clientes que compra producto reciclado al menos una vez al mes
Para este supuesto, decide aplicar un nivel de confianza del 95% y un

error muestral de ±3%, bajo un supuesto de máxima indeterminación p = q
= 0,5. El cálculo queda como sigue: 71
Página
A la vista de estas cifras, la empresa de trabajo de campo, sabe que la

muestra para calcular la proporción, cubre de sobras la que se necesita para
estimar la media de satisfacción. Sin embargo, es necesario reducir el
tamaño muestral de esta propuesta, pues 729 encuestas a 10 euros,
supondrían un coste excesivo: 7 290 euros frente a los 3 000 disponibles.
Para reducir el tamaño muestral, sin bajar el nivel de confianza, el

diseñador de la muestra decide aumentar el error muestral hasta el límite
de ±5%, ya que el de ±3% era más exigente. El nuevo cálculo da lo siguiente:
En este caso, aplicando los valores tradicionales, habría que hacer

329 encuestas, que cubrirían bien ambos objetivos con un coste de trabajo
de campo de 329 x 10 = 3 290 euros, precio asumible por parte del cliente.
La muestra sería fiable y adecuada.
Por consiguiente, la empresa de investigación aconsejaría hacer 329

- 330 entrevistas que proporcionarían estimaciones de la proporción
muestral con un error del ±5% a un nivel de confianza del 95% y un
error muestral inferior a 0,5 puntos en la estimación de la media de
satisfacción del cliente en una escala de 9 puntos.
Evaluación de muestras a posteriori
En muchas ocasiones, al aplicar el criterio de máxima

indeterminación, la muestra que finalmente se obtiene es más precisa de lo
que se piensa a priori, es decir, cuando se hace el diseño.
El desconocimiento de la varianza p·q en una población nos hace

aplicar, en muchas ocasiones, un tamaño muestral más elevado del que
72
realmente sería necesario para estimar una proporción. Sin embargo, como
empresa de trabajo de campo o profesionales, siempre deberemos hacer lo
Página
posible para calcular tamaños que garanticen la fiabilidad de las

estimaciones. Con todo, lo que sí que podemos hacer para proporcionar
mayor satisfacción al cliente, es calcular el error muestral realmente
cometido a posteriori, es decir, una vez extraída la muestra bajo criterios
exigentes.
Si el error a posteriori es más bajo que el que aplicamos a la fórmula

inicial de cálculo de tamaño de la muestra, siempre lo podremos incluir en
la ficha técnica y ampliar el grado de fiabilidad inicial, lo cual siempre será
una buena noticia para el cliente, ya que le estaremos indicando que las
estimaciones realizadas con esa muestra son más fiables de lo que podíamos
pensar todos en un principio.
Veamos un ejemplo para comprender mejor cómo funcionan estos

mecanismos de revisión de fiabilidad.
Ejemplo:
Una empresa de transporte público local encargó un estudio para la

puesta en marcha de una nueva línea de autobús en un municipio, que
uniría otros 4 en su recorrido. La población total de estos 4 municipios era
de 80 000 habitantes, de entre 14 y 84 años, que eran las edades estimadas
de los usuarios potenciales.
La empresa quería que le estimasen la proporción de personas que

estarían interesadas en utilizar la línea al menos una vez por semana.
La empresa de trabajo de campo calculó el tamaño muestral

necesario para efectuar esta estimación con un error muestral máximo del
±5% para un nivel del 95%, bajo criterio de máxima indeterminación (lo
habitual en un caso como este). El cálculo dio el siguiente resultado:
73
Página
Por consiguiente, se realizaron 383 entrevistas aleatorias entre la

población.
Tras llevar a cabo las entrevistas, el resultado del estudio, indicó que
un 34% de la población estaba interesado en utilizar la nueva línea de
autobús al menos una vez a la semana.
La empresa de trabajo de campo, revisó el error a priori (5%), dado

que la estimación de la proporción dio un resultado bastante por debajo del
50%. Para ello, despejó el error de la fórmula de cálculo del tamaño
muestral:
Aplicando valores, sabiendo que p = 0,34 y q = 0,66 (pues salió un

34% de respuesta positiva contra un 66% de otra respuesta acerca del
interés por utilizar el nuevo autobús una vez a la semana):
Multiplicando el resultado por 100, la empresa concluyó que, en

realidad, la muestra extraída comete un error muestral de ±4,73% en lugar
de un error de ±5%.
Dominar estas técnicas resulta conveniente e importante, ya que la

estadística no es una ciencia exacta y, toda reducción del error muestral es
buena noticia, ya que confiere mayor fiabilidad de los estudios que se
realizan.
74
Página
La estimación que se lleva a cabo en este estudio es puntual, y arroja

un 34% de usuarios potenciales, pero, desde un punto de vista de
rentabilidad de la nueva línea de autobús, al cliente le interesa más conocer
el intervalo de confianza de esta estimación, que se halla restando y
sumando el error a la estimación puntual, es decir, haciendo:
 34% – 4,73% = 29,27%

 34% + 4,73% = 38,73%
De esta forma, la empresa de investigación de mercados puede

decirle a la de transporte que, semanalmente, puede esperar una demanda
de entre un 29,27% (80 000 x 0,2927 =23 416 viajeros potenciales) de la
población y un 38,73% (80 000 x 0,3873 = 30 984 viajeros potenciales) de
la población con un 95% de probabilidad.
Las cifras habrían sido diferentes de aplicar el 5% en lugar del 4,73%

como error de muestreo, y menos realistas, pues el intervalo habría sido más
amplio: entre un 29% (23 200 viajeros) y un 39% (31 200 viajeros).
75
Página

Unidad 1 Estadística Inferencial

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 1 Estadística Inferencial

Cargado por

Copyright:

Formatos disponibles

UNIDAD 1.

AÑO LECTIVO 2018-2019

1.1 Términos Utilizados............................................................... 3

2 La función de la Estadística Inferencial ....................................... 5

2.1 Tipos de datos que analiza la estadística en la investigación.

3 Variables Aleatorias ...................................................................... 7

4 Parámetros y Estadísticos .......................................................... 10

5 Tipos de Distribuciones .............................................................. 15

5.1 Distribución Normal ............................................................ 15

5.2 Curva Normal estándar ....................................................... 16

5.2.1 Simétrica ........................................................................20

5.2.2 Asimétrica a derecha ..................................................... 21

5.2.3 Asimétrica a izquierda ................................................... 22

5.2.4 Con forma de campana .................................................. 22

5.2.5 Uniforme ........................................................................ 22

6 Distribución Normal a Probabilidades con variables aleatorias

6.1 Variables aleatorias discretas ........................................... 24

6.2 Parámetros de una variable aleatoria .................................. 25

7 Medidas resumen ....................................................................... 27

7.1 Posición del centro de los datos ..........................................28

7.1.2 La mediana ..................................................................... 29

7.1.3 Medidas de dispersión o variabilidad ............................30

7.1.4 Rangos y distancia intercuartil ...................................... 31

7.1.5 Los cinco números resumen y el gráfico de caja y brazos

7.1.6 Desviación estándar ....................................................... 35

7.1.7 Centro y dispersión en diferentes tipos de distribuciones

8.1 Tipos de Muestreo ............................................................... 43

8.1.1 Muestreos no probabilísticos. ........................................ 43

8.1.2 Muestreos probabilísticos: ............................................ 46

8.2 Cálculo del tamaño de la muestra ...................................... 60

8.2.1 Tamaño muestral para estimar una media poblacional62

8.2.2 Tamaño muestral para estimar una proporción

8.2.3 Error de muestreo y nivel de confianza: evaluación de

9 Bibliografía ............................ Error! Bookmark not defined.

10 Test ..................................... Error! Bookmark not defined.

11 Actividades de la Unidad ... Error! Bookmark not defined.

Se dedica a la generación de los modelos, inferencias y predicciones

La inferencia estadística se encargará de sacar conclusiones acerca

1.1 Términos Utilizados

por muchos individuos: ciudades, escuelas, lotes (de tornillos) etc.

adecuadamente -sin elegir tramposamente la parte buena-

tendremos una buena idea del sabor de la totalidad de la sopa. Esto

2 La función de la Estadística Inferencial

El propósito principal de los métodos estadísticos es legitimar

El uso principal de la inferencia estadística en la investigación del

Los métodos estadísticos inferenciales emplean el razonamiento

3 Tipos de datos que analiza la estadística en la investigación.

Cuando no es posible asociar sus valores a medidas numéricas. Son

Se suele hablar de dos tipos:

» Nominal: los valores son categorías que no pueden ordenarse. Son

Por ejemplo: ¿Estado Civil?

 Soltero - Casado -Viudo - Divorciado

» Ordinal: sus valores son categorías, pero pueden ordenarse (de

 Muy Satisfecho – Satisfecho – Ni Satisfecho Ni Insatisfecho – Poco

Sus resultados son medidas numéricas. En SPSS se las denomina

Hay dos tipos:

» Variable cuantitativa discreta: los valores que toma son números

» Variable cuantitativa continua: puede tomar cualquier valor en

Saber clasificar variables en cualitativas y cuantitativas y, dentro de

aleatoria supone contar con información de la probabilidad asociada a cada

Ejemplo: Si medimos la variable “estado civil” en toda la población

La distribución de probabilidad de una variable aleatoria -de forma

A esa correspondencia entre las modalidades de una variable y sus

Ejemplo: función de probabilidad correspondiente a la variable ‘Nº