Está en la página 1de 23

MANUAL DE BIOESTADÍSTICA VETERINARIA.

Benito López Baños.

CAPITULO 5.

MUESTREO ESTADÍSTICO SIMPLE E INTERVALOS DE CONFIANZA

5.1 INTRODUCCIÓN. El Médico Veterinario Zootecnista como todos los


profesionales de la investigación científica, requiere de conocer las leyes
generales así como, las reglas particulares que caracterizan a una población,
que le permitan incidir en ella ya sea para conocerla y explotarla hasta la
extinción o para modificarla y obtener de ella, ventajas que le permitan
aprovechar mejor los recursos que dicha población pueda proveerle, mas si lo
vemos como una fuente de recursos sustentables o renovables.
Este hecho, plantea la disyuntiva de estudiar la población en forma directa
(censo) o utilizar una “muestra” relativamente pequeña que le permita obtener
información de la población. La primera opción, por lo general resulta poco
práctica por la cantidad de datos (tamaño de la población) que se podrían
manejar, por el tiempo que se emplearía en hacer el estudio y sobre todo, por
el costo del mismo. La segunda opción resulta más viable, ya que vista como
una metodología resuelve el problema de las características que debe cumplir
la información útil: que sea veraz, oportuna y económica.
Así el muestreo, como parte de la estadística es una herramienta crucial en la
investigación científica, en un sentido muy general se puede decir que éste,
determina que porción de una realidad en estudio comúnmente llamada
Población o Universo, debe examinarse con la finalidad de hacer
Inferencias sobre el todo de la o el que procede.
Toda investigación requiere de la selección, observación, recolección,
medición, análisis e interpretación de un número limitado de individuos o
sucesos de una población. Por lo que el muestreo, como proceso científico,
procura aportar en forma razonable métodos que aseguren la selección de una
parte del universo que sirva como modelo de representación de una realidad
objetiva. Obtener una “buena muestra” significa, precisamente, obtener una
versión simplificada de la población, que reproduzca de algún modo sus rasgos
básicos.
La figura 5.1 ejemplifica en forma general las relaciones entre una población y
una muestra. Como puede notarse, las medidas que se obtienen directamente
de la población se les llama “Parámetros” y por lo general se les representa con
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

letras griegas, así se tiene que, para la Media Aritmética o Promedio


poblacional se utiliza la letra “µ” y para la Desviación Estándar la letra “σ”, en
cambio, para estas mismas medidas cuando provienen de una muestra se les
denomina “Estimadores” o “Estadísticos” y se representan con las letras “ X ” y
“s” respectivamente.

Figura 5.1 Relación esquemática entre Población y Muestra.

5.2 DISTRIBUCIÓN MUESTRAL. Una distribución muestral es aquella


distribución probabilística, dada a partir de todas las distintas muestras posibles
de tamaño igual, tomadas de la misma población, existiendo una distribución
muestral para cada estimador o estadígrafo tal como la media, la mediana, la
varianza, la desviación estándar, etc.

5.2.1 Muestreo con Reemplazo.


Para ilustrar este concepto se asume primero un muestreo con reemplazo de
una población que contiene seis elementos {1, 2, 3, 4, 5, 6}. Se selecciona al
azar muestras de tamaño 2.

Se puede notar fácilmente que el promedio µ de esta población es:

1 + 2 + 3 + 4 + 5 + 6 21
µ= = = 3.5
6 6
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

y que la desviación estándar σ es:

(1 − 3.5) 2 + (2 − 3.5) 2 + (3 − 3.5) 2 + (4 + 3.5) 2 + (5 − 3.5) 2 + (6 − 3.5) 2


σ= =
6

17.5
σ= ≈ 1.71
6

Ahora bien, teóricamente se pueden obtener tantas muestras “con reemplazo”


de tamaño 2 de una población con 6 elementos como 6x6 = 36.
Estas se muestran en el Cuadro 5.1 al igual que las medias que resultan de
cada muestra, y se puede observar que el promedio de las medias muestrales

µ x
es igual al parámetro µ, es decir:

µ x
= µ Xi
= 3.5

Donde:

1.0 + 1.5 + 2.0 + ... + 6.0 126


µ
36

x
= ∑ Xi
i =1
=
36
=
36
= 3.5

Por otro lado el gráfico 1, muestra la distribución de la medias, nótese que


dicho gráfico tiende a formar una figura simétrica que se asemeja a una
distribución normal donde el promedio de las medias muestrales 3.5 se ubica
en el centro.
Esto comprueba que si se considera a las X como una variable aleatoria,
tendrá por consecuencia una media y una desviación estándar, que se puede
estimar como una distribución probabilística, siendo igual a la esperanza
matemática E(Xi) y esta a su vez igual a µ.

n
µ = E(Xi) = X 1
P( X 1
)+ X 2
P( X 2
) + …+ X n
P( X n
) = ∑ Xi P( Xi )
i =1

Y que su varianza y desviación estándar será:

σ ∑ Xi 2 P( Xi ) - µ
2 2
X
=
i =1
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

σ = σ
2
X X

Cuadro 5.1 Muestras de tamaño n=2 que teóricamente se pueden obtener de


una población de tamaño N=6, con reemplazo, sus medias y las sumas de las
diferencias con respecto a sus medias al cuadrado.

∑(Xi- X )2
Muestras
σ
2
X
1 {1,1} 1.0 0 0
2 {1,2} 1.5 0.5 0.25
3 {1,3} 2.0 2 1
4 {1,4} 2.5 4.5 2.25
5 {1,5} 3.0 8 4
6 {1,6} 3.5 12.5 6.25
7 {2,1} 1.5 0.5 0.25
8 {2,2} 2.0 0 0
9 {2,3} 2.5 0.5 0.25
10 {2.4} 3.0 2 1
11 {2,5} 3.5 4.5 2.25
12 {2,6} 4.0 8 4
13 {3,1} 2.0 2 1
14 {3,2} 2.5 0.5 .25
15 {3,3} 3.0 0 0
16 {3,4} 3.5 0.5 .25
17 {3,5} 4.0 2 1
18 {3,6} 4.5 4.5 2.5
19 {4,1} 2.5 4.5 2.5
20 {4,2} 3.0 2 1
21 {4,3} 3.5 0.5 .25
22 {4,4} 4.0 0 0
23 {4,5} 4.5 0.5 .25
24 {4,6} 5.0 2 1
25 {5,1} 3.0 8 4
26 {5,2} 3.5 4.5 4.5
27 {5,3} 4.0 2 1
28 {5,4} 4.5 0.5 .25
29 {5,5} 5.0 0 0
30 {5,6} 5.5 0.5 .25
31 {6,1} 3.5 12.5 6.25
32 {6,2} 4.0 8 4
33 {6,3} 4.5 4.5 2.25
34 {6,4} 5.0 2 1
35 {6,5} 5.5 0.5 .25
36 {6,6} 6.0 0 0
µ x
= 3.5 105.0 52.5/36=σ X
2
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

=1.458

Se puede confirmar lo anterior, al usar la información que se muestra en el


cuadro 5.2, donde se presenta las medias de las muestras y la frecuencia
(probabilidad) con que se obtuvieron. Así, se tiene que:

n
µ = E(Xi) = ∑ Xi P( Xi ) = (1.0 x 0.0278) + (1.5 x 0.0556) + …+ (6.0 x 0.0278) = 3.5000
i =1

Así también la varianza de las medias muestrales será.

σ ∑ Xi 2 P( Xi ) - µ
2 2 2 2 2 2
X
= = [(1.0 x 0.0278) + (1.5 x 0.0556) + …+ (6.0 x 0.0278)] – 3.5 =
i =1
2
= 13.7088 – 3.5 = 1.4588

σ = σ 1.4588 = 1.2078 ≈ 1.21


2
X X
=

=σx =
1.71
σ X
n 2
= 1.2092 ≈ 1.21

Este último valor σ X


= 1.21, también se conoce como el Error Estándar de las medias

( X ) de las muestras.

Cuadro 5.2 Probabilidades y frecuencias con que


se presentan las Medias del cuadro 5.1
X Frecuencia P( X ) X P( X )
1 1.0 1 0.027778 0.027778
2 1.5 2 0.055556 0.083334
3 2.0 3 0.083333 0.166666
4 2.5 4 0.111111 0.277777
5 3.0 5 0.138889 0.416667
6 3.5 6 0.166666 0.583331
7 4.0 5 0.138889 0.555556
8 4.5 4 0.111111 0.499999
9 5.0 3 0.083333 0.416665
10 5.5 2 0.055556 0.305558
11 6.0 1 0.027778 0.166668
Suma 36 1.0000 3.500000
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

Gráfica 1. Distribución Muestral


tomadas del cuadro 5.2
7
6
5
4
Frecuencia
3
2
1
0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0

Medias

5.2.2 Muestreo sin Reemplazo.


Ahora, asumiendo un muestreo sin reemplazo, donde se tiene 6 puntos
muestrales formado por el número de lechones destetados por seis marranas
de primer parto cuyos valores son: {5,6,7,8,9,10}, se puede demostrar que el
promedio µ de esta población es:

5 + 6 + 7 + 8 + 9 + 10 45
µ= = = 7.5
6 6

y que la desviación estándar σ es:

(5 − 7.5) 2 + (6 − 7.5) 2 + (7 − 7.5) 2 + (8 + 7.5) 2 + (9 − 7.5) 2 + (10 − 7.5) 2


σ= =
6 −1
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

17.5
σ= ≈ 1.871
6 −1

Si se toman muestras de tamaño 2, al azar de esta población, se puede


esperar un total de 6C2 = 15 muestras diferentes. Estas se observan en el
cuadro 5.3, al igual que sus medias y sus varianzas que resultan de cada
muestra.

Cuadro 5.3 Muestras de tamaño n=2 que teóricamente se pueden obtener de


una población de tamaño N=6, sin reemplazo, sus medias y las varianzas.

∑(Xi- X )2
Muestras
σ
2
X
1 {5,6} 5.5 0.5 0.25
2 {5,7} 6.0 2 1
3 {5,8} 6.5 4.5 2.25
4 {5,9} 7.0 8 4
5 {5,10} 7.5 12.5 6.25
6 {6,7} 6.5 0.5 0.25
7 {6,8} 7.0 2 1
8 {6,9} 7.5 4.5 2.25
9 {6,10} 8.0 8 4
10 {7.8} 7.5 0.5 0.25
11 {7,9} 8.0 2 1
12 {7,10} 8.5 4.5 2.25
13 {8,9} 8.5 0.5 0.25
14 {8,10} 9.0 2 1
15 {9,10} 9.5 0.5 0.25
µ =7.5
x
52.5 26.25/15=σ X
2

=1.75

Una vez mas, si se considera a las X como una variable aleatoria, tendrá por
consecuencia una media y una desviación estándar, que se puede estimar
como una distribución probabilística, siendo igual a la esperanza matemática
E(Xi) y esta a su vez igual a µ.

Así, usando los valores del cuadro 5.4 y sustituyendo la ecuación siguiente se
tiene que:
n
µ = E(Xi) = ∑ Xi P( Xi ) = 0.36685 + 0.40020 + … + 0.63365 = 7.5
i =1
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

σ
2
Se puede ver en el cuadro 5.3, que la varianza de las medias X
es igual a
1.75 y por lo tanto la desviación estándar σ X es 1.323 aproximadamente. Lo
que se puede verificar si obtenemos el error estándar de las medias:

σ 1.871 ≈ 1.323
σ X
=
n
x
=
2

Cuadro 5.4 Probabilidades y frecuencias con que


se presentan las Medias del cuadro 5.3

X Frecuencia P( X ) X P( X )
1 5.5 1 0.0667 0.36685
2 6.0 1 0.0667 0.40020
3 6.5 2 0.1333 0.86645
4 7.0 2 0.1333 0.93310
5 7.5 3 0.2000 1.50000
6 8.0 2 0.1333 1.06640
7 8.5 2 0.1333 1.13305
8 9.0 1 0.0667 0.60030
9 9.5 1 0.0667 0.63365
Suma 15 1.0000 7.50000

Gráfica 2. Distribución Muestral


tomadas del cuadro 5.4
3.5
3
2.5
2
Frecuencia
1.5
1
0.5
0
5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5

Medias
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

5.3 TEOREMA DEL LIMITE CENTRAL.

De todo lo anterior se puede derivar el siguiente teorema: Si se toman todas


las muestras posibles de tamaño “n”, de una población con media µ y
desviación estándar σ, la distribución de muestreo de estas medias será
normal y tendrá una media µ x
igual a µ y una desviación estándar de σ X

igual a σ/ n independientemente de que la población se distribuya


normalmente o no.

5.4 MUESTRO ALEATORIO SIMPLE.

Se define al Muestreo Aleatorio Simple (MAS) como aquel en que cada


elemento de la población tiene la misma probabilidad de ser seleccionado
para integrar la muestra.

Así, una población no es más que aquel conjunto de individuos o elementos


en los cuales podemos observar o medir alguna característica o atributo en
común. Dichas características pueden ser: una o más variables cualitativas
como: especie, raza, edad, sexo, etc. o cuantitativas como: peso al nacimiento,
peso al destete, peso al año de edad, peso y número de huevos por ciclo de
postura, velocidad de crecimiento, conversión alimenticia, entre otras.
Ahora bien, supongamos que nos interesa conocer el peso promedio de
terneros al nacimiento de una raza de bovinos productora de leche, si el
tamaño de la población es muy grande, resultaría un gran problema pesar a
cada uno de los miembros de esta población. Una solución a esto, consiste en
medir solo una parte de la población que comúnmente se llama muestra y
tomar el peso promedio en la muestra como una aproximación del verdadero
valor del peso promedio de la población.
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

Para esto es necesario saber que se le llama Parámetro a las medidas o


datos que se obtienen sobre la distribución de probabilidades de la población,
tales como la media µ y la desviación estándar σ entre otras.

Y Estimador a los datos o medidas que se obtienen sobre una muestra y por lo
tanto es una estimación de los parámetros, entre ellos se encuentra la media

x , y la desviación estándar s. Tal como se ilustra en la figura 5.1

Para que los resultados obtenidos de los datos muestrales se puedan extender
o inferir a la población, la muestra debe ser “representativa” de la población
en lo que se refiere a la característica en estudio, o sea, la distribución de la
característica en la muestra debe ser aproximadamente igual a la distribución
de la característica en la población. Para ello la muestra deberá ser aleatoria o
probabilística, esto es, aquella en que sus elementos son seleccionados
mediante el muestreo aleatorio simple.

Método de selección.

Un procedimiento para obtener una muestra de una población mediante el


muestreo sin reemplazo, es utilizando una tabla de números aleatorios en
especial para poblaciones finitas, la utilización de estas tablas puede realizarse
de diferentes maneras pero en el presente trabajo, se expone un procedimiento
práctico y eficiente, que garantiza razonablemente la obtención de números
aleatorios insesgados, ya que no se necesita de la búsqueda de una gran
cantidad innecesaria de números aleatorios en la tabla.

Existen diferentes tablas de números aleatorios, en este ejemplo se utilizará la


tabla de números aleatorios incluida en el Apéndice A.1 de este manual, la cual
como puede notarse, esta constituida por 720 números aleatorios de 5 dígitos
cada uno, dispuestos en 12 columnas y 60 renglones.

Para ilustrar este procedimiento se utilizará el cuadro 5.5 donde se presenta


una población de 300 datos que corresponden a los pesos al nacimiento en Kg
de terneros de la raza Holstein en un establo del altiplano. Se desea obtener
tres muestras preliminares de tamaño n=8 que permita estimar los valores de la
media X y la desviación estándar s en cada muestra.
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

Previamente observar que la población está compuesta por un número finito de


tamaño N= 300 y que este número está compuesto de 3 dígitos por lo que los
valores del cuadro 5.5 están numerados también con tres dígitos, del 000 al
299, para su fácil identificación.

Cuadro 5.5 Peso al Nacimiento en Kg de 300 terneros de la raza Holstein con


µ = 35.8 y σ = 3.9.
Número Valor Número Valor Número Valor Número Valor Número Valor Número Valor
000 36.5 050 39.3 100 32.9 150 34.7 200 38.7 250 38.2
001 46.3 051 35.6 101 39.4 151 35.9 201 33.1 251 39.3
002 30.7 052 42.2 102 29.6 152 35.5 202 36.4 252 34.2
003 32.9 053 27.8 103 39.2 153 45.0 203 39.7 253 39.3
004 42.4 054 34.1 104 37.7 154 28.4 204 37.1 254 35.6
005 34.1 055 37.5 105 34.4 155 36.5 205 32.8 255 33.7
006 34.3 056 36.9 106 34.5 156 34.6 206 35.4 256 31.8
007 36.6 057 30.9 107 35.4 157 29.6 207 34.7 257 39.9
008 35.9 058 36.9 108 37.7 158 37.2 208 34.3 258 33.5
009 41.2 059 35.2 109 43.7 159 36.4 209 29.6 259 33.4
010 37.8 060 38.2 110 33.7 160 38.3 210 30.9 260 35.9
011 34.2 061 35.7 111 43.0 161 34.2 211 33.1 261 30.4
012 44.9 062 37.3 112 33.0 162 39.0 212 29.6 262 30.8
013 47.8 063 39.7 113 41.0 163 36.8 213 40.5 263 36.9
014 35.4 064 30.0 114 34.6 164 33.2 214 32.3 264 40.7
015 35.5 065 34.6 115 33.6 165 34.8 215 31.6 265 39.8
016 31.9 066 37.0 116 31.5 166 31.9 216 30.1 266 36.5
017 33.7 067 42.8 117 34.2 167 43.8 217 34.4 267 32.9
018 32.3 068 40.8 118 27.4 168 34.3 218 37.5 268 30.0
019 33.9 069 39.7 119 31.3 169 39.7 219 28.8 269 35.1
020 37.2 070 37.0 120 35.1 170 39.0 220 39.3 270 38.5
021 38.7 071 35.9 121 34.6 171 32.7 221 27.3 271 32.9
022 33.6 072 34.9 122 33.1 172 33.1 222 38.0 272 37.0
023 37.4 073 27.3 123 36.9 173 35.9 223 34.6 273 45.1
024 34.2 074 35.3 124 34.5 174 38.2 224 34.0 274 35.8
025 37.4 075 37.5 125 35.1 175 33.3 225 29.0 275 35.3
026 29.1 076 30.6 126 36.0 176 44.8 226 36.8 276 35.4
027 32.9 077 43.6 127 34.3 177 32.3 227 36.2 277 33.2
028 33.3 078 40.3 128 36.0 178 35.0 228 27.0 278 33.1
029 35.9 079 32.3 129 39.9 179 36.2 229 37.0 279 35.9
030 34.4 080 30.5 130 33.7 180 35.2 230 33.9 280 42.4
031 34.8 081 29.0 131 37.4 181 43.7 231 37.4 281 36.0
032 39.4 082 33.8 132 39.4 182 37.3 232 30.9 282 37.4
033 42.4 083 28.7 133 36.0 183 30.4 233 43.1 283 41.5
034 41.5 084 39.3 134 38.4 184 35.4 234 37.2 284 39.2
035 36.0 085 36.5 135 34.2 185 32.4 235 39.7 285 37.6
036 33.5 086 31.1 136 24.6 186 40.4 236 35.9 286 37.9
037 42.1 087 34.8 137 45.6 187 30.5 237 33.3 287 36.2
038 37.6 088 42.9 138 31.9 188 41.3 238 36.2 288 32.3
039 36.3 089 36.6 139 37.8 189 31.9 239 36.6 289 34.9
040 34.5 090 29.4 140 34.6 190 31.6 240 30.4 290 36.0
041 39.8 091 40.5 141 42.0 191 44.3 241 32.4 291 36.1
042 32.5 092 36.4 142 37.9 192 31.0 242 35.4 292 41.3
043 33.5 093 33.3 143 30.6 193 35.7 243 38.6 293 41.0
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

044 33.3 094 34.6 144 32.2 194 34.0 244 33.0 294 35.1
045 34.1 095 35.6 145 32.9 195 35.2 245 38.5 295 31.2
046 41.9 096 35.4 146 42.6 196 34.7 246 34.0 296 38.7
047 37.4 097 35.0 147 38.9 197 33.9 247 33.0 297 43.4
048 30.4 098 42.6 148 34.2 198 32.5 248 36.8 298 32.8
049 38.8 099 41.1 149 34.3 199 34.1 249 31.5 299 36.7

Las tablas de números aleatorios no tienen regla alguna para su uso, por lo que
el usuario o investigador deberá fijar sus propias reglas y estas deberán estar
listas antes de iniciar la lectura de la tabla. Como primer paso se debe fijar el
punto de inicio en la lectura de la tabla, lo cual implica que se debe fijar la
columna y el renglón donde se iniciará la lectura, para ello se puede uno
apoyar en una persona ajena al estudio para que sea esta la que elija
arbitrariamente un número de columna entre 1 y 12 (suponga que eligió el
número 8), posteriormente y de preferencia otra persona, elegirá un número de
renglón entre 1 y 60 (suponga que escogió el número 32). Así, para este
ejemplo, el punto de inicio será la coordenada formada por la columna 8 y el
renglón 32. También se debe fijar la dirección con la cual se moverá sobre el
renglón y podrá ser “derecha” o “izquierda” (suponga que se eligió derecha), el
sentido que tomará cuando llegue al final del renglón “arriba” o “abajo” también
deberá fijarse (suponga que se elige arriba) y finalmente debe decidirse cuales
3 de 5 dígitos que tiene cada número serán los que se utilicen en este ejemplo
(asuma los tres últimos dígitos). Como se podrá notar es poco probable que
dos personas trabajando independientemente sobre la misma tabla de números
aleatorios coincidan en las mismas reglas o criterios prefijados como son: la
misma columna, renglón, dirección, sentido y dígitos de cada número. Lo que
hace a cada regla o criterio prefijado por un investigador como individual o
exclusivo. De tal manera que en este ejemplo la primera muestra se puede
esquematizar con las reglas prefijadas de la siguiente manera:

Muestra 1

C8,R32, →,↑, 3 últimos dígitos.

(columna 8, renglón 32, dirección derecha, sentido arriba, tres últimos dígitos)
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

Cabe aclarar para este ejemplo, que si, en la lectura de los números aleatorios,
se encuentran números formados con los tres últimos dígitos mayores a 299 o
se repite alguno, estos se saltan.
Así los 8 números aleatorios de tres dígitos leídos en la tabla A.1 del Apéndice
serán: 079, 143, 241, 052, 027, 261, 118 y 064.

Cambiando las reglas para obtener los números aleatorio de las muestras dos
y tres, se tendrá:

Muestra 2

C3,R10, ←,↑, 3 primeros dígitos.

(columna 3, renglón 10, dirección izquierda, sentido arriba, tres primeros


dígitos)
Así los 8 números aleatorios de tres dígitos leídos en la tabla A.1 del Apéndice
serán: 114, 297, 162, 070, 161, 188, 219 y 170 para la muestra dos.

Muestra 3

C10,R3, ←,↑, 3 dígitos centrales.

(columna 10, renglón 3, dirección izquierda, sentido arriba, tres dígitos


centrales)
Así los 8 números aleatorios de tres dígitos leídos en la tabla A.1 del Apéndice
serán: 265, 250, 054, 000, 134, 228, 104 y 259 para la muestra tres.

Mismos que ordenados y presentados en columna tendrán los siguientes


valores, así como, sus promedios y desviaciones estándar en las tres muestras
respectivamente, como se muestra en el cuadro 5.6.

Se puede observar en este cuadro que los promedios de las tres muestras
fueron: X 1 = 32.7, X 2 = 37.15 y X 3 = 35.6 valores que aparentemente son
“diferentes” y lo mismo podemos percibir en las desviaciones estándar de las
tres muestras: S1= 3.4, S2 = 4.6 y S3 = 4.1 diferencias que se pueden explicar
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

como producto de los datos seleccionados en cada muestra es decir son


atribuibles al muestreo ya que las tres medias: X 1, X 2 y X 3 son buenas
estimaciones del parámetro µ, lo mismo que las desviaciones estándar: S1, S2 y
S3 lo son de σ.
Si se obtienen un mayor número de muestras del mismo tamaño se podría
observar variaciones entre las medias muestrales, variaciones que girarían
alrededor del parámetro µ y que demostraría el teorema de los limites
centrales. Por lo que, la variación encontrada entre las medias de las diferentes
muestras obtenidas de la misma población son una propiedad normal
inherentes al propio muestreo aleatorio. En otro capitulo se discutirán las
variaciones o diferencias “significativas” entre medias.

Cuadro 5.6 Números Aleatorios ordenados para las tres muestras y sus
correspondientes Pesos al Nacimiento en Kg de ocho terneros (Valores), sus
promedios y desviaciones estándar.
Muestra 1 Muestra 2 Muestra 3
*Número Valor *Número Valor *Número Valor
Aleatorio ** Aleatorio ** Aleatorio **
027 32.9 070 37.0 000 36.5
052 42.2 114 34.6 054 34.1
064 30.0 161 34.2 104 37.7
079 32.3 162 39.0 134 38.4
118 27.4 170 39.0 228 27.0
143 30.6 188 41.2 250 38.2
241 32.4 219 28.8 259 33.4
261 30.4 297 43.4 265 39.8
X 1 = 32.27 X 2 = 37.15 X 3 = 35.6
S1= 4.4 S2 = 4.6 S3 = 4.1
*Número Aleatorio obtenido de la tabla A.1 del Apéndice
** Valores obtenidos del Cuadro 5.5

Es común que los parámetros de la función de distribución ( µ y σ2) no se


conozcan en las distintas poblaciones y que sean estos, uno de los objetivos de
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

un investigador estimar, al trabajar generalmente con muestras de dichas


poblaciones. Ya que un estimador es una función de los valores de la muestra
que proporciona una estimación del parámetro en cuestión.
Existen dos tipos de estimadores: los estimadores puntuales y los estimadores
por intervalo.

Estimación Puntual.
Una estimación del parámetro por medio de un punto se le conoce como
estimador puntual y se considera bueno, si posee 4 propiedades o principios
básicos a saber:

-Insesgado. Que el valor esperado del estimador sea igual al valor de la


población por estimar. Es decir si ê es un estimador de E, entonces ê es
insesgado si el promedio de todos los valores posibles de ê es E.
Por el teorema del límite central y usando conceptos de esperanza
matemática, se sabe que:
E(X )=µ
Lo que significa que la distribución muestral de X se agrupa alrededor del
valor µ y no alrededor de otro valor. Por lo tanto X es un estimador insesgado
de µ.

-Consistente. Si ê es un estimador de E calculado a partir de una muestra al


azar de tamaño n. A medida que n aumenta y se aproxime a N (tamaño de la
población), la probabilidad de que ê sea cercano a E tiende a 1.
Intuitivamente se puede ver que en la medida que n es más grande, X se
aproximará a µ. Por lo que se puede afirmar que X es un estimador consistente
de µ.
Esto también puede expresarse en términos de probabilidad como:

Si P ( X → µ) → 1 cuando n → N
Se lee como “la probabilidad de que X se aproxime a µ tiende a ser 1, en la
medida de que n se aproxime a N”.
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

-Eficiente. Esta propiedad se refiere a que si se tiene 2 estimadores


“diferentes” X 1, X 2 (pero ambos insesgados) de µ con varianzas σ21 y σ22,
respectivamente, y si σ21< σ22 entonces se debe preferir al estimador X 1 en
lugar de X 2, como un buen estimador de µ. Esto obedece, sin demostrarlo a
que se asume que:

µ=X σ = σ2/n
2
y que X

Y por lo tanto el estimador X 1 tiene la varianza mínima que un estimador


puede tener, y generalizando, se puede afirmar que X tiene la mínima
varianza y por lo tanto es un estimador de mínima varianza de µ lo cual lo hace
eficiente.
-Suficiente si el estimador utiliza toda la información que contiene la muestra
acerca del parámetro que pretende estimar, se dice que es un estadístico
suficiente. Así X es un estimador suficiente de µ por que proporciona mayor
información que otros estimadores como son: la Mediana y la Moda al utilizar
todos los elementos de la muestra.
De lo anterior discutido se puede asumir que la X obtenida de una muestra
probabilística o al azar es un estimador insesgado, consistente, eficiente y
suficiente del parámetro µ de la población a la que pertenece la muestra.

Estimación por Intervalos.


Cuando la estimación del parámetro µ se hace por medio de un intervalo
(Intervalo de Confianza (IC)), es decir, por medio de dos límites o puntos
donde se considera que se encuentra el parámetro, se dice que la estimación
es por IC. En este tipo de estimación se pretende estimar un parámetro µ,
mediante un intervalo:
a>µ>b
donde a y b se obtiene a partir de las observaciones muestrales.
Estas estimaciones son de gran importancia en metodología estadística por
que aparte de involucrar conceptos de probabilidad también son más precisos
que las estimaciones puntuales.
Las estimaciones por IC básicamente están relacionadas en dos aspectos
fundamentales; el primero con un nivel de confianza o probabilidad que
representa el grado de confianza que tiene el investigador de que el parámetro
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

estimado se encuentre o esté contenido dentro de los dos límites calculados.


Los niveles de confianza más comúnmente usados por los investigadores son:
0.90, 0.95 y 0.99. También expresado como porcentajes; 90, 95 y 99 % de
confianza, valores que por lo general son fijados por ellos.
Cabe aclarar que cuando un nivel de confianza es elegido, se está aceptando
también la posibilidad de equivocarse y sería la probabilidad de cometer un
error que equivale a: 0.10, 0.05 y 0.01 respectivamente como se muestra en el
cuadro 5.7 donde se puede observar la relación que guarda el nivel de
confianza y el error. Este último también se le llama error α (alfa) o nivel de
significancia.

Cuadro 5.7 Niveles de confianza usados en estimaciones por intervalo.


Probabilidad
Nivel de Confianza 0.90 0.95 0.99
Error (α ) 0.10 0.05 0.01

El segundo es la precisión (Φ) que tiene la estimación y se define como la


distancia máxima que se le permite a un estimador alejarse del parámetro.
X →µ
Asi, el nivel de confianza y la precisión están involucrados en una estimación
por intervalo de confianza y quedan representados por la ecuación siguiente
cuando se conoce σ y n es lo suficientemente grande (n > 30):

X + Zα/2 σ/ n > µ > X - Zα/2 σ/ n …………(5.1)


Donde: X es la media aritmética estimada, σ la desviación estándar de la población, n el
tamaño de la muestra y Zα/2 el nivel de confianza de la estimación.

En la práctica es común que no se conozca σ y se trabaje con muestras


pequeñas (n ≤ 30), en estos casos la ecuación anterior puede ser sustituida
por:
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

X + tα/2 s / n > µ > X - tα/2 s / n ……….(5.2)


. Donde: X es la media aritmética estimada, s la desviación estándar de la muestra, n el
tamaño de la muestra y tα/2 el nivel de confianza de la estimación.
En término general los valores “t” son leídos en su tabla de distribución bajo dos criterios; el
nivel de confianza (α/2 o α) y el grado de libertad (g.l.) que proviene de la muestra “n-1” y
son expresados común mente como: t (α/2, g.l.).

Si se toma del cuadro 5.6 los estimadores obtenidos de la muestra 1, cuyos


valores son X 1 = 32.27, S1= 4.4 y n = 8 se puede sustituir la ecuación 5.2 y se
tendría a un 95 % de confianza:

32.27 + 2.365 x 4.4/ 8 > µ > 32.27 - 2.365 x 4.4/ 8

Nótese que el valor tα/2 para un nivel de 95 % de confianza se puede expresar


como t0.05/2 = t0.025 y leído en tablas de la Distribución “t” del Apéndice A.3 sería
el valor: t (0 .05/2, 7) = 2.365, por lo que resolviendo la ecuación anterior se tiene:

32.27 + (2.365) (1.5556) > µ > 32.27 – (2.365) (1.5556)


32.27 + 3.679 > µ > 32.27 – 3.679
35.95 > µ > 28.59

Para la muestra 2, con X 2 = 37.15 y S2 = 4.6, fijando el mismo nivel de


confianza de 95 % se tendrá:

37.15 + (2.365) ( 4.6/ 8 ) > µ > 37.15 - (2.365) (4.6/ 8 )


37.15 + (2.365) (1.6263) > µ > 37.15 - (2.365) (1.6263)
37.15 + 3.846 > µ > 37.15 - 3.846
41.0 > µ > 33.3

También para la muestra 3, con X 3 = 35.6 y S3 = 4.1, fijando el mismo nivel de


confianza de 95 % se tendrá:

35.6 + (2.365) (4.1/ 8 ) > µ > 35.6 - (2.365) (4.1/ 8 )


MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

35.6 + (2.365) (1.4496) > µ > 35.6 - (2.365) (1.4496)


35.6 + 3.428 > µ > 35.6 - 3.428
39.0 > µ > 32.2

Puede notarse que los tres intervalos de confianza comparten espacios o


puntos en común y son estos últimos los que denotan una cercanía alrededor
del parámetro. En otras palabras se puede asumir que el parámetro µ se
encuentra entre los dos puntos o límites de cada intervalo a un nivel de
confianza de 95%.
Así mismo, se puede observar que cada muestra tuvo un IC diferente, esto
significa, que cada muestreo es una experiencia aleatoria y por lo tanto lo que
se puede esperar de todos los IC del universo posible de muestras de una
población, es que el 95% de ellos, contengan al parámetro µ y por lo tanto un
5% de ellos podrían no contenerlo.

Precisión (Φ). También conocido como Error de muestreo o Error asociado a


la estimación.
La ecuación 5.2 también se puede expresar como:

µ = X ± tα/2 s/ n ………… (5.3)

En esta ecuación se puede notar que la expresión tα/2 s/ n es la precisión Φ


y equivale a la mitad de la distancia entre los dos limites de un intervalo de
confianza.
Φ = tα/2 s/ n …………….(5.4)
Y por lo tanto:
µ = X ± Φ …………..(5.5)

Así, al tomar los datos usados de la muestra 1, para estimar el intervalo de


confianza, se tiene que:
32.27 + 2.365 x 4.4 / 8 > µ > 32.27 - 2.365 x 4.4/ 8
32.27 + (2.365) (1.5556) > µ > 32.27 – (2.365) (1.5556)
32.27 + 3.679 > µ > 32.27 – 3.679
35.95 > µ > 28.59
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

Y usando la ecuación 5.3, se obtiene que:


µ = 32.27 ± 2.365 x 4.4 / 8
µ = 32.27 ± (2.365) (1.5556)
µ = 32.27 ± 3.679
Siendo este último número 3.679 la precisión del estimador o el error de
muestreo, en esta muestra.

En la muestra 2 se tendrá una precisión:


µ = 37.15 ± (2.365) ( 4.6/ 8 )
µ = 37.15 ± (2.365) (1.6263)
µ = 37.15 ± 3.846
Y para la muestra 3 se tendrá:
µ = 35.6 ± (2.365) (4.1/ 8 )
µ = 35.6 ± (2.365) (1.4496)
µ = 35.6 ± 3.428

Ahora bien, se debe recordar que los valores de Φ; 3.679, 3.846 y 3.428 son
valores expresados en la unidad de medida que se usa en la población de
donde provienen las tres muestras respectivamente y son Kg., en ocasiones se
pregunta un investigador al efectuar un muestreo ¿Cuál sería la Precisión mas
adecuada para su estudio?. Seguramente que cualquiera de los tres valores
3.679, 3.846 y 3.428 Kg., pueden ser apropiados para un estudio de Peso al
Nacimientos de becerros Holstein, pero en otra especie como los ovinos,
caprinos, porcinos, etc. Estos valores denotarían un error asociado a la
estimación (Φ) o error de muestreo exagerado.
Algunos autores transforman la Φ o error de muestreo, en un índice relativo Φr
que no exprese unidades de medidas sino un porcentaje, usando la siguiente
ecuación:
Φr (%) = (Φ / X ) 100 ………………(5.6)

De esta manera se tiene un error relativo de la estimación expresado en


porcentaje con respecto a media estimada ( X ) y permite tener una mejor
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

apreciación de este. En general, Φr no mayores de un 10% se consideran


aceptables.
Por lo que sustituyendo la ecuación 5.6 con los datos de la muestra 1, se tiene
un:
Φr1 = (3.679 / 32.27) 100 = 11.4%

En la muestra 2, se tiene un:


Φr2 = (3.846 / 37.15) 100 = 10.4 %

Y para la muestra 3 se tendrá un:


Φr3 = (3.428 / 35.6 ) 100 = 9.6 %

5.4.1 Tamaño de Muestra. Por lo anteriormente discutido es posible asumir,


que una muestra a medida que es más grande, el estimador ( X ) tiende
acercarse al parámetro (µ). En otras palabras, las muestras aleatorias grandes
tienden a obtener estimadores mas precisos, es decir a reducir el error del
muestreo. Sin embargo, en la práctica de campo el tamaño de una muestra se
ve fuertemente influenciado por el costo del estudio, siendo este la limitante
más importante en el tamaño de una muestra. A esto se debe que algunos
autores prefieran plantear el problema de la siguiente manera: ¿Cuál es el
tamaño mínimo de una muestra para estimar µ de manera que │ X - µ │
sea menor o igual a un nivel de confianza, que cierto valor de precisión
preestablecido?.
El problema puede resolverse si retomamos la ecuación 5.4, donde la precisión
Φ de una muestra de tamaño n esta definida por:
Φ = tα/2 s/ n

La cual con un poco de manipulación algebraica sencilla podemos obtener la


siguiente ecuación:

n . Φ = tα/2 . s

n = tα/2 . s / Φ
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

n = t2α/2 . s2 / Φ2 ……………(5.7)

La ecuación 5.7 permite estimar el tamaño mínimo de una muestra que llene
ciertos requisitos preestablecidos por el investigador bajo algunos supuestos
como sería conocer la variación de la población por muestrear, dado que esta
es una medida intrínseca y es única de la población, ello es difícil de saber, se
puede resolver en la práctica con un premuestreo donde se define en forma
arbitraria pero económicamente rentable el tamaño de la “premuestra” con el
objeto de tener un estimador s2 del parámetro σ2, así también el nivel de
confianza y la precisión de la estimación.
Para entender mejor esta idea, se toma de el Cuadro 5.6 los datos de la
muestra 1, y asumiendo que estos son tan solo un premuestreo de la población
mostrada en el Cuadro 5.5, con el objeto de tener un estimador s2 del
parámetro σ2 de la misma, entonces: s1= 4.4 y por lo tanto s21 = 19.36 y
considerando una buena precisión de no mas de un 8% con un nivel de
confianza de 95%. ( nótese que tanto la precisión como el nivel de confianza
son valores extrínsecos de la población, y pueden ser fijados por el
investigador) por lo tanto el 8% de X 1 = 32.27 sería 2.5816 y el nivel de
confianza a un 95% leído en tablas de la Distribución “t” del Apéndice A.3 sería
t (.05/2, ∞.) = 1.96. Sustituyendo con estos datos la ecuación 5.7 se obtiene:

n = 1.962 x 4.42 / 2.58162 = 3.8416 x 19.36 / 6.6647 = 11.16 ≈ 11


n = 11
Lo que se traduce a que, con una muestra aleatoria de 11 datos de la población
presentada en el Cuadro 5.5 se podría obtener a un 95% de confianza, un
estimador X que no se aleje más allá de 2.5816 Kg (8%) del parámetro µ.
Retomando este ejemplo se puede completar a 11 datos, así se tendrá:

Muestra 1

C8,R32, →,↑, 3 últimos dígitos.

(columna 8, renglón 32, dirección derecha, sentido arriba, tres últimos dígitos)
MANUAL DE BIOESTADÍSTICA VETERINARIA.
Benito López Baños.

Así los 8 números aleatorios de tres dígitos leídos en la tabla A.1 del Apéndice
serán: 079, 143, 241, 052, 027, 261, 118 y 064. Mas tres números para sumar
n= 11 ( 171, 187, 276 ) se tendrá el Cuadro 5.8

Cuadro 5.8 Números aleatorios y valores obtenidos


para una muestra aleatoria de tamaño n=11.
Muestra 1A
*Número Valor
Aleatorio **
027 32.9
052 42.2
064 30.0
079 32.3
118 27.4
143 30.6
241 32.4
261 30.4
171 32.7
187 30.5
276 35.4

X 1a = 32.44
S1a= 3.8

Se puede demostrar que usando la ecuación 5.3 y la sustituimos con los datos
del cuadro 5.8 y manteniendo el mismo nivel de confianza de 95%, se tendrá:
µ = X ± tα/2 s/ n

µ = 32.44 ± (2.228) x 3.8/ 11


32.44 ± 2.6
Y con la ecuación 5.6 se hace la estimación del % de precisión que tiene la
media X 1a de la muestra de tamaño 11 con respecto al parámetro µ.

Φr (%) = (Φ / X ) 100
Φr = (2.6 / 32.44) x100 = 8.0 (%)