Está en la página 1de 13

Muestreo y Distribuciones

SEMANA 1
  MUESTRALES  
 
 

 
 
 
 

   
 
 

 
 
 
 

 
 
 

 
 
 
 

 
 
 
   

[ ESTADÍSTICA INFERENCIAL ]
 

1.  MUESTREO  Y  DISTRIBUCIONES  MUESTRALES  


 
INTRODUCCION  
La  estadística  descriptiva  muestra  varios  procedimientos  para  presentar  los  resultados  de  un  
censo,  es  decir  la  numeración  completa  de  los  elementos  de  la  población.  

Aunque   ni   el   muestreo   ni   la   inferencia   estadística   pueden   sustituir   el   censo,   son   los   únicos  
medios  posibles  o  prácticos  para  poder  obtener  información  acerca  de  una  población  cuando  
el  censo  no  puede  hacerse  por  algún  motivo.  

La   importancia   del   muestreo   y   de   la   estadística   inferencial   se   derivan   del   proceso   de  


consecución   de   los   datos   que   van   a   proporcionar   la   información   deseada   acerca   de   la  
población.  Con  una  muestra,  se  utilizan  menos  recursos,  debido  a  que  solo  una  parte  de  la  
población  esta  bajo  observación,  lo  cual  resulta  bastante  beneficioso  sobre  todo  si  se  tiene  
poblaciones  grandes.    

Los  beneficios  del  muestreo  se  hacen  más  notorios  en  el  muestreo  destructivo.  Piense  por  
ejemplo   en   el   fabricante   de   bombillos   que   quiere   saber   la   vida   promedio,   en   horas,   del  
producto.   Este   fabricante   podría   solicitar   al   departamento   de   Ingeniería   la   vida   promedio  
diseñada   para   las   bombillas,   pero   para   determinar   el   tiempo   de   duración   de   las   bombillas,   se  
tendría  que  seleccionar  varias  bombillas,  instalarlas  y  registrar  el  tiempo  transcurrido  hasta  
que   se   quemen.   Si   tomamos   un   censo,   estaríamos   destruyendo   todos   los   elementos   de   la  
población  en  la  prueba,  lo  cual  no  tiene  sentido.  

Las  encuestas  de  opinión,  por  ejemplo  sobre  la  preferencia  de  un  producto,  demuestran  la  
utilidad   del   muestreo   en   contraste   con   un   censo.   Los   cambios   de   opinión   deben   ser  
reconocidos   rápidamente   si   se   espera   acomodar   las   políticas   de   venta   a   los   deseos   de   los  
clientes.  

El   número   reducido   de   unidades   elementales   en   una   muestra,   puede   implicar   que   más  
variables  auxiliares  sean  investigables.  En  un  sitio  dado,  por  el  mismo  tiempo  y  dinero,  uno  
podría   obtener   o   un   censo   del   número   de   industrias   en   una   ciudad   o   una   muestra   que  
incluiría  industrias  por  sector,  utilidades  recibidas  al  año,  principales  productos  producidos.  

Hay  cuatro  preguntas  básicas  que  es  necesario  plantear  acerca  de  las  muestras  y  del  proceso  
de  inferencia:  

1. ¿Cuáles   son   los   métodos   menos   costosos   de   muestreo   que   dan   la   mayor   seguridad  
que  las  muestras  representan  a  la  población  de  la  cual  fueron  seleccionados?  
2. ¿Cuál   es   la   mejor   forma   de   describir   la   información   muestral   a   fin   de   que   sea   útil   y  
clara?  

 
2   [ POLITÉCNICO GRANCOLOMBIANO ]
 

3. ¿Cómo   se   obtienen   conclusiones   a   partir   de   las   muestras   y   cuál   es   la   manera   de   hacer  


inferencias  acerca  de  la  población?  
4. ¿En   qué   medida   son   confiables   las   inferencias   y   conclusiones   basadas   en   la  
información  muestral?  

Temas  de  la  semana:  

• Muestreo  aleatorio  simple  


• Muestreo  estratificado  
• Muestreo  sistemático  
• Muestreo  por  conglomerados.  

Palabras  clave:  Población,  muestra,  parámetro,  estadístico,  error  de  muestreo,  muestreo  
aleatorio,  muestreo  estratificado,  muestreo  sistemático,  muestreo  de  conglomerados.    

 
1. DISEÑOS  MUESTRALES  
1.1  CONCEPTOS  FUNDAMENTALES  
POBLACIÓN:   es   un   conjunto   de   medidas   o   recuento   posible   de   todas   las   unidades   que   tienen  
una   o   varias   características   en   común.   Según   el   número   de   unidades   o   elementos   que   la  
constituyen,  la  población  puede  ser  finita  o  infinita.    

La  población  debe  estar  perfectamente  definida  en  el  tiempo  y  en  el  espacio.  Por  lo  tanto,  al  
definir   una   población,   se   debe   cuidar   que   el   conjunto   de   elementos   que   la   integran   quede  
delimitado.   Si,   por   ejemplo,   para   hacer   un   análisis   de   las   pequeñas   empresas,   se   debe  
especificar  cuáles  son    y  en  qué  período  de  tiempo  se  analizan:  pequeñas  empresas  de  la  capital  
de  país  en  el  año  2012.  

PARÁMETRO:   un   parámetro   es   un   número   determinado   que   describe   un   aspecto   de   la  


población  y  para  determinar  su  valor  es  necesario  utilizar  la  información  poblacional  completa.  
Por  ejemplo  para  determinar  si  los  hombres  o  las  mujeres  tienen  más  aptitud  para  desempeñar  
un   puesto,   es   necesario   conocer   el   puntaje   promedio   de   una   prueba   de   aptitud.   Para  
determinar  el  porcentaje  de  productos  defectuosos  en  la  producción  diaria  en  una  empresa,  se  
debe   conocer   el   porcentaje   de   productos   que   no   cumplen   las   especificaciones   en   toda   la  
producción   del   día.   El   promedio   del   puntaje   y   la   proporción   de   productos   defectuosos   son  
parámetros.  

MUESTRA:   una   muestra   es   un   subconjunto   de   la   población   que   ha   sido   seleccionada   con   una  
técnica   llamada:   diseño   de   muestreo   para   garantizar   que   la   muestra   sea   representativa   de   la  
población,   es   decir   que   las   unidades   sean   seleccionadas   aleatoriamente,   en   tal   forma   que   cada  
una  de  ellas  tenga  la  misma  probabilidad  de  ser  seleccionada.  

 
[ ESTADÍSTICA INFERENCIAL ] 3
 

ESTADISTICA:  un  estadístico  es  un  número  determinado  que  describe  un  aspecto  de  la  muestra  
y   para   encontrar   su   valor   es   necesario   utilizar   la   información   muestral.   En   los   ejemplos  
enunciados  en  la  definición  de  parámetros  los  estadísticos  correspondientes  son:  puntaje  medio  
obtenido   en   la   prueba   de   aptitud   en   las   muestras   seleccionadas   de   hombres   y   mujeres   y  
porcentaje  de  productos  defectuosos  en  una  muestra  seleccionada  de  la  producción  diaria.  

CENSO:   es   una   técnica   para   obtener   los   datos   por   medio   de   la   cual   se   cuentan   todos   los  
elementos  que  conforman  la  población  y  se  registran  sus  características.  

1.2  TIPOS  DE  ERRORES  EN  EL  MUESTREO  


1.2.1    Errores  no  muestrales  
 
El  requisito  fundamental  de  una  muestra  es  que  sea  representativa  de  la  población  que  se  trata  
de  describir.  Hay,  por  supuesto,  muchas  formas  de  obtener  una  muestra  poco  confiable.  Una  
falla   en   la   representatividad   ocurre   cuando,   por   desconocimiento   o   en   forma   inadvertida,   se  
toma   una   muestra   de   una   población   equivocada.   Muchas   veces   hemos   escuchado   encuestas  
que  dan  a  un  candidato  como  posible  ganador  en  elecciones  presidenciales,  información  que  ha  
sido   recogida   a   través   de   una   muestra   conformada   por   habitantes   de   las   clases   media   y   alta   de  
las  grandes  capitales  del  país.  El  candidato  obtuvo  el  apoyo  de  las  clases  con  menos  ingresos,  
cuyas  opciones  no  se  reflejan  en  la  encuesta.  

Otra  fuente  de  error  en  el  muestreo,  especialmente  en  las  encuestas  de  opinión  pública,  son  las  
respuestas   sesgadas.   Cuestionarios   mal   redactados   o   mal   elaborados   dan   lugar   a   respuestas  
que  no  reflejan  las  verdaderas  opiniones.  

Estos  tipos  de  error  se  llaman  errores  no  muestrales.  Incluyen  todo  tipo  de  errores   humanos  
tales   como,   errores   en   la   recolección,   análisis   o   publicación   de   datos,   un   instrumento   de  
medición  mal  calibrado  o  un  registro  del  dato  mal  escrito.  

1.2.2    Errores  muestrales  

Por  otra  parte,  aun  cuando  se  trate  de  muestras  bien  diseñadas  y  seleccionadas,  habrá  casos  en  
donde   la   muestra   no   representa   en   forma   adecuada   a   la   población   de   estudio,   simplemente  
porque  solo  representa  una  parte  de  esa  población.    En  tales  casos  la  información  contenida  en  
la   muestra   puede   dar   inferencias   incorrectas   acerca   de   la   población;   es   decir,   puede   cometerse  
un  error  al  estimar  las  características  de  la  población  sobre  la  base  de  la  información  muestral.  

Los   errores   de   esta   naturaleza,   que   representan   las   diferencias   que   pueden   existir   entre   un  
estadístico  muestral  y  el  parámetro  poblacional  que  se  esta  estimando,  reciben  el  nombre  de  
errores  muestrales.  

 
4   [ POLITÉCNICO GRANCOLOMBIANO ]
 

Un   objetivo   fundamental   del   diseño   de   muestreo   consiste   en   minimizar   tanto   los   errores  
muestrales  como  los  no  muestrales.  Los  errores  son  costosos,  no  solo  en  términos  del  tiempo  y  
del  dinero  invertido  en  la  recolección  de  las  muestras,  sino  también  en  términos  de  la  pérdida  
potencial   que   podría   provenir   de   una   decisión   errónea   tomada   a   partir   de   una   inferencia  
errónea  basada  en  esos  datos,  es  por  esto  que  trataremos  aquí  el  problema  de  determinar  el  
diseño  de  muestreo  que  minimice  con  mayor  efectividad  los  errores.  

1.3    TIPOS  DE  MUESTREO  

Se  dispone  de  dos  métodos  para  seleccionar  muestras  de  poblaciones:  el  muestreo  no  aleatorio  
o  de  juicio  y  el  muestreo  aleatorio  o  probabilístico.  

1.3.1    Muestreo  no  Aleatorio  

En   el   muestreo   no   aleatorio   o   de   juicio,   se   usa   el   conocimiento   y   la   opinión   personal   para  


identificar   los   elementos   de   la   población   que   van   a   incluirse   en   la   muestra.   Una   muestra  
seleccionada  por  muestreo  de  juicio  se  basa  en  el  conocimiento  de  la  población  por  parte  de  
alguien;  en  ocasiones  este  muestreo  sirve  como  muestra  piloto  para  decidir  como  seleccionar  
después  una  muestra  aleatoria.  

1.3.2  Muestreo  Probabilístico  

En   una   muestra   aleatoria   o   probabilística,   sabemos   que   posibilidades   existen   que   un  


elemento   de   la   población   figure   o   no   en   la   muestra.   Por   eso   se   puede   evaluar   objetivamente  
las  estimaciones  de  las  características  de  la  población  que  resultan  de  la  muestra,  es  decir,  se  
puede   describir   matemáticamente   la   objetividad   de   las   estimaciones.   Se   comenzará   la  
explicación  de  este  proceso  describiendo  cuatro  métodos  de  muestreo  aleatorio:  
 
• Muestreo  aleatorio  simple  
• Muestreo  estratificado  
• Muestreo  sistemático  
• Muestreo  por  conglomerados.  
 

Muestreo  aleatorio  simple  


Una   muestra   aleatoria   simple   es   aquella   en   la   cual   todos   los   elementos   de   la   población   a  
muestrear,  tienen  la  misma  probabilidad  de  ser  seleccionados.  

El   muestreo   se   puede   realizar   con   remplazamiento,   cuando   una   unidad   de   muestreo   es  


extraída  de  una  población  finita  y  después  de  registrar  sus  características  se  vuelve  a  dicha  
población   antes   de   extraer   la   siguiente   unidad.   Si   esto   no   se   hace,   es   decir   una   vez  
seleccionada   la   unidad   ésta   no   se   regresa   a   la   población,   se   dice   que   el   muestreo   es   sin  
remplazo.  Si  en  una  población  finita  el  muestreo  se  hace  con  remplazamiento,  esta  se  vuelve  

 
[ ESTADÍSTICA INFERENCIAL ] 5
 

una   población   infinita.   La   práctica   usual   para   muestrear   poblaciones   finitas,   es   muestrear   sin  
remplazo,   es   decir,   con   un   elemento   seleccionado   que   será   elegido   solo   una   vez.   En   el  
muestreo  simple  las  unidades  de  muestreo  individual  y  directamente  por  medio  
de  un  proceso  aleatorio  (por  medio  de  las  tablas  de  números  aleatorios).  
 
Número   Tiempo(Minutos)  
   
01   15  
  02   14  
  03   15  
04   18  
  05   19  
06   20  
 
07   13  
  08   23  
09   30  
  10   35  
  11   30  
12   27  
  13   25  
  14   26  
15   29  
 

Selección   del   muestreo   aleatorio   simple:   el   principal   requisito   para   la   aplicación   de   este  
muestreo   es   que   cada   elemento   de   la   población   sea   identificable   en   forma   clara   y   sin  
ambigüedades,  de  tal  forma  que  se  pueda  obtener  una  lista  que  permita  identificar  de  manera  
única   cada   elemento.   Cuando   ya   se   dispone   de   esta   información   y   esta   completa,   pueden  
numerarse   secuencialmente   todas   las   unidades   de   la   lista   y   puede   elegirse   una   muestra  
aplicando   un   proceso   de   selección   por   medio   de   una   tabla   de   números   aleatorios.   Se   deben  
tener  tantos  números  diferentes  de  esta  tabla  como  los  casos  que  se  desean  para  la  muestra,  
excluyendo   los   números   que   están   fuera   de   la   secuencia   de   números   correspondientes   a   la  
población.  Se  seleccionan  aquellos  elementos  que  correspondan  a  los  números  aleatorios  que  
se  obtuvieron.  

Este   procedimiento   se   muestra   con   el   siguiente   ejemplo:   suponga   una   población   de   quince  
trabajadores  y  su  tiempo  (en  minutos)  en  la  realización  de  un  proceso.  

Con  el  objeto  de  seleccionar  una  muestra  aleatoria  de  5  trabajadores  se  procede  de  la  siguiente  
forma:  

1.    Se  hace  una  enumeración  de  cada  uno  de  los  elementos  de  la  población,  en  este  caso  de  cada  
trabajador.  

 
6   [ POLITÉCNICO GRANCOLOMBIANO ]
 

2.    Para  la  selección  de  los  elementos  que  van  a  conformar  la  muestra,  se  utiliza  la  generación  de  
números  aleatorios  de  Excel.  

 
Para  esto  se  elige  la  función  fx,    y  aleatorio  entre:  

 
Aquí  se  genera  el  primer  número  aleatorio  y  el  resultado  se  extiende  hasta  obtener  los  cinco  
números  generados:  

 
[ ESTADÍSTICA INFERENCIAL ] 7
 

 
Los  valores  aleatorios  corresponden  a  los  datos:  

Número   Tiempo  
(minutos)  
 
01   15  
02   14  
03   15  
04   18  
05   19  
06   20  
07   13  
08   23  
09   30  
10   35  
11   30  
12   27  
13   25  
14   26  
15   29  
 

Muestreo  Estratificado  
Este   es   un   segundo   tipo   de   diseño   de   muestreo,   que   frecuentemente   proporciona   una  
cantidad   de   información   a   menor   costo   que   el   muestreo   aleatorio   simple.   Este   diseño   se  

 
8   [ POLITÉCNICO GRANCOLOMBIANO ]
 

recomienda   cuando   la   población   la   conforma   un   conjunto   de   grupos   heterogéneos  


(distintos).  

El   proceso   de   estratificación   requiere   que   la   población   se   divida   en   grupos   o   estratos   con  


elementos   que   son   homogéneos   dentro   de   los   estratos,   donde   cada   elemento   tiene   una  
característica  tal  que  no  le  permite  pertenecer  a  otro  estrato.  

Para   la   selección   de   una   muestra   estratificada   se   usa   el   procedimiento   de   muestreo  


proporcional,   que   divide   el   tamaño   de   la   muestra   en   forma   proporcional   al   tamaño   de   los  
estratos.    

El  primer  paso  en  la  selección  consiste  en  la  especificación  clara  de  cada  estrato,  asociando  a  
cada  elemento  de  la  población  uno  y  solo  un  estrato.  Una  vez  especificados  los  estratos,  se  
puede  seleccionar  una  muestra  aleatoria  en  cada  estrato.    

Usando   el   muestreo   proporcional,   el   tamaño   de   la   muestra   n   se   divide   en   un   tamaño   de  


muestra   para   cada   uno   de   los   estratos   de   manera   que     n   =   n1   +   n2       +….+   nk   con   cada   ni  
determinada  por  la  siguiente  fórmula:    

 
!!
 
!! = !  
!
 

Donde  Ni  es  el  tamaño  del  estrato  i    y  

N1+N2+……..+  Nk  =  N  

Donde  N  es  el  tamaño  de  la  población.  

Ejemplo:  suponga  que  la  población  de  los  tiempos  de  los  trabajadores  esta  conformada  por  
los  siguientes  valores:  

19   21   35   15   21   18  
17   19   20   32   22   21  
34   27   21   19   20   17  
21   34   20   20   17   19  
25   30   15   19   19   23  
28   19   17   18   23   20  
32   18   21   30   15   21  
25   15   35   31   16   22  
32   25   16   20   25   30  
25   28   18   25   32   18  
N=60    y  se  quiere  seleccionar  una  muestra  estratificada  de  20  elementos:  

 
[ ESTADÍSTICA INFERENCIAL ] 9
 

1.  Se  divide  la  población  en  tres  estratos  de  la  siguiente  forma:  

Estrato  1:  trabajadores  que  gastan  menos  de  20  minutos  

Estrato  2:  trabajadores  que  gastan  entre  20  y  30  minutos  

Estrato  3:  trabajadores    que    gastan    más  de  30  minutos.  

Los  valores  que  conforman  cada  uno  de  los  estratos  son:  

Estrato  1:  

Número   Tiempo   Número   Tiempo   Número   Tiempo  


1   19   9   16   17   15  
2   17   10   18   18   16  
3   19   11   15   19   18  
4   19   12   19   20   17  
5   18   13   19   21   19  
6   15   14   18   22   18  
7   15   15   17      
8   17   16   19      
Estrato  2:  

Número   Tiempo   Número   Tiempo   Número   Tiempo  


1   21   10   20   19   20  
2   25   11   21   20   23  
3   28   12   20   21   25  
4   25   13   21   22   21  
5   25   14   20   23   23  
6   21   15   20   24   20  
7   27   16   25   25   20  
8   25   17   21   26   21  
9   28   18   22      
Estrato  3:  

Número   Tiempo   Número   Tiempo   Número   Tiempo  


1   34   5   30   9   30  
2   32   6   35   10   31  
3   32   7   35   11   32  
4   34   8   32   12   30  
El  tamaño  de  muestra  correspondiente  a  cada  estrato  es:  
!! !!
n1    =  ! !
= 20 !"   = 7,3 = 7  

 
10   [ POLITÉCNICO GRANCOLOMBIANO ]
 

!! !"
n2    =  ! !
= 20 !"   = 8,6 = 9  
!! !"
n3    =  ! !
= 20 !"   = 4  

Se  utiliza  la  generación  de  números  aleatorios  utilizando  la  función  de  Excel  en  cada  estrato:    

Estrato  1  

Número   Número  aleatorio   Tiempo  


1   15   17  
2   1   19  
3   16   19  
4   20   17  
5   22   18  
6   17   15  
7   10   18  
Estrato  2  

Número   Número  aleatorio   Tiempo  


1   15   20  
2   11   21  
3   4   25  
4   5   25  
5   22   21  
6   12   20  
7   11   21  
8   14   20  
9   16   25  
 

Estrato  3  

  Número  aleatorio   Tiempo  


 
1   2   32  
2   8   32  
3   9   30  
4   1   34  
 

 
[ ESTADÍSTICA INFERENCIAL ] 11
 

Muestreo  Sistemático  
El   muestreo   sistemático   o   en   serie,   se   usa   frecuentemente   por   ser   simple,   directo   y  
económico.   Consiste   en   seleccionar   uno   en   uno,   los   elementos   de   la   muestra   en   un   orden  
determinado,  con  un  comienzo  aleatorio.  

La  fracción  de  muestreo  se  establece  con  la  relación:  


!
F  =   !  

Suponga  que  N=  1000    y    n  =  100  entonces  la  fracción  de  muestreo  es:  
!"""  
F=   !"" = 10  

El  primer  elemento  se  selecciona  aleatoriamente  en  el  intervalo  0  a  10,  por  ejemplo  resulto  
seleccionado  el  número  5,  el  segundo  elemento  que  se  seleccionará  será  15,  luego  25  y  así  
sucesivamente,  ya  que  la  fracción  de  muestreo  es  10.  

Muestreo  por  conglomerados  


El  muestreo  por  conglomerados  se  refiere  al  procedimiento  de  dividir  la  población  en  grupos  
de   tal   forma   que   dentro   de   ellos   sean   lo   más   heterogéneos   posible   y   entre   ellos   sean  
homogéneos,  lo  contrario  al  muestreo  estratificado.  

En   general,   en   el   muestreo   por   conglomerados   se   obtendrán   los   resultados   más   exactos,  


cuando   cada   conglomerado   tenga   la   mezcla   más   variada   posible   y   al   mismo   tiempo   se  
asemejen  lo  más  posible  entre  sí.  

Un   ejemplo   del   muestreo   por   conglomerados   es   cuando   se   quiere   medir   el   rendimiento  


académico   de   los   universitarios   en   Colombia.     En   este   caso   cada   Universidad   se   puede  
considerar  como  un  conglomerado  en  donde  las  características  son  heterogéneas  dentro  del  
conglomerado,  es  decir  encontramos  estudiantes  con  rendimiento  alto,  medio,  bajo  y  entre  
conglomerados   se   encuentran   condiciones   homogéneas   o   similares   para   ser   comparables.  
De   cada   Universidad   se   selecciona   un   grupo   de   estudiantes   hasta   conformar   la   muestra  
definitiva.  

 
 
 
 

 
12   [ POLITÉCNICO GRANCOLOMBIANO ]
 

BIBLIOGRAFÍA  
FREUND,   John   E.,   MILLER,   Irwin   y   MILLER,   Marylees.   Estadística   Matemática     con  
aplicaciones.  6ed.  Madrid  Prentice  Hall,  2000.  
 
GUTIERREZ,   Humberto   y     DE   LA   VARA,   Román.   Control   estadístico   de   Calidad   y   Seis   Sigma  
(6s).  México:  McGraw-­‐Hill,  2005.    
 
KENNET,  Ron  S.,  y  ZACKS,  Shelemyahu.  Estadística  Industrial  Moderna.  Barcelona,    Thomson,    
2000.  
 
MONTGOMERY,  Douglas  C.  y    RUNGER,  George  C.  Probabilidad    y  Estadística  aplicadas  a  la  
Ingeniería.  2ed.  México:  Limusa,    2002.  
 
NEWBOLD.  Paul.  Estadística  para  los  Negocios  y  la  Economía.  4ed.  Madrid  Prentice  Hall,  1988.  
 
WALPOLE  Ronal,  E.,  MYERS,  Raymond  H.    y    MYERS,  Sharon  L.  Probabilidad  y  Estadística  para  
Ingenieros.    6ed.  Madrid  Prentice  Hall,  1998.  
 
 
 

 
[ ESTADÍSTICA INFERENCIAL ] 13

También podría gustarte