Está en la página 1de 20

MaMaEuSch

Management Mathematics for European Schools http://www.mathematik.unikl.de/ mamaeusch

Poblacin y muestra. Tcnicas de muestreos o e


Paula Lagares Barreiro* Justo Puerto Albandoz* MaMaEuSch** Management Mathematics for European Schools 94342 - CP - 1 - 2001 - 1 - DE - COMENIUS - C21

Universidad de Sevilla Este proyecto ha sido llevado a cabo con ayuda parical de la Comunidad Europea en el marco del programa Scrates. El contenido del proyecto no reejy necesariamente la posicin de la Comunidad Europea, o o ni implica ninguna responsabilidad por su parte.
**

Indice general
1. Poblacin y muestra. Tcnicas de muestreo o e 1.1. Motivos para la realizacin de un muestreo. Consideraciones o 1.2. Tcnicas de muestreo . . . . . . . . . . . . . . . . . . . . . . e 1.3. Muestreo aleatorio con y sin reemplazamiento . . . . . . . . 1.4. Muestreo estraticado . . . . . . . . . . . . . . . . . . . . . 1.5. Muestreo por conglomerados . . . . . . . . . . . . . . . . . 1.6. Muestreo sistemtico . . . . . . . . . . . . . . . . . . . . . . a 1.7. Otros tipos de muestreo . . . . . . . . . . . . . . . . . . . . 2. Un ejemplo de aplicacin de las tcnicas de muestreo o e 2 2 4 5 7 9 10 11 13

necesarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

Cap tulo 1

Poblacin y muestra. Tcnicas de o e muestreo


Vamos a ampliar en este cap tulo lo que ya vimos al principio de Estad stica Descriptiva, incluyendo ahora la denicin de algunas tcnicas de muestreo y de las nociones sucientes para ser o e capaces de decidir cul es la tcnica de muestreo mas adecuada a cada situacin. a e o Imagina por ejemplo que tu clase ha sido seleccionada como la muestra de una poblacin. El o estudio que se vaya a realizar podr ser de diferentes temas, como los siguientes: a La opinin sobre la posibilidad de organizar movidas alternativas en tu ciudad, y sobre las o propuestas de actividades a realizar en dicha movida. Un sondeo sobre la valoracin de los diferentes l o deres pol ticos. La opinin sobre el destino de un posible viaje de n de curso de los alumnos de tu nivel. o Crees que tu clase ser una buena muestra para cualquiera de estos casos? La respuesta es a que, por ejemplo, para el segundo caso, los alumnos de una clase no son la muestra adecuada. Para el primer caso, es razonable pensar que pueden aportar informacin interesante, aunque la muestra o puede resultar pequea y podr faltarle informacin (chicos de otras edades, de otros barrios...), n a o mientras que para el tercer caso, la muestra puede ser muy adecuada. Es por tanto muy importante la eleccin de una tcnica de muestreo que nos asegure que la muestra escogida es adecuada para o e el estudio que queremos realizar.

1.1.

Motivos para la realizacin de un muestreo. Considerao ciones necesarias

Imagina que vas a realizar estudios para conocer la siguiente informacin: o El porcentaje de espaoles que tiene acceso a internet. n 2

La duracin media de una determinada marca de pilas. o Para el primer caso, la poblacin a la que debes preguntar es de ms de 40 millones de personas. o a Es obvio que entrevistar a ms de 40 millones de personas supone un gran esfuerzo en varios sentidos. a Primero, de tiempo, y segundo de dinero, puesto que es necesario contratar a muchos encuestadores, pagarles viajes para que lleguen a todos los pueblos, etc. Adems, hay una dicultad aadida: es a n dif llegar a todos y cada uno de los espaoles, ya que cuando vayamos a entrevistar, habr gente cil n a que est de viaje fuera del pa habr gente que est enferma en el hospital, etc. En este caso, e s, a e por motivos econmicos, de tiempo y de dicultad de acceso a toda la poblacin, ser conveniente o o a entrevistar a una cierta parte de la poblacin, una muestra, elegida convenientemente para poder o extraer despus conclusiones a toda la poblacin. e o En el segundo caso tenemos una problemtica diferente. Para poder estudiar la duracin de una a o pila, debemos usarla hasta que se gaste, lo que nos impide volver a usar la pila. Es decir, de alguna manera destruimos este elemento de la poblacin. Si quisiramos probar todas y cada una de las o e pilas, nos quedar amos sin ellas. En este caso, de nuevo ser conveniente estudiar slo un conjunto a o de esas pilas y luego extraer conclusiones ms generales a partir del conjunto que hemos estudiado. a Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero para que podamos extraer conclusiones, es importante que elijamos bien las muestras para nuestros estudios. Por ejemplo, para el caso de el acceso a internet de los espaoles, elegir a 10 personas de 40 millones n es insuciente, no es representativo. Tampoco lo ser preguntarle, por ejemplo a 100 personas de a Madrid, o elegir a todos tus amigos y tu familia. Hay cuestiones que debemos especicar a la hora de elegir una muestra: 1. El mtodo de seleccin de los individuos de la poblacin (tipo de muestreo que se va a utilizar). e o o 2. El tamao de la muestra. n 3. El grado de abilidad de las conclusiones que vamos a presentar, es decir, una estimacin del o error que vamos a cometer (en trminos de probabilidad). e Como ya hemos dicho, la seleccin no adecuada de los elementos de la muestra provoca errores o posteriores a la hora de estimar las correspondientes medidas en la poblacin. Pero podemos eno contrar ms errores: el entrevistador podr no ser imparcial, es decir, favorecer que se den unas a a respuestas ms que otras. Puede ocurrir tambin que, por ejemplo, la persona que vayamos a ena e trevistar no quiera contestar a ciertas preguntas (o no sepa contestar). Clasicamos todos estos posibles errores de la siguiente manera: 1. Error de sesgo o de seleccin: si alguno de los miembros de la poblacin tiene ms probao o a bilidad que otros de ser seleccionados. Imagina que queremos conocer el grado de satisfaccin o de los clientes de un gimnasio y para ello vamos a entrevistar a algunos de 10 a 12 de la maana. Esto quiere decir que las personas que vayan por la tarde no se vern representadas n a por lo que la muestra no representar a todos los clientes del gimnasio. Una forma de evitar a este tipo de error es tomar la muestra de manera que todos los clientes tengan la misma probabilidad de ser seleccionados. 2. Error o sesgo por no respuesta: es posible que algunos elementos de la poblacin no o quieran o no puedan responder a determinadas cuestiones. O tambin puede ocurrir, cuando e tenemos cuestionarios de tipo personal, que algunos miembros de la poblacin no contesten o 3

sinceramente. Estos errores son, en general, dif ciles de evitar, pero en el caso de la sinceridad, se suelen incorporar cuestiones (preguntas ltro) para detectar si se est contestando a sinceramente. Despus de lo que acabamos de ver, podemos decir que una muestra es sesgada cuando no es e representativa de la poblacin. o

1.2.

Tcnicas de muestreo e

Ya hemos hecho referencia a la importancia de la correcta eleccin de la muestra para que sea o representativa para nuestra poblacin pero cmo clasicamos las diferentes formas de elegir una o o muestra? Podemos decir que hay tres tipos de muestreo: 1. Muestreo probabil stico: es aquel en el que cada muestra tiene la misma probabilidad de ser elegida. 2. Muestreo intencional u opintico: en el que la persona que selecciona la muestra es quien a procura que sea representativa, dependiendo de su intencin u opinin, siendo por tanto la o o representatividad subjetiva. 3. Muestreo sin norma: se toma la muestra sin norma alguna, de cualquier manera, siendo la muestra representativa si la poblacin es homognea y no se producen sesgos de seleccin. o e o Nosotros siempre haremos muestreo probabil stico, ya que en caso de elegir la tcnica adecuada, e es el que nos asegura la representatividad de la muestra y nos permite el clculo de la estimacin a o de los errores que se cometen. Dentro del muestreo probabil stico podemos distinguir entre los siguientes tipos de muestreo: Muestreo aleatorio con y sin reemplazo. Muestreo estraticado. Muestreo por conglomerados. Muestreo sistemtico. a Otros tipos de muestreo. Imagina ahora que ya has seleccionado una muestra de un Centro de Enseanza Secundaria n (CES) en el que hay 560 alumnos. Has elegido una muestra de 28 alumnos para conocer si tienen internet en casa. Pero, qu signica elegir a 28 de 560? Qu proporcin de la poblacin ests e e o o a entrevistando? Y a la hora de obtener conclusiones sobre la poblacin a cuntos alumnos de la o a poblacin total representa cada uno de los de la muestra? o Para calcular la proporcin de alumnos que estamos entrevistando, dividimos el tamao de la o n muestra entre el de la poblacin: 28/560 = 0,05, lo que quiere decir que estamos pasando la encuesta o al 5 % de la poblacin. o Ahora vamos a calcular a cuntos individuos representa cada uno de los elementos de la muestra. a Hacemos la divisin contraria, dividimos el nmero de individuos de la poblacin entre los de la o u o 4

muestra: 560/28 = 20, lo que querr decir que cada uno de los elementos de la muestra representa a a 20 alumnos del CES. Los dos conceptos que acabamos de ver tienen la siguiente denicin formal: o 1. Factor de elevacin: es el cociente entre el tamao de la poblacin y el tamao de la o n o n u o muestra, N . Representa el nmero de elementos que hay en la poblacin por cada elemento n de la muestra. 2. Factor de muestreo: es el cociente entre el tamao de la muestra y el tamao de la poblacin n n o n . Si se multiplica por 100, obtenemos el porcentaje de la poblacin que representa la muestra. o N

1.3.

Muestreo aleatorio con y sin reemplazamiento

Ya hemos comentado que en caso de querer hacer muestreo de manera que la muestra sea representativa, debemos realizar muestreo probabil stico. Cmo har para seleccionar 28 alumnos de o as 560 dentro de un CES para que tuvieran todos la misma probabilidad de entrar en la muestra? Lo ms sencillo ser hacer un sorteo para elegir 28, es decir, escogerlos al azar, as todos tendr las a a an mismas posibilidades de estar en la muestra. Este proceso de seleccin corresponde a un muestreo aleatorio. Diremos que un muestreo es o aleatorio cuando, el proceso de seleccin de la muestra garantice que todas las muestras posibles o que se pueden obtener de la poblacin tienen la misma probabilidad de ser elegidas, es decir, todos o los elementos de la poblacin tienen la misma posibilidad de ser seleccionados para formar parte de o la muestra. Cuando un elemento es seleccionado, y hemos medido las variables necesarias para el estudio y puede volver a ser seleccionado, se dice que hacemos un muestreo aleatorio con reemplazamiento o reposicin. Generalmente recibe el nombre de muestreo aleatorio simple. o En caso de que el elemento no vuelva a formar parte de la poblacin de manera que no puede o volver a ser seleccionado se dice que se ha obtenido la muestra mediante un muestreo aleatorio sin reposicin o reemplazamiento. En algunos libros, este mtodo recibe tambin el nombre de muestreo o e e irrestrictamente aleatorio. Para nuestro ejemplo al elegir la muestra entre los 560 alumnos del CES, si vamos a preguntar por el hecho de que posean internet en casa, no nos interesa preguntarle dos veces a la misma persona, luego una vez elegido un elemento de la muestra no queremos volverlo a seleccionar. Realizar amos pues un muestreo aleatorio sin reposicin o sin reemplazamiento. o Aunque los dos mtodos son diferentes, cuando el tamao de la poblacin es innito, o tan e n o grande que puede considerarse innito, ambos mtodos nos llevarn a las mismas conclusiones. e a Sin embargo, si la fraccin de muestreo n/N es mayor que 0,1 (muestreamos ms del 10 % de la o a poblacin) la diferencia entre las conclusiones que se obtienen pueden ser importantes. o Al preguntar en nuestro ejemplo si los alumnos tienen o no internet en casa, nos interesa conocer tanto el nmero de alumnos que tiene internet como la proporcin que eso supone dentro del u o centro. Estos dos valores, igual que la media para otros casos (por ejemplo si preguntamos por la altura), son los parmetros ms calculados y que habitualmente queremos estimar. Para el caso del a a muestreo aleatorio tanto con reposicin como sin reposicin, estos estimadores vienen dados por las o o expresiones:

Total: X=N

i=1

Xi . n

Media: X=

i=1

Xi . n Pi . n

Proporcin: o
n

P =
i=1

La proporcin ser la media de una variable que toma valores cero o uno. En las anteriores o a expresiones: Xi es el valor de la variable que estamos estudiando. N es el tamao poblacional. n n es el tamao muestral. n Pi es una variable que toma los valores 0 1. o La estimacin del error para estos estimadores ser o a: Total: Para el muestreo con reposicin: o V (X) = N 2 Para el muestreo sin reposicin: o V (X) = N 2 (1 Media: Para el muestreo con reposicin: o V (X) = Para el muestreo sin reposicin: o V (X) = (1 Proporcin: o Para el muestreo con reposicin: o V (P ) = Para el muestreo sin reposicin: o V (P ) = (1 n PQ ) . N n1 PQ . n1 n S2 ) . N n S2 . n n S2 ) . N n S2 . n

1.4.

Muestreo estraticado

Imagina ahora que queremos hacer una estudio para saber a qu dedican su tiempo libre las e personas que viven en tu ciudad. Todos sabemos que los ancianos no realizan el mismo tipo de actividades que los jvenes, ni tampoco que las personas de mediana edad, como por ejemplo tus o padres. Nos interesar entonces que toda esta informacin que tenemos de antemano nos ayude a o a construir una muestra ms signicativa. De hecho, nos interesa que todos esos colectivos estn a e representados en nuestra muestra. A los colectivos que hemos denido, en este caso por edad, los llamaremos estratos. Lo que haremos ser dividir nuestra muestra de manera que haya represena tantes de todos los estratos. Vamos a denir rigurosamente la manera de hacer un muestreo en este caso. Consideramos que tenemos la poblacin de tamao N dividida en k subpoblaciones de tamaos o n n N1 , N2 , . . . , Nk . Dichas subpoblaciones son disjuntas y cumplen que N1 + N2 + + Nk = N . Cada una de las subpoblaciones se denominan estratos. Si deseamos obtener una muestra de tamao n de n la poblacin inicial, seleccionamos de cada estrato una muestra aleatoria de tamao ni de manera o n que n1 + n2 + + nk = n. Qu ventajas e inconvenientes presenta el muestreo estraticado? Las vemos a continuacin. e o Ventajas: Podemos tener informacin con ms precisin dentro de las subpoblaciones sobre la caraco a o ter stica objeto del estudio. Podemos aumentar la precisin de los estimadores de las caracter o sticas de toda la poblacin. o Inconvenientes: La eleccin del tamao de las muestras dentro de cada estrato para que el total sea n. o n La divisin en estratos en algunas poblaciones puede no ser sencilla. o En general, el muestreo estraticado proporciona mejores resultados que el muestreo aleatorio, mientras ms diferentes sean los estratos entre s y ms homogneos internamente. a a e Podemos considerar 3 mtodos para distribuir el tamao de la muestra entre los estratos: e n 1. Proporcionalmente al tamao de cada estrato, es decir, si tomamos el estrato j-simo de n e tamao Nj , entonces una muestra de dicho estrato ser de tamao n (Nj /N ), siendo N el n a n total de la poblacin y n el tamao de la muestra. o n 2. Proporcionalmente a la variabilidad de la caracter stica que estamos considerando en cada estrato. Por ejemplo, si conocemos que la varianza en la altura de los alumnos es de 15 cm y en las alumnas es de 5 cm, la proporcin de los alumnos es 3 a 1 y la muestra deber guardar o esa proporcin. o 3. Se asigna el mismo tamao a cada estrato. Como consecuencia se favorece a los estratos ms n a pequeos y se perjudica a los grandes en cuanto a precisin. n o

Para el caso del muestreo estraticado, los principales estimadores vendr dados por las siguan ientes expresiones: Total:
k

X=
h=1

Nh X h .

Media:
k k

X=
h=1

wh X h =
h=1

Nh xh . N

Proporcin: o
k

P =
h=1

wh Ph ,

donde X h es la media muestral de la variable X en el estrato h. Nh es el tamao del estrato h. n N es el tamao poblacional. n nh es el tamao muestral en el estrato h. n n es el tamao muestral. n Ph es la proporcin muestral de la variable en el estrato h. o y la estimacin del error que cometemos al estimar los parmetros poblacionales viene dado por: o a Total:
k

V (X) =
h=1

2 Nh (1 fh )

2 Sh , nh

con nh fh = Nh Media:
k

2 Sh

1 nh = n h 1 nh

nh 2 Xhi xh . i=1

V (X) =
h=1

2 wh (1 fh )

2 Sh , nh

donde wh , fh y Proporcin: o

2 Sh

tienen los mismos signicados que antes.


k

V (P ) =
h=1

2 wh (1 fh )

Ph Qh , nh 1

donde Qh = 1 Ph . 8

1.5.

Muestreo por conglomerados

Nos planteamos hacer un estudio de la altura de los alumnos de Secundaria de tu ciudad. En lugar de hacer un muestreo de todos los chicos de tu ciudad podr amos plantearnos elegir algunos barrios, ya que con respecto a la altura, los barrios son como pequeas poblaciones comparables n a la ciudad. En este caso podemos simplicar la eleccin de la muestra al elegir los barrios sin o perder precisin? La respuesta es que en este caso, podr o amos elegir barrios y analizar las alturas de los estudiantes de cada barrio sin perder precisin. Vamos a ver el mtodo que nos lo permite. o e En el muestreo por conglomerados, la poblacin se divide en unidades o grupos, llamados cono glomerados (generalmente son unidades o reas en los que se ha dividido la poblacin), que deben a o ser lo ms representativas posible de la poblacin, es decir, deben representar la heterogeneidad de a o la poblacin objeto del estudio y ser entre s homogneos. o e El motivo para realizar este muestreo es que a veces resultar demasiado costoso realizar una a lista completa de todos los individuos de la poblacin objeto del estudio, o que cuando se terminase o de realizar la lista no tendr sentido la realizacin del estudio. a o El principal inconveniente que tiene es que si los conglomerados no son homogneos entre s la e , muestra nal puede no ser representativa de la poblacin. o Suponiendo que los conglomerados sean tan heterogneos como la poblacin, en relacin a las e o o variables estudiadas, y que entre s sean homogneos, para obtener una muestra bastar con se e a leccionar algunos conglomerados. En este caso se habla de muestreo por conglomerados de una etapa. El muestreo por conglomerados tiene la ventaja de simplicar la recogida de las informaciones muestrales. Veamos ahora la expresin de los estimadores cuando trabajamos con esta tcnica de muestreo. o e Total: X=M Media: X= Proporcin: o P =
n i=1 Ai , n i=1 Mi n i=1 Xi . n i=1 Mi n i=1 Xi . n i=1 Mi

donde Xi es el total de la variable X en el conglomerado i. X i es la media muestral de la variable X en el conglomerado i. N es el nmero de conglomerados de la poblacin. u o M es el tamao poblacional. n n es el nmero de conglomerados de la muestra. u Mi es el tamao del conglomerado i. n Ai es el total de una variable A, que toma el valor 0 1 en el conglomerado i, o 9

y la estimacin de los errores que cometemos al hacer estas estimaciones son los siguientes: o Total: V (X) = Media: V (X) = Proporcin: o V (P ) = N (N n) 1 M 2n n 1
n

N (N n) 1 n n1

(Xi XMi )2 .
i=1

N (N n) 1 M 2n n 1

(Xi XMi )2 .
i=1

(Pi P Mi )2 .
i=1

1.6.

Muestreo sistemtico a

Se nos puede ocurrir otra manera de muestrear. Imaginemos que en tu centro hay 560 alumnos y hemos decidido elegir una muestra de de 28 personas. En este caso el factor de elevacin ser o a de 560/28 = 20. Numeramos a los alumnos del 1 al 560. Elegimos entonces un nmero x al azar u entre 1 y 20 y ese ser el primer alumnos seleccionado, el que ocupa el lugar x. Luego tomamos el a x + 20, x + 2 20 y as sucesivamente. No es un muestreo aleatorio porque todas las muestras no son igualmente probables. Vamos a denir este tipo de muestreo. Supongamos que tenemos una poblacin que consta de N elementos, ordenados y numerados o del 1 hasta N , y deseamos obtener una muestra de tamao n. Dicha poblacin la podemos dividir n o en n subconjuntos, cada uno de ellos con v = N elementos, es decir, cada subconjunto consta de n tantos elementos como indica el factor de elevacin. o Tomamos aleatoriamente un elemento de los enumerados desde 1, 2 hasta N , y lo llamamos x0 ; n despus se toman los siguientes elementos x0 + v, x0 + 2v, x0 + 3v, x0 + 4v . . . e En caso de que v no sea entero, se redondea al entero menor, con lo que puede que algunas muestras tengan tamao n 1. Este hecho introduce una pequea perturbacin en la teor del n n o a muestreo sistemtico, que es despreciable si n > 50. a Este tipo de muestreo requiere que previamente nos hayamos asegurado de que los elementos ordenados no presentan periodicidad en las variables objeto de estudio, puesto que si hay periodicidad y el per odo est prximo al valor v, los resultados que se obtengan tendrn grandes desviaciones y a o a no tendrn validez. a El muestreo sistemtico es equivalente al muestreo aleatorio si los elementos se encuentran a enumerados de manera aleatoria. Las ventajas de dicho mtodo son: e 1. Extiende la muestra a toda la poblacin. o 2. Es de fcil aplicacin. a o Los inconvenientes que presenta son: 10

1. Aumento de la varianza si existe periodicidad en la numeracin de los elementos, producindose o e sesgo por seleccin. o 2. Problemas a la hora de la estimacin de la varianza. o Puede considerarse un caso particular del muestreo por conglomerados, estando cada uno de ellos formado por los siguientes elementos que ocupan en la lista el lugar: Primer conglomerado: 1, 1 + v, 1 + 2v, 1 + 3v, 1 + 4v, . . . Segundo conglomerado: 2, 2 + v, 2 + 2v, 2 + 3v, 2 + 4v, . . . ... v-simo conglomerado: v, 2v, 3v, 4v, . . . nv. e Seleccionar una muestra sistemtica equivale a seleccionar al azar un unico conglomerado. Para a ello es necesario que cada uno de los conglomerados denidos tengan una composicin similar a la o poblacin. o Tambin puede considerarse como un caso particular de muestreo estraticado con un nmero e u de estratos igual a n, cada uno de ellos con v elementos de manera que en cada estrato se elige un unico elemento. En el muestreo estraticado el elemento seleccionado en cada estrato es aleatorio, mientras que en el sistemtico se elige de forma aleatoria al primer elemento quedando los restantes determinados a por el factor v. Los estimadores para este tipo de muestreo son: Total:
n

X=v
i=1

Xi .

Media: X= Proporcin: o P = 1 n
n

1 n

Xi .
i=1

Pi ,
i=1

donde P es una variable que toma los valores 0 1. o

1.7.

Otros tipos de muestreo

El muestreo bietpico es un caso particular de muestreo por conglomerados en el que en la a segunda etapa no se seleccionan todos los elementos del conglomerado, sino que se seleccionan un determinado nmero de elementos de cada conglomerado de manera aleatoria. Los conglomerados u de primera etapa se denominan unidades primarias, los de segunda etapa, secundarias. El muestreo polietpico es una generalizacin del anterior, de manera que cada conglomerado a o puede estar formado a su vez por otros conglomerados y as sucesivamente en varias etapas. 11

En general, para realizar estudios complejos se utilizan los conceptos de estraticacin, conglomo erados y muestreo aleatorio. Por ejemplo, la poblacin de un pa se podr dividir en conglomerados o s a (provincias, municipios, barrios) que pueden ser bastante heterogneos internamente (por ejemplo, e para estudiar la renta per cpita), pero bastante homogneos entre s Luego es necesario clasicar a e . estas unidades en estratos homogneos (unidades primarias, por ejemplo los barrios). Cada una de e estas unidades primarias se divide en nuevas unidades (bloques de casas) llamadas secundarias, que se dividen en las casas concretas. La muestra se tomar a: 1. Seleccionando una muestra estraticada, de cada estrato (barrios), se toma al menos uno. 2. Se eligen al azar varios bloques de casas dentro de cada barrio seleccionado. 3. Se toman aleatoriamente una o varias casas dentro de los bloques seleccionados.

12

Cap tulo 2

Un ejemplo de aplicacin de las o tcnicas de muestreo e


Hemos decidido realizar un estudio en un Centro de Enseanza Secundaria. Queremos conocer n datos sobre el nmero de alumnos que son zurdos del centro, del nmero de alumnos que tienen u u internet en casa, de la altura de los alumnos del centro y de la paga que reciben semanalmente. El hecho de estudiar el nmero de zurdos de un centro es una informacin util para el propio u o centro, ya que ste debe disponer del equipamiento adecuado para ellos, por ejemplo, sillas de pala e adaptadas. La conexin a internet en casa es ya, en estos tiempos, un dato fundamental. Esta informacin o o puede ser utilizada tanto para sondear la posibilidad de ofrecerle al alumno material a travs de e internet, tanto para conocer el potencial acceso de stos a material didctico en la web. e a El estudio de la altura es un clsico. Es interesante, de cualquier forma, conocer si realmente la a altura evoluciona con los aos y los espaoles de hoy son ms altos. n n a La paga es un dato social relevante. Es tambin interesante conocer de qu dinero disponen e e habitualmente los chicos de edades adolescentes para comprender a qu dedican su tiempo. e Con estas premisas, decidimos hacer un muestreo para poder obtener conclusiones sobre todos los alumnos del CES sin tener que preguntar a todos y cada uno de ellos. La informacin de la que o partimos es de la distribucin de alumnos por grupos y niveles en el centro: o 1o 2o 3o 4o 1o 2o A 33 20 20 27 33 30 B 20 15 15 27 28 34 C 30 26 25 30 32 D E Total 53 65 75 79 145 127

ESO ESO ESO ESO Bach Bach

14 31 31 23

Luego estamos trabajando con una poblacin de 544 alumnos de un Instituto de Enseanza o n Secundaria.

13

Partimos de una premisa, vamos a utilizar un tamao de muestra de alrededor de 60 alumnos, n que es el mximo que se nos permite y que nos parece suciente para el estudio que vamos a realizar. a Ya podemos obtener la primera informacin entonces, nuestra fraccin de muestreo ser o o a 60 n = = 0,1102, N 558 es decir, vamos a muestrear aproximadamente un 11 % de la poblacin. Podemos calcular nuestra o factor de elevacin, que ser o a f= N 544 = = 9,1, n 60 o lo que es lo mismo, cada alumno entrevistado representa aproximadamente a 9 compaeros. n Ahora tenemos que decidir qu mtodo utilizamos para muestrear para las diferentes carace e ter sticas que vamos a estudiar. Vamos a llamarlas de la siguiente manera: E= X representar a la altura. a Y representar a la paga. a Z representar a la variable ser zurdoque valdr 1 en caso de serlo y 0 en caso de ser diestro. a a I representa a la variable tener internet en casaque valdr 1 en caso de que se tenga internet a en casa y 0 en caso contrario. Vamos a diferenciar dos casos de entre las 4 variables. Lo primero que nos hacemos es una pregunta: tenemos la poblacin dividida en niveles y en grupos podemos considerar que esta o divisin tiene inuencia en alguna de estas variables? Es decir, podemos considerar que en cada o nivel, por ejemplo, la media de las alturas podr variar? La respuesta a esta pregunta es que por a lgica, s que lo har. A priori, podemos suponer que la edad es una variable que tiene una inuencia o a importante para la altura. Y para la paga? Pues tambin la edad es importante, puesto que a todos e nos han ido aumentando la paga conforme hemos ido creciendo. Ocurre lo mismo con el ser zurdo? Pues no, cuando uno es zurdo, lo es desde que nace, luego la edad no tiene ninguna inuencia. Igual ocurre con el hecho de tener internet en casa. Nuestra tcnica de muestreo elegida ser pues, e a diferente para estos dos grupos de casos. Caso I: Variables paga y altura Ya hemos visto que tenemos la poblacin dividida por cursos y por grupos. Para nosotros, la o divisin en cursos es una divisin por estratos porque los cursos son homogneos dentro de ellos o o e con respecto a la edad (y podemos pensar que tambin con respecto a la paga y a la altura), y e como hemos visto que la edad tiene inuencia en nuestras dos variables, tiene sentido pensar que nos interesa que haya representantes de todos los estratos en nuestra muestra. Luego en estos casos, nuestra eleccin es un muestreo aleatorio estraticado. o Lo siguiente que debemos decidir es el tamao muestral dentro de cada uno de los estratos, es n decir, la ajacin. o Tenemos 6 estratos con los siguientes tamaos: n

14

Estrato 1o de ESO (estrato 1) 2o de ESO (estrato 2) 3o de ESO (estrato 3) 4o de ESO (estrato 4) o 1 de Bachillerato (estrato 5) 2o de Bachillerato (estrato 6)

Tamao n N1 = 53 N2 = 65 N3 = 75 N4 = 79 N5 = 145 N6 = 127

Lo ms lgico en este caso es utilizar ajacin proporcional, es decir, hacemos que los tamaos de a o o n los estratos guarden la mismas proporciones que los tamaos de los estratos. Calculamos entonces n el tamao de la muestra en cada estrato a travs de la siguiente frmula: n e o Ni , N luego obtenemos los siguientes tamaos muestrales: n 53 n1 = 60 544 = 5,84 luego tomamos n1 = 6, 65 n2 = 60 544 = 7,16 luego tomamos n2 = 8, 75 n3 = 60 544 = 8,27 luego tomamos n3 = 8, 79 n4 = 60 544 = 8,71 luego tomamos n4 = 8, 145 n5 = 60 544 = 15,99 luego tomamos n5 = 16, n6 = 60 127 = 14,00 luego tomamos n6 = 14, 544 donde los redondeos se han hecho para mantener el tamao muestral 60 que hab n amos acordado. Luego ya tenemos los tamaos muestrales que necesitamos y podemos hacer un muestreo aleaton rio dentro de cada estrato para seleccionar el nmero de alumnos que indica el correspondiente u tamao muestral del estrato. n Nuestros datos son los siguientes: Para la altura, obtuvimos: ni = n Estrato Estrato Estrato Estrato Estrato Estrato 1 2 3 4 5 6 165 157 168 164 175 190 161 161 165 171 173 178 153 168 175 177 161 194 150 162 175 163 158 183 151 165 165 170 175 165 153 171 163 165 164 170

169 165 160 158 176

164 165 175 161 173

158 168

171 183

175 173

170 183

187 174

168 177

170

185

Y para la paga: Estrato Estrato Estrato Estrato Estrato Estrato 1 2 3 4 5 6 10 0 5 12 5 12 0 5 8 6 10 10 3.5 0 8 5 12 9 0 15 0 12 15 6 0 0 20 12 10 8 3 3 5 6 12 9.4

2 10 0 30 15

0 10 0 12 0

30 20

10 10

6 15

5 10

10 0

21 0

40

15

Vamos ahora a proceder a hacer las estimaciones. Lo primero que hacemos es calcular las medias de los diferentes estratos, que nos van dando informacin de cmo se comportan los diferentes o o estratos. Posteriormente, calcularemos la estimacin de la media de altura y de paga de los alumnos o

15

del centro y la acompaaremos de la estimacin del error cometido al realizar dicha estimacin. n o o Hacemos el proceso independientemente para cada una de las dos variables: Para la altura tenemos: Estrato 1 2 3 4 5 6 Media x1 = 155,5 x2 = 164,625 x3 = 167,625 x4 = 168,125 x5 = 169,3125 x6 = 177,642857 Cuasivarianza 2 Sx1 = 36,7 2 Sx2 = 21,4107 2 Sx3 = 22,5535 2 Sx4 = 36,6964 2 Sx5 = 81,6958 2 Sx6 = 67,478

A primera vista ya observamos un resultado curioso. La media es creciente segn aumentamos u de curso. Esto nos lleva a pensar que la eleccin de un muestreo estraticado ha sido adecuada para o este caso. Pasamos a calcular ahora media y cuasivarianza para la paga por estratos: Estrato 1 2 3 4 5 6 Media y 1 = 2,75 y 2 = 3,125 y 3 = 8,25 y 4 = 6,625 y 5 = 15,1875 y 6 = 8,8857 Cuasivarianza 2 Sy1 = 4,026 2 Sy2 = 26,4107 2 Sy3 = 33,3571 2 Sy4 = 25,4107 2 Sy5 = 101,2291 2 Sy6 = 35,229

Ahora calculamos la media estimada a partir de la muestra completa y la estimacin del error o en trminos de la estimacin de la varianza para las dos variables que estamos estudiando. Para la e o altura:
6 6

X=
h=1

wh xh =
h=1

Nh 53 65 75 79 xh = 155,5 + 164,625 + 167,625 + 168,125 N 544 544 544 544

145 127 169,3125 + 177,642857 = 168,9463. 544 544 La expresin de la varianza es o +


k

V (X) =
h=1

2 wh (1 fh )

2 Sh . nh

Para nuestro caso Estrato 1 2 3 4 5 6 wh 53 = 0,095 544 65 544 = 0,1194 75 544 = 0,1344 79 544 = 0,1415 145 544 = 0,2598 127 544 = 0,2276
2 wh 0.009 0.014 0.018 0.02 0.0675 0.0518

fh 6 = 0,1132 53 8 65 = 0,123 8 75 = 0,1066 8 79 = 0,1012 16 145 = 0,1103 14 127 = 0,1102

1 fh 0.8868 0.8769 0.8934 0.8988 0.8897 0.8898

16

Ahora sustituimos estas cantidades en la expresin de la estimacin de la varianza y nos queda o o


k 2 36,7 21,4107 22,5535 Sh = 0,009 0,8868 + 0,014 0,8769 + 0,018 0,8934 nh 6 8 8

V (X) =
h=1

2 wh (1 fh )

+0,02 0,8988

36,6964 81,6958 64,478 + 0,0675 0,8897 + 0,0518 0,8898 = 0, 728. 8 16 14

Luego para el caso de la altura ya tenemos nuestras estimaciones. La altura media estimada es 168.9463 y calculamos que cometemos un error de 0.728. Pasamos ahora a hacer los mismos clculos para la paga. Empezamos por calcular la media a estimada:
6 6

Y =
h=1

wh y h =
h=1

53 65 75 79 Nh yh = 2,75 + 3,125 + 8,25 + 6,625 N 544 544 544 544

145 127 15,1875 + 8,8857 = 8,8633. 544 544 La estimacin de la varianza la podemos calcular directamente ya que los valores de wh y fh o son los mismos +
k

V (Y ) =
h=1

2 wh (1 fh )

2 Sh 26,4107 33,3571 4,026 + 0,014 0,8769 + 0,018 0,8934 = 0,009 0,8868 nh 6 8 8

+0,02 0,8988

25,4107 101,2291 35,229 + 0,0675 0,8897 + 0,0518 0,8898 = 0,666. 8 16 14

Caso II: Variables Ser zurdo y Tener internet en casa Ahora queremos estudiar las variables ser zurdo y tener internet en casa. Es obvio que la divisin en estratos no es efectiva en este caso, as que debemos pensar en otro tipo de tcnica de o e muestreo. Seguimos queriendo muestrear alrededor de 60 alumnos. Podr amos pensar que frente a estas variables, los grupos en los que est dividida la poblacin se comportan como pequeas a o n poblaciones, es decir, podemos considerar que los grupos se comportan aproximadamente como todo el centro. Adems, nos resulta interesante la posibilidad de muestrear los grupos porque seleccionar a una muestra aleatoria de alumnos, localizarlos y entrevistarlos no es una tarea sencilla. Ahora bien, qu son los grupos para nosotros? Pues ya hemos dicho que interiormente se e comportan como pequeas poblaciones con respecto a nuestras variables, mientras que entre ellos n son similares. Estamos hablando de que tenemos la poblacin dividida en conglomerados, luego o para este caso aplicaremos el muestreo por conglomerados. Lo siguiente que tenemos que decidir es el nmero de grupos que vamos a muestrear. Como los u grupos no son regulares en tamao, 2 3 grupos nos asegurar estar rondando los 60. Para evitar n o an la posibilidad de muestrear dos de los grupos pequeos y que nos quede una muestra excesivamente n pequea para lo que pretendemos, decidimos seleccionar 3 grupos de entre todos los del centro. n As pues, los datos que hemos obtenido son los siguientes. Para la variable ser zurdo: 17

Grupo 1: 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0, Grupo 2: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0, Grupo 3: 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0, donde 1 signica que es zurdo y 0 que no lo es. Ahora, para la variable tener internet en casa, hemos obtenido: Grupo 1: 1 0 0 1 0 1 0 1 0 1 1 1 1 0 1 0 0 1 0 0, Grupo 2: 1 1 1 0 1 1 0 1 1 0 1 0 0 1 1 1 1 1 1 1 1 1 0, Grupo 3: 1 1 0 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 1 1 0 1 1 1 1, donde, en este caso, 1 signica que tienen internet y 0 signica que no tienen. Pasamos ahora a calcular las estimaciones del total de zurdos y de la proporcin de zurdos, o as como del total de alumnos que tienen internet en casa y la proporcin de alumnos que tienen o internet en casa. Calculamos el total y la proporcin para cada grupo y cada variable: o Grupo 1 2 3 Zurdos Total Proporcin o 3 0.15 0 0 2 0.08 Internet Total Proporcin o 10 0.5 17 0.7391 20 0.8

Ahora ya podemos calcular las estimaciones de la proporcin y del total de las variables Z e I. o Comenzamos por la variable Z: Z=M
n i=1 Zi n i=1 Mi

= 544
n i=1 Ai n i=1 Mi

3 i=1 Zi 3 i=1 Mi

= 544

5 3+0+2 = 544 = 40, 20 + 23 + 25 68

PZ =

3+0+2 5 = = 0,0735, 20 + 23 + 25 68

y ahora repetimos los clculos para la variable I: a I=M


n i=1 Ii n i=1 Mi

= 544
n i=1 Ai n i=1 Mi

3 i=1 Ii 3 i=1 Mi

= 544

47 10 + 17 + 20 = 544 = 376, 20 + 23 + 25 68

PI =

10 + 17 + 20 47 = = 0,6911. 20 + 23 + 25 68

Pasamos ahora a calcular la estimacin del error que estamos cometiendo en nuestros clculos o a para la variable ser zurdo: N (N n) 1 V (Z) = n n1
n

(Zi ZMi )2 =
i=1

21(21 3) 1 (3 0,0735 20)2 + (0 0,0735 23)2 + (2 0,0735 25)2 3 2 18

= 329,18.

V (PZ ) =

N (N n) 1 nM 2 n 1

(PZi P Mi ) =
i=1

21(21 3) 1 (3 0,0735 20)2 + (0 0,0735 23)2 + (2 0,0735 25)2 2 3 (544) 2

= 0,00111. Pasamos ahora a calcular los errores estimados para la variable tener internet en casa, N (N n) 1 n n1
n

V (I) =

(Ii IMi ) =
i=1

21(21 3) 1 (10 0,6911 20)2 + (17 0,6911 23)2 + (20 0,6911 25)2 3 2 = 1464,123.

V (PI ) =

N (N n) 1 nM 2 n 1

(PIi P Mi ) =
i=1

21(21 3) 1 (10 0,6911 20)2 + (17 0,6911 23)2 + (20 0,6911 25)2 2 3 (544) 2 = 0,00049.

19