ESTADISTICA INDUSTRIAL | PEA ABEL UABC INVESTIGACION TECNICAS DE MUESTREO
Sesgo estadstico En estadstica se llama sesgo de un estimador a la diferencia entre su esperanza matemtica y el valor numrico del parmetro que estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado. En notacin matemtica, dada una muestra y un estimador del parmetro muestral , el sesgo es:
El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con sta es la de la consistencia: un estimador puede tener un sesgo pero el tamao de ste converge a cero conforme crece el tamao muestral. Dada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores naturales se utilizan otros corregidos para eliminar el sesgo. As ocurre, por ejemplo, con la varianza muestral. En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir de una poblacin. Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se realizase un estudio de toda la poblacin. Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la poblacin sino estimar tambin los mrgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa , pero s podemos actuar de manera que esta condicin se alcance con una probabilidad alta. En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se pueden obtener de la poblacin se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extraccin, sigue la llamada distribucin muestral MUESTREO ALEATORIO SIMPLE.
Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamao tiene igual probabilidad de ser seleccionada de la poblacin. Para obtener una muestra aleatoria simple, cada elemento en la poblacin tenga la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este mtodo pude ser reemplazado por una tabla de nmeros aleatorios. Cuando una poblacin es infinita, es obvio que la tarea de numerar cada elemento de la poblacin es infinita, es obvio que la tarea de numerar cada elemento de la poblacin es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos ms comunes de muestreo aleatorio modificado son sistemticos, estratificados y de conglomerados. Todos los individuos tienen la misma probabilidad de ser seleccionados. La seleccin de la muestra puede realizarse a travs de cualquier mecanismo probabilstico en el que todos los elementos tengan las mismas opciones de salir. Por ejemplo uno de estos mecanismos es utilizar una tabla de nmeros aleatorios, o tambin con un ordenador generar nmeros aleatorios, comprendidos entre cero y uno, y multiplicarlos por el tamao de la poblacin, este es el que vamos a utilizar. El procedimiento empleado es el siguiente:
1) Se asigna un nmero a cada individuo de la poblacin. 2) Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande. Muestreo aleatorio sistemtico Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,..., i+(n-1) k, es decir, se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k. El riesgo de este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin, ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los dos sexos. Tamao de muestra A la hora de determinar el tamao que debe alcanzar una muestra, hay que tomar en cuenta varios factores, como son, el tipo de muestreo, el parmetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello, antes de presentar algunos casos sencillos de clculo de tamao de muestra delimitaremos estos factores. Para calcular el tamao de una muestra se necesitan los siguientes factores: 1. El porcentaje de confianza con el cual se quiere generalizar los datos de muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100%, equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto, para el estudio, o debido a que en ocasiones llega a ser prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comnmente en las investigaciones sociales se busca un 95%. El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea falsa como si fuera verdadera, o a la inversa, rechazar la hiptesis verdadera por considerarla falsa. Al igual que en el caso de confianza, si se quiere eliminar el riesgo de error y considerando como 0% entonces, la muestra es del mimo tamao que la poblacin, por lo que conviene correr con cierto riesgo de equivocarse. Comnmente se acepta entre 4% y 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. NOTA. Para verificar los niveles de confianza ser necesario utilizar la siguiente tabla: NIVEL DE CONFIANZA 99.7 % 99% 98% 96% 95.45% 95% 90% 80% 68.27% 50% Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00 0.6745
Para estimar el tamao de muestra necesario para realizar una investigacin se debe de aplicar la siguiente frmula:
Donde: n= Tamao de la muestra, z= Nivel de confianza, 2,58 para el 99% p= Variabilidad positiva q= 1- p Variabilidad negativa B o e = Precisin o error admitido En caso de conocer el tamao de la poblacin, cuando la variable crtica es dicotmica o binomial, para la estimacin de proporciones poblacionales o universos considerados finitos, entonces el tamao de la muestra se determinar con la siguiente frmula: n=( z)2. N ( p) .( q)/(e)2.N+(z)2.(p).(q) sta frmula se usa para N > 30 . Donde: n= Tamao de la muestra, z= Nivel de confianza, 2,58 para el 99% p= Variabilidad positiva q= 1- p Variabilidad negativa B o e = Precisin o error admitido N = Tamao de la poblacin
n =z2. N .p.q/e2.(N-1)+(z2.p.q) sta frmula se usa para N < 30.2 (0.65) (0.35) = (6.6564) (0.2275) = 1.14331 = 67.3036 2 0.0225 0.0225 El nivel de variabilidad que se calcula para comprobar la hiptesis. A travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generadas con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido.
Muestreo sistemtico Es la eleccin de una muestra a partir de los elementos de una lista segn un orden determinado, o recorriendo la lista a partir de un nmero aleatorio determinado. Si el orden de los elementos de la lista es aleatorio, este muestreo equivale al m.a.s.. Sin embargo, si la lista es tal que elementos ms prximos tienden a ser ms semejantes respecto a la caracterstica a estudiar, entonces este tipo de muestreo puede ser ms preciso. Una empresa de publicidad desea hacer un estudio para una determinada marca de bebidas. Para ello dispone del listn telefnico de Andaluca ( supongamos 10 millones de telfonos entre fijos y mviles). Se estima que con 2000 encuestas se obtiene la fiabilidad deseada. Se elige el muestreo sistemtico como mtodo de seleccin de la muestra. Si tenemos el listn telefnico ordenado alfabticamente, este es una forma aleatoria de ordenacin. Dado que queremos 2000 encuestas, dividiremos 10.000.000 / 2.000 = 5.000. Si tomamos de ese listn un elemento cada 5.000 tendremos las 2.000 encuestas. Para decidir de qu elemento partiremos elegimos al azar un nmero entre 1 y 5000, esto lo podemos hacer con una tabla de nmeros aleatorios o con cualquier calculadora o programa de ordenador. Una vez determinado el primer elemento p, los sucesivos elementos que se tomen sern p+5000, p+2 5000, p+3 5000,..., . De esta forma se obtiene una muestra sistemticamente. Muestreo estratificado En las estadsticas, el Muestreo estratificado Es un mtodo de muestreo de una poblacin .Cuando las poblaciones varan, es conveniente tomar muestras cada su poblacin (estrato) de forma independiente. La estratificacin Es el proceso de dividir a los miembros de la poblacin en subgrupos homogneos antes del muestreo. Los estratos deben ser mutuamente excluyentes: cada elemento de la poblacin se le debe asignar a un solo estrato. Los estratos tambin deberse colectivamente exhaustiva: ningn elemento de la poblacin puede ser excluido. Luego, alazor o un muestreo sistemtico se aplica dentro de cada estrato. A menudo, esto mejora la representatividad de la muestra mediante la reduccin de errores de muestreo. Se puede producir una media ponderada que tiene menos variabilidad que la media aritmtica de una muestra simple al azar de la poblacin.
Las estrategias de muestreo estratificado 1. asignacin proporcional utiliza una fraccin de muestreo en cada uno de los estratos que es proporcional a la de la poblacin total. Por ejemplo, si la poblacin est compuesta de60% en el estrato de hombres y 40% en el estrato de las mujeres, el tamao relativo de lados muestras (tres hombres, dos mujeres) deberan reflejar esta proporcin.2. Asignacin ptima (o la asignacin desproporcionada) - Cada estrato es proporcional a la desviacin estndar de la distribucin de la variable. Muestras ms grandes se toman en los estratos con mayor variabilidad de generar la menor varianza de muestreo posible. Un ejemplo del mundo real de la utilizacin de muestreo estratificado sera para un poltico encuesta. Si las respuestas necesarias para reflejar la diversidad de la poblacin, el investigador especficamente trataran de incluir a participantes de diversos grupos minoritarios, tales como la raza o la religin, sobre la base de su proporcionalidad con la poblacin total como se mencion anteriormente. Una encuesta estratificada por lo tanto podra decir que es ms representativa de la poblacin que una encuesta de muestreo aleatorio simple o muestreo sistemtico .Del mismo modo, si la densidad de poblacin vara mucho de una regin, el muestreo estratificado se asegurar de que los clculos se pueden hacer con la misma precisin indiferentes partes de la regin, y que las comparaciones de las subregiones se pueden hacer con igual potencia estadstica. Por ejemplo, en Ontario, una encuesta realizada en toda la provincia puede usar una fraccin de muestreo ms grande en el poblado al norte menos, ya que la disparidad en la poblacin entre el norte y el sur es tan grande que una fraccin de muestre o basado en la muestra provincial en su conjunto puede dar lugar a la coleccin de slo un puado de datos desde el norte. Estratificacin aleatoria tambin se puede utilizar para mejorar la representatividad de la poblacin en un estudio. Desventajas No es til cuando no hay subgrupos similares. No se puede utilizar cuando la cantidad de datos en subgrupos de datos no es igual pero el total en un subgrupo son de igual importancia, ya queda ms importancia a los subgrupos con ms datos.
Muestreo por conglomerados Cuando la poblacin se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos o conglomerados para la realizacin del estudio. Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las personas a encuestar, y podra aplicrsele el instrumento de medicin a todas las unidades, es decir, los miembros del grupo, o slo se les podra aplicar a algunos de ellos, seleccionados al azar. Este mtodo tiene la ventaja de simplificar la recogida de informacin muestral. Cuando, dentro de cada conglomerado, se extraen los individuos que formarn parte de la muestra por m.a.s., el muestreo se llama bietpico. Las ideas de estratificacin y conglomerados son opuestas. El primer mtodo funciona mejor cuanto ms homognea es la poblacin respecto del estrato, aunque ms diferentes son stos entre s. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre s.