Está en la página 1de 19

ESTADSTICA APLICADA A LAS CIENCIAS DE LA EDUCACIN

ALBERTO RAMREZ GONZALEZ1

MDULO III. POBLACIN Y MUESTRA 1. INTRODUCCIN


La poblacin constituye el total de elementos que forma parte del grupo de estudio, por tanto, se refiere a todos los elementos que en forma individual podran ser cobijados en la investigacin. La poblacin la define el objetivo o propsito central del estudio y no estrictamente su tamao, ubicacin o lmites geogrficos, u otras caractersticas particulares al interior de ella. As, una investigacin podra estar centrada en: 1. Medir la capacidad intelectual CI- de los alumnos de la Universidad Nacional de Bogot 2. Determinar el mtodo didctico ms utilizado por los profesores de Educacin de la Universidad Javeriana 3. Evaluar las competencias de los estudiantes de Ingeniera de ltimo semestre de la Universidad de los Andes 4. Determinar el puntaje medio del ICFES del mejor alumno de cada semestre de la carrera de Economa en la Universidad Javeriana 5. Describir los mtodos de estudio del mejor alumno de la Universidad de Antioquia En su orden, las poblaciones que delimitan las investigaciones previas son: 1. Todos los estudiantes de la Universidad Nacional de Bogot, incluidos horarios diurnos y nocturnos 2. Todos los profesores de la Facultad de Educacin de la Universidad Javeriana, incluidos de tiempo completo, parcial y de ctedra 3. Todos los alumnos de ltimo semestre de Ingeniera de la Universidad de los Andes 4. Nueve alumnos pertenecientes a los semestres primero, segundo,..., noveno de la carrera de Economa 5. El mejor alumno de la Universidad de Antioquia La poblacin congrega entonces el universo de estudio sobre el cual queremos conocer o estudiar un fenmeno particular. Por lo anterior, cada investigacin delimita con base en sus objetivos y viabilidad, la poblacin de estudio. Es claro que un universo muy grande debe ser cubierto por entidades estatales, como por ejemplo, el total de la poblacin escolar del pas, o el
1

M.Sc. Educacin 78

total de estudiantes de educacin superior de las universidades pblicas de una ciudad. Por su parte, las investigaciones relativas a trabajos de grado pre o posgrado -, las cuales son realizadas y financiadas por los propios alumnos dentro de limitaciones econmicas y de tiempo considerables, no deben pretender coberturas amplias en sus objetivos, por cuanto corren el riesgo de desbordar la capacidad e infraestructura del estudiante; deben entonces abordar preguntas ms limitadas y sobre poblaciones ms restringidas: profesores de una facultad, estudiantes de algunos semestres, etc. Ahora bien, el investigador tiene dos opciones para abordar el estudio: evala, observa o mide el total de su poblacin (estudio censal) o toma una muestra sobre la misma (estudio muestral). La muestra consiste en un grupo reducido de elementos de la poblacin de estudio, a la cual se le evalan caractersticas particulares con el propsito de inferir tales caractersticas a toda la poblacin. Para que ello sea posible hablamos de muestras representativas y los elementos que la componen son tomados al azar: muestreo aleatorio simple, estratificado aleatorio, sistemtico aleatorio, principalmente. En uno u otro caso, todos los elementos tienen igual probabilidad de ser incluidos en la muestra. Buenda-Eisman et al. (1999), nos alertan, sin embargo, que en diversas situaciones y por diversas razones, la muestra no puede ser colectada al azar. Refieren los siguientes casos: 1. Muestreo deliberado: se eligen los sujetos porque poseen las caractersticas necesarias para la investigacin. Los resultados, por tanto, no pueden generalizarse a toda la poblacin. Ejemplo: estudio sobre los mejores alumnos de una facultad. 2. Accidental o casual: se forma con sujetos que casualmente se encuentran en el lugar y el momento decidido por el investigador. Ejemplo: una encuesta con los alumnos presentes en la biblioteca de la Universidad un sbado en la maana. 3. Voluntarios: personas que acuden para participar de forma voluntaria en investigaciones. Estas muestras suelen presentar sesgos que no permiten generalizar los resultados. Veamos ahora algunos ejemplos sobre la poblacin bajo estudio: 1. Objetivo: evaluar la percepcin de los estudiantes de la Universidad del Valle, en torno a los niveles de ruido que existen en la Universidad. La poblacin est conformada, entonces, por todos los estudiantes de la Universidad del Valle incluidos aquellos de programas diurnos y nocturnos, y de pregrados y posgrados. La muestra puede conformarse: a) Eligiendo al azar un puado de alumnos con base en un archivo o listado que contenga todos los cdigos o nombres de los estudiantes de las diversas facultades -muestreo aleatorio-. b) Dado que la ubicacin de las diferentes facultades y sus aulas vara de manera consistente al interior del campus y, por ello, los niveles de ruido podran ser ampliamente diferentes al interior de ste, es viable contabilizar el nmero de estudiantes de cada rea del campus y conformar la muestra en forma proporcional a tales nmeros -muestreo estratificado aleatorio-. c) Tambin
79

podramos tomar un listado de todos los alumnos de la Universidad ordenados o no por su nombre, y elegir al azar un alumno, a partir de all, definir una estrategia de seleccin de los individuos restantes: por ejemplo, cada veinte alumnos se elige uno muestreo sistemtico-. 2. Objetivo: evaluar la percepcin de los estudiantes de dcimo grado de Ecologa de la Universidad Javeriana -Bogot, en torno a los niveles de basura que se observan en las aulas. La poblacin est conformada, entonces, por todos los estudiantes de dcimo grado de la carrera de pregrado de Ecologa. La muestra puede tomarse eligiendo al azar un puado de alumnos con base en un archivo o listado que contenga todos los cdigos o nombres de los estudiantes de dicho pregrado, o tambin, contabilizando el nmero de hombres y de mujeres, y conformando la muestra en forma proporcional a tales nmeros. Trabajamos sobre toda la poblacin cuando no nos representa un esfuerzo notable en tiempo o costos. Por ejemplo, si vamos a realizar una encuesta sobre un curso de 30 alumnos, esto nos tomar a lo sumo un par de horas, por lo que no se justifica si quiera pensar en un proceso de muestreo; pero, as mismo, si sobre ese mismo grupo vamos a realizar entrevistas, cada una de ellas podra tomar una o ms horas por lo que estaramos hablando de 30, 60 o ms horas de trabajo en la sola captura de la informacin y muchsimas ms en su anlisis. An as, ser el investigador quien decida si tal esfuerzo es viable y justificable o si, por el contrario, puede reemplazar el censo por una muestra. Tal decisin se trata de una relacin costos beneficios entre el esfuerzo (costos, tiempo, personal) y la precisin obtenida. Cabe referir que el nmero de estudiantes que conforma cada una de las muestras en los ejemplos anteriores, se modifica acorde con el nivel de precisin que deseemos y, de hecho, cambia tambin con la varianza o variabilidad de los registros obtenidos. Si las muestras son representativas en los ejemplos anteriores, es decir, representan al conjunto de alumnos de la poblacin de referencia, los resultados que encontremos en ellas podemos transferirlos o extrapolarlos al total de la poblacin. En el campo de la ecologa Hurlbert (1984) ha llamado la atencin sobre los efectos de pseudoreplicacin que se producen con mucha frecuencia en las investigaciones, situacin que podemos transferir a otras ciencias y disciplinas. La pseudoreplicacin se refiere a que los investigadores suelen hacer inferencias mayores a las que realmente posibilita el diseo del estudio, por cuanto la muestra es muy pequea o el diseo de muestreo no es el apropiado. A manera de ejemplo, la pseudoreplicacin ocurre cuando estudiamos las preferencias temticas de los alumnos de sptimo semestre de Arquitectura de una universidad particular, y con tales resultados hacemos inferencias sobre los estudiantes de todos los semestres restantes o sobre otras universidades. En igual sentido, Kerlinger (1983) nos alerta que no se deben generalizar resultados a partir de muestras que no son representativas de la poblacin que se pretende estudiar.

80

Por lo anterior, los trabajos de grado recurrentemente son exploratorios u obedecen a un estudio de caso; pueden perfectamente, por limitaciones de tiempo y dinero, disearse sobre estudiantes de una nica facultad o incluso de un nico curso, sin pretender abarcar la poblacin de toda la institucin educativa. En tal sentido, constituye un estudio de caso que no pretende una amplia generalizacin sobre sus resultados, pero que aporta informacin til o prctica sobre derroteros futuros en dicha temtica de investigacin. En consecuencia, las conclusiones de un estudio deben plantearse acorde con el objetivo propuesto, el diseo de muestreo empleado y el tamao de la muestra estudiada. Unos y otros estn estrechamente entrelazados y son interdependientes. En este punto cabe adicionar una reflexin adicional concerniente con los estudios de caso, y es que la poblacin estudiada puede ser tomada por caractersticas particulares definidas por el objeto de estudio, como tambin porque nos representa mayor cercana, porque constituye el lugar de trabajo del investigador, por permisos, por disponibilidad de equipos, aulas, etc. Lo importante es que no pretendamos extrapolar tales resultados a otros grupos o instituciones no contempladas. A manera de ejemplo, el que se seleccione para un estudio los estudiantes de primer semestre de una carrera cualquiera, puede tener la intencin precisamente de conocer su percepcin sobre la misma antes de que se involucren en dichos estudios, es decir, antes de que se contaminen con los conocimientos que van a recibir y los maestros que van a tener; pero, al mismo tiempo, su eleccin pudo ser por motivos circunstanciales diferentes a los ya descritos. Las inferencias, en uno u otro caso, no deben salirse del semestre en cuestin. Un punto adicional a tener en cuenta se refiere a que el investigador debe estar familiarizado con los instrumentos de muestreo. As mismo, debe en lo posible realizar un premuestreo que le permita familiarizarse con el lugar, las condiciones, los instrumentos, las personas, etc. La funcin del premuestreo no es tomar datos tiles para la investigacin sino validar las condiciones de muestreo frente a los objetivos propuestos: estn operando bien los instrumentos?, qu cambios deberamos implementar en el mismo?, cmo va a evaluarse la representatividad de muestreo?, qu condiciones ecolgicas pueden incidir en los resultados?, etc. Algunos factores referidos por Buenda-Eisman et al. (1999) que pueden afectar la representatividad o validez de una investigacin en el rea de la psicopedagoga, los cuales pueden ser transferidos a otras ciencias y deben ser tenidos en cuenta por el investigador son: 1) Poblacin: se puede generalizar de muestra a poblacin? 2) Ecolgica: las condiciones ambientales en que se llev a cabo el estudio permiten generalizar a otras condiciones ambientales? 3) Modificaciones en los sujetos sometidos a experimentacin: en estudios sociales los cambios en la conducta de los sujetos pueden producir resultados alterados por: a. Efecto Hawthorne: porque se siente observado o analizado; desmotivacin en sujetos del grupo control por saber que no hay tratamiento sobre ellos -de all el uso de placebos-. b. Efecto debido a la novedad o a la interrupcin de procesos normales. c. Efecto del experimentador. d. Efecto debido a la sensibilizacin del pretest.
81

e. f. g. h. i. j. k.

Efecto debido a la sensibilizacin del postest. Efecto de la interaccin entre la historia y el tratamiento -el contexto histrico incide en la expresin de un fenmeno-. Efecto John Henry: cuando hay comunicacin y competencia entre los grupos de prueba. Medida de la variable dependiente; por ejemplo, cambio de instrumento entre pretest y postest. Interaccin entre el tiempo de medida y el efecto del tratamiento: hay efectos a corto, mediano y largo plazo y debe ajustarse el estudio a ellos. Validez del constructo: el instrumento que hemos abordado nos permite efectivamente inferir en el constructo estudiado? Con frecuencia el investigador concluye sobre lo que pretenda ver desde el inicio del proceso, y no sobre lo que realmente arrojan los datos de estudio.

En relacin con las caractersticas ecolgicas, cabe sealar que las circunstancias en que se realiza una medicin pueden afectar los resultados de una investigacin. As, por ejemplo, la poca climtica, el da de la semana e incluso la hora de aplicacin de una prueba puede llevar a resultados distintos; es as que una prueba despus de almuerzo o en la noche despus de una jornada ardua de estudio o trabajo, puede dar resultados muy diferentes a si se hacen a primera hora de la maana. Por tanto, debe guardarse precaucin con tales factores y enmarcar los resultados bajo las condiciones particulares en que se hicieron las mediciones. Por lo anterior, Buenda-Eisman et al., refieren que en investigaciones de carcter experimental se debe procurar que las condiciones se parezcan estrechamente a la situaciones cotidianas de los sujetos. As mismo, se deben evitar voluntarios, mortalidad abandonos- y sujetos en extremo atpicos. Por ltimo, se trae el pensamiento de tres diferentes autores sobre el proceso de muestreo: Tamayo y Tamayo (2000) recalcan la importancia de determinar la validez del muestreo. Salkind (1997) nos refiere que debe seleccionarse una muestra que sea apropiada para su estudio tanto en sus caractersticas como en su tamao. Kerlinger (1983) recomienda para el caso de encuestas y entrevistas, definir claramente el universo a muestrear, as como verificar que los actores concernientes con diferentes niveles estn presentes -ciudadanos, lderes, empresarios,...etc.- acorde con el objeto del estudio.

Para el caso de encuestas ya hemos referido que si la poblacin es pequea conviene hacer un estudio censal, pero si la poblacin es muy grande debemos recurrir a muestras. En tal caso, se debe elegir la pregunta ms importante de la misma y sobre ella aplicar uno de los procedimientos expuestos a continuacin para determinar la representatividad de la muestra. Para el caso de entrevistas la situacin es ms compleja por cuanto el mtodo es dispendioso y el nmero de sujetos que logran entrevistarse resulta generalmente muy bajo.

82

2. REPRESENTATIVIDAD DE LA MUESTRA
Este pargrafo se abordar esencialmente desde 3 enfoques diferentes. El primero se refiere a que podemos valernos de grficas para aproximarnos al estudio de la representatividad; el segundo a formulaciones estadsticas que permiten calcular parmetros como error de muestreo o talla de muestreo requerida para alcanzar un error particular; el tercero se refiere a las tallas de muestreo para pruebas de hiptesis particulares. 2.1 Mtodos Grficos Hay dos tipos esenciales de grficos que pueden ser tiles. El primero se refiere a la categoras acumuladas para variables cualitativas nominales, y el segundo, a grficos de desempeo en los cuales se acumula el promedio de una variable cuantitativa (extensivo a ordinales o nominales). Categoras acumuladas Ejemplo: se enva una lista de adjetivos a un numeroso grupo de personas que ha recibido una misma capacitacin particular. Se les solicita que marquen con una X las 3 casillas que describen mejor su percepcin sobre la informacin temtica recibida. Un grupo de 40 personas responde la encuesta y quiere saberse si tales respuestas podran dar una idea apropiada del conjunto de adjetivos que describen el curso. Para ello se construye una matriz de adjetivos encuestados, en el mismo orden en que lleg la informacin o se organizan de forma aleatoria:
Adjetivo \ Encuestado 1.Completa 2.Incompleta 3.Robusta 4.Superficial 5.Profunda 6.Muy terica 7.Terico-prctica 8.Importante 9.Descontextualizada 10.Bien desarrollada 11.Desordenada 12. Ordenada Adjetivo \ Encuestado 1.Completa 2.Incompleta 3.Robusta 4.Superficial 5.Profunda 6.Muy terica 7.Terico-prctica 8.Importante 9.Descontextualizada 10.Bien desarrollada 11.Desordenada 12. Ordenada 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

X X

21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 X X X X X X X X X X X

X X X X X X X X X X X X X

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

X X

83

A partir de la tabla anterior elaboramos una nueva tabla donde se acumulan una a una todas las categoras que han sido marcadas hasta cada uno de los individuos. As, por ejemplo, cuando se han contabilizado los tres primeros individuos, han sido marcadas 7 categoras distintas (3 del individuo 1; 3 del individuo 2; 1 del individuo 3). La tabla que se obtiene es la siguiente:
Adjetivo \ Encuestado 01 02 03 04 05 06 07 08 1.Completa X X X X X 2.Incompleta 3.Robusta X X X X X X X X 4.Superficial 5.Profunda X X X X X X 6.Muy terica 7.Terico-prctica X X X X X X X 8.Importante X X X X X X X 9.Descontextualizada X X X X X X X 10.Bien desarrollada X X X X X X X X 11.Desordenada 12. Ordenada X X X X X X X X Total categoras 3 6 7 8 8 8 8 8 Adjetivo \ Encuestado 1.Completa 2.Incompleta 3.Robusta 4.Superficial 5.Profunda 6.Muy terica 7.Terico-prctica 8.Importante 9.Descontextualizada 10.Bien desarrollada 11.Desordenada 12. Ordenada Total categoras 09 10 11 12 13 14 15 16 17 18 19 20 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

X X X X X X X X X X X X 8 8 8 8 8 8 8 8 8 8 8 8

21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 X X X X X X X X X X X X X X X X X X X X X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8 X X X X X X X 8

Se grafican entonces los individuos encuestados (X) contra el nmero de categoras acumuladas (Y) tal como se ilustra a continuacin. Se reconoce claramente en ella, que el nmero de categoras marcadas se ha estabilizado desde muy temprano y se mantiene constante desde el individuo cuarto hasta el cuarenta. Podemos decir entonces, que estas 8 categoras describen las caractersticas principales de la capacitacin. Es importante resaltar que la grfica da respuesta a una pregunta meramente cualitativa y no da uso de las proporciones de las respuestas, sino tan solo de las categoras respondidas.

84

Representatividad de muestreo 9 8 7 6 5 4 3 2 1 0
11 13 15 17 19 21 23 25 27 29 31 33 35 37

Categoras acumuladas

Individuos

Promedio acumulado (grfico de desempeo) Este tipo de grfico se refiere a estudios en que se evala una variable cuantitativa, como por ejemplo, edad, calificacin, aos de estudio u otras. El principio es similar al expuesto en la grfica anterior pero, a diferencia de sta, el eje Y corresponde al valor promedio acumulado de la variable bajo estudio. La estabilidad de la curva denota que el promedio permanece aproximadamente constante y por ello asumimos la muestra como representativa. Una proyeccin de este mtodo puede emplearse tambin cuando se estudian variables dicotmicas donde se trata de respuestas de S NO o de FALSO VERDADERO, o de la cantidad de personas por gnero que hemos registrado en una muestra, u otras. Para ello se reemplaza una de las variables anteriores por uno (1) y la otra por cero (0) y se obtiene el promedio acumulado de tales valores, el cual se grfica contra los individuos que se han muestreado hasta ese momento. Ntese que este procedimiento puede emplearse adems, cuando la variable no es dicotmica sino ordinal, es decir, cuando la pregunta se responde por variables cualitativas que pueden ser ordenadas de mayor a menor (alternativas de grado). Algunos ejemplos son: a) Marque con una X la respuesta con la que usted se identifica ms sobre la siguiente expresin: LOS MAESTROS DEL ESTADO ESTN BIEN PREPARADOS PARA CUMPLIR CABALMENTE CON SU PRCTICA DOCENTE
TOTALMENTE EN DESACUERDO PARCIALMENTE EN DESACUERDO INDECISO PARCIALMENTE DE ACUERDO TOTALMENTE DE ACUERDO

39

85

b) Marque con una X la respuesta ms cercana a sus actitudes de estudio cotidianas: EN MIS TIEMPOS LIBRES REPASO LOS TEMAS VISTOS EN CLASE
NUNCA CASI NUNCA OCASIONALMENTE CON FRECUENCIA SIEMPRE

El principio que nos permite operar con un promedio acumulado este tipo de respuestas, es que podemos ordenar y numerar (1 a 5) las respuestas anteriores ya que cada una responde a un grado mayor o menor que las dems. A continuacin se expone un ejemplo para variables dicotmicas, recordando que puede ser aplicado igualmente al estudio de variables ordinales. El procedimiento que se sigue es el siguiente: 1. 2. 3. 4. 5. Se anotan todos los registros uno a uno en el orden en que fueron colectados o al azar Se reemplazan los registros cualitativos por cuantitativos (1 0) Se promedian los 2 primeros, tres primeros, cuatro primeros, ..., n primeros registros Se grafican los promedios acumulados contra el nmero de individuos La estabilidad de la grfica denota que la proporcin de las respuestas dicotmicas de la muestra es prxima a la proporcin de la poblacin

Ejemplo: una muestra de cuarenta profesores universitarios responde con S y NO a la siguiente pregunta: EST USTED DE ACUERDO CON EL SISTEMA IMPLEMENTADO EN LA EDUCACIN SUPERIOR? DE CRDITOS

La tabla expuesta a continuacin nos compendia lo siguiente: sujetos en la primera columna; respuestas obtenidas en la segunda columna; la tercera columna ha convertido en valores 1 y 0 las respuestas dadas; la cuarta columna promedia en forma acumulada todas las respuestas. La grfica de individuos (X) contra respuesta promedio acumulada (Y) se presenta a continuacin y en ella se reconoce que el promedio inicialmente tiene altas variaciones, pero se va estabilizando con oscilaciones cada vez menores alrededor de los valores 0,33 y 0,37. Dicha estabilidad indica que el promedio de la poblacin se encuentra muy probablemente en dicho rango y, por tanto, podemos asumir que la muestra es representativa en tanto el incremento en el nmero de individuos no produce cambios importantes en el valor promedio. Es decir que entre 33 y 37% de los maestros estn de acuerdo con el sistema de crditos, mientras que 63 a 67% no lo est. Ntese que una situacin como la expuesta en el ejemplo previo puede ser vlida para evaluar los profesores de una facultad o de una universidad, pero de ningn modo refleja el pensamiento de los maestros universitarios de todo un pas, de un departamento o incluso de

86

todos los maestros de una gran ciudad, investigaciones que requieren de un diseo de muestreo ms elaborado y con muchos individuos ms.
PROFESORES S - NO S 1 NO 2 NO 3 NO 4 S 5 S 6 S 7 NO 8 NO 9 NO 10 NO 11 NO 12 NO 13 NO 14 S 15 S 16 NO 17 NO 18 S 19 NO 20 1 - 0 ACUMULADO 1 1 0 0,50 0 0,33 0 0,25 1 0,40 1 0,50 1 0,57 0 0,50 0 0,44 0 0,40 0 0,36 0 0,33 0 0,31 0 0,29 1 0,33 1 0,38 0 0,35 0 0,33 1 0,37 0 0,35 PROFESORES 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 S - NO NO NO S S NO NO NO NO S NO S NO NO S S NO NO S NO NO 1-0 0 0 1 1 0 0 0 0 1 0 1 0 0 1 1 0 0 1 0 0 ACUMULADO 0,33 0,32 0,35 0,38 0,36 0,35 0,33 0,32 0,34 0,33 0,35 0,34 0,33 0,35 0,37 0,36 0,35 0,37 0,36 0,35

REPRESENTATIVIDAD DEL MUESTREO 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 11 13 15 17 19 21 23 25 27 29 31 33 35 37 Individuos 39 1 3 5 7 9

Variable nominales Una extensin de la grfica de desempeo puede llevarnos a su aplicacin sobre variables nominales que no pueden ser ordenadas, como por ejemplo, azul, rojo, verde; matemticas, geografa, historia; ingeniera, medicina, educacin; etc. Cabe referir que aun as, podramos numerar arbitrariamente tales variables y promediar los valores como se hizo previamente. La

Promedio acumulado

87

estabilidad de la curva denotara constancia en el promedio y ello ocurre cuando las respuestas nuevas no generan cambios sobre el conjunto de respuestas acumuladas. Sin embargo, dos posible rutas de trabajo ms adecuadas son las siguientes: 1) Se grafica la proporcin acumulada para cada categora (o el porcentaje) 2) Se obtiene un nico ndice que recoja las proporciones de todas las variables. El mismo 2 ni puede ser n Ejemplo: se toma una muestra de 50 alumnos que ingresan al grado 11 en una misma localidad, y se les pregunta lo siguiente: POR CUL DE ESTAS REAS SE SIENTE USTED ATRADO PARA REALIZAR ESTUDIOS SUPERIORES: SOCIALES, NATURALES O ARTES? Ntese que las respuestas no pueden ser ordenadas y numeradas como un reactivo de grado, puesto que artes no es ms o menos que sociales o naturales y viceversa. La siguiente tabla nos proporciona las respuestas dadas como algunos clculos adicionales.
FRECUENCIA Alumno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Respuesta Sociales Naturales Sociales Artes Artes Artes Naturales Sociales Artes Naturales Naturales Naturales Naturales Naturales Naturales Naturales Naturales Sociales Sociales Sociales Sociales Sociales Artes Sociales Sociales Naturales Artes Artes Artes Naturales Artes Sociales 1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 5 6 7 8 8 9 10 10 10 10 10 10 10 Naturales 0 1 1 1 1 1 2 2 2 3 4 5 6 7 8 9 10 10 10 10 10 10 10 10 10 11 11 11 11 12 12 Artes 0 0 0 1 2 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 6 7 8 8 9 PORCENTAJE Sociales 1,00 0,50 0,67 0,50 0,40 0,33 0,29 0,38 0,33 0,30 0,27 0,25 0,23 0,21 0,20 0,19 0,18 0,22 0,26 0,30 0,33 0,36 0,35 0,38 0,40 0,38 0,37 0,36 0.34 0,33 0,32 Naturales 0,00 0,50 0,33 0,25 0,20 0,17 0,29 0,25 0,22 0,30 0,36 0,42 0,46 0,50 0,53 0,56 0,59 0,56 0,53 0,50 0,48 0,45 0,43 0,42 0,40 0,42 0,41 0,39 0.38 0,40 0,39 Artes 0,00 0,00 0,00 0,25 0,40 0,50 0,43 0,38 0,44 0,40 0,36 0,33 0,31 0,29 0,27 0,25 0,24 0,22 0,21 0,20 0,19 0,18 0,22 0,21 0,20 0,19 0,22 0,25 0.28 0,27 0,29

(ni / n)
1,00 0,50 0,56 0,38 0,36 0,39 0,35 0,34 0,36 0,34 0,34 0,35 0,36 0,38 0,40 0,41 0,43 0,41 0,39 0,38 0,37 0,37 0,36 0,36 0,36 0,36 0,35 0,34 0.34 0,34 0,34

88

FRECUENCIA Alumno 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Respuesta Naturales Artes Artes Artes Sociales Naturales Artes Sociales Artes Naturales Naturales Naturales Sociales Sociales Sociales Sociales Artes Naturales Naturales Sociales 10 10 10 10 11 11 11 12 12 12 12 12 13 14 15 16 16 16 16 Naturales 13 13 13 13 13 14 14 14 14 15 16 17 17 17 17 17 17 18 19 Artes 9 10 11 12 12 12 13 13 14 14 14 14 14 14 14 14 15 15 15 0,31 0,30 0,29 0,29 0,31 0,30 0,29 0,31 0,30 0,29 0,29 0,28 0,30 0,31 0,33 0,34 0,33 0,33 0,32

PORCENTAJE Sociales Naturales 0,41 0,39 0,38 0,37 0,36 0,38 0,37 0,36 0,35 0,37 0,38 0,40 0,39 0,38 0,37 0,36 0,35 0,37 0,38 Artes 0,28 0,30 0,32 0,34 0,33 0,32 0,34 0,33 0,35 0,34 0,33 0,33 0,32 0,31 0,30 0,30 0,31 0,31 0,30

(ni / n)
0,34 0,34 0,34 0,34 0,33 0,34 0,34 0,33 0,34 0,34 0,34 0,34 0,34 0,34 0,34 0,34 0,33 0,34 0,34

En la columna 1 se refiere el alumno; en la 2, la respuesta; en las columnas 3 a 5, los resultados por cada rea del conocimiento tabulados de forma acumulada; en las columnas 6 a 8, se han acumulado los resultados como proporciones; en la comuna 9, se ha calculado la expresin (ni / n) 2 . Las siguientes grficas muestran la evolucin de las columnas 6 a 8, por un lado, y 9 por el otro.
Representatividad de Muestreo 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 Alumnos SOCIALES NATURALES ARTES 49

Porcentajes

89

Representatividad de muestreo 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46

Suma (ni/n)2

Alumnos

Se aprecia que todas las curvas oscilan ampliamente en un inicio pero, de forma posterior, restringen su rango de variaciones mantenindose casi constantes. Esta situacin denota que la proporcin de cada categora en la muestra se aproxima a la proporcin que expone en la poblacin y bajo tal principio aceptamos la muestra como representativa.

2.2 Mtodos Estadsticos El ejemplo previo nos seala que la proporcin de la muestra y la poblacin es prxima pero no nos indica el error de muestreo o el nmero de personas que debemos encuestar para obtener un error determinado. Estas preguntas se abordan a continuacin bajo mtodos estadsticos a la luz de las siguientes formulaciones (Chao, 1993):
n= t2 S2 E2 ; n= N t 2S 2 E 2 ( N 1) + t 2 S 2 ; n= Z 2 p (1 p ) E2

Donde: la primera frmula se refiere a poblaciones muy grandes en las que se desconoce su tamao y, la segunda, a poblaciones finitas de tamao conocido -N-; n es el nmero de elementos que debe tener la muestra; t el valor de la estadstica t de tablas para una confiabilidad dada -generalmente 95%; si n 30, este valor se aproxima al de la estadstica Z igual a 1,96-; S2 es la varianza de la variable y E es el error que aceptamos en la estimacin del promedio -por ejemplo 20% o menos-. La ltima frmula se emplea en el estudio de proporciones y all p denota la proporcin estimada o esperada de la variable, si no se conoce tal valor, se reemplaza por 0,5. Las frmulas anteriores pueden ser usadas en dos vas:

49

90

a. Hallamos el valor de n dado que conocemos los dems parmetros b. Para un n muestreado, hallamos el error en la estimacin Ejemplo: retomamos el ejercicio desarrollado previamente para registros binarios en el que se le pregunta a 40 maestros si estn de acuerdo con el sistema de crditos en la educacin superior y cuyas respuestas S y NO fueron llevadas a 1 y 0. Nos preguntamos ahora, cuntos maestros debemos encuestar de tal modo que no sobrepasemos un error del 20% en la estimacin del promedio poblacional? Para ello aplicamos la frmula siguiente, que para este caso se ha calculado cada 5 individuos: n= t2 S2 E2 para n = 5 : n = 2,776 2 0,548 2 = 361 (0,40 0,2) 2
Estadstica t n (n-1, G.L) estimado 2,776 361 2,262 213 2,145 246 2,093 214 2,064 197 2,045 216 2,032 180 2,023 195

n muestreado 5 10 15 20 25 30 35 40

Promedio 0,40 0,40 0,33 0,35 0,36 0,33 0,37 0,35

Desviacin estndar 0,548 0,516 0,488 0,489 0,490 0,479 0,490 0,483

Los clculos previos nos indican que si queremos obtener un error que no sobrepase el 20% en la estimacin del promedio poblacional, debemos muestrear aproximadamente 195 individuos. Ntese, sin embargo, que el tamao de la muestra estimada se ha ido reduciendo de 361 a 195 individuos, a medida que se ampla la muestra, hecho que ocurre por disminucin, tanto de la desviacin estndar, como de la estadstica t, por lo que el valor real ser seguramente menor a 195. El muestreo debe entonces continuar hasta que el n muestreado sea igual o mayor al n estimado. La otra forma de abordar este ejemplo es estimando el error de muestreo que tenemos para n = 40. Para ello despejamos y resolvemos E de la frmula previa as: E2 = t2 S2 n para n = 40 : E = 2,023 2 0,483 2 = 0,15 40

El error calculado est expresado en las mismas unidades del promedio y debe representarse como un porcentaje del promedio mediante una regla de tres: si 0,35 es el 100%, 0,15 a qu porcentaje corresponde? La respuesta es 44%, y el promedio de la poblacin se encuentra entre 0,35 + 0,15 = 0,50, y 0,35 - 0,15 = 0,20 cuando hemos muestreado 40 maestros. Estos datos sealan que el error es amplio y que deberamos incrementar la muestra para lograr mayor precisin.

91

La tabla y grfica siguiente complementan las variaciones que experimenta el promedio junto con su intervalo de confianza del 95%, el cual nos indica entre que valores se ubica el promedio poblacional a medida que avanza el muestreo.
n 5 10 15 20 25 30 35 40 Media 0,40 0,40 0,33 0,35 0,36 0,33 0,37 0,35 Intervalo Superior 0,88 0,72 0,58 0,56 0,55 0,50 0,53 0,50 Intervalo Inferior -0,08 0,08 0,09 0,14 0,17 0,16 0,21 0,20

REPRESENTATIVIDAD DEL MUESTREO Promedio e intervalo de confianza 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0
5 10 15 20 25 30 35 40

Individuos

Ntese que a medida que se incrementa la talla de la muestra, el intervalo de estimacin se hace ms estrecho. As mismo y de manera general, requerimos muestras ms grandes cuando tenemos alta variabilidad (varianza) en la variable que estudiamos. Ejemplo: para abordar ahora la frmula de talla de la muestra en proporciones, desarrollamos el ejemplo relativo a los 50 alumnos de grado 11 a quines se les indag sobre el rea temtica en que realizaran estudios superiores: sociales, naturales y artes. Se refiri previamente que si se desconoce el resultado aproximado de la proporcin de la variable objeto de estudio (no hay estudios de sondeo anteriores), el valor de p toma el valor de 0,5. Luego, si aceptamos un error de por ejemplo 10% en la proporcin estimada, la talla de la muestra para cualquiera de las temticas debe ser:

92

n=

Z 2 p (1 p ) 1,96 2 0,5 (1 0,5) = = 96 E2 0,12

De forma complementaria, el intervalo de confianza para una proporcin se estima as (para n 30): P (1 P) P Z Sp ; P Z n

El siguiente cuadro resume los intervalos de confianza al 95% y el error como porcentaje para el caso de sociales.
Alumno 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Proporcin Intervalo Sociales 0,34 0,17 0,34 0,16 0,34 0,16 0,34 0,16 0,34 0,15 0,34 0,15 0,33 0,15 0,34 0,15 0,34 0,14 0,33 0,14 0,34 0,14 0,34 0,14 0,34 0,14 0,34 0,13 0,34 0,13 0,34 0,14 0,34 0,14 0,34 0,14 0,33 0,13 0,34 0,13 0,34 0,13 Error (%) 50 51 51 51 52 52 49 49 49 47 47 47 47 48 45 43 41 39 40 40 40

Se aprecia entonces que el error en la estimacin se redujo de 50 a 40% al ampliar la muestra de 30 a 50 alumnos. Estos resultados se grafican a continuacin.

93

Intervalos de confianza de la proporcin -SOCIALES0.6 0.5 Intervalo (95%) 0.4 0.3 0.2 0.1 0 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Alumnos

2.3 Pruebas de hiptesis

En este pargrafo se abordan aspectos relativos a la talla de muestreo en pruebas de hiptesis, los cuales no pretenden ser una camisa de fuerza a seguir por el investigador, pero que brindan una aproximacin al diseo experimental a seguir segn la estadstica que se vaya a implementar. Cabra decir, de manera general, que entre ms datos tengamos ms fiables sern los parmetros estimados, por lo que las pruebas de hiptesis respondern de forma ms robusta. Adicionalmente, un resultado obtenido con una muestra pequea no tendr la misma aceptacin en el medio cientfico que uno con una muestra grande, a la vez que las conclusiones no podrn ir ms all de los objetivos y la poblacin estudiada; es as como podramos encontrar que con un 95% de confianza las nias obtienen mejores calificaciones que los nios en un rea temtica particular y en un colegio especfico, pero ello no nos permitira aseverar que tal relacin es cierta fuera de tal institucin; las generalizaciones slo podrn hacerse cuando futuras y numerosas investigaciones posteriores sobre la misma temtica, arrojen resultados semejantes. Por lo anterior, los derroteros expuestos a continuacin obedecen a poblaciones mesuradas (por ejemplo, alumnos o profesores de un colegio o similares) y no pretenden su empleo en preguntas de investigacin con una cobertura nacional o regional donde debemos, muy seguramente, emplear muestreos estratificados y muestras categricamente mayores. Vale referir que existe la creencia popular de que se deben aplicar pruebas no paramtricas cuando las muestras son pequeas, sin embargo, algunos autores consideran que, por el contrario, las pruebas no paramtricas por ser menos robustas requieren de un mayor nmero de datos para su implementacin.

94

Anlisis de Regresin Algunos lineamientos de Drapper y Smith (1981) para el diseo de muestreo en anlisis de regresin son los siguientes: Se debe procurar cubrir homogneamente el rango de la variable X estudiada Se deben tomar varias rplicas para cada valor de X

La siguiente grfica explica tal situacin; si la variable X se encuentra por ejemplo, entre 0 y 20, debe procurarse cubrir la mayor parte de este segmento, a la vez que se toman rplicas para cada valor de X evaluado. Un nmero de 10 coordenadas o ms, provee informacin apropiada para acercarnos a tal relacin. Tal como se refiri previamente, lo anterior no desmerita un nmero menor de coordenadas, pero s limita la aceptacin de la comunidad cientfica sobre los estadsticos empleados.
Muestras en anlisis de regresin 35 30 25 20 15 10 5 0 0 5 10 X 15 20

Anlisis de correlacin En el anlisis de correlacin el investigador tiene la nocin del rango que puede obtener en las variables de estudio, pero no puede manipular la eleccin de la misma de forma tan contundente a como lo hace con anlisis de regresin. An as, se sugiere procurar un rango amplio en las variables de estudio (figura a) evitando dejar vacos de informacin en ellas (figura b). En lo posible, se deben tomar ms de 10 registros por variable.

95

Comparacin de promedios En trminos prcticos, la comparacin de ms de 2 promedios por anlisis de varianza, suele hacerse con 5 a 10 rplicas por tratamiento. Diversos autores recomiendan, adems, que el nmero de rplicas por cada tratamiento sea el mismo. Cuando se comparan 2 grupos o tratamientos, conviene tener muestras un tanto mayores, como por ejemplo, de 15 a 20 rplicas. Frecuencias Los resultados de pruebas de hiptesis mediante la estadstica chi cuadrado sugieren simplemente que entre ms grande la muestra, ms posibilidades hay de que se reconozcan diferencias significativas entre los grupos que se comparan, por lo que se sugiere seguir tal recomendacin. El valor mnimo con que podramos aproximarnos al empleo de esta estadstica sugiere que los valores esperados deben ser mayores a 5 a 10, segn la prueba en desarrollo.

BIBLIOGRAFA
Buenda-Eisman, L., Cols-Bravo, M.P., Hernndez-Pina, F. 1999. Mtodos de Investigacin en Psicopedagoga. Mcgraw-Hill, Madrid. Chao, L.L. 1993. Estadstica para las Ciencias Administrativas. McGraw-Hill, Bogot. Drapper, N.R., Smith, H. 1981. Applied Regression Analysis, 2a Ed. Wiley, New York. Hurlbert, S.H. 1984. Pseudoreplication and the Design of Ecological Field Experiments. Ecol. Monogr 54(2): 187-211. Kerlinger, F.N. 1983 Investigacin del Comportamiento. Tcnicas y Metodologa. Nueva Editorial Interamericana, Mxico D.F. Salkind, N.J. 1997. Mtodos de Investigacin. Prentice Hall, Hispanoamericana, Mxico.

96

También podría gustarte