Está en la página 1de 49

NOTAS SOBRE REALIZACIÓN Y PROCESO DE ENCUESTAS DE OPINIÓN

Material elaborado por:

Ma. de Lourdes Fournier G.

Departamento de Política y Cultura

UAM-X

Año 2016

1
NOTAS SOBRE REALIZACIÓN Y PROCESO DE ENCUESTAS DE OPINIÓN

CONTENIDO

Primera parte: Elaboración y Análisis de encuestas de opinión

I.1. Antecedentes de las encuestas de opinión

I.2. Formas de obtención de datos

I.3. Lineamientos para la elaboración de cuestionarios


I.3.1. Objetivo de la encuesta
I.3.2. Población que se va a encuestar
I.3.3. Selección de los temas que abarcará la encuesta
I.3.4. Posibles variables asociadas a cada tema
I.3.5. Selección de temas y variables definitivas
I.3.6. Planteamiento de las preguntas
I.3.7. Tipos de preguntas
I.3.8. Selección a priori de opciones para preguntas cerradas
I.3.9. Primera versión del cuestionario
I.3.10. La prueba piloto
I.3.11. Resumen
I.3.12. Codificación del cuestionario

I.4. Trabajo de campo, codificación y captura


I.4.1. Guía del encuestador
I.4.2. Guía del codificador
I.4.3. Guía del capturista
I.4.4. El primer análisis

Segunda parte: Método científico, estadística y muestreo

Introducción

II.1. Método científico de investigación


II.1.1. Algunas definiciones iniciales
II.1.2. ¿Por qué es necesaria la investigación?
II.1.3. ¿Cómo se puede instrumentar la aplicación del método científico?
II.1.4. La estadística como herramienta básica de investigación

II.2. Conceptos básicos de estadística


II.2.1. Definición y tipos de estadística
II.2.2. Tipos de variables y niveles de medición
II.2.3. Principales medidas descriptivas
II.2.4. Ejercicios

2
II.3. Algo de probabilidad

II.4 Breve nota sobre la distribución normal

II.5. Algunos elementos sobre población y muestra


II.5.1. Tamaño de muestra
II.5.2. Variación en el tamaño de muestra cuando cambia el tamaño de la población
II.5.3. Variación en el tamaño de muestra para diferentes intervalos de confianza
II.5.4. Ejercicio

Tercera parte: Análisis de resultados

Apéndice A Fórmulas de estadística descriptiva

Apéndice B Cuadros estadísticos

Apéndice C Tamaños de muestra más usados

Bibliografía

3
PRIMERA PARTE: ELABORACIÓN Y ANÁLISIS DE ENCUESTAS DE OPINIÓN

Ma. de Lourdes Fournier G.

El presente texto tiene por objeto orientar sobre los antecedentes y métodos de la realización de encuestas
de opinión, hasta llegar a lineamientos sobre el trabajo de campo, el procesamiento de los datos y la
elaboración de los informes finales.

I.1. ANTECEDENTES DE LAS ENCUESTAS DE OPINIÓN

Las encuestas de opinión, al igual que los estudios de mercado no son cosa nueva. Su metodología se ha
venido “desarrollando penosamente desde fines del siglo XVIII, con vacilaciones características, contra
oposiciones constantes.” [Noelle 1970: 11]. En el caso de las encuestas de opinión relacionadas con
procesos electorales, existe ya un historial tanto de éxitos como de fracasos, así como legislaciones
específicas que incluyen puntos sobre los métodos para realizarlas, pero se centran sobre todo en la forma
y tiempos en que se pueden dar a conocer sus resultados.

La ESOMAR (European Society for Opinion and Marketing Research) considera que en los últimos 50
años se ha comprobado que las encuestas de opinión son elementos operacionales permanentes de las
democracias modernas, ya que son el medio a través del cual es posible seguir paso a paso el avance de
las campañas electorales, así como las fluctuaciones de popularidad de candidatos y gobernantes. Se
conocen tendencias y motivaciones, se detectan los cambios de opinión y la evolución de los valores, se
siguen los movimientos de apoyo y se evalúa el impacto público de cualquier acontecimiento. Además,
permiten a los ciudadanos hacerse escuchar en todo momento y comparar sus puntos de vista con los de
los demás. Para esta misma asociación “las encuestas de opinión y la libertad no pueden ir separadas. La
relación entre los encuestadores y los encuestados presupone un clima de confianza y los resultados
publicados son creíbles únicamente en la medida en que todas las opiniones puedan expresarse
libremente, por desagradables que puedan ser para aquéllos que están en el poder.” [ESOMAR 1993: 2].
Tal vez esto explique, al menos es parte, lo ocurrido en México durante la presente década y en especial
en la etapa previa a las elecciones para Jefe de Gobierno del D.F. en julio de 1997, cuando incluso se
llegó a hablar en algunos de los medios de comunicación de una supuesta “guerra de encuestas”.

Precisamente acerca de esta “guerra de encuestas” es conveniente mencionar algunos de los supuestos
efectos negativos de la publicación de los resultados de sondeos de este tipo durante el desarrollo de
campañas y sobre todo en fechas cercanas a una votación. Es un ejemplo muy citado lo ocurrido durante
la campaña presidencial de 1948 en los Estados Unidos de Norteamérica, protagonizada por el Demócrata
Harry S. Truman (cuyos años de gobierno en la Casa Blanca habían estado marcados por una serie de
dificultades, al grado que fue prácticamente debido al rechazo de Eisenhower a la candidatura que su
partido lo nominó) y el Republicano Thomas E. Dewey, que ya antes había perdido en unas elecciones
presidenciales pero que confiaba, junto con su partido, en un triunfo sin problemas. Era tan grande la
supuesta ventaja de Dewey que desarrolló una muy tibia campaña, mientras Truman recorrió, con
excelentes resultados, buena parte de la Unión Americana. A pesar del entusiasmo despertado por la
presencia de Harry, “casi todo experto político y encuestadores como George Gallup y Elmo Roper,
pronosticaron una derrota para Truman. El fuerte margen a favor de Dewey, anotó Roper, tiene un
parecido casi siniestro con las cifras Roosevelt-Landon” [Morison 1980: 628], haciendo referencia a un
proceso electoral anterior en el que Roosevelt resultó triunfador. Sin embargo, en las elecciones, Truman
venció a Dewey ante el asombro de todos y para escarnio de los investigadores de opinión. Desde
entonces, estos sucesos se han mostrado como un caso en que los resultados de las encuestas, tan
favorables a Dewey, sólo sirvieron para provocar que tanto él como sus seguidores se confiaran, con
negativos resultados.

4
Volviendo a la situación en México, Roderic Ai Camp cita un análisis de bases de datos de las encuestas
de opinión pública en América Latina realizado por Louise Harris Berlin del que se desprende que las
primeras verdaderas encuestas de opinión pública realizadas en nuestro país son de la década de 1950,
patrocinadas en su mayoría por el gobierno de los Estados Unidos de Norteamérica. “La base de datos
estadounidense no incluye ninguna encuesta patrocinada por mexicanos antes de 1986” [Ai Camp 1997:
11]. De acuerdo con este mismo autor “antes de 1988 la mayoría de las encuestas políticas, que no se
publicaban, eran realizadas por Partido Revolucionario Institucional (PRI) o por políticos
gubernamentales individuales” [Ai Camp 1997, 16]. No es difícil llegar a la conclusión de que la mayoría
de esas encuestas no publicadas tuvieron como finalidad mejorar las perspectivas de triunfos electorales y
permanencia en el poder de la reducida elite que tenía acceso a esa información. En 1988 algunos diarios
y revistas efectuaron encuestas de opinión política y “en ese año [fue] cuando analistas, políticos,
periodistas, encuestadores y público en general iniciaron un debate aún inconcluso sobre el uso y abuso
de encuestas en la escena política mexicana” [Gamboa Henze en Ai Camp 1997: 37]. Ahora, conforme
aumenta la liberalización política, puede decirse que desde las elecciones presidenciales de agosto de
1994 “las encuestas metodológicamente aceptables publicadas con anticipación ofrecen un medio público
y abierto de comparar los resultados oficiales con los anticipados” [Ai Camp 1997: 19] y junto con las
encuestas preelectorales, las encuestas de salida y los conteos rápidos se aplicaron, con excelentes
resultados, en ese mismo año.

Después de las elecciones presidenciales de 1994, las elecciones para Jefe de Gobierno del Distrito
Federal, dada su particular importancia por ser las primeras en que los habitantes de esta ciudad elegirían
a quien encabeza aunque con muchas limitaciones jurídicas el Departamento del Distrito Federal, fueron
motivo de una gran cantidad de encuestas, la mayoría de ellas patrocinadas por los diversos medios
comunicación, sobre todo prensa, o por algunos grupos políticos. Muchas veces la metodología utilizada
y los resultados parecían estar correlacionados con los intereses del patrocinador. Ya desde 1994 se había
observado que un aspecto metodológico en apariencia de poco peso, encuestar en la calle o en el
domicilio, provoca diferencias interesantes ya que “en el presente estado de desarrollo de la cultura
política la gente tiende a protegerse en sus respuestas a algunos temas al saberse identificada en su
domicilio. [...] sobre este punto el diario Reforma realizó una encuesta experimental en la ciudad de
México donde las preferencias electorales hacia el candidato del PRI mejoran casi un 11% en la casa con
respecto a la calle, y lo contrario ocurre con los candidatos del PAN y del PRD”. [Basañez en Ai Camp
1997: 179-180].

I.2. FORMAS DE OBTENCIÓN DE DATOS

La base para el trabajo estadístico, es decir los datos, se pueden obtener de manera indirecta, por ejemplo
al utilizar la información de los censos nacionales o de algún tipo de organización o institución, o de
manera directa, llenando fichas, cédulas de observación o aplicando cuestionarios. En aplicaciones reales,
lo más común es que la parte inicial o básica de un estudio se apoye en datos generales que no se hayan
obtenido de manera directa (por ejemplo, distribución general de la población por edades, niveles de
escolaridad, distribución de actividades por entidad federativa) y que la parte medular y las conclusiones
descansen en datos obtenidos en forma directa, por ser específicos para el problema que se está
analizando.

En muchas ocasiones en la investigación científica es necesario recurrir a la obtención directa de datos, ya


sea al emplear fichas o cédulas de observación en las que se registran características de interés, o bien al
diseñar un cuestionario cuyas respuestas nos permitan conocer las características de quien responde, su
opinión, las condiciones reales en las cuales se encuentra en relación con algún aspecto específico, como
podría ser trabajo, educación y capacitación, salud, relaciones interpersonales, empleo del tiempo libre,
etcétera.

5
Cuando los datos se obtengan de manera directa, será necesario apoyarse en el muestreo, diseñar el
instrumento de recolección, coordinar la recopilación de datos y su procesamiento, para finalmente hacer
en análisis de la información y efectuar el informe o informes finales en que se basará la toma de
decisiones.

I.3. LINEAMIENTOS PARA LA ELABORACIÓN DE CUESTIONARIOS

Aquí, trataremos de revisar los pasos que deben seguirse para diseñar cuestionarios de fácil aplicación,
que se puedan codificar en corto tiempo y con un mínimo de errores, y cuyas características permitan su
eventual procesamiento por computadora.

A primera vista parece que diseñar un cuestionario es cosa fácil, después de todo mucho de nuestro
aprendizaje lo realizamos a base de preguntas, en la infancia casi enloqueciendo a nuestros familiares más
cercanos y en la escuela poniendo en aprietos a los profesores.

Pero es aquí donde se encuentra el primer obstáculo que debemos vencer. No es lo mismo hacer
preguntas en desorden y para cubrir intereses personales, los cuales cambian en poco tiempo, que intentar
realizar un trabajo metódico, que cubra las necesidades de un objetivo de investigación bien planteado.

I.3.1. Objetivo de la encuesta

De acuerdo con los pasos de la metodología de investigación, en primer lugar es necesario tener
expresado con claridad cuál es el objetivo general de la investigación dentro de la que se usará un
cuestionario para la obtención directa de datos. Los objetivos específicos de las diferentes fases de la
investigación también deben estar enunciados en forma concisa e inequívoca, así como las hipótesis, si las
hay.

Si un objetivo puede interpretarse de varias maneras diferentes, de acuerdo con opiniones subjetivas, está
mal planteado y debe revisarse, hasta que no haya lugar a más dudas.

Esto no significa que más adelante no se pueda revisar, e incluso replantear, algún objetivo. Conforme
avanza una investigación, nuestro conocimiento de la realidad estudiada cambia y esto puede reflejarse en
la adecuación y planteamiento corregido de alguno de los objetivos e incluso de las hipótesis.

Pero cuidado, no se trata de hacer cambios para trabajar menos o para reflejar algunas ideas "copiables"
que hayamos encontrado al efectuar revisiones bibliográficas u observar el trabajo de algunos colegas,
cambiando continuamente, ya que así no se logrará avanzar.

El objetivo de la encuesta depende por completo del objetivo general de la investigación. Una vez
planteado correctamente el objetivo general, en primer lugar es necesario analizar si bajo este objetivo se
justifica la obtención directa de datos por medio de una encuesta.

En caso afirmativo, se procede a plantear el objetivo de la encuesta. Este objetivo debe estar acorde con el
objetivo general y de ninguna forma puede implicar abarcar aspectos de la realidad que excedan los
límites del objetivo general, ya que esto sería absurdo. En esta fase ocurre con frecuencia que nos demos
cuenta de algunos errores en el planteamiento del objetivo general, por lo que es otro momento de
revisión y corrección que debemos aprovechar.

No se debe avanzar hasta no tener planteados el objetivo general, los objetivos específicos y el objetivo
de la encuesta.

6
En esta etapa también se empiezan a presentar algunas preguntas sobre la población a la cual pretendemos
encuestar, sobre las posibilidades de acceso a quienes deseamos interrogar y sobre algunos problemas
relacionados con el trabajo de campo.

I.3.2. Población que se va a encuestar

Como ya se mencionó antes, al aplicar un cuestionario, podemos hacerlo con todos los individuos de un
grupo de interés, a lo cual se denomina censo, o bien con una muestra o parte representativa de ese grupo.

Lo más común es que se trabaje con una muestra representativa, de tamaño probabilísticamente correcto,
que represente a toda la población. A partir de este punto, cuando hablemos de población nos referiremos
a los individuos que se van a encuestar, sin preocuparnos si se trata de todos o de una parte, para
simplificar la terminología.

Al diseñar un cuestionario debemos tomar en cuenta las características de la población que lo va a


responder, tanto para adecuar el lenguaje que utilicemos como para decidir cuáles son los temas que
cubrirá el cuestionario.

Desde luego, los temas están regidos sobre todo por el objetivo, pero puede suceder que algún tema de
interés se encuentre por encima de los conocimientos de la población encuestada. Por ejemplo, si nuestro
objetivo se relaciona con las condiciones laborales de profesores e investigadores universitarios, y si la
encuesta se va a aplicar precisamente a este tipo de personal académico, aunque sea de interés saber
cuáles son los mecanismos de obtención y asignación de presupuestos no podemos preguntarlo en el
cuestionario, ya que son las autoridades las únicas que podrían contestar sobre estos temas.

Podemos concluir esta sección señalando que los objetivos, los temas que se cubran y el lenguaje
utilizado en un cuestionario deben ser adecuados a la población que se va a encuestar.

I.3.3. Selección de los temas que abarcará la encuesta

Como ya se dijo, una vez definidos los objetivos general y específicos del estudio y de la encuesta, se
deberá decidir con toda claridad cuál es la población que se va a encuestar. Al pensar en la población, casi
de inmediato se puede empezar a enumerar cuáles son las capas o estratos de esa población que nos
interesan en especial; es común que hombres y mujeres tengan diferentes preferencias u opiniones en
ciertos temas, que los distintos grupos de edad reaccionen de diversas formas ante determinadas
condiciones de la realidad, que los estudiantes de cada turno tengan problemas y características
diferentes, y demás. Este es el siguiente nivel en el que se debe subdividir a la población, para decidir
cuántas encuestas se aplicarán en cada uno de estos estratos y que nos ayuden a obtener datos
relacionados directamente con nuestro objetivo.

Ahora, ya se está en condiciones de empezar a listar todos los puntos o temas que deseamos abarcar en
nuestras preguntas. En primer lugar, siempre debe plantearse un conjunto de preguntas que nos
proporcionen un perfil mínimo de nuestros encuestados, ya que es indispensable saber quién nos
respondió.

En el perfil del encuestado por lo general se incluyen puntos como sexo, edad, ocupación, nivel de
ingresos; otras preguntas de esta sección surgen del objetivo de la encuesta. Por ejemplo, turno y carrera
serían parte del perfil en una encuesta aplicada a estudiantes universitarios. Adscripción y antigüedad se
usarían casi en cualquier encuesta a trabajadores. Derechohabiente o beneficiario en el caso de usuarios
de servicios de salud. La definición del perfil del encuestado es muy importante e incluye preguntas para
determinar a qué estrato de la población encuestada corresponde cada cuestionario. Las preguntas

7
relacionadas con el perfil del encuestado se colocan por lo común al inicio del cuestionario y ayudan a
iniciar la comunicación encuestador-encuestado. Como casi siempre son fáciles de responder y rara vez
implican una toma de posición u opinión del encuestado, resultan un buen punto de partida.

A pesar de esto, algunos diseños de encuesta colocan estas preguntas al final y entonces se aprovecha el
momento para solicitar al encuestado su consentimiento para una posible entrevista a profundidad o para
su asistencia a una sesión de grupo de control, tomando sus datos de localización.

Desde luego, el perfil del encuestado sólo es un tema del cuestionario y es el más fácil de decidir, ya que
debe incluirse siempre. Pero, ¿de dónde salen los demás temas? Al analizar con cuidado el objetivo de la
encuesta y las características que nos interesa observar en la población que se va a encuestar empezarán a
surgir los temas.

Se recomienda una sesión de lluvia de ideas en la que participen todas las personas involucradas en la
investigación. Es importante anotar todos los temas, e incluso preguntas ya planteadas, que surjan en esta
etapa.

El siguiente paso consiste en ordenar los temas, tratando de seguir una secuencia lógica que facilite las
respuestas del encuestado. Puede afirmarse que una parte importante del éxito de la aplicación de un
cuestionario radica en que los temas estén bien ordenados, ya que no podemos pedir al encuestado que
cambie de línea de pensamiento según nuestro capricho.

Por ejemplo, si nuestro objetivo general es hacer una evaluación sobre los problemas de vivienda de
personas que habitan zonas de poblamiento irregular, algunos temas serían: perfil, condiciones de trabajo,
características del grupo familiar, actividades económicas, características de la vivienda, condiciones y
problemas de transporte, condiciones y problemas de propiedad y arrendamiento, medios y distribución
del ingreso. Como se puede observar, estos temas no están ordenados. Si se plantean preguntas para cada
uno de estos temas, así como están anotados, tendremos un cuestionario difícil de responder. Los
recomendable es agrupar los temas e ir ordenándolos por grupos, para después decidir si todos se
conservan en el cuestionario.

Para el ejemplo, condiciones de trabajo, actividades económicas y distribución del ingreso son temas
relacionados; características de la vivienda, condiciones y problemas de propiedad y arrendamiento, así
como condiciones y problemas de transporte serían dos grandes bloques, para los que habría que decidir
un orden, antes de empezar a plantear preguntas para cada tema.

I.3.4. Posibles variables asociadas a cada tema

Una vez seleccionado y ordenados los temas que abarcará un cuestionario, si pretendemos procesarlo por
computadora usando un paquete estadístico como SPSS, SAS o Stat Graphics, es necesario decidir y listar
cuáles son las variables que nos interesa evaluar para cada tema. Usando la terminología de SPSS, un
caso es la unidad básica de análisis para la cual se van a obtener mediciones, es decir que cada
cuestionario equivale a un caso. Cada caso está caracterizado por una serie de valores y cada valor
corresponde genéricamente a una variable. Por ejemplo, si se aplica un cuestionario para obtener
información sobre el consumo de una serie de productos, serían variables importantes, además del perfil
del encuestado, la frecuencia de uso y las diferentes posibles razones de la preferencia dentro del tema
uso y preferencia; la opinión sobre ciertas características de los productos nos daría otro conjunto de
variables importantes; en el caso de la variable opinión, ésta podría tomar los valores favorable,
desfavorable y neutra, para cada producto.

8
Es recomendable anotar en columna los temas, en el orden en que se piense presentarlos en el
cuestionario y escribir frente a cada tema la lista de las variables que se considere sean relevantes.

Por ejemplo, estos podrían ser algunos temas y variables asociadas en una encuesta para definir el perfil
de los estudiantes de bachillerato de una institución educativa:

TEMA VARIABLES

Datos generales Turno de inscripción


Plantel
Edad
Sexo
Estado civil

Características del núcleo Personas con las que vive


Familiar Responsable(s) económicos
Ocupación de los padres
Nivel de estudio de los padres

Aspectos económicos Origen del dinero que gasta


Cantidad que gasta
¿Contribuye al gasto familiar?

Vivienda Delegación en que vive


¿Vivienda propia?
Electrodomésticos en casa

Conforme se avance en la anotación exhaustiva de variables relevantes para cada tema se detrminará si
estos temas son o no válidos, e incluso pueden llegar a surgir nuevos temas y desecharse algunos que
parecían de importancia. Desde luego, al hacer cualquier modificación no deben olvidarse nunca los
objetivos y lascaracterísticas de la población que se va a encuestar.

I.3.5. Selección de temas y variables definitivas

Ahora es necesaria una revisión a fondo de esta lista, para determinar qué temas y variables se van a
conservar para a partir de esto hacer la primera versión del cuestionario. Es importante considerar cuál es
el orden más adecuado, primero para los temas y después para las variables asociadas a cada tema. No
hay que olvidar que un cuestionario bien ordenado facilita la obtención de respuestas lógicas y veraces.

Lo primero que se debe hacer es revisar, otra vez, si cada tema en verdad corresponde al objetivo general
del cuestionario, si es factible que la población que se va a encuestar se encuentre en posibilidad de dar
datos sobre el tema y si el tema es relevante para los objetivos de la investigación.

Una vez aprobado un tema, habrá que revisar si las variables anotadas corresponden a ese tema y si es
factible que la población que se va a encuestar se encuentre en posibilidad de informar con respecto a
cada variable. En esta etapa, lo último que se hace es reordenar los temas y reordenar las variables de
cada tema.

9
I.3.6. Planteamiento de las preguntas

En esta fase del diseño del cuestionario se plantearán las preguntas correspondientes a las variables
anotadas para cada tema. Si no se realizó una lista de variables por tema, se plantearán preguntas
relacionadas con cada tema y luego se tratará de dejar sólo las que sean relevantes, para por ultimo
ordenarlas.

I.3.7. Tipos de preguntas

En los cuestionarios se pueden usar preguntas de varios tipos:

Las preguntas abiertas son aquellas a las que el encuestado responde con sus propias palabras, ya que no
incluyen opciones de respuesta.

Las preguntas cerradas van seguidas por una serie de opciones, de ser posible mutuamente excluyentes,
de entre las cuales el encuestado ha de elegir o el encuestador marca a partir de lo que el encuestado diga
libremente.

Es una creencia generalizada que el empleo de computadora y de un paquete estadístico para el


procesamiento de los datos de un cuestionario obliga al uso exclusivo de preguntas cerradas. Aunque es
mucho más fácil preparar para su procesamiento, es decir codificar, un cuestionario cuyas preguntas sean
cerradas, las respuestas a una pregunta abierta se pueden agrupar y dar una clave a cada grupo para poder
procesarlas.

Veamos dos ejemplos:

Pregunta abierta

¿Dónde aprendió a usar computadora? _____________________


(Anote la respuesta completa)

Pregunta cerrada

¿Dónde aprendió a usar computadora?

En el bachillerato ___
En trimestres anteriores en la UAM ___
En un curso de la UNAM ___
En un curso en el trabajo ___
Con los compañeros de trabajo ___
En otro tipo de curso ___
Otro (especifique) __________________________

Desde luego, en el caso de la pregunta cerrada será muy fácil dar claves a cada opción para su proceso por
computadora.

Pero hay que analizar varias cosas. En primer lugar, las opciones que se están dando para cerrar la
pregunta deben tener alguna relación con la realidad. Uno se pregunta de dónde salieron las opciones y
porqué se usan esas opciones y no otras.

10
Además, las opciones deben ser lo suficientemente claras para que el encuestado (o bien el encuestador)
pueda decidirse sin dificultad por alguna de ellas. Otra característica conveniente, aunque no siempre sea
posible, es que las opciones sean mutuamente excluyentes, lo cual equivale a que no sea posible
seleccionar más de una de ellas.

Por otra parte, la opción "Otro (especifique)" en realidad equivale a una pregunta abierta, ya que se puede
presentar cualquier valor para la variable. Ahora, queda por definir cómo codificarla.

Es común combinar preguntas abiertas y cerradas en un cuestionario, para tener un mejor acercamiento a
las verdaderas actitudes, opiniones o preferencias de los encuestados. Si sólo se utilizan preguntas
cerradas, es probable que se obtengan respuestas mecánicas, además de que se depende por completo de
la buena selección de las opciones presentadas.

Si en las preguntas cerradas se incluye la opción

Otro (especifique) _______________________

se da al encuestado la posibilidad de expresarse, aún cuando lo que tenga que decir no se haya
considerado inicialmente. Más adelante se explica cómo codificar estas respuestas.

En las preguntas cerradas es conveniente considerar como opción "No sabe/no está seguro" o "No
contesta", ya que en ocasiones el encuestado no está en posibilidad de responder y también es muy común
que en preguntas de opinión no todos los encuestados deseen dar una respuesta.

Por otra parte, si se emplean sólo preguntas abiertas que provoquen respuestas largas y complejas, se está
más cerca de una entrevista estructurada que de una encuesta. Las entrevistas estructuradas o a
profundidad son una forma de obtención de datos muy importante, que tiene su propio campo de uso; se
aplican a pocas personas, seleccionadas con base a criterios tales como su conocimiento experto sobre un
tema, por lo general se graban en cinta magnética, se transcriben y analizan.

Una encuesta se diseña para aplicarse a un parte muestra representativa de la población e incluso a toda
la población, se anota en las formas de un cuestionario y se caracteriza por un cierto dinamismo en el
planteamiento de las preguntas y la obtención de respuestas. Casi siempre estará destinada a procesarse
por computadora para la rápida obtención de conteos y estadísticas.

I.3.8. Selección a priori de opciones para preguntas cerradas

Una parte importante del diseño de un cuestionario es la que corresponde a las opciones que se anotan
para las preguntas cerradas.

Hay preguntas, como estado civil, cuyas opciones de cierre no presentan dificultad alguna. En cambio
habrá otras preguntas que nos resulte difícil cerrar a priori.

Para elegir a priori las opciones de cierre, lo recomendable es basarse en la experiencia sobre el tema, sin
olvidar incluir la posibilidad "Otro (especifique)"; después de la prueba piloto, que consiste en una
aplicación preliminar del cuestionario y cuyas características se revisan con detalle en la próxima sección,
se revisa el funcionamiento de las opciones, eliminando aquellas que no hayan seleccionado los
encuestados y revisando con cuidado los resultados de la ultima opción "Otro (especifique)", para
incorporar como opciones las respuestas no previstas que hayan ocurrido un elevado numero de veces.

11
Consideremos de nuevo la pregunta

¿Dónde aprendió a usar computadora?

con las opciones

En el bachillerato ___
En trimestres anteriores en la UAM ___
En un curso de la UNAM ___
En un curso en el trabajo ___
Con los compañeros de trabajo ___
En otro tipo de curso ___
Otro (especifique) _______________________

dadas a priori por quien diseño la encuesta.

Si después de la prueba piloto se observa que hubo muchas personas que eligieron la opción "Otro
(especifique)" y anotaron variaciones de la respuesta "Con los compañeros de clase", será conveniente
incluir esta respuesta como una opción más. Por el contrario, si casi nadie eligió la opción "En un curso
en la UNAM", deberá considerarse la posibilidad de eliminarla.

Una vez realizada la prueba piloto, la pregunta podría quedar así:

¿Dónde aprendió a usar computadora?

En el bachillerato ___
En trimestres anteriores en la UAM ___
En un curso en el trabajo ___
Con los compañeros de trabajo ___
Con los compañeros de clase ___
En otro tipo de curso ___
Otro (especifique) _______________________

I.3.9. Primera versión del cuestionario

Si se han seguido los pasos marcados hasta aquí, en este momento se tendrá una serie de preguntas,
agrupadas por temas. Aunque parezca repetitivo, de nuevo es necesario revisar el orden en que se están
planteando las preguntas, cuidando que para el encuestado resulte fácil contestarlas.

También debe revisarse con cuidado el orden de las opciones dadas para las preguntas cerradas y verificar
que no existan opciones en apariencia diferentes que expresen la misma posible respuesta. Con las
preguntas abiertas en especial, aunque también puede suceder en las preguntas cerradas, existe el peligro
de estar incluyendo más de una variable en la misma pregunta, lo cual se conoce como preguntas
multidimensionales. Por ejemplo, si se pregunta "Está Ud. de acuerdo con sus actuales condiciones de
trabajo y con los mecanismos de promoción" en realidad se están explorando dos cosas diferentes y un
encuestado podría estar de acuerdo con las condiciones de trabajo y no estar de acuerdo con los
mecanismos de promoción, o viceversa.

Como la aplicación de un cuestionario se realiza en forma rápida, cuando se comete el error de presentar
preguntas multidimensionales, lo más probable es que el encuestado responda a la parte de la pregunta
que le importe más o que recuerde al momento de emitir su respuesta; si se aplica en forma definitiva un

12
cuestionario con este tipo de defecto, el cual se descubrirá al momento de realizar la codificación final,
será necesario eliminar del proceso la pregunta mal planteada con la consiguiente pérdida de trabajo y de
datos.

Volviendo al ejemplo, la pregunta "Está Ud. de acuerdo con sus actuales condiciones de trabajo y con los
mecanismos de promoción", en realidad debería plantearse como dos preguntas separadas, así:

PR1 ¿Está Ud. de acuerdo con sus actuales condiciones de trabajo?

PR2 ¿Está Ud. de acuerdo con los mecanismos de promoción?

Si se quisiera dar opciones, éstas podrían ser:

PR1 ¿Está Ud. de acuerdo con sus actuales condiciones de trabajo?


SÍ ____ NO ____ NO RESPONDE ____

PR2 ¿Está Ud. de acuerdo con los mecanismos de promoción?


SÍ ____ NO ____ NO RESPONDE ____

Pero si nos interesara además saber la razón, plantear las preguntas y sus opciones así:

PR1 ¿Está Ud. de acuerdo con sus actuales condiciones de trabajo?


SÍ ____ NO ____ NO RESPONDE ____
¿PORQUÉ? (anote la respuesta) ___________________________

PR2 ¿Está Ud. de acuerdo con los mecanismos de promoción?


SÍ ____ NO ____ NO RESPONDE ____
¿PORQUÉ? (anote la respuesta)___________________________

nos presentaría problemas a la hora de codificar.

Lo más recomendable es emplear esta forma:

PR1 ¿Está Ud. de acuerdo con sus actuales condiciones de trabajo?


SÍ, PORQUE ___________________________________________
NO, PORQUE___________________________________________
NO RESPONDE ____

PR2 ¿Está Ud. de acuerdo con los mecanismos de promoción?


SÍ, PORQUE ___________________________________________
NO, PORQUE___________________________________________
NO RESPONDE ____

Con lo que estaremos efectuando un agrupamiento previo de SÍ o NO con su causa. Cuando se realice la
codificación, será necesario hacer una lista de las diferentes causas que expresen los encuestados.

Al concluir esta revisión, se tendrá listo un preliminar del cuestionario. Dependiendo de las condiciones
en que se vaya a aplicar el cuestionario, tal vez sea necesario hacer una prueba con un solo cuestionario,
tomando el tiempo que se lleva y eliminar algunas preguntas, para tener un tiempo de llenado que resulte
razonable.

13
Un cuestionario que se aplique en la calle, en las filas para asistir a espectáculos, en bancos, en lugares de
servicio o en puntos de afluencia, no debe requerir más de diez minutos para responderse, ya que puede
suceder que el encuestado se marche sin terminar de contestar.

Si un cuestionario se va a aplicar a grupos escolares completos, a todos los trabajadores o empleados de


una institución, o si se realizó una cita para aplicarlo, se tiene la posibilidad de encuestar a más
profundidad, utilizando más tiempo.

Después de verificar tiempos, se ha llegado a la primera versión del cuestionario, la cual debe someterse a
una prueba, según se detalla en la siguiente sección, para así llegar a la versión final o definitiva.

I.3.10. La prueba piloto

Una vez que se ha llegado a la primera versión del cuestionario, formada por un conjunto de preguntas
abiertas y cerradas que siguen un orden que hemos considerado fácil de responder para el encuestado,
expresadas en un lenguaje adecuado para la población que nos interesa, con una duración que
consideramos soportable para los encuestados y que corresponde a los objetivos planteados al inicio del
trabajo, es necesario realizar la prueba piloto.

Esta prueba consiste en aplicar el cuestionario a personas con características semejantes a la población
que en definitiva se quiere estudiar.

Lo más conveniente es que quienes realicen la prueba piloto sean los mismos encuestadores que habrán
de participar en la aplicación definitiva, ya que les servirá de entrenamiento y les permitirá familiarizarse
con las preguntas y las opciones, cuando se trate de preguntas cerradas.

El número de encuestas aplicadas en la prueba piloto no tiene que ser muy grande, ya que incrementa los
costos en tiempo y en gastos; una regla práctica para investigaciones realizadas por estudiantes o con
encuestadores voluntarios, consiste en hacer que cada uno de los ellos aplique al menos tres cuestionarios.

Es muy importante que al realizar la prueba piloto cada encuestador anote cualquier observación que
permita afinar el cuestionario: puntos en los que los encuestados expresen dudas o pidan explicaciones;
opciones que no resulten comprensibles para los encuestados; fatiga, aburrimiento o pérdida de interés
por parte de los encuestados y cualquier otro problema que se presente.

Todo lo anterior se debe tomar en cuenta al revisar el cuestionario para llegar a una versión definitiva
acorde con la realidad. El lenguaje usado se puede adecuar, el orden de preguntas y opciones mejorarse.
Si el cuestionario es largo, tal vez se deje sólo lo más importante para lograr una buena calidad en las
respuestas al realizar la aplicación definitiva.

Además, se revisará pregunta por pregunta para eliminar aquellas a las que todos los encuestados hayan
respondido de la misma forma. Se analizarán una por una las opciones de las preguntas cerradas, para
dejar sólo las que estén usándose y tomar de la opción "Otros (especifique)" aquellas respuestas que se
hayan repetido mucho para anotarlas como nuevas opciones.

En cuanto a las preguntas abiertas, este es el momento para determinar si es posible cambiar alguna o
algunas de ellas a preguntas cerradas, con opciones que se determinan a partir de las respuestas dadas en
la prueba piloto.

Una vez efectuada a fondo esta revisión, se tendrá la versión definitiva del cuestionario. Al mecano
escribir esta última serie de preguntas abiertas y cerradas, si se desea facilitar el trabajo de codificación,

14
debe reservarse una columna a la derecha, en la que sólo se colocarán líneas o casillas para llenarlas con
la clave correspondiente a las respuestas, así:

5. ¿Crees que la computación es importante en el /___/


desempeño profesional?
Indispensable ___
Mucho ___
Poco ___
Regular ___
Nada ___

I.3.11. Resumen

En general, los pasos que se deben seguir para diseñar un cuestionario son:

1. Planteamiento del objetivo general de la investigación.

2. Planteamiento de los objetivos específicos de la investigación.

3. Planteamiento de hipótesis, si las hay.

4. Decidir si se requiere obtención directa de datos por medio de una encuesta. Otras posibilidades son las
fichas de observación o las entrevistas dirigidas.

5. Planteamiento del objetivo del cuestionario.

6. Determinación de cuál es la población que se va a encuestar.

7. Decidir si se hará en forma de censo o para una muestra.

8. Si se va a muestrear, determinación del tamaño y características de la muestra.

9. Determinación de los estratos de la población que resultan de interés.

10. Determinación de los puntos que servirán para definir el perfil del encuestado.

11. Lluvia de ideas para obtener la lista preliminar de temas que se desea cubrir en el cuestionario.

12. Ordenamiento y revisión de la lista, para tener los temas definitivos ya ordenados.

13. Lista preliminar de variables de interés por tema.

14. Lista de temas y variables ordenados.

15. Planteamiento de preguntas abiertas y cerradas, de acuerdo con las variables de interés.

16. Selección de opciones para las preguntas cerradas.

17. Depuración de la lista de preguntas.

18. Determinación del tiempo que lleva responder el cuestionario.

15
19. Primera versión del cuestionario.

20. Entrenamiento de los encuestadores.

21. Aplicación del cuestionario a encuestados con características similares a las de la población de interés.

22. Lista de las propuestas de modificación.

23. Versión definitiva del cuestionario.

I.3.12. Codificación del cuestionario

Como se indicó en la sección anterior, al escribir la versión definitiva del cuestionario, si se desea facilitar
el trabajo de codificación, debe reservarse una columna a la derecha, en la que sólo se colocarán líneas o
casillas para llenarlas con la clave correspondiente a las respuestas.

A fin de poder procesar los datos de un cuestionario usando computadora, es necesario asignar claves o
códigos a los diferentes valores que puede tomar cada variable.

Cuando se utilizan sólo números, se dice que la variable a la que corresponden es una variable numérica.
Las variables numéricas pueden ser enteras (por ejemplo 1, 2, 3) o tener una parte decimal (1.49, 1.50,
1.51, 1.52).

Si se emplean letras, la variable es alfanumérica. En la mayoría de los paquetes estadísticos resulta


recomendable que las variables alfanuméricas no toman valores formados por más de cuatro caracteres.

Volviendo al ejemplo de la sección anterior,

5. ¿Crees que la computación es importante en el /___/


desempeño profesional?
Indispensable ___
Mucho ___
Poco ___
Regular ___
Nada ___

Si se decide que las variable PR5, es decir PRegunta 5, sea numérica, la codificación podría ser:

1 = Indispensable
2 = Mucho
3 = Poco
4 = Regular
5 = Nada

Entonces, si alguien hubiera contestado:

5. ¿Crees que la computación es importante en el /___/


desempeño profesional?
Indispensable ___
Mucho _X_

16
Poco ___
Regular ___
Nada ___

Al codificar el cuestionario, preparándolo para la captura de datos por computadora, quedaría así:

5. ¿Crees que la computación es importante en el /_2_/


desempeño profesional?
Indispensable ___
Mucho _X_
Poco ___
Regular ___
Nada ___

Por otra parte, se pudo preferir esta codificación con letras:

A = Indispensable
B = Mucho
C = Poco
D = Regular
E = Nada

Pero en general, resulta poco recomendable elegir combinaciones de cuatro letras que intenten ser una
abreviatura del valor codificado, ya que es difícil recordarlas y, lo que es más importante, escribirlas sin
errores como es la inversión de letras.

Una codificación como ésta:

IN = Indispensable
MU = Mucho
PO = Poco
RE = Regular
NA = Nada

puede parecer sin problemas, pero si consideramos que esto sólo es parte de un cuestionario, veremos que
a la larga resultará difícil no cometer errores.

Aunque los paquetes estadísticos aceptan claves numéricas y alfanuméricas, el proceso de números es
más rápido. En cuanto a la codificación y captura, mientras menos caracteres se utilicen existen menos
posibilidades de error. En las notas sobre proceso de datos por medio del paquete estadístico SPSS se
amplía todo lo referente a tipos de variables y codificación.

I.4. TRABAJO DE CAMPO, CODIFICACIÓN Y CAPTURA

En esta sección se incluyen, en forma de guía listada, las recomendaciones para quienes salen a campo a
aplicar un cuestionario, y para quienes se ocupan de las fases siguientes de codificación y captura, ya que
no importa que tan bueno sea el diseño de un estudio de opinión si no se controla la calidad del trabajo en
estas tres fases.

17
I.4.1. Guía del encuestador

- Al salir a campo no lleves alhajas ni objetos valiosos. Vístete en forma cómoda y normal. Recuerda
que eres un o una estudiante que participa en un trabajo escolar (o un profesional de los estudios de
mercado, si ese es el caso).

- Lleva tu identificación de la escuela (o de la empresa para la que trabajas) y consérvala visible o a la


mano por si hace falta que la muestres.

- Al acercarte a una persona, sonríe y muestra una actitud positiva.

- Identifícate con claridad y explica el objetivo del trabajo. Si a ti no te interesa y no muestras


convencimiento te será más difícil encontrar respondentes.

- Si alguien se niega a la encuesta, da las gracias con amabilidad y retírate.

- No entres en polémicas si alguien cuestiona lo que estás haciendo o se niega de mala manera.
Suspende la interacción y aléjate.

- Si la persona acepta, mírale a los ojos cuando expreses las preguntas y trata de transmitirle tu interés.
A esta forma de comunicación momentánea e intensa entre dos personas que no se conocen pero que
acaban en establecer un objetivo común (la encuesta) se le conoce como rapport. Trata de no
perderlo.

- Para llenar el cuestionario usa LAPIZ y si tienes que rectificar una respuesta, borra rápido o tacha y
escribe lo correcto.

- No dejes que decaiga el interés de la entrevista. Si el encuestado(a) no encuentra una respuesta o se


muestra reacio a responder, continúa avanzando después de dar un reforzamiento positivo (por
ejemplo, “no hay problema, no se preocupe, la siguiente pregunta dice ...).

- No intentes codificar al mismo tiempo que haces las preguntas. Esto tiene efectos negativos:

- Se pierde el rapport, ya que no puedes concentrarte igual en el encuestado.

- No hay manera de verificar si anotas una clave equivocada.

- Aunque creas ganar tiempo, la entrevista se va a prolongar más y la calidad de las respuestas va
disminuir, por la mayor duración y la baja interconexión.

- Al concluir agradece a la persona por el tiempo que te dedicó.

- Antes de seguir con otra entrevista (a menos ya que esté otra persona esperando para responderte)
REVISA el cuestionario que acabas de llenar, borra bien si hay tachones o errores y verifica que
todos tus cuestionarios estén completos y legibles. Recuerda: otras personas van a trabajar con este
material y tú mismo después de varios días en campo no vas a poder descifrar de memoria símbolos
extraños.

- Si conoces bien el cuestionario, estarás en posibilidad de detectar cuando la respuesta que obtuviste
no corresponde a la pregunta planteada:

18
Por ejemplo: Sexo: masculino
Ocupación: “Estoy en mi casa”
o “Me ocupo de la casa”

Esto no implica que el encuestado sea “ama de casa”. Dependiendo de la edad, puede tratarse de un
desempleado, un jubilado, alguien que abandonó la escuela o tiene problemas con su inscripción al pasar
de un nivel escolar a otro. En estos casos, el criterio del encuestador sirve para decidir si se explora más a
fondo la respuesta o se registra como “No responde”. Si no se resuelve el problema, en la verificación
lógica alguien va a tener que buscar entre todos los cuestionarios para saber qué pasó y esto toma tiempo,
mientras que al momento esto se puede aclarar, sobre todo si usas tu criterio en forma adecuada Recuerda,
se trata de trabajo en equipo.

Otro ejemplo: Número de personas en casa: “75”.

En realidad, lo más probable es que la pregunta se refiera a “número de integrantes del núcleo familiar”,
pero esta terminología técnica, a pesar de ser muy precisa, no puede usarse como tal. Aquí es necesario
explorar la causa de un valor tan elevado, que puede deberse a que se trate de una casa de huéspedes, de
estudiantes o algún otro arreglo diferente de núcleo familiar, que es lo que interesaba. Además de anotar
al margen la cifra inicial y su causa, debes marcar NS/NR (no sabe/no responde) para no alterar las
estadísticas finales.

Casos semejantes ocurren cuando el encuestado declara tiempo muy prolongado de transporte, alto
número de viajes al día, etcétera.

Es equipo recomendable para el trabajo de campo un porta gafete con tu credencial y una tabla con clip en
que apoyar tus cuestionarios.

RECOMENDACIÓN: Por cuestiones de seguridad es conveniente trabajar en parejas, aunque teniendo


cuidado de no intimidar a los encuestados, ya que la sesión debe ser solamente con un encuestador. Se
puede trabajar “por turnos” y aprovechar los tiempos vacíos para revisar el cuestionario anterior.

I.4.2. Guía del codificador

- La labor de codificación es muy importante, no se trata de anotar cualquier número para terminar lo
más pronto posible.

- Para todas las preguntas cuyas respuestas ya tengan asignado código, utiliza esos valores y trata de no
cometer errores.

- En el caso de las preguntas abiertas, es necesaria una sesión de grupo para unificar criterios en cuanto
a los códigos que se van a asignar.

- Las respuestas imprevistas deben tomarse en consideración, aunque parezca lo más fácil mandarlas a
“otros” o “NS/NR”.

- En el caso de “otro _________ (especifique)” las respuestas que ocurren con alta frecuencia deben
tomarse en cuenta para abrir nuevos valores de la variable.

- Anota las claves de cada variable en el lugar designado para ello y procura escribir lo más legible
posible, con LAPIZ que tenga buena punta.

19
- Mantén bien afilada la punta del lápiz, para lograr una escritura legible.

I.4.3. Guía del capturista

- Trata de concentrarte en tu trabajo, ya que esto te facilitará las cosas y disminuirá errores.

- Recuerda que eres parte de un equipo y cada error que cometas afecta el trabajo de los demás.

- Si vas a teclear sólo números, lo mejor es que actives el teclado de calculadora al oprimir la tecla de
“Bloqueo numérico” y trabajes ahí con la mano derecha, así te cansas menos, disminuyen los errores
y avanzas más rápido.

- Si crees haber cometido un error, no avances más y verifica. Si tienes dudas, repite o revisa todo el
cuestionario .

- Cuando observes valores fuera de lo normal, verifica si se debe a un error de codificación y si no es


así, anota el número de caso, la variable y el valor correspondiente. Un informe de este tipo ayudará
mucho en la depuración de la base de datos.

- Son errores comunes en captura:

- Capturar dos veces el mismo cuestionario.


- Dejar sin capturar algún cuestionario.
- Teclear 6 en vez de 9 o viceversa.
- Teclear la letra O (o mayúscula) en vez del número cero (0).
- Teclear la letra l en vez del número 1.
- Invertir números, como cuando 19 se vuelve 91.
- Capturar mal los valores faltantes:
99 se vuelve 9
98 se vuelve 8
ya que casi siempre ocurren pocas veces.

- Al terminar, debes guardar tus archivos con el nombre que se te indicó, no con cualquier otro que se
te ocurra de momento, ya que esto dificulta mucho la labor de quien va a unir los archivos de datos.

- Si tu disquete contiene otro archivo, carpetas o directorios, NO coloques tu archivo de datos dentro de
un directorio. De nuevo, esto dificulta la unión de los archivos de datos.

- Procura aprovechar bien el tiempo de computadora asignado para que efectúes la captura que te
corresponde, ya que no es fácil ampliar estos horarios y casi siempre existe un término fijo en cuanto
al tiempo para esta parte de una investigación.

NOTA.- Como parte del esquema de captura de cuestionarios largos es muy recomendable que se dejen
columnas en blanco, que después se eliminarán, al menos al terminar cada par de páginas del
cuestionario. Esto facilita las revisiones.

20
I.4.4. El primer análisis (esta breve sección se basa en una comunicación escrita directa de Sabrina
Karam Cedillo, Investigadora y Ejecutiva de Pearson)

1. Ser muy perceptivos para traducir de manera objetiva y práctica lo que nos dicen las cifras.
2. Exponer los resultados con claridad para que todas las personas que consulten el estudio puedan
entender esos resultados, aunque no entiendan cómo se llegó a ellos.
3. Limitarse a analizar los resultados de la investigación, que para eso son. Por supuesto se vale
conceptualizar pero nunca se debe dejar de subrayar eso.
4. Los resultados del estudio únicamente van a responder a lo que yo pregunté, lo que se me olvidó, se
me pasó o tal vez no consideré importante, ya se perdió. No se deben crear falsas expectativas y
prometer que de un estudio surgirán resultados que lo rebasen.
5. Hacer reportes prácticos, sencillos y coherentes en los que las conclusiones se apoyen en los
resultados del estudio.
6. Los resultados no son lo que nosotros pensamos que pasa, es lo que la gente piensa que pasa. Los
entrevistados opinaron, los resultados indican.

21
SEGUNDA PARTE: MÉTODO CIENTÍFICO, ESTADÍSTICA Y MUESTREO

II.1. MÉTODO CIENTÍFICO DE INVESTIGACIÓN

El empleo de la estadística dentro de la investigación basada en el uso del método científico, tanto en
Ciencias Sociales como en aspectos administrativos relacionados con la toma de decisiones resulta cada
vez más importante. En general, como veremos más adelante, se puede decir que la metodología de
investigación determina la calidad de la información en la cual se basan tanto la descripción del
comportamiento de variables e indicadores, como la toma de decisiones. A fin de ayudar al lector en sus
trabajos de investigación, en esta sección se revisa una serie de conceptos básicos relacionados con la
investigación científica y la estadística.

II.1.1. ALGUNAS DEFINICIONES INICIALES

Para determinar una definición de método científico de investigación se pueden precisar cada uno de sus
términos. Método, que viene del griego methodos, meta, y odos, vía y que se interpreta como la vía con
la cual se logra algo y que se puede generalizar como un modo razonado de obrar. Ciencia es el
conocimiento exacto y razonado que se tiene sobre algo. Investigación es el proceso lógico, objetivo,
reflexivo y crítico que conduce al descubrimiento o conocimiento de datos o fenómenos de cualquier
ámbito.

Al analizar este acercamiento a una definición de método científico de investigación, se aprecian varios
elementos fundamentales, de entre los que conviene resaltar algunos. Se trata de un proceso lógico, lo
cual marca que este tipo de investigación debe seguir una serie de etapas en secuencia y con una
congruencia racional; debe trabajarse con objetividad, lo cual implica que la labor científica de
investigación ha de realizarse con imparcialidad, a fin de obtener conclusiones y resultados válidos y
confiables, que permitan generalizaciones probabilísticamente confiables; y además se requiere que este
proceso sea reflexivo y crítico, por lo que la vía que se siga debe tomarse con detenimiento, mesura,
planeación y control, aplicando juicios críticos a cada paso, a fin de llegar a resultados rigurosamente
valorados, ya que los cuestionamientos llevan a agotar todos los posibles caminos de adquisición de
información y conocimiento.

Entonces, se puede concluir que el método científico de investigación no es sino la vía o modo razonado
de trabajar para alcanzar un conocimiento exacto y preciso sobre ciertas cosas mediante un proceso
lógico, objetivo, reflexivo y crítico que se sigue para alcanzar ese conocimiento.

II.1.2. ¿PORQUÉ ES NECESARIA LA INVESTIGACIÓN?

En ocasiones pensamos que conocemos algo, sin embargo al intentar profundizar nos percatamos que tal
vez hay algo erróneo en lo que ya sabemos.

En general, se puede afirmar que todo ser humano utiliza su sentido común y su capacidad lógica de
pensar, pero no existe la seguridad de que esto sea suficiente. Por ejemplo, durante el Siglo XV era
aceptable por completo, de sentido común, el pensar que el mundo era absolutamente plano, ya que
cualquiera podía comprobarlo con sólo mirar, pero con sólo mirar no siempre se llega a conclusiones
válidas.

Siempre han caído manzanas de los árboles, las mareas han cambiado y los planetas han girado alrededor
del sol, pero no fue sino hasta que Newton expresó su teoría sobre la masa y la ley de la gravitación
universal que se pudo establecer la relación entre los tres hechos enunciados al inicio.

Cuando "por casualidad" un científico descubre cuál es la relación entre dos o más fenómenos, en
realidad no se trata de una verdadera casualidad en el sentido común del término, sino de la

22
concatenación de una serie de descubrimientos y hechos parciales, combinada con un conocimiento cada
vez más profundo de aquello que se estudia, así que se podría afirmar que "la casualidad" del científico
está muy lejos de aquella del hombre común.

Es por eso que la investigación sistemática y objetiva es muy importante, para poner a prueba las
aparentes verdades del sentido común. El conocimiento subjetivo, basado en las limitadas experiencias
personales debe someterse a toda una serie de contrastaciones y pruebas para así llegar a un conocimiento
objetivo y general.

II.1.3. ¿CÓMO SE PUEDE INSTRUMENTAR LA APLICACIÓN DEL MÉTODO CIENTÍFICO?

El método se inicia con la observación de un hecho específico, lo cual puede llevar al planteamiento de un
problema que interesa resolver.

Si los hechos observados se utilizan para generar una teoría consistente con los hechos, el proceso se
denomina inducción (va de lo particular a lo general) y constituye el primer paso del método científico. El
segundo paso es la deducción (aplica un principio general a un caso particular), cuando nos preguntamos
cuáles son las consecuencias de la teoría y cuáles son las implicaciones específicas que refleja. El acto de
reunir nuevos hechos que permitan decidir si la teoría se confirma o rechaza constituye el tercer paso,
denominado verificación. Por lo general los nuevos hallazgos llevan, por lo menos, a modificar la teoría,
si no es que a rechazarla, lo cual conduce a un nuevo ciclo de inducción, deducción y verificación. Este es
un proceso iterativo, en el cual los nuevos hechos nos llevan a modificar nuestras concepciones iniciales,
denominadas hipótesis, afinándolas y volviéndolas a contrastar con la realidad, para así llegar a un
conocimiento más válido y preciso.

Se podría decir que cuando iniciamos nuestra observación de algo, lo estamos mirando a simple vista y
que al usar el método científico lo que hacemos es utilizar primero un lente de aumento, para después
sustituirlo por microscopios cada vez más poderosos y así llegar a una observación lo más justa y precisa
posible.

II.1.4. LA ESTADÍSTICA COMO HERRAMIENTA BÁSICA DE INVESTIGACIÓN

Uno de los métodos que se utilizan para la validación de hipótesis, sobre todo en investigaciones
descriptivas y causales, es la estadística, cuya importancia ubicaremos ahora dentro del trabajo científico.

En general, se puede decir que en este momento del desarrollo científico existen dos grandes tendencias
en la investigación: la investigación cuantitativa o a lo ancho, y la investigación cualitativa o a
profundidad. Los métodos de investigación cuantitativa, apoyados en la estadística, se basan en el
procesamiento de datos numéricos, mientras que la investigación cualitativa se basa en métodos
antropológicos como la entrevista a profundidad, la investigación participativa y las historias de vida.
Estos dos métodos no son excluyentes, sino que pueden utilizarse en forma complementaria; por ejemplo,
los resultados de una encuesta de opinión basada en una muestra aleatoria de gran tamaño pueden ir
acompañados de la interpretación de pocas entrevistas estructuradas, en las que se haya profundizado
sobre puntos relevantes que en los cuestionarios sólo se hayan tocado en forma superficial a través de dos
o tres preguntas cerradas.

Los problemas metodológicos que enfrenta la investigación por encuestas son:


 De quién recolectar información.
 Qué métodos usar para recolectar información.
 Cómo procesar, analizar e interpretar la información.

y en las diferentes partes de este texto se irán atacando uno a uno.

23
II.2. CONCEPTOS BÁSICOS DE ESTADÍSTICA

Ahora nos ocuparemos de revisar algunas herramientas de tipo estadístico, es decir cuantitativas. Como
sucede con la aplicación de cualquier herramienta de tipo matemático, en primer lugar necesitamos
establecer un lenguaje común, para lo cual a continuación se presentan, de manera breve y sencilla,
algunas definiciones básicas sin las cuales no podríamos trabajar con claridad y precisión.

II.2.1. DEFINICIÓN Y TIPOS DE ESTADÍSTICA

ESTADÍSTICA: Conjunto de técnicas matemáticas que se usan para recolectar, organizar, presentar,
analizar e interpretar datos numéricos con el fin de obtener una descripción del comportamiento
de un fenómeno o para ayudarse en una más efectiva toma de decisiones.

ESTADÍSTICA DESCRIPTIVA: Conjunto de procedimientos empleados para organizar y condensar


grandes volúmenes de datos numéricos, referidos a un mismo universo o población.

ESTADÍSTICA INFERENCIAL: También denominada inferencia estadística o estadística inductiva,


consiste en los métodos necesarios para obtener conclusiones válidas para una población
(totalidad) a partir del análisis estadístico de una muestra (parte).

ESTADÍSTICA NO PARAMÉTRICA: Se trata de una ramificación moderna de la estadística, que se ocupa


de aquellas técnicas de inferencia que no dependen de la naturaleza estadística de la población a
partir de la cual se obtuvo una muestra.

II.2.2. TIPOS DE VARIABLES Y NIVELES DE MEDICIÓN

Antes de avanzar en las definiciones estadísticas, es muy importante hablar de los diferentes tipos de
variables con los que se va a trabajar y de sus niveles.

NIVELES DE MEDICIÓN: El tipo de valor que puede asignarse a una variable depende de su nivel de
medición; los diferentes niveles de medición condicionan las técnicas estadísticas y los tipos de cálculos
que son adecuados o aplicables a una variable. Los niveles de medición son: nominal, ordinal, de
intervalo y de razón. El tipo de variables que se manejan en las Ciencias Sociales corresponden por lo
común a los niveles nominal, ordinal y de razón, aunque diversas escalas empleadas en las ciencias de la
conducta corresponden al nivel de intervalo.

El nivel nominal es el más bajo y se refiere a datos clasificados en categorías; cada valor de categoría
sirve como etiqueta o nombre. No existe orden o distancia entre las categorías, pero éstas no se enciman y
entre todas abarcan la totalidad de posibilidades. Una variable de nivel nominal puede tener sus valores
expresados como letras o números, pero cuando se usan números no tienen significado como tales. Se
trata de variables cualitativas.

El siguiente nivel de medición es el ordinal; cuando es posible hacer que cada una de las categorías
correspondientes a los valores de la variable quede clasificada en un orden fijo, se está trabajando en el
nivel ordinal. Esta clasificación implica que cada categoría tenga una posición relativa única con respecto
a las demás, sin que se conozca la distancia entre una categoría y la siguiente; igual que en el nivel
nominal, las categorías no se enciman y abarcan todos los posibles valores de la variable. Por ejemplo, se
trata de una variable de nivel ordinal si un grupo de personas se clasifican por estatura como ALTA,
MEDIA y BAJA.

El nivel de intervalo tiene las características del nivel ordinal pero además la distancia entre las categorías
o valores es de tamaño constante. Además, el valor correspondiente a cero se fija en forma arbitraria. Son

24
ejemplos las escalas Celsius y Fahrenheit para medir temperaturas; también las puntuaciones de
calificación en algunos tipos de exámenes y pruebas psicológicas. Las escalas semánticas, de medición de
actitudes y opinión, así como los números índice son otros ejemplos de este nivel.

El nivel superior de medición es el de razón. En este nivel las categorías siguen un orden, además se
conoce la distancia entre las diferentes categorías, la cual está dada en unidades fijas, y existe un punto
cero bien definido; igual que en los niveles anteriores las categorías no se enciman y abarcan todos los
posibles valores de la variable. En el nivel de razón es posible realizar todas las manipulaciones
matemáticas válidas para números reales. Por ejemplo, la variable correspondiente a la talla en
centímetros de un grupo de recién nacidos corresponde al nivel de razón. Se trata de variables
cuantitativas.

En el nivel nominal las pruebas estadísticas que se pueden aplicar son: porcentajes, moda, Chi cuadrada y
binomial; para el nivel ordinal, además de las anteriores, se pueden aplicar percentiles, mediana,
correlación de rango-orden y análisis de varianza de Friedman; para el nivel de intervalo, además de las
pruebas ya anotadas, se aplican rango, media, desviación estándar, correlaciones producto-momento,
pruebas t, análisis de varianza, regresión y análisis de factores; en el nivel de razón, que permite todas las
pruebas que hasta aquí se han mencionado, hay que agregar media geométrica, media armónica y
coeficiente de variación.

II.2.3 PRINCIPALES MEDIDAS DESCRIPTIVAS

Cuando se desea describir estadísticamente un conjunto de datos numéricos, se utilizan ciertas medidas,
que se pueden dividir en dos grupos: las medidas de tendencia central (porque suelen agruparse en esta
zona al graficar) y las medidas de dispersión (que nos indican en qué grado se alejan los datos de esa zona
central).

Medidas de tendencia central

Si se agrupan los datos en una serie de frecuencias, es decir si se anota cada valor diferente de una
variable y enfrente se escribe el número de veces que se repite, es posible obtener las principales medidas
de tendencia central.

MODA: Es el valor al cual corresponde la mayor frecuencia, es decir aquel que se repite mayor número de
veces. Se trata de una medida que no se ve afectada por los valores extremos, esto es por aquellos valores
muy grandes o muy pequeños que se presentan con baja frecuencia. Se expresa en las mismas unidades
que los datos originales, al igual que la media y la mediana. Se puede determinar para variables de
cualquier nivel.

MEDIA: La media aritmética no es sino el valor promedio de los datos, es decir el resultado de sumar
todos los valores de una variable y dividirlo entre el total de valores. Es una medida muy sensible a los
valores extremos, por lo que siempre debe considerarse en relación con las otras medidas de tendencia
central y con las medidas de dispersión. Sólo se puede calcular para variables de nivel de intervalo o de
razón.

MEDIANA: Es el valor que ocupa la posición central en una serie de datos. Se caracteriza porque el 50%
de los casos considerados toman un valor menor o igual al de la mediana y el otro 50% son mayores o
iguales a la mediana. Se puede determinar sólo para variables de nivel de intervalo o de razón.

Medidas de dispersión

Son muy útiles para evaluar la representatividad de las medidas de tendencia central y para conocer en
qué grado se encuentran diseminados los datos.

25
MÍNIMO: Es el menor valor de una serie de datos de nivel de intervalo o de razón. Puede tratarse de un
valor extremo, es decir de un valor muy pequeño no representativo.

MÁXIMO: Es el mayor valor de una serie de datos de nivel de intervalo o de razón. Puede tratarse de un
valor extremo, es decir de un valor muy elevado no representativo.

AMPLITUD o RANGO: Es la medida del intervalo en el cual están contenidos todos los valores de una
variable de nivel de intervalo o de razón. Se calcula como la diferencia Máximo - Mínimo.

PROMEDIO DE DESVIACIONES: Se define como desviación a la diferencia que existe entre cada uno
de los datos de una serie y la media aritmética de esa serie. El promedio de desviaciones se obtiene al
sumar el valor absoluto de todas las desviaciones (todas positivas) y dividir entre el número de casos.

DESVIACIÓN ESTÁNDAR: La desviación estándar, tal vez la medida estadística cuya fórmula tiene el
peor aspecto para los no iniciados, es simplemente un promedio cuadrático de desviaciones, es decir que
se calculan las desviaciones, se elevan al cuadrado, se suman, se dividen entre el número de casos y se
obtiene la raíz cuadrada positiva de este valor. Se trata de una medida muy importante y poco
comprendida, sirve para diversos cálculos relacionados con la distribución normal y en estadística
inferencial.

VARIANZA: Si seguimos todos los pasos para calcular la desviación estándar, excepto el último
(obtención de la raíz cuadrada), tendremos la varianza. Esta medida también es muy importante cuando se
efectúan inferencias.

II.2.4. EJERCICIOS

1. Ordena y agrupa en una serie de frecuencias los siguientes datos. Después calcula media, mediana,
moda, mínimo, máximo, amplitud, promedio de desviaciones y desviación estándar.

Duración en la docencia (años) de un grupo de 100 profesores.

1 6 9 10 12 13 16 18 21 26
2 7 9 11 12 13 16 18 21 28
3 7 9 11 12 14 16 18 22 29
4 7 9 11 12 14 16 18 23 30
4 7 9 11 12 14 17 19 24 30
5 7 10 11 13 14 17 19 25 32
6 8 10 11 13 15 17 19 25 34
6 8 10 11 13 15 17 19 25 33
6 8 10 12 13 15 17 20 25 38
6 8 10 12 13 15 18 20 25 40

Interpreta tus resultados.

26
2. Calcula media, mediana, moda, mínimo, máximo, amplitud, promedio de desviaciones y desviación
estándar para los siguientes datos. Interpreta los resultados.

Pesos en kilogramos de un grupo de 66 recién nacidos durante el mes de mayo de 1997 en clínicas
rurales de la Sierra Puebla.

2.370 1.920 3.000 2.580 3.200 2.100


1.550 3.050 2.510 3.090 2.810 2.300
1.920 2.580 2.900 3.100 1.920 3.000
3.050 2.510 1.920 3.000 3.000 1.750
1.920 2.580 2.900 3.090 2.810 2.300
3.090 2.810 2.300 3.000 3.200 2.100
3.200 2.100 1.550 3.050 2.510 3.090
1.920 2.580 2.900 3.090 2.810 2.370
2.090 2.810 2.300 3.000 3.200 2.100
3.000 2.580 3.200 2.100 2.510 1.920
2.510 1.920 2.580 3.200 2.100 2.510

3. Para los datos que siguen, obtenidos al aplicar una encuesta entre amas de casa en el Distrito Federal
durante el mes de mayo de 1998, calcula las medidas necesarias para determinar aproximadamente a
cuánto asciende la cantidad promedio de que dispone cada persona.

Número de hogar Número de personas del Ingreso familiar mensual


entrevistado núcleo familiar promedio en $
1 8 4,250
2 4 3,500
3 3 6,000
4 3 8,000
5 4 3,900
6 5 9,500
7 5 6,300
8 4 3,000
9 4 5,800
10 4 3,900
11 6 5,100
12 7 4,900
13 6 9,000
14 5 4,500
15 4 4,500
16 4 7,800
17 3 6,300
18 3 4,300
19 3 3,500
20 6 5,000
21 6 6,900
22 7 9,500
23 3 4,800
24 4 15,000
25 4 3,900

27
II.2 PROBABILIDAD

Introducción

Vivimos rodeados de incertidumbre: es probable que hoy llueva según dijeron durante el
noticiero matutino, tal vez el boleto de lotería que compramos gane algo ….

Se trata de fenómenos aleatorios, cuya ocurrencia depende de factores fortuitos. El resultado de


un experimento de este tipo se presenta al azar, sin intención o plan. Esto no significa que se
desconozcan todos los posibles resultados, pero sí que se desconoce cuál será el resultado de un
intento o ensayo particular.

Un experimento es una actividad que se observa o mide y a sus posibles resultados se les
denomina eventos. Si el resultado de un experimento no está previamente determinado (lo cual
ocurre en la mayoría de los casos), entonces se trata de un experimento y un evento aleatorios.
En los eventos aleatorios es posible conocer de antemano cuáles son los posibles resultados, a
pesar de que no se pueda determinar previamente el resultado particular de un solo ensayo o
intento.

Ejemplos:

Si se efectúa el experimento aleatorio de arrojar un dado, los posibles eventos o resultados son
ver un número del conjunto {1, 2, 3, 4, 5, 6}.

Si se efectúa el experimento aleatorio de arrojar una moneda, los posibles eventos o resultados
son ver o cara o cruz.

Al tratar con eventos aleatorios es posible asignar una fracción de probabilidad (por ejemplo lo
que se hace al decir que existe una posibilidad de uno en un millón de algo muy difícil).

Definición clásica de probabilidad

El enfoque clásico o a priori a la probabilidad se basa en la consideración de que los resultados


de un experimento son igualmente posibles., Con esta base, la probabilidad de que ocurra un
evento se calcula dividiendo el número de resultados favorables entre el número total de posibles
resultados.
Número de resultados favorables
Probabilidad de un evento = -------------------------------------
Número de resultados posibles

Ejemplos:

a) La probabilidad de que caiga par al arrojar un dado es

3
Probabilidad de par = ------
6
28
b) La probabilidad de que caiga cara al arrojar una moneda es
1
Probabilidad de cara = ------
2

Definición estadística de probabilidad

Otra forma de enfocar las probabilidades se basa en la obtención de frecuencias relativas y


también se le denomina a posteriori. De esta forma, la probabilidad de que ocurra un evento a
largo plazo se determina al observar la fracción de veces que eventos similares ocurrieron en el
pasado.

Número de veces que ocurrió en el pasado


Probabilidad de un evento = ----------------------------------------------
Número total de observaciones

Ejemplo:

Al preguntar a 100 personas de una población si en las próximas elecciones piensa votar por Y,
60 de ellas respondieron afirmativamente. Entonces, la probablidad de que una persona de esa
misma localidad diga que va a votar por Y es 6/100 = 0.6.

Conceptos básicos

El espacio muestral de un experimiento es el conjunto de todos los posibles resultados de dicho


experimento, es decir el conjunto universal de ese experimento. Cada elemento de este epacio se
conoce como punto muestra.

Un experimento es aquel proceso u operación cuyos resultados están bien definidos.

Un resultado es aquello que se obtiene al realizar un experimento una única ocasión.

Un ensayo es aquel acto que lleva a uno de los posibles resultados de un experimento.

Cuando se trabaja con experimentos aleatorios se denomina evento aleatorio al resultado de un


ensayo.

Un evento aleatorio simple es el resultado de un solo ensayo de un experimento dado.

Un evento compuesto es un subconjunto del espacio muestral y contiene dos o más eventos
simples.

Se dice que dos eventos son independientes si la probabilidad de ocurrencia de uno de ellos no
afecta la probabilidad de ocurrencia del otro. (¿Son independientes los sorteos de la lotería?)

29
Si sólo uno de varios eventos puede ocurrir en cada ensayo o realización de uneexperimento,
entonces se trata de eventos mutuamente excluyentes.

Si un experimento tiene un conjunto de eventos que incluye todos sus posibles resultados, este
conjunto es totalmente incluyente.

Si el conjunto de posibles eventos de un experimento es totalmente incluyente y los eventos son


mutuamente excluyentes, entonces la suma de sus probabilidades es 1.

El complemento de un evento A está formado por todos los posibles resultados del
experimento, excluyendo aquellos favorables a A.

La unión de dos eventos A y B mutuamente excluyentes es el conjunto formado por los


elemento de A más los elemento de B. (¿Qué sucede si A y B no son mutiuamente excluyentes?).

Ejercicio

La duración de las luces de un semáforo sobre una avenida importante son de 90 segundos para
verde, 4 segundos para amarillo y 40 segundos para rojo. Calcular la probabilidad de que al
llegar a ese punto el semáforo esté:

A) en verde
B) en amarillo
C) en rojo
D) en verde o en amarillo.

Reglas de conteo o Análisis combinatoria (CD)

Probabilidad condicional

Al trabajar con probabilidades puede suceder que un evento afecte la ocurrencia de otro, es decir
que interese calcular la probabilidad de ocurra un evento B dado que ha ocurrido un evento A, a
lo que se denomina probabilidad condicional de B dado A y se denota P(B|A) .
P(B A)
P(B|A) = ----------------
P(A)

Ejemplo:

La duración de las luces de un semáforo sobre una calle secundaria son de 85 segundos para
verde, 5 segundos para amarillo y 35 segundos para rojo. Entonces:

P (V) = 85/125 = 0.68


P (A) = 5/125 = 0.04
P (R) = 35/125 = 0.28

30
Un automóvil acaba de pasar en forma legal. ¿Cuál es la probabilidad de que haya pasado con
luz amarilla?

Solución:

El evento L {V, A} corresponde a cruzar en forma legal, es decir con luz verde o amarilla.

P (L) = P (V  A) = P(V) + P(A) = 0.68 + 0.04 = 0.72

Ahora se requiere calcular la probabilidad condicional


P (A)
P (A|L) = ----------- = (0.04) / (0.72) = 0.056
P (L)

Ejercicio:

Si se tiene un lote de 10 rollos de película y se sabe que la fecha de caducidad de 3 de ellos ya


pasó:

A) ¿Cuál es la probabilidad de seleccionar un rollo al azar y que sea bueno?


B) ¿Cuál es la probabilidad de seleccionar un rollo al azar y que haya caducado?
C) Si se seleccionan dos rollos, uno después de otro, ¿cuál es la probabilidad de que el
segundo rollo selecionado al azar
a. haya caducado si el primero había caducado?
b. haya caducado si el primero era bueno?

Teorema de Bayes

Si un espacio muestral S puede particionarse en un número finito de eventos mutuamente


excluyentes A1, A2, A3, An, es decir que

S = A1  A2  A3  An y

A1  A2 = 

y B es un evento con probabilidad diferente de cero, entonces

P (B | Ai ) P (Ai)
P (Ai | B) = ---------------------------------------------------------------
P (B | A1 ) P (A1) + P (B | A2 ) P (A2) + … + P (B | An ) P (An)

Ejemplo:

De un lote de aparatos se descubre uno defectuoso. Puede provenir de cualquiera de tres plantas
de producción I, II y III.

31
Se sabe que
10% del lote vino de I,
40% de II y
50% de III.

Entonces, si A1, A2 y A3 son las probabilidades de que en este lote un aparato elegido al azar
venga de I, II o III, respectivamente son

P (A1) = 0.1
P (A2 ) = 0.4
P ( A3) = 0.5

Además las estadísticas de producción indican que

1% de la producción de I es defectuosa,
3% de la producción de II es defectuosa y
2% la producción de III es defectuosa.

A partir de estos datos se tiene que:

P (B|A1) = 0.01 probabilidad de que una pieza producidad por I sea defectuosa
P (B|A2 ) = 0.03
P (B|A3) = 0.02

Ahora se aplica el Teorema de Bayes para calcular la probabilidad de que dado que la pieza es
defectuosa venga de I:

P (B | A1 ) P (A1)
P (A1|B) = ------------------------------------------------------------------
P (B | A1 ) P (A1) + P (B | A2 ) P (A2) + P (B | A3 ) P (A3)

Sustituyendo

(0.01) (0.1) 0.001 1


P (A1|B) = ---------------------------------------------- = ---------- = ----------
(0.01) (0.1) + ( 0.03)(0.4)+ (0.02)(0.5) 0.023 23

Para II:

P (B | A2 ) P (A2)
P (A2|B) = ------------------------------------------------------------------
P (B | A1 ) P (A1) + P (B | A2 ) P (A2) + P (B | A3 ) P (A3)

Sustituyendo

32
(0.03) (0.4) 0.012 12
P (A2|B) = ----------------- = --------------- = ----------
0.023 0.023 23

Para III_

P (B | A3 ) P (A3)
P (A3|B) = ------------------------------------------------------------------
P (B | A1 ) P (A1) + P (B | A2 ) P (A2) + P (B | A3 ) P (A3)

Sustituyendo
(0.02) (0.5) 0.1 10
P (A3|B) = -------------------- = ------------ = ------------
0.023 0.023 23

33
II.4 BREVE NOTA SOBRE LA DISTRIBUCIÓN NORMAL

Introducción

Se trata de una distribución probabilística muy importante que entre otras aplicaciones sirve
como base en la estadística inferencial. Además, si se determina la desviación estándar de un
conjunto de datos permite construir resultados descriptivos para distribuciones empíricas. En la
naturaleza existen muchas variables que se comportan siguiendo una distribución normal, como
alturas, pesos, medidas corporales y cocientes de inteligencia.

La curva normal (o campana de Gauss, matemático que la presentó por primera vez en 1733) es
un modelo teórico, una especie de polígono de frecuencias continuo. Tiene una sola moda, que
además coincide con el valor de la media y de la mediana, es decir su punto central. Sus dos
extremos se extienden en ambas direcciones hacia infinto, sin llegar a tocar el eje horizontal y es
perfectamente simétrica con respecto al punto central.

Puntuaciones z

La distribución normal estándar, que se denota como N(0,1), tiene media 0 y desviación
estándar 1. Al tratarse de una distribución probabilística el área total bajo la curva es unitarias,
es decir vale 1.

En la tabla que sigue se dan las áreas (o probabilidades) que correponden a ciertas las distancias
toamdas a partir de la media.

Distancia a partir Area bajo la curva


de la media
±1 68.26 %
±2 95.44 %
±3 99.74 %

El hecho de que se puede determinar con precisión la relación entre la distancia con respecto a la
media y el área correspondiente en esta distribución teórica al aplicarse a distribuciones
empíricas, es decir de datos reales obtenidos en forma directa, que se aproxime a la normal
permite hacer afirmaciones sobre estas distribuciones empíricas.

Para determinar el porcentaje del área total (o el número de casos) a la derecha, a la izquierda o
entre dos puntuaciones de una distribución empírica estas puntuaciones deben transformarse en
unidades de su desviación estándar. Al hacer esto las puntuaciones originales se convierten en
puntuacions estandarizadas o puntuaciones z.

34
II.5. ALGUNOS ELEMENTOS SOBRE POBLACIÓN Y MUESTRA

En Ciencias Sociales es muy común el problema de que una población de interés resulte muy grande para
estudiarla en su totalidad; también ocurre que se desconozca el tamaño de la población objetivo, por
ejemplo debido a sus características cambiantes o por no haber sido estudiada antes. En el análisis
estadístico se pueden obtener datos relativos a todos los integrantes de un grupo de interés, a lo cual se
denomina censo, o bien para una muestra o parte representativa de ese grupo. La ventaja de efectuar un
censo es que se tiene la seguridad (relativa) que los resultados que se obtengan corresponden a la
población, pero esto es con un alto costo en tiempo y dinero. Cuando se trabaja con una muestra, a
cambio de ahorrar tiempo y dinero, será necesario seguir las reglas del muestreo para poder generalizar
los resultados a la población correspondiente.

Para resolver este problema, se trabaja con una parte de la población, denominada muestra y se aplican
las técnicas de la estadística inferencial. Esta forma de trabajo se basa en estudiar una muestra aleatoria
de la población de interés y efectuar generalizaciones a partir de las características conocidas de la
muestra a la población desconocida.

Una muestra aleatoria o probabilística se obtiene por medio de un cuidadoso y rígido proceso de
selección. Por el contrario, una muestra conveniente está formada por aquellos elementos de la población
que "por casualidad" o facilidad y conveniencia fue posible estudiar y no permite inferencias o
generalizaciones estadísticas, aunque puede ser la única forma de trabajo cuando no se dispone de
recursos y para poblaciones con características especiales. Por su parte, una muestra aleatoria debe ser
representativa, tener un tamaño adecuado y estar bien obtenida.

El muestreo es la técnica que se utiliza para determinar el tamaño de la muestra y para saber cuáles son
los elementos de la población que se deben incluir. Además, la muestra debe ser representativa, tener el
tamaño adecuado y estar bien obtenida, para evitar introducir sesgos o desviaciones en los resultados.
El tamaño de la muestra nunca se determina a partir de un simple porcentaje del tamaño de la población,
sino que se calcula a partir del tipo de medidas estadísticas que se desea determinar, de los estratos o
capas de la población que nos interesan y del tamaño de la población, si es que se conoce o se puede
determinar de alguna forma.

- disponible o
conveniente
No probabilística - accidental
- por cuota
- intencionada
- bola de nieve
Tipos de muestra:
- aleatoria simple
Probabilística - sistemática
- estratificada:
proporcional
no proporcional
- por conglomerados
- polietápica

Cuando se trabaja con una muestra aleatoria, siempre existen dos tipos de errores: el de medición y el de
muestreo.

35
Muestra aleatoria simple: Se requiere una población definida, una lista completa de todos los casos en la
población y establecer un proceso de selección aleatoria que se aplica tantas veces como sea necesario
hasta haber completado el tamaño deseado de muestra.

Muestra sistemática: Es una variación de la anterior, ya que sólo el primer caso se selecciona en forma
aleatoria y se continúa con cada k-ésimo caso hasta completar el tamaño deseado de muestra.

Muestra estratificada: En este caso la lista de la población se divide en sublistas con base en alguna
característica importante y se efectúa un muestreo aleatorio simple en cada sublista. Cuando se establece
la proporción de elementos que posean cierta característica que deban incluirse en la muestra, se trata de
una muestra estratificada proporcional. Cuando se establecen cuotas muestrales que se deben extraer de
cada sublista, independientemente de cual sea su proporción en la población, se trata de una muestra
estratificada no proporcional, que presenta problemas para generalizar los resultados a la población.

Muestra por conglomerados: Como no siempre se puede disponer de una lista de los elementos de la
población que se va a muestrear, una posibilidad es elegir como base de la selección al azar alguna forma
de agrupamiento existente en la población, a lo que se denomina conglomerado, y probar cada caso de
cada conglomerado así seleccionado.

Muestra polietápica: En su primera fase, se selecciona una muestra y se recolecta cierta información. En
la segunda etapa, se extrae una submuestra y de sus elementos se obtiene información adicional. No
necesariamente se limita a dos fases, sino que pueden ser tres o más.

II.3. 1. TAMAÑO DE LA MUESTRA

Ahora, antes de presentar la diferentes fórmulas que se aplican para determinar el tamaño de una muestra
aleatoria, es conveniente anotar otra vez que el tamaño de una muestra aleatoria NO ES UN
PORCENTAJE DEL TAMAÑO DE LA POBLACIÓN; se calcula con base en el tamaño de la población
y si éste se desconoce o es muy grande, se considera infinito (como podría ser el caso de los usuarios del
Metro en la Ciudad de México durante cualquier día); cuando se trata de una población pequeña, el
tamaño de la muestra puede resultar muy cercano al de toda la población; para una población grande, es
sólo un fracción relativamente pequeña y mucho más fácil de manejar que un censo.

Los factores que intervienen en el cálculo de una muestra son:

 El número de grupos y subgrupos que se desea analizar.


 La exactitud requerida.
 El costo involucrado, tanto en dinero como en tiempo.
 La variabilidad que presentan, en el interior de la población, los factores de interés del estudio.

En las fórmulas para el cálculo del tamaño de una muestra se utilizan:

 Intervalo de confianza: Se construye alrededor de la media (o proporción) poblacional y se expresa


en puntuaciones z (abscisas de la normal). Por lo general es mayor del 80% y los valores más
utilizados son 95% (z = 1.96) o 99% (z = 2.57).
 Nivel de precisión: Es la máxima diferencia permitida entre la media (o proporción) muestral y la
media (o proporción) de la población. Por lo común se usa 5% o 10% (e = 0.05; e = 0.1).

36
Factores que aparecen en las fórmulas:

N = tamaño de la población

p = probabilidad de que suceda un evento

q = probabilidad de que no suceda un evento

p + q = 1; si p = q = 0.5

z = puntuación tipificada; medida del intervalo de confianza

e = nivel de precisión

S2 = Varianza poblacional

n1 = tamaño inicial de la muestra

n = tamaño ajustado de muestra

i) TAMAÑODE MUESTRA PARA ESTIMAR PROPORCIONES POR MUESTREO ALEATORIO SIMPLE

z 2 p ( 1− p )
n1 =
e2

Se desconoce el tamaño de la población o se considera infinita.

ii) TAMAÑO DE MUESTRA PARA ESTIMAR PROPORCIONES POR MUESTREO ALEATORIO


SIMPLE

n1
n=
n1 −1
1+
N
N = tamaño de la población

iii) TAMAÑO DE MUESTRA PARA ESTIMAR PROPORCIONES

n final = n * efecto del diseño muestral

Varianza del diseño


efecto del diseño = Por lo general 1.6 o 1.8; en
Varianza del muestreo aleatorio simple

[ ]
n1
n final= (1 . 7 )
n1−1
1+
N 37
iv) TAMAÑO DE MUESTRA PARA ESTIMAR MEDIAS POR MUESTREO ALEATORIO SIMPLE

S2 = Varianza poblacional (a partir del piloto o de datos censales)

n1

( ) s2
2
e ; ; n=
v= n1 = 2 n1
z v 1+
N

v) TAMAÑO DE MUESTRA PARA ESTIMAR TOTALES POR MUESTREO ALEATORIO SIMPLE

S2 = Varianza poblacional ( a partir del piloto o de datos censales)

n1
( )
2
e N 2 s2 n=
v= n1 = n1
z v2 1+
N

NOTA: Es una práctica común agregar un 10% a estos tamaños de muestra, para compensar aquellos
cuestionarios que deban desecharse, ya sea por errores de campo o por inconsistencias lógicas que surjan
al procesarlos.

II.3.2. VARIACIONES EN EL TAMAÑO DE LA MUESTRA CUANDO CAMBIA EL TAMAÑO


DE LA POBLACIÓN

Para observar el comportamiento del tamaño de la muestra en el caso de diferentes tamaños


poblacionales, a continuación se presenta una tabla de valores comparados. Pero primero, se detalla el
cálculo de n1, considerando que se van a estimar proporciones.

DATOS:

p = q = 0.5

z = 2.57 (intervalo de confianza de 99% )

e = 0.05
( 6 .6 ) ( 0. 25 )
n1 = =660 . 49
0. 0025

Ahora, si se aplica esta n1 a diferentes valores de población se tiene:

38
N n Porcentaje de la
población
100 86.84 = (660) / [ 1 + (660 / 100) ] 86.84 %
1,000 397.59 = (660) / [ 1 + (660 / 1000) ] 39.75 %
5,000 583.03 = (660) / [ 1 + (660 / 5000) ] 11.66 %
10,000 655.67 = (660) / [ 1 + (660 / 10000) ] 6.55 %
5,000,000 659.91 = (660) / [ 1 + (660 / 5000000) ] 0.013%

Como se puede observar, mientras menor es el tamaño de la población la muestra es proporcionalmente


más grande, mientras que para poblaciones muy grandes la muestra en proporción es mucho menor.

II.3.3. VARIACIONES EN EL TAMAÑO DE LA MUESTRA PARA DIFERENTES


INTERVALOS DE CONFIANZA

Ahora se analizan los cambios en el tamaño de la muestra cuando se incrementa el tamaño del intervalo
de confianza, considerando que la población es infinita, para evitar el ajuste por el tamaño de la
población, con p = q = 0.5 y un nivel de precisión de 5%.

INTERVALO DE PUNTUACIÓN z e n1
CONFIANZA
80% 1.28 5% 163.84 = [(1.28) 2 (0.25) ] / (0.0025)
85% 1.44 5% 207.36 = [(1.44) 2 (0.25) ] / (0.0025)
90% 1.65 5% 272.25 = [(1.65) 2 (0.25) ] / (0.0025)
95% 1.96 5% 384.16 = [(1.96) 2 (0.25) ] / (0.0025)
99% 2.57 5% 660.49 = [(2.57) 2 (0.25) ] / (0.0025)

Como se puede observar, un incremento de 5% o 4% en el tamaño del intervalo de confianza puede


implicar que el tamaño de la muestra aumente en una proporción mucho mayor.

II.3.4. EJERCICIO

Completar la siguiente tabla y analizar los valores resultantes.

INTERVALO DE PUNTUACIÓN z e n1
CONFIANZA
95% 1.96 8%
95% 1.96 5%
95% 1.96 3%
95% 1.96 2.5%
95% 1.96 1%

39
TERCERA PARTE: ANÁLISIS DE RESULTADOS

El tipo de procesamiento estadístico que se pueda aplicar a una determinada variable depende de su nivel
de medición. Como se puede ver en cualquier texto de Estadística, estos niveles son: nominal, ordinal, de
intervalo y de razón, siendo los más comunes en Ciencias Sociales nominal, ordinal y de razón.

Teniendo esto en cuenta, a continuación se repasa cuáles son los puntos necesarios para pasar de la
obtención directa de datos por medio de un cuestionario hasta el análisis y presentación de resultados.

- Diseño del cuestionario


- Diseño de la muestra
- Aplicación del cuestionario
- Codificación de cuestionarios
- Captura de datos
- Depuración de datos
- Procesamiento estadístico
- Análisis de resultados
- Resumen de resultados por medio de tablas y gráficas (Informe ejecutivo)
- Informe técnico

Como puede verse en la lista, una vez obtenidos los resultados estadísticos, muy probablemente por
medio de computadora, sólo queda aplicar el herramental estadístico para, gracias a la creatividad y
capacidad imaginativa humanas, efectuar una lectura analítica de esos resultados.

El procesamiento de los datos irá proporcionando elementos que contribuyan a terminar de depurar el
archivo de datos, ya que algunos resultados serán señales de atención sobre fallas lógicas. Por ejemplo, en
casi cualquier lugar resulta muy extraño que un hombre indique “ama de casa” como “ocupación
principal” o que un “jubilado” declare ser de edad joven (menos de 30 años).

Es recomendable obtener tablas de frecuencias de todas las variables, incluido el número de cuestionario
o de folio, ya que la frecuencia para cada uno de sus valores debe ser uno (a menos que se haya empleado
algún esquema en que se repitan, práctica que no es recomendable) si no hubo errores de captura que
hayan provocado que algún cuestionario se incluya en los datos más de una vez o se haya omitido.

La lectura cuidadosa de las tablas de frecuencias proporciona el primer acercamiento a la información


proveniente de los datos. A partir de este primer análisis, el investigador empieza a conocer cuantitativa y
objetivamente cuál es el comportamiento de cada una de las variables de un estudio. Para las variables de
nivel nominal y ordinal, además de las frecuencias y sus porcentajes correspondientes, la moda es una
medida importante. En una segunda etapa, se pueden efectuar recodificaciones de valores que los
agrupen; por ejemplo, si la variable estado civil tomara los valores “soltero/a”, “casado/a”, “unión libre”,
“divorciado/a” y “viudo/a”, después de obtener frecuencias y porcentajes para cada valor, se podría
constituir grupos más amplios, así: “soltero/a”, “con vida en pareja” y “sin pareja”, englobando
“casado/a” y “unión libre” en el segundo grupo y “divorciado/a” y “viudo/a” en el tercero. Es práctica
muy común hacer esto con variables que presenten muchos valores diferentes, cada uno de ellos con baja
frecuencia, como ocurre con el ingreso de las personas; de esta forma, una vez calculadas las medidas
descriptivas más importantes, es posible presentar tablas de frecuencias para la variable recodificada,
ahora con un número menor de valores, que además serán más fáciles de presentar y leer en una gráfica.

40
Una vez analizados los resultados de tablas de frecuencias, porcentajes y estadísticas descriptivas, se
empiezan a distinguir posibles relaciones entre variables. Es muy común que los datos correspondientes al
perfil del encuestado sirvan como variables independientes que se consideren asociadas al
comportamiento de algunas otras variables. De esta forma, puede ocurrir, por ejemplo, que la edad del
encuestado sirva como variable independiente para cruzarla con preferencia política; que el nivel de
ingresos (ya recodificado) se cruce con las actividades recreativas preferidas.

Los cruces más complejos y el proceso de multirespuestas se pueden efectuar por medio del Módulo
Tables de SPSS para Windows. A partir de este punto, el procesamiento y por ende el análisis, tomarán el
rumbo que marquen el nivel de los datos, el tipo de investigación y las habilidades estadísticas y de
manejo del paquete SPSS del investigador.

Al concluir el análisis de los resultados, se acostumbra generar el llamado “Informe ejecutivo”,


compuesto por una muy breve introducción a la investigación, una somera explicación de la metodología
utilizada (esquema de muestreo, características del trabajo de campo, etc.), acompañadas por las tablas y
gráficas en que se puedan observar los resultados más relevantes. Esto va dirigido a un lector que ya
conoce el contexto en el cual se efectuó la investigación, que dispone de poco tiempo y que muy
probablemente ocupe un puesto de toma de decisiones.

Se ha vuelto práctica común aprovechar las tablas y gráficas de este tipo de informe para crear lo que se
conoce como “presentación por computadora”, que consiste en manejar por medio de un paquete de
aplicación para presentaciones, como PowerPoint de Microsoft Office, cada una de las páginas del
informe, para proyectarlas por medio del equipo adecuado a grupos amplios; de esta forma, se facilita el
análisis y discusión de resultados por parte de todos los interesados. PowerPoint permite incorporar
elementos muy atractivos en una presentación, como son sonidos, animaciones, transiciones de muchos
tipos y hasta un lápiz virtual que permite hacer anotaciones en pantalla. Todo esto se acerca a lo que sería
una presentación multimedia, que es una forma más elaborada y costosa, en CD-ROM, que se está
utilizando para llevar a los usuarios de la información los resultados de trabajos de análisis estadístico.
También puede "publicarse" este informe, o una versión todavía más resumida, como una página
electrónica en Internet, lo cual permite una amplísima difusión de los resultados de investigaciones
específicas, que puedan ser de interés para la comunidad científica.

Al informe ejecutivo le debe acompañar un “Informe técnico” en el cual se presenta una lectura
concienzuda y profunda de todos los resultados obtenidos. Es aquí donde se van a resaltar los
descubrimientos, tanto comprobando las hipótesis como disprobándolas, las incongruencias, los nuevos
significados encontrados en las variables; en una palabra, se trata del resultado total del proceso de
investigación al que se ha dedicado este texto.

41
APÉNDICE A

FÓRMULAS DE ESTADÍSTICA DESCRIPTIVA

En este apéndice se presentan, más que nada con fines de información y para que el material del texto sea
completo, las formas más usadas de presentación de datos y las fórmulas para calcular las medidas más
comunes de Estadística descriptiva, tan sólo como complemento al capítulo correspondiente. No se
incluyen ejercicios ni ejemplos, ya que en esta época, al utilizar una aplicación de hoja de cálculo como
Excel o un paquete estadístico como SPSS, lo más importante es poder interpretar los resultados.

Serie de datos:

X ={ x 1 , x 2 , x 3 , . .. , x n }

Serie de frecuencias:
Valor Número de veces que
( xi) se repite ( f i )
___________________________

( x1 ) f1
( x 2) f2
( x 3) f3
. .
. .
. .
( x n) fn
___________________________
N N =∑ f i

42
Serie de clases y frecuencias:

Clase o Intervalo Frecuencia


________________________________
a1 −b1 f1
a2 −b2 f2
a3 −b3 f3
. .
. .
. .
an −b n fn
_______________________________
N

Media aritmética:

x̄=
∑ x1 o { x̄=
∑ x1 f 1 ¿
N ∑ f1

Mediana:

( )
N
−faa
2
Ma=x N o Md=Li+ i
f
2
donde
Li= límite inferior de la clase
que contiene a la mediana
faa= frecuencia acumulada
anterior a la clase que
contiene a la mediana
f = frecuencia de la clase que
contiene a la mediana
i= tamaño de la clase que
contiene a la mediana .

43
Desviación estándar:

S=
√ ∑ ( x 1− x̄ )2
N
o S=
√ ∑ f 1( x 1− x̄ )2
∑ f1

44
APENDICE C
CUADROS ESTADÍSTICOS

El siguiente es un ejemplo de cuadro estadístico o tabla, en el que aparecen los elementos que en general
es conveniente contenga esta forma de presentación de resultados.

Cuadro 8.1

Intención de voto por partidos, de acuerdo con el nivel


socioeconómico. Elecciones para Jefe de Gobierno. México, D. F., junio
de 1997.

(Porcentajes con base en el total de encuestados por nivel


socioeconómico)

PAN PRD PRI PVEM OTROS No sabe Base del


No está porcentaje:
seguro
Nivel A 13% 56% 13% 13% 0% 5% 16

Nivel B 21% 43% 22% 11% 2% 1% 129

Nivel C 15% 50% 16% 10% 2% 7% 380

Nivel D 16% 49% 21% 6% 2% 6% 1,055

No se 15% 31% 39% 8% 0% 7% 21


registró
Total: 1,601

Fuente: Segunda encuesta de opinión preelectoral en el Distrito


Federal, Gabinete de encuestas por muestreo, Depto. de Política
y Cultura, UAM-X.

Nota : El nivel socioeconómico se determinó por medio de mapas


mercadológicos a partir de la combinación de colonia o barrio y
Delegación en que declararon vivir los encuestados.

Los elementos de un cuadro estadístico son:

1.- Número, que permite la identificación, consulta y referencias rápidas.

2.- Titulo:
- Contenido general,
- ubicación en el espacio y en el tiempo,
- unidades empleadas y bases porcentuales.

3.- Fuente: Origen de la información presentada.

45
4.- Encabezados de columna
5.- Encabezados de renglón o fila

A continuación se presenta una tabla de trabajo, obtenida en SPSS por medio del comando

CROSSTABS / TABLES PR4 BY PR22 / OPTIONS 3 4 5.

PR4 Sexo
BY PR22 Considera el proceso tranquilo / agitado

Row
Count Tranquilo Agitado Total
PR22 Row PCT
Col Pct
Tot Pct
559 253 812
68.8 31.2 56.1
PR4 Masculino 57.5 53.4
38.6 17.5

414 221 635


Femenino 65.2 34.8 43.9
42.5 46.6
28.6 15.3

973 474 1447


67.2 32.8 100.0

Number of missing observations = 196

Es importante saber leer este tipo de tablas o cuadros de trabajo, cuyas características difieren un poco del
cuadro de presentación con que se inició este apéndice.

En este caso el título tiene la misma función, esto es permite identificar que la tabla corresponde al cruce
de las variables PR4 (sexo) por PR22 (Considera el proceso tranquilo/agitado). Pero esta es toda la
información que se proporciona. No se sabe ni dónde ni cuándo se obtuvieron los datos a partir de los
cuales se generó la tabla, aunque por ser un resultado de correr el paquete SPSS es seguro que la persona
que efectuó el proceso sabe bien que los datos provienen de la Primera encuesta de opinión preelectoral
en el Distrito Federal, efectuada en ese lugar en el mes de abril de 1997 por el Gabinete de encuestas por
muestreo de UAM-X.

Siguiendo con la tabla, se tiene que la variable que da titulo a los renglones es PR4 y PR22 da titulo a las
columnas, lo cual corresponde con lo que se anotó sobre cruce de variables en SPSS. Entonces, en cada
celda coincide un valor de PR4 con un valor de PR22. La pregunta que en el cuestionario corresponde a la
variable PR22 fue “¿Cómo considera que será el próximo proceso electoral en el D.F?” con las opciones
“Tranquilo/Agitado/No sabe/Rehusó”. Para la variable PR22 se manejaron como valores faltantes
(missing values) “No sabe” y “Rehusó”, que fueron las respuestas dadas por 196 de los encuestados,
según se indica al concluir la tabla.

En la parte superior izquierda de la tabla aparecen las palabras Count (conteo o número de casos), Row
Pct (porcentaje con respecto al total del renglón), Col Pct (porcentaje con respecto al total de la

46
columna) y Tot Pct (porcentaje con respecto al total general). Los valores que aparecen en cada celda
corresponden, siguiendo ese mismo orden, a estos cálculos de número de casos y porcentajes.

De esta forma, si se analiza la celda en que coincide “Sexo = Masculino” con “Proceso = Tranquilo”, se
tiene que:

Número de casos 559


Porcentaje con
respecto al total 68.8
del renglón
Porcentaje con
respecto al total 57.5
de la columna
Porcentaje con
respecto al total 38.6
general

Esto quiere decir que 559 hombres opinaron que el proceso sería tranquilo. En cuanto a los porcentajes,
68.8% de quienes opinaron que el proceso sería tranquilo son hombres (y el complemento, leído en la
celda inmediata inferior, es que 65.2% son mujeres). De los hombres, 57.5% contestaron que el proceso
sería tranquilo (lo que de nuevo se complementa, ahora por renglón, con 53.4% de hombres que opinaron
que el proceso sería agitado). Por último, de los 1,447 encuestados que sí respondieron esta pregunta
(esquina inferior derecha, total general), el 38.6% son hombres que opinaron que el proceso sería
tranquilo.

La lectura exhaustiva de tablas de este tipo es una parte importante del análisis de resultados, sobre todo
si las variables son de nivel nominal u ordinal. Se recomienda al lector que pruebe leer el resto de las
celdas de la tabla. Se eligieron dos variables con dos valores cada una, a fin de facilitar este primer
acercamiento, pero lo común es trabajar con más renglones y columnas, sin que el proceso de lectura
cambie.

47
APÉNDICE C TAMAÑOS DE MUESTRA MÁS USADOS

Como complemento a lo referente a la determinación de tamaños de muestra para estimar


proporciones por muestreo aleatorio simple se calcula la última columna de la tabla que sigue,
para después discutir la forma en que un estudiante que realiza una investigación ha de enfrentar
la decisión sobre el tamaño.
Intervalo de confianza z Nivel de precisión Tamaño
inicial de muestra
80% 1.28 5% 163.8
80% 1.28 3% 455.1
80% 1.28 2.5% 655.4
80% 1.28 2% 1024.0
80% 1.28 1% 4096.0
85% 1.44 5% 207.4
85% 1.44 3% 576.0
85% 1.44 2.5% 829.4
85% 1.44 2% 1296.0
85% 1.44 1% 5184.0
90% 1.65 5% 272.3
90% 1.65 3% 756.3
90% 1.65 2.5% 1089.0
90% 1.65 2% 1701.6
90% 1.65 1% 6806.3
95% 1.96 5% 384.2
95% 1.96 3% 1067.1
95% 1.96 2.5% 1536.6
95% 1.96 2% 2401.0
95% 1.96 1% 9604.0
99% 2.57 5% 660.5
99% 2.57 3% 1834.7
99% 2.57 2.5% 2642.0
99% 2.57 2% 4128.1
99% 2.57 1% 16512.3

Es importante observar que el asunto de la muestra no concluye aquí. Lo siguiente es diseñar un


esquema de muestreo de acuerdo con los objetivos generales de investigación, que considere las
características de la población y acorde con los objetivos específicos de la obtención directa de
datos.

48
BIBLIOGRAFÍA

Babbie, Earl. Fundamentos de investigación social . International Thomson Editores,


México, 1999.

Johnson, Dallas E. Métodos multivariados aplicados al análisis de datos . International


Thomson Editores, México, 1999.

Lohr, Sharon L. Muestreo: Diseño y análisis. International Thomson Editores, México,


1999.

Malhotra, Naresh K. Investigación de mercados, un enfoque práctico. Prentice Hall


Hispanoamericana, México, 1997.

Rosenblueth, Arturo. El método científico. La prensa médica mexicana/ CINVESTAV IPN, México,
1995.

Schmelkes, Corina. Manual para la presentación de anteproyectos e informes de investigación. Harla,


México, 1988.

Selltiz, Claire et. al. Métodos de investigación en las relaciones sociales. 9ª Ed., Ediciones Rialp, S.A.
Madrid, 1980.

49

También podría gustarte