Disertacion

PONTIFICIA UNIVERSIDAD
Facultad de Ciencias
Instituto de Matemáticas CATÓLICA
Magister en Didáctica de la Matemática DE VALPARAISO
Investigación en Didáctica de la Matemática
Prof. Raimundo Olfos
RECOGIDA Y ANÁLISIS DE DATOS EN INVESTIGACIÓN CUANTITATIVA
Por: Leidy Caterine Bautista

Víctor Michael Pérez
1. Recogida de datos
En investigación cuantitativa, la recogida de datos se realiza de manera estructurada y sistemática, y los datos
pueden ser generados por el propio interesado, o bien haber sido recopilados por un tercero, ya sea un individuo o
una organización. En el primer caso, la fuente de datos se denomina primaria, y en el segundo caso, secundaria. En
ambas situaciones, los datos pueden ser generados básicamente de tres maneras:
 A través de la realización de un censo: se logra observar o medir todas las unidades o sujetos
de interés existentes. Sin embargo, en muchas situaciones prácticas, no es posible acceder a
todas las unidades existentes, por ser una tarea costosa, ardua y en ocasiones hasta imposible, o
bien porque la medición destruiría a la unidad o sujeto en estudio.
 Diseñando un experimento: el investigador genera sus propios datos interviniendo directamente.
 Tomando una muestra: se obtienen los datos a través de la medición u observación de una
porción de las unidades existentes.
En este último caso es necesario conocer algunas técnicas que permitan determinar cuántas y cuáles unidades se
deben tomar para realizar el estudio.
2. Técnicas de Muestreo
Cuando el investigador tiene determinadas su(s) variable(s) de estudio, a su vez determina la población de interés de
la cual desea recolectar la información; sin embargo, en algunas ocasiones las poblaciones son muy extensas y no
se cuenta con el tiempo y recursos suficientes (agregando que los resultados obtenidos no son tan precisos como se
pueda esperar) para estudiar todos sus elementos. Por tal razón el investigador busca trabajar con una parte de ella
que se asemeje en sus características a la población escogida. No obstante, para el investigador surgen las
siguientes preguntas ¿qué individuos debo incluir? ¿Cuántos debo tomar? El método utilizado para realizar la
elección de la muestra se denomina muestreo.
2.1. Muestreo de selección intencionada o muestreo por conveniencia: Consiste en la elección por métodos no
aleatorios de una muestra cuyas características sean similares a las de la población objetivo. En este tipo de
muestreos la “representatividad” la determina el investigador de modo subjetivo, siendo este el mayor
inconveniente del método ya que no podemos cuantificar la representatividad de la muestra.
2.2. Muestreo aleatorio: En el muestreo aleatorio todos los elementos tienen la misma probabilidad de ser
elegidos. Los individuos que formarán parte de la muestra se elegirán al azar mediante números aleatorios. El
muestreo aleatorio puede realizarse de distintas maneras, las más frecuentes son el estratificado y el muestreo
por conglomerados.
2.2.1. Muestreo aleatorio estratificado: Se divide la población en grupos en función de un carácter

determinado y después se muestrea cada grupo aleatoriamente, para obtener la parte proporcional
de la muestra.
2.2.2. Muestreo aleatorio por conglomerados: Se divide la población en varios grupos de
características parecidas entre ellos y luego se analizan completamente algunos de los grupos,
descartando los demás. Dentro de cada conglomerado existe una variación importante, pero los
distintos conglomerados son parecidos. Requiere una muestra más grande, pero suele simplificar
la recogida de muestras. Frecuentemente los conglomerados se aplican a zonas geográficas.
3. Tamaño de la muestra
El tamaño de la muestra está condicionado por los objetivos del estudio, que determinarán su diseño, las variables a
considerar y el método planteado, por tanto existen fórmulas para determinar un tamaño de la muestra teniendo
estos aspectos.
A continuación se muestran las diferentes fórmulas empleadas para calcular el tamaño de la muestra dependiendo
del objetivo del estudio.
a. Si el objetivo es estimar una proporción:
𝑍𝛼2 ∙ 𝑝0 ∙ (1 − 𝑝0 )
𝑛=
𝑑2
Donde
𝑑: Anchura del intervalo de confianza.
𝑝0 : Proporción de sujetos que presentan la característica que se va a estudiar.
𝑍∝ : El nivel de confianza elegido determinado por el valor de α (para una confianza del 95%, α = 0,05, que
es la utilizada habitualmente, este valor es 1,96).
b. Si el objetivo es estimar una media:

𝑍𝛼2 ∙ 𝐷𝐸 2
𝑛=
𝑑2
Donde DE representa la Desviación Estándar.
c. Si el objetivo es contrastar dos hipótesis:
 Si el objetivo es comparar dos proporciones:

2
𝑍𝛼 ∙ 2𝑝(1 − 𝑝) + 𝑍𝛽 ∙ 𝑝1 (1 − 𝑝1 ) + 𝑝2 (1 − 𝑝2 )
𝑛=
𝑝1 − 𝑝2
Donde n = sujetos necesarios en cada una de las muestras.
𝑍𝛼 = Valor Z Correspondiente al riesgo deseado.

𝑍𝛽 = Valor Z Correspondiente al riesgo deseado.
𝑝1 = Valor de la proporción en el primer grupo.
𝑝2 = Valor de la proporción en el segundo grupo.
𝑝 = Media de las dos proporciones 𝑝1 y 𝑝2 .
 Si el objetivo es comparar dos medias:

2
2 𝑍𝛼 + 𝑍𝛽 ∙ 𝑆2
𝑛=
𝑑2
Donde 𝑆 2 = varianza de la variable cuantitativa que tiene el grupo de control o de referencia.

𝑑 = Valor mínimo de la diferencia que se desea detectar (datos cuantitativos)
Al trasladar los datos obtenidos en la muestra a la población, se pueden cometer dos tipos de errores, el error
aleatorio y el error sistemático.
El error aleatorio es el derivado de trabajar con muestras y se puede cuantificar, está relacionado con la precisión. A
medida que se aumenta el tamaño de la muestra, este error disminuye, hasta el punto de que si se estudia a toda la
población el error aleatorio desaparece.
El error sistemático o sesgo está relacionado con la representatividad de la población; si la muestra estudiada reúne
características diferentes a las que se producen en la población, aunque se aumente el tamaño de la muestra, este
error se mantiene y se obtendrán valores diferentes en la muestra a los que realmente se dan en la población. Este
error está relacionado con la validez.
Cuando el error está relacionado con la calidad de la estimación de un parámetro hecha a partir de la muestra, se
denomina error estándar. Este error puede ser de diferentes tipos dependiendo del objetivo de estudio:
a. Error estándar de una proporción:
𝑝0 ∙ (1 − 𝑝0 )
𝐸𝐸𝑃 =
𝑛
b. Error estándar de una media
𝐷𝐸
𝐸𝐸𝑀 =
𝑛
4. Métodos de análisis cuantitativo
Según el número de variables el análisis pude ser de dos tipos;
a. Análisis univariado: Contraste de relaciones entre dos variables o grupos de observaciones, diseña tablas
con tabulaciones cruzadas, es decir, las categorías de una variable se cruzan con las categorías de una
segunda variable. Se les conoce como tablas de contingencia. Los requisitos que debe cubrir son:
 El título debe reflejar la información que contiene la tabla.

 Incluir un subtítulo para cada columna y subcolumna que se integre a la tabla.

 Indicar el 100 % cuando la tabla se exprese en términos porcentuales.
 Indicar al final de cada columna el número total de casos o categorías que comprende.
 Prueba Chi cuadrado: este estadístico permite contrastar la hipótesis de que dos criterios de clasificación
utilizados (las dos variables categóricas) son independientes. Para ello, compara las frecuencias
observadas con las frecuencias esperadas. Obtenidas las frecuencias esperadas, el estadístico chi
cuadrado se obtiene de la siguiente manera:
(𝑛𝑖𝑗 − 𝑚𝑖𝑗 )2
𝜒2 =
𝑚𝑖𝑗
𝑖 𝑗
 Prueba T student: se utiliza para comparar dos muestras entre si y detectar si hay una diferencia
significativa entre ellas.
 Análisis de varianza: se puede utilizar para verificar si hay diferencias significativas entre medias cuando
se tienen más de dos muestras o grupos en el mismo planteamiento.
 Ancova: es un método de descomposición de la variabilidad que se aplica cuando entre las variables
predictoras del modelo se tienen tanto variables numéricas como variables de clasificación y combina, por
tanto, análisis de regresión y análisis de varianza.
b. Análisis multivariado: brinda los métodos estadísticos para el análisis conjunto de dos o más variables
que pueden estar interrelacionadas. Esta rama de la estadística comprende procedimientos y técnicas para
la síntesis, la presentación y el análisis multidimensional de caracteres, tanto cualitativos como cuantitativos,
obtenidos a partir de un número de individuos.
La diferencia entre los análisis univariados y multivariados radica en el hecho de que los primeros emplean una
variable dependiente, mientras que los segundos comparan muestras sobre la base de dos o más variables que
están relacionadas.
5. REFERENCIAS BIBLIOGRÁFICAS
 Casal, J y Mateu, E. (2003). Tipos de muestreo. Recuperado el 22 de septiembre de 2011 de

http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf
 Fuentelsaz, C. (2004). Cálculo del tamaño de la muestra. Recuperado 22 de septiembre de 2011 de

http://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp.
 Introducción a la estadística. Documento en línea. Recuperado el 22 de septiembre de 2011 de

http://www.cepeu.edu.py/LIBROS_ELECTRONICOS_2/Introducci%F3n%20a%20la%20estad%EDstica%
20en%20excel.pdf
 Pérez, M. (2008). Trabajo de grado. Estudio de la relación de rendimiento académico de los estudiantes de
primer semestre de las ingenierías de la UIS con los resultados de las pruebas de estado a través del
análisis de componentes principales y tablas de contingencia. Recuperado el 22 de septiembre de 2011 de

http://tangara.uis.edu.co/biblioweb/.
ANEXO
1. Al trasladar los datos obtenidos en la muestra a la población, se pueden cometer dos tipos de errores el
aleatorio y el sistemático. La diferencia fundamental entre estos dos tipos de error radica en:
a. que el primero está relacionado con la precisión mientras que el segundo se relaciona con la
representatividad de la población.
b. que el error sistemático lo puedo disminuir a medida que aumente la muestra mientras que el error
aleatorio permanece invariante al aumento de la muestra.
c. que el error aleatorio se encuentra asociado a la validez de los resultados mientras que el error
sistemático se asocia con la técnica de muestreo empleada.
d. que el error sistemático se puede cuantificar mientras que el error aleatorio solo puede apreciarse
en cuanto difieran los datos de la muestra con los de la población.
2. Respecto al tamaño de la muestra es correcto afirmar que:
a. está condicionado por los objetivos del estudio.

b. es independiente de lo que se pretenda estudiar.
c. es siempre igual al tamaño de la población.
d. es determinado libremente por el investigador.
3. Cuál de las siguientes características no corresponde al método chi cuadrado para análisis de datos
a. Compara dos variables para determinar su independencia,

b. Compara un valor observado con un valor esperado,
c. Se utiliza para comparar variables categóricas.
d. Se utiliza para comparar variables numéricas con variables de clasificación.
4. Las directivas de un colegio decide realizar un estudio para medir el nivel de matemáticas que manejan sus
alumnos. Para tal fin diseña una prueba por niveles de la siguiente manera:
Nivel 1: 6º - 7º; Nivel 2: 8º - 9º; Nivel 3: 10º - 11º

Para aplicar la prueba decide escoger los diez estudiantes más destacados de cada grado.
1. Dada esta situación, realice algunas conjeturas respecto a los resultados de este estudio teniendo en
cuenta:
a. El tamaño de la muestra.
b. La representatividad de la muestra,
c. La validez de los resultados obtenidos.
2. Si en uno de los grados solo asistieran 5 estudiantes, ¿cómo se verían afectados los resultados de esta
prueba?

Disertacion

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Disertacion

Cargado por

Copyright:

Formatos disponibles

PONTIFICIA UNIVERSIDAD

RECOGIDA Y ANÁLISIS DE DATOS EN INVESTIGACIÓN CUANTITATIVA

Por: Leidy Caterine Bautista

2.2.1. Muestreo aleatorio estratificado: Se divide la población en grupos en función de un carácter

a. Si el objetivo es estimar una proporción:

b. Si el objetivo es estimar una media:

c. Si el objetivo es contrastar dos hipótesis:

 Si el objetivo es comparar dos proporciones:

Donde n = sujetos necesarios en cada una de las muestras.

𝑍𝛼 = Valor Z Correspondiente al riesgo deseado.

𝑝 = Media de las dos proporciones 𝑝1 y 𝑝2 .

 Si el objetivo es comparar dos medias:

Donde 𝑆 2 = varianza de la variable cuantitativa que tiene el grupo de control o de referencia.

a. Error estándar de una proporción:

b. Error estándar de una media

4. Métodos de análisis cuantitativo

Según el número de variables el análisis pude ser de dos tipos;

 El título debe reflejar la información que contiene la tabla.

 Incluir un subtítulo para cada columna y subcolumna que se integre a la tabla.

 Casal, J y Mateu, E. (2003). Tipos de muestreo. Recuperado el 22 de septiembre de 2011 de

 Fuentelsaz, C. (2004). Cálculo del tamaño de la muestra. Recuperado 22 de septiembre de 2011 de

 Introducción a la estadística. Documento en línea. Recuperado el 22 de septiembre de 2011 de

análisis de componentes principales y tablas de contingencia. Recuperado el 22 de septiembre de 2011 de

2. Respecto al tamaño de la muestra es correcto afirmar que:

a. está condicionado por los objetivos del estudio.

a. Compara dos variables para determinar su independencia,

Nivel 1: 6º - 7º; Nivel 2: 8º - 9º; Nivel 3: 10º - 11º

También podría gustarte