Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
La formación investigativa en la universidad: métodos cuantitativos de investigación
ISBN: 978-958-8777-95-5
Diseño y diagramación
División Editorial y Publicaciones
Se prohíbe la reproducción impresa o electrónica, total o parcial de esta obra, sin la autorización expresa y
por escrito de la Universidad Industrial de Santander
2
UNIDAD 4.
Unidad de análisis: uno de elementos que conforman la población; debe ser claramente
definida de acuerdo con los propósitos de estudio.
Su función básica es determinar qué parte de una realidad en estudio (población o universo)
debe examinarse con la finalidad de hacer inferencias sobre dicha población. Las muestras
son subgrupos de la población, previamente delimitada y puede ser probabilística o no
probabilística.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita
o finita. Una población finita en la que se efectúa muestreo con reposición puede
3
considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande
puede considerarse como infinita. En todo el estudio se debe limitar a una población de
partida infinita y a un muestreo con reposición.
Al considerar todas las posibles muestras de tamaño n en una población. Para cada muestra
se puede calcular un estadístico (media, desviación típica, proporción) que variará de una a
otra. Así, se obtiene una distribución del estadístico que se llama distribución muestral. Las
dos medidas fundamentales de esta distribución son la media y la desviación típica, también
denominada error típico.
Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las
distribuciones muestrales son normales y en esto se basarán todos los resultados que se
alcancen (García Cebrian, 2001).
Muestreo probabilístico: aquel donde cada unidad de análisis que compone la población,
tiene exactamente la misma probabilidad de muestreo, puede calcularse la probabilidad de
extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo
es el más aconsejable, aunque en ocasiones no es posible optar por él.
Muestreo sistemático: es la elección de una muestra a partir de los elementos de una lista
según un orden determinado, o recorriendo la lista a partir de un número aleatorio
determinado.
Muestreo teórico o errático: también se llama sin norma. La muestra se realiza valorando
únicamente la comodidad o la oportunidad en términos de costes, tiempo u otro factor no
estadístico.
4
Muestreo simple: este tipo de muestreo toma solamente una muestra de una población
dada para el propósito de inferencia estadística. Puesto que solamente se toma una
muestra, el tamaño de esta debe ser suficientemente grande para extraer una conclusión.
Muestreo aleatorio simple (MAS): es aquel en que cada elemento de la población tiene la
misma probabilidad de ser seleccionado para integrar la muestra. Una muestra simple
aleatoria es aquella en la que sus elementos son seleccionados mediante el muestreo
aleatorio simple.
Representatividad
Inferencia estadística
𝑁(𝑝 ∗ 𝑞 )
𝑛= 𝑁−1
2 +(𝑝∗𝑞)
𝑒 𝑧2
Convenciones
5
de problema, ya que significa que se espera que ocurra p en la mitad de los casos, lo cual es
inaplicable en la mayoría de investigaciones.
Ejemplo
En el estudio adelantado por Rojas y Linares (2010), los datos para el muestreo fueron los
siguientes:
6
IC = índice de confiabilidad (95%), estandarizado Z 1.96
n = Tamaño de muestra 341
*Fuente: (Universidad Industrial de Santander, 2009)
Donde:
Ahora bien, este número general de muestra debe ser distribuido (ponderado) para
equiparar su distribución tal como sucede en la población de referencia, con el propósito
de buscar mayor representatividad. En este ejemplo se establece la importancia de
ponderar la muestra a partir de dos criterios de distribución: edad y facultad a la que
pertenecen los estudiantes. La estratificación con varios giros es siempre posible, pero
puede llegar a reducir demasiado el volumen de la muestra en cada estrato.
Para lograr la muestra estratificada basta multiplicar el total de estudiantes de cada giro por
una fracción de muestreo que resulta de la relación entre el volumen de la muestra y el
volumen de la población.
7
Matrícula total de pregrado según programa (la base n se modifica a 16.335): (0.021)
Estrato o giro Población Muestra
Ciencias 1.266 26
Ciencias Humanas 3.120 65
Ing. Fisicomecánicas 6.998 146
Ing. Fisicoquímicas 3.430 72
Salud 1.521 32
Total 16.335* 341
* Se excluyen estudiantes a distancia y sedes regionales
Para determinar el tamaño de la muestra cuando los datos son cualitativos, es decir para el
análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar la
ausencia o presencia del fenómeno a estudiar, se recomienda utilizar la siguiente fórmula:
𝑛´
𝑛=
1 + 𝑛´ /𝑁
Donde:
𝑆2
𝑛´ = σ2
Sabiendo que:
8
Se = error estándar que está dado por la diferencia entre (µ - 𝑥⃑) la media poblacional y la
media muestral.
(Se)2 = error estándar al cuadrado, que servirá para determinar σ 2, por lo que σ2 = (Se)2, es
la varianza poblacional.
Ejemplo
Se desea conocer la aceptación de los programas de salud sexual adelantados por la Alcaldía
de una población de 1176 adolescentes de la ciudad de Bucaramanga, y para ello se desea
tomar una muestra, por lo que se necesita saber la cantidad de adolescentes que se deben
entrevistar para tener una información adecuada con error estándar menor de 0.015 al 90
% de confiabilidad.
Solución:
Se = 0.015
Por tanto
400
𝑛= = 298
1 + 400/1176
Desventajas
La representatividad no es segura
9
Las estimaciones a partir de la muestra son poco confiables.
Rara vez los resultados son generalizables a una población
Muestras de expertos. Son muestras válidas y útiles cuando los objetivos del estudio
requieren la opinión de expertos en un tema, especialmente en estudios cualitativos y
exploratorios.
4.3 Variables
Una variable es un elemento de una fórmula, proposición o algoritmo que puede adquirir
un valor cualquiera (siempre dentro de su universo) o ser sustituido por dicho valor. Los
valores que una variable es capaz de recibir pueden estar definidos dentro de un rango o
estar limitados por criterios o condiciones de pertenencia al universo que les corresponde
(en estos casos, el universo de la variable pasa a ser un subconjunto de un universo mayor,
el que tendría sin las restricciones).
10
Esquema n.°18. Tipos de variables, estadísticas apropiadas y nivel de potencia
Tipo de m Características de Ejemplo Estadísticas apropiadas Potencia
Variable
edición
Nominal Categorías no Sexo, municipio, Recuentos, tasas, Baja
ordenadas estado de ánimo, proporciones, riesgo
2
orientación relativo, x , Mantel-
religiosa. Haentzel, regresión.
Ordinal Categorías ordenadas Grado de Además de lo anterior : Intermedia
con intervalos no aprendizaje, nivel mediana, correlación
cuantificables de escolaridad. ordinal
Continua o Espectro ordenado Peso, talla, número Además : Media, DS, Elevada
discreta con intervalos de clases al día, pruebas t, Anova,
cuantificables horas de TV. a la regresión potente
semana.
Fuentes: (Kerlinger, 2001), (Grau, Correa, & Rojas, 2005)
La clasificación de la variable según tipo es una decisión instrumental que tendrá efecto en
el tipo de medición y en el tipo de pruebas estadísticas que pueden ser usadas para su
análisis. Como en el esquema anterior, es importante entender que esta definición no es
arbitraria, es el resultado de la manera en que hemos planteado el problema y los objetivos
de investigación.
La clase más simple de variable es aquella por la cual una unidad puede ser clasificada por
la presencia o ausencia de esa dimensión: hombre - mujer; estudioso - desaplicado; pobre
- rico, etc. Hay variables más complejas como por ejemplo, niveles de edad, rangos de
ingreso, tamaño de la familia, ocupación, etc. (Adonay Moreno, 1999)
11
estudiar cómo incide sobre la nivel de lectura y del énfasis investigativo
expresión de la variable dependiente del programa
Interviniente Tienen efecto en la relación Los estudiantes de la Escuela de Trabajo
planteada, aunque no son esenciales Social UIS, obtuvieron alto rendimiento en
en la relación. las pruebas SABER 2011, resultado del buen
nivel de lectura y del énfasis investigativo del
programa, especialmente de aquellos
estudiantes con alto rendimiento escolar.
Fuentes: (Kerlinger, 2001), (Grau, Correa, & Rojas, 2005)
En términos resumidos las variables son las características observables de una unidad de
análisis, ligadas entre sí en su variación en una relación específica de asociación,
dependencia o causalidad.
Las variables se clasifican según diversos criterios. Una clasificación tiene en cuenta el
criterio de causalidad; en este caso se habla de variables independientes y variables
dependientes. Es independiente la variable que explica el fenómeno y es dependiente la
variable que corresponde al fenómeno explicado.
OPERACIONALIZACIÓN DE VARIABLES
Consiste en hacer deliberadamente un manejo operativo de cada variable, es decir, definir
los indicadores e índices con los cuales se va a expresar concretamente la variable con base
en los conceptos y elementos que intervienen en el problema de investigación. La
operacionalización es de naturaleza básicamente cualitativa.
VARIABLE Dimensiones
Indicadores Indicadores
Ejemplos de hipótesis
13
El mayor uso de tecnologías de la informática y la comunicación no implica un
mejor desempeño académico de los estudiantes de pregrado de la Universidad
Industrial de Santander.
Como en los ejemplos anteriores, los términos (variables) de las hipótesis tienen que ser
comprensibles, precisos y lo más concreto posibles.
14
Tipos de hipótesis
Univariadas
Los modelos pedagógicos participativos son más aceptados en la población escolar infantil
de la ciudad de Santander.
Multivariadas
La hipótesis nula o hipótesis de nulidad (Ho), que es lo contrario a lo que se intenta probar
va a ocurrir, se redacta de forma que niegue –excluyendo- la hipótesis alterna.
15
La hipótesis alterna (Hi) es la que se busca comprobar a partir del rechazo de la hipótesis
nula.
El análisis estadístico de los datos servirá para determinar si se puede o no aceptar Hi.
Cuando se rechaza Ho, significa que el factor estudiado ha influido significativamente en los
resultados y es información relevante para apoyar la hipótesis de investigación Hi
planteada. Plantear una hipótesis de investigación que no sea excluyente con Ho supondría
una aplicación incorrecta del razonamiento estadístico. La hipótesis de investigación se
puede representar en la curva normal (campana de Gauss), de la siguiente manera:
Zona crítica
Zona crítica
Margen de error
Margen de error
Error tipo I
Error tipo II
Alfa
Beta
Zona de rechazo
Zona de rechazo Ho
Ho
Ejemplo 1:
De investigación
Los niños escolarizados en el nivel de básica de primaria del municipio de Girón ven la
televisión más de lo esperado.
Hipótesis nula: en la actualidad, los niños de Girón de cinco a seis años ven la TV
aproximadamente doce horas a la semana.
Hipótesis alternativa: en la actualidad los niños de Girón de cinco a seis años ven la TV más
de doce horas a la semana.
Hipótesis estadísticas: sea X el número de horas por semana que un niño de Girón ve la TV
y sea M[X] la "media teórica" o "valor esperado" de X,
Ho: M[X] = 12 Ha: M[X] > 12
Ejemplo 2:
16
Hipótesis investigativa:
En el tratamiento con hipnosis de la migraña los resultados son mejores en la medida que
se logra una hipnosis más profunda.
Hipótesis nula:
Los resultados del tratamiento con hipnosis de la migraña (en términos de cura total,
mejoría o no cambios) son independientes del nivel de hipnosis logrado (en términos de
ligera, media o profunda).
Hipótesis alternativa:
En la medida que es más profundo el nivel de hipnosis que se logre, se esperan mejores
resultados en la cura de la migraña.
Hipótesis estadísticas:
Sea X el nivel de hipnosis que se logra en un individuo con migraña sometido a tratamiento
durante el experimento (X se mide en tres niveles: 1. ligera, 2: media, 3: profunda) y sea Y
los resultados del tratamiento (Y se mide también en tres niveles: 1. sin cambios, 2. mejoría,
3. cura total).
17
Prueba Resultado Aplicación
Coeficiente Pearson -1.00 a +1.00 Prueba de correlación –dos variables continuas-
A partir de ello se hace regresión lineal
Prueba t Nivel de significancia Diferencias de grupos respecto a la X y la S2, se usan
grados de libertad
Anova (Prueba F) Nivel de significancia Prueba de comparación de diferencias entre grupos e
intragrupos: evalúa el efecto de una (one way) o varias
(factorial) variables independientes sobre una
dependiente.
Fuente: (Hernández Sampieri, 2010)
18
Esquema n.°23. Análisis estadístico para prueba de hipótesis de investigación (continuación)
Análisis no paramétricos (supuestos):
1. No requieren distribución normal –muestras-.
2. El nivel de medición de las variables es de cualquier tipo
H0: hipótesis nula, que es lo contrario de lo que sospechamos que va a ocurrir (suele
llevar los signos igual, mayor o igual y menor o igual)
H1: hipótesis alternativa y es lo que sospechamos que va a ser cierto (suele llevar los
signos distinto, mayor y menor).
19
De los dos, el más importante es alfa, al que se denomina nivel de significación y nos
informa de la probabilidad que tenemos de estar equivocados si aceptamos la hipótesis
alternativa.
Debido a que dos errores a la vez son imposibles de controlar, la decisión depende
solamente del nivel de significancia, si es grande es más fácil aceptar la hipótesis alternativa
cuando en realidad es falsa. El valor del nivel de significancia suele ser un 5% (0.05), definido
como margen de error para el cálculo muestral.
p < e = se rechaza la hipótesis nula y se acepta, por lo tanto, la hipótesis alterna, quiere decir
que se ha comprobado la hipótesis de investigación, por el contrario:
p > e = se acepta la hipótesis nula, en realidad no podemos afirmar que sea cierta, sino que
la hipótesis alternativa no es cierta, ya que el margen de error con el que se acepta la
hipótesis nula es muy grande (García Cebrian, 2001).
Ejemplo 1
20
% de Facultad 44,0% 42,7% 13,3% 100,0%
Salud Recuento 16 15 1 32
% de Facultad 50,0% 46,9% 3,1% 100,0%
Total Recuento 176 154 25 355
% de Facultad 49,6% 43,4% 7,0% 100,0%
Fuente: (Rojas yy Linares, 2010)
Interpretación
H0: hipótesis nula: no existe ninguna diferencia entre la facultad en que están matriculados
los estudiantes y la consideración del costo de la educación superior hoy en Colombia, o Ho:
M [X] = Y
H1: hipótesis alternativa: existen diferencias significativas entre la facultad en que están
matriculados los estudiantes y la consideración del costo de la educación superior hoy en
Colombia, o Ho: M [X] ≠ Y
La prueba se realiza a través de chi cuadrado y razón de verosimilitudes puesto que ambas
variables son categóricas –no continuas-.
Los datos de la tabla de contingencia y la prueba chi cuadrado (chi2), indicaron una
correlación estadísticamente significativa (0.026 y 0.030) menores que el error (0.05). Lo
que implica que se rechaza la hipótesis nula y se acepta la alternativa. Además, el cuadro
nos ofrece información interna de en dónde se presentaron las mayores diferencias al
contrastar las variables: los estudiantes de Ciencias y de Humanidades, se inclinan por
afirmar que es muy costosa la educación, a diferencia de los estudiantes de ingenierías que,
en mucho menor grado opinan lo contrario.
Ejemplo 2
21
H0: hipótesis nula: no existe ninguna diferencia de género de los estudiantes y la
consideración del costo de la educación superior hoy en Colombia, o Ho: M [X] = Y
Tabla n.° 8 Género y Consideración sobre el costo de la educación universitaria hoy en Colombia
Sig. asintótica
Valor Gl (bilateral)
Chi cuadrado de Pearson 0,328 2 0,849
Razón de verosimilitudes 0,331 2 0,848
Número de casos válidos 355
Bibliografía
Adonay Moreno, Y. G. (1999). Aprender a investigar. Modulo 3. Santa Fe de Bogota: ARFO EDITORES
LTDA.
Beck, U. (2008). Generaciones globales en la sociedad del riesgo mundial. Revista Cidob d'Afers
Internacionals nº 82-83, septiembre, [Recuperado septiembre 2010:
22
http://www.revistasculturales.com/articulos/13/revista-cidob-d-afers-
internacionals/932/4/generaciones-globales-en-la-sociedad-del-riesgo-mundial.html].
Castañeda Góez, B., & Ossa Londoño, J. (2005). Por los caminos de los semilleros de investigación.
Medellín. Medellín: Universidad de Antioquia, Biogénesis, Fondo Editorial.
Gibbons, M., Limoges, C., Nowotny, S., Schwartzman, S., Scott, P., & Trow, M. (1994). The New
Production of Knowledge: The Dynamics of Science and Research in Contemporary Societies.
SAGE.
Grau, R., Correa, C., & Rojas, M. (2005). Metodología de la Investigación. Ibagué: Universidad de
Ibagué.
Jaramillo, H. (2005). Interacción entre el Capital Humano, el Capital Intelectual y el Capital Social:
Una Aproximación a la Medición de Recursos Humanos en Ciencia y Tecnología. Bogotá:
Colciencias, Recuperado enero 2008 http://www.colciencias.gov.co/encuentros.html.
Jiménez-Buedo, M., & Ramos Vielba, I. (2009). ¿Más allá de la ciencia académica?: modo 2, ciencia
posnormal y ciencia posacadémica. Arbor, 185(738), 721-737.
Kuhn, T. (2000). La estructura de las revoluciones científicas (2a ed. en español). Bogotá: FCE.
Medina, J., & Lucio, J. (Marzo de 2006). Lo que necesitamos aprender en ciencia, tecnología e
innovación. Portafolio, págs. 16-18.
Popper, K. (1997). El mito del marco común. En defensa de las ciencias y la racionalidad. Buenos
Aires: Paidós Básica.
23
Villa Sánchez, A. (2008). La excelencia docente. Revista de Educación, Extraordinario, 177-212.
24