Unidad 4

La formación investigativa en la universidad:
métodos cuantitativos de investigación
Mauricio Rojas Betancur

Andrea Soto Zorro
Grupo de Investigación en Población, Ambiente y Desarrollo G-PAD

Universidad Industrial de Santander
2015
1
La formación investigativa en la universidad: métodos cuantitativos de investigación
ISBN: 978-958-8777-95-5
Escuela de Trabajo Social

Universidad Industrial de Santander
Palabras clave: ciencia, métodos cuantitativos, investigación social, trabajo social
Diseño y diagramación
División Editorial y Publicaciones
©Universidad Industrial de Santander

Mauricio Rojas Betancur
Andrea Soto Zorro
2015
Se prohíbe la reproducción impresa o electrónica, total o parcial de esta obra, sin la autorización expresa y
por escrito de la Universidad Industrial de Santander
2
UNIDAD 4.
4.1 Muestra. Selección de la muestra. La caracterización de la población
¿Quiénes van a ser medidos?
La respuesta a esta pregunta depende de precisar claramente el problema a investigar y los

objetivos de la investigación. Los objetivos determinan cuáles deben ser las unidades
básicas de análisis. El muestreo es una técnica muy extendida en la investigación social
debido a la imposibilidad práctica de trabajar con universos completos de personas,
eventos, grupos u objetos.
Población: hace referencia al total de unidades de análisis que componen el conjunto

definido de elementos a investigar.
Unidad de análisis: uno de elementos que conforman la población; debe ser claramente
definida de acuerdo con los propósitos de estudio.
Muestra: es un subconjunto representativo de la población a estudiar. La representatividad

significa que la selección del subconjunto debe garantizar, por procedimientos estadísticos
o teóricos, que sus conclusiones sean generalizables a toda la población a través de
procesos de inferencia estadística.
El muestreo: es una herramienta de la investigación científica para seleccionar

probabilísticamente elementos de un universo con la finalidad de estimar, con un
determinado grado de precisión, algunas características del universo en su totalidad.
Su función básica es determinar qué parte de una realidad en estudio (población o universo)
debe examinarse con la finalidad de hacer inferencias sobre dicha población. Las muestras
son subgrupos de la población, previamente delimitada y puede ser probabilística o no
probabilística.
Muestreo probabilístico: es una técnica que se basa en el principio de equiprobabilidad. Es

decir, en un principio según el cual todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamaño n tienen la misma probabilidad de ser elegidas.
Muestreo no probabilístico: la elección depende de causas relacionadas con las

características del investigador. Está claro que tienden a ser sesgadas y se justifican casi solo
en estudios de carácter exploratorio.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita
o finita. Una población finita en la que se efectúa muestreo con reposición puede
3
considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande
puede considerarse como infinita. En todo el estudio se debe limitar a una población de
partida infinita y a un muestreo con reposición.
Al considerar todas las posibles muestras de tamaño n en una población. Para cada muestra
se puede calcular un estadístico (media, desviación típica, proporción) que variará de una a
otra. Así, se obtiene una distribución del estadístico que se llama distribución muestral. Las
dos medidas fundamentales de esta distribución son la media y la desviación típica, también
denominada error típico.
Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las
distribuciones muestrales son normales y en esto se basarán todos los resultados que se
alcancen (García Cebrian, 2001).
4.2 Tipos de muestreo
Muestreo probabilístico: aquel donde cada unidad de análisis que compone la población,
tiene exactamente la misma probabilidad de muestreo, puede calcularse la probabilidad de
extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo
es el más aconsejable, aunque en ocasiones no es posible optar por él.
Muestreo estratificado: consiste en la división previa de la población de estudio en grupos

o clases que se suponen homogéneos respecto a característica a estudiar. A cada uno de
estos estratos se le asignaría una cuota que determinaría el número de miembros que
compondrán la muestra (por ejemplo, estudiantes de pregrado y de postgrado según su
peso relativo).
Muestreo sistemático: es la elección de una muestra a partir de los elementos de una lista
según un orden determinado, o recorriendo la lista a partir de un número aleatorio
determinado.
Muestreo por conglomerados: cuando la población se encuentra dividida, de manera

natural, en grupos que se suponen que contienen toda la variabilidad de la población, es
decir, la representan fielmente respecto a la característica a elegir, Cuando en lugar de
unidades últimas se eligen grupos, bloques o conjuntos de esas unidades, se dice que
el muestreo es por conglomerados.
Muestreo teórico o errático: también se llama sin norma. La muestra se realiza valorando
únicamente la comodidad o la oportunidad en términos de costes, tiempo u otro factor no
estadístico.
Procedimiento para el cálculo muestras estadísticas
4
Muestreo simple: este tipo de muestreo toma solamente una muestra de una población
dada para el propósito de inferencia estadística. Puesto que solamente se toma una
muestra, el tamaño de esta debe ser suficientemente grande para extraer una conclusión.
Muestreo aleatorio simple (MAS): es aquel en que cada elemento de la población tiene la
misma probabilidad de ser seleccionado para integrar la muestra. Una muestra simple
aleatoria es aquella en la que sus elementos son seleccionados mediante el muestreo
aleatorio simple.
Esquema n.°17. Elementos del muestreo aleatorio simple
Muestreo aleatorio simple
Población (N) Muestra (n)
Representatividad
Inferencia estadística
Fuente: Elaboración propia, 2011
Fórmula de muestreo aleatorio simple, utilizando un parámetro poblacional
𝑁(𝑝 ∗ 𝑞 )
𝑛= 𝑁−1
2 +(𝑝∗𝑞)
𝑒 𝑧2
Convenciones
N = tamaño de población (debe ser un número conocido)
p = parámetro de la población, se define en el diseño muestral y se establece como

probabilidad de ocurrencia de un evento o como esperanza matemática de un suceso.
Algunos textos recomiendan que se use 0.5 como p, pero esa decisión corresponde al tipo
5
de problema, ya que significa que se espera que ocurra p en la mitad de los casos, lo cual es
inaplicable en la mayoría de investigaciones.
q = lo que le falta a p para llegar a 1(1-p), o a la probabilidad total (p+q=1)
e = margen de error, que es el grado de precaución señalada para la investigación sobre el

nivel de generalización que pueda realizar con los resultados. En Ciencias Sociales, dada la
complejidad de los fenómenos y la imposibilidad de un control sobre las situaciones –
variables-, es conveniente el uso de un margen alrededor del 5%, aunque ello depende de
la precisión de la investigación que se realice.
Z2 = es el nivel de significancia estandarizado bajo la curva normal a partir de puntuaciones

expresadas en sigmas. En cada investigación, al igual que en el margen de error, se define
un índice de confiabilidad que implica el nivel de generalización logrado o el grado
porcentual en que son aplicables las conclusiones a la población (N). Un índice de
confiabilidad adecuado en Ciencias Sociales es del 95% (se aplica a la población en el 95%
de los casos), que estandarizado bajo la normal equivale a 1.96 sigmas.
Muestreo aleatorio simple. Observaciones
 La población (N) es conocida, pero estadísticamente infinita

 El parámetro poblacional “p” se define a partir de investigaciones anteriores o del
referente conceptual (marco teórico)
 p+q = 1
 p (X)= casos favorables/casos posibles
 Cuando no se tiene certeza del parámetro poblacional “p” es un error usar 0.50,
pues significa que se espera que el evento estudiado ocurra en el 50% de los casos
 A mayor parámetro poblacional “p”, menor número de muestra, pues se incrementa
la probabilidad de éxito del suceso p (X).
Ejemplo
En el estudio adelantado por Rojas y Linares (2010), los datos para el muestreo fueron los
siguientes:
Tabla n.° 6. Criterios estadísticos para el cálculo de la muestra

Tamaño de muestra, convenciones Tamaño
N = Tamaño de población 18.964*
p = Proporción de estudiantes de pregrado que se espera puntúen con una 0.30
predisposición alta hacia la emigración finalizada la formación
q = p-1 0.70
e = margen de error 0.05
6
IC = índice de confiabilidad (95%), estandarizado Z 1.96
n = Tamaño de muestra 341
*Fuente: (Universidad Industrial de Santander, 2009)
Donde:
18964 (0.30 ∗ 0.70)

𝑛=
18964 − 1
(0.05)2
(1.96)2 + (0.30 ∗ 0.70)
n = 341 encuestas efectivas
Ahora bien, este número general de muestra debe ser distribuido (ponderado) para
equiparar su distribución tal como sucede en la población de referencia, con el propósito
de buscar mayor representatividad. En este ejemplo se establece la importancia de
ponderar la muestra a partir de dos criterios de distribución: edad y facultad a la que
pertenecen los estudiantes. La estratificación con varios giros es siempre posible, pero
puede llegar a reducir demasiado el volumen de la muestra en cada estrato.
Para lograr la muestra estratificada basta multiplicar el total de estudiantes de cada giro por
una fracción de muestreo que resulta de la relación entre el volumen de la muestra y el
volumen de la población.
n/N = 341/18.964 = 0.018
Estrato o giro Población Muestra

Hombres 9.092 163
Mujeres 9.940 178
Total 18.964 341
7
Matrícula total de pregrado según programa (la base n se modifica a 16.335): (0.021)
Estrato o giro Población Muestra
Ciencias 1.266 26
Ciencias Humanas 3.120 65
Ing. Fisicomecánicas 6.998 146
Ing. Fisicoquímicas 3.430 72
Salud 1.521 32
Total 16.335* 341
* Se excluyen estudiantes a distancia y sedes regionales
Esta no es la única forma de calcular la muestra, ello dependerá de la información disponible

para el investigador, por ejemplo si cuenta con parámetros como las varianzas
poblacionales:
α 𝟐
σ2 Z1 − 2
𝒏=( )
e
σ2 = varianza poblacional
e = error estándar o error máximo prefijado y está dado por la expresión:
σ2
𝑒=
√𝑛 𝑍1−α2
Para el índice de confianza (1- α) constituye una medida de la precisión de la estimación.
Para determinar el tamaño de la muestra cuando los datos son cualitativos, es decir para el
análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar la
ausencia o presencia del fenómeno a estudiar, se recomienda utilizar la siguiente fórmula:
𝑛´
𝑛=
1 + 𝑛´ /𝑁
Donde:
𝑆2
𝑛´ = σ2
Sabiendo que:
σ 2 =varianza de la población respecto a determinadas variables.
S2 = varianza de la muestra, la cual podrá determinarse en términos de probabilidad como

S2 = p (1-p)
8
Se = error estándar que está dado por la diferencia entre (µ - 𝑥⃑) la media poblacional y la
media muestral.
(Se)2 = error estándar al cuadrado, que servirá para determinar σ 2, por lo que σ2 = (Se)2, es
la varianza poblacional.
Ejemplo
Se desea conocer la aceptación de los programas de salud sexual adelantados por la Alcaldía
de una población de 1176 adolescentes de la ciudad de Bucaramanga, y para ello se desea
tomar una muestra, por lo que se necesita saber la cantidad de adolescentes que se deben
entrevistar para tener una información adecuada con error estándar menor de 0.015 al 90
% de confiabilidad.
Solución:
N = 1.176 adolescentes (unidades muestrales y unidades de análisis)
Se = 0.015
σ2 = (Se)2 = (0.015)2 = 0.000225
S2 = p (1-p) = 0.9 (1-0.9) = 0.09
Por tanto
n´= s2/ σ 2 = 0.09/0.000225 = 400
400
𝑛= = 298
1 + 400/1176
Es decir, para realizar la investigación se necesita una muestra de al menos 298

adolescentes.
Muestras no probabilísticas: es cuando no se realiza el cálculo estadístico y se aplica a

sujetos voluntarios, expertos, sujetos tipo, muestras por cuotas. Las muestras no
probabilísticas o muestras dirigidas suponen un proceso de selección informal y un poco
arbitraria. Tales muestras pretenden seleccionar sujetos “típicos” con la vaga esperanza que
serán representativos, “en cierto sentido”, de una población determinada.
Desventajas
 La representatividad no es segura
9
 Las estimaciones a partir de la muestra son poco confiables.
 Rara vez los resultados son generalizables a una población
Tipos de muestras no probabilísticas
Muestras de sujetos voluntarios. Se trata de muestras fortuitas, por ejemplo, en Medicina

y Arqueología, donde ciertos especímenes llegan a manos del investigador de manera
“casual”.
Muestras de expertos. Son muestras válidas y útiles cuando los objetivos del estudio
requieren la opinión de expertos en un tema, especialmente en estudios cualitativos y
exploratorios.
Muestras con sujetos tipo. se emplea en estudios exploratorios e investigaciones de tipo

cualitativo cuando el objetivo es la riqueza, profundidad y calidad de la información y no la
cantidad y estandarización.
Muestras por cuotas. Se utiliza en encuestas de opinión y mercadotecnia de acuerdo a

ciertas propiedades de variables demográficas que dependen del juicio del investigador y
no de un análisis riguroso de estratificación
4.3 Variables
El concepto de variable en investigación cuantitativa está siempre en relación con el

concepto de hipótesis y representa un concepto fundamental en la investigación, puesto
que determina la posibilidad de acercarnos al mundo real, para observarlo o explicarlo. Las
variables son características de la realidad que puedan ser determinadas por observación
y, lo más importante, que puedan mostrar diferentes valores de una unidad de observación
a otra, de una persona a otra, o de un país a otro (edad, ingresos, número de habitantes,
etc.). Técnicamente una variable es una propiedad que puede adquirir diferentes valores
en un conjunto determinado y cuya variación es susceptible de ser medida.
Una variable es un elemento de una fórmula, proposición o algoritmo que puede adquirir
un valor cualquiera (siempre dentro de su universo) o ser sustituido por dicho valor. Los
valores que una variable es capaz de recibir pueden estar definidos dentro de un rango o
estar limitados por criterios o condiciones de pertenencia al universo que les corresponde
(en estos casos, el universo de la variable pasa a ser un subconjunto de un universo mayor,
el que tendría sin las restricciones).
Una investigación, cualitativa o cuantitativa, exige la operacionalización de sus conceptos

centrales en variables; de esta definición operativa depende el nivel de medición y potencia
de las pruebas realizadas.
10
Esquema n.°18. Tipos de variables, estadísticas apropiadas y nivel de potencia
Tipo de m Características de Ejemplo Estadísticas apropiadas Potencia
Variable
edición
Nominal Categorías no Sexo, municipio, Recuentos, tasas, Baja
ordenadas estado de ánimo, proporciones, riesgo
2
orientación relativo, x , Mantel-
religiosa. Haentzel, regresión.
Ordinal Categorías ordenadas Grado de Además de lo anterior : Intermedia
con intervalos no aprendizaje, nivel mediana, correlación
cuantificables de escolaridad. ordinal
Continua o Espectro ordenado Peso, talla, número Además : Media, DS, Elevada
discreta con intervalos de clases al día, pruebas t, Anova,
cuantificables horas de TV. a la regresión potente
semana.
Fuentes: (Kerlinger, 2001), (Grau, Correa, & Rojas, 2005)
La clasificación de la variable según tipo es una decisión instrumental que tendrá efecto en
el tipo de medición y en el tipo de pruebas estadísticas que pueden ser usadas para su
análisis. Como en el esquema anterior, es importante entender que esta definición no es
arbitraria, es el resultado de la manera en que hemos planteado el problema y los objetivos
de investigación.
Lo importante en una variable es:

a. Que se derive siempre de una unidad.
b. Que admita un rango mínimo de variación.
La clase más simple de variable es aquella por la cual una unidad puede ser clasificada por
la presencia o ausencia de esa dimensión: hombre - mujer; estudioso - desaplicado; pobre
- rico, etc. Hay variables más complejas como por ejemplo, niveles de edad, rangos de
ingreso, tamaño de la familia, ocupación, etc. (Adonay Moreno, 1999)
Por nivel, las variables pueden además clasificarse en dependientes, independientes e

intervinientes, tal como se resume en el siguiente esquema. Esta clasificación es necesaria
cuando se trabaja con con hipótesis de investigación. Es importante poder distinguir en una
hipótesis –que expresa la relación entre variables- en qué nivel se deben ubicar las variables
que componen la investigación.
Esquema n.°19. Niveles de las variables, ejemplos

Nivel de la Definición Ejemplo
variable
Dependiente Es el efecto estudiado, la Los estudiantes de la Escuela de Trabajo
característica explicada, cuya Social UIS, obtuvieron alto rendimiento en
variación depende de una o más las pruebas SABER 2015, resultado del buen
variables independientes. nivel de lectura.
Independiente Es la causa asociada, aquella que es Los estudiantes de la Escuela de Trabajo
manipulada por el investigador en Social UIS, obtuvieron alto rendimiento en
un experimento con el objeto de las pruebas SABER 2011, resultado del buen
11
estudiar cómo incide sobre la nivel de lectura y del énfasis investigativo
expresión de la variable dependiente del programa
Interviniente Tienen efecto en la relación Los estudiantes de la Escuela de Trabajo
planteada, aunque no son esenciales Social UIS, obtuvieron alto rendimiento en
en la relación. las pruebas SABER 2011, resultado del buen
nivel de lectura y del énfasis investigativo del
programa, especialmente de aquellos
estudiantes con alto rendimiento escolar.
En términos resumidos las variables son las características observables de una unidad de
análisis, ligadas entre sí en su variación en una relación específica de asociación,
dependencia o causalidad.
Las variables se clasifican según diversos criterios. Una clasificación tiene en cuenta el
criterio de causalidad; en este caso se habla de variables independientes y variables
dependientes. Es independiente la variable que explica el fenómeno y es dependiente la
variable que corresponde al fenómeno explicado.
Los valores de la variable independiente no dependen de otra variable sino de la voluntad

y el propósito del investigador, mientras que los valores de la variable dependiente están
sujetos a los valores que se hayan elegido para la variable independiente (Adonay Moreno,
1999).
OPERACIONALIZACIÓN DE VARIABLES
Consiste en hacer deliberadamente un manejo operativo de cada variable, es decir, definir
los indicadores e índices con los cuales se va a expresar concretamente la variable con base
en los conceptos y elementos que intervienen en el problema de investigación. La
operacionalización es de naturaleza básicamente cualitativa.
Esquema de operacionalización. La forma más corriente o más común de realizar la

operacionalización de variables es a través del siguiente esquema, en donde se definen las
dimensiones, indicadores e índices.
Esquema n.° 20. Operacionalización de las variables
VARIABLE Dimensiones
Indicadores Indicadores
Factores a medir Señala los elementos Ponderaciones o

que permiten medir y valoraciones
cuantificar en la práctica
el comportamiento de
las variables
12
Fuente: Elaboración propia, 2013
4.4 Hipótesis de investigación
Las hipótesis de investigación son explicaciones tentativas del fenómeno investigado,

formuladas a manera de proposiciones que caracterizan una o más variables o sus
relaciones y que se apoyan en conocimientos organizados y sistematizados.
Funciones de las hipótesis:

a. Sirven como guía de investigaciones, necesita contrastación, construcción de información
y técnicas adecuadas de manejo de datos.
b. Especifican cuáles hechos se observan y qué relación se establecerá entre ellos.
c. Ofrecen una explicación previa pues están relacionadas con el marco teórico-conceptual
lo que facilita el análisis de datos.
 La hipótesis indica el tipo de relación que se espera encontrar

 Describe alguna o algunas propiedades de la relación entre a y b
 El primer elemento a es la causa del segundo b
 Cuando se presenta esto, a entonces sucede aquello, b
 Cuando esto sí, a, entonces aquello no, b.
 Para que sea admitida como cuerpo de conocimiento científico, la hipótesis tiene que
poder establecer una cuantificación determinada o una proporción matemática que
permite su verificación estadística.
Por tratarse de proposiciones a comprobar o a desvirtuar, las hipótesis siempre son de

carácter provisional; se pueden encontrar dos tipos: hipótesis teóricas y empíricas, aunque
muchos autores también hablan de hipótesis históricas, descriptivas, explicativas, entre
otras, situación que tiene que ver más exactamente con el tipo de investigación formulada.
Ejemplos de hipótesis
 El incremento en los costos de la educación privada causa desplazamiento de la

población estudiantil hacia la educación pública.
 Los hijos de padres maltratadores tienen una mayor probabilidad de ser adultos
disfuncionales.
 Los niños en situación de malnutrición tienen un menor rendimiento escolar que
los niños con un buen nivel de nutrición.
 La falta de aceptación cultural del uso de métodos de planificación se presenta
más en los hombres que en las mujeres, especialmente en la población rural.
13
 El mayor uso de tecnologías de la informática y la comunicación no implica un
mejor desempeño académico de los estudiantes de pregrado de la Universidad
Industrial de Santander.
Como en los ejemplos anteriores, los términos (variables) de las hipótesis tienen que ser
comprensibles, precisos y lo más concreto posibles.
14
Tipos de hipótesis
Esquema n.° 21 Tipos de hipótesis

Según la forma Según el nivel
Descriptivas Hipótesis de investigación
Correlacionales Hipótesis descompuesta en nula y alternativa
De comparación de grupos Hipótesis estadísticas
De causalidad: univariadas, bivariadas y
multivariadas
Ejemplos de hipótesis de causalidad:
Univariadas
La desintegración familiar provoca una disminución de la autoestima de los hijos.
Los modelos pedagógicos participativos son más aceptados en la población escolar infantil
de la ciudad de Santander.
Multivariadas
La cohesión, la centralidad y el tipo de liderazgo favorecen la efectividad en el logro de las

metas primarias en las organizaciones comunitarias.
La variedad y la autonomía en el trabajo, así como la retroalimentación proveniente de este

determinan la motivación intrínseca y la satisfacción laboral entre los empleados
colombianos actuales.
La disminución en la edad de ingreso del joven a la universidad, el incremento de la

cobertura y la mayor oferta educativa en Santander, así como la apertura de fuentes de
financiación de la educación, no han impacto positivamente en el índice de deserción
estudiantil.
Con variables modificantes

La atención en salud, la solución a los problemas de vivienda y la capacitación en labores
productivas amortiguan el impacto psicosocial del desplazamiento forzoso de las familias
colombianas, especialmente en el departamento de Santander del Sur.
Por nivel, la hipótesis se descompone en dos mutuamente excluyentes:
La hipótesis nula o hipótesis de nulidad (Ho), que es lo contrario a lo que se intenta probar
va a ocurrir, se redacta de forma que niegue –excluyendo- la hipótesis alterna.
15
La hipótesis alterna (Hi) es la que se busca comprobar a partir del rechazo de la hipótesis
nula.
El análisis estadístico de los datos servirá para determinar si se puede o no aceptar Hi.
Cuando se rechaza Ho, significa que el factor estudiado ha influido significativamente en los
resultados y es información relevante para apoyar la hipótesis de investigación Hi
planteada. Plantear una hipótesis de investigación que no sea excluyente con Ho supondría
una aplicación incorrecta del razonamiento estadístico. La hipótesis de investigación se
puede representar en la curva normal (campana de Gauss), de la siguiente manera:
Esquema n.°22 Prueba de hipótesis
Zona crítica
Zona crítica
Margen de error
Margen de error
Error tipo I
Error tipo II
Alfa
Beta
Zona de rechazo
Zona de rechazo Ho
Ho
Ejemplos de hipótesis por niveles:
Ejemplo 1:
De investigación
Los niños escolarizados en el nivel de básica de primaria del municipio de Girón ven la
televisión más de lo esperado.
Hipótesis nula: en la actualidad, los niños de Girón de cinco a seis años ven la TV
aproximadamente doce horas a la semana.
Hipótesis alternativa: en la actualidad los niños de Girón de cinco a seis años ven la TV más
de doce horas a la semana.
Hipótesis estadísticas: sea X el número de horas por semana que un niño de Girón ve la TV
y sea M[X] la "media teórica" o "valor esperado" de X,
Ho: M[X] = 12 Ha: M[X] > 12
Ejemplo 2:
16
Hipótesis investigativa:
En el tratamiento con hipnosis de la migraña los resultados son mejores en la medida que
se logra una hipnosis más profunda.
Hipótesis nula:
Los resultados del tratamiento con hipnosis de la migraña (en términos de cura total,
mejoría o no cambios) son independientes del nivel de hipnosis logrado (en términos de
ligera, media o profunda).
Hipótesis alternativa:
En la medida que es más profundo el nivel de hipnosis que se logre, se esperan mejores
resultados en la cura de la migraña.
Otras hipótesis alternativas:

En la medida que se logra una hipnosis más profunda, se obtienen peores resultados en la
cura de la migraña.
Hipótesis estadísticas:
Sea X el nivel de hipnosis que se logra en un individuo con migraña sometido a tratamiento
durante el experimento (X se mide en tres niveles: 1. ligera, 2: media, 3: profunda) y sea Y
los resultados del tratamiento (Y se mide también en tres niveles: 1. sin cambios, 2. mejoría,
3. cura total).
Ho: X Y son independientes

H1: X Y se "correlacionan positivamente" de forma significativa.
4.4.1 Pruebas de hipótesis
Es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea

para determinar si la hipótesis es una afirmación razonable. Existen múltiples pruebas
estadísticas para determinar la relación entre las variables. Los siguientes cuadros nos
ofrecen un resumen de una parte pequeña del arsenal estadístico que se puede utilizar para
la comprobación:
Esquema n.° 23. Análisis estadístico para prueba de hipótesis de investigación

Análisis paramétrico (supuestos):
1. La distribución poblacional de la variable dependiente es normal –En el universo está
normalmente distribuido-
2. El nivel de medición de la variable dependiente es por intervalos o razón
3. En dos poblaciones la varianza y la dispersión son homogéneas
17
Prueba Resultado Aplicación
Coeficiente Pearson -1.00 a +1.00 Prueba de correlación –dos variables continuas-
A partir de ello se hace regresión lineal
Prueba t Nivel de significancia Diferencias de grupos respecto a la X y la S2, se usan
grados de libertad
Anova (Prueba F) Nivel de significancia Prueba de comparación de diferencias entre grupos e
intragrupos: evalúa el efecto de una (one way) o varias
(factorial) variables independientes sobre una
dependiente.
Fuente: (Hernández Sampieri, 2010)
18
Esquema n.°23. Análisis estadístico para prueba de hipótesis de investigación (continuación)
Análisis no paramétricos (supuestos):
1. No requieren distribución normal –muestras-.
2. El nivel de medición de las variables es de cualquier tipo
Prueba Resultado Aplicación

2
Significancia Prueba para evaluar hipótesis acerca de la relación
Chi cuadrada o X
entre dos variables categóricas
Coeficiente Phi 0a1 Tablas 2X2: el 0 indica ausencia de correlación y el 1
correlación perfecta.
V de Cramer 0a1 Tablas de cualquier tamaño
Goodman-Kruskal 0a1 Tablas de cualquier tamaño y asume causalidad
Lambda
Gamma de Goodman -1 a +1 -1 es una relación negativa perfecta y +1 positiva
y Kruskal perfecta, variables ordinales
Kappa 0a1 Datos categorizados por intervalos, cualquier tamaño.
Fuente: (Hernández Sampieri, 2010)
El contraste de hipótesis es una decisión entre Ho y Hi (hipótesis nula e hipótesis alterna),

que afecta a cierto parámetro poblacional (inmerso en la redacción de la hipótesis). Con
ayuda de la estadística se toma la decisión de optar por una de estas dos hipótesis y ello
nos conduce a conocer una medida de error cometido (cuántas veces de cada cien nos
equivocamos en términos de la probabilidad de un evento).
El proceso estadístico se denomina contraste de hipótesis, recordando que el contraste

sucede entre:
 H0: hipótesis nula, que es lo contrario de lo que sospechamos que va a ocurrir (suele
llevar los signos igual, mayor o igual y menor o igual)
 H1: hipótesis alternativa y es lo que sospechamos que va a ser cierto (suele llevar los
signos distinto, mayor y menor).
Los contrastes de hipótesis pueden ser de dos tipos:

 Bilateral: en la hipótesis alternativa aparece el signo distinto.
 Unilateral: en la hipótesis alternativa aparece o el signo > o el signo <.
Podemos aceptar una hipótesis cuando en realidad no es cierta, entonces cometeremos

unos errores, que podrán ser de dos tipos:
 Error de tipo I: consiste en aceptar la hipótesis alternativa cuando la cierta es la nula.

 Error de tipo II: consiste en aceptar la hipótesis nula cuando la cierta es la
alternativa.
Se aceptan estos errores si no son muy grandes o si no nos importa que sean muy grandes.
 alfa: es la probabilidad de cometer un error de tipo I.
 beta: es la probabilidad de cometer un error de tipo II.
19
De los dos, el más importante es alfa, al que se denomina nivel de significación y nos
informa de la probabilidad que tenemos de estar equivocados si aceptamos la hipótesis
alternativa.
Debido a que dos errores a la vez son imposibles de controlar, la decisión depende
solamente del nivel de significancia, si es grande es más fácil aceptar la hipótesis alternativa
cuando en realidad es falsa. El valor del nivel de significancia suele ser un 5% (0.05), definido
como margen de error para el cálculo muestral.
Contraste de hipótesis bilateral
Si se cumple una de las siguientes hipótesis:
 El tamaño de la muestra es mayor de 30 y la variable sigue un modelo normal.

 El tamaño de la muestra es mayor de 100.
Se analiza el nivel de significancia obtenido, según el modelo empleado, la regla es:
p < e = se rechaza la hipótesis nula y se acepta, por lo tanto, la hipótesis alterna, quiere decir
que se ha comprobado la hipótesis de investigación, por el contrario:
p > e = se acepta la hipótesis nula, en realidad no podemos afirmar que sea cierta, sino que
la hipótesis alternativa no es cierta, ya que el margen de error con el que se acepta la
hipótesis nula es muy grande (García Cebrian, 2001).
Ejemplo 1
En la investigación referenciada anteriormente (Rojas y Linares, 2010), se estableció la

importancia de contrastar dos variables en la siguiente hipótesis: existen diferencias
importantes entre los estudiantes de pregrado según facultad a la que pertenecen y la
consideración sobre el costo de la educación superior hoy en Colombia. Los resultados
fueron los siguientes (Vía SPSS®):
Tabla n.° 7. Facultad y costos de la educación universitaria
Considera usted que la educación

universitaria hoy Total
Es muy Sus costos son Es poco Es muy

costosa adecuados costosa costosa
Facultad Ciencias Recuento 21 9 1 31
% de Facultad 67,7% 29,0% 3,2% 100,0%
Ciencias Humanas Recuento 44 24 3 71
% de Facultad 62,0% 33,8% 4,2% 100,0%
Ing. Fisicomecánicas Recuento 62 74 10 146
% de Facultad 42,5% 50,7% 6,8% 100,0%
Ing. Fisicoquímicas Recuento 33 32 10 75
20
% de Facultad 44,0% 42,7% 13,3% 100,0%
Salud Recuento 16 15 1 32
% de Facultad 50,0% 46,9% 3,1% 100,0%
Total Recuento 176 154 25 355
% de Facultad 49,6% 43,4% 7,0% 100,0%
Fuente: (Rojas yy Linares, 2010)
Pruebas de chi cuadrado

Grados de Sig. asintótica
Valor libertad (gl) (bilateral)
Chi cuadrado de Pearson 17,453(a) 8 ,026
Razón de verosimilitudes 16,994 8 ,030
Número de casos válidos 355
Interpretación
 La hipótesis, para su contraste, fue formulada de la siguiente manera:
H0: hipótesis nula: no existe ninguna diferencia entre la facultad en que están matriculados
los estudiantes y la consideración del costo de la educación superior hoy en Colombia, o Ho:
M [X] = Y
H1: hipótesis alternativa: existen diferencias significativas entre la facultad en que están
matriculados los estudiantes y la consideración del costo de la educación superior hoy en
Colombia, o Ho: M [X] ≠ Y
La prueba se realiza a través de chi cuadrado y razón de verosimilitudes puesto que ambas
variables son categóricas –no continuas-.
Variable dependiente: costo de la educación superior hoy en Colombia.
Variable independiente: facultad del estudiante de pregrado.
Los datos de la tabla de contingencia y la prueba chi cuadrado (chi2), indicaron una
correlación estadísticamente significativa (0.026 y 0.030) menores que el error (0.05). Lo
que implica que se rechaza la hipótesis nula y se acepta la alternativa. Además, el cuadro
nos ofrece información interna de en dónde se presentaron las mayores diferencias al
contrastar las variables: los estudiantes de Ciencias y de Humanidades, se inclinan por
afirmar que es muy costosa la educación, a diferencia de los estudiantes de ingenierías que,
en mucho menor grado opinan lo contrario.
Ejemplo 2
21
H0: hipótesis nula: no existe ninguna diferencia de género de los estudiantes y la
consideración del costo de la educación superior hoy en Colombia, o Ho: M [X] = Y
H1: hipótesis alternativa: no existe ninguna diferencia de género de los estudiantes y la

consideración del costo de la educación superior hoy en Colombia, o Ho: M [X] ≠ Y
Tabla n.° 8 Género y Consideración sobre el costo de la educación universitaria hoy en Colombia
Considera usted que la educación

universitaria hoy Total
Es muy Sus costos son Es poco Es muy

costosa adecuados costosa costosa
Sexo Hombres Recuento 97 83 15 195
Porcentaje
49,7% 42,6% 7,7% 100,0%
de sexo
Mujeres Recuento 79 71 10 160
Porcentaje
49,4% 44,4% 6,3% 100,0%
de sexo
Total Recuento 176 154 25 355
Porcentaje
49,6% 43,4% 7,0% 100,0%
de sexo
Fuente: (Rojas& Linares, 2010)
Pruebas de chi cuadrado
Sig. asintótica
Valor Gl (bilateral)
Chi cuadrado de Pearson 0,328 2 0,849
Razón de verosimilitudes 0,331 2 0,848
Número de casos válidos 355
Al contrario de lo que sucede estadísticamente en el ejemplo 1, los datos entre sexo

(representado en dos valores: hombres y mujeres), la prueba de significancia estadística
arrojó un resultado mayor al 0.05, lo cual que implica que no puede rechazarse la Ho;
significa, entonces, que no hay una variabilidad importante entre ambos valores (como
variable independiente) y la opinión respecto al costo de la educación superior en Colombia.
Internamente los datos muestran muy poca diferencia entre ambas condiciones.
Bibliografía
Adonay Moreno, Y. G. (1999). Aprender a investigar. Modulo 3. Santa Fe de Bogota: ARFO EDITORES
LTDA.
Beck, U. (2008). Generaciones globales en la sociedad del riesgo mundial. Revista Cidob d'Afers
Internacionals nº 82-83, septiembre, [Recuperado septiembre 2010:
22
http://www.revistasculturales.com/articulos/13/revista-cidob-d-afers-
internacionals/932/4/generaciones-globales-en-la-sociedad-del-riesgo-mundial.html].
Castañeda Góez, B., & Ossa Londoño, J. (2005). Por los caminos de los semilleros de investigación.
Medellín. Medellín: Universidad de Antioquia, Biogénesis, Fondo Editorial.
Feyerabend, P. (1989). Contra el método. . Barcelona: Ariel.
García Cebrian, M. (2001). Inferencia Estadística. Madrid.

http://descartes.cnice.mec.es/materiales_didacticos/inferencia_estadistica/index_inferen
cia.htm: Ministerio de Educación. .
Gibbons, M., Limoges, C., Nowotny, S., Schwartzman, S., Scott, P., & Trow, M. (1994). The New
Production of Knowledge: The Dynamics of Science and Research in Contemporary Societies.
SAGE.
Grau, R., Correa, C., & Rojas, M. (2005). Metodología de la Investigación. Ibagué: Universidad de
Ibagué.
Hernández Sampieri, R. e. (2010). Metodología de la Investigación. 5a Ed. México: Macgraw-hill.
Hernández, C. A. (2005). Navegaciones. El magisterio y la investigación. Bogotá: UNESCO-

COLCIENCIAS.
Jaramillo, H. (2005). Interacción entre el Capital Humano, el Capital Intelectual y el Capital Social:
Una Aproximación a la Medición de Recursos Humanos en Ciencia y Tecnología. Bogotá:
Colciencias, Recuperado enero 2008 http://www.colciencias.gov.co/encuentros.html.
Jiménez-Buedo, M., & Ramos Vielba, I. (2009). ¿Más allá de la ciencia académica?: modo 2, ciencia
posnormal y ciencia posacadémica. Arbor, 185(738), 721-737.
Kerlinger, H. (2001). Investigación del comportamiento.4a Ed. . México: Mcgraw-hill.
Kuhn, T. (2000). La estructura de las revoluciones científicas (2a ed. en español). Bogotá: FCE.
Lakatos, I. (1978). La metodología de los programas de investigación científica. Traducción de J.C.

Zapatero (1983). Madrid: Alianza. (Edición orig. Inglés, 1978) .
Martínez, P. (2009). Desarrollo Económico de Santander. Bucaramanga: USTA.
Medina, J., & Lucio, J. (Marzo de 2006). Lo que necesitamos aprender en ciencia, tecnología e
innovación. Portafolio, págs. 16-18.
Merton, R. (1964). La sociología del conocimiento. Buenos Aires: Eudeba.
Merton, R. (2002). Teoría y Acción sociales. México: FCE.
Popper, K. (1997). El mito del marco común. En defensa de las ciencias y la racionalidad. Buenos
Aires: Paidós Básica.
Tamayo, M. (1999). Aprender a insvestigar. Santa Fe de Bogota: ARFO EDITORES LTDA.
Universidad Industrial de Santander. (2009). La UIS en cifras. Bucaramanga: UIS.
23
Villa Sánchez, A. (2008). La excelencia docente. Revista de Educación, Extraordinario, 177-212.
24

Unidad 4

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 4

Cargado por

Copyright:

Formatos disponibles

La formación investigativa en la universidad:

métodos cuantitativos de investigación

Mauricio Rojas Betancur

Grupo de Investigación en Población, Ambiente y Desarrollo G-PAD

Escuela de Trabajo Social

Palabras clave: ciencia, métodos cuantitativos, investigación social, trabajo social

©Universidad Industrial de Santander

4.1 Muestra. Selección de la muestra. La caracterización de la población

¿Quiénes van a ser medidos?

La respuesta a esta pregunta depende de precisar claramente el problema a investigar y los

Población: hace referencia al total de unidades de análisis que componen el conjunto

Muestra: es un subconjunto representativo de la población a estudiar. La representatividad

El muestreo: es una herramienta de la investigación científica para seleccionar

Muestreo probabilístico: es una técnica que se basa en el principio de equiprobabilidad. Es

Muestreo no probabilístico: la elección depende de causas relacionadas con las

4.2 Tipos de muestreo

Muestreo estratificado: consiste en la división previa de la población de estudio en grupos

Muestreo por conglomerados: cuando la población se encuentra dividida, de manera

Procedimiento para el cálculo muestras estadísticas

Esquema n.°17. Elementos del muestreo aleatorio simple

Muestreo aleatorio simple

Población (N) Muestra (n)

Fuente: Elaboración propia, 2011

Fórmula de muestreo aleatorio simple, utilizando un parámetro poblacional

N = tamaño de población (debe ser un número conocido)

p = parámetro de la población, se define en el diseño muestral y se establece como

q = lo que le falta a p para llegar a 1(1-p), o a la probabilidad total (p+q=1)

e = margen de error, que es el grado de precaución señalada para la investigación sobre el

Z2 = es el nivel de significancia estandarizado bajo la curva normal a partir de puntuaciones

Muestreo aleatorio simple. Observaciones

 La población (N) es conocida, pero estadísticamente infinita

Tabla n.° 6. Criterios estadísticos para el cálculo de la muestra

18964 (0.30 ∗ 0.70)

n = 341 encuestas efectivas

n/N = 341/18.964 = 0.018

Estrato o giro Población Muestra

Esta no es la única forma de calcular la muestra, ello dependerá de la información disponible

σ 2 =varianza de la población respecto a determinadas variables.

S2 = varianza de la muestra, la cual podrá determinarse en términos de probabilidad como

N = 1.176 adolescentes (unidades muestrales y unidades de análisis)

σ2 = (Se)2 = (0.015)2 = 0.000225

S2 = p (1-p) = 0.9 (1-0.9) = 0.09

n´= s2/ σ 2 = 0.09/0.000225 = 400

Es decir, para realizar la investigación se necesita una muestra de al menos 298

Muestras no probabilísticas: es cuando no se realiza el cálculo estadístico y se aplica a

Tipos de muestras no probabilísticas

Muestras de sujetos voluntarios. Se trata de muestras fortuitas, por ejemplo, en Medicina

Muestras con sujetos tipo. se emplea en estudios exploratorios e investigaciones de tipo

Muestras por cuotas. Se utiliza en encuestas de opinión y mercadotecnia de acuerdo a

El concepto de variable en investigación cuantitativa está siempre en relación con el

Una investigación, cualitativa o cuantitativa, exige la operacionalización de sus conceptos

Lo importante en una variable es:

Por nivel, las variables pueden además clasificarse en dependientes, independientes e

Esquema n.°19. Niveles de las variables, ejemplos

Los valores de la variable independiente no dependen de otra variable sino de la voluntad

Esquema de operacionalización. La forma más corriente o más común de realizar la

Esquema n.° 20. Operacionalización de las variables

Factores a medir Señala los elementos Ponderaciones o

4.4 Hipótesis de investigación

Las hipótesis de investigación son explicaciones tentativas del fenómeno investigado,

Funciones de las hipótesis:

 La hipótesis indica el tipo de relación que se espera encontrar

Por tratarse de proposiciones a comprobar o a desvirtuar, las hipótesis siempre son de