Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Área: Metodología y
Semestre: 4
Créditos: 5
Carácter: Obligatoria
Sistema Universidad Abierta
INTRODUCCIÓN
Para llevar a cabo una investigación social necesitamos plantear suposiciones para
explicar hechos “causas” y “efectos” a través de las relaciones entre variables
independientes y las variables dependientes. Para su tratamiento, esos supuestos son
traducidos a términos estadísticos y sometidos a pruebas de validez, por lo que el
investigador deberá identificar claramente el tipo de variables en estudio, sus escalas de
medición, así como la relación que guardan entre sí.
Esta unidad presenta la metodología para el diseño y contrastación de hipótesis, así como
breve descripción de los errores que pueden cometerse al tomar una decisión estadística
equivocada y las condiciones en que éstas deberán tomarse, dependiendo de las pruebas
paramétricas o no paramétricas elegidas.
OBJETIVO
TEMARIO
I. HIPÓTESIS ESTADÍSTICAS.
I.1. Hipótesis Estadísticas.
El investigador la plantea como base para su estudio o referencia de lo que quiere indagar,
dando una explicación tentativa del fenómeno social que desea investigar
Una hipótesis plantea una causa y un efecto, o plantea una variación en las causas darán
variaciones en los efectos, sean lineales, proporcionales, positivas o negativas.
Las variables involucradas en las hipótesis deben ser tangibles, significativas y medibles.
Y deben estar bien definidas evitando ambiguedades de interpretación.
Las hipótesis suelen relacionar causas con efectos, pero estas relaciones pueden ser de
correlación lineal, de correlación por categorias (2 x 2), de asociación por parejas, de
dependencia y contingencia (n x n).
Las relaciones de Correlación lineal, para ello usamos el coeficiente de correlación lineal
“r” de Pearson que los alumnos ven en estadística aplicada a la investigación Social I.
Asi que se este coeficiente representa dos componentes de la relación: la fuerza y la
tendencia.
Veamos ejemplos
El signo positivo indica la tendencia, si uno crece el otro también crece, el signo negativo
indica que sin uno crece el otro decrece, y el valor nos da la fuerza de la correlación, si se
acerca a +1 o a -1, la variable independiente explicara perfectamente el comportamiento de
la variable dependendiente, cuando los valores se acercan a cero no tenemos certidumbre,
pues indica que es escasa o nula la correlación de las variables, no seria prudente
pronosticar si los coeficientes “r” de Pearson fueran ± < 0.74, el criterio lo fija el investigador.
La pobreza en las áreas urbanas en México se debe a la falta de empleos bien remunerados
Las Hipótesis estadísticas nula y alterna deben ser planteadas en forma cuantitativa, forman
un continuo del universo probabilidades posibles. Es decir son complementarias, mientras
que las de trabajo abarcan el total de dichas probabilidades.
Cuando planteamos a las hipótesis como unilaterales, las probabilidades se ven así:
Probabilidades 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Probabilidades 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Tipo de relación H i p ó t e s i s - d e - T r a b a j o
Aceptar la Ho: (Si el Estadístico) <= 50% Aceptar la Ha: (Si el Estadístico) > 50%
Aceptar la Ho: (Si el Estadístico) <= 60% Aceptar la Ha: (Si el Estadístico) > 60%
orrelación Aceptar la Ho: (Si el Estadístico) <= 75% Aceptar la Ha: (Si el
Buena Estadístico) > 75%
Rechazar Hipótesis Nula
Aceptar Hipótesis Nula Ho
Ho
Existe una correlación baja a casi buena Existe correlación entre
buena a perfecta
Probabilidades 0 a 0.1 0.1 a 0.2 0.2 a 0.3 0.3 a 0.4 0.4 a 0.5 0.5 a 0.6 0.6 a 0.7 0.7 a 0.8 0.8 a 0.9 0.9 a 1
Muy
Correlación Nula Escasa Incierta Baja Regular Buena buena
Excelente
Probabilidades 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.85 0.9 1
Rangos 0 a 0.4 0.5 a 0.6 0.7 a 0.85 0.86 a 1
Hipótesis Hipótesis Ho1: Hipótesis Ho2: Hipótesis Ha1: Hipótesis Ha2:
Tipo de
correlación
Correlación nula Correlación pobre Correlación buena Correl. Excelente
Probabilidades 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.85 0.9 1
Rangos < 0.7 0.7 >= y <=0.85 >0.85
Hipótesis Aceptar Ho: Si (Estadístico) < 0.7 y Aceptar Ha: Aceptar Ho: si
(Estadístico) >= 0.7 (Estadístico) > 0.85
y (Estadístico)
<=0.85
Tipo de No existe correlación entre el rango del estadístico con Rechazar Ho Existe Ni existe correlación
correlación valores menores a 0.7 correlación entre el entre valores superioes
rango de 0.7 a 0.85 a 0.85
I.1.1 Hipótesis Estadística Nula
Ejemplo 1
Hipótesis de Trabajo:
A mayor horas de estudio, mejores calificaciones escolares
En este caso la relación es proporcional positiva, por eso el coeficiente “r” de Pearson es
positivo, entre mas estudies mayor será la calificación que obtengas.
Ejemplo 2
Hipótesis de Trabajo:
La tasa de desempleo en los municipios de México es inversamente
proporcional a la capacitación de los trabajadores
Ejemplo 3
O podemos decir
Los que ganan poco ahorran poco y los que ganan
mucho ahorran mucho
Hipótesis Alterna Ha: La tasa de desempleo en los municipios de México tiene una
correlación suficientemente buena con respecto a la capacitación de los trabajadores con
una Correlación r de Pearson >= ±0.74 {observe que el valor del parámetro para comparación puede
cambiar a elección del investigador}
Hipótesis Nula Ho: La tasa de desempleo en los municipios de México no tiene una
asociación suficientemente buena con respecto a la capacitación de los trabajadores con una
asociación por parejas rs de Spearman < ±0.74
Hipótesis Alterna Ha: La tasa de desempleo en los municipios de México tiene una
asociación suficientemente buena con respecto a la capacitación de los trabajadores con una
asociación por parejas rs de Spearman >= ±0.74
Cuando queremos polarizar la correlación como en dos grupos, buscamos la correlación 2x2
de Yale.
En la correlación y asociación buscamos ir viendo que las parejas de datos van coincidiendo
en crecimiento o decrecimiento, en Yale, buscamos concetraciones de extremos.
Por ejemplo si decimos en la Hipótesis de Trabajo los que ganan poco ahorran poco y los
que ganan mucho ahorran mucho. Como si existiera una tasa de ahorro diferente en cada
grupo.
Mientras que en una correlación o asociación lineal, se busca que el ahorro sea proporcional
al salario.
Vemos los sectores del la grafica en donde se concentran correlación por categorias de Yale
y en donde se concentran los datos de correlación de Pearson
Pearson mide la cercania con respecto a
una recta lineal, y una área circundante a
ella, al darnos una correlación baja de
r=0.54, elegimos usar r2 para forzar y
vemos que pocos datos caen dentro por
eso vale r2=0.3, tendriamos una
certidumbre de 30% si hicieramos algún
pronóstico, usando Pearson y la Recta de
Regresión.
Mas ejemplos
Hipótesis de Trabajo:
La tasa de desempleo en los municipios de México es inversamente
proporcional a la capacitación de los trabajadores
Aunque los alumnos deben manejar el método de correlación lineal “r” de Pearson, a manera de
repaso lo incluimos en este apartado
I.5. Contraste de Hipótesis.
Calcular el estadístico de prueba llamado E#=?, luego compararlo con la regla de decisión y
el parámetro prefijado P#
Y en la Regla de decisión
Concluir
Implicando que existe una correlación muy buena entre la variable independiente y la
dependiente.
El Error tipo II, es que por descuido o por estar mal planteadas las reglas de decisión
referentes a la Ha, rechacemos la Hipótesis alterna Ha, cuando teniamos que aceptarla.
Para calcular el coeficiente de correlación lineal “r” de Pearson, usamos la fórmula siguiente:
Sustituyendo
Nos faltan las reglas de Decisión para aceptar o rechazar las Ho.
Reglas de decisión
Conclusión
La Hipótesis
Ho: No existe correlación suficiente buena entre los años y la cantidad de agua
del acuifero con un coeficiente de correlación r<=±0.80
Es lo que dirian los ganaderos para que los sigan dejando tomar
agua sin limite.
Ha: Existe correlación suficiente buena entre los años y la cantidad de agua del
acuifero con un coeficiente de correlación r>±0.80
Aceptar la Ho si r<=±0.80
Rechazar la Ho si r>±0.80
0=105-5x
despejamos la x
-5x = -105
multiplicamos ambos lados por -1
5x = 105
entonces x = 105/5 = 21
Con estos datos se puede convencer a los ganaderos, para un consumo mas racional del agua.
Conclusión
Se rechaza la hipótesis Nula Ho, porque r=-1 >±0.80, indicando que Existe
correlación perfecta entre los años y la cantidad de agua del acuifero. Mostrando
que se acabara con el, en tan solo 21 años de explotación.
I.7. Método para la comprobación de hipótesis estadísticas.
El alumno tiene que sensibilizarse con las tres pruebas, antes de elegir una
determinada para el tipo de investigación que está realizando. Cuando se
desconoce el comportamiento de las variables se hacen las tres y se ven los
resultados, para elegir la prueba que mejor nos diga como se comporta el
fenómeno en cuestión.
La correlación muestra una mayor relación fuerte, entre las variable dependiente
y la independiente, es como si las variables estubieran emparentadas o en
matrimonio por decirlo en sentido figurado.
Reglas de decisión
Aceptar Ho si “Q” <= ±0.82
Rechazar Ho si “Q” > ±0.82
Hemos explicado antes que se busca que exista empatia en dos extremos de los
datos.
Veamos como se calcula el coeficiente “Q” de Yale
Pasos
Paso 1 Obtenga la mediana de cada variable
Mediana Variable independiente
Mediana variable dependiente
Paso 2 Colorear
Las categorias de la variable independiente serán
Valores <= Mediana Variable independiente
Valores > Mediana Variable independiente
Paso 3 Colorear
Las categorias de la variable dependiente serán
Valores <= Mediana Variable dependiente
Valores > Mediana Variable dependiente
Paso 4 Ordenar por variable dependiente
y asignar los colores correspondientes
Paso 5 Ordenar por variable independiente
y asignar los colores correspondientes
Paso 6 Contar
A= coinciden variable independiente y Variable dependiente
B= coinciden variable independiente y Variable dependiente
C= coinciden variable independiente y Variable dependiente
D= coinciden variable independiente y Variable dependiente
Paso 7 Sustituir en la fórmula de Yale
(AD-BC)
Q=
(AD+BC)
Paso 8 Concluir si se acepta o rechaza la Ho
Conclusión
Hipótesis
Reglas de decisión
Esta es una prueba que se usa para ver si las parejas están bien relacionadas, y
mide la asociación y la interdependencia. La interpretación de coeficiente de
Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -
1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlación, y no independencia. Usamos esta prueba cuando los
datos no muestran una relación o correlación normal. O alguna de las variables es
Ordinal, digamos que es menos extricta que la prueba de correlación “r” de
Pearson.
Pasos
Paso 2 Agregue una columna nueva con OD, y rellene con serie consecutiva
Paso 3 Revise las veces que los datos se repiten y marquelos con un color, asi
como en la columna OD
Paso 6 Revise las veces que los datos se repiten y marquelos con un color, asi
como en la columna OI
Paso 7 Promedie los OI que tengan el mismo color
Hrs Cap Rendimiento Hrs Cap Rendimiento OH Hrs Cap Rendimiento OH OR Dif Dif2
10 60 10 60 2.5 10 50 2.5 2 0.5 0.25
10 50 10 50 2.5 10 50 2.5 2 0.5 0.25
10 50 10 50 2.5 10 50 2.5 2 0.5 0.25
10 50 10 50 2.5 10 60 2.5 4 -1.5 2.25
14 70 14 70 6.5 14 65 6.5 5 1.5 2.25
14 70 14 70 6.5 14 70 6.5 8 -1.5 2.25
14 70 14 70 6.5 14 70 6.5 8 -1.5 2.25
14 65 14 65 6.5 14 70 6.5 8 -1.5 2.25
20 74 20 74 10 20 70 10 8 2 4
20 70 20 70 10 20 70 10 8 2 4
20 70 20 70 10 20 74 10 11.5 -1.5 2.25
26 74 26 74 12 26 74 12 11.5 0.5 0.25
27 75 27 75 13 27 75 13 13 0 0
28 80 28 80 14 28 80 14 15 -1 1
30 80 30 80 15.5 30 80 15.5 15 0.5 0.25
30 80 30 80 15.5 30 80 15.5 15 0.5 0.25
32 85 32 85 17 32 85 17 17.5 -0.5 0.25
37 85 37 85 18 37 85 18 17.5 0.5 0.25
40 100 40 100 19.5 40 90 19.5 19 0.5 0.25
40 90 40 90 19.5 40 100 19.5 20 -0.5 0.25
Dif2= 25
Lo
que podemos
corroborar con la
grafica correspon-
diente.
Conclusión
Se Rechaza la Ho porque rs = ±0.98 > ± 0.85
Indicando que existe una asociación casi perfecta ente las variables horas de
capacitación y rendimiento laboral.
Para terminar esta parte de los apuntes resolveré un ejercicio por los tres
métodos, para que el alumno que desee, comprobar los resultados lo haga por su
cuenta.
Ejercicio con el siguiente grupo de datos sobre capacitación en software de
computadoras a trabajadores del gobierno, calcula las pruebas correspondientes.
Datos Prueba Parametríca
De correlación lineal “r” de Pearson
Hrs Cap Rendimiento
16 75 HT A Mayor horas de capacitación mayor rendimiento
12 55
Ho: No Existe correlación buena entre las horas de capacitación y
32 80
el rendimiento con una correlación r<=±0.78
35 85
28 80 Ha: Existe correlación buena entre las horas de capacitación y el
32 80 rendimiento con una correlación r>±0.78
12 60
Regla de decisión
16 65 Aceptar la Ho si r<=±0.78 Rechazar la Ho si r>±0.78
42 95
16 75 Conclusión
Rechazar la Ho porque r= ±0.93 > ±0.78
22 75
12 60
34 85 De Asociación lineal “rs” de Spearman
12 60
28 75 HT A Mayor horas de capacitación mayor rendimiento
42 100
Ho: No Existe asociación buena entre las horas de capacitación y
22 75
el rendimiento con una correlación rs <=±0.78
16 65
22 75 Ha: Existe asociación buena entre las horas de capacitación y el
28 75
rendimiento con una correlación rs >±0.78
Regla de decisión
Aceptar la Ho si rs <=±0.78 Rechazar la Ho si rs >±0.78
Conclusión
Rechazar la Ho porque rs = ±0.98 > ±0.78
Regla de decisión
Aceptar la Ho si Q <= ±0.78 Rechazar la Ho si Q > ±0.78
Comentarios:
Mientras que la correlación lineal de Pearson, y la asociación lineal por parejas de
Spearman muestran una marcada tendencia o cercania con la linea de regresión o
a la linea de tendencia. Siendo 0.93 para Pearson y 0.98 para Spearman, indican-
do que en sentido general el grupo de empleados se comporta linealmente.
Pero en las categorias de Yale, que intentamos medir que los que se han
capacitado menos o iguales que la mediana de 23 horas de capacitación se
corresponden a los sacan menos o iguales a la mediana de rendimiento de 73 (los
que sacan notas mas bajas).
Contra los que se han capacitado mas por arriba de la mediana de 23 horas de
capacitación con rendimientos mayores a 73 (los sacan notas altas).
Yale reporta un coeficiente “Q”=0.79, asi que se descarta que el grupo existan
dos grupos.
Esto le indicará al los alumnos que primeros sacan las pruebas y luego usan la
que consideran idonea para su estudio.