Está en la página 1de 25

UNAM ENTS SUAyED

Universidad Nacional Autónoma de México, Escuela Nacional de Trabajo


Social, Sistema de Universidad Abierta y Educación a Distancia.

Estadística Aplicada a la Investigación Social II

Mtro en Sist. Carlos Douglas X. Payno Sánchez

Área: Metodología y

Práctica de Trabajo Social

Semestre: 4

Créditos: 5

Carácter: Obligatoria
Sistema Universidad Abierta

UNIDAD 2 HIPÓTESIS ESTADÍSTICAS

INTRODUCCIÓN

Para llevar a cabo una investigación social necesitamos plantear suposiciones para
explicar hechos “causas” y “efectos” a través de las relaciones entre variables
independientes y las variables dependientes. Para su tratamiento, esos supuestos son
traducidos a términos estadísticos y sometidos a pruebas de validez, por lo que el
investigador deberá identificar claramente el tipo de variables en estudio, sus escalas de
medición, así como la relación que guardan entre sí.

Esta unidad presenta la metodología para el diseño y contrastación de hipótesis, así como
breve descripción de los errores que pueden cometerse al tomar una decisión estadística
equivocada y las condiciones en que éstas deberán tomarse, dependiendo de las pruebas
paramétricas o no paramétricas elegidas.

OBJETIVO

Aprender a diseñar y plantear hipótesis de trabajo y estadísticas, reglas de decisión y


cómo confrontarlas para aceptarlas o rechazarlas cuando son aplicadas a una
investigación social, que permita tomar de decisiones, dependiendo del tipo de
variables seleccionadas.

TEMARIO

I. HIPÓTESIS ESTADÍSTICAS.
I.1. Hipótesis Estadísticas.

I.1.1 Características de las hipótesis.

I.1.2 Los tipos de relaciones dentro de las hipótesis


I.2. Hipótesis de Trabajo.

I.3. Hipótesis estadísticas Nula Ho.

I.4. Hipótesis estadísticas Alterna Ha.

I.5. Contraste de Hipótesis.

I.6. Errores Estadísticos.

I.7. Método para la comprobación de hipótesis estadísticas.

I.7.1 Reglas de decisión para aceptar o rechazar las Hipótesis Nula.

I.1. LAS HIPÓTESIS

Una hipótesis es un enunciado que afirma la relación, comportamiento, tendencia, fuerza


y diversos aspectos de ocurrencia entre dos o más variables de una población o muestra y
está sujeta a comprobación. La relación puede de ser de correlación lineal, asociación,
dependencia, independencia o de contingencia entre las variables. El comportamiento puede
ser proporcional, o inversamente proporcional. La tendecia puede positiva o negativa. La
fuerza nos dara, que tanto explica una variable independiente a la variable dependiente. Este
enunciado podrá ser verdadero o no verdadero dependiendo de si aceptamos o rechazamos
su validez.

El investigador la plantea como base para su estudio o referencia de lo que quiere indagar,
dando una explicación tentativa del fenómeno social que desea investigar

Comportamiento y tendencia proporcional positiva, alta fuerza de correlación

Comportamiento y tendencia proporcional negativa, media fuerza de correlación

Comportamiento y tendencia proporcional positiva, baja fuerza de correlación


I.1.1 Características de las hipótesis

Las hipótesis orientan al investigador hacia dónde debe ir dirijida la


investigación. Su redacción debe ser clara, para evitar falsas interpretaciones.

Pueden ser cualitativas o cuantitativas respecto a las variables involucradas.

En el caso de las hipótesis estadísticas nula y alterna, deben plantearse en términos


cuantitativos en relación con alguna técnica estadística parametrica o no parametrica
“comprobables” para ser contrastada o sometida a prueba de aceptación o rechazo.

Deben ser objetivas evitando las subjetividades.

Las hipótesis de Trabajo son planteadas cualitativamente, mientras que las


Estadísticas deben ser planteadas cuantitativamente en el enunciado, o en las reglas de
decisión para aceptar o rechazar las hipótesis.

Una hipótesis plantea una causa y un efecto, o plantea una variación en las causas darán
variaciones en los efectos, sean lineales, proporcionales, positivas o negativas.

Las variables involucradas en las hipótesis deben ser tangibles, significativas y medibles.
Y deben estar bien definidas evitando ambiguedades de interpretación.

I.1.2 Los tipos de relaciones dentro de las hipótesis

Las hipótesis suelen relacionar causas con efectos, pero estas relaciones pueden ser de
correlación lineal, de correlación por categorias (2 x 2), de asociación por parejas, de
dependencia y contingencia (n x n).
Las relaciones de Correlación lineal, para ello usamos el coeficiente de correlación lineal
“r” de Pearson que los alumnos ven en estadística aplicada a la investigación Social I.
Asi que se este coeficiente representa dos componentes de la relación: la fuerza y la
tendencia.
Veamos ejemplos

El signo positivo indica la tendencia, si uno crece el otro también crece, el signo negativo
indica que sin uno crece el otro decrece, y el valor nos da la fuerza de la correlación, si se
acerca a +1 o a -1, la variable independiente explicara perfectamente el comportamiento de
la variable dependendiente, cuando los valores se acercan a cero no tenemos certidumbre,
pues indica que es escasa o nula la correlación de las variables, no seria prudente
pronosticar si los coeficientes “r” de Pearson fueran ± < 0.74, el criterio lo fija el investigador.

Los valores de las correlaciones y si interpretación se aprecian en la siguiente tabla


Veamos algunos ejemplos

Ejemplo de Hipótesis de Trabajo

La pobreza en las áreas urbanas en México se debe a la falta de empleos bien remunerados

Causa Falta de empleos_bien_remunerados => Efecto La pobreza

Debe expresarse con criterios cualitativos, y eso le dá clariadad al enunciado.

A menor oferta de empleos_bien_remunerados mayor pobreza

Relación proporcional inversa una variable decrece la otra crece

A mayor consumo de comida chatara mayor daño a la Salud

Relación proporcional una variable crece la otra también crece.

Las Hipótesis estadísticas nula y alterna deben ser planteadas en forma cuantitativa, forman
un continuo del universo probabilidades posibles. Es decir son complementarias, mientras
que las de trabajo abarcan el total de dichas probabilidades.

Cuando planteamos a las hipótesis como unilaterales, las probabilidades se ven así:

Probabilidades 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Probabilidades 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Tipo de relación H i p ó t e s i s - d e - T r a b a j o
Aceptar la Ho: (Si el Estadístico) <= 50% Aceptar la Ha: (Si el Estadístico) > 50%

Correlación Aceptar Hipótesis Nula Ho Rechazar Hipótesis Nula Ho


Mala o pobre Existe una correlación mala o pobre Existe una pobre a buena correlación

Aceptar la Ho: (Si el Estadístico) <= 60% Aceptar la Ha: (Si el Estadístico) > 60%

Correlación Aceptar Hipótesis Nula Rechazar Hipótesis Nula Ho


Regular Existe una correlación mala a regular Existe correlación entre regular
a perfecta

orrelación Aceptar la Ho: (Si el Estadístico) <= 75% Aceptar la Ha: (Si el
Buena Estadístico) > 75%
Rechazar Hipótesis Nula
Aceptar Hipótesis Nula Ho
Ho
Existe una correlación baja a casi buena Existe correlación entre
buena a perfecta

Aceptar la Ho: (Si el Estadístico) <= 85% Aceptar la Ha:


(Si el
Estadístico) >
Correlación 85%
Muy Buena Rechazar
Aceptar Hipótesis Nula Ho Hipótesis Ho
Existe una correlación baja a muy buena Existe una
Correlación
entre muy
buena a
perfecta

Escala de Graduación de las correlaciones o asociaciones entre variables.

Probabilidades 0 a 0.1 0.1 a 0.2 0.2 a 0.3 0.3 a 0.4 0.4 a 0.5 0.5 a 0.6 0.6 a 0.7 0.7 a 0.8 0.8 a 0.9 0.9 a 1
Muy
Correlación Nula Escasa Incierta Baja Regular Buena buena
Excelente

Cuando planteamos a las hipótesis de manera bilateral se pueden ver asi:

Probabilidades 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.85 0.9 1
Rangos 0 a 0.4 0.5 a 0.6 0.7 a 0.85 0.86 a 1
Hipótesis Hipótesis Ho1: Hipótesis Ho2: Hipótesis Ha1: Hipótesis Ha2:
Tipo de
correlación
Correlación nula Correlación pobre Correlación buena Correl. Excelente

Aceptar Ho1: (Estadístico) <= 0.4 0.5>= y <=0.6

Probabilidades 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.85 0.9 1
Rangos < 0.7 0.7 >= y <=0.85 >0.85
Hipótesis Aceptar Ho: Si (Estadístico) < 0.7 y Aceptar Ha: Aceptar Ho: si
(Estadístico) >= 0.7 (Estadístico) > 0.85
y (Estadístico)
<=0.85
Tipo de No existe correlación entre el rango del estadístico con Rechazar Ho Existe Ni existe correlación
correlación valores menores a 0.7 correlación entre el entre valores superioes
rango de 0.7 a 0.85 a 0.85
I.1.1 Hipótesis Estadística Nula

Las hipótesis nulas Ho: se plantean con la idea de rechazarlas, son


cuantitativas en su enunciado en en las reglas para aceptarlas o rechazarlas,
abarcan una porción de las probabilidades posibles.

Las hipótesis Alternas Ha: se plantean con la idea de complementar, a las


Nulas, también son cuantitativas en su enunciado en en las reglas para
aceptarlas o rechazarlas, abarcan una porción de las probabilidades
complementaria para cubrir todo el espectro posible.

Ejemplo 1
Hipótesis de Trabajo:
A mayor horas de estudio, mejores calificaciones escolares

Hipótesis Nula Ho:


No existe correlación buena entre las horas de estudio, y las calificaciones
obtenidas, r de Pearson < ±0.84

Hipótesis Alterna Ha:


Existe correlación buena entre las horas de estudio, y las calificaciones
obtenidas, r de Pearson >= ±0.84

En este caso la relación es proporcional positiva, por eso el coeficiente “r” de Pearson es
positivo, entre mas estudies mayor será la calificación que obtengas.

Veamos un ejemplo de proporción inversa

Ejemplo 2
Hipótesis de Trabajo:
La tasa de desempleo en los municipios de México es inversamente
proporcional a la capacitación de los trabajadores

Hipótesis Nula Ho:


La tasa de desempleo en los municipios de México no tiene
una correlación suficientemente buena con respecto a la
capacitación de los trabajadores con una Correlación r de
Pearson < ±0.74

Hipótesis Alterna Ha:


La tasa de desempleo en los municipios de México tiene
una correlación suficientemente buena con respecto a la
capacitación de los trabajadores con una Correlación r de
Pearson >= ±0.74

Podemos plantear las hipótesis en terminos de asociación

En lugar de referirnos a la correlación lineal “r” de Pearson, podemos usar el coeficiente de


asociación por parejas de Spearman

Ejemplo 3

Suponiendo que existe una capacidad de ahorro en unos trabajadores


Hipótesis de Trabajo:
El ahorro en los trabajadores Méxicanos es proporcional
al nivel de ingreso.

O podemos decir
Los que ganan poco ahorran poco y los que ganan
mucho ahorran mucho

Hipótesis Nula Ho:


No existe asociación buena entre el ahorro y el
ingreso de los trabajadores Mexicanos con un
coeficiente de asociación rs de Spearman < ±0.70

Hipótesis Alterna Ha:


Existe asociación buena entre el ahorro y el
ingreso de los trabajadores Mexicanos con un
coeficiente de asociación rs de Spearman >= ±0.70
Ejemplo

O dicho de otra forma: A mayor capacitación menor desempleo


Hipótesis Nula Ho: La tasa de desempleo en los municipios de México no tiene una
correlación suficientemente buena con respecto a la capacitación de los trabajadores con
una Correlación r de Pearson < ±0.74 {observe que el valor del parámetro para comparación puede
cambiar a elección del investigador, y que la elección a cual le asigna el “=” dependera del investigador}

Hipótesis Alterna Ha: La tasa de desempleo en los municipios de México tiene una
correlación suficientemente buena con respecto a la capacitación de los trabajadores con
una Correlación r de Pearson >= ±0.74 {observe que el valor del parámetro para comparación puede
cambiar a elección del investigador}

Si las plantearamos en términos de asociación sería:

Hipótesis Nula Ho: La tasa de desempleo en los municipios de México no tiene una
asociación suficientemente buena con respecto a la capacitación de los trabajadores con una
asociación por parejas rs de Spearman < ±0.74

Hipótesis Alterna Ha: La tasa de desempleo en los municipios de México tiene una
asociación suficientemente buena con respecto a la capacitación de los trabajadores con una
asociación por parejas rs de Spearman >= ±0.74

La interpretación del Coeficiente de Correlación “r” de Pearson y la de asociación “r s”


de Spearman son similares.

Cuando queremos polarizar la correlación como en dos grupos, buscamos la correlación 2x2
de Yale.

En la correlación y asociación buscamos ir viendo que las parejas de datos van coincidiendo
en crecimiento o decrecimiento, en Yale, buscamos concetraciones de extremos.

Por ejemplo si decimos en la Hipótesis de Trabajo los que ganan poco ahorran poco y los
que ganan mucho ahorran mucho. Como si existiera una tasa de ahorro diferente en cada
grupo.

Mientras que en una correlación o asociación lineal, se busca que el ahorro sea proporcional
al salario.

Vemos los sectores del la grafica en donde se concentran correlación por categorias de Yale
y en donde se concentran los datos de correlación de Pearson
Pearson mide la cercania con respecto a
una recta lineal, y una área circundante a
ella, al darnos una correlación baja de
r=0.54, elegimos usar r2 para forzar y
vemos que pocos datos caen dentro por
eso vale r2=0.3, tendriamos una
certidumbre de 30% si hicieramos algún
pronóstico, usando Pearson y la Recta de
Regresión.

En Yale medimos en extremos en donde se


agrupan o se concentran los datos como
se ven en el tramado de diagonales, Aqui
dio Q=0.88 que es una correlación por
grupos de Yale muy buena, indicando que
existen dos grupos los que ganan poco y
ahorran poco, y los que ganan mucho y
ahorran bastante.

Mas ejemplos

Hipótesis de Trabajo:
La tasa de desempleo en los municipios de México es inversamente
proporcional a la capacitación de los trabajadores

Hipótesis Nula Ho:


La tasa de desempleo en los municipios de México no
tiene una correlación suficientemente buena con
respecto a la capacitación de los trabajadores con una
Correlación r de Pearson < ±0.74

Aunque los alumnos deben manejar el método de correlación lineal “r” de Pearson, a manera de
repaso lo incluimos en este apartado
I.5. Contraste de Hipótesis.

El contraste de hipótesis es cuando obtenemos los estadísticos de las pruebas, ya sean


parametricas o no parametricas y las contrastamos con las reglas de decisión para aceptar o
rechazar las hipótesis

Equematicamente seria algo asi:

Calcular el estadístico de prueba llamado E#=?, luego compararlo con la regla de decisión y
el parámetro prefijado P#

Aceptar Ho, si E# <= P#

Rechazar Ho, si E# > P#

Concluir según el valor de E#

Este esquema queda claro con un ejemplo

Supongamos que el estadístico de prueba E# es “r”, y al calcular r es igual a 0.89

Y en la Regla de decisión

Aceptar Ho, si “r” <= ±0.85

Rechazar Ho, si “r” > ±0.85

Concluir

Rechazamos la Ho, porque “r”=0.89 > ±0.85

Implicando que existe una correlación muy buena entre la variable independiente y la
dependiente.

I.6. Errores Estadísticos


El Error tipo I, es que por descuido o por estar mal planteadas las reglas de decisión
referentes a la Ho, aceptemos la Hipótesis nula Ho, cuando teniamos que rechazarla.

El Error tipo II, es que por descuido o por estar mal planteadas las reglas de decisión
referentes a la Ha, rechacemos la Hipótesis alterna Ha, cuando teniamos que aceptarla.

Ambos errores llevan a conclusiones falsas, y por eso deben de eviarse.


Método paramétrico de correlación lineal “r” de Pearson.

Para calcular el coeficiente de correlación lineal “r” de Pearson, usamos la fórmula siguiente:

Sustituyendo

Cuando los datos


no muestran una
tendencia lineal;
Se calcula el
coeficiente de
determinación
elevando “r” al
cuadrado,
nos dira que tan
fuerte es la
correlación en
casos extremos, pero la grafica de dispersión siempre aporta el indicio correcto.

Seleccionamos las primeras dos columnas para graficar


HT: La producción es proporcional a los años

Ho: No existe correlación regular entre la producción y los años con un


coeficiente r <= ±0.60.

Ha: Existe correlación regular entre la producción y los años con un


coeficiente r > ±0.60.

Nos faltan las reglas de Decisión para aceptar o rechazar las Ho.

Reglas de decisión

Aceptar la Ho si r de Pearson <= ±0.60.


Rechazar la Ho si r de Pearson > ±0.60.

Conclusión

Se acepta la Ho porque r= -0.08 <= ±0.60


Indicando que no llega la correlación a ser cercana a la regular.
Veamos ahora un ejemplo en donde si exista correlación lineal

Un problema ecologico puede


ser un problema social.

Pues la pérdida de acuiferos


en lugares en donde no hay
lluvias, no se recarga el
acuifero. Años Acuifero
1 100
Sin lluvias el agua se evapora 2 95
por acción del sol, y por el 3 90
consumo humano y animal, 4 85
pues llevan los ganaderos a Imagen tomada de flicker solo 5 80
tomar agua a sus rebaños. con fines educativos. 6 75
7 70
Se desea calcular cuándo se
agotará el acuifero si la tasa de 8 65
Ejemplo contextualizado de la
realidad. Carlos Douglas Payno, consumo se mantiene igual. 9 60
marzo 2020 10 55

La Hipótesis

HT Si la tasa de consumo de agua crece el acuifero decrese con los años.

Ho: No existe correlación suficiente buena entre los años y la cantidad de agua
del acuifero con un coeficiente de correlación r<=±0.80
Es lo que dirian los ganaderos para que los sigan dejando tomar
agua sin limite.
Ha: Existe correlación suficiente buena entre los años y la cantidad de agua del
acuifero con un coeficiente de correlación r>±0.80

Las Reglas de Decisión

Aceptar la Ho si r<=±0.80
Rechazar la Ho si r>±0.80

Luego se calcula para poder concluir.


Alargamos es decir extrapolamos la recta de tendencia hasta que llegue al eje
horizontal y vemos que el año 21 el acuifero se agotara.

La Recta Y=F(x)=105-5x nos sirve para pronosticar cuando se secara, si Y=0

0=105-5x
despejamos la x
-5x = -105
multiplicamos ambos lados por -1
5x = 105
entonces x = 105/5 = 21
Con estos datos se puede convencer a los ganaderos, para un consumo mas racional del agua.

Conclusión
Se rechaza la hipótesis Nula Ho, porque r=-1 >±0.80, indicando que Existe
correlación perfecta entre los años y la cantidad de agua del acuifero. Mostrando
que se acabara con el, en tan solo 21 años de explotación.
I.7. Método para la comprobación de hipótesis estadísticas.

I.7.1 Reglas de decisión para aceptar o rechazar las Hipótesis Nula.

Dependiendo de la prueba paramétrica seleccionada, se ajusta la regla de


decisión, para que incluya el paramétro sea “r” de correlación lineal de
Pearson, “Q” de correlación por grupos extremos de Yale, o “rs” de
asociación por parejas de Spearman.

El alumno tiene que sensibilizarse con las tres pruebas, antes de elegir una
determinada para el tipo de investigación que está realizando. Cuando se
desconoce el comportamiento de las variables se hacen las tres y se ven los
resultados, para elegir la prueba que mejor nos diga como se comporta el
fenómeno en cuestión.
La correlación muestra una mayor relación fuerte, entre las variable dependiente
y la independiente, es como si las variables estubieran emparentadas o en
matrimonio por decirlo en sentido figurado.

En cambio la asosiación muestra una relación no tan fuerte como la correlación


entre las variable dependiente y la independiente, es como si las variables
estubieran emparentadas o en una amistad o en una afinidad por decirlo en
sentido figurado.

Veremos ahora la prueba


Paramétrica de correlación categorías 2x2 de Yale

Planteamos las Hipótesis


HT: A mayor horas de ver TV, menor Rendimiento escolar.
O para decirlo de una mejor manera para Yale
“Los que ven muchas horas tienen bajas notas, y los que ven pocas horas
tienen altas notas. Nota correlación inversa.
Ho: No existe correlación por categorías de Yale suficientemente buena
entre horas de ver TV, y el Rendimiento escolar con “Q” <= ±0.82
Nota: Esto diría un alumno a sus padres, que insinten
en que no vea tanta televisión. Es como decir ver
televisión no afecta las notas escolares, o el
rendimiento escolar.
Ha: Existe correlación por categorías de Yale suficientemente buena
entre horas de ver TV, y el Rendimiento escolar con “Q” > ±0.82
Nota: La realidad es que si afecta el rendimiento
escolar la cantidad de horas de ver televisión.

Reglas de decisión
Aceptar Ho si “Q” <= ±0.82
Rechazar Ho si “Q” > ±0.82

Hemos explicado antes que se busca que exista empatia en dos extremos de los
datos.
Veamos como se calcula el coeficiente “Q” de Yale
Pasos
Paso 1 Obtenga la mediana de cada variable
Mediana Variable independiente
Mediana variable dependiente
Paso 2 Colorear
Las categorias de la variable independiente serán
Valores <= Mediana Variable independiente
Valores > Mediana Variable independiente
Paso 3 Colorear
Las categorias de la variable dependiente serán
Valores <= Mediana Variable dependiente
Valores > Mediana Variable dependiente
Paso 4 Ordenar por variable dependiente
y asignar los colores correspondientes
Paso 5 Ordenar por variable independiente
y asignar los colores correspondientes
Paso 6 Contar
A= coinciden variable independiente y Variable dependiente
B= coinciden variable independiente y Variable dependiente
C= coinciden variable independiente y Variable dependiente
D= coinciden variable independiente y Variable dependiente
Paso 7 Sustituir en la fórmula de Yale
(AD-BC)
Q=
(AD+BC)
Paso 8 Concluir si se acepta o rechaza la Ho

Pasemos a un ejemplo práctico

Sacar medianas Ordenamos por


Ordenamos por Horas TV y
horas de TV = 19 Rendimiento y
coloreamos
Rendimiento = 67.5 coloreamos

Horas de TV Rendimiento Horas de TV Rendimiento Horas de TV Rendimiento


40 20 40 20 1 100
39 40 39 40 3 88
37 50 37 50 4 86
32 52 32 52 10 84
31 53 31 53 12 80
30 54 30 54 13 78
28 80 26 62 14 70
26 62 26 64 14 74
26 64 21 66 15 69
21 66 17 66 17 66
17 69 15 69 21 66
15 70 14 70 26 62
14 66 14 74 26 64
14 74 13 78 28 80
13 78 28 80 30 54
12 80 12 80 31 53
10 84 10 84 32 52
4 86 4 86 37 50
3 88 3 88 39 40
1 100 1 100 40 20

Ahora se puede contar las coincidencias A=1, B=9, C=9, D=1,


Q=(1*1-9*9)/(1*1+9*9) = -80/82 =-0.98, veamos la gráfica
Así saca la grafica Excel, la podemos modificar con otra aplicación como GIMP,
para que quede asi y nos muestre los grupos

Conclusión

Se rechaza la hipótesis nula “Ho:” porque Q=-0.98 > ±0.82,


mostrando que existe una correlación casi perfecta entre las
horas de ver televisión y el rendimiento escolar.

Prueba paramétrica de asociación de Spearman

Como en cualquier prueba parametrica, primero diseñamos las hipótesis, luego


las reglas de decisión y luego calculamos el coeficiente correspondiente a la
prueba.

Hipótesis

HT A mayor horas de capacitación mayor será el rendimiento laboral


Ho: No existe asociación buena ente las horas de capacitación y el rendimiento
laboral con un rs <= ± 0.85

Ha: Existe asociación buena ente las horas de capacitación y el rendimiento


laboral con un rs > ± 0.85

Reglas de decisión

Aceptar Ho Si rs <= ± 0.85

Rechazar Ho Si rs > ± 0.85

Esta es una prueba que se usa para ver si las parejas están bien relacionadas, y
mide la asociación y la interdependencia. La interpretación de coeficiente de
Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -
1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlación, y no independencia. Usamos esta prueba cuando los
datos no muestran una relación o correlación normal. O alguna de las variables es
Ordinal, digamos que es menos extricta que la prueba de correlación “r” de
Pearson.

Pasos

Paso 1 Seleccione ambas variables y ordene por la dependiente

Paso 2 Agregue una columna nueva con OD, y rellene con serie consecutiva

Paso 3 Revise las veces que los datos se repiten y marquelos con un color, asi
como en la columna OD

Paso 4 Promedie los OD que tengan el mismo color

Paso 5 Seleccione toda la tabla, y ordene por la variable independiente

Oculte las columnas de la variable dependiente y la OD

Paso 6 Revise las veces que los datos se repiten y marquelos con un color, asi
como en la columna OI
Paso 7 Promedie los OI que tengan el mismo color

Paso 8 Genera la diferencia en una columna de OD-OI, y en otra columna elevela


al cuadrado

Hrs Cap Rendimiento Hrs Cap Rendimiento OH Hrs Cap Rendimiento OH OR Dif Dif2
10 60 10 60 2.5 10 50 2.5 2 0.5 0.25
10 50 10 50 2.5 10 50 2.5 2 0.5 0.25
10 50 10 50 2.5 10 50 2.5 2 0.5 0.25
10 50 10 50 2.5 10 60 2.5 4 -1.5 2.25
14 70 14 70 6.5 14 65 6.5 5 1.5 2.25
14 70 14 70 6.5 14 70 6.5 8 -1.5 2.25
14 70 14 70 6.5 14 70 6.5 8 -1.5 2.25
14 65 14 65 6.5 14 70 6.5 8 -1.5 2.25
20 74 20 74 10 20 70 10 8 2 4
20 70 20 70 10 20 70 10 8 2 4
20 70 20 70 10 20 74 10 11.5 -1.5 2.25
26 74 26 74 12 26 74 12 11.5 0.5 0.25
27 75 27 75 13 27 75 13 13 0 0
28 80 28 80 14 28 80 14 15 -1 1
30 80 30 80 15.5 30 80 15.5 15 0.5 0.25
30 80 30 80 15.5 30 80 15.5 15 0.5 0.25
32 85 32 85 17 32 85 17 17.5 -0.5 0.25
37 85 37 85 18 37 85 18 17.5 0.5 0.25
40 100 40 100 19.5 40 90 19.5 19 0.5 0.25
40 90 40 90 19.5 40 100 19.5 20 -0.5 0.25
Dif2= 25

Lo
que podemos
corroborar con la
grafica correspon-
diente.

Conclusión
Se Rechaza la Ho porque rs = ±0.98 > ± 0.85
Indicando que existe una asociación casi perfecta ente las variables horas de
capacitación y rendimiento laboral.

Para terminar esta parte de los apuntes resolveré un ejercicio por los tres
métodos, para que el alumno que desee, comprobar los resultados lo haga por su
cuenta.
Ejercicio con el siguiente grupo de datos sobre capacitación en software de
computadoras a trabajadores del gobierno, calcula las pruebas correspondientes.
Datos Prueba Parametríca
De correlación lineal “r” de Pearson
Hrs Cap Rendimiento
16 75 HT A Mayor horas de capacitación mayor rendimiento
12 55
Ho: No Existe correlación buena entre las horas de capacitación y
32 80
el rendimiento con una correlación r<=±0.78
35 85
28 80 Ha: Existe correlación buena entre las horas de capacitación y el
32 80 rendimiento con una correlación r>±0.78
12 60
Regla de decisión
16 65 Aceptar la Ho si r<=±0.78 Rechazar la Ho si r>±0.78
42 95
16 75 Conclusión
Rechazar la Ho porque r= ±0.93 > ±0.78
22 75
12 60
34 85 De Asociación lineal “rs” de Spearman
12 60
28 75 HT A Mayor horas de capacitación mayor rendimiento
42 100
Ho: No Existe asociación buena entre las horas de capacitación y
22 75
el rendimiento con una correlación rs <=±0.78
16 65
22 75 Ha: Existe asociación buena entre las horas de capacitación y el
28 75
rendimiento con una correlación rs >±0.78

Regla de decisión
Aceptar la Ho si rs <=±0.78 Rechazar la Ho si rs >±0.78

Conclusión
Rechazar la Ho porque rs = ±0.98 > ±0.78

De Correlación por categorías “Q” de Yale

HT Los que se capacitan poco tienen bajo rendimiento y los que se


capacitan mucho tienen alto rendimiento

Ho: No Existe correlación buena por categorías entre las horas de


capacitación y el rendimiento con una correlación Q<=±0.80

Ha: Existe correlación buena por categorías entre las horas de


capacitación y el rendimiento con una correlación Q>±0.80

Regla de decisión
Aceptar la Ho si Q <= ±0.78 Rechazar la Ho si Q > ±0.78

Conclusión se Acepta la Ho Q=0.79 >±0.78


Sus graficos son:

Comentarios:
Mientras que la correlación lineal de Pearson, y la asociación lineal por parejas de
Spearman muestran una marcada tendencia o cercania con la linea de regresión o
a la linea de tendencia. Siendo 0.93 para Pearson y 0.98 para Spearman, indican-
do que en sentido general el grupo de empleados se comporta linealmente.

Pero en las categorias de Yale, que intentamos medir que los que se han
capacitado menos o iguales que la mediana de 23 horas de capacitación se
corresponden a los sacan menos o iguales a la mediana de rendimiento de 73 (los
que sacan notas mas bajas).

Contra los que se han capacitado mas por arriba de la mediana de 23 horas de
capacitación con rendimientos mayores a 73 (los sacan notas altas).

Yale reporta un coeficiente “Q”=0.79, asi que se descarta que el grupo existan
dos grupos.

Las Correlación de Pearson y la Asociación de Spearman indican que el conjunto


es homogeneo y que los resultados reportan proporcionalidad entre las horas de
capacitación y los rendimientos encontrados.

Esto le indicará al los alumnos que primeros sacan las pruebas y luego usan la
que consideran idonea para su estudio.

Termina esta parte de los apuntes.

También podría gustarte