Está en la página 1de 86

La presentación y disposición en conjunto de

ESTADISTICA INFERENCIAL PARA PROFESIONALES DE LA SALUD

Son propiedad de la UNIVERSIDAD DE GUADALAJARA

Ninguna parte de esta obra puede ser reproducida o transmitida, mediante ningún sistema o
método, electrónico o mecánico (INCLUYENDO EL FOTOCOPIADO, la grabación o cualquier
sistema de recuperación y almacenamiento de información), sin consentimiento por escrito de la
Institución.

Derechos Reservados:

D.R. ©

UNIVERSIDAD DE GUADALAJARA

Centro Universitario de Ciencias de la Salud

Departamento de Salud Pública

Av. Sierra Nevada 950 Edificio N, Colonia Independencia.

C.P. 44340 Guadalajara, Jalisco México.

ISBN‐13:

Impreso en México

Fecha: 12 de enero de 2013

2
Prólogo

El libro "Estadistica para profesionales de la Salud", escrito por la


Dra. Genoveva Rizo Curiel, forma parte de su inquietud como profesora-
investigadora del CUTONALA/ CUCS para compartir su experiencia
docente con los futuros grupos del área de salud.

Para el efecto hace un recuento de los principales medidas que se


utilizan en el análisis estadístico de datos, señalando ejemplos de manera
sencilla para su aplicación, desde la descripción hasta la inferencia tan
necesarias para dotar de elementos de juicio al proceso de los
profesionales de la salud.

Aunque un libro nunca puede igualar la riqueza de la tutoria


presencial de un maestro, sus líneas pueden servir de guía para preparar
la clase o para reforzar conceptos una vez recibida así como apoyar el
trabajo de investigación en la práctica.

No omito felicitar a la Dra. Genoveva por su iniciativa, y


generosidad, deseando que este sea el principio de muchas ediciones más.

Atentamente
Dr. Javier Garcia de Alba G.

3
INDICE
PROLOGO
PREFACIO

CAPÍTULO1
TAMAÑO DE LA MUESTRA
Población infinita
Población finita
CAPÍTULO 2
MUESTREO PROBALISTICO
MUESTREO NO PROBALISTICO
CAPÍTULO 3
HIPÓTESIS
CAPÍTULO 4
CHI CUADRADA
CAPÍTULO 5
YATES
CAPÍTULO 6
FISHER
CAPÍTULO 7
REGRESION LINEAL
CAPÍTULO 8
CORRELACION
REFERENCIAS BIBLIOGRAFICAS
REPUESTAS
GLOSARIO
APENDICE
Formulario
Tabla A. Distribución Chi Cudrada
Tabla B. Distribución t student
Tabla C. Valores de r, Niveles de Confianza
Tabla D. Números Aleatorios

4
Capítulo 1
Tamaño de la Muestra

Cuando se analizan a todos los sujetos de una población se tiene un


censo y si sólo se analizan una parte de la población y cumple con la
condición de ser representativa de toda la población, se tiene una muestra
a través de un muestreo probabilístico. La muestra corresponde a una
parte de una población la cual reúne características que se pretenden
estudiar. Cuando se conoce el número de individuos que la componen, se
habla de «población finita» y, cuando no se conoce su número, de
«población infinita».

Para determinar el tamaño de la muestra debe tomarse en consideración los


siguientes puntos:
a) margen de certeza, b) variabilidad, c) error de muestreo, d) recursos
económicos, f) el tiempo y, g)la información que se disponga del fenómeno
a investigar.

a)Margen de certeza

El nivel de confianza (MC) corresponde a la probabilidad de que la


estimación efectuada se ajuste a la realidad.

b)Variabilidad
Corresponde a la cantidad de variación del fenómeno, conocida como
puntuación “Z”; para su medición se recurre a la distribución de la
campana de Gauss y la variabilidad se elige de acuerdo al margen de
certeza.

5
c)Error de muestreo
Este error equivale al hecho que se obtienen conclusiones sobre
cierta realidad a partir de la observación de sólo una parte de ella. Para
un 99% de margen de certeza, debe existir un 1% de error, es decir la
probabilidad de 0.01 y para el 95% equivale a un 5% o 0.05. Lo contrario
del error corresponde a la precisión (d), lo cual asegura un error estándar
menor de 0.01.

En este punto existe una interrogante ¿De donde será obtenida la


variabilidad y el margen de certeza?.

A partir de la consideración de la distribución de la campana de


Gauss. Una proporción constante del área total, bajo la curva normal, se
situará entre la media y cualquier distancia dada de “x” (que corresponde
a la observación), medida en unidades de la desviación estándar “s”, la
cual posee tres puntuaciones tanto positivas como negativas. Este
principio se aplica universalmente a todos los datos normales
distribuidos. De tal forma que el área bajo la curva normal entre ± 1s
siempre será 68%, ± 2s corresponde a 95% y ± 3s equivale a 99%.

Distribución según la ley de probabilidad de la campana de Gauss


Margen de Error de Desviación Variabilidad

Certeza(MC) muestreo (d) Estándar (S) Valor “Z”

99 % 1% o sea * 0.01 ±3 2.57

95% 5% o sea * 0.05 ±2 1.96

68% --------------- ±1 1.64

*El porcentaje se convierte a decimales (1 entre 100 = 0.01) porque se


considera una probabilidad y ésta no debe pasar de la unidad.

6
d)Recursos Económicos
En este apartado se decide el nivel de confianza, variabilidad y
precisión del tamaño de la muestra, dependiendo del presupuesto
disponible para la realización del estudio.

f)Tiempo
El tiempo es fundamental para la consideración del tamaño de la
muestra, lo que a su vez determina que margen de certeza tenga que
utilizarse.

g)La información que se disponga del fenómeno a investigar


Es difícil emplear una muestra probabilística en fenómenos poco
investigados, por ejemplo, en patologías inusuales, tales como: Síndrome
de Capgras o Síndrome de Kabuki, la primera corresponde a un trastorno
psiquiátrico, mientras que la segunda a un trastorno genético con
alteraciones en el neurodesarrollo.

De lo anterior se generan las siguientes tres reglas:

A mayor variabilidad Mayor tamaño de la muestra

A mayor precisión Mayor tamaño de la muestra

A mayor margen de certeza Mayor tamaño de la muestra

7
CÁLCULO DE TAMAÑO DE LA MUESTRA PARA ESTUDIO

DESCRIPTIVOS

Para calcular el tamaño de la muestra en estudios descriptivos y/o


muestras aleatorias existen dos fórmulas:

Para la “población infinita” no existe límite en el número de


individuos (Cuando se desconoce el universo de la población).

𝑍!  𝑝 ∗ 𝑞
𝑛=
(𝑑)!

n= muestra n=
Z 2 (p * q)
d2

z= variabilidad (se elige de acuerdo a la campana de Gauss)


p= porcentaje a favor del fenómeno (se debe convertir a unidad: %/100),
porque se considera una probabilidad y ésta no debe pasar de la unidad.
Cuando se desconoce p, se utiliza el 50%
q= (1-p)
d= precisión y/o error de muestreo

1. La “Población finita” tiene un número definido de individuos


(cuando se conoce el universo de la población).

𝑍!  𝑝 ∗ 𝑞 𝑁
𝑛=
(𝑑)! 𝑁 + 𝑍 ! (𝑝 ∗ 𝑞)
n= muestra
z= variabilidad (se elige de acuerdo a la campana de Gauss)
p= porcentaje a favor del fenómeno (se debe convertir a unidad: %/100)
cundo no se conoce se utiliza el 50%.
q= (1-p)
N= universo “población total”
d= precisión y/o error de muestreo.

8
Ejemplo para “población finita”:

Se investiga en la ciudad de Guadalajara la diabetes mellitus, de


acuerdo al Sistema único de vigilancia epidemiológica, 2010 (SUIVE) hay
9,826 enfermos y el porcentaje es de 1.14. Se decidió el 5% de error, con
un “margen de certeza” de 95%.
Procedimiento:
1. Despejar la fórmula:

𝑍!  𝑝 ∗ 𝑞 𝑁
𝑛=
(𝑑)! 𝑁 + 𝑍 ! (𝑝 ∗ 𝑞)

* (Indica multiplicación)
Z= 1.96 (porque se eligió el 95% de “margen de certeza”)
p= 1.14, se tiene que convertir en fracción (57/100) = 0.011
q= 1- .0.011= 0.989 (1-p)
d= 5% se convierte a fracción (5%100 = 0.05) porque se considera una
probabilidad y ésta no debe pasar de la unidad.
N= 9,826 enfermos de diabetes en la ciudad de Guadalajara, Jalisco

9
Procedimiento del cálculo de la fórmula

N= 9,826

p= 0.011 1.96 2 (0.011*0.989)(9,826)

z= 1.96 (.05) 2 9,826 + 1.96 2 (0.011)(0.989)

q= 0.989

d 2 = 0.0025 3.8416 (0.011) (9,826)

z 2 = 3.8416 (0.0025) 2 9,826+3.8416 (0.011)

Z 2 *p*q*N= 410.6 410.6


24.61
p*q= 0.0108

d 2 *N= 24.57 n=17 enfermos con diabetes que

Z 2 *p*q= 0.042 estudiar

d 2 *N+ Z 2 *p*q= 24.61

n= 17

El resultado se redacta:
El cálculo del tamaño de la muestra (n) se basó en la fórmula de
Z 2 *p*q*N / d 2 *N+ Z 2 *p*q, donde: z= 1.96 (para el 95% de confianza);
d=0.05 (precisión); p=0.11 (proporción estimada de "presencia de
diabetes") y q= 0.989 (proporción estimada de "ausencia").Sobre la base de
la ecuación mencionada, el tamaño de la muestra fue de 17 enfermos con
diabetes.

10
Calcular el tamaño de la muestra de los siguientes municipios con
un 5% de error y con un “margen de certeza” de 95%.

Casos de Diabetes Mellitus en municipios de Jalisco


Municipio Total de Casos de % N

Diabetes Mellitus

Jamay 70 0.45

Ocotlán 469 1.81

Jocotepec 204 1.01

Poncitlán 135 0.64

Zapopan 6293 1.97

FUENTE: SUIVE-2010

11
Ejercicio 9

Se pretende obtener una muestra de la población de Jalisco de


acuerdo al censo del 2000 correspondiente a 6 652 232 habitantes, en
relación a Intoxicación por picadura de alacrán que representa en el 2%
de la población general, también quiere obtenerse datos de la muestra con
la probabilidad de ser errónea, una vez cada 100 ocasiones que se repita.

Determine el tamaño de la muestra

N=
p=
q=
d=

Repuesta:
n=

Redacte el resultado de la ecuación.

12
Capítulo 2
Muestreo
Muestreo es el procedimiento para recolectar muestras, es una
herramienta de la investigación científica, la función general es que parte
de la población (muestra) debe examinarse y que cumpla la condición de
ser representativa para realizar inferencias.

Hay dos tipos de muestreos:


1. Muestreo probabilístico.
2. Muestreo no probabilístico.

Muestreo probabilístico.
Se fundamenta en que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, por lo
tanto, todas las posibles muestras (n) tienen la misma probabilidad de ser
elegidas. Solo estos métodos de muestreo probabilístico aseguran la
representatividad de la muestra, por tanto, los más recomendables.

Tipos de muestreos probabilísticos:


• Muestreo simple
• Muestreo sistemático
• Muestreo estratificado
• Muestreo por conglomerados

13
ESQUEMA DE MUESTREO PROBABILISTICO

Aleatorio Simple Sistemático

Estratificado Conglomerados

14
Muestreo simple: Es aquel donde cada individuo tiene la misma
probabilidad de ser seleccionado como parte de la muestra y esto
determina su confiabilidad, generalmente se utilizan en tamaño de
muestra pequeña.

Procedimiento:
1. Tener la muestra
2. Listar todos los miembros de la población
3. Cada miembro del marco de muestreo se le asigna un número
exclusivo
4. Aplicar un procedimientos de selección (Números aleatorios, tablas
aleatorios, y/o sorteo)
EJEMPLO:
Se investiga en la ciudad de Guadalajara la diabetes mellitus, de
acuerdo al Sistema único de vigilancia epidemiológica, 2010 (SUIVE) hay
9,826 enfermos y el porcentaje es de 1.14. Se decidió el 5% de error, con
un “margen de certeza” de 95%.

15
Procedimiento del Muestreo Simple
Procedimiento Resultados
Tener la muestra 17 enfermos de diabetes mellitus (se
calcula con anterioridad, ver capítulo 7)
Listar todos los miembros Se tiene que listar los 9,826 enfermos de
de la población diabetes de la ciudad de Guadalajara
Cada miembro del marco de En este caso es del uno al 9,826
muestreo se le asigna un
número exclusivo
Aplicar un procedimiento Consulte tabla D de números aleatorios o
de selección (Números utilice su calculadora .
aleatorios y/o sorteo) En la web esta disponible:
http://randomnumbergenerator.intemodino.com/es/generador-
de-numeros-aleatorios.html

Muestreo sistemático:
Este procedimientos se utiliza en poblaciones amplias y que estén
numeradas, con este muestreo se asegura una distribución espacial.

Procedimiento:
1. Tener la muestra (n)
2. Conseguir un listado de los N elementos de la población
3. Definir un intervalo “K” (k=N/n)
4. Elegir un número aleatorio a este se le llama arranque aleatorio “r”, entre 1 y
k
5. Seleccionar los elementos de la lista.

16
Ejemplo:
El resultado del tamaño de la muestra de enfermos de diabetes mellitus
en Guadalajara fue 17.
Resultados
1. Tener la muestra (n) (se calcula con 17 enfermos de diabetes mellitus
anterioridad, en el capitulo de muestra de
este libro plantea como realizar el cálculo
del tamaño de la muestra).

2. Conseguir un listado de los Se tiene que listar los 9,826 enfermos


N elementos de la población de diabetes de la ciudad de
Guadalajara docentes
3.Definir un intervalo “K” (k=N/n) 9826/17=578, este resultado significa que se
estudiará un enfermo de 578 en 578 de la lista
general hasta completar los 17 personas enfermas a
investigar.

4.Elegir un número aleatorio a Se sorteo entre los primeros 578


éste se le llama arranque enfermos para saber en donde
aleatorio “r”, entre 1 y k iniciar, en el ejemplo resulto el 502
Seleccionar los elementos de la Como resultó seleccionado el numero
lista. 502,
entonces seguiríamos con el, 1079,
1580, 2081, 2582 , etc

Muestreo estratificado:
Se utiliza cuando se tiene una población variable (heterogénea), se
agrupan en estratos de acuerdo a un marco referencial.
Ejemplo:
El resultado del tamaño de la muestra de enfermos de diabetes mellitus
en Guadalajara fue 17. La variable de interés es sexo.

17
Procedimiento:
1. Tener la muestra
2. Elegir la variable de interés
3. Una vez calculado el tamaño muestral, éste se reparte de manera
proporcional entre los distintos estratos definidos en la población
usando una simple regla de tres.

Procedimiento Resultados
Muestra 17
Elegir la variable de interés Se eligió la variable sexo
Una vez calculado el tamaño muestral, n=17
(se calcula con anterioridad, en el Regla de tres
capítulo de muestra se plantea como 17- 100
realizar el cálculo del tamaño de la X - 50%
muestra). La muestra se reparte de 17*50/100=9
manera proporcional entre los distintos 9 Hombres
estratos definidos en la población 9 Mujeres
usando una simple regla de tres. Este es el método de afijación
proporcional.
*indica multiplicación

Muestreo por conglomerados:


En este muestreo las unidades de análisis (quien serán medidos, en este
caso los sujetos que se aplicará un instrumento) se encuentran cerradas
en lugares físicos, o geográficos, por ejemplo en el país de México se
encuentran los estados, municipios y localidades. En el Centro
Universitario los departamentos académicos, academias, programas
académicos.

18
Procedimiento:
Se realizan varias fases de muestreo sucesivas (polietápico).
La necesidad de listados de las unidades de una etapa se limita a aquellas
unidades de muestreo seleccionadas en la etapa anterior.

Ejemplo:
El resultado del tamaño de la muestra de personas enfermas de diabetes
mellitas fue de 17. Los conglomerados o áreas, también conocidos por
racimos en el caso de este ejemplo son las colonias del municipio de
Guadalajara.
Procedimiento:
1. Tener la muestra
2. Identificar cuántos enfermos se encuentran en cada colonia.
3. Calcular la fracción constante.
4. Multiplicar la población de cada conglomerado (Nh) con la fracción
constante (fh) y dará como resultado la muestra de cada
conglomerado.

1. Muestra: 17

2. Fracción constante
n/N fh= 0.0017

Población Total N= 9826


Muestra n= 17

Total de Población del Muestra del


Colonia conglomerado (Nh) conglomerado Nh*fh
Colonia A 3000 5
Colonia B 1500 3
Colonia C 800 1
Colonia D 589 1
Colonia F 2334 4
Colonia G 1603 3
Total 9826 17

19
PROCEDIMIENTOS DE SELECCIÓN
Para asegurar que las unidades de análisis o elementos muestrales se
eligieron aleatoriamente, es decir que cada elemento tenga la misma
probabilidad de ser elegido. Se utilizan tres procedimientos de selección:

1. Sorteo o “Rifa”
En el cual se enumeran todos elementos de la muestra del 1 a “n”.
escribir el número consecutivo en papeletas, una papeleta por cada
elemento, colocarlas en una caja y mezclarlas para obtener de la caja el
número de papeletas hasta obtener el total de la muestra.

2. "Volado"
Este procedimiento es poco común, el cual corresponde a lanzar al aire
una moneda para la elección del total de la muestra, según el resultado,
ya sea cara o cruz de la moneda.

3. Números aleatorios o números random


Son mecanismos de probabilidad para los cuales se utilizan tablas
aleatorias como las generadas por la corporación Rand en 1955. La tabla
contiene un millón de números aleatorios y 100,000 abscisas aleatorias de
la distribución normal tipificada [RAN55], o con programas de cómputo.

20
MUESTREO NO PROBABILÍSTICO

Es aquel utilizado en forma empírica, es decir, no se efectúa bajo


normas probabilísticas de selección, por lo que sus procesos intervienen
opiniones y criterios personales del investigador o no existe norma bien
definida o validada. La tendencia de este procedimiento se basa en la
generación de muestras menos precisas y representativas que el muestreo
probabilístico.

Consideraciones para utilizar un muestreo no probabilístico:

• Cuando se pretende estudiar una población rara o marginal


• Cuándo no hay un marco disponible para propósitos de muestreo
• Cuando se considera que no se requieren cifras exactas sobre la
representatividad estadística de los resultados

Tipos de muestreo no probabilístico

Accidental o de Conveniencia:
Se le conoce como selección intencionada, muestreo accidental o
muestreo por oportunidad.
Consiste en la elección por métodos no aleatorios de una muestra cuyas
características sean similares a las de la población objetivo.
En este tipo de muestreo la “representatividad” la determina el
investigador de modo subjetivo, siendo este el mayor inconveniente del
método ya que no podemos cuantificar la representatividad de la muestra.
En una esquina de la calle o cualquier lugar, se establece un tiempo.

21
Por Cuota:
Fijar una cantidad de sujetos a estudiar. La población se fracciona en
subpoblaciones y de cada población se fija una cuota, que consisten en un
número de individuos, que reúnen unas determinadas condiciones.

Intencionado o de criterio:
El investigador conoce la población y sus elementos que se puedan
utilizarse para escoger los casos que se incluirán en la muestra.
La muestra se elige sobre la base de conocimientos que el investigador
tenga de la población, sus elementos y la naturaleza de los objetivos de la
investigación.

22
Capítulo 3
Hipótesis
PASOS PARA EL USO DE PRUEBAS ESTADÍSTICAS EN LA
INVESTIGACIÓN

I. Formulación de la hipótesis de nulidad (Ho).


II. Elección del modelo estadístico
III. Especificación del nivel de significancia (α) y de la muestra (n).
IV. Definición de la región de rechazo.

I. Formulación de la hipótesis de nulidad (Ho).

La hipótesis de nulidad (H o ) es una suposición de diferencias nulas.


Es planteada por lo común con la intención de ser rechazada. Si se
rechaza, puede aceptarse la hipótesis alterna (H 1 ) La Hipótesis alterna es
la predicción que se deriva de la teoría que se está probando.

Al hacer una decisión acerca de diferencias sucede lo siguiente:

Si se rechaza la Hipótesis nula (Ho) se acepta la alterna (H 1 )


Si se rechaza la hipótesis alterna (H 1 ) se acepta la nula (Ho)

Cada prueba estadística tiene su propio planteamiento de hipótesis


nula por ejemplo la prueba t de student plantea lo siguiente:

23
Ho: x 1 = x 2 La media de la primera población es igual a la media de la
segunda población.

H1: x 1 ≠ x 2 Lo media de la primera población no es igual a la media


de la segunda población.

EJEMPLOS DE HIPOTESIS DE INVESTIGACION :


• El fumar cigarros ocasiona cáncer de pulmón.
• Los protestantes no tienen la misma taza de suicidio que los católicos.

II. Elección del modelo estadístico


Se debe de tomar en cuenta el tamaño de la población, el tipo de escala y
la hipótesis a comprobar.

Resumen de pruebas de estadística


Nombre de la Signo Grados de Variable Variable n Ho Planteamiento
prueba Libertad independiente dependiente
Chi cuadrada X² (r-1)(c-1) Nominal Nominal >40 A=B Los dos grupos
Ordinal no difieren con
respecto a
alguna
característica
Prueba exacta de p ------ Nominal Nominal <20 A=B Los dos grupos
Fisher Ordinal no difieren con
respecto a
alguna
característica
Corrección de X² (r-1)(c-1) Nominal Nominal 20 y A=B Los dos grupos
Yates Ordinal 40 no difieren con
respecto a
alguna
característica
t para muestras t n1+n2-2 Nominal Continua >30 x1 = x2 No hay
Independientes Ordinal diferencias
entre las
medias de las
variables
Correlación de r n-2 Continua Continua >30 r=0 No hay fuerza
Pearson Discontinua Discontinua de asociación
entre las
variables
Regresión lineal b n-2 Continua Continua >30 β=0 No hay relación
simple Discontinua Discontinua entre las
variables

24
III. Especificación del nivel de significancia (α) y de la muestra (n).

Cuando las hipótesis de nulidad y alternas han sido enunciadas y


seleccionada la prueba estadística, el paso a seguir es especificar el nivel
de significación (α), los valores comunes son 0.05 y 0.01.

El investigador debe escoger el nivel de significancia tomando en


cuenta lo que esta estudiando, Por ejemplo si se estudia los efectos
terapéuticos de la cirugía del cerebro y en la investigación tecnológica, el
investigador debe escoger el nivel más severo (0.01)
Al informar el investigador de sus resultados debe mencionar el nivel con
el que ha trabajado.
Por lo general el nivel de significancia más común es el de 0.05,
porque se considera que la salud tiene que ver con variables de carácter
social. Una nota importante es que antes de aplicar la prueba estadística
elegida se debe de elegir el nivel de significancia.

Se debe de recordar que la probabilidad no debe de pasar de 1, por


ello se puede elegir; 0.01, 0.02, 0.03, 0.04, 0.05.

IV Definición de la región de rechazo.

La probabilidad asociada con cualquier valor de la región de rechazo


es igual o menor que α.

25
La siguiente gráfica muestra la región de rechazo de la hipótesis, cuando
el cálculo se realiza manual y con es por medio del programa de cómputo
SPSS.
Con el SPSS
Cálculo Manual Aceptación de Hipótesis
Alterna con un alfa (α) de .05:

Si p es menor que α, se rechaza


la hipótesis nula (H o ) y se
Ho Hi acepta la hipótesis alterna (H i ).

.04
α
.03
Tabulada
 .02
.01
.001 d e s d e aquí se acepta con un α de .01
.002
.003
Si la calculada es igual o menor que la .004
tabulada, entonces es H o . .005
.006
.007
Si la calculada es mayor que la tabulada, .008
entonces es H 1 . .009
.0001

Estos valores son cuando se


utilizan programas estadísticos
de computo
En relación a la redacción
Cuando un paquete estadístico nos proporciona un valor p de .000 debemos escribir
p<.01 ó p<.001.
El cuerpo de la tabla contiene los datos generalmente dos cifras decimales se le
puede añadir símbolos a determinados datos como * para indicar el nivel de
significación. Por ejemplo: *p<.05 ó **p<.01.

26
Ejemplo:

Calculada Tabulada Hipótesis Alfa p p Hipótesis


Escritura
(α) adecuada
4.94 3.84 H1 .05 .0000 H1
p<.001**
8.22 5.99 H1 .05 .07 .07 Ho
2.73 1.50 H1 .01 .03 .03 Ho
1.24 8.3 Ho .01 .0000 p<.001** H 1

27
Ejercicio 10

Identifique el tipo de hipótesis con la información del siguiente cuadro?

Calculada Tabulada Hipótesis Alfa (α) p Hipótesis


3.84 3.84 .05 .05
5.9 8.22 .05 .04
1.50 2.73 .01 .001
8.3 1.24 .01 .000

Tabulada Calculada Hipótesis p Alfa (α) Hipótesis


3.84 3.84 .05 .05
5.9 8.22 .05 .04
1.50 2.73 .01 .01
8.3 1.24 .01 .01

28
Capítulo 4
Chi Cuadrado

La prueba de chi cuadrado (X 2 ) se usa para hacer comparaciones


entre dos o más muestras.
La prueba X 2 requiere que las frecuencias esperadas (E) en cada
celdilla no sean demasiado pequeñas. Cuando rebasan el mínimo, la
prueba no puede usarse adecuada ni significativamente.
Se utiliza cuando son datos de escala nominal: sólo se requieren las
frecuencias.
El resultado de X 2 se decide si existen diferencias significativas
entre los dos grupos.

En el caso de 2 por 2.
Se trata de tablas en cuyas celdas figuran probabilidades, y en la
cual podemos determinar unas probabilidades conociendo otras de la
tabla.

Si las frecuencias están en una tabla de contingencia 2 por 2, la


decisión concerniente al uso de X 2 debe guiarse por estas consideraciones:
1. Cuando N es mayor de 40, se usa X² corregida por la
continuidad.
2. Cuando N está entre 20 y 40, la prueba X² (Corrección de Yates),
3. Cuando la N es menor de 20, se usa la prueba de probabilidad
exacta de Fisher.

Si la frecuencia esperada más pequeña es menor de 5, se usa la prueba


de la probabilidad exacta de Fisher en todos los casos.

29
Resumen de consideraciones para uso de pruebas de chi cuadrada de 2 x 2
Nombre de la prueba Signo Grados de Variable Variable n Ho Planteamiento
Libertad independiente dependiente
Chi cuadrada X² (r-1)(c-1) Nominal Nominal >40* A=B Los dos grupos
Ordinal no difieren con
respecto a
alguna
característica
Prueba exacta de Fisher p ------ Nominal Nominal <20 A=B Los dos grupos
Ordinal no difieren con
respecto a
alguna
característica
Corrección de Yates X² (r-1)(c-1) Nominal Nominal 20 y A=B Los dos grupos
Ordinal 40* no difieren con
respecto a
alguna
característica
*Si la frecuencia esperada m ás pequeña es m enor de 5, se usa la prueba de la probabilidad
exacta de Fisher, no obstante que cum pla con el criterio de tam año de la m uestra.

FÓRMULA:

!
(𝑂 − 𝐸)!
𝑥 =
𝐸

O= Observados
E= Esperados

Se calculan las frecuencias observadas en una tabla de contingencia


(k) (r), usando las columnas (k) para los grupos y las filas (r) para las
condiciones.
Se determina la frecuencia esperada para cada una de las celdillas
para obtener el producto de los totales marginales comunes a ella y
dividirlo por N.

30
Los cuadros siguientes muestran las celdas con sus fórmulas.

OBSERVADOS ESPERADOS

A B Tr 1 Tr 1 = A+B TK 1 *Tr 1 /N TK 2 *Tr 1 /N


C D Tr 2 Tr 2 = C+D TK 1 *Tr 2 /N TK 2 *Tr 2 /N
TK 1 =A+C TK 2 =B+D N

Ejemplo:

Con una muestra aleatoria de 36 personas, un investigador recolectó


datos sobre el hábito de fumar y el cáncer de pulmón. Se desea asociar con
un alfa (α)de 0.05.

Supóngase que resultarán los datos de la tabla 1.1.

TABLA 1.1.

Cáncer de Esperados
pulmón
Hábito de Si No Total
fumar Si No Total
Si 15 5 20 11.66 8.33 20
No 6 10 16 9.34 6.67 16
TOTAL 21 15 36 21 15 36

31
PROCEDIMIENTO:

Sacar las frecuencias esperadas:

Para la celda A de los observados, se multiplica el total de la columna


uno (TK 1 ) por el total del renglón uno (Tr 1 ) y se divide con el total de
la muestra (N) 21*20/36=11.66
Para la celda B se multiplica el total de la columna dos (TK 2 ) por el
total del renglón uno (Tr 1 ) y se divide con el total de la muestra (N)
15*20/36=8.33
Para la celda C se multiplica el total de la columna uno (TK 1 ) por el
total del renglón dos (Tr 2 ) y se divide con el total de la muestra (N)
21*16/36=9.34
Para la celda D se multiplica el total de la columna dos (TK 2 ) por el
total del renglón dos (Tr 2 ) y se divide con el total de la muestra (N)
15*16/36=6.67

Despejar la fórmula:

PASOS:
1. Se resta los observados y esperados de cada celda
2. Se eleva al cuadrado el resultado de la resta de observados y
esperados de cada celda
3. El resultado de la resta de observados y esperados elevados al
cuadrado se divide entre los esperados de cada celda
4. Se suman los resultados de paso número tres y se obtiene la X 2 .

32
Paso 1 Paso 2 Paso3
O E (O-E) (O-E)² (O-E)²/E
Celda A 15 11.67 3.33 11.11 0.95
Celda B 5 8.33 -3.33 11.11 1.33
Celda C 6 9.34 -3.33 11.11 1.19
Celda D 10 6.67 3.33 11.11 1.67
Σ=5.14
Paso 4
x²= 5.14

III. Buscar en la tabla de chi cuadrada con un nivel de significancia


(α= alfa) de 0.05, primero calcular los grados de libertad.

IV. Cálculo de los grados de libertad (se multiplican las columnas


(k) menos 1 por renglones (r) menos 1).
gl= (K-1) (r-1).
2-1= 2-1=1
1*1=1
Se localiza en la tabla (A) gl=1 y con la α=0.05 (fijada con anterioridad)
siendo el valor X 2 (tabulada) de 3.84.

V. LA DECISIÓN:
Si la calculada es igual o menor que la tabulada, entonces es H o .

Si la calculada es mayor que la tabulada, entonces es H 1 .

Si p es igual o menor que α se rechaza la hipótesis nula (H o ) y se


acepta la hipótesis alterna (H 1 ), solo si el calculo fue realizado con
programas de computo.

H o : El hábito de fumar y el cáncer de pulmón son independientes.


H 1 : El hábito de fumar y el cáncer de pulmón no son independientes.

33
VI. CONCLUSIÓN:

Aceptamos H 1 : El hábito de fumar y el cáncer de pulmón no son


independientes.
Si hay diferencia significativa entre el hábito de fumar y el cáncer de
pulmón.

NOTA:
En este ejemplo no se cumple con la consideración del tamaño de la
muestra para chi cuadrada de >40, siendo la n=36, en este caso se
debe utilizar Corrección de Yates.

Redacción APA
χ 2 (1, N=36)=5.14, p<.05.Se encontraron diferencias significativas entre el hábito de
fumar y el cáncer de pulmón.

34
Ejercicio 11
El siguiente cuadro muestra los datos de los Diabéticos

GRUPO
 SEXO
 GLUCOSA
 HTA
 Estado
Nutricional



Hospitalizado
 Hombre
 350
 Presión
arterial
óptima
 Obeso
Tipo
I

Hospitalizado
 Hombre
 400
 Presión
arterial
óptima
 Sobrepeso

Hospitalizado
 Hombre
 369
 Presión
arterial
óptima
 Normal

Hospitalizado
 Hombre
 322
 Presión
arterial
óptima
 Obeso
Tipo
III

Hospitalizado
 Hombre
 291
 HTA
etapa
2
 Normal

Hospitalizado
 Hombre
 465
 HTA
etapa
1
 Obeso
Tipo
I

Hospitalizado
 Mujer
 312
 HTA
etapa1
 Sobrepeso

Hospitalizado
 Mujer
 296
 Presión
arterial
normal
 Sobrepeso

Hospitalizado
 Mujer
 306
 Presión
arterial
normal
 Obeso
Tipo
III

Hospitalizado
 Mujer
 380
 HTA
etapa1
 Normal

Hospitalizado
 Mujer
 400
 HTA
etapa1
 Obeso
Tipo
I

Hospitalizado
 Mujer
 180
 Presión
arterial
normal
alta
 Sobrepeso

Hospitalizado
 Hombre
 500
 Presión
arterial
óptima
 Normal

Hospitalizado
 Mujer
 300
 Presión
arterial
óptima
 Obeso
Tipo
I

Hospitalizado
 Hombre
 290
 Hipertensión
sistólica
aislada
 Sobrepeso

Hospitalizado
 Mujer
 190
 HTA
etapa
2
 Sobrepeso

Hospitalizado
 Hombre
 400
 HTA
etapa1
 Sobrepeso

Hospitalizado
 Hombre
 250
 Hipertensión
sistólica
aislada
 Normal

Hospitalizado
 Mujer
 256
 HTA
etapa
2
 Normal

Hospitalizado
 Mujer
 300
 Presión
arterial
óptima
 Sobrepeso

Hospitalizado
 Mujer
 188
 Hipertensión
sistólica
aislada
 Sobrepeso

Hospitalizado
 Hombre
 324
 Presión
arterial
óptima
 Obeso
Tipo
III

Hospitalizado
 Hombre
 304
 Presión
arterial
óptima
 Obeso
Tipo
I

Hospitalizado
 Hombre
 280
 Hipertensión
sistólica
aislada
 Obeso
Tipo
III

Hospitalizado
 Hombre
 300
 Presión
arterial
óptima
 Normal

Hospitalizado
 Hombre
 346
 Presión
arterial
normal
alta
 Normal

Hospitalizado
 Hombre
 250
 HTA
etapa1
 Normal

Hospitalizado
 Mujer
 400
 HTA
etapa1
 Normal

Hospitalizado
 Hombre
 250
 Presión
arterial
óptima
 Obeso
Tipo
I

Hospitalizado
 Mujer
 190
 HTA
etapa1
 Obeso
Tipo
III

Mujer
 340
 Sobrepeso

Hospitalizado
 Presión
arterial
normal
alta

Hombre
 294

Hospitalizado
 HTA
etapa1
 Obeso
Tipo
I

Hombre
 240

Hospitalizado
 HTA
etapa1
 Obeso
Tipo
II

Mujer
 318

Hospitalizado
 Presión
arterial
normal
alta
 Obeso
Tipo
II

Mujer
 240
 Sobrepeso

Hospitalizado
 Presión
arterial
normal

Hombre
 290
 Normal

Hospitalizado
 Presión
arterial
normal
alta

Hombre
 314

Hospitalizado
 Presión
arterial
óptima
 Obeso
Tipo
I

Mujer
 180

Hospitalizado
 Presión
arterial
normal
 Obeso
Tipo
III

Mujer
 198
 Sobrepeso

Hospitalizado
 HTA
etapa1

Mujer
 170
 Sobrepeso

Hospitalizado
 Presión
arterial
óptima


35
Continuación de cuadro de datos de Diabéticos
No
hospitalizado
 Mujer
 268
 Presión
arterial
normal
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 240
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Hombre
 140
 Presión
arterial
normal
alta
 Obeso
Tipo
III

No
hospitalizado
 Hombre
 125
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 180
 HTA
etapa
1
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 360
 HTA
etapa
1
 Sobrepeso

No
hospitalizado
 Hombre
 260
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Hombre
 160
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 300
 Presión
arterial
normal
alta
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 230
 HTA
etapa
1
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 145
 HTA
etapa
1
 Sobrepeso

No
hospitalizado
 Mujer
 120
 HTA
etapa
1
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 190
 Presión
arterial
óptima
 Normal

No
hospitalizado
 Hombre
 224
 HTA
etapa
1
 Obeso
Tipo
II

No
hospitalizado
 Hombre
 192
 Presión
arterial
normal
alta
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 160
 HTA
etapa
1
 Sobrepeso

No
hospitalizado
 Hombre
 136
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Hombre
 66
 Presión
arterial
óptima
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 141
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 183
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Mujer
 174
 Presión
arterial
óptima
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 185
 Presión
arterial
normal
alta
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 182
 Presión
arterial
óptima
 Obeso
Tipo
III

No
hospitalizado
 Hombre
 130
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Hombre
 129
 Presión
arterial
óptima
 Normal

No
hospitalizado
 Mujer
 153
 Presión
arterial
normal
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 132
 HTA
etapa
1
 Normal

No
hospitalizado
 Hombre
 382
 Presión
arterial
óptima
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 209
 Presión
arterial
óptima
 Obeso
Tipo
II

No
hospitalizado
 Hombre
 170
 Presión
arterial
óptima
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 164
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 155
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 114
 Presión
arterial
óptima
 Sobrepeso

No
hospitalizado
 Hombre
 142
 Presión
arterial
óptima
 Sobrepeso

No
hospitalizado
 Mujer
 168
 Presión
arterial
óptima
 Normal

No
hospitalizado
 Hombre
 135
 HTA
etapa
1
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 133
 Presión
arterial
óptima
 Obeso
Tipo
II

No
hospitalizado
 Hombre
 136
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Mujer
 182
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Hombre
 145
 Presión
arterial
óptima
 Sobrepeso


36
Ejercicio 11

Del cuadro anterior calcular la chi2 con las variables de Presión Arterial
y Hospitalizados y no Hospitalizados, tomando en cuenta los siguientes
puntos:

1. Formulación de la hipótesis de nulidad (Ho)

2. Elección del modelo estadístico

3. Especificación del nivel de significancia (α) y de la muestra (n)

4. Definición de la región de rechazo

5. Decisión

6. Conclusión

37
Capítulo 5
Corrección de Yates

Se utiliza cuando N está entre 20 y 40, la prueba y las frecuencias


observadas o esperadas sean de 5 o menores de 10. En datos de escala
nominal.

FÓRMULA:

!
!
𝑂 − 𝐸 − 0.5
𝑥 =
𝐸

O= Observados
E= Esperados

Se calculan las frecuencias observadas en una tabla de contingencia


(k) (r), usando las columnas (k) para los grupos y las filas (r) para las
condiciones.

Se determina la frecuencia esperada para cada una de las celdillas


para obtener el producto de los totales marginales comunes a ella y
dividirlo por N.

38
Ejemplo: Supóngase que resultarán los datos de la tabla 1.2.

TABLA 1.2.

Cáncer de Esperados
pulmón
Hábito de Si No Total
fumar Si No Total
Si 15 5 20 11.66 8.33 20
No 6 10 16 9.34 6.67 16
TOTAL 21 15 36 21 15 36

I. Para sacar las frecuencias esperadas (utilizando el


procedimiento de X²)
II. Despejar la fórmula.

PASOS:
1. Se resta los observados y esperados de cada celda menos 0.5 (sin
tomar en cuenta los signos).
2. Se eleva al cuadrado el resultado de la resta de observados y
esperados menos 0.5 de cada celda.
3. El resultado de la resta de observados y esperados menos 0.5
elevados al cuadrado se divide entre los esperados de cada celda.
4. Se suman los resultados de paso número tres y se obtiene la X² de
yates.

39
Paso 1 Paso 2 Paso3
O E (O-E)-0.5 [ (O-E)-0.5] ² [ (O-E)-0.5] ²/E
Celda A 15 11.6667 2.83 8.03 0.69
Celda B 5 8.33333 2.83 8.03 0.96
Celda C 6 9.33333 2.83 8.03 0.86
Celda D 10 6.66667 2.83 8.03 1.20

Paso 4
x²= 3.72

III. Buscar en la tabla con nivel de significancia de 0.05, primero se


calculan los grados de libertad.

IV. Cálculo de los grados de libertad (se multiplican las columnas (k)
menos 1 por renglones (r) menos1).
gl= (K-1) (r-1) 2-1= 2-1=1 1*1=1
Se localiza en la tabla gl=1 y con la a=0.05 (fijada con anterioridad)
siendo el valor X 2 = 3.84 (tabulada).

V. La decisión
Si la calculada es igual o menor que la tabulada, entonces es H o .

Si la calculada es mayor que la tabulada, entonces es H 1 .


Si p es igual o menor que a se rechaza Ho.

Por lo tanto, si 3.72 (calculada) es menor 3.84 (tabulada) se acepta la H o y


se rechaza la H 1 .

Ho: El hábito de fumar y el cáncer de pulmón son independientes


H 1 : El hábito de fumar y el cáncer de pulmón no son independientes.

VI. Conclusión

Aceptamos Ho: El hábito de fumar y el cáncer de pulmón son


independientes.

40
No hay diferencia significativa entre el hábito de fumar y el cáncer de
pulmón.

Como se muestra arriba, la corrección de Yates produce un valor de


chi cuadrada menor (X 2 =3.72) que el que se obtenía mediante la fórmula
no corregida (X 2 =5.13). Con la fórmula corregida aceptamos la hipótesis
nula, sin ella, la rechazamos.

Redacción APA
χ 2 (1, N=36)=3.74, p>.05. No se encontraron diferencias significativas entre el
hábito de fumar y el cáncer de pulmón.

41
El siguiente cuadro muestra los datos de los Diabéticos
SEXO
 GLUCOSA
 HTA
 Estado
Nutricional

Hombre
 350
 Presión
arterial
óptima
 Obeso
Tipo
I

Hombre
 400
 Presión
arterial
óptima
 Sobrepeso

Hombre
 369
 Presión
arterial
óptima
 Normal

Hombre
 322
 Presión
arterial
óptima
 Obeso
Tipo
III

Hombre
 291
 HTA
etapa
2
 Normal

Hombre
 465
 HTA
etapa
1
 Obeso
Tipo
I

Mujer
 312
 HTA
etapa1
 Sobrepeso

Mujer
 296
 Presión
arterial
normal
 Sobrepeso

Mujer
 306
 Presión
arterial
normal
 Obeso
Tipo
III

Mujer
 380
 HTA
etapa1
 Normal

Mujer
 400
 HTA
etapa1
 Obeso
Tipo
I

Mujer
 180
 Presión
arterial
normal
alta
 Sobrepeso

Hombre
 500
 Presión
arterial
óptima
 Normal

Mujer
 300
 Presión
arterial
óptima
 Obeso
Tipo
I

Hombre
 290
 Hipertensión
sistólica
aislada
 Sobrepeso

Mujer
 190
 HTA
etapa
2
 Sobrepeso

Hombre
 400
 HTA
etapa1
 Sobrepeso

Hombre
 250
 Hipertensión
sistólica
aislada
 Normal

Mujer
 256
 HTA
etapa
2
 Normal

Mujer
 300
 Presión
arterial
óptima
 Sobrepeso

Mujer
 188
 Hipertensión
sistólica
aislada
 Sobrepeso

Hombre
 324
 Presión
arterial
óptima
 Obeso
Tipo
III

Hombre
 304
 Presión
arterial
óptima
 Obeso
Tipo
I

Hombre
 280
 Hipertensión
sistólica
aislada
 Obeso
Tipo
III

Hombre
 300
 Presión
arterial
óptima
 Normal

Hombre
 346
 Presión
arterial
normal
alta
 Normal

Hombre
 250
 HTA
etapa1
 Normal

Mujer
 400
 HTA
etapa1
 Normal

Hombre
 250
 Presión
arterial
óptima
 Obeso
Tipo
I

Mujer
 190
 HTA
etapa1
 Obeso
Tipo
III

Mujer
 340
 Sobrepeso

Presión
arterial
normal
alta

Hombre
 294

HTA
etapa1
 Obeso
Tipo
I

Hombre
 240

HTA
etapa1
 Obeso
Tipo
II

Mujer
 318

Presión
arterial
normal
alta
 Obeso
Tipo
II

Mujer
 240
 Sobrepeso

Presión
arterial
normal

Hombre
 290
 Normal

Presión
arterial
normal
alta

Hombre
 314

Presión
arterial
óptima
 Obeso
Tipo
I

Mujer
 180

Presión
arterial
normal
 Obeso
Tipo
III

Mujer
 198
 Sobrepeso

HTA
etapa1

Mujer
 170
 Sobrepeso

Presión
arterial
óptima


42
Continuación de cuadro de datos de Diabéticos
Mujer
 268
 Presión
arterial
normal
 Obeso
Tipo
I

Mujer
 240
 Presión
arterial
normal
alta
 Sobrepeso

Hombre
 140
 Presión
arterial
normal
alta
 Obeso
Tipo
III

Hombre
 125
 Presión
arterial
normal
alta
 Sobrepeso

Mujer
 180
 HTA
etapa
1
 Obeso
Tipo
III

Mujer
 360
 HTA
etapa
1
 Sobrepeso

Hombre
 260
 Presión
arterial
normal
alta
 Sobrepeso

Hombre
 160
 Presión
arterial
normal
alta
 Sobrepeso

Mujer
 300
 Presión
arterial
normal
alta
 Obeso
Tipo
III

Mujer
 230
 HTA
etapa
1
 Obeso
Tipo
III

Mujer
 145
 HTA
etapa
1
 Sobrepeso

Mujer
 120
 HTA
etapa
1
 Obeso
Tipo
I

Mujer
 190
 Presión
arterial
óptima
 Normal

Hombre
 224
 HTA
etapa
1
 Obeso
Tipo
II

Hombre
 192
 Presión
arterial
normal
alta
 Obeso
Tipo
I

Mujer
 160
 HTA
etapa
1
 Sobrepeso

Hombre
 136
 Presión
arterial
normal
 Sobrepeso

Hombre
 66
 Presión
arterial
óptima
 Obeso
Tipo
I

Mujer
 141
 Presión
arterial
normal
alta
 Sobrepeso

Mujer
 183
 Presión
arterial
normal
 Sobrepeso

Mujer
 174
 Presión
arterial
óptima
 Obeso
Tipo
III

Mujer
 185
 Presión
arterial
normal
alta
 Obeso
Tipo
III

Mujer
 182
 Presión
arterial
óptima
 Obeso
Tipo
III

Hombre
 130
 Presión
arterial
normal
 Sobrepeso

Hombre
 129
 Presión
arterial
óptima
 Normal

Mujer
 153
 Presión
arterial
normal
 Obeso
Tipo
III

Mujer
 132
 HTA
etapa
1
 Normal

Hombre
 382
 Presión
arterial
óptima
 Obeso
Tipo
III

Mujer
 209
 Presión
arterial
óptima
 Obeso
Tipo
II

Hombre
 170
 Presión
arterial
óptima
 Obeso
Tipo
III

Mujer
 164
 Presión
arterial
normal
alta
 Sobrepeso

Mujer
 155
 Presión
arterial
normal
alta
 Sobrepeso

Mujer
 114
 Presión
arterial
óptima
 Sobrepeso

Hombre
 142
 Presión
arterial
óptima
 Sobrepeso

Mujer
 168
 Presión
arterial
óptima
 Normal

Hombre
 135
 HTA
etapa
1
 Obeso
Tipo
I

Mujer
 133
 Presión
arterial
óptima
 Obeso
Tipo
II

Hombre
 136
 Presión
arterial
normal
 Sobrepeso

Mujer
 182
 Presión
arterial
normal
 Sobrepeso

Hombre
 145
 Presión
arterial
óptima
 Sobrepeso


43
Ejercicio 12

Del cuadro anterior calcular la corrección de yates de los pacientes de


diabéticos de las variables de sexo y estado nutricional normal y obeso
tipo III , tomando en cuenta los siguientes puntos:

I.Formulación de la hipótesis de nulidad (Ho)

II.Elección del modelo estadístico

III.Especificación del nivel de significancia (α) y de la muestra (n)

IV.Definición de la región de rechazo

V.Decisión

VI.Conclusion

44
Capítulo 6

Prueba de la Probabilidad Exacta


de Fisher
Se utiliza para análisis de datos nominales u ordinales y cuando las
dos muestras independientes son pequeñas (20 casos) en tablas de
contingencia de 2x2. Los grupos pueden ser experimentales y controles,
hombres o mujeres, nuños y adultos, abuelos y abuelas, tratamiento A y
tratamiento B.

FÓRMULA:

p= (A+B )! (C+D) ! (A+ C) ! (B+D) !


N ! A ! B ! C ! D

p= Prueba de la probabilidad de Fisher


Factorización Ejem. Factor de 4 es
! 4*3*2*1=24
N= Total de sujetos

DISTRIBUCIÓN EN LA TABLA DE 2X2

- +
Grupo I A B A+B
Grupo II C D C+D
Total A+C B+D N

Ejemplo:
Se realizo una investigación para evaluar la efectividad de un nuevo
tratamiento “A” para la gripe que se administró a 15 sujetos. Se desea
saber si es efectivo el tratamiento para la gripe?

45
Gripa
Tratamiento “A” Si No Totales
Si 1 8 9
No 6 0 6
Totales 7 8 15
Paso 1 Paso 1
PROCEDIMIENTO:

PASOS:

I. Sumar las celdas por columnas y renglones.

N= 15
A+B= 9
C+D= 6
A+C 7
B+D= 8

II. Sacar los factoriales de cada una de las celdas indicadas en la


fórmula.
Factorial N 1.30767E+12*
Factorial A+B 362880
Factorial C+D 720
Factorial A+C 5040
Factorial B+D 40320
Factorial A 1
Factorial B 40320
Factorial C 720
Factorial D 1
*E= Exponente , se tiene que agregar en este caso doce ceros

III. Se aplica la fórmula.

(A+B )! (C+D) ! (A+ C) !


(B+D) ! = 5.30941E+16
N ! A ! B ! C ! D = 3.79623E+19

p= 0.001398601

IV. La decisión.

Con un α de 0.05 prefijada.

46
En este caso la probabilidad (p=0.001) es menor que el nivel
seleccionado al principio (α=0.05) se rechaza H o . Y se acepta H 1 ,
(hipótesis alterna).
V. Conclusión.

Concluimos que hay una diferencia estadística entre haber usado el


tratamiento “A” y curarse de gripa.

Redacción del APA


Si hay diferencia significativa entre el tratamiento “A” y curarse de
gripa p=<.001.

47
El siguiente cuadro muestra los datos de los Diabéticos
GRUPO
 SEXO
 GLUCOSA
 HTA
 Estado
Nutricional

Hospitalizado
 Hombre
 350
 Presión
arterial
óptima
 Obeso
Tipo
I

Hospitalizado
 Hombre
 400
 Presión
arterial
óptima
 Sobrepeso

Hospitalizado
 Hombre
 369
 Presión
arterial
óptima
 Normal

Hospitalizado
 Hombre
 322
 Presión
arterial
óptima
 Obeso
Tipo
III

Hospitalizado
 Hombre
 291
 HTA
etapa
2
 Normal

Hospitalizado
 Hombre
 465
 HTA
etapa
1
 Obeso
Tipo
I

Hospitalizado
 Mujer
 312
 HTA
etapa1
 Sobrepeso

Hospitalizado
 Mujer
 296
 Presión
arterial
normal
 Sobrepeso

Hospitalizado
 Mujer
 306
 Presión
arterial
normal
 Obeso
Tipo
III

Hospitalizado
 Mujer
 380
 HTA
etapa1
 Normal

Hospitalizado
 Mujer
 400
 HTA
etapa1
 Obeso
Tipo
I

Hospitalizado
 Mujer
 180
 Presión
arterial
normal
alta
 Sobrepeso

Hospitalizado
 Hombre
 500
 Presión
arterial
óptima
 Normal

Hospitalizado
 Mujer
 300
 Presión
arterial
óptima
 Obeso
Tipo
I

Hospitalizado
 Hombre
 290
 Hipertensión
sistólica
aislada
 Sobrepeso

Hospitalizado
 Mujer
 190
 HTA
etapa
2
 Sobrepeso

Hospitalizado
 Hombre
 400
 HTA
etapa1
 Sobrepeso

Hospitalizado
 Hombre
 250
 Hipertensión
sistólica
aislada
 Normal

Hospitalizado
 Mujer
 256
 HTA
etapa
2
 Normal

Hospitalizado
 Mujer
 300
 Presión
arterial
óptima
 Sobrepeso

Hospitalizado
 Mujer
 188
 Hipertensión
sistólica
aislada
 Sobrepeso

Hospitalizado
 Hombre
 324
 Presión
arterial
óptima
 Obeso
Tipo
III

Hospitalizado
 Hombre
 304
 Presión
arterial
óptima
 Obeso
Tipo
I

Hospitalizado
 Hombre
 280
 Hipertensión
sistólica
aislada
 Obeso
Tipo
III

Hospitalizado
 Hombre
 300
 Presión
arterial
óptima
 Normal

Hospitalizado
 Hombre
 346
 Presión
arterial
normal
alta
 Normal

Hospitalizado
 Hombre
 250
 HTA
etapa1
 Normal

Hospitalizado
 Mujer
 400
 HTA
etapa1
 Normal

Hospitalizado
 Hombre
 250
 Presión
arterial
óptima
 Obeso
Tipo
I

Hospitalizado
 Mujer
 190
 HTA
etapa1
 Obeso
Tipo
III

Mujer
 340
 Sobrepeso

Hospitalizado
 Presión
arterial
normal
alta

Hombre
 294

Hospitalizado
 HTA
etapa1
 Obeso
Tipo
I

Hombre
 240

Hospitalizado
 HTA
etapa1
 Obeso
Tipo
II

Mujer
 318

Hospitalizado
 Presión
arterial
normal
alta
 Obeso
Tipo
II

Mujer
 240
 Sobrepeso

Hospitalizado
 Presión
arterial
normal

Hombre
 290
 Normal

Hospitalizado
 Presión
arterial
normal
alta

Hombre
 314

Hospitalizado
 Presión
arterial
óptima
 Obeso
Tipo
I

Mujer
 180

Hospitalizado
 Presión
arterial
normal
 Obeso
Tipo
III

Mujer
 198
 Sobrepeso

Hospitalizado
 HTA
etapa1

Mujer
 170
 Sobrepeso

Hospitalizado
 Presión
arterial
óptima


48
Continuación de cuadro de datos de Diabéticos
No
hospitalizado
 Mujer
 268
 Presión
arterial
normal
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 240
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Hombre
 140
 Presión
arterial
normal
alta
 Obeso
Tipo
III

No
hospitalizado
 Hombre
 125
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 180
 HTA
etapa
1
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 360
 HTA
etapa
1
 Sobrepeso

No
hospitalizado
 Hombre
 260
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Hombre
 160
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 300
 Presión
arterial
normal
alta
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 230
 HTA
etapa
1
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 145
 HTA
etapa
1
 Sobrepeso

No
hospitalizado
 Mujer
 120
 HTA
etapa
1
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 190
 Presión
arterial
óptima
 Normal

No
hospitalizado
 Hombre
 224
 HTA
etapa
1
 Obeso
Tipo
II

No
hospitalizado
 Hombre
 192
 Presión
arterial
normal
alta
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 160
 HTA
etapa
1
 Sobrepeso

No
hospitalizado
 Hombre
 136
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Hombre
 66
 Presión
arterial
óptima
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 141
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 183
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Mujer
 174
 Presión
arterial
óptima
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 185
 Presión
arterial
normal
alta
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 182
 Presión
arterial
óptima
 Obeso
Tipo
III

No
hospitalizado
 Hombre
 130
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Hombre
 129
 Presión
arterial
óptima
 Normal

No
hospitalizado
 Mujer
 153
 Presión
arterial
normal
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 132
 HTA
etapa
1
 Normal

No
hospitalizado
 Hombre
 382
 Presión
arterial
óptima
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 209
 Presión
arterial
óptima
 Obeso
Tipo
II

No
hospitalizado
 Hombre
 170
 Presión
arterial
óptima
 Obeso
Tipo
III

No
hospitalizado
 Mujer
 164
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 155
 Presión
arterial
normal
alta
 Sobrepeso

No
hospitalizado
 Mujer
 114
 Presión
arterial
óptima
 Sobrepeso

No
hospitalizado
 Hombre
 142
 Presión
arterial
óptima
 Sobrepeso

No
hospitalizado
 Mujer
 168
 Presión
arterial
óptima
 Normal

No
hospitalizado
 Hombre
 135
 HTA
etapa
1
 Obeso
Tipo
I

No
hospitalizado
 Mujer
 133
 Presión
arterial
óptima
 Obeso
Tipo
II

No
hospitalizado
 Hombre
 136
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Mujer
 182
 Presión
arterial
normal
 Sobrepeso

No
hospitalizado
 Hombre
 145
 Presión
arterial
óptima
 Sobrepeso


49
Ejercicio 13

1. Calcular la prueba de probabilidad exacta de Fisher del cuadro


anterior, con las variables de estar hospitalizado y no hospitalizado
y el estado nutricional de normal y obeso tipo I. Tomando en cuenta
los siguientes puntos:

I.Formulación de la hipótesis de nulidad (Ho)

II.Elección del modelo estadístico

III.Especificación del nivel de significancia (α) y de la muestra (n)

IV.Definición de la región de rechazo

V.Decisión

VI.Conclusion

50
Capítulo 7
Regresión Lineal Simple
El análisis de regresión simple es una técnica estadística de análisis
bivariado, que estudia la relación de una variable cuantitativa continua,
en función de una variable cuantitativas continuas.

La variable cuya variabilidad queremos estudiar es la variable


dependiente o respuesta (Y), y las variables en función de las cuales varía
son las variables independientes (X), también llamadas variables
predictoras (permite predecir resultados o lleva a hacer pronósticos).

El objetivo de análisis de regresión es predecir los valores de la


variable dependiente, en función de los valores de las variables
independientes.

La regresión lineal simple tiene una sola variable independiente.


Por ejemplo, si queremos estudiar la dependencia de los valores de la
presión arterial sistólica (variable independiente), en relación la presión
arterial diastólica (variable dependiente), al hacer una sola variable
independiente, la regresión es simple.

Atendiendo al número de variables independientes, la regresión


puede ser simple (cuando se tiene una sola variable independiente) o
múltiple (cuando hay más de dos variables independiente por ejemplo;
edad, peso y talla).

Otra característica que debe tenerse en cuenta en la clasificación de


la regresión es la función. Si la dependencia funcional de la variable
respuesta (dependiente) respecto a las variables independientes es lineal,
la regresión es lineal.

51
En este tipo de análisis de regresión hay una sola variable independiente
y la dependencia de la variable respuesta respecto a la predictora sigue
una función lineal.

“Y” es la variable dependiente la cual se coloca en línea vertical de la


gráfica y, “X” es la variable independiente la cual se representa en la
línea horizontal de la gráfica. Este tipo de gráfica se denomina diagrama
de dispersión
Y

Las gráficas que a continuación se presentan son ejemplos de Diagramas


de Dispersión para relaciones que son positivas, negativas o cero.

Positiva Negativa Cero


Y

Y

Y


X
 X

X

Y más altos X más Altos No está clara la tendencia

52
Fórmula:

b̂ =
"( x ! x ) ( y ! y )
i i
2
" (x ! x ) i

x i =Observación (de la variable independiente)

y i = Observación (de la variable dependiente)

x= Media (de la variable independiente)

Ῡ= Media (de la variable dependiente)

Hipótesis de la Regresión Lineal Simple

La hipótesis en regresión simple es que existe asociación lineal


entre la variable dependiente y la variable independiente. Si existe
asociación lineal, el coeficiente de regresión lineal debe ser
significativamente distinto de cero.

Las hipótesis en este caso son las siguientes:

H o = β=0

H i = β≠0

Una manera de resolver el contraste de hipótesis anterior, es


teniendo en cuenta que si b es igual a cero, sigue una distribución t de
Student con n-2 grados de libertad, y la siguiente fórmula es la que se
utiliza para comprobar la hipótesis.

53
Fórmula para comprobar hipótesis :

r n!2
t=
1! r 2
t= t de student

n= número de datos

r= correlación de Pearson

r 2 =coeficiente de determinación indica la fuerza de asociación lineal entre


dos variables 0 y 1 ,0 =ausencia , 1= relación lineal perfecta.

Fórmula para correlación de Pearson:

!!!
𝑟=
!!

b= regresión lineal

S x = desviación estándar de x

S y = desviación estándar de y

Ejemplo:

Considere que son pocos datos(es solo para calcular la formula del
ejemplo), y la regresión lineal simple se debe de utilizar con una muestra
mínima de 30.

I.Formulación de la hipótesis de nulidad (Ho)


No hay relación entre la edad y la glucosa de pacientes diabéticos
hospitalizados en urgencias con alfa de 0.05.

54
II.Elección del modelo estadístico
Regresión lineal Simple porque son variable cuantitativas

b̂=
"(x !x)(y !y)
i i
2
" (x !x) i

a. Cálculo de la regresión lineal

Resultados

Edad Glucosa
(x i - x)(y i - (x i -
X Y (x i - x) (yi‐ӯ) ӯ) x) 2 (yi‐ӯ) 2
55 350 -5 14.1 -63 20 199
64 290 5 -45.9 -207 20 2107
62 369 3 33.1 83 6 1096
63 300 4 -35.9 -126 12 1289
63 291 4 -44.9 -157 12 2016
57 465 -3 129.1 -323 6 16667
26 312 -34 -23.9 801 1122 571
75 296 16 -39.9 -618 240 1592
67 306 8 -29.9 -224 56 894
63 380 4 44.1 154 12 1945
-680.50 1509 28375

x= 59.5
Ῡ= 335.90
Σ(yi-ӯ) 2 = 28374.90
Σ(x i - x) 2 1509
Σ(x i - x)(y i -
ӯ)= -681
b= -0.451

El valor del coeficiente de regresión (b) indica que por cada año que
aumenta la edad la glucosa disminuye en -0.45 mg/dl en pacientes con
diabetes mellitus que están hospitalizados en urgencias.

III.Especificación del nivel de significancia (α) y de la muestra (n)


Se elige un alfa de 0.05 y la muestra para este ejemplo es de diez (la
regresión se aplica con mayor a 30).

55
IV.Definición de la región de rechazo
b) Comprobar la hipótesis, es a través de la formula de “t”.
r n!2
t=
1! r 2
Lo primero es obtener “r”, la Fórmula para correlación de Pearson es la
b̂Sx 𝜮 (𝑿𝒊! 𝒙)𝟐
siguiente: r = 𝑺 = 
Sy 𝒏!𝟏

Pasos para obtener “r”:


b= regresión lineal simple
S x = Desviación estándar de la “x” Σ(yi-ӯ) 2 = 28374.90/n-1 y la raíz
cuadrada del resultado
S y = Desviación estándar de la “y” Σ(x i - x) 2 =1509/n-1 y la raíz cuadrada
del resultado

Resultados:

Sy= 56.15
Sx= 12.95
bS x -5.8
r= -0.10

Segundo es calcular la “t” y la fórmula es la siguiente:

r n!2
t=
1! r 2

n-2= 8
√n-2= 2.83
r√ n-2= -0.29
r²= 0.01 coeficiente de determinación
1-r²= 0.99
√1-r²= 0.99

t= -0.30

c. Buscar en la tabla B con nivel de significancia de 0.05, primero se


calculan los grados de libertad.

56
d. Cálculo de los grados de libertad
gl=n-2

10-2=8
Se localiza en la tabla B, gl=8 y con la a=0.05 (fijada con anterioridad)
siendo el valor t= 2.306 (tabulada).

V. La decisión
Si la calculada es igual o menor que la tabulada, entonces es H o .

Si la calculada es mayor que la tabulada, entonces es H 1 .


Si p es igual o menor que a se rechaza H o .

Por lo tanto, si 0.30 (calculada) es menor 2.306 (tabulada) se acepta la H o


y se rechaza la H 1 .

Ho: La edad y la glucosa no tienen relación


H 1 : La edad y la glucosa si tienen relación

VI.Conclusión

Aceptamos Ho: La edad y la glucosa no tienen relación


e. Describir el coeficiente de determinación

El coeficiente de determinación R 2 indica la fuerza de la asociación lineal


entre dos variables. Puede tener valores entre cero y uno, 0 =ausencia,
1= relación lineal perfecta y multiplicado por cien , indica el porcentaje de
las variaciones de la variable dependiente que explica el modelo.

Se obtiene de elevar al cuadrado la correlación (r).

(-0.10) 2 = 0.01 y multiplicado por 100 es igual a 1

El 1% de la variabilidad de la glucosa explica el modelo de regresión

57
Redacción APA:
Estimamos la regresión lineal simple de la edad sobre la glucosa y probamos la
hipótesis de que la edad no está negativamente relacionada con la glucosa.
Encontramos que la pendiente β=-0.45, t(8)=-0.30, p>.05 no fue estadísticamente
significativa y por tanto rechazamos la hipótesis de relación lineal entre edad y
glucosa. El valor de R 2 fue de .0.01 indicando que aproximadamente un decimo de
la variabilidad de la edad es explicada por la glucosa.

58
Presión arterial de diabéticos hospitalizados

Presión arterial Presión arterial


Sistólica Diastólica
100 90
80 70
110 90
110 85
160 90
150 92
140 70
125 65
120 60
140 80
140 90
130 80
110 80
110 70
200 85
179 90
146 83
250 100
175 100
115 50
200 80
100 80
110 70
210 80
95 57
130 70
140 100
148 105
114 50
140 90
130 90
140 90
140 80
130 85
120 70
130 80
110 60
120 70
155 80
110 70

59
Ejercicio 14

Del cuadro anterior calcule la regresión Lineal de las variables de presión


arterial sistólica y diastólica

I.Formulación de la hipótesis de nulidad (Ho)

II.Elección del modelo estadístico


Calculo de b=

III.Especificación del nivel de significancia (α) y de la muestra (n)


Utilizar t=

IV.Definición de la región de rechazo

V.Decisión

VI.Conclusion

60
Capítulo 8
Correlación

La asociación entre dos variables cuantitativas, aun siendo


significativa, puede ser fuerte o débil. El coeficiente de determinación (r)
nos indica la fuerza de la asociación lineal entre dos variables. Esta
prueba estadística, puede tomar valores entre 0 y 1. Un valor cero indica
ausencia de asociación entre las dos variables y un valor de uno indica
una asociación perfecta. Este estadístico, multiplicado por cien, indica el
porcentaje de las variaciones de la variable dependiente que explica el
modelo.

Fórmula:

"( x ! x ) ( y ! y )
i i
𝒓= 2 2
"( x ! x ) "( y ! y )
i i

x i =Observación (de la variable independiente)

y i = Observación (de la variable dependiente)

x= Media (de la variable independiente)

Ῡ= Media (de la variable dependiente)

61
Interpretación de la correlación

El coeficiente de correlación se encuentran generalmente entre -


1,00 y + 1,00 como sigue:

- 1.00 correlación negativa perfecta

- 0.95 correlación negativa fuerte

-0.50 correlación negativa moderada

- 0.10 correlación negativa débil

0.00 ninguna correlación

+ 0.10 correlación positiva débil

+ 0.50 correlación positiva moderada

+ 0.95 correlación positiva fuerte

+ 1.00 correlación positiva perfecta

Con respecto al grado de asociación, mientras más cerca esté de


1,00, en una u otra dirección, mayor es la fuerza de correlación.

Ejemplo

Se desea saber la fuerza de asociación que se tiene entre la edad y la


glucosa de pacientes diabéticos hospitalizados en urgencias. Considere
que son pocos datos(es solo para calcular la formula), y la correlación se
debe de utilizar con una muestra mínima de 30.

Pasos:

1. Obtener la media de la x
2. Obtener la media de la y
3. Obtener la diferencia de cada observación de “x” con su media

62
4. Elevar al cuadrado el paso tres.
5. Obtener la diferencia de cada observación de “y” con su media
6. Elevar al cuadrado el paso cinco
7. Multiplicar el paso tres y cinco
8. Sumar los resultados de paso siete
9. Sumar el resultado de paso tres
10. Sumar los resultados de paso cuatro
11. Raíz cuadrada del resultado del paso nueve
12. Raíz cuadrada del resultado del paso diez
13. Multiplicar el resultado del paso nueve con resultado del paso once
14. Dividir el paso ocho con el paso trece

Resultados:

Edad Glucosa
(x i - (x i - (yi- (x i -
X Y x) x) 2 (yi-ӯ) ӯ) 2 x)(y i -ӯ)
55 350 -5 20 14.1 199 -63
64 290 5 20 -45.9 2107 -207
62 369 3 6 33.1 1096 83
63 300 4 12 -35.9 1289 -126
63 291 4 12 -44.9 2016 -157
57 465 -3 6 129.1 16667 -323
26 312 -34 1122 -23.9 571 801
75 296 16 240 -39.9 1592 -618
67 306 8 56 -29.9 894 -224
63 380 4 12 44.1 1945 154
Paso Paso Paso Paso
3 4 5 6 Paso 7

Paso 1 x= 59.5
Paso 2 Ῡ= 335.9
Paso 8 Σ(x i - x)(y i -ӯ)= -681 Numerador
Paso 9 Σ(x i - x) 2 1509
Paso 10 Σ (y i -ӯ) 2 = 28375
Paso 11 √Σ (x i -x) 2 = 39
Paso 12 √Σ (y i -ӯ) 2 = 168
Paso 13 √Σ (x i - x) 2 √Σ(x i - x) 2 = 6542.4 Denominador
Paso 14 r= -0.10

63
La variable dependiente es la glucosa y la variable independiente la
edad, un coeficiente de determinación de -.10, significa que el -10% de las
variaciones observadas de la glucosa son explicables por las variaciones
de la edad. Es una fuerza de asociación negativa débil.

Un método simplificado para comprobar la significancia de r

Afortunadamente, el proceso que se ilustró anteriormente para comprobar


la significancia de la r de Pearson ha sido simplificado, de manera que es
innecesario calcular realmente una razón t. En lugar de esto vamos a la
Tabla C de la parte final del texto, donde encontramos un lista de valores
significativos de la r de Pearson para los niveles de confianza de 0.05 y
0.01 con el número de grados de libertad de 1 a 90.

Si el coeficiente de correlación de Pearson calculado es menor que el valor


correspondiente en la tabla, debemos aceptar la hipótesis nula de que r=0.

Los grados de libertad de coeficiente de correlación de Pearson es n-2.

Observando la tabla C, al final del texto, encontramos al nivel de


confianza de 0,05 con 8 grados de libertad el valor de r de .6664. Por lo
tanto, el coeficiente de correlación de -.10 es menor que el valor de la
tabla, lo cual se acepta la hipótesis nula, no hay asociación entre la edad
y la glucosa.
Redacción APA
Para escribir correlaciones en un documento científico o bien la incluimos en una
tabla (matriz) si son muchas o bien escribimos r con los grados de libertad entre
paréntesis seguido del valor y la significación. Por ejemplo: “r(8)=-.10, p>.05”.

64
Presión arterial de diabéticos hospitalizados

Presión arterial Presión arterial


Sistólica Diastólica
100 90
80 70
110 90
110 85
160 90
150 92
140 70
125 65
120 60
140 80
140 90
130 80
110 80
110 70
200 85
179 90
146 83
250 100
175 100
115 50
200 80
100 80
110 70
210 80
95 57
130 70
140 100
148 105
114 50
140 90
130 90
140 90
140 80
130 85
120 70
130 80
110 60
120 70
155 80
110 70

65
Ejercicio 15

Del cuadro anterior calcular la correlación de las variables de presión


arterial sistólica y diastólica

I.Formulación de la hipótesis de nulidad (Ho)

II.Elección del modelo estadístico

III.Especificación del nivel de significancia (α) y de la muestra (n)

IV.Definición de la región de rechazo

V.Decisión

VI.Conclusion

66
REFERENCIAS BIBLIOGRAFICAS

Álvarez Cáceres, R. (2007). Estadísticas aplicada a las ciencias de la

salud. España: Díaz de Santos.

APA. (2012). Manual de Publicaciones American Psychological Association (6ta

ed.). (Zavala. S. Trad.) México: El Manual Moderno.

Dawson, B., & Trapp, R. G. (2002). Bioestadística médica. México: Manual

Moderno.

Gardner, R. C. (2003). Estadística para Psicología Usando SPSS para

Windows. México. D.F.: Prentice Hall.

García de Alba, E. (1995). Estadística para el equipo del área de la salud.

Guadalajara: Universidad de Guadalajara.

Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P.

(1999). Metodología de la investigación. México, D.F.: Mc Graw Hill.

Maza Cabrera, M., Zavala Gutiérrez, M., & Merino Escobar, J. (2009).

Actitud profesional de enfermería ante la muerte de pacientes. Cien.

Enferm. (online) , 39-48.

Organización Panamericana de la Salud. (1986). Manual sobre el enfoque

de riesgo en la atención materno infantil. Washington: Organización

Panamericana de la Salud.

Peña, D., & Romo, J. (1997). Introducción a la Estadística para la

Ciencias Sociales. Madrid: Mc Graw Hill.

67
Polit, D., & Hungler, B. (2000). Investigación Científica en Ciencias de la

Salud. México,D.F: Mc Graw Hill.

Rebagliato, M. (1996). Población del estudio. Técnicas de muestreo y

tamaño de la muestra. En M. Rebagliato, I. Ruiz, & M. Arranz,

Metodología de Investigación en Epidemiología (págs. 73-94). Madrid:

Díaz de Santos.

Salkind, N. (1998). Métodos de Investigación. México, D.F: Prentice Hall.

Wayne W., D. (1988). Estadística con aplicaciones a las ciencias sociales y

a la educación. México, D.F. : Mc Graw Hill.

68
RESPUESTAS EJERCICIOS

Capítulo 1
Ejercicio 9
n=1,294

El resultado se redacta:
El cálculo del tamaño de la muestra (n) se basó en la fórmula de
Z 2 *p*q*N / d 2 *N+ Z 2 *p*q, donde: z= 2.27 (para el 99% de confianza);
d=0.01 (precisión); p=0.02 (proporción estimada de "presencia de
Intoxicación por picadura de alacrán") y q=0.98 (proporción estimada de
"ausencia"). Sobre la base de la ecuación mencionada, el tamaño de la
muestra fue de 1,294 Intoxicados por picadura de alacrán.

Casos de Diabetes Mellitus en municipios de Jalisco


Municipio Total de Casos % n

Jamay 70 0.45 7

Ocotlán 469 1.81 26

Jocotepec 204 1.01 14

Poncitlán 135 0.64 9

Zapopan 6293 1.97 30

FUENTE: SUIVE-2010

69
Capítulo 3
Ejercicio 10

Calculada Tabulada Hipótesis Alfa (α) p Correcta


de escribir
Hipótesis
p
3.84 3.84 Ho .05 .05 .05 Ho
5.9 8.22 Ho .05 .04* .04* H1
1.50 2.73 Ho .01 .000 <.001** Ho
8.3 1.24 H1 .01 .01 .01 Ho

*p<.05

**p<.01

Tabulada Calculada Hipótesis p Alfa Hipótesis


(α)
3.84 3.84 Ho .05 .05 Ho
5.9 8.22 H1 .05 .04 Ho
1.50 2.73 H1 .01 .01 Ho
8.3 1.24 Ho .01 .01 Ho

Capítulo 4
Ejercicio 11

I. Formulación de la hipótesis de nulidad (Ho).


No hay diferencias significativas entre estar hospitalizado y la
Hipertensión

II. Elección del modelo estadístico, de acuerdo a variables,


muestra e hipótesis
Se elige Chi cuadrado de 2X6 , por tener mas de cuarenta
casos
Hipertensión Hospitalizado No Hospitalizado Total
Hipertensión sistólica
aislada 4 0 4
HTA etapa 1 11 9 20
HTA etapa 2 3 0 3
Presión arterial óptima 13 13 26
Presión arterial normal 4 7 11
Presión arterial normal
alta 5 11 16
Total 40 40 80

70
III. Especificación del nivel de significancia (α) y de la muestra
(n).
El alfa es de 0.05 y el tamaño de la muestra de cuarenta.

IV. Definición de la región de rechazo.


X 2 = 10.268 (calculada) gl= 5, tabulada 11.07. p=.068

V. Decisión
Se acepta la hipótesis nula (Ho).

VI. Conclusión
No hay diferencias significativas entre estar hospitalizado y no
hospitalizado con la Hipertensión de los pacientes diabéticos.

Redacción APA
χ 2 (5, N=40)=10.2, p >.05. No se encontraron diferencias significativas entre estar
hospitalizado y no hospitalizado con la hipertensión de los pacientes diabéticos.

Capítulo 5
Ejercicio 12

I. Formulación de la hipótesis de nulidad (Ho).


No hay diferencia estadística entre sexo y el estado
nutricional normal y obeso tipo I.
II. Elección del modelo estadístico, de acuerdo a variables
Corrección de Yates, por tener muestra 31 y no esperados
menor de 5.

71
Estado Nutricional
Obeso Tipo
Normal III Total
Hombre Observado 9 6 15
Sexo Esperado 7,3 7,7 15,0
Mujer Observado 6 10 16
Esperado 7,7 8,3 16,0
Total Observado 15 16 31
Esperado 15 16 31

III.Especificación del nivel de significancia (α) y de la muestra (n).


El alfa es de 0.05 y el tamaño de la muestra de 31.

IV.Definición de la región de rechazo.


X 2 = 0.79 (calculada) gl= 2, tabulada 3.84. p=0.37

V.Decisión
Se acepta la hipótesis nula (Ho).

VI.Conclusión
No hay diferencia estadística entre sexo y el estado nutricional normal y
obeso tipo I de los pacientes diabéticos.
Redacción APA
χ 2 (2, N=40)=0.79, p >.05. No se encontraron diferencias significativas entre sexo
y el estado nutricional normal y obeso tipo I de los pacientes diabéticos.

Capítulo 6
Ejercicio 13

I. Formulación de la hipótesis de nulidad (Ho).


No hay diferencias significativas entre estar hospitalizado y no
hospitalizado y el estado nutricio de normal y obeso tipo I.

72
II. Elección del modelo estadístico, de acuerdo a variables,
muestra e hipótesis
Prueba de probabilidad de Fisher, por tener celdas observadas
menores de 5.

Hospitalizado Estado Nutricio


Normal Obeso Tipo I Total
Si 11 8 19
No 4 5 9
Total 15 13 28

p= .396

III. Especificación del nivel de significancia (α) y de la muestra


(n).
El alfa es de 0.05 y el tamaño de la muestra de 28.

IV. Definición de la región de rechazo.


La p=.396 es menor de α=0.05

V. Decisión
Se acepta la hipótesis Ho

VI: Conclusión
No hay diferencias significativas entre estar hospitalizado y
no hospitalizado con el estado nutricional de los pacientes
diabéticos.
Capítulo 7
Ejercicio 14

I.Formulación de la hipótesis de nulidad (Ho)


No hay relación significativa en presión arterial sistólica y diastólica

73
II.Elección del modelo estadístico
Regresión lineal por ser variables cuantitativas y mayor de 30 y por la
hipótesis de relación entre las variables

III.Especificación del nivel de significancia (α) y de la muestra (n)


Alfa==.05 y una muestra de 40

IV.Definición de la región de rechazo

x= 136.55
0.19
Ῡ= 79.43 b= 4
S(x i - x)(y i -ӯ)= 8839 r= 0.49
S(x i - x) 2 45646
S(yi-ӯ) 2 = 6993.78 SS t o t a l r= 0.49
Sy= 13.39 n-2= 38
Sx= 34.21 √n-2= 6.16
(Ŷ -Ῡ) 2 = 1711.47 SS r e g r e s i ó n r√ n-2= 3.05
(Ῡ-Ŷ ) 2 = 5282.30 SS r e g r e s i ó n r²= 0.24
1-r²= 0.76
n-1= 39 √1-r²= 0.87
a=Y-bx= 52.984
t= 3.51

El valor del coeficiente de regresión (b) indica que por cada mm de


mercurio que aumenta la presión arterial sistólica, la presión arterial
diastólica aumenta en 0.194 mm de mercurio en pacientes con diabetes
mellitus que están hospitalizados en urgencias.

V.Decisión
gl=n-2=38

t= 3.51 (Calculada) t= 2.021 (Tabulada) p=0.001

74
Se acepta la hipótesis alterna (Hi) es mayor la calcula de la
tabulada

VI.Conclusión
Si hay relación significativa en presión arterial sistólica y diastólica
entre los pacientes diabéticos hospitalizados en urgencias

Capítulo 8
Ejercicio 15

I.Formulación de la hipótesis de nulidad (Ho)


No hay fuerza de asociación significativa en presión arterial sistólica y
diastólica

II.Elección del modelo estadístico


Correlación de Pearson por ser variables cuantitativas y mayor de 30 y
por la hipótesis de fuerza de asociación entre las variables

III.Especificación del nivel de significancia (α) y de la muestra (n)


Alfa==.05 y una muestra de 40

IV.Definición de la región de rechazo


x= 136.55
Ῡ= 79.4
Σ(x i - x)(y i -ӯ)= 8839 Numerador r= 0.49
Σ(x i - x) 2 45646
Σ(yi‐ӯ) 2 = 6994 r*100 49%
√Σ(xi‐x) 2 = 214
√Σ(yi‐ӯ) 2 = 84
Σ(x i - x) 2 √Σ(xi- x) 2 = 17867.2 Denominador

V.Decisión
gl=n-2=38

75
r= .49 multiplicado por 100=49%
Significa que el 49% de las variaciones observadas de la presión arterial
diastólica son explicables por las variaciones de la presión arterial
sistólica. Es una fuerza de asociación positiva moderada

r= 0.49 5(Calculada) r= .3044(Tabulada) p=0.001


Se acepta la hipótesis alterna (Hi) es mayor la calcula de la tabulada

VI.Conclusión
Si hay fuerza de asociación significativa en presión arterial sistólica y
diastólica entre los pacientes diabéticos hospitalizados en urgencias

Redacción APA
Para escribir correlaciones en un documento científico o bien la incluimos en una
tabla (matriz) si son muchas o bien escribimos r con los grados de libertad entre
paréntesis seguido del valor y la significación. Por ejemplo: “r(38)=-.49, p<.05”.

76
GLOSARIO

Abscisa: Coordenada horizontal en un plano cartesiano rectangular,


expresada como la distancia entre un punto y el eje vertical.

Aleatorio: Perteneciente o relativo al juego de azar.

Análisis: Parte de las matemáticas basada en los conceptos de límite,


convergencia y continuidad, que dan origen a diversas ramas: cálculo
diferencial e integral, teoría de funciones, etc.

Caso: Proceso morboso individual, especialmente de los no habituales.

Censo: Padrón o lista de la población o riqueza de una nación o pueblo.

Cociente: Resultado que se obtiene al dividir una cantidad por otra, y que
expresa cuántas veces está contenido el divisor en el dividendo.

Criterio: Norma para conocer la verdad.

Cuartil: Cualquiera de los percentiles 25, 50 ó 75.

Datos: Son los valores cualitativos o cuantitativos mediante los cuales se


miden las características de individuos los objetos, sucesos a estudiar.

Denominador: En los quebrados, número que expresa las partes iguales en


que la unidad se considera dividida. Se escribe debajo del numerador y
separado de este por una raya horizontal. En los cocientes de dos
expresiones o términos, el que actúa como divisor.

Frecuencia: Número de veces de los datos.

77
Fuente: Material que sirve de información a un investigador o de
inspiración a un autor.

Hipótesis: que se establece provisionalmente como base de una


investigación que puede confirmar o negar la validez de aquella.

Incidencia: Número de casos ocurridos.

Intervalo: Conjunto de los valores que toma una magnitud entre dos
límites dados. Intervalo de temperaturas, de energías, de frecuencias.

Método: Procedimiento que se sigue en las ciencias para hallar la verdad


y enseñarla.

Morbilidad: Proporción de personas que enferman en un sitio y tiempo


determinado

Numerador: Guarismo que señala el número de partes iguales de la


unidad contenidas en un quebrado. Se escribe separado del denominador
por una raya horizontal o inclinada. En los cocientes de dos expresiones o
términos, guarismo que actúa como dividendo.

Población: Es el conjunto de individuos u objetos que tienen la


característica de interés

Parámetro:
Variable que en una familia de elementos, sirve para identificar cada uno
de ellos mediante su valor numérico.

Percentil: Valor que divide un conjunto ordenado de datos estadísticos de


forma que un porcentaje de tales datos sea inferior a dicho valor. Así, un

78
individuo en el percentil 80 está por encima del 80% del grupo a que
pertenece.

Rango: Amplitud de la variación de un fenómeno entre un límite menor y


uno mayor claramente especificados.

Riesgo: Contingencia o proximidad de un daño.

Serie: Expresión de la suma de los infinitos términos de una sucesión.


Serie en
que la suma de sus términos se aproxima cada vez más a una determinada
cantidad. ej., 1/2 + 1/4 + 1/8 + 1/16..., se acerca progresivamente a valer 1,
sin llegar nunca. Serie en que la suma de sus términos tiende al infinito.

La significancia estadística
Es el número, llamado p-valor, que te dice la probabilidad de que tu resultado sea
observado, dado que ciertos supuestos (la hipótesis nula) son verdaderos. Si el p-
valor es suficientemente pequeño, el experimentador puede asumir con seguridad
que la hipótesis nula es falsa.

Tablas de contingencia
Se trata de tablas en cuyas celdas figuran probabilidades, y en la cual
podemos determinar unas probabilidades conociendo otras de la tabla.

Teoría: Conocimiento especulativo considerado con independencia de toda


aplicación. Serie de las leyes que sirven para relacionar determinado
orden de fenómenos. Hipótesis cuyas consecuencias se aplican a toda una
ciencia o a parte muy importante de ella.

79
FORMULARIO

Número
Fórmula
de página

X=
! x
N

𝑵+𝟏
𝑴𝒅 =  
𝟐

𝒏
𝟐   −  𝒄
𝑴𝒅 = 𝑳 + 𝒊
𝒇

𝟏
𝑴𝒐 = 𝑳𝟏 !    (𝒊)
𝟏 + 𝟐  

𝜮 𝒇𝒙𝒊
𝒙 = 
𝜮 𝒇

S=
! (xi " x )2
n "1
2
(O ! E)
X ="
2

80
Número
Fórmula
de página

𝑍!  𝑝 ∗ 𝑞
𝑛=
(𝑑)!

𝑍!  𝑝 ∗ 𝑞 𝑁
𝑛=
(𝑑)! 𝑁 + 𝑍 ! (𝑝 ∗ 𝑞)

!
(𝑂 − 𝐸)!
𝑥 =
𝐸

!
!
𝑂 − 𝐸 − 0.5
𝑥 =
𝐸

p= (A+B )! (C+D) ! (A+ C) ! (B+D) !


N ! A ! B ! C ! D

b̂ =
"( x ! x ) ( y ! y )
i i
2
# ( xi ! x )

"( x ! x ) ( y ! y )
i i
𝒓= 2 2
"( x ! x ) "( y ! y )
i i

81
Apéndice

TABLA A. Distribución Chi Cuadrada

gl 0.05 0.01
1 3.84 6.63
2 5.99 9.21
3 7.81 11.34
4 9.49 13.28
5 11.07 15.09
6 12.59 16.81
7 14.07 18.48
8 15.51 20.09
9 16.92 21.67
10 18.31 23.21
11 19.68 24.72
12 21.03 26.22
13 22.36 27.69
14 23.68 29.14
15 25.00 30.58
16 26.30 32.00
17 27.59 33.41
18 28.87 34.81
19 30.14 36.19
20 31.41 37.57
21 32.67 38.93
22 33.92 40.28
23 35.17 41.63
24 36.41 42.98
25 37.65 44.31
26 38.88 45.64
27 40.11 46.96
28 41.33 48.27
29 42.55 49.58
30 43.77 50.89

82
TABLA B. Distribución t-Student

Gl 0.05 0.02 0.01


1 12.706 31.821 63.657
2 4.303 6.965 9.925
3 3.182 4.541 5.841
4 2.776 3.747 4.604
5 2.571 3.365 4.032
6 2.447 3.143 3.707
7 2.365 2.998 3.499
8 2.306 2.896 3.355
9 2.262 2.821 3.250
10 2.228 2.764 3.169
11 2.201 2.718 3.106
12 2.179 2.681 3.055
13 2.160 2.650 3.012
14 2.145 2.624 2.977
15 2.131 2.602 2.947
16 2.120 2.583 2.921
17 2.110 2.567 2.898
18 2.101 2.552 2.878
19 2.093 2.539 2.861
20 2.086 2.528 2.845
21 2.080 2.518 2.831
22 2.074 2.508 2.819
23 2.069 2.500 2.807
24 2.064 2.492 2.797
25 2.060 2.485 2.787
26 2.056 2.479 2.779
27 2.052 2.473 2.771
28 2.048 2.467 2.763
29 2.045 2.462 2.756
30 2.042 2.457 2.750
40 2.021 2.423 2.704
60 2.000 2.390 2.660
120 1.980 2.358 2.617
¥ 1.960 2.326 2.576

83
TABLA C. Valores de la r a los Niveles de Confianza

Gl .05 .01
1 .99692 .999877
2 .95000 .990000
3 .8783 .95873
4 .8114 .91720
5 .7545 .8745
6 .7067 .8343
7 .6664 .7977
8 .6319 .7646
9 .6021 .7348
10 .5760 .7079
11 .5529 .6835
12 .5324 .6614
13 .5139 .6411
14 .4973 .6226
15 .4821 .6055
16 .4683 .5897
17 .4555 .5751
18 .4438 .5614
19 .4329 .5487
20 .4227 .5368
25 .3809 .4869
30 .3494 .4487
35 .3246 .4182
40 .3044 .3932
45 .2875 .3721
50 .2732 .3541
60 .2500 .3248
70 .2319 .3017
80 .2172 .2830
90 .2050 .2673

84
TABLA D. Números Aleatorios

4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330

6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092

5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324

3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854

6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
5484 3900 3485 0741 9069 5920 4326 7704 6525 1249

7227 0104 4141 1521 9104 5563 1392 8238 4882 2324
8506 6348 4612 8252 1062 1757 0964 2983 2244 7654
5086 0303 7423 3298 3979 2831 2257 1508 7642 1245
3690 2492 7171 7720 6509 7549 2330 5733 4730 4534
0813 6790 6858 1489 2669 3743 1901 4971 8280 0835

6905 7127 5933 1137 7583 6450 5658 7678 3444 3754
8387 5323 3753 1859 6043 0294 5110 6340 9137 6323
4094 4957 0163 9717 4118 4276 9465 8820 4127 0202
4951 3781 5101 1815 7068 6379 7252 1086 8919 2093
9047 0199 5068 7447 1664 9278 1708 3625 2864 0204

7274 9512 0074 6677 8676 0222 3335 1976 1645 3203
9192 4011 0255 5458 6942 8043 6201 1587 0972 0243
85
ESTADÍSTICA DESCRIPTIVAPARA PROFESIONALES DE LA SALUD

UNIVERSIDAD DE GUADALAJARA

Centro Universitario de Tonalá

División de Ciencias de la Salud

Departamento de Ciencias Biomédicas

Av. Nuevo Periférico No. 555 Ejido San José Tatepozco

C.P. 48525, Tonalá Jalisco México

Compilador:

Dra. Genoveva Rizo Curiel

TIRAJE: 500 EJEMPLARES

86