Libro Estadistica Inferencial 1

La presentación y disposición en conjunto de
ESTADISTICA INFERENCIAL PARA PROFESIONALES DE LA SALUD
Son propiedad de la UNIVERSIDAD DE GUADALAJARA
Ninguna parte de esta obra puede ser reproducida o transmitida, mediante ningún sistema o
método, electrónico o mecánico (INCLUYENDO EL FOTOCOPIADO, la grabación o cualquier
sistema de recuperación y almacenamiento de información), sin consentimiento por escrito de la
Institución.
Derechos Reservados:
D.R. ©
UNIVERSIDAD DE GUADALAJARA
Centro Universitario de Ciencias de la Salud
Departamento de Salud Pública
Av. Sierra Nevada 950 Edificio N, Colonia Independencia.
C.P. 44340 Guadalajara, Jalisco México.
ISBN‐13:
Impreso en México
Fecha: 12 de enero de 2013
2
Prólogo
El libro "Estadistica para profesionales de la Salud", escrito por la

Dra. Genoveva Rizo Curiel, forma parte de su inquietud como profesora-
investigadora del CUTONALA/ CUCS para compartir su experiencia
docente con los futuros grupos del área de salud.
Para el efecto hace un recuento de los principales medidas que se

utilizan en el análisis estadístico de datos, señalando ejemplos de manera
sencilla para su aplicación, desde la descripción hasta la inferencia tan
necesarias para dotar de elementos de juicio al proceso de los
profesionales de la salud.
Aunque un libro nunca puede igualar la riqueza de la tutoria

presencial de un maestro, sus líneas pueden servir de guía para preparar
la clase o para reforzar conceptos una vez recibida así como apoyar el
trabajo de investigación en la práctica.
No omito felicitar a la Dra. Genoveva por su iniciativa, y

generosidad, deseando que este sea el principio de muchas ediciones más.
Atentamente
Dr. Javier Garcia de Alba G.
3
INDICE
PROLOGO
PREFACIO
CAPÍTULO1
TAMAÑO DE LA MUESTRA
Población infinita
Población finita
CAPÍTULO 2
MUESTREO PROBALISTICO
MUESTREO NO PROBALISTICO
CAPÍTULO 3
HIPÓTESIS
CAPÍTULO 4
CHI CUADRADA
CAPÍTULO 5
YATES
CAPÍTULO 6
FISHER
CAPÍTULO 7
REGRESION LINEAL
CAPÍTULO 8
CORRELACION
REFERENCIAS BIBLIOGRAFICAS
REPUESTAS
GLOSARIO
APENDICE
Formulario
Tabla A. Distribución Chi Cudrada
Tabla B. Distribución t student
Tabla C. Valores de r, Niveles de Confianza
Tabla D. Números Aleatorios
4
Capítulo 1
Tamaño de la Muestra
Cuando se analizan a todos los sujetos de una población se tiene un

censo y si sólo se analizan una parte de la población y cumple con la
condición de ser representativa de toda la población, se tiene una muestra
a través de un muestreo probabilístico. La muestra corresponde a una
parte de una población la cual reúne características que se pretenden
estudiar. Cuando se conoce el número de individuos que la componen, se
habla de «población finita» y, cuando no se conoce su número, de
«población infinita».
Para determinar el tamaño de la muestra debe tomarse en consideración los

siguientes puntos:
a) margen de certeza, b) variabilidad, c) error de muestreo, d) recursos
económicos, f) el tiempo y, g)la información que se disponga del fenómeno
a investigar.
a)Margen de certeza
El nivel de confianza (MC) corresponde a la probabilidad de que la

estimación efectuada se ajuste a la realidad.
b)Variabilidad
Corresponde a la cantidad de variación del fenómeno, conocida como
puntuación “Z”; para su medición se recurre a la distribución de la
campana de Gauss y la variabilidad se elige de acuerdo al margen de
certeza.
5
c)Error de muestreo
Este error equivale al hecho que se obtienen conclusiones sobre
cierta realidad a partir de la observación de sólo una parte de ella. Para
un 99% de margen de certeza, debe existir un 1% de error, es decir la
probabilidad de 0.01 y para el 95% equivale a un 5% o 0.05. Lo contrario
del error corresponde a la precisión (d), lo cual asegura un error estándar
menor de 0.01.
En este punto existe una interrogante ¿De donde será obtenida la

variabilidad y el margen de certeza?.
A partir de la consideración de la distribución de la campana de

Gauss. Una proporción constante del área total, bajo la curva normal, se
situará entre la media y cualquier distancia dada de “x” (que corresponde
a la observación), medida en unidades de la desviación estándar “s”, la
cual posee tres puntuaciones tanto positivas como negativas. Este
principio se aplica universalmente a todos los datos normales
distribuidos. De tal forma que el área bajo la curva normal entre ± 1s
siempre será 68%, ± 2s corresponde a 95% y ± 3s equivale a 99%.
Distribución según la ley de probabilidad de la campana de Gauss

Margen de Error de Desviación Variabilidad
Certeza(MC) muestreo (d) Estándar (S) Valor “Z”
99 % 1% o sea * 0.01 ±3 2.57
95% 5% o sea * 0.05 ±2 1.96
68% --------------- ±1 1.64
*El porcentaje se convierte a decimales (1 entre 100 = 0.01) porque se

considera una probabilidad y ésta no debe pasar de la unidad.
6
d)Recursos Económicos
En este apartado se decide el nivel de confianza, variabilidad y
precisión del tamaño de la muestra, dependiendo del presupuesto
disponible para la realización del estudio.
f)Tiempo
El tiempo es fundamental para la consideración del tamaño de la
muestra, lo que a su vez determina que margen de certeza tenga que
utilizarse.
g)La información que se disponga del fenómeno a investigar

Es difícil emplear una muestra probabilística en fenómenos poco
investigados, por ejemplo, en patologías inusuales, tales como: Síndrome
de Capgras o Síndrome de Kabuki, la primera corresponde a un trastorno
psiquiátrico, mientras que la segunda a un trastorno genético con
alteraciones en el neurodesarrollo.
De lo anterior se generan las siguientes tres reglas:
A mayor variabilidad Mayor tamaño de la muestra
A mayor precisión Mayor tamaño de la muestra
A mayor margen de certeza Mayor tamaño de la muestra
7
CÁLCULO DE TAMAÑO DE LA MUESTRA PARA ESTUDIO
DESCRIPTIVOS
Para calcular el tamaño de la muestra en estudios descriptivos y/o

muestras aleatorias existen dos fórmulas:
Para la “población infinita” no existe límite en el número de

individuos (Cuando se desconoce el universo de la población).
𝑍! 𝑝 ∗ 𝑞
𝑛=
(𝑑)!
n= muestra n=
Z 2 (p * q)
d2
z= variabilidad (se elige de acuerdo a la campana de Gauss)

p= porcentaje a favor del fenómeno (se debe convertir a unidad: %/100),
porque se considera una probabilidad y ésta no debe pasar de la unidad.
Cuando se desconoce p, se utiliza el 50%
q= (1-p)
d= precisión y/o error de muestreo
1. La “Población finita” tiene un número definido de individuos

(cuando se conoce el universo de la población).
𝑍! 𝑝 ∗ 𝑞 𝑁
𝑛=
(𝑑)! 𝑁 + 𝑍 ! (𝑝 ∗ 𝑞)
n= muestra
z= variabilidad (se elige de acuerdo a la campana de Gauss)
p= porcentaje a favor del fenómeno (se debe convertir a unidad: %/100)
cundo no se conoce se utiliza el 50%.
q= (1-p)
N= universo “población total”
d= precisión y/o error de muestreo.
8
Ejemplo para “población finita”:
Se investiga en la ciudad de Guadalajara la diabetes mellitus, de

acuerdo al Sistema único de vigilancia epidemiológica, 2010 (SUIVE) hay
9,826 enfermos y el porcentaje es de 1.14. Se decidió el 5% de error, con
un “margen de certeza” de 95%.
Procedimiento:
1. Despejar la fórmula:
𝑛=
(𝑑)! 𝑁 + 𝑍 ! (𝑝 ∗ 𝑞)
* (Indica multiplicación)
Z= 1.96 (porque se eligió el 95% de “margen de certeza”)
p= 1.14, se tiene que convertir en fracción (57/100) = 0.011
q= 1- .0.011= 0.989 (1-p)
d= 5% se convierte a fracción (5%100 = 0.05) porque se considera una
probabilidad y ésta no debe pasar de la unidad.
N= 9,826 enfermos de diabetes en la ciudad de Guadalajara, Jalisco
9
Procedimiento del cálculo de la fórmula
N= 9,826
p= 0.011 1.96 2 (0.011*0.989)(9,826)
z= 1.96 (.05) 2 9,826 + 1.96 2 (0.011)(0.989)
q= 0.989
d 2 = 0.0025 3.8416 (0.011) (9,826)
z 2 = 3.8416 (0.0025) 2 9,826+3.8416 (0.011)
Z 2 *p*q*N= 410.6 410.6

24.61
p*q= 0.0108
d 2 *N= 24.57 n=17 enfermos con diabetes que
Z 2 *p*q= 0.042 estudiar
d 2 *N+ Z 2 *p*q= 24.61
n= 17
El resultado se redacta:
El cálculo del tamaño de la muestra (n) se basó en la fórmula de
Z 2 *p*q*N / d 2 *N+ Z 2 *p*q, donde: z= 1.96 (para el 95% de confianza);
d=0.05 (precisión); p=0.11 (proporción estimada de "presencia de
diabetes") y q= 0.989 (proporción estimada de "ausencia").Sobre la base de
la ecuación mencionada, el tamaño de la muestra fue de 17 enfermos con
diabetes.
10
Calcular el tamaño de la muestra de los siguientes municipios con
un 5% de error y con un “margen de certeza” de 95%.
Casos de Diabetes Mellitus en municipios de Jalisco

Municipio Total de Casos de % N
Diabetes Mellitus
Jamay 70 0.45
Ocotlán 469 1.81
Jocotepec 204 1.01
Poncitlán 135 0.64
Zapopan 6293 1.97
FUENTE: SUIVE-2010
11
Ejercicio 9
Se pretende obtener una muestra de la población de Jalisco de

acuerdo al censo del 2000 correspondiente a 6 652 232 habitantes, en
relación a Intoxicación por picadura de alacrán que representa en el 2%
de la población general, también quiere obtenerse datos de la muestra con
la probabilidad de ser errónea, una vez cada 100 ocasiones que se repita.
Determine el tamaño de la muestra
N=
p=
q=
d=
Repuesta:
n=
Redacte el resultado de la ecuación.
12
Capítulo 2
Muestreo
Muestreo es el procedimiento para recolectar muestras, es una
herramienta de la investigación científica, la función general es que parte
de la población (muestra) debe examinarse y que cumpla la condición de
ser representativa para realizar inferencias.
Hay dos tipos de muestreos:

1. Muestreo probabilístico.
2. Muestreo no probabilístico.
Muestreo probabilístico.
Se fundamenta en que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, por lo
tanto, todas las posibles muestras (n) tienen la misma probabilidad de ser
elegidas. Solo estos métodos de muestreo probabilístico aseguran la
representatividad de la muestra, por tanto, los más recomendables.
Tipos de muestreos probabilísticos:

• Muestreo simple
• Muestreo sistemático
• Muestreo estratificado
• Muestreo por conglomerados
13
ESQUEMA DE MUESTREO PROBABILISTICO
Aleatorio Simple Sistemático
Estratificado Conglomerados
14
Muestreo simple: Es aquel donde cada individuo tiene la misma
probabilidad de ser seleccionado como parte de la muestra y esto
determina su confiabilidad, generalmente se utilizan en tamaño de
muestra pequeña.
Procedimiento:
1. Tener la muestra
2. Listar todos los miembros de la población
3. Cada miembro del marco de muestreo se le asigna un número
exclusivo
4. Aplicar un procedimientos de selección (Números aleatorios, tablas
aleatorios, y/o sorteo)
EJEMPLO:
Se investiga en la ciudad de Guadalajara la diabetes mellitus, de
acuerdo al Sistema único de vigilancia epidemiológica, 2010 (SUIVE) hay
9,826 enfermos y el porcentaje es de 1.14. Se decidió el 5% de error, con
un “margen de certeza” de 95%.
15
Procedimiento del Muestreo Simple
Procedimiento Resultados
Tener la muestra 17 enfermos de diabetes mellitus (se
calcula con anterioridad, ver capítulo 7)
Listar todos los miembros Se tiene que listar los 9,826 enfermos de
de la población diabetes de la ciudad de Guadalajara
Cada miembro del marco de En este caso es del uno al 9,826
muestreo se le asigna un
número exclusivo
Aplicar un procedimiento Consulte tabla D de números aleatorios o
de selección (Números utilice su calculadora .
aleatorios y/o sorteo) En la web esta disponible:
http://randomnumbergenerator.intemodino.com/es/generador-
de-numeros-aleatorios.html
Muestreo sistemático:
Este procedimientos se utiliza en poblaciones amplias y que estén
numeradas, con este muestreo se asegura una distribución espacial.
Procedimiento:
1. Tener la muestra (n)
2. Conseguir un listado de los N elementos de la población
3. Definir un intervalo “K” (k=N/n)
4. Elegir un número aleatorio a este se le llama arranque aleatorio “r”, entre 1 y
k
5. Seleccionar los elementos de la lista.
16
Ejemplo:
El resultado del tamaño de la muestra de enfermos de diabetes mellitus
en Guadalajara fue 17.
Resultados
1. Tener la muestra (n) (se calcula con 17 enfermos de diabetes mellitus
anterioridad, en el capitulo de muestra de
este libro plantea como realizar el cálculo
del tamaño de la muestra).
2. Conseguir un listado de los Se tiene que listar los 9,826 enfermos

N elementos de la población de diabetes de la ciudad de
Guadalajara docentes
3.Definir un intervalo “K” (k=N/n) 9826/17=578, este resultado significa que se
estudiará un enfermo de 578 en 578 de la lista
general hasta completar los 17 personas enfermas a
investigar.
4.Elegir un número aleatorio a Se sorteo entre los primeros 578

éste se le llama arranque enfermos para saber en donde
aleatorio “r”, entre 1 y k iniciar, en el ejemplo resulto el 502
Seleccionar los elementos de la Como resultó seleccionado el numero
lista. 502,
entonces seguiríamos con el, 1079,
1580, 2081, 2582 , etc
Muestreo estratificado:
Se utiliza cuando se tiene una población variable (heterogénea), se
agrupan en estratos de acuerdo a un marco referencial.
Ejemplo:
El resultado del tamaño de la muestra de enfermos de diabetes mellitus
en Guadalajara fue 17. La variable de interés es sexo.
17
Procedimiento:
1. Tener la muestra
2. Elegir la variable de interés
3. Una vez calculado el tamaño muestral, éste se reparte de manera
proporcional entre los distintos estratos definidos en la población
usando una simple regla de tres.
Procedimiento Resultados
Muestra 17
Elegir la variable de interés Se eligió la variable sexo
Una vez calculado el tamaño muestral, n=17
(se calcula con anterioridad, en el Regla de tres
capítulo de muestra se plantea como 17- 100
realizar el cálculo del tamaño de la X - 50%
muestra). La muestra se reparte de 17*50/100=9
manera proporcional entre los distintos 9 Hombres
estratos definidos en la población 9 Mujeres
usando una simple regla de tres. Este es el método de afijación
proporcional.
*indica multiplicación
Muestreo por conglomerados:

En este muestreo las unidades de análisis (quien serán medidos, en este
caso los sujetos que se aplicará un instrumento) se encuentran cerradas
en lugares físicos, o geográficos, por ejemplo en el país de México se
encuentran los estados, municipios y localidades. En el Centro
Universitario los departamentos académicos, academias, programas
académicos.
18
Procedimiento:
Se realizan varias fases de muestreo sucesivas (polietápico).
La necesidad de listados de las unidades de una etapa se limita a aquellas
unidades de muestreo seleccionadas en la etapa anterior.
Ejemplo:
El resultado del tamaño de la muestra de personas enfermas de diabetes
mellitas fue de 17. Los conglomerados o áreas, también conocidos por
racimos en el caso de este ejemplo son las colonias del municipio de
Guadalajara.
Procedimiento:
1. Tener la muestra
2. Identificar cuántos enfermos se encuentran en cada colonia.
3. Calcular la fracción constante.
4. Multiplicar la población de cada conglomerado (Nh) con la fracción
constante (fh) y dará como resultado la muestra de cada
conglomerado.
1. Muestra: 17
2. Fracción constante
n/N fh= 0.0017
Población Total N= 9826

Muestra n= 17
Total de Población del Muestra del

Colonia conglomerado (Nh) conglomerado Nh*fh
Colonia A 3000 5
Colonia B 1500 3
Colonia C 800 1
Colonia D 589 1
Colonia F 2334 4
Colonia G 1603 3
Total 9826 17
19
PROCEDIMIENTOS DE SELECCIÓN
Para asegurar que las unidades de análisis o elementos muestrales se
eligieron aleatoriamente, es decir que cada elemento tenga la misma
probabilidad de ser elegido. Se utilizan tres procedimientos de selección:
1. Sorteo o “Rifa”
En el cual se enumeran todos elementos de la muestra del 1 a “n”.
escribir el número consecutivo en papeletas, una papeleta por cada
elemento, colocarlas en una caja y mezclarlas para obtener de la caja el
número de papeletas hasta obtener el total de la muestra.
2. "Volado"
Este procedimiento es poco común, el cual corresponde a lanzar al aire
una moneda para la elección del total de la muestra, según el resultado,
ya sea cara o cruz de la moneda.
3. Números aleatorios o números random

Son mecanismos de probabilidad para los cuales se utilizan tablas
aleatorias como las generadas por la corporación Rand en 1955. La tabla
contiene un millón de números aleatorios y 100,000 abscisas aleatorias de
la distribución normal tipificada [RAN55], o con programas de cómputo.
20
MUESTREO NO PROBABILÍSTICO
Es aquel utilizado en forma empírica, es decir, no se efectúa bajo

normas probabilísticas de selección, por lo que sus procesos intervienen
opiniones y criterios personales del investigador o no existe norma bien
definida o validada. La tendencia de este procedimiento se basa en la
generación de muestras menos precisas y representativas que el muestreo
probabilístico.
Consideraciones para utilizar un muestreo no probabilístico:
• Cuando se pretende estudiar una población rara o marginal

• Cuándo no hay un marco disponible para propósitos de muestreo
• Cuando se considera que no se requieren cifras exactas sobre la
representatividad estadística de los resultados
Tipos de muestreo no probabilístico
Accidental o de Conveniencia:
Se le conoce como selección intencionada, muestreo accidental o
muestreo por oportunidad.
Consiste en la elección por métodos no aleatorios de una muestra cuyas
características sean similares a las de la población objetivo.
En este tipo de muestreo la “representatividad” la determina el
investigador de modo subjetivo, siendo este el mayor inconveniente del
método ya que no podemos cuantificar la representatividad de la muestra.
En una esquina de la calle o cualquier lugar, se establece un tiempo.
21
Por Cuota:
Fijar una cantidad de sujetos a estudiar. La población se fracciona en
subpoblaciones y de cada población se fija una cuota, que consisten en un
número de individuos, que reúnen unas determinadas condiciones.
Intencionado o de criterio:
El investigador conoce la población y sus elementos que se puedan
utilizarse para escoger los casos que se incluirán en la muestra.
La muestra se elige sobre la base de conocimientos que el investigador
tenga de la población, sus elementos y la naturaleza de los objetivos de la
investigación.
22
Capítulo 3
Hipótesis
PASOS PARA EL USO DE PRUEBAS ESTADÍSTICAS EN LA
INVESTIGACIÓN
I. Formulación de la hipótesis de nulidad (Ho).

II. Elección del modelo estadístico
III. Especificación del nivel de significancia (α) y de la muestra (n).
IV. Definición de la región de rechazo.
La hipótesis de nulidad (H o ) es una suposición de diferencias nulas.

Es planteada por lo común con la intención de ser rechazada. Si se
rechaza, puede aceptarse la hipótesis alterna (H 1 ) La Hipótesis alterna es
la predicción que se deriva de la teoría que se está probando.
Al hacer una decisión acerca de diferencias sucede lo siguiente:
Si se rechaza la Hipótesis nula (Ho) se acepta la alterna (H 1 )

Si se rechaza la hipótesis alterna (H 1 ) se acepta la nula (Ho)
Cada prueba estadística tiene su propio planteamiento de hipótesis

nula por ejemplo la prueba t de student plantea lo siguiente:
23
Ho: x 1 = x 2 La media de la primera población es igual a la media de la
segunda población.
H1: x 1 ≠ x 2 Lo media de la primera población no es igual a la media

de la segunda población.
EJEMPLOS DE HIPOTESIS DE INVESTIGACION :

• El fumar cigarros ocasiona cáncer de pulmón.
• Los protestantes no tienen la misma taza de suicidio que los católicos.
II. Elección del modelo estadístico

Se debe de tomar en cuenta el tamaño de la población, el tipo de escala y
la hipótesis a comprobar.
Resumen de pruebas de estadística

Nombre de la Signo Grados de Variable Variable n Ho Planteamiento
prueba Libertad independiente dependiente
Chi cuadrada X² (r-1)(c-1) Nominal Nominal >40 A=B Los dos grupos
Ordinal no difieren con
respecto a
alguna
característica
Prueba exacta de p ------ Nominal Nominal <20 A=B Los dos grupos
Fisher Ordinal no difieren con
respecto a
alguna
característica
Corrección de X² (r-1)(c-1) Nominal Nominal 20 y A=B Los dos grupos
Yates Ordinal 40 no difieren con
respecto a
alguna
característica
t para muestras t n1+n2-2 Nominal Continua >30 x1 = x2 No hay
Independientes Ordinal diferencias
entre las
medias de las
variables
Correlación de r n-2 Continua Continua >30 r=0 No hay fuerza
Pearson Discontinua Discontinua de asociación
entre las
variables
Regresión lineal b n-2 Continua Continua >30 β=0 No hay relación
simple Discontinua Discontinua entre las
variables
24
III. Especificación del nivel de significancia (α) y de la muestra (n).
Cuando las hipótesis de nulidad y alternas han sido enunciadas y

seleccionada la prueba estadística, el paso a seguir es especificar el nivel
de significación (α), los valores comunes son 0.05 y 0.01.
El investigador debe escoger el nivel de significancia tomando en

cuenta lo que esta estudiando, Por ejemplo si se estudia los efectos
terapéuticos de la cirugía del cerebro y en la investigación tecnológica, el
investigador debe escoger el nivel más severo (0.01)
Al informar el investigador de sus resultados debe mencionar el nivel con
el que ha trabajado.
Por lo general el nivel de significancia más común es el de 0.05,
porque se considera que la salud tiene que ver con variables de carácter
social. Una nota importante es que antes de aplicar la prueba estadística
elegida se debe de elegir el nivel de significancia.
Se debe de recordar que la probabilidad no debe de pasar de 1, por

ello se puede elegir; 0.01, 0.02, 0.03, 0.04, 0.05.
IV Definición de la región de rechazo.
La probabilidad asociada con cualquier valor de la región de rechazo

es igual o menor que α.
25
La siguiente gráfica muestra la región de rechazo de la hipótesis, cuando
el cálculo se realiza manual y con es por medio del programa de cómputo
SPSS.
Con el SPSS
Cálculo Manual Aceptación de Hipótesis
Alterna con un alfa (α) de .05:
Si p es menor que α, se rechaza

la hipótesis nula (H o ) y se
Ho Hi acepta la hipótesis alterna (H i ).
.04
α
.03
Tabulada  .02
.01
.001 d e s d e aquí se acepta con un α de .01
.002
.003
Si la calculada es igual o menor que la .004
tabulada, entonces es H o . .005
.006
.007
Si la calculada es mayor que la tabulada, .008
entonces es H 1 . .009
.0001
Estos valores son cuando se

utilizan programas estadísticos
de computo
En relación a la redacción
Cuando un paquete estadístico nos proporciona un valor p de .000 debemos escribir
p<.01 ó p<.001.
El cuerpo de la tabla contiene los datos generalmente dos cifras decimales se le
puede añadir símbolos a determinados datos como * para indicar el nivel de
significación. Por ejemplo: *p<.05 ó **p<.01.
26
Ejemplo:
Calculada Tabulada Hipótesis Alfa p p Hipótesis

Escritura
(α) adecuada
4.94 3.84 H1 .05 .0000 H1
p<.001**
8.22 5.99 H1 .05 .07 .07 Ho
2.73 1.50 H1 .01 .03 .03 Ho
1.24 8.3 Ho .01 .0000 p<.001** H 1
27
Ejercicio 10
Identifique el tipo de hipótesis con la información del siguiente cuadro?
Calculada Tabulada Hipótesis Alfa (α) p Hipótesis

3.84 3.84 .05 .05
5.9 8.22 .05 .04
1.50 2.73 .01 .001
8.3 1.24 .01 .000
Tabulada Calculada Hipótesis p Alfa (α) Hipótesis

3.84 3.84 .05 .05
5.9 8.22 .05 .04
1.50 2.73 .01 .01
8.3 1.24 .01 .01
28
Capítulo 4
Chi Cuadrado
La prueba de chi cuadrado (X 2 ) se usa para hacer comparaciones

entre dos o más muestras.
La prueba X 2 requiere que las frecuencias esperadas (E) en cada
celdilla no sean demasiado pequeñas. Cuando rebasan el mínimo, la
prueba no puede usarse adecuada ni significativamente.
Se utiliza cuando son datos de escala nominal: sólo se requieren las
frecuencias.
El resultado de X 2 se decide si existen diferencias significativas
entre los dos grupos.
En el caso de 2 por 2.
Se trata de tablas en cuyas celdas figuran probabilidades, y en la
cual podemos determinar unas probabilidades conociendo otras de la
tabla.
Si las frecuencias están en una tabla de contingencia 2 por 2, la

decisión concerniente al uso de X 2 debe guiarse por estas consideraciones:
1. Cuando N es mayor de 40, se usa X² corregida por la
continuidad.
2. Cuando N está entre 20 y 40, la prueba X² (Corrección de Yates),
3. Cuando la N es menor de 20, se usa la prueba de probabilidad
exacta de Fisher.
Si la frecuencia esperada más pequeña es menor de 5, se usa la prueba

de la probabilidad exacta de Fisher en todos los casos.
29
Resumen de consideraciones para uso de pruebas de chi cuadrada de 2 x 2
Nombre de la prueba Signo Grados de Variable Variable n Ho Planteamiento
Libertad independiente dependiente
Chi cuadrada X² (r-1)(c-1) Nominal Nominal >40* A=B Los dos grupos
respecto a
alguna
característica
Prueba exacta de Fisher p ------ Nominal Nominal <20 A=B Los dos grupos
respecto a
alguna
característica
Corrección de Yates X² (r-1)(c-1) Nominal Nominal 20 y A=B Los dos grupos
Ordinal 40* no difieren con
respecto a
alguna
característica
*Si la frecuencia esperada m ás pequeña es m enor de 5, se usa la prueba de la probabilidad
exacta de Fisher, no obstante que cum pla con el criterio de tam año de la m uestra.
FÓRMULA:
!
(𝑂 − 𝐸)!
𝑥 =
𝐸
O= Observados
E= Esperados
Se calculan las frecuencias observadas en una tabla de contingencia

(k) (r), usando las columnas (k) para los grupos y las filas (r) para las
condiciones.
Se determina la frecuencia esperada para cada una de las celdillas
para obtener el producto de los totales marginales comunes a ella y
dividirlo por N.
30
Los cuadros siguientes muestran las celdas con sus fórmulas.
OBSERVADOS ESPERADOS
A B Tr 1 Tr 1 = A+B TK 1 *Tr 1 /N TK 2 *Tr 1 /N

C D Tr 2 Tr 2 = C+D TK 1 *Tr 2 /N TK 2 *Tr 2 /N
TK 1 =A+C TK 2 =B+D N
Ejemplo:
Con una muestra aleatoria de 36 personas, un investigador recolectó

datos sobre el hábito de fumar y el cáncer de pulmón. Se desea asociar con
un alfa (α)de 0.05.
Supóngase que resultarán los datos de la tabla 1.1.
TABLA 1.1.
Cáncer de Esperados
pulmón
Hábito de Si No Total
fumar Si No Total
Si 15 5 20 11.66 8.33 20
No 6 10 16 9.34 6.67 16
TOTAL 21 15 36 21 15 36
31
PROCEDIMIENTO:
Sacar las frecuencias esperadas:
Para la celda A de los observados, se multiplica el total de la columna

uno (TK 1 ) por el total del renglón uno (Tr 1 ) y se divide con el total de
la muestra (N) 21*20/36=11.66
Para la celda B se multiplica el total de la columna dos (TK 2 ) por el
total del renglón uno (Tr 1 ) y se divide con el total de la muestra (N)
15*20/36=8.33
Para la celda C se multiplica el total de la columna uno (TK 1 ) por el
total del renglón dos (Tr 2 ) y se divide con el total de la muestra (N)
21*16/36=9.34
Para la celda D se multiplica el total de la columna dos (TK 2 ) por el
total del renglón dos (Tr 2 ) y se divide con el total de la muestra (N)
15*16/36=6.67
Despejar la fórmula:
PASOS:
1. Se resta los observados y esperados de cada celda
2. Se eleva al cuadrado el resultado de la resta de observados y
esperados de cada celda
3. El resultado de la resta de observados y esperados elevados al
cuadrado se divide entre los esperados de cada celda
4. Se suman los resultados de paso número tres y se obtiene la X 2 .
32
Paso 1 Paso 2 Paso3
O E (O-E) (O-E)² (O-E)²/E
Celda A 15 11.67 3.33 11.11 0.95
Celda B 5 8.33 -3.33 11.11 1.33
Celda C 6 9.34 -3.33 11.11 1.19
Celda D 10 6.67 3.33 11.11 1.67
Σ=5.14
Paso 4
x²= 5.14
III. Buscar en la tabla de chi cuadrada con un nivel de significancia

(α= alfa) de 0.05, primero calcular los grados de libertad.
IV. Cálculo de los grados de libertad (se multiplican las columnas

(k) menos 1 por renglones (r) menos 1).
gl= (K-1) (r-1).
2-1= 2-1=1
1*1=1
Se localiza en la tabla (A) gl=1 y con la α=0.05 (fijada con anterioridad)
siendo el valor X 2 (tabulada) de 3.84.
V. LA DECISIÓN:
Si la calculada es igual o menor que la tabulada, entonces es H o .
Si la calculada es mayor que la tabulada, entonces es H 1 .
Si p es igual o menor que α se rechaza la hipótesis nula (H o ) y se

acepta la hipótesis alterna (H 1 ), solo si el calculo fue realizado con
programas de computo.
H o : El hábito de fumar y el cáncer de pulmón son independientes.

H 1 : El hábito de fumar y el cáncer de pulmón no son independientes.
33
VI. CONCLUSIÓN:
Aceptamos H 1 : El hábito de fumar y el cáncer de pulmón no son

independientes.
Si hay diferencia significativa entre el hábito de fumar y el cáncer de
pulmón.
NOTA:
En este ejemplo no se cumple con la consideración del tamaño de la
muestra para chi cuadrada de >40, siendo la n=36, en este caso se
debe utilizar Corrección de Yates.
Redacción APA
χ 2 (1, N=36)=5.14, p<.05.Se encontraron diferencias significativas entre el hábito de
fumar y el cáncer de pulmón.
34
Ejercicio 11
El siguiente cuadro muestra los datos de los Diabéticos
GRUPO  SEXO  GLUCOSA  HTA  Estado Nutricional 

Hospitalizado  Hombre  350  Presión arterial óptima  Obeso Tipo I 
Hospitalizado  Hombre  400  Presión arterial óptima  Sobrepeso 
Hospitalizado  Hombre  369  Presión arterial óptima  Normal 
Hospitalizado  Hombre  322  Presión arterial óptima  Obeso Tipo III 
Hospitalizado  Hombre  291  HTA etapa 2  Normal 
Hospitalizado  Hombre  465  HTA etapa 1  Obeso Tipo I 
Hospitalizado  Mujer  312  HTA etapa1  Sobrepeso 
Hospitalizado  Mujer  296  Presión arterial normal  Sobrepeso 
Hospitalizado  Mujer  306  Presión arterial normal  Obeso Tipo III 
Hospitalizado  Mujer  380  HTA etapa1  Normal 
Hospitalizado  Mujer  400  HTA etapa1  Obeso Tipo I 
Hospitalizado  Mujer  180  Presión arterial normal alta  Sobrepeso 
Hospitalizado  Mujer  300  Presión arterial óptima  Obeso Tipo I 
Hospitalizado  Hombre  290  Hipertensión sistólica aislada  Sobrepeso 
Hospitalizado  Mujer  190  HTA etapa 2  Sobrepeso 
Hospitalizado  Hombre  400  HTA etapa1  Sobrepeso 
Hospitalizado  Hombre  250  Hipertensión sistólica aislada  Normal 
Hospitalizado  Mujer  256  HTA etapa 2  Normal 
Hospitalizado  Mujer  300  Presión arterial óptima  Sobrepeso 
Hospitalizado  Mujer  188  Hipertensión sistólica aislada  Sobrepeso 
Hospitalizado  Hombre  280  Hipertensión sistólica aislada  Obeso Tipo III 
Hospitalizado  Hombre  346  Presión arterial normal alta  Normal 
Hospitalizado  Hombre  250  HTA etapa1  Normal 
Hospitalizado  Mujer  190  HTA etapa1  Obeso Tipo III 
Mujer  340  Sobrepeso 
Hospitalizado  Presión arterial normal alta 
Hombre  294 
Hospitalizado  HTA etapa1  Obeso Tipo I 
Hombre  240 
Hospitalizado  HTA etapa1  Obeso Tipo II 
Mujer  318 
Hospitalizado  Presión arterial normal alta  Obeso Tipo II 
Hospitalizado  Presión arterial normal 
Hombre  290  Normal 
Hombre  314 
Hospitalizado  Presión arterial óptima  Obeso Tipo I 
Mujer  180 
Hospitalizado  Presión arterial normal  Obeso Tipo III 
Hospitalizado  HTA etapa1 
Hospitalizado  Presión arterial óptima 
35
Continuación de cuadro de datos de Diabéticos
No hospitalizado  Mujer  268  Presión arterial normal  Obeso Tipo I 
No hospitalizado  Mujer  240  Presión arterial normal alta  Sobrepeso 
No hospitalizado  Hombre  140  Presión arterial normal alta  Obeso Tipo III 
No hospitalizado  Hombre  125  Presión arterial normal alta  Sobrepeso 
No hospitalizado  Mujer  180  HTA etapa 1  Obeso Tipo III 
No hospitalizado  Mujer  360  HTA etapa 1  Sobrepeso 
No hospitalizado  Mujer  300  Presión arterial normal alta  Obeso Tipo III 
No hospitalizado  Mujer  120  HTA etapa 1  Obeso Tipo I 
No hospitalizado  Mujer  190  Presión arterial óptima  Normal 
No hospitalizado  Hombre  224  HTA etapa 1  Obeso Tipo II 
No hospitalizado  Hombre  192  Presión arterial normal alta  Obeso Tipo I 
No hospitalizado  Hombre  136  Presión arterial normal  Sobrepeso 
No hospitalizado  Hombre  66  Presión arterial óptima  Obeso Tipo I 
No hospitalizado  Mujer  183  Presión arterial normal  Sobrepeso 
No hospitalizado  Mujer  174  Presión arterial óptima  Obeso Tipo III 
No hospitalizado  Hombre  129  Presión arterial óptima  Normal 
No hospitalizado  Mujer  153  Presión arterial normal  Obeso Tipo III 
No hospitalizado  Mujer  132  HTA etapa 1  Normal 
No hospitalizado  Hombre  382  Presión arterial óptima  Obeso Tipo III 
No hospitalizado  Mujer  209  Presión arterial óptima  Obeso Tipo II 
No hospitalizado  Mujer  114  Presión arterial óptima  Sobrepeso 
No hospitalizado  Hombre  142  Presión arterial óptima  Sobrepeso 
No hospitalizado  Hombre  135  HTA etapa 1  Obeso Tipo I 
36
Ejercicio 11
Del cuadro anterior calcular la chi2 con las variables de Presión Arterial
y Hospitalizados y no Hospitalizados, tomando en cuenta los siguientes
puntos:
1. Formulación de la hipótesis de nulidad (Ho)
2. Elección del modelo estadístico
3. Especificación del nivel de significancia (α) y de la muestra (n)
4. Definición de la región de rechazo
5. Decisión
6. Conclusión
37
Capítulo 5
Corrección de Yates
Se utiliza cuando N está entre 20 y 40, la prueba y las frecuencias

observadas o esperadas sean de 5 o menores de 10. En datos de escala
nominal.
FÓRMULA:
!
!
𝑂 − 𝐸 − 0.5
𝑥 =
𝐸
O= Observados
E= Esperados
Se calculan las frecuencias observadas en una tabla de contingencia

(k) (r), usando las columnas (k) para los grupos y las filas (r) para las
condiciones.
Se determina la frecuencia esperada para cada una de las celdillas

para obtener el producto de los totales marginales comunes a ella y
dividirlo por N.
38
Ejemplo: Supóngase que resultarán los datos de la tabla 1.2.
TABLA 1.2.
Cáncer de Esperados
pulmón
Hábito de Si No Total
fumar Si No Total
Si 15 5 20 11.66 8.33 20
No 6 10 16 9.34 6.67 16
TOTAL 21 15 36 21 15 36
I. Para sacar las frecuencias esperadas (utilizando el

procedimiento de X²)
II. Despejar la fórmula.
PASOS:
1. Se resta los observados y esperados de cada celda menos 0.5 (sin
tomar en cuenta los signos).
2. Se eleva al cuadrado el resultado de la resta de observados y
esperados menos 0.5 de cada celda.
3. El resultado de la resta de observados y esperados menos 0.5
elevados al cuadrado se divide entre los esperados de cada celda.
4. Se suman los resultados de paso número tres y se obtiene la X² de
yates.
39
Paso 1 Paso 2 Paso3
O E (O-E)-0.5 [ (O-E)-0.5] ² [ (O-E)-0.5] ²/E
Celda A 15 11.6667 2.83 8.03 0.69
Celda B 5 8.33333 2.83 8.03 0.96
Celda C 6 9.33333 2.83 8.03 0.86
Celda D 10 6.66667 2.83 8.03 1.20
Paso 4
x²= 3.72
III. Buscar en la tabla con nivel de significancia de 0.05, primero se

calculan los grados de libertad.
IV. Cálculo de los grados de libertad (se multiplican las columnas (k)
menos 1 por renglones (r) menos1).
gl= (K-1) (r-1) 2-1= 2-1=1 1*1=1
Se localiza en la tabla gl=1 y con la a=0.05 (fijada con anterioridad)
siendo el valor X 2 = 3.84 (tabulada).
V. La decisión

Si p es igual o menor que a se rechaza Ho.
Por lo tanto, si 3.72 (calculada) es menor 3.84 (tabulada) se acepta la H o y

se rechaza la H 1 .
Ho: El hábito de fumar y el cáncer de pulmón son independientes

H 1 : El hábito de fumar y el cáncer de pulmón no son independientes.
VI. Conclusión
Aceptamos Ho: El hábito de fumar y el cáncer de pulmón son

independientes.
40
No hay diferencia significativa entre el hábito de fumar y el cáncer de
pulmón.
Como se muestra arriba, la corrección de Yates produce un valor de

chi cuadrada menor (X 2 =3.72) que el que se obtenía mediante la fórmula
no corregida (X 2 =5.13). Con la fórmula corregida aceptamos la hipótesis
nula, sin ella, la rechazamos.
Redacción APA
χ 2 (1, N=36)=3.74, p>.05. No se encontraron diferencias significativas entre el
hábito de fumar y el cáncer de pulmón.
41
SEXO  GLUCOSA  HTA  Estado Nutricional 
Hombre  350  Presión arterial óptima  Obeso Tipo I 
Hombre  400  Presión arterial óptima  Sobrepeso 
Hombre  369  Presión arterial óptima  Normal 
Hombre  322  Presión arterial óptima  Obeso Tipo III 
Hombre  291  HTA etapa 2  Normal 
Hombre  465  HTA etapa 1  Obeso Tipo I 
Mujer  312  HTA etapa1  Sobrepeso 
Mujer  296  Presión arterial normal  Sobrepeso 
Mujer  306  Presión arterial normal  Obeso Tipo III 
Mujer  380  HTA etapa1  Normal 
Mujer  400  HTA etapa1  Obeso Tipo I 
Mujer  180  Presión arterial normal alta  Sobrepeso 
Mujer  300  Presión arterial óptima  Obeso Tipo I 
Hombre  290  Hipertensión sistólica aislada  Sobrepeso 
Mujer  190  HTA etapa 2  Sobrepeso 
Hombre  400  HTA etapa1  Sobrepeso 
Hombre  250  Hipertensión sistólica aislada  Normal 
Mujer  256  HTA etapa 2  Normal 
Mujer  300  Presión arterial óptima  Sobrepeso 
Mujer  188  Hipertensión sistólica aislada  Sobrepeso 
Hombre  280  Hipertensión sistólica aislada  Obeso Tipo III 
Hombre  346  Presión arterial normal alta  Normal 
Hombre  250  HTA etapa1  Normal 
Mujer  400  HTA etapa1  Normal 
Mujer  190  HTA etapa1  Obeso Tipo III 
Presión arterial normal alta 
Hombre  294 
HTA etapa1  Obeso Tipo I 
Hombre  240 
HTA etapa1  Obeso Tipo II 
Mujer  318 
Presión arterial normal alta  Obeso Tipo II 
Presión arterial normal 
Presión arterial normal alta 
Hombre  314 
Presión arterial óptima  Obeso Tipo I 
Mujer  180 
Presión arterial normal  Obeso Tipo III 
HTA etapa1 
Presión arterial óptima 
42
Mujer  268  Presión arterial normal  Obeso Tipo I 
Hombre  140  Presión arterial normal alta  Obeso Tipo III 
Hombre  125  Presión arterial normal alta  Sobrepeso 
Mujer  180  HTA etapa 1  Obeso Tipo III 
Mujer  300  Presión arterial normal alta  Obeso Tipo III 
Mujer  230  HTA etapa 1  Obeso Tipo III 
Mujer  120  HTA etapa 1  Obeso Tipo I 
Mujer  190  Presión arterial óptima  Normal 
Hombre  224  HTA etapa 1  Obeso Tipo II 
Hombre  192  Presión arterial normal alta  Obeso Tipo I 
Hombre  136  Presión arterial normal  Sobrepeso 
Mujer  174  Presión arterial óptima  Obeso Tipo III 
Mujer  185  Presión arterial normal alta  Obeso Tipo III 
Mujer  182  Presión arterial óptima  Obeso Tipo III 
Mujer  153  Presión arterial normal  Obeso Tipo III 
Mujer  132  HTA etapa 1  Normal 
Mujer  209  Presión arterial óptima  Obeso Tipo II 
Mujer  114  Presión arterial óptima  Sobrepeso 
Mujer  168  Presión arterial óptima  Normal 
Hombre  135  HTA etapa 1  Obeso Tipo I 
Mujer  133  Presión arterial óptima  Obeso Tipo II 
43
Ejercicio 12
Del cuadro anterior calcular la corrección de yates de los pacientes de

diabéticos de las variables de sexo y estado nutricional normal y obeso
tipo III , tomando en cuenta los siguientes puntos:
I.Formulación de la hipótesis de nulidad (Ho)
II.Elección del modelo estadístico
III.Especificación del nivel de significancia (α) y de la muestra (n)
IV.Definición de la región de rechazo
V.Decisión
VI.Conclusion
44
Capítulo 6
Prueba de la Probabilidad Exacta

de Fisher
Se utiliza para análisis de datos nominales u ordinales y cuando las
dos muestras independientes son pequeñas (20 casos) en tablas de
contingencia de 2x2. Los grupos pueden ser experimentales y controles,
hombres o mujeres, nuños y adultos, abuelos y abuelas, tratamiento A y
tratamiento B.
FÓRMULA:
p= (A+B )! (C+D) ! (A+ C) ! (B+D) !

N ! A ! B ! C ! D
p= Prueba de la probabilidad de Fisher

Factorización Ejem. Factor de 4 es
! 4*3*2*1=24
N= Total de sujetos
DISTRIBUCIÓN EN LA TABLA DE 2X2
- +
Grupo I A B A+B
Grupo II C D C+D
Total A+C B+D N
Ejemplo:
Se realizo una investigación para evaluar la efectividad de un nuevo
tratamiento “A” para la gripe que se administró a 15 sujetos. Se desea
saber si es efectivo el tratamiento para la gripe?
45
Gripa
Tratamiento “A” Si No Totales
Si 1 8 9
No 6 0 6
Totales 7 8 15
Paso 1 Paso 1
PROCEDIMIENTO:
PASOS:
I. Sumar las celdas por columnas y renglones.
N= 15
A+B= 9
C+D= 6
A+C 7
B+D= 8
II. Sacar los factoriales de cada una de las celdas indicadas en la

fórmula.
Factorial N 1.30767E+12*
Factorial A+B 362880
Factorial C+D 720
Factorial A+C 5040
Factorial B+D 40320
Factorial A 1
Factorial B 40320
Factorial C 720
Factorial D 1
*E= Exponente , se tiene que agregar en este caso doce ceros
III. Se aplica la fórmula.
(A+B )! (C+D) ! (A+ C) !

(B+D) ! = 5.30941E+16
N ! A ! B ! C ! D = 3.79623E+19
p= 0.001398601
IV. La decisión.
Con un α de 0.05 prefijada.
46
En este caso la probabilidad (p=0.001) es menor que el nivel
seleccionado al principio (α=0.05) se rechaza H o . Y se acepta H 1 ,
(hipótesis alterna).
V. Conclusión.
Concluimos que hay una diferencia estadística entre haber usado el

tratamiento “A” y curarse de gripa.
Redacción del APA

Si hay diferencia significativa entre el tratamiento “A” y curarse de
gripa p=<.001.
47
GRUPO  SEXO  GLUCOSA  HTA  Estado Nutricional 
Hospitalizado  Hombre  400  Presión arterial óptima  Sobrepeso 
Hospitalizado  Hombre  291  HTA etapa 2  Normal 
Hospitalizado  Hombre  465  HTA etapa 1  Obeso Tipo I 
Hospitalizado  Mujer  312  HTA etapa1  Sobrepeso 
Hospitalizado  Mujer  296  Presión arterial normal  Sobrepeso 
Hospitalizado  Mujer  306  Presión arterial normal  Obeso Tipo III 
Hospitalizado  Mujer  400  HTA etapa1  Obeso Tipo I 
Hospitalizado  Mujer  180  Presión arterial normal alta  Sobrepeso 
Hospitalizado  Mujer  300  Presión arterial óptima  Obeso Tipo I 
Hospitalizado  Hombre  290  Hipertensión sistólica aislada  Sobrepeso 
Hospitalizado  Mujer  190  HTA etapa 2  Sobrepeso 
Hospitalizado  Hombre  400  HTA etapa1  Sobrepeso 
Hospitalizado  Hombre  250  Hipertensión sistólica aislada  Normal 
Hospitalizado  Mujer  256  HTA etapa 2  Normal 
Hospitalizado  Mujer  300  Presión arterial óptima  Sobrepeso 
Hospitalizado  Mujer  188  Hipertensión sistólica aislada  Sobrepeso 
Hospitalizado  Hombre  280  Hipertensión sistólica aislada  Obeso Tipo III 
Hospitalizado  Hombre  346  Presión arterial normal alta  Normal 
Hospitalizado  Hombre  250  HTA etapa1  Normal 
Hospitalizado  Mujer  190  HTA etapa1  Obeso Tipo III 
Hombre  294 
Hospitalizado  HTA etapa1  Obeso Tipo I 
Hombre  240 
Hospitalizado  HTA etapa1  Obeso Tipo II 
Mujer  318 
Hospitalizado  Presión arterial normal alta  Obeso Tipo II 
Hospitalizado  Presión arterial normal 
Hombre  314 
Hospitalizado  Presión arterial óptima  Obeso Tipo I 
Mujer  180 
Hospitalizado  Presión arterial normal  Obeso Tipo III 
Hospitalizado  HTA etapa1 
Hospitalizado  Presión arterial óptima 
48
No hospitalizado  Mujer  268  Presión arterial normal  Obeso Tipo I 
No hospitalizado  Hombre  140  Presión arterial normal alta  Obeso Tipo III 
No hospitalizado  Mujer  120  HTA etapa 1  Obeso Tipo I 
No hospitalizado  Hombre  224  HTA etapa 1  Obeso Tipo II 
No hospitalizado  Hombre  192  Presión arterial normal alta  Obeso Tipo I 
No hospitalizado  Hombre  66  Presión arterial óptima  Obeso Tipo I 
No hospitalizado  Hombre  129  Presión arterial óptima  Normal 
No hospitalizado  Mujer  153  Presión arterial normal  Obeso Tipo III 
No hospitalizado  Mujer  132  HTA etapa 1  Normal 
No hospitalizado  Mujer  114  Presión arterial óptima  Sobrepeso 
No hospitalizado  Hombre  135  HTA etapa 1  Obeso Tipo I 
49
Ejercicio 13
1. Calcular la prueba de probabilidad exacta de Fisher del cuadro

anterior, con las variables de estar hospitalizado y no hospitalizado
y el estado nutricional de normal y obeso tipo I. Tomando en cuenta
los siguientes puntos:
V.Decisión
VI.Conclusion
50
Capítulo 7
Regresión Lineal Simple
El análisis de regresión simple es una técnica estadística de análisis
bivariado, que estudia la relación de una variable cuantitativa continua,
en función de una variable cuantitativas continuas.
La variable cuya variabilidad queremos estudiar es la variable

dependiente o respuesta (Y), y las variables en función de las cuales varía
son las variables independientes (X), también llamadas variables
predictoras (permite predecir resultados o lleva a hacer pronósticos).
El objetivo de análisis de regresión es predecir los valores de la

variable dependiente, en función de los valores de las variables
independientes.
La regresión lineal simple tiene una sola variable independiente.

Por ejemplo, si queremos estudiar la dependencia de los valores de la
presión arterial sistólica (variable independiente), en relación la presión
arterial diastólica (variable dependiente), al hacer una sola variable
independiente, la regresión es simple.
Atendiendo al número de variables independientes, la regresión

puede ser simple (cuando se tiene una sola variable independiente) o
múltiple (cuando hay más de dos variables independiente por ejemplo;
edad, peso y talla).
Otra característica que debe tenerse en cuenta en la clasificación de

la regresión es la función. Si la dependencia funcional de la variable
respuesta (dependiente) respecto a las variables independientes es lineal,
la regresión es lineal.
51
En este tipo de análisis de regresión hay una sola variable independiente
y la dependencia de la variable respuesta respecto a la predictora sigue
una función lineal.
“Y” es la variable dependiente la cual se coloca en línea vertical de la

gráfica y, “X” es la variable independiente la cual se representa en la
línea horizontal de la gráfica. Este tipo de gráfica se denomina diagrama
de dispersión
Y
Las gráficas que a continuación se presentan son ejemplos de Diagramas

de Dispersión para relaciones que son positivas, negativas o cero.
Positiva Negativa Cero

Y 
Y 
Y 
X  X 
X 
Y más altos X más Altos No está clara la tendencia
52
Fórmula:
b̂ =
"( x ! x ) ( y ! y )
i i
2
" (x ! x ) i
x i =Observación (de la variable independiente)
y i = Observación (de la variable dependiente)
x= Media (de la variable independiente)
Ῡ= Media (de la variable dependiente)
Hipótesis de la Regresión Lineal Simple
La hipótesis en regresión simple es que existe asociación lineal

entre la variable dependiente y la variable independiente. Si existe
asociación lineal, el coeficiente de regresión lineal debe ser
significativamente distinto de cero.
Las hipótesis en este caso son las siguientes:
H o = β=0
H i = β≠0
Una manera de resolver el contraste de hipótesis anterior, es

teniendo en cuenta que si b es igual a cero, sigue una distribución t de
Student con n-2 grados de libertad, y la siguiente fórmula es la que se
utiliza para comprobar la hipótesis.
53
Fórmula para comprobar hipótesis :
r n!2
t=
1! r 2
t= t de student
n= número de datos
r= correlación de Pearson
r 2 =coeficiente de determinación indica la fuerza de asociación lineal entre

dos variables 0 y 1 ,0 =ausencia , 1= relación lineal perfecta.
Fórmula para correlación de Pearson:
!!!
𝑟=
!!
b= regresión lineal
S x = desviación estándar de x
S y = desviación estándar de y
Ejemplo:
Considere que son pocos datos(es solo para calcular la formula del
ejemplo), y la regresión lineal simple se debe de utilizar con una muestra
mínima de 30.

No hay relación entre la edad y la glucosa de pacientes diabéticos
hospitalizados en urgencias con alfa de 0.05.
54
Regresión lineal Simple porque son variable cuantitativas
b̂=
"(x !x)(y !y)
i i
2
" (x !x) i
a. Cálculo de la regresión lineal
Resultados
Edad Glucosa
(x i - x)(y i - (x i -
X Y (x i - x) (yi‐ӯ) ӯ) x) 2 (yi‐ӯ) 2
55 350 -5 14.1 -63 20 199
64 290 5 -45.9 -207 20 2107
62 369 3 33.1 83 6 1096
63 300 4 -35.9 -126 12 1289
63 291 4 -44.9 -157 12 2016
57 465 -3 129.1 -323 6 16667
26 312 -34 -23.9 801 1122 571
75 296 16 -39.9 -618 240 1592
67 306 8 -29.9 -224 56 894
63 380 4 44.1 154 12 1945
-680.50 1509 28375
x= 59.5
Ῡ= 335.90
Σ(yi-ӯ) 2 = 28374.90
Σ(x i - x) 2 1509
Σ(x i - x)(y i -
ӯ)= -681
b= -0.451
El valor del coeficiente de regresión (b) indica que por cada año que
aumenta la edad la glucosa disminuye en -0.45 mg/dl en pacientes con
diabetes mellitus que están hospitalizados en urgencias.

Se elige un alfa de 0.05 y la muestra para este ejemplo es de diez (la
regresión se aplica con mayor a 30).
55
b) Comprobar la hipótesis, es a través de la formula de “t”.
r n!2
t=
1! r 2
Lo primero es obtener “r”, la Fórmula para correlación de Pearson es la
b̂Sx 𝜮 (𝑿𝒊! 𝒙)𝟐
siguiente: r = 𝑺 =
Sy 𝒏!𝟏
Pasos para obtener “r”:

b= regresión lineal simple
S x = Desviación estándar de la “x” Σ(yi-ӯ) 2 = 28374.90/n-1 y la raíz
cuadrada del resultado
S y = Desviación estándar de la “y” Σ(x i - x) 2 =1509/n-1 y la raíz cuadrada
del resultado
Resultados:
Sy= 56.15
Sx= 12.95
bS x -5.8
r= -0.10
Segundo es calcular la “t” y la fórmula es la siguiente:
r n!2
t=
1! r 2
n-2= 8
√n-2= 2.83
r√ n-2= -0.29
r²= 0.01 coeficiente de determinación
1-r²= 0.99
√1-r²= 0.99
t= -0.30
c. Buscar en la tabla B con nivel de significancia de 0.05, primero se

calculan los grados de libertad.
56
d. Cálculo de los grados de libertad
gl=n-2
10-2=8
Se localiza en la tabla B, gl=8 y con la a=0.05 (fijada con anterioridad)
siendo el valor t= 2.306 (tabulada).
V. La decisión

Si p es igual o menor que a se rechaza H o .
Por lo tanto, si 0.30 (calculada) es menor 2.306 (tabulada) se acepta la H o

y se rechaza la H 1 .
Ho: La edad y la glucosa no tienen relación

H 1 : La edad y la glucosa si tienen relación
VI.Conclusión
Aceptamos Ho: La edad y la glucosa no tienen relación

e. Describir el coeficiente de determinación
El coeficiente de determinación R 2 indica la fuerza de la asociación lineal

entre dos variables. Puede tener valores entre cero y uno, 0 =ausencia,
1= relación lineal perfecta y multiplicado por cien , indica el porcentaje de
las variaciones de la variable dependiente que explica el modelo.
Se obtiene de elevar al cuadrado la correlación (r).
(-0.10) 2 = 0.01 y multiplicado por 100 es igual a 1
El 1% de la variabilidad de la glucosa explica el modelo de regresión
57
Redacción APA:
Estimamos la regresión lineal simple de la edad sobre la glucosa y probamos la
hipótesis de que la edad no está negativamente relacionada con la glucosa.
Encontramos que la pendiente β=-0.45, t(8)=-0.30, p>.05 no fue estadísticamente
significativa y por tanto rechazamos la hipótesis de relación lineal entre edad y
glucosa. El valor de R 2 fue de .0.01 indicando que aproximadamente un decimo de
la variabilidad de la edad es explicada por la glucosa.
58
Presión arterial de diabéticos hospitalizados
Presión arterial Presión arterial

Sistólica Diastólica
100 90
80 70
110 90
110 85
160 90
150 92
140 70
125 65
120 60
140 80
140 90
130 80
110 80
110 70
200 85
179 90
146 83
250 100
175 100
115 50
200 80
100 80
110 70
210 80
95 57
130 70
140 100
148 105
114 50
140 90
130 90
140 90
140 80
130 85
120 70
130 80
110 60
120 70
155 80
110 70
59
Ejercicio 14
Del cuadro anterior calcule la regresión Lineal de las variables de presión

arterial sistólica y diastólica

Calculo de b=

Utilizar t=
V.Decisión
VI.Conclusion
60
Capítulo 8
Correlación
La asociación entre dos variables cuantitativas, aun siendo

significativa, puede ser fuerte o débil. El coeficiente de determinación (r)
nos indica la fuerza de la asociación lineal entre dos variables. Esta
prueba estadística, puede tomar valores entre 0 y 1. Un valor cero indica
ausencia de asociación entre las dos variables y un valor de uno indica
una asociación perfecta. Este estadístico, multiplicado por cien, indica el
porcentaje de las variaciones de la variable dependiente que explica el
modelo.
Fórmula:
"( x ! x ) ( y ! y )
i i
𝒓= 2 2
"( x ! x ) "( y ! y )
i i
x i =Observación (de la variable independiente)
y i = Observación (de la variable dependiente)
x= Media (de la variable independiente)
Ῡ= Media (de la variable dependiente)
61
Interpretación de la correlación
El coeficiente de correlación se encuentran generalmente entre -

1,00 y + 1,00 como sigue:
- 1.00 correlación negativa perfecta
- 0.95 correlación negativa fuerte
-0.50 correlación negativa moderada
- 0.10 correlación negativa débil
0.00 ninguna correlación
+ 0.10 correlación positiva débil
+ 0.50 correlación positiva moderada
+ 0.95 correlación positiva fuerte
+ 1.00 correlación positiva perfecta
Con respecto al grado de asociación, mientras más cerca esté de

1,00, en una u otra dirección, mayor es la fuerza de correlación.
Ejemplo
Se desea saber la fuerza de asociación que se tiene entre la edad y la

glucosa de pacientes diabéticos hospitalizados en urgencias. Considere
que son pocos datos(es solo para calcular la formula), y la correlación se
debe de utilizar con una muestra mínima de 30.
Pasos:
1. Obtener la media de la x
2. Obtener la media de la y
3. Obtener la diferencia de cada observación de “x” con su media
62
4. Elevar al cuadrado el paso tres.
5. Obtener la diferencia de cada observación de “y” con su media
6. Elevar al cuadrado el paso cinco
7. Multiplicar el paso tres y cinco
8. Sumar los resultados de paso siete
9. Sumar el resultado de paso tres
10. Sumar los resultados de paso cuatro
11. Raíz cuadrada del resultado del paso nueve
12. Raíz cuadrada del resultado del paso diez
13. Multiplicar el resultado del paso nueve con resultado del paso once
14. Dividir el paso ocho con el paso trece
Resultados:
Edad Glucosa
(x i - (x i - (yi- (x i -
X Y x) x) 2 (yi-ӯ) ӯ) 2 x)(y i -ӯ)
55 350 -5 20 14.1 199 -63
64 290 5 20 -45.9 2107 -207
62 369 3 6 33.1 1096 83
63 300 4 12 -35.9 1289 -126
63 291 4 12 -44.9 2016 -157
57 465 -3 6 129.1 16667 -323
26 312 -34 1122 -23.9 571 801
75 296 16 240 -39.9 1592 -618
67 306 8 56 -29.9 894 -224
63 380 4 12 44.1 1945 154
Paso Paso Paso Paso
3 4 5 6 Paso 7
Paso 1 x= 59.5
Paso 2 Ῡ= 335.9
Paso 8 Σ(x i - x)(y i -ӯ)= -681 Numerador
Paso 9 Σ(x i - x) 2 1509
Paso 10 Σ (y i -ӯ) 2 = 28375
Paso 11 √Σ (x i -x) 2 = 39
Paso 12 √Σ (y i -ӯ) 2 = 168
Paso 13 √Σ (x i - x) 2 √Σ(x i - x) 2 = 6542.4 Denominador
Paso 14 r= -0.10
63
La variable dependiente es la glucosa y la variable independiente la
edad, un coeficiente de determinación de -.10, significa que el -10% de las
variaciones observadas de la glucosa son explicables por las variaciones
de la edad. Es una fuerza de asociación negativa débil.
Un método simplificado para comprobar la significancia de r
Afortunadamente, el proceso que se ilustró anteriormente para comprobar

la significancia de la r de Pearson ha sido simplificado, de manera que es
innecesario calcular realmente una razón t. En lugar de esto vamos a la
Tabla C de la parte final del texto, donde encontramos un lista de valores
significativos de la r de Pearson para los niveles de confianza de 0.05 y
0.01 con el número de grados de libertad de 1 a 90.
Si el coeficiente de correlación de Pearson calculado es menor que el valor

correspondiente en la tabla, debemos aceptar la hipótesis nula de que r=0.
Los grados de libertad de coeficiente de correlación de Pearson es n-2.
Observando la tabla C, al final del texto, encontramos al nivel de

confianza de 0,05 con 8 grados de libertad el valor de r de .6664. Por lo
tanto, el coeficiente de correlación de -.10 es menor que el valor de la
tabla, lo cual se acepta la hipótesis nula, no hay asociación entre la edad
y la glucosa.
Redacción APA
Para escribir correlaciones en un documento científico o bien la incluimos en una
tabla (matriz) si son muchas o bien escribimos r con los grados de libertad entre
paréntesis seguido del valor y la significación. Por ejemplo: “r(8)=-.10, p>.05”.
64
Presión arterial de diabéticos hospitalizados
Presión arterial Presión arterial

Sistólica Diastólica
100 90
80 70
110 90
110 85
160 90
150 92
140 70
125 65
120 60
140 80
140 90
130 80
110 80
110 70
200 85
179 90
146 83
250 100
175 100
115 50
200 80
100 80
110 70
210 80
95 57
130 70
140 100
148 105
114 50
140 90
130 90
140 90
140 80
130 85
120 70
130 80
110 60
120 70
155 80
110 70
65
Ejercicio 15
Del cuadro anterior calcular la correlación de las variables de presión

arterial sistólica y diastólica
V.Decisión
VI.Conclusion
66
REFERENCIAS BIBLIOGRAFICAS
Álvarez Cáceres, R. (2007). Estadísticas aplicada a las ciencias de la
salud. España: Díaz de Santos.
APA. (2012). Manual de Publicaciones American Psychological Association (6ta
ed.). (Zavala. S. Trad.) México: El Manual Moderno.
Dawson, B., & Trapp, R. G. (2002). Bioestadística médica. México: Manual
Moderno.
Gardner, R. C. (2003). Estadística para Psicología Usando SPSS para
Windows. México. D.F.: Prentice Hall.
García de Alba, E. (1995). Estadística para el equipo del área de la salud.
Guadalajara: Universidad de Guadalajara.
Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P.
(1999). Metodología de la investigación. México, D.F.: Mc Graw Hill.
Maza Cabrera, M., Zavala Gutiérrez, M., & Merino Escobar, J. (2009).
Actitud profesional de enfermería ante la muerte de pacientes. Cien.
Enferm. (online) , 39-48.
Organización Panamericana de la Salud. (1986). Manual sobre el enfoque
de riesgo en la atención materno infantil. Washington: Organización
Panamericana de la Salud.
Peña, D., & Romo, J. (1997). Introducción a la Estadística para la
Ciencias Sociales. Madrid: Mc Graw Hill.
67
Polit, D., & Hungler, B. (2000). Investigación Científica en Ciencias de la
Salud. México,D.F: Mc Graw Hill.
Rebagliato, M. (1996). Población del estudio. Técnicas de muestreo y
tamaño de la muestra. En M. Rebagliato, I. Ruiz, & M. Arranz,
Metodología de Investigación en Epidemiología (págs. 73-94). Madrid:
Díaz de Santos.
Salkind, N. (1998). Métodos de Investigación. México, D.F: Prentice Hall.
Wayne W., D. (1988). Estadística con aplicaciones a las ciencias sociales y
a la educación. México, D.F. : Mc Graw Hill.
68
RESPUESTAS EJERCICIOS
Capítulo 1
Ejercicio 9
n=1,294
El resultado se redacta:
El cálculo del tamaño de la muestra (n) se basó en la fórmula de
Z 2 *p*q*N / d 2 *N+ Z 2 *p*q, donde: z= 2.27 (para el 99% de confianza);
d=0.01 (precisión); p=0.02 (proporción estimada de "presencia de
Intoxicación por picadura de alacrán") y q=0.98 (proporción estimada de
"ausencia"). Sobre la base de la ecuación mencionada, el tamaño de la
muestra fue de 1,294 Intoxicados por picadura de alacrán.
Casos de Diabetes Mellitus en municipios de Jalisco

Municipio Total de Casos % n
Jamay 70 0.45 7
Ocotlán 469 1.81 26
Jocotepec 204 1.01 14
Poncitlán 135 0.64 9
Zapopan 6293 1.97 30
FUENTE: SUIVE-2010
69
Capítulo 3
Ejercicio 10
Calculada Tabulada Hipótesis Alfa (α) p Correcta

de escribir
Hipótesis
p
3.84 3.84 Ho .05 .05 .05 Ho
5.9 8.22 Ho .05 .04* .04* H1
1.50 2.73 Ho .01 .000 <.001** Ho
8.3 1.24 H1 .01 .01 .01 Ho
*p<.05  **p<.01
Tabulada Calculada Hipótesis p Alfa Hipótesis

(α)
3.84 3.84 Ho .05 .05 Ho
5.9 8.22 H1 .05 .04 Ho
1.50 2.73 H1 .01 .01 Ho
8.3 1.24 Ho .01 .01 Ho
Capítulo 4
Ejercicio 11

No hay diferencias significativas entre estar hospitalizado y la
Hipertensión
II. Elección del modelo estadístico, de acuerdo a variables,

muestra e hipótesis
Se elige Chi cuadrado de 2X6 , por tener mas de cuarenta
casos
Hipertensión Hospitalizado No Hospitalizado Total
Hipertensión sistólica
aislada 4 0 4
HTA etapa 1 11 9 20
HTA etapa 2 3 0 3
Presión arterial óptima 13 13 26
Presión arterial normal 4 7 11
Presión arterial normal
alta 5 11 16
Total 40 40 80
70
III. Especificación del nivel de significancia (α) y de la muestra
(n).
El alfa es de 0.05 y el tamaño de la muestra de cuarenta.

X 2 = 10.268 (calculada) gl= 5, tabulada 11.07. p=.068
V. Decisión
Se acepta la hipótesis nula (Ho).
VI. Conclusión
No hay diferencias significativas entre estar hospitalizado y no
hospitalizado con la Hipertensión de los pacientes diabéticos.
Redacción APA
χ 2 (5, N=40)=10.2, p >.05. No se encontraron diferencias significativas entre estar
hospitalizado y no hospitalizado con la hipertensión de los pacientes diabéticos.
Capítulo 5
Ejercicio 12

No hay diferencia estadística entre sexo y el estado
nutricional normal y obeso tipo I.
II. Elección del modelo estadístico, de acuerdo a variables
Corrección de Yates, por tener muestra 31 y no esperados
menor de 5.
71
Estado Nutricional
Obeso Tipo
Normal III Total
Hombre Observado 9 6 15
Sexo Esperado 7,3 7,7 15,0
Mujer Observado 6 10 16
Esperado 7,7 8,3 16,0
Total Observado 15 16 31
Esperado 15 16 31
III.Especificación del nivel de significancia (α) y de la muestra (n).

El alfa es de 0.05 y el tamaño de la muestra de 31.
IV.Definición de la región de rechazo.

X 2 = 0.79 (calculada) gl= 2, tabulada 3.84. p=0.37
V.Decisión
Se acepta la hipótesis nula (Ho).
VI.Conclusión
No hay diferencia estadística entre sexo y el estado nutricional normal y
obeso tipo I de los pacientes diabéticos.
Redacción APA
χ 2 (2, N=40)=0.79, p >.05. No se encontraron diferencias significativas entre sexo
y el estado nutricional normal y obeso tipo I de los pacientes diabéticos.
Capítulo 6
Ejercicio 13

No hay diferencias significativas entre estar hospitalizado y no
hospitalizado y el estado nutricio de normal y obeso tipo I.
72
II. Elección del modelo estadístico, de acuerdo a variables,
muestra e hipótesis
Prueba de probabilidad de Fisher, por tener celdas observadas
menores de 5.
Hospitalizado Estado Nutricio

Normal Obeso Tipo I Total
Si 11 8 19
No 4 5 9
Total 15 13 28
p= .396
III. Especificación del nivel de significancia (α) y de la muestra

(n).
El alfa es de 0.05 y el tamaño de la muestra de 28.

La p=.396 es menor de α=0.05
V. Decisión
Se acepta la hipótesis Ho
VI: Conclusión
No hay diferencias significativas entre estar hospitalizado y
no hospitalizado con el estado nutricional de los pacientes
diabéticos.
Capítulo 7
Ejercicio 14

No hay relación significativa en presión arterial sistólica y diastólica
73
Regresión lineal por ser variables cuantitativas y mayor de 30 y por la
hipótesis de relación entre las variables

Alfa==.05 y una muestra de 40
x= 136.55
0.19
Ῡ= 79.43 b= 4
S(x i - x)(y i -ӯ)= 8839 r= 0.49
S(x i - x) 2 45646
S(yi-ӯ) 2 = 6993.78 SS t o t a l r= 0.49
Sy= 13.39 n-2= 38
Sx= 34.21 √n-2= 6.16
(Ŷ -Ῡ) 2 = 1711.47 SS r e g r e s i ó n r√ n-2= 3.05
(Ῡ-Ŷ ) 2 = 5282.30 SS r e g r e s i ó n r²= 0.24
1-r²= 0.76
n-1= 39 √1-r²= 0.87
a=Y-bx= 52.984
t= 3.51
El valor del coeficiente de regresión (b) indica que por cada mm de

mercurio que aumenta la presión arterial sistólica, la presión arterial
diastólica aumenta en 0.194 mm de mercurio en pacientes con diabetes
mellitus que están hospitalizados en urgencias.
V.Decisión
gl=n-2=38
t= 3.51 (Calculada) t= 2.021 (Tabulada) p=0.001
74
Se acepta la hipótesis alterna (Hi) es mayor la calcula de la
tabulada
VI.Conclusión
Si hay relación significativa en presión arterial sistólica y diastólica
entre los pacientes diabéticos hospitalizados en urgencias
Capítulo 8
Ejercicio 15

No hay fuerza de asociación significativa en presión arterial sistólica y
diastólica

Correlación de Pearson por ser variables cuantitativas y mayor de 30 y
por la hipótesis de fuerza de asociación entre las variables

Alfa==.05 y una muestra de 40

x= 136.55
Ῡ= 79.4
Σ(x i - x)(y i -ӯ)= 8839 Numerador r= 0.49
Σ(x i - x) 2 45646
Σ(yi‐ӯ) 2 = 6994 r*100 49%
√Σ(xi‐x) 2 = 214
√Σ(yi‐ӯ) 2 = 84
Σ(x i - x) 2 √Σ(xi- x) 2 = 17867.2 Denominador
V.Decisión
gl=n-2=38
75
r= .49 multiplicado por 100=49%
Significa que el 49% de las variaciones observadas de la presión arterial
diastólica son explicables por las variaciones de la presión arterial
sistólica. Es una fuerza de asociación positiva moderada
r= 0.49 5(Calculada) r= .3044(Tabulada) p=0.001

Se acepta la hipótesis alterna (Hi) es mayor la calcula de la tabulada
VI.Conclusión
Si hay fuerza de asociación significativa en presión arterial sistólica y
diastólica entre los pacientes diabéticos hospitalizados en urgencias
Redacción APA
Para escribir correlaciones en un documento científico o bien la incluimos en una
tabla (matriz) si son muchas o bien escribimos r con los grados de libertad entre
paréntesis seguido del valor y la significación. Por ejemplo: “r(38)=-.49, p<.05”.
76
GLOSARIO
Abscisa: Coordenada horizontal en un plano cartesiano rectangular,

expresada como la distancia entre un punto y el eje vertical.
Aleatorio: Perteneciente o relativo al juego de azar.
Análisis: Parte de las matemáticas basada en los conceptos de límite,

convergencia y continuidad, que dan origen a diversas ramas: cálculo
diferencial e integral, teoría de funciones, etc.
Caso: Proceso morboso individual, especialmente de los no habituales.
Censo: Padrón o lista de la población o riqueza de una nación o pueblo.
Cociente: Resultado que se obtiene al dividir una cantidad por otra, y que
expresa cuántas veces está contenido el divisor en el dividendo.
Criterio: Norma para conocer la verdad.
Cuartil: Cualquiera de los percentiles 25, 50 ó 75.
Datos: Son los valores cualitativos o cuantitativos mediante los cuales se

miden las características de individuos los objetos, sucesos a estudiar.
Denominador: En los quebrados, número que expresa las partes iguales en

que la unidad se considera dividida. Se escribe debajo del numerador y
separado de este por una raya horizontal. En los cocientes de dos
expresiones o términos, el que actúa como divisor.
Frecuencia: Número de veces de los datos.
77
Fuente: Material que sirve de información a un investigador o de
inspiración a un autor.
Hipótesis: que se establece provisionalmente como base de una

investigación que puede confirmar o negar la validez de aquella.
Incidencia: Número de casos ocurridos.
Intervalo: Conjunto de los valores que toma una magnitud entre dos
límites dados. Intervalo de temperaturas, de energías, de frecuencias.
Método: Procedimiento que se sigue en las ciencias para hallar la verdad

y enseñarla.
Morbilidad: Proporción de personas que enferman en un sitio y tiempo

determinado
Numerador: Guarismo que señala el número de partes iguales de la

unidad contenidas en un quebrado. Se escribe separado del denominador
por una raya horizontal o inclinada. En los cocientes de dos expresiones o
términos, guarismo que actúa como dividendo.
Población: Es el conjunto de individuos u objetos que tienen la

característica de interés
Parámetro:
Variable que en una familia de elementos, sirve para identificar cada uno
de ellos mediante su valor numérico.
Percentil: Valor que divide un conjunto ordenado de datos estadísticos de

forma que un porcentaje de tales datos sea inferior a dicho valor. Así, un
78
individuo en el percentil 80 está por encima del 80% del grupo a que
pertenece.
Rango: Amplitud de la variación de un fenómeno entre un límite menor y

uno mayor claramente especificados.
Riesgo: Contingencia o proximidad de un daño.
Serie: Expresión de la suma de los infinitos términos de una sucesión.

Serie en
que la suma de sus términos se aproxima cada vez más a una determinada
cantidad. ej., 1/2 + 1/4 + 1/8 + 1/16..., se acerca progresivamente a valer 1,
sin llegar nunca. Serie en que la suma de sus términos tiende al infinito.
La significancia estadística
Es el número, llamado p-valor, que te dice la probabilidad de que tu resultado sea
observado, dado que ciertos supuestos (la hipótesis nula) son verdaderos. Si el p-
valor es suficientemente pequeño, el experimentador puede asumir con seguridad
que la hipótesis nula es falsa.
Tablas de contingencia
Se trata de tablas en cuyas celdas figuran probabilidades, y en la cual
podemos determinar unas probabilidades conociendo otras de la tabla.
Teoría: Conocimiento especulativo considerado con independencia de toda

aplicación. Serie de las leyes que sirven para relacionar determinado
orden de fenómenos. Hipótesis cuyas consecuencias se aplican a toda una
ciencia o a parte muy importante de ella.
79
FORMULARIO
Número
Fórmula
de página
X=
! x
N
𝑵+𝟏
𝑴𝒅 =
𝟐
𝒏
𝟐 − 𝒄
𝑴𝒅 = 𝑳 + 𝒊
𝒇
𝟏
𝑴𝒐 = 𝑳𝟏 ! (𝒊)
𝟏 + 𝟐
𝜮 𝒇𝒙𝒊
𝒙 =
𝜮 𝒇
S=
! (xi " x )2
n "1
2
(O ! E)
X ="
2
80
Número
Fórmula
de página
𝑍! 𝑝 ∗ 𝑞
𝑛=
(𝑑)!
𝑛=
(𝑑)! 𝑁 + 𝑍 ! (𝑝 ∗ 𝑞)
!
(𝑂 − 𝐸)!
𝑥 =
𝐸
!
!
𝑂 − 𝐸 − 0.5
𝑥 =
𝐸
p= (A+B )! (C+D) ! (A+ C) ! (B+D) !

N ! A ! B ! C ! D
b̂ =
"( x ! x ) ( y ! y )
i i
2
# ( xi ! x )
"( x ! x ) ( y ! y )
i i
𝒓= 2 2
"( x ! x ) "( y ! y )
i i
81
Apéndice
TABLA A. Distribución Chi Cuadrada
gl 0.05 0.01
1 3.84 6.63
2 5.99 9.21
3 7.81 11.34
4 9.49 13.28
5 11.07 15.09
6 12.59 16.81
7 14.07 18.48
8 15.51 20.09
9 16.92 21.67
10 18.31 23.21
11 19.68 24.72
12 21.03 26.22
13 22.36 27.69
14 23.68 29.14
15 25.00 30.58
16 26.30 32.00
17 27.59 33.41
18 28.87 34.81
19 30.14 36.19
20 31.41 37.57
21 32.67 38.93
22 33.92 40.28
23 35.17 41.63
24 36.41 42.98
25 37.65 44.31
26 38.88 45.64
27 40.11 46.96
28 41.33 48.27
29 42.55 49.58
30 43.77 50.89
82
TABLA B. Distribución t-Student
Gl 0.05 0.02 0.01

1 12.706 31.821 63.657
2 4.303 6.965 9.925
3 3.182 4.541 5.841
4 2.776 3.747 4.604
5 2.571 3.365 4.032
6 2.447 3.143 3.707
7 2.365 2.998 3.499
8 2.306 2.896 3.355
9 2.262 2.821 3.250
10 2.228 2.764 3.169
11 2.201 2.718 3.106
12 2.179 2.681 3.055
13 2.160 2.650 3.012
14 2.145 2.624 2.977
15 2.131 2.602 2.947
16 2.120 2.583 2.921
17 2.110 2.567 2.898
18 2.101 2.552 2.878
19 2.093 2.539 2.861
20 2.086 2.528 2.845
21 2.080 2.518 2.831
22 2.074 2.508 2.819
23 2.069 2.500 2.807
24 2.064 2.492 2.797
25 2.060 2.485 2.787
26 2.056 2.479 2.779
27 2.052 2.473 2.771
28 2.048 2.467 2.763
29 2.045 2.462 2.756
30 2.042 2.457 2.750
40 2.021 2.423 2.704
60 2.000 2.390 2.660
120 1.980 2.358 2.617
¥ 1.960 2.326 2.576
83
TABLA C. Valores de la r a los Niveles de Confianza
Gl .05 .01
1 .99692 .999877
2 .95000 .990000
3 .8783 .95873
4 .8114 .91720
5 .7545 .8745
6 .7067 .8343
7 .6664 .7977
8 .6319 .7646
9 .6021 .7348
10 .5760 .7079
11 .5529 .6835
12 .5324 .6614
13 .5139 .6411
14 .4973 .6226
15 .4821 .6055
16 .4683 .5897
17 .4555 .5751
18 .4438 .5614
19 .4329 .5487
20 .4227 .5368
25 .3809 .4869
30 .3494 .4487
35 .3246 .4182
40 .3044 .3932
45 .2875 .3721
50 .2732 .3541
60 .2500 .3248
70 .2319 .3017
80 .2172 .2830
90 .2050 .2673
84
TABLA D. Números Aleatorios
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
5484 3900 3485 0741 9069 5920 4326 7704 6525 1249
7227 0104 4141 1521 9104 5563 1392 8238 4882 2324
8506 6348 4612 8252 1062 1757 0964 2983 2244 7654
5086 0303 7423 3298 3979 2831 2257 1508 7642 1245
3690 2492 7171 7720 6509 7549 2330 5733 4730 4534
0813 6790 6858 1489 2669 3743 1901 4971 8280 0835
6905 7127 5933 1137 7583 6450 5658 7678 3444 3754
8387 5323 3753 1859 6043 0294 5110 6340 9137 6323
4094 4957 0163 9717 4118 4276 9465 8820 4127 0202
4951 3781 5101 1815 7068 6379 7252 1086 8919 2093
9047 0199 5068 7447 1664 9278 1708 3625 2864 0204
7274 9512 0074 6677 8676 0222 3335 1976 1645 3203
9192 4011 0255 5458 6942 8043 6201 1587 0972 0243
85
ESTADÍSTICA DESCRIPTIVAPARA PROFESIONALES DE LA SALUD
UNIVERSIDAD DE GUADALAJARA
Centro Universitario de Tonalá
División de Ciencias de la Salud
Departamento de Ciencias Biomédicas
Av. Nuevo Periférico No. 555 Ejido San José Tatepozco
C.P. 48525, Tonalá Jalisco México
Compilador:
Dra. Genoveva Rizo Curiel
TIRAJE: 500 EJEMPLARES
86

Libro Estadistica Inferencial 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Libro Estadistica Inferencial 1

Cargado por

Copyright:

Formatos disponibles

La presentación y disposición en conjunto de

ESTADISTICA INFERENCIAL PARA PROFESIONALES DE LA SALUD

Son propiedad de la UNIVERSIDAD DE GUADALAJARA

Centro Universitario de Ciencias de la Salud

Departamento de Salud Pública

Av. Sierra Nevada 950 Edificio N, Colonia Independencia.

C.P. 44340 Guadalajara, Jalisco México.

Fecha: 12 de enero de 2013

El libro "Estadistica para profesionales de la Salud", escrito por la

Para el efecto hace un recuento de los principales medidas que se

Aunque un libro nunca puede igualar la riqueza de la tutoria

No omito felicitar a la Dra. Genoveva por su iniciativa, y

Cuando se analizan a todos los sujetos de una población se tiene un

Para determinar el tamaño de la muestra debe tomarse en consideración los

El nivel de confianza (MC) corresponde a la probabilidad de que la

En este punto existe una interrogante ¿De donde será obtenida la

A partir de la consideración de la distribución de la campana de

Distribución según la ley de probabilidad de la campana de Gauss

Certeza(MC) muestreo (d) Estándar (S) Valor “Z”

99 % 1% o sea * 0.01 ±3 2.57

95% 5% o sea * 0.05 ±2 1.96

68% --------------- ±1 1.64

*El porcentaje se convierte a decimales (1 entre 100 = 0.01) porque se

g)La información que se disponga del fenómeno a investigar

De lo anterior se generan las siguientes tres reglas:

A mayor variabilidad Mayor tamaño de la muestra

A mayor precisión Mayor tamaño de la muestra

A mayor margen de certeza Mayor tamaño de la muestra

Para calcular el tamaño de la muestra en estudios descriptivos y/o

Para la “población infinita” no existe límite en el número de

z= variabilidad (se elige de acuerdo a la campana de Gauss)

1. La “Población finita” tiene un número definido de individuos

Se investiga en la ciudad de Guadalajara la diabetes mellitus, de

p= 0.011 1.96 2 (0.011*0.989)(9,826)

z= 1.96 (.05) 2 9,826 + 1.96 2 (0.011)(0.989)

d 2 = 0.0025 3.8416 (0.011) (9,826)

z 2 = 3.8416 (0.0025) 2 9,826+3.8416 (0.011)

Z 2 *p*q*N= 410.6 410.6

d 2 *N= 24.57 n=17 enfermos con diabetes que

Z 2 *p*q= 0.042 estudiar

d 2 *N+ Z 2 *p*q= 24.61

Casos de Diabetes Mellitus en municipios de Jalisco

Ocotlán 469 1.81

Jocotepec 204 1.01

Poncitlán 135 0.64

Zapopan 6293 1.97

Se pretende obtener una muestra de la población de Jalisco de

Determine el tamaño de la muestra

Redacte el resultado de la ecuación.

Hay dos tipos de muestreos:

Tipos de muestreos probabilísticos:

Aleatorio Simple Sistemático

2. Conseguir un listado de los Se tiene que listar los 9,826 enfermos

4.Elegir un número aleatorio a Se sorteo entre los primeros 578

Muestreo por conglomerados:

Población Total N= 9826

Total de Población del Muestra del

3. Números aleatorios o números random

Es aquel utilizado en forma empírica, es decir, no se efectúa bajo

Consideraciones para utilizar un muestreo no probabilístico:

• Cuando se pretende estudiar una población rara o marginal

Tipos de muestreo no probabilístico

I. Formulación de la hipótesis de nulidad (Ho).

Z 2 pq*N= 410.6 410.6

Z 2 pq= 0.042 estudiar

d 2 N+ Z 2 p*q= 24.61

A B Tr 1 Tr 1 = A+B TK 1 Tr 1 /N TK 2 Tr 1 /N

GRUPO  SEXO  GLUCOSA  HTA  Estado Nutricional