Está en la página 1de 49

INFERENCIA ESTADÍSTICA

PROBABILIDAD
Es la característica de un suceso del que existen
razones para creer que se realizará o ocurrirá

Frecuencia relativa

0y1

0 = Imposible

1 = Tiene que ocurrir


PROBABILIDAD

DISTRIBUCIÓN DE PROBABILIDAD

Distribución teórica de frecuencias


Describe como se espera que varíen los resultados

Discreto Continuo

Distribución uniforme
• Distribución uniforme Distribución normal (gaussiana)
• Distribución binomial Distribución gamma
• Distribución binomial negativa Distribución exponencial
• Distribución Poisson Distribución Pareto
• Distribución geométrica Distribución ji-cuadrada
• Distribución hipergeométrica Distribución t de Student
• Distribución zeta Distribución Laplace
Distribución beta
Distribución de Cauchy
Distribución F de Snedecor - Fisher
PROBABILIDAD

DISTRIBUCIÓN NORMAL
Gauss o Distribución gaussiana

• Simétrica
• Limite de otras

Caracteres Morfológicas
Errores medición
Caracteres Fisiológicas
Caracteres Sociológicos Parámetros Estadísticos

Caracteres Psicológicos
PROBABILIDAD

DISTRIBUCIÓN NORMAL
Definida: Media y Desviación Típica

Características

• Valores (-, + )

• Alta probabilidad de estar cerca de la Media

• La probabilidad disminuye al alejarse de la media

• Simétrica

• Depende del parámetro S


PROBABILIDAD

DISTRIBUCIÓN NORMAL ESTANDAR

=0 =1
Inferencia Estadística ESTADISTICA

Descriptiva
Recolección

Descripción
Visualización

Resumen
Inferencial
Generación de modelos

Inferencias
Predicciones
Contraste de Hipótesis
Parte de la estadística matemática que se
encarga del estudio de los métodos para la
obtención del modelo de probabilidad que
Inferencia Estadística

sigue una variable aleatoria de una


determinada población, a través de una
muestra obtenida de la población

ESTIMACIÓN

Puntual

Intervalos de Confianza

PRUEBA HIPOTESIS

Estadísticas de Prueba

Intervalos de Confianza
Estimación Puntual

Se estima el valor del parámetro mediante un solo valor


Inferencia Estadística

Existe una alta probabilidad de error

Disminuye con el aumento de n

Ejercicios
De una población se escogieron al azar 10 personas y se les midió la
presión arterial sistólica. Los resultados en mm Hg fueron: 110, 117, 117,
115, 116, 118, 116, 117, 113, 115. Estime la media y la varianza de manera
puntual.
Estimación Puntual
Inferencia Estadística

Se realizaron encuestas en una población para determinar la cantidad de


niños vacunados adecuadamente bajo el esquema único de vacunación de
Colombia. De las 450 niños consultados, 316 se encuentran acordes con el
esquema. Estime la proporción de niños que se encuentran dentro del
esquema único de vacunación de Colombia.

Un cultivo de abejas está formado por 800 cajas. Se seleccionaron 30 cajas


y se observó que, en promedio, viven 300 abejas por caja. Estime el total
de abejas en el cultivo.

De un lote de 1.000 estufas de laboratorio se escogen aleatoriamente 40 y


se encontró que 2 de ellas estaban estropeadas;¿cuántas estufas se estima
que estén estropeadas?
Estimación Intervalos

Se estima el valor del parámetro poblacional mediante la


Inferencia Estadística

construcción de un rango en el cual se espera que se encuentre el


valor verdadero.

L1<  < L2
Nivel de Confianza
Probabilidad de que el parámetro este
en el intervalo

Nivel de Significancia
Valor a – Probabilidad de fallar
estimando

Valor Crítico
Abscisa que deja a su derecha a/2
Estimación Intervalos

Conoce 2
Inferencia Estadística

PL1    L2   0.95

 
x  1.96 ; x  1.96
n n
Estimación Intervalos

No se conoce 2
Inferencia Estadística

Lo más común

Xn  
t
s
n
Distribución de Probabilidad t Student

•Cada t es continuo

• El gráfico de distribución es simétrico

• Al aumentarlos gl la curva tiende a normal

s s
x  ta 2 ; x  ta 2
n n
Estimación Intervalos

Viven solos Viven


Inferencia Estadística
Se realizó un estudio encaminado a detectar las
variables que contribuyen al estrés en acompañados
pacientes clinicos cardiacos varones. El estrés 8.6 9.3 13.2 17.5
se midió mediante la puntuación de ansiedad
de Hamilton. 9.3 9.5 14.7 14.0
10.1 10.3 14.2 13.6
• Presente la estadística descriptiva de los 9.4 10.7 15.6 18.1
datos 14.2 12.9 18.0 17.4
• Construya un intervalo de confianza para cada 9.0 9.6 15.4 18.5
grupo
13.5 8.3 16.9 13.3
11.0 8.1 16.0 14.6
8.7 9.4 17.3 15.2
8.2 11.6 16.1 17.2
Hamilton Marcas: Escala de 1 a 25
Donde 18 denota un estrés moderado y 25 un estrés
grave
Estimación Intervalos

Estimación de la Diferencia entre medias poblacionales


Inferencia Estadística

Establecer un intervalo de confianza x  y 

Conoce 2
D  x y   Normal estándar

 y2  y2
x  y 1.96  x2
n1

n2
 
; x  y  1.96
 x2
n1

n2
Estimación Intervalos

Estimación de la Diferencia entre medias poblacionales


Inferencia Estadística

No se conoce 2 Lo más común


 x2   y2
s12 n1  1  s22 n2  1
Sp 
2

n1  n2  2
Sigue una distribución t

x  y  t a
1 1
  2 1 1
Sp    ; x  y  ta Sp   
2
2
 n1 n2  2
 n1 n2 
Estimación Intervalos

Viven solos Viven


Inferencia Estadística
Se realizó un estudio encaminado a detectar las
variables que contribuyen al estrés en acompañados
pacientes clinicos cardiacos varones. El estrés 8.6 9.3 13.2 17.5
se midió mediante la puntuación de ansiedad
de Hamilton. 9.3 9.5 14.7 14.0
10.1 10.3 14.2 13.6
• Presente la estadística descriptiva de los 9.4 10.7 15.6 18.1
datos 14.2 12.9 18.0 17.4
•Determine si existen diferencias significativas 9.0 9.6 15.4 18.5
entre los niveles de estrés entre los grupos de
pacientes 13.5 8.3 16.9 13.3
11.0 8.1 16.0 14.6
8.7 9.4 17.3 15.2
8.2 11.6 16.1 17.2
Hamilton Marcas: Escala de 1 a 25
Donde 18 denota un estrés moderado y 25 un estrés
grave
Parte de la estadística matemática que se
encarga del estudio de los métodos para la
obtención del modelo de probabilidad que
Inferencia Estadística

sigue una variable aleatoria de una


determinada población, a través de una
muestra obtenida de la población

ESTIMACIÓN

Puntual

Intervalos de Confianza

PRUEBA HIPOTESIS

Estadísticas de Prueba

Intervalos de Confianza
Inferencia Estadística Prueba de Hipótesis

Suposición teórica sobre el


valor de algún parámetro

Contraste con cola derecha Ho :   0 H1 :   0

Contraste con cola izquierda Ho :   0 H1 :   0

Contraste con dos colas Ho :   0 H1 :   0


Inferencia Estadística Prueba de Hipótesis

Pasos

1. Plantear las hipótesis

2. Seleccione a1 y a

3. Determine el estadístico a utilizar y la distribución

4. Región de rechazo

5. Calcular el valor del estadístico de prueba

6. Expresar la decisión en términos del problema


b
Prueba de Hipótesis

a
Inferencia Estadística

Tipos de Errores

La hipótesis nula es La hipótesis nula es


verdadera falsa
Aceptar la Hipótesis Nula Se acepta correctamente Error tipo II (Tipo b)
Rechazar la Hipótesis Nula Error tipo I (Tipo a) Se rechaza correctamente

Lo ideal sería que las probabilidades de ambos tipos de error


fueran tan pequeñas como fuera posible.

Aumentar n

En una muestra de tamaño prefijado, disminuir la probabilidad


del error de tipo I, α, conduce a incrementar la probabilidad del
error de tipo II, β.
Pruebas de Significancia Pruebas de Significancia

Determinar si son significativas las


diferencias encontradas entre dos
resultados

Prueba de Hipótesis

Generalmente la hipótesis nula se rechaza cuando la probabilidad


de que la diferencia observada ocurra por azar es menor que 1 de
cada 20 veces

a<0.05
p<0.05
Pruebas de Significancia Pruebas de Significancia

Comparación media frente a un


valor conocido ()


t  x  n
s2

t
x  
s
n
t  crítico

Se rechaza Ho
Pruebas de Significancia Pruebas de Significancia

Ejemplos

Se ha desarrollado una nueva vacuna contra la difteria para aplicarla en niños. El


nivel de protección estándar obtenido por la antiguas vacunas era de 11 g/mL, un
mes después de la inmunización. Transcurrido un mes, se han obtenido los
siguientes datos del nivel de protección de la nueva vacuna.

1 2 3 Determine si la nueva vacuna muestra


diferencias de protección frente a la
12.5 13.4 13.1
vacuna estandar.
14.2 13.0 12.6
13.3 10.5 13.2
13.7 11.6 13.3
12.8 15.8 12.1
13.4 13.5 12.7
10.8 11.6 11.5
Pruebas de Significancia Pruebas de Significancia

Ejemplos
La determinación de proteínas totales se realiza para evaluar la posible
presencia de enfermedades nutricionales, estado nutricional tras intervenciones
de cirugía, enfermedades del riñón o del hígado, o bien que el cuerpo no
absorba bien suficientes proteínas. Si el valor de las proteínas totales está
alterado se debe realizar un estudio pormenorizado de cada grupo, albúmina y
alfa-1, alfa-2, beta y gamma globulinas, para saber cuál es el desequilibrio
existente. El promedio de proteínas totales en sangre en un adulto sano es de
7,25 g/dL.

Se realizaron una serie de ocho análisis de sangre a un [ ] g /dL


determinado paciente a lo largo de varios días, 7.23
obteniéndose los siguientes datos. Existen diferencias
7.32
significativas que indiquen un posible riesgo.
7.25
7.26
7.28
7.27
7.29
7.24
Pruebas de Significancia Pruebas de Significancia

Ejemplos
El numero medio de ataques de angina de pecho por semana entre los pacientes es
de 1.3. Se está probando un nuevo medicamento y se espera que reduzca esta
cifra. Los datos se obtienen mediante la observación de una muestra de 20
pacientes, que están utilizando el nuevo medicamento.

1 3 0 1 1 1 0 2 2 0
0 1 0 0 0 1 1 1 1 0

¿Puede plantearse que el nuevo medicamento realmente reduce el numero de


ataques presentados a un nivel de 0.05 y a un nivel de 0.01?

(Basado en la información hallada en un anuncio en el American Journal of Nursing,


septiembre de 1990, pág. 13.)
25

Pruebas de Significancia 20
Co ntro l
Indo metacina
Fracció n A
Fracció n B
Pruebas de Significancia
15

Comparación de las medias de dos muestras 10

Comparar grupos de muestras bajo las mismas condiciones 0

Comparar la misma muestra bajo diferentes tratamientos o métodos

1. Cuando las varianzas NO son significativamente diferentes

Sp 
2 s1
2
n1  1  s 2 n2  1
2

n1  n2  2

t
x  x 
1 2

Sp 1  1 n1  n2  2 gl S12
n1 n2 F 2
S2
25

Pruebas de Significancia 20
Co ntro l
Indo metacina
Fracció n A
Fracció n B
Pruebas de Significancia
15

Comparación de las medias de dos muestras 10

1. Cuando las varianzas son significativamente diferentes

t
x  x 
1 2
2 2
S 1 S 2
n1 n2
2
 s   s
2 2

 n    n 
1 2

  1  2 
gl  2 2
 s1   s2 
2 2
 n  n 
 1
  2

n1  1 n2  1
Estimación Intervalos

Viven solos Viven


Inferencia Estadística
Se realizó un estudio encaminado a detectar las
variables que contribuyen al estrés en acompañados
pacientes clinicos cardiacos varones. El estrés 8.6 9.3 13.2 17.5
se midió mediante la puntuación de ansiedad
de Hamilton. 9.3 9.5 14.7 14.0
Determine si existen diferencias significativas 10.1 10.3 14.2 13.6
entre los sitios de muestreo 9.4 10.7 15.6 18.1
14.2 12.9 18.0 17.4
9.0 9.6 15.4 18.5
13.5 8.3 16.9 13.3
11.0 8.1 16.0 14.6
8.7 9.4 17.3 15.2
8.2 11.6 16.1 17.2
Hamilton Marcas: Escala de 1 a 25
Donde 18 denota un estrés moderado y 25 un estrés
grave
Estimación Intervalos
Bahía de Ciénaga
Pruebas de Significancia
Cartagena Grande
Niveles de mercurio en cáscaras de huevo de 0.21 0.13
garza obtenidas en cuerpos de agua de la
Costa Atlántica Colombiana.
0.23 0.10
0.22 0.05
Determine si existen diferencias
significativas entre los sitios de muestreo 0.23 0.02
0.34 0.22
0.01 0.01
0.10 0.02
0.32 0.07
0.24 0.07
0.36 0.04
0.36
0.22
Pruebas de Significancia Pruebas de Significancia
La flebitis es una inflamación en las venas que puede
Ejemplos
presentarse al administrar medicamentos por vía endovenosa.

El fin de determinar si amiodarone (anti-arrítmico) tiene una incidencia real sobre la


producción de flebitis se realizó un ensayo in vivo utilizando conejos de laboratorio,
los cuales fueron asignados de manera aleatoria a cada uno de los tratamientos en
estudio (control y tratamiento), los tratamientos fueron administrados en la vena de
la oreja. Un incremento en la temperatura de la oreja tratada se considero como
posible indicador temprano de flebitis.
Vehículo Amiodarone
La diferencia en las temperaturas de
las orejas del animal se usó como 0,3 2,2
variable respuesta. Determine si el
0,0 1,6
fármaco realmente tiene un efecto
inductor de flebitis. 0,6 0,8
0,0 1,8
-0,3 1,4
0,2 0,4
0,6
1,5
0,5
Pruebas de Significancia Pruebas de Significancia

Ejemplos

Se comparo un nuevo método espectroscópico de absorción atómica para


determinar mercurio por vapor frio en muestras biológicas frente al método
tradicional. Obteniéndose los siguientes datos:

Vapor Frio M. Estándar


22.2 25
19.2 19.5
15.7 16.6
20.4 21.3
19.6 20.7
15.7 16.8

Difieren significativamente los resultados obtenidos por los dos métodos?


Inferencia Estadística Estimación Intervalos
Zinc Cobre
3.0 0.40
5.8 0.51
En condiciones normales los alimentos
contienen pequeñas cantidades de zinc 5.6 0.47
y cobre. Para los siguientes valores 4.8 0.55
obtenidos de una muestra de alimentos: 5.1 0.56
3.6 0.41
5.5 0.60
Determine si existen diferencias
significativas entre los sitios de 4.7 0.46
muestreo. 5.7 0.60
5.0 0.61
5.9 0.48
5.7 0.63
4.4 0.50
5.4 0.62
4.2 0.57
Pruebas de Significancia Pruebas de Significancia
Datos Emparejados (Pareados)

Existe una dependencia natural o a propósito en los datos.


•Estudios con gemelos
•Estudios a priori y posteriori
•Administración de dos tratamientos a un mismo sujeto

x  x   x
1 2 D

Ho : x1  x2  0 Ho : x D  0

xD  0
t n1  1 gl
SD n
Pruebas de Significancia Pruebas de Significancia

Ejemplos

Se pensó que un programa de Sujeto Antes Despues


ejercicios regulares podría beneficiar a 1 7.6 14.7
pacientes que han sufrido infarto al
miocardio. 11 sujetos fueron incluidos 2 9.9 14.1
en el estudio. Se determinó la 3 8.6 11.8
capacidad de trabajo midiendo el
tiempo que demora en alcanzar una 4 9.5 16.1
frecuencia de 160 latidos por minuto. 5 8.4 14.7
Despues de 25 semanas de ejercicio se 6 9.2 14.1
repitio la medida y se obtuvieron los
7 6.4 13.2
siguientes datos.
8 9.9 14.9
Determine si el ejercicio físico beneficia
9 8.7 12.2
a estos pacientes.
10 10.3 13.4
11 8.3 14.0
Pruebas de Significancia Pruebas de Significancia

Ejemplos

Se estudio el efecto del ejercicio Sujeto Posterior Previo


físico sobre el nivel de triglicéridos 1 68 95
en un grupo de once individuos,
obteniéndose las siguientes 2 77 90
lecturas (en mg de triglicéridos 3 94 86
por 100 mL de sangre) previas y
posteriores al ejercicio. 4 73 58
5 37 47
Determine si el ejercicio físico 6 131 121
tiene un efecto directo e
7 77 136
inmediato sobre los niveles de
triglicéridos. 8 24 65
9 99 131
10 629 630
11 116 104
Pruebas de Significancia Pruebas de Significancia

Ejemplos

Se realizó un estudio para


comparar el contenido de sodio
en el plasma con el nivel de sodio
en la leche de las vacas lecheras Sujeto Leche Plasma
de la sabana. Se obtuvieron las 1 93 147
siguientes observaciones sobre el
contenido de sodio [en milimoles 2 104 157
por litro de leche (o plasma)] en 3 95 142
10 vacas aleatoriamente
seleccionadas: 4 81.5 141
5 95 142
¿Hay pruebas de que exista
alguna diferencia?. 6 95 147
7 76.5 148
8 80.5 144
9 79.5 144
10 87.0 146
Anexos

ANEXOS
DISTRIBUCIÓN NORMAL

Gauss o Distribución gaussiana


Anexos

• Simétrica
• Limite de otras

Caracteres Morfológicas
Errores medición
Caracteres Fisiológicas
Caracteres Sociológicos Parámetros Estadísticos

Caracteres Psicológicos
DISTRIBUCIÓN NORMAL
Definida: Media y Desviación Típica
Anexos

Características

• Valores (-, + )

• Alta probabilidad de estar cerca de la Media

• La probabilidad disminuye al alejarse de la media

• Simétrica

• Depende del parámetro S


PROBABILIDAD

DISTRIBUCIÓN NORMAL ESTANDAR

=0 =1
Anexos
VARIANZA = S2

La varianza es una medida de la dispersión de una variable aleatoria X


respecto a lo esperado o su esperanza E[X].
Anexos

Def. La varianza es la media aritmética del cuadrado de las desviaciones


respecto a la media de una distribución estadística.

Se calcula:
GRADOS DE LIBERTAD

Si a usted le pide que elija un par de números (x,y) al azar, usted tiene
libertad completa de elección de los dos números, tiene dos grados de
libertad. Las dos coordenadas, pueden ser representadas por un punto
localizado en el plano XY, el cual es un espacio bidimensional. El punto es
Anexos

libre de moverse horizontal y verticalmente, hay dos variables y el punto


tiene dos grados de libertad.

Ahora supongamos que nos ponen a elegir un par de números cuya suma
es 7. Es claro que solo un número puede elegirse libremente, pues el
segundo queda fijado, una vez se conozca el primero. Aunque aquí hay
dos variables, en esta situación solo una es independiente, por lo que el
número de grados de libertad se reduce de dos a solo uno, por la
imposición de la restricción x+y= 7 , el punto ahora es libre de moverse en
el plano XY pero restringido a permanecer sobre la recta x+y= 7 . Esta
línea es un espacio unidimensional que está contenido en el espacio
bidimensional original.
GRADOS DE LIBERTAD

La totalidad de posibilidades de elección


que tenemos con una restricción
Anexos

Si te dicen que puedes tomar 20 muestras con la única condición de


que el peso promedio de las 20 sea 200 gramos, tu puedes elegir con
libertad tomar 19 muestras sin preocuparte por calcular el peso pero...
cuando te vas a llevar la ultima no tienes la libertad de despreocuparte
del peso ya que el peso de esta debe ser tal que se cumpla el criterio
del promedio, entonces tienes 19 grados de libertad ya que una
muestra esta condicionada a pesar una determinada cantidad sin
libertad

Es decir tienes una totalidad de 19 elecciones sin condición pero tienes


una elección con restricción

gl  n  1
Anexos
Anexos
WEB

Estadística Básica

http://home.ubalt.edu/ntsbarsh/Business-stat/otherapplets/Descriptive.htm

http://davidmlane.com/hyperstat/desc_univ.html
Anexos

http://www.physics.csbsju.edu/stats/descriptive2.html
NORMALIDAD
More precise information can be obtained by performing one of the
tests of normality to determine the probability that the sample came
from a normally distributed population of observations (e.g., the so-
called Kolmogorov-Smirnov test, or the Shapiro-Wilks' W test. However,
none of these tests can entirely substitute for a visual examination of
Anexos

the data using a histogram


Anexos

También podría gustarte