Inferencia Estadistica PDF

Inferencia
estadística
carlos.delgado@anahuac.mx
1 Universidad Anáhuac, mayo 2015
Fundamentos
"Teoría de la Probabilidad“
O las distintas formas funcionales de las

distribuciones de probabilidad.
"Teoría de Muestras“
procedimientos para tomar muestras de manera

apropiada.
2
Teoría de muestras
Técnicas y procedimientos que deben emplearse para

que las muestras sean representativas de la población
bajo estudio, de forma que los errores en la
determinación de los parámetros de la población
objeto de estudio sean mínimos.
Para que la extracción de la muestra sea
representativa se deben cumplir dos principios
básicos:
Que haya independencia en la selección de los
individuos que forman la muestra y
Que todos los individuos tengan la misma probabilidad
de ser incluidos en la muestra.
3
Modelos de muestreo - Muestreo Aleatorio
Simple (MAS)
Para efectuar este tipo de muestreo en una población

con N individuos, se enumeran de 1 a n a los N
individuos de la población.
Mediante un programa de ordenador o una tabla de
generación de números aleatorios, se seleccionan a
los n individuos que formarán la muestra.
Después de cada extracción el individuo seleccionado
se devuelve a la población para que pueda volver a
ser elegido.
4
Estratificado (MAE)
Cuando la población no es homogénea respecto a

la variable aleatoria objeto de estudio, conviene
distinguir en ella, clases o estratos.
Los estratos se deben elegir de manera que sean
lo más homogéneos posible respecto a la variable
aleatoria a estudiar y que entre ellos exista la
mayor diferencia posible.
5
Estratificado
Afijación: Reparto del tamaño de la muestra entre

los diferentes estratos de una población.
Afijación Uniforme: Mismo número de individuos
por estrato.
Afijación Proporcional: Distribución de los
individuos que forman la muestra proporcionalmente
al número de individuos de cada estrato.
Una vez definido el número de individuos por estrato,
la selección de individuos se realiza por MAS.
6
Ejemplo
Se pretende valorar las faltas de ortografía que

cometen los alumnos de una escuela
primaria/secundaria mediante un dictado de un
texto de 20 líneas; la prueba se realizará a una
muestra de 50 alumnos.
Se divide la población en cuatro estratos: primero
y segundo grados, tercero y cuarto grados y quinto
y sexto grados de primaria; todos los niveles de
secundaria.
7
La población escolar es:
1º y 2º años de primaria: 110 alumnos.
3º y 4º año de primaria: 162 alumnos.
5º y 6º grados de primaria: 210 alumnos
Alumnos de secundaria: 338 alumnos.
Como el número total de alumnos son 820 y la
muestra debe estar formada por 50 alumnos, el
cálculo del número de alumnos que se han de tomar
de cada estrato se calcula como sigue:
8
1º y 2º de primaria:
3º y 4º de primaria :
5º y 6º de primaria
Secundaria
9
Inferencia
Deducción de una cosa a partir de otra, conclusión

deducción
f. Conclusión,inferencia: de acuerdo a lo que se sabe,
sacar deducciones y decidir.
filos
m. Método de razonamiento que parte de conceptos
generales o principios universales para llegar a
conclusiones particulares: la deducción presupone el
pensamiento hipotético.
10
Estadística inferencial
Parte de la Estadística que comprende los

métodos y procedimientos para deducir
propiedades (hacer inferencias) de una población,
a partir de una pequeña parte de la misma
(muestra).
La bondad de estas deducciones se mide en
términos probabilísticos: toda inferencia se
acompaña de su probabilidad de acierto.
11
Inferencia estadística (IE)
Se basa en las conclusiones a la que se llega por

la ciencia experimental basándose en información
muestral (de una parte de la población),
generando modelos probabilísticos a partir de un
conjunto de observaciones y, a partir de dicha
muestra, se estiman los parámetros del modelo,
contrastándolos contra las hipótesis establecidas,
a fin de determinar si el modelo probabilístico
refleja el problema real planteado.
12
INFERENCIA
POBLACIÓN
Muestra
13
Procedimiento
Se parte de un conjunto de observaciones de una

variable;
Se “infiere” o genera un modelo probabilístico.
La IE es la consecuencia de la investigación
empírica (cuando se está llevando a cabo) y como
consecuencia de la ciencia teórica (cuando se
están generando estimadores, o métodos, con tal
o cual característica para casos particulares).
14
Problemas fundamentales de aplicación
Problema de la estimación
15
Población Muestra
Definición Colección de elementos Parte o porción de la
considerados población seleccionada
para su estudio
Características “Parámetros” “Estadísticos”
Símbolos Tamaño de la población = N Tamaño de la muestra =
n
Media de la población = m
Desviación estándar de la Desviación estándar de
población = s la muestra = s
16
Conceptos iniciales
Estimación Puntual.- Estadístico calculado a partir de la

información obtenida de la muestra y que se usa para estimar
el parámetro poblacional
Intervalo de confianza.- es un conjunto de valores obtenido a

partir de los datos muestrales en el que hay una determinada
probabilidad de que se encuentre el parámetro, a esta
probabilidad se le conoce como el nivel de significancia.
Error de muestreo.- Diferencia entre un valor estadístico de

muestra y su parámetro de población correspondiente.
Intervalos de confianza
Para muestras mayores a 30 elementos

s
X z
n
Para muestras menores a 30 elementos
s
X t
n
Desviación estándar
s
 ( X  m) 2
 
X 2
( X ) 2
n
s
N n 1
Ejercicio
Suponga que se toma una muestra de 30

empleados de los cuales reciben en promedio
349$ y una desviación estándar de 110$. ¿Cuál es
el intervalo de confianza?
s
X z 349  39
n
110
349  1,96 310  389
30
19
Ejercicio
Suponga que se toma una muestra de 20

empleados de los cuales reciben en promedio
346$ y una desviación estándar de 126$. ¿Cuál es
el intervalo de confianza?
s 346  59
X t
n
126 287  405
346  2,093
20
20
Proporciones
Fracción, razón o porcentaje que indica la parte de la

muestra o población que tiene una característica
determinada
PROPORCIÓN x
p 
MUESTRAL: n
INTERVALOS DE CONFIANZA PARA p  zs p
UNA PROPORCIÓN POBLACIONAL
ERROR ESTÁNDAR DE LA PROPORCIÓN MUESTRAL
p(1  p)
sp 
n
Ejercicio
En una muestra aleatoria de 2000 miembros de

sindicato, se tiene que 1600 están a favor de
fusionarse con otra empresa ¿Cuál es el valor
estimado de la proporción poblacional?¿Cuál es el
intervalo de confianza al 95% de confianza?
x 1600
p  p   0,80
n 2000
p (1  p ) 0,80(1  0,80)
pz 0,80  1,96  0,80  0,018
22 n 2000
Problemas fundamentales de aplicación
Problema del contraste de
hipótesis
23
Prueba de hipótesis para una muestra
HIPÓTESIS.- Es una afirmación sobre una población,

que puede someterse a pruebas al extraer una muestra
aleatoria.
PRUEBA DE HIPÓTESIS.- Formular una teoría y luego

contrastarla
PASOS PARA PROBAR UNA HIPÓTESIS

1. PRUEBA DE HIPÓTESIS
2. SELECCIONAR EL NIVEL DE SIGNIFICANCIA
3. CALCULAR EL VALOR ESTADÍSTICO DE PRUEBA
4. FORMULAR LA REGLA DE DECISIÓN
5. DECIDIR
24
Test de hipótesis
Metodología o procedimiento que permite

cuantificar la probabilidad del error que se
cometería cuando se hace una afirmación sobre la
población bajo estudio; es decir, permite medir la
fuerza de la evidencia que tienen los datos a favor
o en contra de alguna hipótesis de interés sobre la
población.
Es un procedimiento de decisión basado en datos
muestrales.
25
H 0 : m  m0 Hipótesis nula: Afirmación acerca del valor de un
parámetro poblacional
H 0: m  m0
H 1 : m  m0 Hipótesis Alternativa: Afirmación que se aceptará si

los datos muestrales aseguran que es falsa H 0
H 1 : m  m0
Nivel de significancia
Generalmente son del 5% o 1% (Error de tipo I y Error de tipo II)
ERROR DE TIPO I.- Rechazar la hipótesis nula, H0 cuando es verdadera
ERROR DE TIPO II.- Aceptar la hipótesis nula, H0 cuando es Falsa

26
Cuánto influye el nivel de escolaridad de la madre
sobre el estado nutricional del niño?
Para investigar sobre este punto, se toma una
muestra de niños y se analiza en cada uno de
ellos el estado nutricional y el nivel de escolaridad
de sus madres. Una vez obtenidos los datos, se
necesita de un procedimiento que estime la
verosimilitud de los resultados obtenidos en la
muestra.
Este es un test de hipótesis estadística.
27
Los tests de hipótesis consisten en confrontar dos
hipótesis, una llamada hipótesis nula (H0) y otra
llamada hipótesis alternativa (H1). En el ejemplo
las hipótesis que se plantean son:
1. “el estado nutricional de los niños está asociado
al nivel de escolaridad de las madres” (hipótesis
de trabajo).
2. No existe tal asociación.
28
La hipótesis nula admite sólo una posibilidad (no
existe asociación), mientras la hipótesis alternativa
admite varias posibilidades.
Ejemplo
Supongamos que se quiere probar si la proporción (p)
de desnutridos en una población infantil es igual o no
al 20%. La H0 es que la proporción de desnutridos es
igual al 20% (p=0,20), mientras que la H1admite tres
posibilidades: que la proporción de desnutridos sea
menor al 20% (p<0,20), que sea mayor al 20%
(p>0,20), o que sea distinta al 20% (p ≠ 0,20), se debe
determinar como H1una de estas tres posibilidades.
29
30
Puesto que, el interés generalmente es “rechazar
Ho” la probabilidad de error que se controla
durante este procedimiento, es justamente el error
asociado a esta decisión (Probabilidad del Error
Tipo I), es decir, la probabilidad de rechazar Ho
cuando es cierta.
La máxima probabilidad de error tipo I se denota
con α y recibe el nombre de nivel de significación
del test y él debe ser prefijado de antemano,
generalmente varía entre el 1% y el 5% (α= 0,01 o
α= 0,05). La probabilidad de Error Tipo II se
denota con β.
31
Valor estadístico de prueba.
Estadísticos de pruebas como: Z, t de Student, F y
Ji cuadrado
Formular la regla de decisión

Son las condiciones según las que se acepta o rechaza la
hipótesis nula
Tomar una decisión

El valor observado de la estadística muestral se
compara con el valor de estadística de prueba
32
Inferencia paramétrica y no paramétrica
Inferencia estadística paramétrica

Se conoce la forma funcional de la función de
distribución que sigue la variable aleatoria objeto
de estudio y sólo deben estimarse los parámetros
que la determinan.
Inferencia estadística no paramétrica
No se conoce la forma funcional de la distribución
que sigue la variable aleatoria objeto de estudio.
33
Tipos de pruebas de hipótesis
Prueba de una cola: prueba de cualquier hipótesis

estadística donde la alternativa es unilateral
H0: p=p0
H1: p>p0 (cola derecha) H1: p<p0(cola izquierda)
Prueba de dos colas: prueba de cualquier

hipótesis estadística donde la alternativa es
bilateral
H0: p = p0
H1: p ≠ p0
34
Prueba sobre una media
Se conoce que el promedio de días de estadía de

pacientes de un hospital es de 8 días; si en una
muestra aleatoria de 30 pacientes incluidos en un
estudio indica que el promedio de días de estada
es de 6 días con un desvío estándar de 2,31 días;
cual es la probabilidad de que promedio de días
de estancia sea menor a 8 con un nivel de
significancia del 5%?
35
Prueba sobre una proporción
Se cree que un medicamento es efectivo en un
60% ( los casos. De un nuevo medicamento
administrado en una muestra aleatoria de 100
adultos, 70 mejoraron (p=0,7); al 5% de
significancia se puede afirmar que el nuevo
medicamento es mejor o no?

36
Inferencia
estadística
paramétrica
37
Un mismo individuo
38
39
Dos grupos independientes
40
Un grupo bajo diferentes condiciones
41
Análisis paramétricos
Coeficientes de correlación (Pearson)
Regresión lineal
Prueba t
Prueba de diferencia de proporciones
Análisis de varianza
Análisis de covarianza
42
Coeficiente de correlación de Pearson
Analiza la relación entre dos variables medidas

en un nivel por intervalos o de razón.
Símbolo – r
Ejemplos: A mayor X, mayor Y.
A mayor X, menor Y.
La hipótesis de investigación señala que la
correlación es significativa. (No identifica
causalidad).
Regresión lineal
Es un modelo estadístico para estimar el efecto

de una variable sobre otra.
Está asociado con el coeficiente de correlación de

Pearson.
Brinda la oprtunidad de predecir las puntuaciones

de una variable tomando las puntuaciones de la
otra variable.
Prueba t de Student
Es una prueba estadística para evaluar si dos

grupos difieren entre si de manera significativa
respecto a sus medias en una variable.
Símbolo – t.
La hipótesis de investigación propone que los dos

grupos difieren de manera significativa y la
hipótesis nula que los dos grupos no difieren.
Prueba de diferencia de proporciones
Es una prueba estadística para analizar si dos
proporciones o porcentajes difieren
significativamente entre sí, en dos grupos.
La comparación se realiza con una variable.
Si hay varias variables hay que realizar una
prueba por cada variable.

Análisis de varianza(ANOVA- one-way)
Es una prueba estadística para analizar si más
de dos grupos difieren significativamente (son
diferentes)entre sí en cuanto a sus medias y
varianzas.
Inferencia
estadística no
paramétrica
48
Análisis no paramétricos
Chi cuadrada
Coeficientes de correlación e independencia para
tabulaciones cruzadas
Coeficientes de correlación por rangos ordenados
de Spearman y Kendall.
Chi cuadrada
Es una prueba estadística para evaluar
hipótesis acerca de la relación entre dos
variables categóricas.
Símbolo – X2
No considera relaciones causales.

Dudas?
51

Inferencia Estadistica PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Inferencia Estadistica PDF

Cargado por

Copyright:

Formatos disponibles

Inferencia

O las distintas formas funcionales de las

procedimientos para tomar muestras de manera

Técnicas y procedimientos que deben emplearse para

Para efectuar este tipo de muestreo en una población

Cuando la población no es homogénea respecto a

Afijación: Reparto del tamaño de la muestra entre

Se pretende valorar las faltas de ortografía que

Deducción de una cosa a partir de otra, conclusión

Parte de la Estadística que comprende los

Se basa en las conclusiones a la que se llega por

Se parte de un conjunto de observaciones de una

Estimación Puntual.- Estadístico calculado a partir de la

Intervalo de confianza.- es un conjunto de valores obtenido a

Error de muestreo.- Diferencia entre un valor estadístico de

Para muestras mayores a 30 elementos

Suponga que se toma una muestra de 30

Suponga que se toma una muestra de 20

Fracción, razón o porcentaje que indica la parte de la

ERROR ESTÁNDAR DE LA PROPORCIÓN MUESTRAL

En una muestra aleatoria de 2000 miembros de

Problema del contraste de

HIPÓTESIS.- Es una afirmación sobre una población,

PRUEBA DE HIPÓTESIS.- Formular una teoría y luego

PASOS PARA PROBAR UNA HIPÓTESIS

Metodología o procedimiento que permite

H 1 : m  m0 Hipótesis Alternativa: Afirmación que se aceptará si

ERROR DE TIPO I.- Rechazar la hipótesis nula, H0 cuando es verdadera

ERROR DE TIPO II.- Aceptar la hipótesis nula, H0 cuando es Falsa

Formular la regla de decisión

Tomar una decisión

Inferencia estadística paramétrica

Prueba de una cola: prueba de cualquier hipótesis

Prueba de dos colas: prueba de cualquier

Se conoce que el promedio de días de estadía de

Se cree que un medicamento es efectivo en un

60% ( los casos. De un nuevo medicamento

administrado en una muestra aleatoria de 100

adultos, 70 mejoraron (p=0,7); al 5% de

significancia se puede afirmar que el nuevo

medicamento es mejor o no?

Coeficientes de correlación (Pearson)

Prueba de diferencia de proporciones

Analiza la relación entre dos variables medidas

Es un modelo estadístico para estimar el efecto

Está asociado con el coeficiente de correlación de

Brinda la oprtunidad de predecir las puntuaciones

Es una prueba estadística para evaluar si dos

La hipótesis de investigación propone que los dos

Es una prueba estadística para analizar si dos

proporciones o porcentajes difieren

significativamente entre sí, en dos grupos.

La comparación se realiza con una variable.

Si hay varias variables hay que realizar una

prueba por cada variable.

Es una prueba estadística para analizar si más

de dos grupos difieren significativamente (son

diferentes)entre sí en cuanto a sus medias y

Coeficientes de correlación e independencia para

Coeficientes de correlación por rangos ordenados

Es una prueba estadística para evaluar

hipótesis acerca de la relación entre dos

No considera relaciones causales.