Está en la página 1de 38

ESTADÍSTICA INFERENCIAL

Armín Trujillo Mata


armin.trujillo@anahuac.mx
Armin Trujillo Mata

 Doctor en Alta Dirección. M.C. en Ingeniería Industrial (concentración en


Análisis de Decisiones). Ingeniero Industrial (especialidad en Sistemas de
Calidad y Manufactura).
 Especializaciones en: Análisis de Decisiones (Stanford University),
Evaluación de Decisiones Estratégicas (Pontificia Universidad Católica de
Chile), Data Science (Florida Internatiional University), Finanzas
(Tecnológico de Monterrey).
 Ha desempeñado diversos cargos en Kimberly-Clark de México, Bio-
Pappel, Crown Packaging, y Heineken México.
 Ha sido consultor para Kimberly-Clark de México, y para la Subdirección de
Distribución y Comercialización de PEMEX Exploración y Producción.
 Ha sido profesor en nivel licenciatura y posgrado en el Tecnológico de
Orizaba, el Tecnológico de Monterrey, y profesor-investigador invitado en
la Escuela Superior de Ingeniería Industrial de la Universidad de La Rioja,
España.
 Actualmente, profesor en: Escuelas de Ingeniería, y Economía y Negocios
(Universidad Anáhuac Veracruz), Facultad de Administración (Universidad
Veracruzana), y en el programa del Global Executive MBA (Panamerican
University - Miami, FL).
 Miembro de The Institute for Operations Research and the Management
Sciences, (INFORMS), y de The Decision Analysis Society (DAS).

© 2023 Armin Trujillo Mata 2


Contenido

1. Introducción

2. Ley de los grandes números

3. Estimación de parámetros

4. Pruebas de hipótesis paramétricas

5. Pruebas no paramétricas

6. Análisis de regresión
© 2023 Armin Trujillo Mata 3
1. Introducción

Estadística inferencial

Parte de la estadística que comprende un conjunto de


métodos que permiten inducir, a través de una muestra
estadística, el comportamiento de una determinada población.

Objetivo

Construir estimaciones y pruebas de hipótesis acerca de las


características de una población mediante la información
contenida en una muestra.
© 2023 Armin Trujillo Mata 4
La estadística inferencial…

Se encarga de utilizar los


conceptos de probabilidad para
manejar la incertidumbre en la
toma de decisiones.

© 2023 Armin Trujillo Mata 5


La estadística inferencial…

… estudia entonces cómo, a


través de la aplicación de
ciertos métodos sobre los
datos de una muestra, se
pueden extraer
conclusiones acerca de los
parámetros de la población
de datos.

© 2023 Armin Trujillo Mata 6


Importancia de la estadística inferencial

Puede dar respuesta a muchas de las


necesidades que la sociedad y las
industrias pueden requerir, pues su
tarea fundamental es el análisis de los
datos que se obtienen a partir de
experimentos, con el objetivo de
representar la realidad y conocerla.

© Armin Trujillo Mata 7


Clasificación de la estadística inferencial

Paramétrica No paramétrica
• Asume que los datos • No es posible asumir
tienen una determinada ningún tipo de
distribución. distribución subyacente
• Se especifican en los datos ni tampoco
determinados un parámetro específico
parámetros que • Nos permiten analizar
deberían cumplirse. datos en escala nominal
u ordinal.

© Armin Trujillo Mata 8


Pruebas paramétricas

Prueba del valor Z de la distribución normal

Prueba T de Student para datos relacionados


(muestras dependientes)

Prueba T de Student para datos no relacionados


(muestras independientes)

Prueba T de Student-Welch para dos muestras


independientes con varianzas no homogéneas

Prueba F (análisis de varianza o ANOVA)

© Armin Trujillo Mata 9


Pruebas no paramétricas
Prueba binomial

Prueba ji cuadrada para una muestra

Prueba ji cuadrada para dos y más muestras


independientes
Prueba ji cuadrada de proporciones para tres o
más muestras independientes

Prueba de Fischer y Yates

Prueba de McNemar para muestras dependientes

Prueba Q para tres o más muestras dependientes


© Armin Trujillo Mata 10
2. Ley de los grandes números

• Bajo el término genérico de ley de los grandes números se


engloban varios teoremas que describen el comportamiento
del promedio de una sucesión de variables aleatorias
conforme aumenta su número de ensayos.

• Nos dice que si no conocemos la probabilidad de un suceso en


un experimento aleatorio, debemos hacer tantas veces el
experimento que al hacer un estudio estadístico de los
resultados, la frecuencia relativa de cada suceso llega un
momento que se estabiliza.

© Armin Trujillo Mata 11


Práctica en Excel

Realiza los ejercicios del archivo 2. Adición Variables Aleatorias ST.xlsx.

© Armin Trujillo Mata 12


3. Estimación de parámetros

 Cuando se conoce la distribución de probabilidad pero no el valor de sus


parámetros, éstos se deben estimar a partir de una muestra.

 Para diferenciar parámetros de estimadores se ha establecido la siguiente


notación:

© Armin Trujillo Mata 13


Intervalos de confianza

 Un enfoque para la estimación que arroja más información,


consiste en presentar un intervalo de valores del que se espera se
encuentre el parámetro poblacional.

 A dicho intervalo se le conoce como intervalo de confianza.

Conjunto de valores que se forma a partir de una muestra


de datos de forma que exista la posibilidad de que el
parámetro poblacional ocurra dentro de dicho conjunto de
valores, con una probabilidad específica llamada nivel de
confianza.

© Armin Trujillo Mata 14


Distribución z

• Ejemplo de intervalo de confianza de 95% y un a = 0.05

Cuando conocemos s

© 2023 Armin Trujillo Mata 15


Distribución t

Cuando no conocemos s

© 2023 Armin Trujillo Mata 16


Distribuciones z y t

© 2023 Armin Trujillo Mata 17


Práctica en Excel

Realiza los ejercicios del archivo 3. Estimación ST.xlsx.

© Armin Trujillo Mata 18


4. Pruebas de hipótesis paramétricas

• En lugar de encontrar el conjunto de valores en el que se espera se


encuentre el parámetro poblacional, se puede probar la validez de un
enunciado relacionado con un parámetro poblacional.

• En el análisis estadístico, se establece una afirmación (una hipótesis), y


se recogen los datos necesarios que se utilizarán posteriormente para
probar dicha afirmación.

© Armin Trujillo Mata 19


Los pasos de una prueba de hipótesis

No se rechaza H0

Se rechaza H0 y
se acepta H1

Establecer
Se identifica Se toma
Hipótesis Se formula
Seleccionar el una
Nula H0 e una regla
Nivel de estadístico muestra; se
Hipótesis para tomar
significancia de la llega a una
Alternativa decisiones
prueba decisión
H1

© Armin Trujillo Mata 20


Los tipos de errores

a = probabilidad de cometer un error tipo I


b = probabilidad de cometer un error tipo II

© Armin Trujillo Mata 21


Cómo saber qué distribución usar

© Armin Trujillo Mata 22


Práctica en Excel

Realiza los ejercicios de los archivos


4. Pruebas de hipótesis 1 muestra.xlsx.
4. Pruebas de hipótesis 2 muestras.xlsx.

© Armin Trujillo Mata 23


5. Pruebas no paramétricas

• Las pruebas que hemos aprendido hasta ahora, se basan en la


suposición de que las muestras aleatorias se seleccionan de
poblaciones normales (métodos paramétricos).

• La mayor parte de estas pruebas aún son confiables cuando existen


ligeras desviaciones de la normalidad, en particular cuando el tamaño
de la muestra es grande.

• Pero existen procedimientos de prueba alternativos, llamados métodos


no paramétricos (de distribución libre), cuando no hay conocimiento de
ningún tipo acerca de las distribuciones de las poblaciones
subyacentes, excepto, que éstas son continuas.

© 2023 Armin Trujillo Mata 24


Prueba de los signos

Prueba de los signos para muestras apareadas

Prueba de rango con signo de Wilcoxon

Prueba U de Mann-Whitney

Prueba H de Kruskal-Wallis

© 2023 Armin Trujillo Mata 25


Desventajas de las pruebas no paramétricas

• La primera es que no utilizan toda la información que proporciona la


muestra, por lo tanto, cuando se pueden aplicar ambos métodos, estas
últimas muestran ser menos eficientes que el procedimiento paramétrico
correspondiente.

• En consecuencia, para lograr la misma potencia que la prueba paramétrica


correspondiente, una prueba no paramétrica requerirá un tamaño de
muestra mayor que el que requeriría la primera.

© 2023 Armin Trujillo Mata 26


Práctica en Excel

Realiza los ejercicios del archivo 5. Pruebas no paramétricas ST.xlsx.

© Armin Trujillo Mata 27


6. Análisis de regresión

• En este tema, el foco de interés cambia hacia el estudio de la


relación entre dos variables de intervalo (o de razón).

• Para comenzar el estudio de las relaciones entre ambas


variables, se examinan el significado y el propósito de un
análisis de correlación.

• Continuamos con el desarrollo de una ecuación matemática


que permita estimar el valor de una variable con base en el
valor de otra, procedimiento que se conoce como análisis de
regresión.

© 2023 Armin Trujillo Mata 28


Una herramienta básica:
El diagrama de dispersión
sd

Línea de regresión
Proporciona una representación
visual de la relación entre las
variables.

© 2023 Armin Trujillo Mata 29


Diagramas de dispersión con correlación
negativa y correlación positiva perfectas

© 2023 Armin Trujillo Mata 30


Rango del coeficiente de correlación

© 2023 Armin Trujillo Mata 31


Relaciones posibles entre x y y

© 2023 Armin Trujillo Mata 32


Coeficiente de correlación r

Es la medida específica que cuantifica la


intensidad de la relación lineal entre dos variables
y se dice que es una medida de dependencia
lineal entre dos variables aleatorias

• Para determinar el coeficiente de correlación se utiliza la siguiente


ecuación:

© Armin Trujillo Mata 33


Modelo estadístico de regresión lineal

© 2023 Armin Trujillo Mata 34


• Las diferencias entre los valores Y realmente observados y los
correspondientes valores Y ajustados, (Ŷ ’s), se llaman residuos.

• Los residuos son las distancias verticales (positivas o negativas)


entre los puntos de datos y la línea de mínimos cuadrados.

• Observación = Ajuste + Residuo.

• En símbolos:

© 2023 Armin Trujillo Mata 35


• b0 es la intersección con Y
• b1 es la pendiente

© 2023 Armin Trujillo Mata 36


El poder explicativo de una ecuación de
regresión lineal

• La línea de regresión ajustada (de la muestra),

puede considerarse como una estimación de la línea de


regresión de la población

© 2023 Armin Trujillo Mata 37


Práctica en Excel

Realiza los ejercicios del archivo 6. Análisis de regresión simple ST.xlsx.

© Armin Trujillo Mata 38

También podría gustarte