MIGUEL ARMANDO RODRIGUEZ MARQUEZ POSGRADOS EN ADMINISTRACIÓN DE EMPRESAS -
ESTADISTICA
UNIVERSIDAD DEL TOLIMA
PLAN DE CLASE FACULTAD DE CIENCIAS ECONOMICAS Y
ADMINISTRATIVAS – POSGRADO EN ADMINISTRACIÓN DE EMPRESAS
Autor: Profesor Miguel Armando Rodríguez Marquez
mrodriguez_marquez@hotmail.com
Tema: Análisis exploratorio de datos (EDA) Tiempo clase: 1h.
Objetivo: Comprender los conceptos de Distribuciones de densidad de probabilidad,
Distribuciones de probabilidad Acumulada, medidas de resumen, función generatriz de momentos, función de momentos.
Recursos: Sala de computo, software especializado (hoja de cálculo de Excel),Video-
Beam, pizarra y marcadores.
Saberes previos:
1. Variables aleatorias, análisis exploratorio de datos (EDA).
2. Propiedades, lemas y teoremas del valor esperado, la varianza y la covarianza de variables aleatorias.
I) Metodología de trabajo: Simular distribuciones de densidad de probabilidad en
Excel, Stata e Infostat para variables aleatorias discretas: Bernoulli, Binomial, Poisson y Uniforme. Simular distribuciones de densidad de probabilidad continuas: Normal estándar, normal, Beta, exponencial y Gama. Realizar análisis exploratorio de datos y las respectivas graficas: Histograma, Box-Plot y secuencias en el tiempo.
Figura 1: Graficas funciones de densidad de probabilidad para diferentes normales de
acuerdo a los parámetros estimados. Distribución Normal.
Figura 2: Graficas funciones de probabilidad Acumulada para diferentes normales de
acuerdo a los parámetros estimados. Distribución Normal.
Miguel Armando Rodríguez Marquez
Master En Ciencias Estadística Universidad Nacional, Master En Ciencias Física Universidad del Tolima, Especialista En Ciencias Física Universidad del Tolima, Especialista En Evaluación Educativa Universidad Santo Tomas, Especialista En desarrollo de Aprendizaje Autónomo UNAD, Tecnólogo En Sistematización De Datos Universidad Antonio Nariño, Licenciado En Matemáticas y Física Universidad del Tolima. MIGUEL ARMANDO RODRIGUEZ MARQUEZ POSGRADOS EN ADMINISTRACIÓN DE EMPRESAS - ESTADISTICA
Figura 3: Graficas regiones aceptación y rechazo bajo la Ho contra la alternativa, datos
bajo una distribución normal, F-Snedecor.
Valores intervalos de confianza y niveles de significancia en distribución normal
Nivel de significancia α (error tipo I) 10% 5% 1% 0.10 0.05 0.01
90% 95% 99%
Intervalo de confianza-I.C. 0.90 0.95 0.99
Zα / 2 1.65 1.96 2.58
Tabla 1: Valores críticos de la estadística de prueba para diferentes valores de significancia en la distribución de probabilidad Normal estandarizada.
Ejercicios Propuestos del texto guía Lind D, Marchal W, y Wathen S. (2005)- Consulta (Trabajo):
1. Realizar glosario con los conceptos, ecuaciones y fundamentos relacionados en el
trabajo de la presente guía (función de densidad de probabilidad, Distribuciones de probabilidad acumuladas, mediadas de resumen método de momentos y función generatriz de momento).
2. Consultar y consignar en una tabla de resumen en hoja cuadriculada de examen
para cada variable aleatoria (va): parámetros, su distribución de densidad de probabilidad, distribución de probabilidad acumulada, medidas de resumen (en función de los momentos) y la ecuación generatriz de momentos.
3. Realizar la simulación de datos aleatorios para la distribución Bernoulli (p= 0.2,
0.3, 0.4, 0.5, 0.6, 0.7) Binomial con N=25 y 300 (p= 0.2, 0.3, 0.4, 0.5, 0.6, 0.7), Poisson ( = 2, 5, 8, 10, 20, 50) , uniforme intervalos (a=2 y b=3, a=1 y b=5, a=30 y b=70, a=20 y b=300, a=200 y b=3000) y Normal (µ=0 y 𝝈𝟐 = 𝟏, µ = 𝟎 𝒚 𝝈𝟐 = 𝟐, µ = 𝟎 𝒚 𝝈𝟐 = 𝟑, µ = 𝟎 𝒚 𝝈𝟐 = 𝟒, µ = 𝟑𝟎 𝒚 𝝈𝟐 = 𝟏𝟎𝟎, µ = 𝟏𝟐𝟎 𝒚 𝝈𝟐 = 𝟗𝟎) . En cada caso tomar una sola variable y 120 datos aleatorios, realizar el EDA, histograma, grafica de secuencia y comparar sus momentos (medidas de resumen). 4. Consultar y consignar en una tabla de resumen en hoja cuadriculada de examen para cada variable aleatoria (va): las medidas de resumen y graficas: media, varianza, desviación estándar, simetría y curtosis (en función de los momentos) y la función-ecuación generatriz de momentos. 5. Realizar los ejercicios propuestos del texto guía Lind D, Marchal W, y Wathen S. (2005) Capitulo 6 página 189 y Capitulo 7 página 239. 6. Realizar el análisis exploratorio EDA de la base de datos EDAGeneral138, análisis gráfico y analítico.
Referencias:
➢ Walpole y Myers (1991), “Probabilidad y Estadística”, Mac Graw-Hill / Latinoamericana
de Mexico S.A. ➢ David Ospina (2002). “Introducción al muestreo”. Universidad Nacional de Colombia. ➢ Martinez B. (2002), “Estadística y Muestreo”, Textos Universitarios. Miguel Armando Rodríguez Marquez Master En Ciencias Estadística Universidad Nacional, Master En Ciencias Física Universidad del Tolima, Especialista En Ciencias Física Universidad del Tolima, Especialista En Evaluación Educativa Universidad Santo Tomas, Especialista En desarrollo de Aprendizaje Autónomo UNAD, Tecnólogo En Sistematización De Datos Universidad Antonio Nariño, Licenciado En Matemáticas y Física Universidad del Tolima. MIGUEL ARMANDO RODRIGUEZ MARQUEZ POSGRADOS EN ADMINISTRACIÓN DE EMPRESAS - ESTADISTICA
➢ Lind D, Marchal W, y Wathen S. (2005), “Estadística Aplicada a los Negocios y a la
Economia”. Mc Graw Hill. ➢ Canavos G, (1991), “Probabilidad y Estadística. Aplicaciones y Métodos”, Mac Graw-Hill / Latinoamericana de Mexico S.A. ➢ Martinez B. (2002), “Estadística y Muestreo”, Textos Universitarios. ➢ Cochran G. W. y Cox M. G. (1990) “Sampling Techniques” Wiley New York. ➢ Cochran G. W. y Cox M. G. (1980) Diseños experimentales. Trillas. ➢ Kuehl O. R. (2001). Diseños de experimentos Principios estadísticos de diseño y análisis de investigación. Ingramex S.A. de C.V. ➢ Borras, B.; Pérez, A; y Domingo G. (2001). Microeconometría y Decisión. Ediciones Pirámide. ➢ Enders, Walter. (2010). Applied Econometric Time Series. Tercer edición. . John Willey and Sons. ➢ Greene, W. (2012). Econometrics Analysis. Septima Edición. Prentice Hall. ➢ Griffiths, W.; Hill, R; & Judge G. (1993). Learning and Practicing Econometrics. John Willey and Sons. ➢ Guerrero, V. (2003). Análisis Estadístico de Series de Tiempo Económicas. Thomson. ➢ Gujarati. D. y Porter, D. (2010). Econometría. Quinta Edición. McGraw - Hill
➢ Johnston, J. & Dinardo, J. (1997). Econometrics Methods. Cuarta edición. McGraw
- Hill. ➢ Judge, G; Hill, R; Griffiths, W; Lutkepohl, H. & Lee, T. (1988). Introduction to the Theory and Practice of Econometrics. Segunda edición. John Willey and Sons. ➢ Maddala. G. (1992). Introducción a la econometría. Prentice Hall. Segunda edición. ➢ Novales. A. (1993). Econometría. Segunda Edición. McGraw - Hill. ➢ Stewart, M. & Wallis, K. (1984). Introducción a la Econometría. Alianza Editorial. ➢ Wooldrigde, J. (2010). Introducción a la Econometría. Un enfoque moderno. Cuarta edición. Cengage Learning. ➢ Wei, W. (2006). Time Series Analysis. Pearson-Addison Wesley.
Miguel Armando Rodríguez Marquez
Master En Ciencias Estadística Universidad Nacional, Master En Ciencias Física Universidad del Tolima, Especialista En Ciencias Física Universidad del Tolima, Especialista En Evaluación Educativa Universidad Santo Tomas, Especialista En desarrollo de Aprendizaje Autónomo UNAD, Tecnólogo En Sistematización De Datos Universidad Antonio Nariño, Licenciado En Matemáticas y Física Universidad del Tolima.