Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apuntes Curso AE EXCEL 290606
Apuntes Curso AE EXCEL 290606
INTRODUCCIÓN ...................................................................................................... 1
7. Análisis de Regresión.......................................................................................... 14
INTRODUCCIÓN
Un ejemplo para esta diferencia: “Un estudio que se realizó dentro de la ciudad de Santa
Cruz arrojó un resultado, el promedio de horas que las personas ven televisión es de 2.6
horas/día. Y basándose en este dato se supone que todas las personas de Bolivia tienen
un promedio de horas frente a la televisión de ±2.6 horas/día.”
En este caso el promedio de 2.6 horas/día para la ciudad de Santa Cruz corresponde a la
Estadística Descriptiva; mientras que la afirmación que ese promedio es similar para
todas las personas de Bolivia es parte de la Estadística Inferencial.
Para definir apropiadamente qué es una variable, es necesario primero hacer alusión al
concepto de unidad de investigación.
Por ejemplo, el número de televisores que tiene el consumidor del mercado boliviano.
Es una variable porque ciertamente adopta distintos valores para cada unidad observada
y es posible su medición.
Existen de igual manera muchas clasificaciones para las escalas de medición a las que
se apegan las variables, pero procurando la sencillez se considera la siguiente:
Ø Variable de Escala (de Intervalo y/o Razón), es aquella que tiene un valor dado
por un número.
Por ejemplo, la opinión sobre un concierto puede ser buena, mala o regular.
Una vez definido el concepto de variable, sus tipos y sus escalas de medición, es posible
denotar concepto de distribución.
TALLER EN EXCEL 2
Juan Fernando Subirana Osuna
2. Teoría de Probabilidades:
Casos Favorables
Probabilidad =
Casos Posibles
Aplicado al ejemplo antes dado, se tiene que los casos posibles son 10 (el número de
bolas en la caja) y los favorables de sacar una bola azul 6, donde aplicando la fórmula:
Pr (sacar una bola azul) = = 0.6
6
10
j
j =1
De igual manera que las Variables que surgen de la Observación y Medición directa
(Variables Descriptivas) tienen sus distribuciones; las Variables Aleatorias (o
Probabilísticas) tienen sus distribuciones.
Existen algunas distribuciones de probabilidad que son muy útiles y conocidas, como lo
es la Curva Normal para Variables Aleatorias Continuas.
TALLER EN EXCEL 3
Juan Fernando Subirana Osuna
f (X ) =
1
exp −
σ 2π 2 σ
Gráfico 1.1
Distribución Normal
Probabilidad [f(x)]
Valores de X
Esta es sin lugar a duda, una de las más importantes Distribuciones de Probabilidad,
tiene algunas características relevantes que se detallan a seguir.
Ø Si una Variable (X) tiene una Distribución de Probabilidad Normal con media µ
y varianza σ2 se puede expresar de manera resumida como: X ~ N(µ,σ2)
Ø La distribución Normal es Simétrica; es decir, su Promedio, su Mediana y su
Moda son iguales.
Ø La probabilidad que la Variable X, con distribución Normal, tome valores a una
distancia de una (1) desviación típica de su media (µ ± σ) es aproximadamente
68%; expresado formalmente Pr[µ - 1σ < X < µ + 1σ] ≈ 0,68
Ø La probabilidad que la Variable X, con distribución Normal, tome valores a una
distancia de dos (2) desviaciones típicas de su media (µ ± 2σ) es
aproximadamente 95%; expresado formalmente Pr[µ - 2σ < X < µ + 2σ] ≈ 0,95
Ø La probabilidad que la Variable X, con distribución Normal, tome valores a una
distancia de tres (3) desviaciones típicas de su media (µ ± 3σ) es
aproximadamente 99%; expresado formalmente Pr[µ - 3σ < X < µ + 3σ] ≈ 0,99
TALLER EN EXCEL 4
Juan Fernando Subirana Osuna
El principal motivo para que muchos Estudios no hayan tenido resultados aceptables
son problemas en la Selección de las Unidades, que no es realizada Aleatoriamente.
La mayoría de las veces esto no se realiza por lo tedioso que resulta completar una
muestra de 300 ó 400 unidades con datos aleatorios.
Para suerte de los investigadores EXCEL ha saldado este problema con los siguientes
pasos.
TALLER EN EXCEL 6
Juan Fernando Subirana Osuna
Para ejecutar esta opción de EXCEL los resultados deben estar tabulados en Columnas,
preferentemente con un nombre distintivo encabezando a la misma.
TALLER EN EXCEL 7
Juan Fernando Subirana Osuna
4) Una vez se tenga la salida de esta opción lo que interesa es interpretar los
Resultados de tal forma que cumplan su función Describir a la Variable.
TALLER EN EXCEL 8
Juan Fernando Subirana Osuna
En repetidas ocasiones las distribuciones de las variables deben ser expuestas en forma
de tablas de frecuencia para facilitar su comprensión.
TALLER EN EXCEL 10
Juan Fernando Subirana Osuna
5. Análisis de Correlación
Muchas veces se trabaja con más de una Variable y se quiere conocer que relación
tienen unas con otras. Bajo ese concepto se concibe el análisis de Correlación o
Asociación Lineal.
En más de una ocasión se tendrá que hacer contrastes entre 2 o más variables, u otro
caso 2 o más grupos dentro de una variable; para responder preguntas como: “¿Es
mayor el precio del producto X o del Y?, ¿Los residentes de la zona Sur consumen más
que los de las zona Norte?, ¿El porcentaje de artículos defectuosos del proveedor A
difiere significativamente de los artículos del proveedor B ó C?”
Para responder a este tipo de incógnitas están las pruebas de Hipótesis. En aras de la
sencillez se propone la siguiente regla práctica, con una confianza del 95%:
• Si la Significancia [Pr(T<=t)] es MAYOR a 0.05 → Se acepta la Hipótesis Nula.
• Si la Significancia es MENOR a 0.05 → Se acepta la Hipótesis Alterna.
TALLER EN EXCEL 13
Juan Fernando Subirana Osuna
Estos conceptos son válidos y aplicables para todos los tests de Medias Muestrales a ser
desarrollados en el curso.
7. Análisis de Regresión
Para realizar este análisis deben identificarse las Variables Independientes (X) y la
Variable Dependiente (Y) para expresar a estas con una ecuación que por lo general es
lineal: Y = a + bX1 + cX2
TALLER EN EXCEL 14
Juan Fernando Subirana Osuna
TALLER EN EXCEL 15
Juan Fernando Subirana Osuna
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,93578159
Coeficiente de determinación R^2 0,87568719
R^2 ajustado 0,85496839
Error típico 0,68226271
Observaciones 15
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 39,3475 19,6738 42,2653 0,0000
Residuos 12 5,5858 0,4655
Total 14 44,9333
TALLER EN EXCEL 16
Juan Fernando Subirana Osuna
Este cuadro muestra los valores de Ye y los residuos, se observa que todos son pequeños
por esto la estimación es buena. Con esta tabla se pueden hacer pruebas más complejas
como ser el Test de Autocorrelación y el de Heteroscedasticidad, pero estos no son
temas del curso por lo que se recomienda consultar bibliografía como Damodar
Gujarati, Econometría.
Como se ha podido observar son varios los resultados de este análisis, hecho que lo
convierte en una poderosa herramienta de decisión.
TALLER EN EXCEL 17
Juan Fernando Subirana Osuna
Los pronósticos son estimaciones de valores futuros en base a los valores pasados.
Hay varias técnicas para realizar Pronósticos, pero la que se desarrollará es la del
Suavizado Exponencial.
TALLER EN EXCEL 18
Juan Fernando Subirana Osuna
También se observa los errores que son pequeños, lo propio se observa en el gráfico.
TALLER EN EXCEL 19
Juan Fernando Subirana Osuna