Está en la página 1de 20

Tabla de Contenido

Apuntes del Taller


Análisis Estadístico en EXCEL

INTRODUCCIÓN ...................................................................................................... 1

1. Definición y Clasificación de la Estadística:.......................................................... 1

1.1 Concepto de Unidad de Investigación, Variable y Distribución...................... 1

2. Teoría de Probabilidades: ...................................................................................... 3

DESARROLLO DEL CURSO................................................................................... 5

1. Habilitación del Menú Análisis de Datos en EXCEL............................................. 5

2. Selección de una Muestra Aleatoria....................................................................... 6

3. Manejo de Estadísticos Descriptivos ..................................................................... 7

4. Presentación en tabla de Frecuencia Simple e Histograma..................................... 9

5. Análisis de Correlación ....................................................................................... 11

6. Pruebas de Hipótesis sobre las Medias ................................................................ 12

7. Análisis de Regresión.......................................................................................... 14

8. Pronósticos por Series Temporales...................................................................... 18

PDF created with pdfFactory trial version www.pdffactory.com


Apuntes del Taller
Análisis Estadístico en EXCEL

Juan Fernando Subirana Osuna

INTRODUCCIÓN

1. Definición y Clasificación de la Estadística:

La ciencia Estadística es muchas veces mal conceptualizada y, por qué no decirlo,


encasillada como un grupo de tareas monótonas y sin sentido.
La estadística no debe verse solamente como la recolección de datos o como ir a
entrevistar a un grupo de personas; si no más bien como un conjunto de técnicas
matemáticas que aplicadas a la realidad tienen valor de uso y de importancia.

La Estadística tiene una clasificación general, se divide en dos grandes ramas:

3. La Estadística Descriptiva, como su nombre lo indica es una “descripción” que


consiste en la recopilación, análisis e información de datos pertinentes a un
grupo de elementos, que por lo general es llamado muestra.

4. La Estadística Inferencial, el mismo término sugiere “razonamiento o


inferencia” que no es más que partir de resultados de una porción de datos
(muestra) para estimar los mismos resultados para el total de datos (población).
También se puede decir que esta rama de la estadística es aquella donde entran
en juego las probabilidades.

Un ejemplo para esta diferencia: “Un estudio que se realizó dentro de la ciudad de Santa
Cruz arrojó un resultado, el promedio de horas que las personas ven televisión es de 2.6
horas/día. Y basándose en este dato se supone que todas las personas de Bolivia tienen
un promedio de horas frente a la televisión de ±2.6 horas/día.”
En este caso el promedio de 2.6 horas/día para la ciudad de Santa Cruz corresponde a la
Estadística Descriptiva; mientras que la afirmación que ese promedio es similar para
todas las personas de Bolivia es parte de la Estadística Inferencial.

En conclusión a esto se puede decir que: “La Estadística Descriptiva es el escalón


necesario para llegar a una Estadística Inferencial”

1.1 Concepto de Unidad de Investigación, Variable y Distribución

Para definir apropiadamente qué es una variable, es necesario primero hacer alusión al
concepto de unidad de investigación.

Entiéndase por Unidad de Investigación al objeto de estudio de una búsqueda de


información.
Por ejemplo, si se está analizando el comportamiento del consumidor en el mercado
boliviano, lógicamente el objeto de estudio será el consumidor. Otro ejemplo
considerable, si se estudia el tiempo promedio de confección de una prenda de vestir, el
objeto de estudio serían tanto los operarios de las máquinas como las máquinas en sí.
TALLER EN EXCEL 1
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


En pocas palabras la unidad de investigación es la entidad de la cual se obtendrá la
información requerida en un estudio.

Una Variable, es simplemente una característica medible de un conjunto de unidades de


investigación.

Por ejemplo, el número de televisores que tiene el consumidor del mercado boliviano.
Es una variable porque ciertamente adopta distintos valores para cada unidad observada
y es posible su medición.

Hay distintas clasificaciones para las variables y su forma de medición.

Clasificación de las Variables Basada en los Valores que pueden tomar:

Ø Variable Discreta, es aquella que solo toma valores de números enteros.

Un ejemplo de Variable Discreta: El número de habitaciones que tienen las


personas en sus casas, es una variable discreta porque es imposible encontrar en
una casa media habitación o ¾ de habitación.

Ø Variable Continua, es aquella que toma todos los valores reales.

Para ejemplificar una Variable Continua: La estatura de las personas, ya que es


posible encontrar a una persona que mida 1.82 m. y de igual manera es probable
encontrar a otra persona que mida 1.81 m.

Existen de igual manera muchas clasificaciones para las escalas de medición a las que
se apegan las variables, pero procurando la sencillez se considera la siguiente:

Clasificación de las Variables Basada en su Escala de Medición:

Ø Variable de Escala (de Intervalo y/o Razón), es aquella que tiene un valor dado
por un número.

Por ejemplo, el precio de cierto producto en el mercado.

Ø Variable de escala Ordinal, es aquella que se mide por orden de preferencia.

Por ejemplo, la elección en un concurso de belleza, para alguien la ganadora


debió quedar en 3º lugar, para otra persona en 2º lugar.
Ø Variable de escala Nominal (Categórica), es simplemente asignar mediante
nombres, letras o cualquier distintivo no numérico de categoría.

Por ejemplo, la opinión sobre un concierto puede ser buena, mala o regular.

Una vez definido el concepto de variable, sus tipos y sus escalas de medición, es posible
denotar concepto de distribución.

TALLER EN EXCEL 2
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


La Distribución de una variable es simplemente el conjunto de datos o valores obtenidos
de la medición de las unidades de investigación, que tiene cierto comportamiento.

Por ejemplo, considerando la variable “Opinión sobre la Atención de un Restaurante”,


puede tener una distribución de este tipo:
• Buena: 63 personas.
• Regular: 25 personas.
• Mala: 12 personas.
Y considerar al comportamiento como: el 25% de las personas opinaron regular.

2. Teoría de Probabilidades:

Para comentar sobre lo que concierne a la Teoría de Probabilidades, es primordial dar


un concepto al término probabilidad. Si bien es cierto, no hay una sino varias
interpretaciones para esta acepción, se ha elegido la siguiente por su fácil comprensión y
gran aplicabilidad.

La Probabilidad de ocurrencia de un suceso es el grado o medida de confianza en que


se cree que puede producirse este.

Un ejemplo muy claro y clásico de esto es la siguiente situación:


Se tiene una caja con 10 bolas de colores de las cuales 6 son azules y 4 son rojas,
entonces la probabilidad de meter la mano y sin mirar extraer una bola de color azul es
de 0.6 ó del 60%.

Las probabilidades en su aproximación más simple se representan por la relación:

Casos Favorables
Probabilidad =
Casos Posibles

Aplicado al ejemplo antes dado, se tiene que los casos posibles son 10 (el número de
bolas en la caja) y los favorables de sacar una bola azul 6, donde aplicando la fórmula:
Pr (sacar una bola azul) = = 0.6
6
10

Las Principales Característica (Axiomas) de las Probabilidades son las siguientes:


Ø Oscilan entre 0 y 1, o sus equivalentes porcentuales (0% y 100%).
Ø La suma de todas las probabilidades asociadas a un suceso debe ser igual al a 1.
Puesto en términos matemáticos:
0 ≤ Pr ( X j ) ≤ 1 ∑ Pr (X ) = 1
k

j
j =1

De igual manera que las Variables que surgen de la Observación y Medición directa
(Variables Descriptivas) tienen sus distribuciones; las Variables Aleatorias (o
Probabilísticas) tienen sus distribuciones.

Existen algunas distribuciones de probabilidad que son muy útiles y conocidas, como lo
es la Curva Normal para Variables Aleatorias Continuas.
TALLER EN EXCEL 3
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


Viene dada por la expresión:
1 X −µ
2

f (X ) =
1
exp −
σ 2π 2  σ 

Donde μ es la media de X y σ su desviación estándar.

La gráfica de esta función es la siguiente:

Gráfico 1.1

Distribución Normal
Probabilidad [f(x)]

µ−3σ µ−2σ µ−1σ µ µ+1σ µ+2σ µ+3σ

Valores de X

Fuente: Elaboración Propia

Esta es sin lugar a duda, una de las más importantes Distribuciones de Probabilidad,
tiene algunas características relevantes que se detallan a seguir.

Ø Si una Variable (X) tiene una Distribución de Probabilidad Normal con media µ
y varianza σ2 se puede expresar de manera resumida como: X ~ N(µ,σ2)
Ø La distribución Normal es Simétrica; es decir, su Promedio, su Mediana y su
Moda son iguales.
Ø La probabilidad que la Variable X, con distribución Normal, tome valores a una
distancia de una (1) desviación típica de su media (µ ± σ) es aproximadamente
68%; expresado formalmente Pr[µ - 1σ < X < µ + 1σ] ≈ 0,68
Ø La probabilidad que la Variable X, con distribución Normal, tome valores a una
distancia de dos (2) desviaciones típicas de su media (µ ± 2σ) es
aproximadamente 95%; expresado formalmente Pr[µ - 2σ < X < µ + 2σ] ≈ 0,95
Ø La probabilidad que la Variable X, con distribución Normal, tome valores a una
distancia de tres (3) desviaciones típicas de su media (µ ± 3σ) es
aproximadamente 99%; expresado formalmente Pr[µ - 3σ < X < µ + 3σ] ≈ 0,99

De esta función de densidad (o de probabilidad) surgen muchas importantes


aplicaciones. También hay otras importantes como ser: la t de Student, la Chi Cuadrado
(χ2) y la F de Fisher (o de Snedecor), entre otras.

TALLER EN EXCEL 4
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


DESARROLLO DEL CURSO

1. Habilitación del Menú Análisis de Datos en EXCEL

El EXCEL tiene incorporado una poderosa herramienta de análisis estadístico, pero


muchas veces esta opción no está habilitada en las versiones estándar, para hacerlo
deben seguirse los siguientes pasos.

1) Ir al Menú Herramientas y luego a la opción Complementos.

2) En el cuadro de Dialogo que aparece seleccionar la opción Herramientas para


análisis – VBA.

Con estos pasos aparecerá en el menú Herramientas la opción Análisis de Datos.


TALLER EN EXCEL 5
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


2. Selección de una Muestra Aleatoria

El principal motivo para que muchos Estudios no hayan tenido resultados aceptables
son problemas en la Selección de las Unidades, que no es realizada Aleatoriamente.

La mayoría de las veces esto no se realiza por lo tedioso que resulta completar una
muestra de 300 ó 400 unidades con datos aleatorios.

Para suerte de los investigadores EXCEL ha saldado este problema con los siguientes
pasos.

1) Copiar todos los elementos de la Población en un Libro de EXCEL, y


numerarlos de 1 a N.

2) Seleccionar la opción Muestra en el menú Análisis de Datos.

3) Llenar el cuadro de diálogo.


En el Rango de Entrada los números del listado.
Se habilita Rótulos, si es que la primera celda tiene texto.
Se selecciona el Tipo de Muestreo Sistemático o Aleatorio Simple, si se
selecciona Aleatorio se coloca el tamaño de muestra (para este ejemplo n = 5).
El Rango de Salida se escoge a gusto.

TALLER EN EXCEL 6
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


4) Luego se tienen los resultados de la Selección, indicando que resultados
elementos deben ser entrevistados.

De igual manera se procederá a realizar los demás análisis del curso.

3. Manejo de Estadísticos Descriptivos

Para ejecutar esta opción de EXCEL los resultados deben estar tabulados en Columnas,
preferentemente con un nombre distintivo encabezando a la misma.

Se tienen los siguientes pasos para la realización de este análisis.

1) Tabular los datos del estudio en una Columna con un Encabezado.

2) Seleccionar la opción Estadística descriptiva en el menú Análisis de Datos.

TALLER EN EXCEL 7
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


3) Llenar el cuadro de diálogo.
En el Rango de Entrada los números del listado.
Se habilita Rótulos, si es que la primera celda tiene texto. En este caso sí.
Se selecciona Resumen de Estadísticas si se quiere un análisis completo de los
indicadores Descriptivos de la variable.
Si se desea realizar inferencias sobre la Media Muestral se selecciona Nivel de
confianza para la media, por defecto este nivel está fijado en 95%.
En caso que se desee conocer estadísticos de posición se pueden seleccionar K-
ésimo mayor y K-ésimo menor.
El Rango de Salida se escoge a gusto.

4) Una vez se tenga la salida de esta opción lo que interesa es interpretar los
Resultados de tal forma que cumplan su función Describir a la Variable.

TALLER EN EXCEL 8
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


Considerando que para este ejemplo se utilizó una muestra de 15 jefes de hogar a los
que se les preguntó cuántas personas vivían bajo su techo en calidad de familia, los
resultados se interpretarían de la siguiente forma.
- Media: El número Promedio de miembros de una familia bajo un mismo techo
es de 3.27 personas.
- Error típico: Hay un 68% de probabilidad que el número Promedio Poblacional
de personas familiares bajo un mismo techo esté entre 3.27 ± 0.46.
- Mediana: En el 50% de los hogares hay 3 o menos personas familiares.
- Moda: En la mayoría de los hogares hay solo 2 personas familiares.
- Desviación estándar: La dispersión promedio de los datos respecto a la media es
de 1.79.
- Varianza de la muestra: Es la Desviación Estándar al cuadrado; tiene poca
aplicación práctica.
- Curtosis: Al ser un número menor a cero, indica que la distribución tiene una
altura inferior a la de una distribución Normal.
- Coeficiente de Asimetría: Al ser un número positivo, indica que la mayoría de
los hogares tienen un número de personas inferior a 3.27 (la media).
- Rango: Es la diferencia entre el máximo y el mínimo valor, se interpreta como
un medida de dispersión.
- Mínimo: El valor más bajo que puede tomar la variable es 1.
- Máximo: El valor más alto que puede tomar la variable es 6.
- Suma: Es simplemente la sumatoria de todos los datos.
- Cuenta: Es el tamaño de muestra considerado, n = 15.
- Nivel de confianza (95.0%): Hay un 95% de probabilidad que el número
Promedio Poblacional de personas familiares bajo un mismo techo esté entre
3.27 ± 0.99.

4. Presentación en tabla de Frecuencia Simple e Histograma

En repetidas ocasiones las distribuciones de las variables deben ser expuestas en forma
de tablas de frecuencia para facilitar su comprensión.

Los pasos para formar estas tablas son los siguientes.


TALLER EN EXCEL 9
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


1) Tabular los datos del estudio en una Columna con un Encabezado.

2) Formular cuales son los límites que tendrá la tabla.

3) Seleccionar la opción Histograma en el menú Análisis de Datos.

4) Llenar el cuadro de diálogo.


En el Rango de Entrada los números del listado.
En el Rango de Clases los límites de la tabla.
Se habilita Rótulos, si es que la primera celda tiene texto. En este caso sí.
El Rango de Salida se escoge a gusto.
Se selecciona Pareto si se quiere un análisis ordenado la distribución de la
variable. En este caso no.
Si se desea realizar un análisis más pormenorizado se selecciona Porcentaje
acumulado.
Se aconseja que se habilite Crear gráfico para tener una visión más completa de
la variable.

TALLER EN EXCEL 10
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


5) Luego de esto se tienen los resultados del procedimiento.

5. Análisis de Correlación

Muchas veces se trabaja con más de una Variable y se quiere conocer que relación
tienen unas con otras. Bajo ese concepto se concibe el análisis de Correlación o
Asociación Lineal.

Los pasos son los siguientes.

1) Tabular los datos del estudio en Columnas Contiguas con un Encabezado.

2) Seleccionar la opción Coeficiente de Correlación en el menú Análisis de Datos.

3) Llenar el cuadro de diálogo.


En el Rango de Entrada las columnas con las variables a analizar.
Se habilita Rótulos, si es que la primera celda tiene texto. En este caso sí.
El Rango de Salida se escoge a gusto.
TALLER EN EXCEL 11
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


4) Luego se obtienen los resultados del procedimiento para su posterior
interpretación.

Reconociendo que el Coeficiente de Correlación (de Pearson) varía del –1 al +1, y


siendo una alta asociación cuando este se acerque a 1 en valor absoluto y baja
asociación cuando este coeficiente tienda a cero. Se tiene.
- La asociación entre el número de Personas en un hogar y el Pago de Luz es alta
(92%) y positiva.
- La asociación entre el número de Personas en un hogar y el Pago de Agua es
moderadamente alta (70%) y positiva.
- La asociación entre el Pago de Luz y el Pago de Agua es moderada (63%) y
positiva.

6. Pruebas de Hipótesis sobre las Medias

En más de una ocasión se tendrá que hacer contrastes entre 2 o más variables, u otro
caso 2 o más grupos dentro de una variable; para responder preguntas como: “¿Es
mayor el precio del producto X o del Y?, ¿Los residentes de la zona Sur consumen más
que los de las zona Norte?, ¿El porcentaje de artículos defectuosos del proveedor A
difiere significativamente de los artículos del proveedor B ó C?”

Para responder a este tipo de incógnitas están las pruebas de Hipótesis. En aras de la
sencillez se propone la siguiente regla práctica, con una confianza del 95%:
• Si la Significancia [Pr(T<=t)] es MAYOR a 0.05 → Se acepta la Hipótesis Nula.
• Si la Significancia es MENOR a 0.05 → Se acepta la Hipótesis Alterna.

La Hipótesis Nula siempre es una Igualdad, es una verdad por comprobar.


TALLER EN EXCEL 12
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


Los pasos a seguir para este procedimiento son:

1) Tabular los datos del estudio en una Columna preferentemente con un


Encabezado.

2) Seleccionar la opción Prueba t para medias de dos muestras emparejadas


(pueden seleccionarse otras opciones dependiendo del caso) en el menú Análisis
de Datos.

3) Llenar el cuadro de diálogo.


En el Rango para la variable 1 la columna con la primer variable a analizar.
En el Rango para la variable 2 la columna con la segunda variable a analizar.
En Diferencia hipotética entre medias, este valor va a depender de la Hipótesis
Nula planteada. Para este caso H0: M(Luz) – M(Agua) = 3
Se habilita Rótulos, si es que la primera celda tiene texto. En este caso sí.
Alfa es el nivel de contraste, casi siempre se utiliza un valor de 95% de
confianza lo que genera un Alfa de 0.05. Como en este caso.
El Rango de Salida se escoge a gusto.

TALLER EN EXCEL 13
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


4) Luego se obtienen los resultados del procedimiento para su posterior
interpretación.

En el cuadro de resultados se tienen:


- Las Medias de las 2 variables, claramente identificadas por sus respectivos
rótulos.
- Las Varianzas muestrales.
- El número de muestra de cada variables (para este caso son iguales).
- El Coeficiente de Correlación moderado positivo de 63%.
- La constante de la Hipótesis nula. En este caso 3.
- El estadístico t de Student y sus Grados de Libertad.
- La Significancia [Pr(T<=t)] para una cola. Esto se utilizaría si la Hipótesis Nula
hubiera sido H0: M(Luz) – M(Agua) <= 3.
- La Significancia [Pr(T<=t)] para 2 colas. En este caso es de 0.60, valor muy por
encima del valor teórico 0.05.
Aplicando la regla Práctica: Significancia (0.60) > 0.05 → Se acepta la Hipótesis Nula.
Llevando el resultado a la práctica: la Diferencia entre el Pago de Luz y el Pago de
Agua de cada hogar, no es estadísticamente distinta de 3.

Estos conceptos son válidos y aplicables para todos los tests de Medias Muestrales a ser
desarrollados en el curso.

7. Análisis de Regresión

En muchas áreas del conocimiento es necesario plantear modelos matemáticos,


ecuaciones que ayuden a explicar algunas situaciones, y para ello está el análisis de
Regresión.

Para realizar este análisis deben identificarse las Variables Independientes (X) y la
Variable Dependiente (Y) para expresar a estas con una ecuación que por lo general es
lineal: Y = a + bX1 + cX2

Los pasos para realizar este análisis son:

TALLER EN EXCEL 14
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


1) Tabular los datos de la Variable Dependiente en una Columna preferentemente
con un Encabezado.

2) Tabular los datos de las Variables Independiente en Columnas Contiguas


preferentemente con Encabezados.

3) Seleccionar la opción Regresión en el menú Análisis de Datos.

4) Llenar el cuadro de diálogo.


En el Rango Y de entrada la columna con la variable dependiente.
En el Rango X de entrada las columnas con las variables independientes.
Se habilita Rótulos, si es que la primera celda tiene texto. En este caso sí.
Constante igual a cero si es que se quiere un modelo de la forma Y = bX1 + cX2.
Para este caso no se ha seleccionado esa opción.
Nivel de confianza, utiliza por defecto un valor de 95%. Como en este caso.
El Rango de Salida se escoge a gusto.
Residuales son las diferencias entre los puntos verdaderos (Y) y los estimados
por la expresión (Ye).
Residuos estándares, Gráfico de residuales son opciones que complementan al
análisis de los residuos del modelo.
Curva de regresión ajustada es un gráfico que ayuda visualmente a ver las
relaciones entre las variables.
Gráfico de probabilidad normal es una opción poco utilizada.

TALLER EN EXCEL 15
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


5) Se obtienen los resultados del procedimiento. Dado que para este análisis los
resultados son tantos se expondrán y detallarán interpretaciones cuadro por
cuadro.
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,93578159
Coeficiente de determinación R^2 0,87568719
R^2 ajustado 0,85496839
Error típico 0,68226271
Observaciones 15

En este cuadro se observan:


- El Coeficiente de Correlación Múltiple es la medición de la asociación lineal de
todas las variables del modelo, para este caso es bastante alto del 94%.
- El Coeficiente de Determinación (R2), indica (a groso modo) qué porcentaje de Y
está siendo explicado por X. En este caso el 88%.
- El R2 ajustado, es una medida similar al R2 con la variante que tiende a ser más
pequeño porque penaliza más grados de libertad. En este cado es del 85%.
- El Error típico es la variabilidad presentada por los Residuos o Errores del
modelo. Mientras más bajo sea este valor mejor, en este caso es de 0.68.
- Observaciones es el tamaño de muestra utilizado.

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 39,3475 19,6738 42,2653 0,0000
Residuos 12 5,5858 0,4655
Total 14 44,9333

TALLER EN EXCEL 16
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


Esta tabla contiene mucha información valiosa pero lo único relevante de ella es el
Valor crítico de F que es un indicador equivalente a la significancia, por ende ayuda a
decidir si aceptar o rechazar la Hipótesis Nula.

La Hipótesis Nula implícita es H0: R2 = 0 ó Las Variables X no tienen relación la Y.

Considerando que, la Significancia (0.00) < 0.05 → Se acepta la Hipótesis Alterna.


Visto prácticamente; Se acepta la Hipótesis que las variables X tienen relación con la Y.

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -5,8958 1,0243 -5,7560 0,0001 -8,1275 -3,6641
Luz 1,1400 0,1876 6,0783 0,0001 0,7314 1,5486
Agua 0,4389 0,2950 1,4878 0,1626 -0,2038 1,0816

En este cuadro se contienen propiamente los resultados de la Regresión.


- Acorde a la columna Coeficientes la expresión de Regresión es la siguiente:
Ye = –5 .89 + 1.14X1 + 0.44X2
- Las columnas Error típico, Estadístico t y Probabilidad se refieren a la
realización de Pruebas de Hipótesis, en este caso Probabilidad = Significancia.
La Hipótesis Nula Implícita es H0: Coeficiente = 0.
Se ve que el único caso en el que se acepta la Hipótesis es para el Coeficiente de
la variable Agua, por esto se concluye que esa variable No aporta al análisis.

Análisis de los residuales

Observación Pronóstico Familia Residuos Residuos estándares


1 4,8486 1,1514 1,8229
2 1,1208 0,8792 1,3919
3 2,6997 -0,6997 -1,1077
4 5,9886 0,0114 0,0181
5 4,5408 -0,5408 -0,8562
6 2,2608 -0,2608 -0,4129
7 3,8397 0,1603 0,2538
8 2,1297 -0,1297 -0,2053
9 2,2608 0,7392 1,1702
10 4,4097 0,5903 0,9345
11 2,2608 -0,2608 -0,4129
12 1,1208 -0,1208 -0,1913
13 2,1297 -1,1297 -1,7885
14 2,8308 0,1692 0,2678
15 6,5586 -0,5586 -0,8843

Este cuadro muestra los valores de Ye y los residuos, se observa que todos son pequeños
por esto la estimación es buena. Con esta tabla se pueden hacer pruebas más complejas
como ser el Test de Autocorrelación y el de Heteroscedasticidad, pero estos no son
temas del curso por lo que se recomienda consultar bibliografía como Damodar
Gujarati, Econometría.

Como se ha podido observar son varios los resultados de este análisis, hecho que lo
convierte en una poderosa herramienta de decisión.

TALLER EN EXCEL 17
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


8. Pronósticos por Series Temporales

Los pronósticos son estimaciones de valores futuros en base a los valores pasados.
Hay varias técnicas para realizar Pronósticos, pero la que se desarrollará es la del
Suavizado Exponencial.

La técnica del Suavizado Exponencial pertenece al grupo de las técnicas de Pronósticos


de Serie Temporal. Tiene ciertas características básicas.
- Solo es útil para proyectar un periodo a futuro.
- Involucra un factor de confianza o credibilidad que se repitan los valores del
periodo inmediato anterior (lógicamente varía entre 0 y 1).
- El resultado depende únicamente de los datos pasados.

Los pasos a seguir para desarrollar el método son los siguientes:

1) Tabular los datos de la Variable en una Columna con un Encabezado.

2) Seleccionar la opción Suavización Exponencial en el menú Análisis de Datos.

3) Llenar el cuadro de diálogo.


En el Rango de entrada la columna con de la variable.
Factor de Suavización es el porcentaje de los Valores Pasados (anteriores al
periodo inmediato anterior) que cree que se repetirán para el periodo a predecir.
Se habilita Rótulos, si es que la primera celda tiene texto. En este caso sí.
El Rango de Salida se escoge a gusto. Crear Gráfico y Error típico se habilitan.

TALLER EN EXCEL 18
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com


4) Se obtienen los resultados del procedimiento.

Se observa que el valor de pronóstico para el siguiente periodo (Mes de Enero) es de


4.89 unidades en ventas.

También se observa los errores que son pequeños, lo propio se observa en el gráfico.

TALLER EN EXCEL 19
Juan Fernando Subirana Osuna

PDF created with pdfFactory trial version www.pdffactory.com

También podría gustarte