Está en la página 1de 9

Estadstica Descriptiva Bivariante e Intervalos de Confianza

Introduccin En este guin se presenta el anlisis conjunto de dos variables (anlisis bivariante) y una introduccin a los intervalos de confianza con Excel 2007. Vamos a trabajar con los siguientes datos:
Sexo M H H H H M M H M M Ojos N N A V V V N V A A

donde M=Mujer, H=Hombre, N=Negros, A=Azules, V=Verdes.

Tablas de contingencia Una vez introducidos los datos anteriores en la hoja de Excel 2007, podemos construir una tabla de doble entrada asociada a los datos anteriores: 1. Se selecciona Tabla Dinmica en la pestaa Insertar. 2. Se introducen las informaciones correctas en Tabla o rango y Ubicacin. Nosotros, por ejemplo, introducimos lo siguiente:

3. Una vez pulsado Aceptar, a la derecha aparecer una ventana con el nombre Lista de campos de tabla dinmica. En esta ventana, se arrastra con el ratn una variable en el rea Rtulos de columna y la otra en el rea Rtulos de fila; despus se arrastra una de las dos variables en el rea Valores:

4. Si en lugar de las frecuencias absolutas queremos obtener porcentajes (por filas o por columnas), hay que posicionarse en el rea Valores, en la parte superior de la flecha a la derecha de Cuenta de Ojos y se selecciona Configuracin de campo de valor En la ventana emergente, se selecciona la pestaa Mostrar valores como, y se selecciona % de fila o % de columna:

5. Finalmente, se puede crear un grfico: Ir a la pestaa Insertar Seleccionar Columna de entre las opciones de Grficos Seleccionar Columna en 2-D, Columna Agrupada pulsar Seleccionar Datos Seleccionar la tabla de contingencia completa:

80,00% 70,00% 60,00% 50,00% 40,00% 30,00% 20,00% 10,00% 0,00% A N V H M

Covarianzas y Correlaciones En este apartado veremos cmo calcular las matrices de covarianzas y correlaciones. Vamos a utilizar los datos de Paises.xlsx. De hecho, se trata de dos operaciones muy sencillas: el complemento Anlisis de datos nos ofrece dos opciones, Covarianza y Coeficiente de correlacin, que nos permiten calcular ambas matrices de manera inmediata. Los pasos necesarios se pueden resumir en las siguientes tres figuras:

Anlisis de pares de variables cuantitativas Empezamos este apartado dibujando un diagrama de dispersin entre dos variables cuantitativas. Vamos a utilizar los datos de Paises.xlsx, y en particular ln(PIB) (X) y Tasa de natalidad (Y): 1. Se copia en una nueva hoja las columnas Pas, ln(PIB) y Tasa de natalidad (en este orden). 2. Nos movemos a la pestaa Insertar, se abre el submen de Dispersin, y se escoge Dispersin slo con marcadores. 3. Se seleccionar Seleccionar datos, e se introduce en Rango de datos del grfico la celdas que contienen los datos, en nuestro caso =guion2!$B$1:$C$92. Se selecciona Aceptar. El diagrama de dispersin que se obtiene es el siguiente:

A continuacin, calculamos una regresin lineal con las mismas dos variables: 1. Se selecciona Anlisis de datos en la pestaa Datos; se selecciona Regresin y se pulsa Aceptar. 2. Se rellena la ventana emergente con las siguientes instrucciones:

3. Los resultados son los siguientes:


Resumen Estadsticas de la regresin Coeficiente de0,736134954 mltiple correlacin Coeficiente de determinacin R^2 0,54189467 R^2 ajustado 0,53674742 Error tpico 9,323987683 Observaciones 91 ANLISIS DE VARIANZA Grados de libertad de cuadradosde los cuadrados Suma Promedio F Valor crtico de F Regresin 1 9152,56716 9152,56716 105,278464 9,2913E-17 Residuos 89 7737,37042 86,9367463 Total 90 16889,9376 Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%Inferior 95,0% Superior 95,0% Intercepcin 75,52125521 4,59430152 16,4380276 1,05E-28 66,3924761 84,6500343 66,3924761 84,6500343 ln(PIB) -6,131938014 0,59762394 -10,2605294 9,2913E-17 -7,31940402 -4,944472 -7,31940402 -4,944472

4. La recta de regresin que se ha estimado se puede introducir en el anterior diagrama de dispersin de la siguiente manera: Nos situamos encima de los datos, es decir, los puntos y se pulsa el botn derecho del ratn. En el cuadro emergente se selecciona Agregar lnea de tendenciay se elige Lineal:

Nota: a la hora de calcular una recta de regresin podemos pedir a Excel 2007 que nos devuelva tambin el grfico de los residuos, para hacer un diagnstico del modelo estimado (por lo menos a nivel grfico). Para hacer eso, en la ventana emergente de la opcin Regresin hay que seleccionar Grfico de residuales. El grfico para el modelo anterior es el siguiente:

Intervalos de confianza para la media


Ejemplo: En una muestra de 100 personas se ha obtenido que el dinero medio en efectivo del que disponen es de 68. Si se sabe que la desviacin tpica de la poblacin es 7.9, halla el intervalo de confianza con un nivel de significacin de 0.05 para la media de la poblacin. Abres una hoja de clculo e introduces los siguientes valores

=INTERVALO.CONFIANZA(B3;C3;D3) y se obtiene un valor - En la celda E3 escribes aproximado igual a 1.55, que es la semilongitud del intervalo.

- En la celda F3 introduces =A3 =A3-E3 y se obtiene 66.45 - En la celda G3 introduces =A3+E3 y se obtiene aproximadamente 69.55 =A3+E3

As, un intervalo de confianza del 95% para la media es (66.45 ; 69.59) n

Intervalos de confianza para la proporcin


Ejemplo: Se ha tomado una muestra de 400 personas y se ha contabilizado que 250 de ellas practican deporte. Halla el intervalo de confianza para la proporcin de personas que practican deporte, con un nivel de confianza del 99%. Abres una hoja de clculo e introduce los siguientes valores: introduces

- En la celda B4 introduces "=(1+A4)/2 y se obtiene 0.995. "=(1+A4)/2" - En la celda C4 introduces "=DISTR.NORM.ESTAND.INV(B4) y se obtiene 2.58 =DISTR.NORM.ESTAND.INV(B4)" 58 aproximadamente. =B8/A8" - En la celda C8 introduces "=B8/A8 y se obtiene 0.625 - En la celda D8 introduces "=1 =1-C8" y se obtiene 0.375 - En la celda E8 introduces "=RAIZ(C8*D8/A8) y se obtiene 0.02 =RAIZ(C8*D8/A8)" - En la celda F8 introduces "=C4 y se obtiene 2.58 =C4" - En celda G8 introduces "=F8*E8 y se obtiene 0.062 =F8*E8" - En la celda H8 introduces "=C8 =C8-G8" y se obtiene 0.563 - En la celda I8 introduces "=C8+G8 y se obtiene 0.687 =C8+G8"

n (0.563 , 0.687) As, un intervalo de confianza del 99% para la proporcin es (