Está en la página 1de 11

Cap tulo 2 Recetas para el Tema 3

2.1. Dando nombre a un rango

Como ya se ha visto, EXCEL es un programa para gestionar hojas de clculo, a es decir, estructuras bidimensionales, formadas por celdillas o casillas, que pueden contener elementos tales como magnitudes numricas, cadenas de texto y frmulas y e o expresiones matemticas de numerosos tipos. a Recordemos que para indicar un rango, es decir, una submatriz, se emplean dos referencias de casillas, separadas por dos puntos. Por ejemplo B10:D14 indica un conjunto rectangular de casillas, cuyo vrtice superior izquierdo es B10 y cuyo vrtice e e inferior derecho es D14. A B C D E ..... ---------------------------------------. | 10 | B10 C10 D10 11 | B11 C11 D11 12 | B12 C12 D12 13 | B13 C13 D13 14 | B14 C14 D14 . | Cuando los rangos son de pequea extensin, se pueden manejar fcilmente con el n o a ratn o las teclas de movimiento de cursor. Pero si los rangos son grandes, por ejemplo o de miles o millones de casillas, resulta muy cmodo darles un nombre simblico, y o o referenciar dicho rango mediante su nombre. Esta referencia se puede emplear por ejemplo como argumento de frmulas. o Para asignar un nombre a un rango tenemos, como siempre, numerosas posibilidades. Una de ellas es la siguiente. Nos posicionamos en la pequea venta de la n parte superior derecha, y escribimos el rango que deseemos nombrar, por ejemplo A1:A1000. Acto seguido, validamos pulsando | , con lo que dicho rango queda

17

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

18

marcado. Manteniendo el rango marcado, nos posicionamos en la susodicha ventana, y escribimos un nombre, por ejemplo, datos, y volvemos a validar pulsando | , con lo que el nombre datos queda asignado al rango. Mientras se mantenga la asignacin, podremos referirnos al rango mediante su o nombre. Por ejemplo, si queremos calcular la media aritmtica de los valores, podree mos escribir =PROMEDIO(datos) en lugar de =PROMEDIO(A1:A1000). Si queremos eliminar o modicar una asignacin, nos iremos a la opcin Insertar o o del men principal, subopcin Nombre, donde podremos realizar estas operaciones y u o tambin crear nuevos nombres. e

2.2.

Receta para calcular parmetros mediante la a herramienta Estad stica Descriptiva

Vamos a utilizar como ejemplo el nmero de hijos de 150 familias, y vamos a u calcular una serie de parmetros estad a sticos mediante la herramienta espec ca denominada Estad stica Descriptiva. Para ello, dentro de la opcin Herramientas, en la subopcin Anlisis de Datos, o o a accederemos a Estad stica Descriptiva, y el la forma usual, introduciremos el rango de valores a analizar, en nuestro caso los datos estn en el rango A1:A150, que se a encuentran agrupados en columna. Como los datos no estn encabezados por ningn a u rtulo, no indicaremos nada en la opcin Rtulos en primera la. o o o Queremos que el resultado se coloque en la misma hoja donde estn los datos, con a lo que especicaremos un rango de salida, en este caso la casilla D6 que ser la esquina a superior derecha a partir de la cual se producir la salida de resultados. Finalmente, a activaremos la pestaa correspondiente a Resumen de Estad n sticas. Los pasos seguidos pueden verse en la Figura 1.

Figura 1. Acceso a la herramienta Estad stica Descriptiva, desde Anlisis de Datos . a

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

19

Pulsando Aceptar obtendremos una serie de parmetros estad a sticos bsicos como a media aritmtica, mediana, etc. Los resultados de nuestra ejemplo pueden verse en la e Figura 2.

Figura 2. Parmetros estad a sticos obtenidos con la herramienta Estad stica Descriptiva. Notemos que algunos parmetros no coinciden con los denidos en nuestras clases. Por a ejemplo, la varianza y la desviacin t o pica o estndar son realmente la cuasivarianza a y la cuasidesviacin t o pica. Tambin los coecientes de asimetr y curtosis presentan e a diferencias. Vase siguiente seccin. e o

2.3.

Receta para el clculo de parmetros a gusto a a del consumidor

A continuacin vamos a exponer un procedimiento para calcular parmetros eso a tad sticos empleando las funciones espec cas de las que EXCEL dispone para ello. Aunque las funciones de tipo estad stico son muy numerosas, para nuestro ejemplo nos limitaremos a las que exponemos a continuacin. Observemos que cuando indicao mos datos nos referimos a un rango que puede ser indicado en la forma usual Ai:Fj, o mediante un nombre. PROMEDIO(datos). Calcula la media aritmtica de los datos. e

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

20

MEDIANA(datos). Calcula la mediana. MODA(datos). Calcula la moda. CUARTIL(datos;n). Calcula el cuartil n de los datos. As CUARTIL(datos;3). Calcula Q3 . PERCENTIL(datos;). Calcula el percentil 100 , siendo un nmero entre u 0 y 1. Por ejemplo PERCENTIL(datos;0.3) calcula P30 . VARP(datos). Calcula la varianza. DESVESTP(datos). Calcula la desviacin t o pica. MAX(datos). Calcula el valor mximo. a MIN(datos). Calcula el valor m nimo. COEFICIENTE.ASIMETRIA(datos). Calcula el coeciente de asimetr a de Fisher. CURTOSIS(datos). Calcula el coeciente de curtosis o aplastamiento. Adems, a partir de estos parmetros podemos calcular otros que se construyen a a a partir de ellos como, RANGO. Diferencia entre el mximo y el m a nimo, MAX(datos)-MIN(datos) RECORRIDO INTERCUART ILICO. IQR=CUARTIL(datos,3)-CUARTIL(datos,1) COEFICIENTE DE VARIACION. Cv(X)=DESVESTP(datos)/ABS(PROMEDIO(datos)) COEFICIENTE DE ASIMETR DE PEARSON. IA As=(PROMEDIO(datos)-MODA(datos))/DESVESTP(datos) Para nuestro ejemplo, emplearemos los datos brutos relativos a las puntuaciones de 175 alumnos. Suponemos que estos datos se encuentran en el rango A1:A175. mediante el procedimiento indicado al principio de este cap tulo, daremos a estos datos el nombre simblico dat175. o Acto seguido, iremos escribiendo en sucesivas casillas las frmulas de los parmeo a tros que deseemos, empleando al nombre dat175, por ejemplo, para calcular la media aritmtica escribiremos PROMEDIO(dat175). Adems, aadiremos los rtulos ine a n o dicativos que sean necesarios, como se muestra en la Figura 3. Una vez terminado, el resultado nal se muestra en la Figura 4.

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

21

Figura 3. Clculo de parmetros estad a a sticos empleando las correspondientes frmulas. o

Figura 4. Parmetros estad a sticos obtenidos mediante frmulas de EXCEL. o

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

22

Para terminar este apartado, hemos de advertir que las frmulas que emplea EXo CEL para calcular algunos parmetros producen resultados distintos que las explia cadas en las clases. Por ejemplo el coeciente de asimetr de Fisher y el coeciente a de curtosis producen resultados diferentes. As por ejemplo, nuestra denicin del , o coeciente de asimetr de Fisher es, a 1 = 1 3 = 3 S nS 3
n

(Xi X)3
i=1

mientras que EXCEL emplea la siguiente expresin, o COEFICIENTE.ASIMETRIA = n (n 1)(n 2)S 3


n

(Xi X)3
i=1

Como puede verse, aunque las expresiones dieren, la diferencia es pequea, sobre n todo para valores grandes de n, que son los ms usuales en las situaciones reales. Algo a similar sucede con el coeciente de curtosis o aplanamiento. Tambin en el clculo e a de los cuartiles y percentiles podemos encontrar a veces pequeas discrepancias. En n trminos generales, daremos por buenos los resultados obtenidos con las funciones de e EXCEL.

2.4.

Clculo de parmetros cuando los datos ya a a estn resumidos a

Puede ocurrir que nos encontremos con los datos ya resumidos en intervalos, y no dispongamos de los datos brutos. Veamos como se pueden calcular los parmea tros en este caso. Para hacerlo, emplearemos el ejemplo de las puntuaciones de 175 estudiantes, ya agrupadas en intervalos, de la siguiente forma, (ei1 , ei ] (46,5, 55,5] (55,5, 64,5] (64,5, 73,5] (73,5, 82,5] (82,5, 91,5] (91,5, 100,5] xi 51 60 69 78 87 96 ni 11 16 39 63 35 11

El clculo de parmetros se hace aplicando las tcnicas estudiadas en el Tema 3., a a e cuando los datos estn agrupados en intervalos, empleando las marcas de clases, y a teniendo en cuenta que, obviamente, los valores obtenidos no sern en general los que a obtendr amos a partir de los datos brutos originales. Esta diferencia est originada a por la prdida de informacin que se produce en la agrupacin. e o o Como ejemplo, calcularemos la media aritmtica, la varianza, la desviacin t e o pica, el coeciente de asimetr de Fisher y el coeciente de curtosis. Dispondremos los a clculos en EXCEL, como aparecen en la Figura 5. a

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

23

Figura 5. Parmetros estad a sticos obtenidos por clculo directo a partir de una tabla de a frecuencias. Como puede verse, a partir de la tabla bsica, con las marcas de clase, xi , y a las frecuencias, ni , hemos construido una serie de columnas adicionales, empleando frmulas de EXCEL, y copindolas en la forma usual. Notemos que ma denota la o a media aritmtica. Por ejemplo, para calcular el coeciente de asimetr de Fisher, e a 1 = 3 1 = 3 S nS 3
n

(Xi X)3 =
i=1

1 nS 3

ni (xi X)3
i=1

construimos una columna que contenga las cantidades ni (xi X)3 . Como es usual, para ello, calculamos la primera cantidad mediante escribiendo la frmula adecuao da en la primera casilla, y a continuacin copiaremos la frmula en las casillas que o o sean necesarias. Una vez hecho esto, sumaremos la columna mediante el botn . o 3 Finalmente, dividiremos por n, y por S , que ya se ha calculado previamente.

2.5.

Estudio de la concentracin. Curva de Lorenz. o Indice de Gini

Para estudiar la concentracin de una variable, visto en la teor dos herramientas o a bsicas, por una parte la curva de Lorenz, que es la l a nea poligonal obtenida uniendo

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

24

los puntos (0, 0), (X1 /T, 1/n), ((X1 + X2 )/T, 2/n),..., (T /T, n/n) = (1, 1), siendo X1 , X2 , . . . , Xn los valores de la variable, ordenados de menor a mayor, y T el total de la misma, es decir, T = n Xi . i=1 Esta poligonal se ubica en un cuadrado de dimensiones 1 1, y se mantiene siempre por encima de la bisectriz del primer cuadrante. La m nima concentracin o corresponder a un reparto equitativo o uniforme de T , con lo cual la curva de Lorenz a coincide con la bisectriz. Por contra, conforme este reparto es menos equitativo, es decir, el total T tiende a concentrarse ms en uno o varios valores, dicha curva tiende a a separarse de la bisectriz. De esta forma, la observacin de la curva de Lorenz nos o permite formar un juicio sobre la concentracin de una variable. o La supercie, , de la regin comprendida entre la bisectriz y la curva de Lorenz o ser tanto ms pequea cuanto menor concentracin haya. El m a a n o nimo valor de dicha supercie es 0 y la cota superior 1/2. Podemos pues construir el siguiente parmetro a de concentracin, IG = 2 denominado Indice de Gini, cuyo valor se obtiene despus o e de un clculo directo, y resulta ser, a IG = 1 2n2 X
n n

|Xi Xj |
i=1 j=1

Este valor se encuentra entre cero y uno. A mayor valor del ndice de Gini, mayor concentracin. A menor valor, menos concentracin, es decir, ms equitatividad en el o o a reparto del total de la variable. Existe una modicacin de la descripcin anterior, empleando porcentajes en lugar o o de proporciones, es decir, empleando los puntos de unin (0, 0), (100 X1 /T, 100/n), o (100(X1 + X2 )/T, 200/n),..., (100 T /T, 100 n/n) = (100, 100), para construir la curva de Lorenz. En tal caso, dicha curva se ubica en un cuadrado de dimensiones 100100, y el ndice de Gini se dene entonces como IG = 2 /1002 , siendo la supercie entre la curva y la bisectriz, y donde la divisin por 1002 se realiza ahora con objeto de que o dicha cantidad se mantenga entre cero y uno. De cualquier manera, la expresin nal o sigue siendo, n n 1 IG = 2 |Xi Xj | 2n X i=1 j=1 A continuacin, vamos a ver como se puede realizar el estudio de la concentracin o o empleando EXCEL. Como ejemplo, emplearemos los datos correspondientes a las puntuaciones de 175 estudiantes. Supongamos, como ya hemos hecho en otros ejemplos, que estos datos estn ubia cados en el rango A1:A175, con el nombre dat175. Lo primero que haremos, es proceder a ordenarlos de menor a mayor, para lo cual marcaremos el rango completo y pulsaremos el botn, o
Z
A

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

25

Seguidamente, con objeto de calcular B1 la larga frmula, o

n i=1

n j=1

|Xi Xj |, escribiremos en la casilla

=SUMAR.SI(dat175;>&TEXTO(A1;0)) -SUMAR.SI(dat175;<&TEXTO(A1;0)) +A1*(CONTAR.SI(dat175;<&TEXTO(A1;0)) -CONTAR.SI(dat175;>&TEXTO(A1;0))) Esta frmula se justica fcilmente, sin ms que observar la estructura de la o a a expresin n |Xi Xj |. Acto seguido, marcaremos la casilla, y copiaremos la frmula o o j=1 en todo el rango B2:B175. Sumando el rango B1:B175, obtendremos,
n n

|Xi Xj |
i=1 j=1

Y dividiendo esta cantidad por 2*175*175*PROMEDIO(dat175) obtendremos el ndice de Gini. Vase Figura 6. e

Figura 6. Indice de Gini y curva de Lorenz para las puntuaciones de 175 estudiantes. Datos brutos. Para obtener la curva de Lorenz, construiremos los puntos de la poligonal en las columnas C y D. Para ello, en C1 pondremos un cero, y en C2 escribiremos la

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

26

frmula =C1+A1/SUMA(dat175). Marcaremos esta casilla y la copiaremos hasta o la casilla C176. Acto seguido, en D1 colocaremos un cero, y en la casilla D2 escribiremos la frmula =D1+1/175. Marcaremos esta casilla y la copiaremos hasta la casilla D176. o Con estas operaciones , hemos conseguido construir los puntos de la l nea poligonal que constituye la curva de Lorenz. Para dibujar la curva emplearemos los grcos de a dispersin, con la opcin de conexin de puntos por segmentos, sin marcadores. Tamo o o bin dibujaremos la bisectriz del primer cuadrante. Aadiendo los rtulos adecuados, e n o y eligiendo colores apropiados hemos obtenido la curva que aparece en la Figura 6. Como puede verse, hay poca concentracin, y ello se reeja tambin en el pequeo o e n valor del ndice de Gini.

Figura 7. Estudio de la concentracin de las puntuaciones de 175 a partir de los datos o agrupados en intervalos. Recordemos que tambin es posible estudiar la concentracin a partir de unos e o datos ya resumidos en intervalos. No obstante, los resultados no coinciden con los que se obtendr a partir de los datos brutos, debido a la prdida de informacin. A an e o modo de ejemplo, hemos realizado el estudio con los datos de las puntuaciones de los 175 estudiantes, ya resumidas en intervalos. Los resultados se muestran en la Figura 7., y como puede verse, el ndice de Gini diere, aunque levemente, del obtenido con anterioridad.

Jos A. Mayor Gallego e

F.M.E. Estad stica Descriptiva 2004-2005. Recetario EXCEL. Tema 3. [J.A.Mayor]

27

Finalmente, en la Figura 8., se muestran los resultados obtenidos al estudiar la concentracin de los datos correspondientes al nmero de hijos de 150 familias, ya o u empleados anteriormente en numerosos ejemplo, tanto a partir de los datos brutos como a a partir de los datos resumidos en una tabla de frecuencias. Como puede verse, y como era de esperar, ahora los resultados son totalmente coincidentes, pues en este tipo de datos, el resumen no produce prdida de informacin. e o

Figura 8. Estudio de la concentracin del nmero de hijos de 150 familias, a partir de los o u datos brutos y de los datos resumidos.

Jos A. Mayor Gallego e

También podría gustarte