A modo de resumen indicamos que en la primera clase se vio como desarrollar el Mtodo Estadstico, o sea los pasos a seguir para llevar adelante un proceso acorde con la informacin obtenida en un determinado evento. Estos pasos serian
De esos 6 pasos claramente identificables, hablamos en nuestra primera entrega del primero de ellos (Como seleccionar el tamao de una muestra), y de cmo a partir de la obtencin de los datos y de su clasificacin, establecer tablas de valores agrupados. Ahora nos encargaremos de analizar el resto de los puntos, centralizndonos ms en como tabular dichos datos y cmo proceder para calcular las medidas estadsticas que vamos a necesitar para comprender el comportamiento de nuestra muestra.
Comienza entonces la elaboracin matemtica y medicin de los datos. El anlisis se va complementar con la obtencin de indicadores estadsticos como las medidas: de tendencia central, dispersin, posicin y forma. A manera de facilitar la comprensin del anlisis de cada medida, la idea es trabajarlo bajo tres aspectos Estos son:
1. La nominacin de dicha medida y su definicin 2. La forma de calcularlo matemticamente a travs de una formula y que representa en la muestra obtenida 3. Como calcularlo a travs del programa Excel. (para facilitar en un futuro su obtencin)
Este proceso tiene como finalidad conocer tericamente la medida que est analizando, el porqu de su obtencin y la definicin terica que ayuda a comprender an ms sobre ella.
En un segundo paso, se indicar la formula o el procedimiento para su clculo con un ejemplo claro. En este punto el alumno se preguntara Para que necesito la formula? Para que necesito hacer el clculo matemtico si despus un programa como el Excel, me facilita todo? Qu sentido tiene, si cuando vuelco los datos al programa informtico con solo apretar una o a lo sumo dos teclas ya s cul es su resultado? Esto tiene su sentido, y ser explicado en forma sencilla. Cuando uno aprende la matemtica o en este caso en particular la estadstica sin comprender lo que hago, sin saber porque llegue a ese resultado y sin saber estimar algn error posible de clculo, solo estoy haciendo un mecanismo robtico, un movimiento por inercia y la intensin es que comprendamos, que sepamos lo que estamos haciendo. Sin lugar a dudas hoy en da, con todos los procesadores de clculo y programas informticos, no tiene mucho sentido llenarnos de clculos y de frmulas para obtener un resultado determinado, pero si es vlido saber de qu se trata y cul es su importancia o su necesidad de obtencin. Tambin es cierto que muchas veces no contamos con elementos informticos y s con una simple calculadora manual que puede ayudarnos muchsimo, pero adems y esto es netamente personal, el hecho de proponernos en algunos casos hacerlo sin la ayuda de programas, nos hace salir de la mecanizacin y ayuda a desarrollar un poco ms el pensamiento y la memoria, que no es poca cosa.
Comenzaremos con un ejercicio para entender lo que debemos hacer e ir ejemplificando un poco ms cada uno de los procedimientos, tanto de frmulas como de manejo de Excel
Ejemplo:
A continuacin presentamos los datos recabados de una prueba de salto en largo realizada a 108 alumnos.
1. Pasamos todos los datos a el programa Excel y vamos a construir una tabla de datos agrupados utilizando las bondades de este programa informtico
Como se ver los datos estn registrados en una celda compuesta por una letra y un nmero. Por ejemplo el primer dato ingresado est en la celda (A2); la Celda (H8), contiene el dato 366 y el ltimo dato registrado est en la Celda (L10)
2. Para armar una tabla de datos agrupados necesitamos:
La cantidad de datos registrados La cantidad de intervalos a utilizar EL rango de la prueba tomada La amplitud de intervalo
Por lo tanto debajo de los datos ingresados y en una Celda para cada valor escribimos los que vamos a calcular
En la Celda (B13) escribimos n (nmero de datos) en (B14) Cantidad de intervalos; (B15) Valor mximo, (B16) Valor mnimo; (B17) Rango y (B18) Amplitud de intervalo.
En la Celda (B12) escribimos n (nmero de datos) en (B13) Cantidad de intervalos; (B14) Numero de Clases, (B15) Valor mximo, (B16) Valor mnimo; (B17) Rango; (B18) Amplitud de intervalo y (B19) Amplitud Final,. Las celdas correspondientes a (C12, 13, 14, 15, 16, 17, 18 y 19) se ubicarn los resultados obtenidos para cada variable.
A continuacin desarrollaremos que significa y como se obtiene cada una de ellas
Cantidad de datos registrados: (n: B12). Para obtener esta informacin utilizaremos la funcin de Excel llamada CONTAR: CONTAR: Cuenta un conjunto de celdas que posean nmeros en su contenido Formato: CONTAR (ref1; ref2;) Categora: Estadsticas
Para proceder a contar
1. Debemos parar el cursor en la Celda (C12) lugar donde queremos que se registre el dato. 2. Vamos a insertar funcin y aparece un cuadro (Grfico adjunto), seleccionamos la categora Estadstica y luego CONTAR
3. Aceptamos y aparece el siguiente cuadro
4. Ahora llevamos el mouse a la celda (A2) Primer dato y apretando con el botn derecho arrastramos hasta la celda (L10) ltimo dato. Veremos que en la casilla Valor 1 se escribe automticamente A2:L10
Al aceptar automticamente se registra el dato en la casilla (C12), lugar donde queramos que fuese colocado
Determinar el nmero de intervalos (Cantidad de intervalos). El nmero de intervalos depende del tamao de la muestra o poblacin de datos.
Como no es muy grande (remitirse a la clase I, donde se explica este concepto) elegimos ,
1. Debemos parar el cursor en la Celda (C13) lugar donde queremos que se registre el dato. En dicha celda escribimos . Recordemos que la cantidad de datos registrados lo tenemos en la celda (C12). Al hacerlo se pintar dicha celda y dndole entrada nos dar el resultado esperado
2. Como el clculo de una raz cuadrada no siempre es exacto y nos da como resultado un numero irracional, debemos proceder a transformar dicho resultado a un nmero entero. Por eso nos posicionamos en la casilla C14 (nmero de clases) y le solicitamos que redondee el nmero de la celda anterior a entero
En la Casilla (C14) observamos que le indicamos que redondee el nmero de la casilla C!3 y luego con punto y coma le indicamos el nmero 0, que significa ningn decimal. El resultado obviamente es 10. Tomaremos entonces 10 intervalos para agrupar nuestros datos
Determinar el ancho de cada intervalo, o sea la amplitud de intervalo. Para ello necesitamos, primero conocer el Rango que es a diferencia entre el mayor valor y el menor valor de la muestra que tenemos
1. Para determinar el valor mximo y mnimo utilizaremos las siguientes frmulas de Excel:
MAX: Localiza y muestra el valor mximo de un conjunto de nmeros. Formato: MAX(nmero1;nmero2;) Categora: Estadsticas
MIN: Localiza y muestra el valor mnimo de un conjunto de nmeros. Formato: MIN(nmero1;nmero2;) Categora: Estadsticas
Ubicamos el cursor en la celda (C15), luego vamos a insertar formulas, luego buscamos estadsticas y ms tarde MAX
Ahora llevamos el mouse a la celda (A2) Primer dato y apretando con el botn derecho arrastramos hasta la celda (L10) ltimo dato. Veremos que en la casilla Numero 1 se escribe automticamente A2:L10
Al aceptar automticamente se registra el dato en la casilla (C15), lugar donde queramos que fuese colocado
Idntico procedimiento hacemos para encontrar el valor mnimo. La nica diferencia que en la funcin ser en la categora estadstica MIN
Una vez encontrado cada una de las medidas necesaria, solo nos falta calcular el rango y la amplitud. El rango es la diferencia entre el Xmax y el Xmin y la amplitud, la divisin del rango y la cantidad de intervalos
Para ello nos paramos en la Celda (C17) y escribimos Celdas respectivas del valor mximo y mnimo hallado. El resultado obtenido es el rango
Una vez realizado este procedimiento, ubicamos el cursor en la celda C18 y escribimos En la casilla C17 tenemos el rango y casilla C14 el nmero de clases o sea la cantidad de intervalos que va a tener nuestra tabla
Como se ver nos dio el rango dio como resultado 89 y la amplitud , pero no podemos hacer intervalos con nmeros con decimales y adems se aconseja que el numero sea entero e impar, por eso corregimos la amplitud en la siguiente casilla . Lo que tenemos que hacer es indicarle es que redondee al nmero entero impar ms cercano del resultado obtenido
CONSTRUCCION DE LA TABLA DE DATOS AGRUPADOS
Determinar limites inferiores y superiores de cada intervalo Una vez que tenemos todos los datos, comenzamos a construir la tabla de datos agrupados. Dicha tabla la podemos armar en otra hoja, para tener ms ordenado el trabajo. En la primer hoja los datos y los clculos y en la otra nuestra propia tabla. Ac tambin podemos agregar aprovechando esta organizacin, el nombre a cada hoja de clculo. Para ello nos posicionamos con el cursor en la Hoja1 y al presionar el botn derecho del mouse sale las opciones y optando en cambiar el nombre, escribimos debajo Datos. Hacemos lo propio en la Hoja2 y la nombramos Tabla.
Podemos comenzar indicando el titulo para saber de qu se trata la tabla de dados. Luego en la casilla B5 escribimos LI (lmite inferior de cada intervalo) y en la siguiente LS (lmite superior de cada intervalo). Luego una celda ms debajo de LI (B6) escribimos , que es el lugar donde se encuentra el dato que necesitamos (DATOS!, representa la hoja y C16, la casilla de ubicacin); resultado 317.
En la celda siguiente (B7), escribimos Esto significa que el programa asumir que debe crear el segundo lmite inferior que se compone del valor de la Celda (B6) sumado la amplitud de intervalo que se encuentra en la hoja DATOS! Y en la casilla C19.
Ac debemos hacer un parntesis para explicar una opcin del programa Excel que nos permite realizar directamente y sin necesidad de repetir paso a paso el procedimiento anterior. Cuando se trabaja algn tipo de informe en Excel encontramos que necesitamos hacer una frmula que se repite en varias celdas, con el objetivo de ahorrar tiempo y precisin al momento de ejecutar un clculo. En este caso el programa nos ofrece la posibilidad de fijar celdas. Para trabajar con referencias absolutas se debe especificar escribiendo el signo $ delante de la letra de la columna y del nmero de fila, segn corresponda (a veces debemos tener solo fija la columna o solo fija la fila) Por ejemplo $A$3 indica que siempre ser la celda A3 y, al aplicar llenados -hacia abajo o hacia la derecha-, u operaciones de copiar y pegar, las referencias que tengan el signo $ delante no sern modificadas.
En nuestro caso en particular nos paramos en la celda (B7) y observaremos que en la parte superior aparece , ah debemos introducir el signo $ delante de C y de 19. Y nos queda
Una vez realizado este procedimiento, nos paramos en la celda (B7) con el cursor en el extremo derecho inferior y bajamos hasta la casilla (B15) que son los 10 intervalos determinados y al aceptar se forma la primera parte de la tabla. Como se ver, sum en cada casilla 9 que es nuestra amplitud.
Para establecer la otra parte de la tabla (Limite Superior del intervalo), nos posicionamos en la celda (C6) y escribimos Que es el dato que tenemos del lmite inferior del segundo intervalo reducido en una unidad. Aparecer el valor 325. A continuacin escribimos en la Celda (C7) y repetimos el procedimiento anterior de llevar el cursor desde esa celda a la celda (C15) y se construye la tabla correspondiente
Determinar las frecuencias absolutas, frecuencias acumuladas y frecuencias relativas.
Comencemos con la frecuencia absoluta (f). Para trabajar con intervalos emplearemos una nueva funcin del programa de Excel
FRECUENCIA: Muestra el nmero de veces que se repite un nmero, dentro de un rango de celdas. Eso quiere decir que vamos a establecer la cantidad de veces que un dato se registra dentro de cada intervalo
Nos ubicamos en la celda (D6), donde se ubicara la primera frecuencia del intervalo, pero para que aparezcan todas las frecuencias absolutas, debemos seleccionar la totalidad de las casillas correspondientes. Lluego vamos a insertar formulas, luego buscamos estadsticas y ms tarde, FRECUENCIA
Cuando activamos la funcin FRECUENCIA nos muestra una ventana que pide dos requisitos: DATOS, que equivale al rango de celda donde est los datos iniciales y Grupo, correspondiente en nuestro caso, a los lmites superiores de la tabla de frecuencia. Eso quiere decir que toma elementos en forma de matriz y busca la cantidad (o sea la frecuencia) para cada lmite superior del intervalo
En datos indicamos DATOS!A2:L10 (que son todos los datos que tengo incorporados) y en Grupos indicamos C6:C15 que son los limites superiores de nuestra tabla.
Despus de seleccionar las matrices de datos y ubicaciones, no debemos aceptar porque aparecer solo en la primer celda el valor buscado; debemos presionar simultneamente las teclas CONTROL + MAYS + ENTRAR y veremos que aparecen todas las frecuencias absolutas de cada intervalo
Para la frecuencia acumulada (que llamaremos con la letra f mayscula F), el procedimiento es el siguiente. Como las frecuencias acumuladas son la suma sucesiva de las frecuencias absolutas, nos paramos en la celda (E6) y escribimos (valor de la primer frecuencia) y luego en la celda (E7) , que es justamente la suma de las dos frecuencias, luego arrastramos el mouse hasta la ltima Celda y tendremos la suma de cada frecuencia en cada clase
Frecuencia Relativa (fr): Equivale a la razn de las frecuencias de cada intervalo sobre la totalidad de los datos (n o N, dependiendo del caso). Matemticamente se expresa: Frecuencia Relativa Acumulada (FR): Presenta un saldo acumulado de las frecuencias relativas de cada intervalo de clase. Su clculo resulta dela suma del acumulado de las frecuencias relativas de los intervalos anteriores ms la frecuencia relativa del intervalo actual. O bien utilizando la misma frmula anterior pero la razn ser con las frecuencias acumuladas.
Para obtener la frecuencia relativa, nos ubicamos en la celda F6 y escribimos =D6/$E$15. En D6 tenemos la primer frecuencia y en E15 la cantidad de datos registrados. Obsrvese que lo indicamos con el signo $ tanto en las filas como en las columnas, porque ese dato que divide es fijo. Cabe aclarar que al ser una divisin entre dos nmeros, el resultado puede dar excesivos nmeros decimales, por lo que sera conveniente reducirlos solo a dos. Para ello podemos utilizar la funcin redondear, y podramos ya indicarlo de antemano cuando realizamos la divisin correspondiente; entonces en vez de escribir, =D6/$E$15, lo reemplazaramos por =REDONDEAR(D6/$E$15;2). El nmero 2 que esta luego de la formula, indica dos decimales, si queremos ms o menos nmeros simplemente indicamos el nmero que deseamos.
Idntico procedimiento realizamos para el clculo de la Frecuencia relativa acumulada. Nos posicionamos en la celda G6 y escribimos =REDONDEAR(E6/$E$15;2). En E6 tenemos la primera frecuencia acumulada y en E15 la cantidad de datos registrados. Obsrvese que lo indicamos con el signo $ tanto en las filas como en las columnas, porque ese dato que divide es fijo y el dos significa la cantidad de decimales solicitados. Paso seguido luego de aceptar, arrastramos el mouse hasta la ltima Celda y tendremos la suma de cada frecuencia relativa acumulada de cada clase
a
Ahora vamos a establecer lo que se llama Marca de la Clase o tambin llamado Punto medio. Este es un valor representativo que centraliza los limites inferiores y superiores de los intervalos, justamente las Marcas de Clase (Mc): Se define como el punto medio de un intervalo de clase. La pregunta es Para qu lo calculamos? La respuesta es simple: al establecer intervalos con limites inferiores y superiores, no podemos saber a ciencia cierta cul fue la marca de cada uno de los alumnos o personas que representan la frecuencia y por esa razn la centralizamos en una sola marca que llamaremos Marca de clase o Punto medio.
Por lo tanto se calcula de la siguiente forma Las marcas de clase son muy utilizadas en algunas grficas estadsticas y en clculos que sern vistos posteriormente. En este punto aclaramos por qu decamos que es conveniente que la amplitud sea negativa; Al sumar dos nmeros positivos o dos nmeros negativos la suma siempre es un numero par y al ser dividido por dos, el resultado siempre es un valor entero.
Para confeccionarlo con el programa Excel, en nuestro caso, nos posicionamos en la celda (H6) y escribimos . Justamente es el lmite inferior (B6) y el lmite superior (C6) que sumamos y lo dividimos por dos. Al darle entrada nos da el valor del primer punto medio y luego al arrastrar el cursor hacia abajo nos va dando la totalidad de los puntos medios requeridos