Está en la página 1de 12

Unidad 2.

Representacin numrica y grfica de datos


Presentacin de la unidad
En la unidad anterior, conociste las dos grandes divisiones de la estadstica: la que se dedica a la recoleccin, presentacin y categorizacin de datos, llamada estadstica descriptiva y la que se dedica a realizar hiptesis con base en dichos datos, la inferencial. Tambin aprendiste a determinar el espacio de estudio (es decir, la poblacin) y las variables que se van a estudiar de acuerdo al problema planteado. En esta unidad estudiars la estadstica descriptiva y aprenders cmo organizar y presentar los datos obtenidos mediante el muestreo en poblaciones. Cuando se realiza un trabajo que requiere a la estadstica, se disean instrumentos para obtener los datos deseados. Existen muchos mtodos para recolectar informacin, pero los ms frecuentes son:

Otra de las tcnicas ms recurridas en estadstica para recolectar informacin son los experimentos, revisa en qu consisten. Un experimento es una prueba que se realiza para determinar las caractersticas o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qu alimentos te parecen ms salados. Tambin, experimento se define como el proceso que se realiza para verificar una serie de hiptesis relacionadas con un determinado fenmeno, en el cual se determinan las caractersticas o comportamientos del fenmeno que se analiza. Por ejemplo, un experimento para determinar la velocidad de la luz en el vaco.

La diferencia entre la primera y la segunda definicin es que en la segunda se parte de una hiptesis mientras que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin antes predecir cul ser ms salado. En el segundo ejemplo, la hiptesis, a partir de estudios anteriores, es que la velocidad de la luz en el vaco es de 300 000 km/seg. Por lo tanto, el experimento verifica si esta hiptesis es cierta o no y en l cabe un margen de error experimental. Los datos que se recopilan, usando alguna tcnica de las que acabamos de describir u otra, son organizados de acuerdo a los parmetros de la estadstica descriptiva que estudiars en esta unidad.

Propsitos de la unidad
En esta unidad: Identificars algunos conceptos que se utilizan en estadstica descriptiva. Organizars datos en diferentes tipos de tablas y elaborars varios tipos de grficas.

Competencia especfica
Utiliza las tcnicas de representacin numrica y grfica para representar informacin a travs de la organizacin de los datos obtenidos de una muestra o poblacin.

2.1. Organizacin de datos y distribucin de frecuencias


Introduccin La descripcin estadstica organiza los datos y los presenta en forma de tablas y grficas. Esta rea slo describe, resume, organiza y representa los datos obtenidos de una poblacin o muestra de la poblacin, sin elaborar inferencias ni obtener conclusiones. La organizacin de datos se realiza a travs de tablas que se utilizan para simplificar la presentacin y distribucin de estos datos. A continuacin, conocers que existen diferentes tipos de presentacin de datos y con base en ellos, distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

2.1.1. Frecuencias

Frecuencia o Frecuencia absoluta La frecuencia o frecuencia absoluta es el nmero de veces que se repite un valor dentro de un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes la siguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendras:
Dato 2
3

Frecuencia 2 (porque se repite 2 veces) 3 (porque se repite 3 veces) 2 (porque se repite 2 veces) 4 (porque se repite 4 veces) 11

5
7

Total de datos (N)

Frecuencia absoluta acumulada La frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta el rengln i, se representa como Fi. Tambin es conocida como frecuencia acumulada. Siguiendo con el ejemplo anterior:
Dato 2
3

Frecuencia 2
3

Frecuencia acumulada 2 (hasta aqu tienes 2 datos 5 (la suma de la frecuencia del primer dato con la del segundo dato 2+3) 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5) 11 (frecuencia de 2+frecuencia de 3+frecuencia de 5 frecuencia de 7)

5
7

2
4

Total de datos (N)

11

Frecuencia relativa La frecuencia relativa es el resultado de dividir la frecuencia de cada dato entre el nmero total de datos(N). La suma de esta columna da 1 (excepto cuando el resultado de las divisiones se redondea). Este dato tambin puede verse como un porcentaje, se representa como hi. Siguiendo con el ejemplo anterior:
Dato 2
3

Frecuencia 2
3

Frecuencia acumulada 2
5

Frecuancia relativa 0.181 (se divide 2/11)


0.272 (se divide 3/11)

4
5

2
4

7
11

0.181 (se divide 2/11)


0.363 (se divide 4/11)

Total de datos (N)

11

Frecuencia relativa acumulada La frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el rengln i. Se representa como Hi, observa el ejemplo:
Dato 2 Frecuencia 2 Frecuencia acumulada 2 Frecuencia relativa 0.1818 Frecuencia relativa acumulada 0.1818 (hasta este rengln slo tienes esta frecuencia relativa) 0.4545 (se suma la frecuencia relativa del primer dato con la del segundo dato 0.1818+0.2727) 0.6363 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5) 0.9999 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5+la frecuencia relativa de 7)

0.2727

0.1818

11

0.3636

Total de datos (N)

11

Ejemplo de organizacin de frecuencias En la siguiente pantalla observars una tabla con la organizacin de frecuencias, los datos presentados son los siguientes: 18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

2.1.2. Intervalos

Otro concepto muy utilizado en estadstica descriptiva es el de intervalo. Conoce qu es y los dems conceptos asociados.

Intervalos
Conjunto de valores agrupados entre dos nmeros, conocidos como lmites, en este caso, lmites del intervalo.

Intervalo de clase
Se llama intervalo de clase a la expresin que denota un intervalo.

Amplitud del intervalo


La amplitud del intervalo es la distancia que hay entre los lmites superior e inferior del intervalo. Se calcula restando el valor del lmite inferior al valor del lmite superior.

Frontera de clase
Son los puntos medios entre los lmites de intervalos consecutivos. Las fronteras de clase se utilizan para recuperar los datos entre el lmite superior de un intervalo y el lmite inferior del siguiente.

Marca de clase
Tambin conocida como punto medio de clase, es el resultado de la suma de los lmites inferior y superior del intervalo, dividido entre dos.

Ejemplo de intervalos Observa cmo se representan los conceptos relacionados con los intervalos, coloca el cursor sobre las palabras resaltadas. Dados los nmeros 15 y 25, tendras que: El intervalo corresponde a todos los nmeros que se encuentran entre 15 y 25. El intervalo de clase sera: 15-25 Los lmites del intervalo son: Lmite inferior=15 Lmite superior=25 La amplitud del intervalo 15-25 sera: 25 menos 15, es decir, 10. Es recomendable que todos los intervalos tengan la misma amplitud, por lo que se puede restar el dato menor al dato mayor y dividir el resultado entre el nmero de intervalos. La frontera de clase: dados los intervalos 4-14, 15-25 y 26-36, las fronteras de clase seran: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por ltimo, 25.5 y 36.5 para el tercer intervalo. La marca de clase del intervalo 15-25 es igual a: 15+25=40/2=20. Es recomendable que la marca del intervalo coincida con alguno de los datos, aunque esto no es necesario ni siempre se logra; sobre todo cuando los intervalos tienen la misma amplitud.

2.1.3. Construccin de intervalos de clase


La formacin de clases o intervalos de clase, que se representa con (k), depende, generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente. Paso 1. Calcular el rango Se identifica el nmero mayor (Xn) y el nmero menor (X1) en los datos. El rango es el resultado de restar el nmero menor al nmero mayor; esto es: 240 R= Xn X1 Por ejemplo: Para una serie de datos que van desde el 18 hasta el 56,se tiene lo siguiente: Xn= 56 X1= 18 por lo tanto, R= Xn X1= 56 18= 38 Paso 2. Determinar el nmero de intervalos que se desea tener No existe una regla para determinar el nmero de intervalos, pero generalmente se suelen crear entre 5 y 20 intervalos. La decisin la toma el investigador. Siguiendo con el ejemplo, se van a construir 7 intervalos. Entonces k= 7

Paso 3. Dividir el rango entre el nmero de intervalos que se desea tener Recuerda que es recomendable elegir un nmero entre 5 y 20 para los intervalos y dividir el rango entre el nmero deseado de intervalos. Siguiendo con el ejemplo: Si son 7 intervalos 38/7 = 5.428 sta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge el entero sin decimales. Paso 4. Formacin de intervalos: Los intervalos se forman comenzando un nmero antes del primer dato. Intervalos: 17 a 22 (se cuenta 5 desde 18 hasta 22) 23 a 28 (el siguiente intervalo comienza a partir del lmite superior del intervalo anterior) 29 a 34 35 a 40 41 a 46 47 a 52 53 a 58 Nota. No importa que el ltimo intervalo exceda el ltimo dato.

Ejemplo de construccin de intervalos El director de una consultora en desarrollo de software desea conocer el nmero de incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello registra los siguientes datos: 35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20. Observa cada paso: 1. 2. 3. 4. Calcular el rango: R=XnX1=60-20=40 Determinar el nmero de intervalos entre 5 y 20: Elegir 8 intervalos. Dividir el rango entre el nmero de intervalos: 40/8=5 Se forman los intervalos: Comenzar por un nmero anterior al lmite inferior: 19-24, 25-30, 31-36, 37-42, 43-48, 49-54, 55-60

2.1.4. Tablas de datos


Existen diferentes tipos de tablas para presentar datos, las ms utilizadas son: Tabla de datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qu consiste cada una:

Tablas de datos Una tabla de datos es la forma ms sencilla de organizar un conjunto de datos y se utiliza cuando la informacin que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos. Ejemplo: Imagina que la medicin de temperatura a lo largo del da da como resultado los siguientes valores (en grados Celsius): 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7 A partir de estos valores construyes la siguiente tabla:

2.1.5. Tablas de frecuencias


Las tablas de frecuencia aportan mayor informacin que las tablas de datos, ya que estn construidas con las categoras de la variable que se est midiendo y su frecuencia. Un experimento da como resultado los siguientes valores: 1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2, 3, 4, 5, 5, 4, 3, 3, 2 Si agrupas los datos por categoras, segn la frecuencia o nmero de veces que aparece cada dato, tendras la siguiente tabla: Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a la frecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada.

2.1.6. Tablas por intervalos de clase


En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable. Ejemplo: En una encuesta sobre el desempleo en el rea metropolitana de la ciudad de Mxico, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

2.1.7. Tablas de doble entrada


Estas tablas proporcionan informacin referente a dos variables o eventos relacionados entre s. La informacin se distribuye poniendo en los renglones de la tabla la informacin de una de las variables y en las columnas la informacin de la otra variable. Ejemplo: Se cuenta el nmero de cirugas realizadas por edades en una muestra de 100 personas, los resultados son los siguientes:

En el ejemplo las variables relacionadas son la edad y el nmero de cirugas.

Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango. Por ejemplo, imagina que mides la temperatura de un lquido con respecto al tiempo de calentamiento. En el rengln colocas los tiempos y en las columnas la temperatura obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:

2.2. Representacin grfica de los datos


Introduccin El tema anterior present diferentes formas de organizar o de tabular datos y la distribucin de frecuencias. Ahora estudiars la representacin grfica de los datos. Las grficas son representaciones visuales de los datos que se muestran en una tabla. Existen diferentes tipos de grficas, cada una de ellas se elabora con base en el tipo de informacin que se quiere representar.

2.2.1. Histograma
El histograma es la representacin grfica de una variable continua. Se elabora en un sistema de coordenadas rectangulares. El eje horizontal se utiliza para representar la variable independiente, es decir, la escala de medicin o fronteras de clase. El eje vertical representa la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras sern proporcionales a las frecuencias. El histograma permite apreciar visualmente la distribucin y dispersin de las mediciones.

2.2.2. Grfica de barras


Este tipo de grfica se utiliza para datos de tipo ordinal, nominal y discreto. En stas se muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones por medio de espacios vacos entre las barras. La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

Un histograma y una grfica de barras son muy semejantes, la diferencia radica en que el histograma no presenta separacin entre las barras.

2.2.3. Grfica de lneas


Una grfica de lneas tambin se construye en un sistema coordenado rectangular y muestra la relacin entre las variables mediante puntos conectados por lneas continuas. La frecuencia de cada valor medido es representada por la altura del punto. En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen, obtenindose la grfica de lnea.

2.2.4. Grfica de reas o de pastel


Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Esta grfica muestra la relacin entre las variables dividiendo un crculo (o pastel) en sectores (o rebanadas). Tambin, se utilizan para representar la distribucin de frecuencias, pero es el rea de cada sector la proporcional a los valores medidos. Para trazar la grfica, se hace una distribucin proporcional de las frecuencias del problema con respecto a la circunferencia, determinando sectores circulares para cada categora. Ejemplos de grficas
Medicin en cm Frecuencia Frecuencia acumulada Porcentaje

30 30.1 30.2 30.3 30.4. 30.5 30.6 30.7 30.8 30.9

3 7 12 18 23 21 17 11 5 1

3 10 22 40 63 84 101 112 117 118

3% 6% 10% 15% 19% 18% 14% 9% 4% 1%

Histograma En esta figura se muestra el histograma de las mediciones en cm vs la frecuencia, nota como el ancho de las clases es el mismo.

Grfica de pastel En la grfica de pastel se muestra dentro de cada rebanada la medicin en cm y el porcentaje que corresponde a la frecuencia relativa.

Grfica de lnea En esta figura se muestra la frecuencia acumulada mediante una grfica de lnea.

Cierre de la unidad
Has concluido la unidad 2, en la que conociste los fundamentos de la estadstica descriptiva, la utilidad de sta y el tipo de informacin que puedes obtener a travs de ella. Recuerda que la organizacin de los datos se hace a travs de tablas que pueden ser de frecuencias o intervalos de clase. La frecuencia es el nmero de veces que se repite un dato. Puede ser: Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia relativa acumulada Los intervalos de clase son un conjunto de nmeros comprendidos entre un nmero lmite inferior y un nmero lmite superior. Tambin las grficas ayudan a visualizar la informacin contenida en las tablas de frecuencia. No olvides que la estadstica descriptiva es muy til en todo tipo de investigaciones; por ejemplo, cuando muestran grficas o estadsticas en los medios de comunicacin.

Para saber ms

Consulta la siguiente direccin electrnica para saber ms sobre las tcnicas para recolectar informacin: http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf En la siguiente direccin electrnica puedes encontrar explicaciones, ejemplos y ejercicios sobre los temas que se abordaron en esta unidad: http://www.vitutor.com/estadistica.html

Fuentes de consulta

Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadstica aplicadas a la ingeniera (4 ed.). McGraw-Hill, Mxico. Walpole, Ronald E., Myers Raymond H., et al. (2007). Probabilidad y Estadstica para Ingeniera y ciencias (8 ed.). Mxico: Pearson Educacin. Intervalos de clase, consultado el 26 de abril de 2010 en:http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descriptiva_2 Censo y entrevista, consultados el 26 de abril de 2010 en:http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.dochttp://www.tec.url.e
du.gt/boletin/URL_03_BAS01.pdf