Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2. SINTESIS DE DATOS
Una vez organizados los datos en tablas y representados grficamente, es til sintetizarlos o
resumirlos en medidas o nmeros que permitan trabajar cmodamente y que contengan el mximo
de informacin. Existen dos tipos de medidas que describen las caractersticas de la distribucin de
frecuencias de los valores de una variable: las medidas de centralizacin y de dispersin.
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
Ejemplo:
Durante los ltimos 32 das el valor de las compras (soles) en peridicos fue:
(7+1)
=
2
(8+1)
=
2
(5+6)
=
2
5.5
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
2.1.3 La Moda: La moda es el valor que se observa con ms frecuencia, el ms repetido y sus
caractersticas son:
Puede no existir o existir ms de una moda.
Su valor no se ve afectado por los valores extremos en los datos.
Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa.
Es una medida inestable cuando en nmero de datos es reducido
Para datos no agrupados:
Por ejemplo. Durante los ltimos 32 das el valor de las compras en peridicos fue:
Mo = 7 y 9 Serie bimodal.
Ejemplo: 6, 5, 6, 6, 3, 4, 6, 6, 7
Mo = 6 Serie Unimodal.
2.1.4 Media Geomtrica: La media geomtrica simple de n observaciones X1, X2, X3,.., Xn
positivos, est dado por la raz ensima del producto de los n valores observados. El promedio
geomtrico de los valores: (X1, X2, X3,.., Xn) es
Para datos no agrupados:
2.1.5 Cuartiles, Deciles, Percentiles: Son medidas de localizacin, pero no central, sino que
localizan otros puntos de una distribucin. Los cuartiles dividen los datos en cuatro partes iguales,
los deciles en diez partes iguales y los percentiles, en cien partes iguales. Por definicin, el cuartil 2
coincide con el decil 5 y con el percentil 50, y todos ellos con la mediana.
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
3. REPRESENTACION GRAFICA
Una vez obtenidos los datos es preciso mostrarlos de una forma ordenada y comprensible. La forma
ms sencilla es colocarlos en una Tabla, donde se muestran las variables, las categoras de cada
variable y el nmero de eventos de cada categora. En ciertas ocasiones, especialmente cuando
trabajamos con un gran nmero de datos, las tablas no son prcticas y es necesario una mejor visin
de los datos con una mirada rpida. Esto se consigue con los grficos. La seleccin del grfico
depender del tipo de datos empleados. Comenzaremos con los grficos para datos cuantitativos.
3.1 HISTOGRAMA: Se utiliza para variables cuantitativas continuas. En el eje x se muestran los datos
de la variable, que por ser continuos requieren ser agrupados previamente en intervalos, y en el eje
y se representa la frecuencia con la que aparece cada dato. La anchura del intervalo y la altura que
alcanza determinan el rea de cada intervalo, que es proporcional a la frecuencia de cada intervalo.
Da una idea muy aproximada de la forma de la distribucin que sigue la variable
Ejemplo: El peso de un grupo de alumnos aparece recogido en la siguiente tabla:
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
3.2 NUBE DE PUNTOS: Es un grfico donde se muestran dos variables cuantitativas, una en el eje
X y otro en l Y, mostrando los valores mediante puntos o smbolos.
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
Ejemplo 2: Las notas obtenidas por un grupo de alumnos en una prueba de matemticas vienen
resumida en la siguiente tabla
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
Vertical: Las distintas categoras estn situadas en el eje horizontal y las barras de frecuencias
crecen verticalmente.
Horizontal: las categoras se sitan en el eje vertical y las barras crecen horizontalmente. Suelen
usarse cuando hay muchas categoras o sus nombres son demasiado largos.
Las categoras pueden ordenarse alfabticamente facilitando su bsqueda o por sus frecuencias
facilitando la comparacin de los datos. Veamos el siguiente ejemplo del porcentaje habitantes
usuarios de internet del ao 2007 por pases (Fuente: Unin Internacional de Telecomunicaciones).
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
Contiene
Apilado:
varias
en
segmentos
de
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
El crculo representa la totalidad que se quiere observar en el ejemplo, total de viajeros hospedados
en hoteles y cada porcin, llamadas sectores, representan la proporcin de cada categora de la
variable (en el ejemplo, tipo de hotel) respecto el total. Suele expresarse en porcentajes
Obtencin de los ngulos por cada sector:
Frecuencia relativa =
Porcentaje = Frecuencia relativa X 100
Angulo = Frecuencia Relativa X 360
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
3.4 PICTOGRAMAS: Un pictograma es un grfico que representa mediante figuras o smbolos las
frecuencias de una variable cualitativa o discreta. Al igual que los grficos de barras suelen usarse
para comparar magnitudes o ver la evolucin en el tiempo de una categora concreta.
Tipos de pictogramas:
Grficas de barras cuyas barras estn constituidas por smbolos o figuras distorsionadas que se
adaptan a la longitud de la barra.
10
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
En el ejemplo se puede
apreciar que los pases con
ms produccin agrcola
consumen
ms
fertilizantes nitrogenados.
Se observa en principio
una relacin lineal positiva
11
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
3.5 GRFICO DE CAJA: Sirve para representar variables cualitativas en escala ordinal y cuantitativa
discretas. Se construye un rectngulo de altura igual al recorrido intercuartlico, dentro se traza un
segmento en el punto correspondiente a la mediana y se define los valores adyacentes o bigotes: el
valor adyacente inferior es el valor ms pequeo de la distribucin. El valor adyacente superior es
la observacin ms grande de la serie. Los valores de la distribucin que sean menores que el valor
adyacente inferior o mayores que el superior se denominan observaciones extremas o outliers
4. CONSIDERACIONES IMPORTANTES
Podemos considerar la estadstica descriptiva como el conjunto de tcnicas para ordenar y
representar los datos en tablas, y resumirlos mediante el clculo de diferentes medidas. Por tanto,
podemos distinguir tres apartados:
-Tabulacin, que consiste en ordenar los datos originales y presentarlos de forma que, sin perder
informacin, sea ms fcil conocer la distribucin de los mismos. El resultado final es una tabla
donde se muestran los valores de la variable que se tabula y sus frecuencias.
-Clculo de medidas para resumir la distribucin. Pueden ser de tendencia central, que indican
alrededor de que valores se agrupan los datos observados; y de variabilidad o dispersin, que
indican si los valores de la variable estn muy dispersos o concentrados.
-Representacin grfica, que facilita un anlisis visual de los datos y permite sacar conclusiones
acerca de las caractersticas globales de la distribucin
12
UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
13