Está en la página 1de 10

Estadística Descriptiva

Por: Claudia Tinajero Ramírez

1.4 Métodos gráficos para la representación de datos (gráfica de pastel, barras, histograma,
gráfico de series de tiempo, gráfica de dispersión, cajas y alambres).
Gráficas de barras

Las gráficas de barras son útiles para describir datos generalmente de nivel nominal u ordinal; las
categorías y sus frecuencias se representan por barras cuya longitud denota la frecuencia. La
siguiente figura muestra una gráfica de barras horizontales y también pueden usarse barras
verticales.
Estados con mayor venta de autos nuevos
Estado Autos vendidos
DF 195,036
Estado de México 99,359
Jalisco 63,433
Nuevo León 61,468
Guanajuato 33,364
Puebla 32,524
Tamaulipas 31,313
Coahuila 23,776
Sinaloa 22,609
Chihuahua 21,602

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
Autos Vendidos
Chihuahua 21,602
Sinaloa 22,609
Coahuila 23,776
Tamaulipas 31,313
Puebla 32,524
Guanajuato 33,364 Autos Vendidos
Nuevo León 61,468
Jalisco 63,433
Estado de México 99,359
DF 195,036

0 50,000 100,000 150,000 200,000

La presencia de las barras y las líneas verticales a la altura de las marcas permiten
distinguir y comparar ciertos aspectos de los datos más fácilmente que en la tabla de datos
ordenados. Por ejemplo, las ventas en el DF son casi el doble de las ventas del Estado de México,
el estado con más venta después de él. En este caso, se dice que las ventas en el Distrito Federal
no sólo son un valor extremo sino atípico considerablemente más alto que los demás). Se
aprecian también grupos de estados con ventas similares y que en este rubro deben tener
características semejantes: Jalisco y Nuevo León; Guanajuato, Puebla y Tamaulipas, y el grupo de
Coauhila, Sinaloa y Chihuahua. Por último, las ventas en el DF y el Estado de México son
alrededor del doble de las ventas de los otros 8 estados con mayores ventas de la República
Mexicana.

Diagramas de Pareto
Un diagrama de Pareto es una gráfica de barras que se emplea en situaciones donde opera
el siguiente principio:
El Principio de Pareto se da cuando la mayoría de los elementos de un conjunto de datos caen en
un pequeño número de categorías, y las pocas observaciones restantes caen generalmente en un
gran número de categorías. El primer grupo suele llamarse de lo “poco vital”y el segundo de lo
“mucho trivial”

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
Por ejemplo, un gerente desea investigar las causas de la insatisfacción de los clientes de un hotel
determinado. El gerente investiga y registra las razones de las quejas de los clientes:

Quejas de los clientes

Quejas Cantidad Defectos acumulados % Total % Acumulado


Sala 104 104 45.4148472 45.41484716
Aparatos 45 149 19.650655 65.06550218
Limpieza 43 192 18.7772926 83.84279476

Comodidad 19 211 8.29694323 92.13973799


Calidad de
los
alimentos 8 219 3.49344978 95.63318777
Otros 10 229 4.36681223 100
Total 229

http://support.minitab.com/es-mx/minitab/17/topic-library/quality-tools/quality-tools/pareto-chart-basics/

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
La gráfica de barras de la frecuencia de incidencia de los distintas quejas en un cierto periodo.
Esta gráfica, conocida como diagrama de pareto, grafica el tipo de defecto en el eje horizontal, en
el eje vertical izquierdo la frecuencia de incidencias y en el eje vertical derecho el porcentaje. Las
frecuencias se distribuyen en orden descendente de izquierda a derecha.
El diagrama de Pareto muestra que la mayoría de las quejas los constituyen la sala, los aparatos y
la limpieza y éstos, conjuntamente constituyen prácticamente 80% de los defectos, por lo que
podrían considerarse como lo poco vital, y el resto de los defectos como lo mucho trivial.

Gráficas circulares o de pastel


Es una gráfica especialmente útil para mostrar la división de una cantidad total en sus partes
componentes. El círculo completo representa la cantidad total o el 100%. Cada sector del círculo
representa una parte componente del total. Los sectores pueden aparecer con los nombres y los
porcentajes correspondientes. Con el fin de distinguir los sectores entre sí se utilizan diferentes
tonos de color.
Se muestra una gráfica de pastel donde se muestran las emisiones globales que produjeron gases
de invernadero durante el año 2000.

3.6
13.5
24.1 Electricidad y calor
Industria y otros
Cambio del uso de suelo
14.9
Agricultura
Transpotación
25.7 Desperdicio
18.2

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
Histograma de frecuencias
Es un despliegue gráfico bidimensional que utiliza rectángulos. Las bases de los rectángulos se
colocan en el eje horizontal y corresponden, en cierta forma, a las clases de la variable en estudio.
En el otro eje se muestran las frecuencias (absolutas, relativas o acumuladas) asociadas con cada
clase.
A diferencia de una gráfica de barras, los lados de los rectángulos adyacentes de un histograma
son coincidentes; no hay separación entre los rectángulos de las clases adyacentes. Con esto,
cada clase y su frecuencia quedan representadas por un rectángulo cuya base, colocada en el eje
horizontal es igual al ancho de clase y su altura es la frecuencia correspondiente.
Por ejemplo, se muestra el estudio de la estatura de 360 adolescentes mediante un histograma
piramidal.

http://e-ducativa.catedu.es/44700165/aula/archivos/repositorio//500/557/html/Unidad05/pagina_28.html

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
Gráficas de series de tiempo
Son útiles en diferentes áreas ya que muestran el cambio de una variable, generalmente a
espacios regulares de tiempo. Alguna de sus aplicaciones son el crecimiento poblacional, las
variaciones presentadas en las medición realizada por algún experimento cada cierta unidad
adecuada de tiempo, la evolución de la estatura de una persona a lo largo de los meses (años),
etc. Por ejemplo, se muestra la concentración del ozono en ppm (partes por millón), medida cada
hora del día, Los valores corresponden al Distrito Federal y las concentraciones son en realidad
las medias obtenidas a lo largo del año.
Se muestra el comportamiento horario de concentración de ozono.

Ciudad de México,
http://www.aire.cdmx.gob.mx/default.php?opc='aqBhnmOkZA=='
©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
Gráficos de Dispersión
Es una gráfica que se utiliza para explorar la relación potencial entre un par de variables
continuas. Se grafican los valores de datos de las variables en sus coordenadas (X,Y). Cuando se
crea una gráfica de dispersión, usualmente se muestra la variable de respuesta en el eje de las “Y”
y la variable predictora en el eje “X” para cada observación. Por ejemplo, supongamos que
tenemos a un grupo de personas adultas del sexo masculino. Para cada persona se mide la altura
en metros (variable X) y el peso en kilogramos (Variable Y). Es decir, para cada persona se tendrá
un par de valores X, Y que son la altura y el peso de dicha persona:

Persona Altura (m) Peso (Kg) Persona Altura (m) Peso (Kg)
1 1.94 95.8 26 1.66 74.9
2 1.82 80.5 27 1.96 88.1
3 1.79 78.2 28 1.56 65.3
4 1.69 77.4 29 1.55 65.5
5 1.8 82.6 30 1.71 75.5
6 1.88 87.8 31 1.9 91.3
7 1.57 67.6 32 1.65 66.6
8 1.81 82.5 33 1.78 76.8
9 1.76 82.5 34 1.83 80.2
10 1.63 65.8 35 1.98 97.6
11 1.59 67.3 36 1.67 76
12 1.84 88.8 37 1.53 58
13 1.92 93.7 38 1.96 95.2
14 1.84 82.9 39 1.66 74.5
15 1.88 88.4 40 1.62 71.8
16 1.62 69 41 1.89 91
17 1.86 83.4 42 1.53 62.1
18 1.91 89.1 43 1.59 69.8
19 1.99 95.2 44 1.55 64.6
20 1.76 79.1 45 1.97 90
21 1.55 61.6 46 1.51 63.8
22 1.71 70.6 47 1.59 62.6
23 1.75 79.4 48 1.6 67.8
24 1.76 78.1 49 1.57 63.3
25 2 90.6 50 1.61 65.2
qcursos.aiu.edu/Fundamentos%20de%20Estadística/pdf/Tema%205.pdf

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
120

100

80

60

40

20

0
0 0.5 1 1.5 2 2.5

Se observa que las personas con mayor altura tienen mayor peso, es decir parece haber una
correlación positiva entre altura y peso. Pero un hombre bajito y gordo puede pesar más que otro
alto y flaco. Esto es así porque no hay una correlación total y absoluta entre las variables de altura
y peso. Para cada altura hay personas de distinto peso. Sin embargo, si podemos afirmar que
existe cierta correlación en mayor o menor grado.

Diagrama de cajas y bigotes


También conocidos como diagrama de cajas y brazos son otra técnica útil para el análisis
exploratorio de datos para describir conjuntos de datos. Los pasos para la construcción de un
diagrama de cajas y bigotes son:
Paso 1: Se ordenan los datos de menor a mayor
0.5, 2.2, 2.3, 2.5, 2.7, 3.0, 3.2, 3.2, 3.5, 3.5, 3.8, 4.0, 4.1, 4.3, 4.3, 4.5, 4.7, 4.8, 4.8, 5.2, 5.8, 5.8,
5.9, 6.5, 6.6, 7.2, 7.6, 12.9, 18.2

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
Paso 2: Se encuentra la mediana.
Mediana= (4.3 + 4.5)/2=4.4
Paso 3: Se encuentra el primer cuartil.
Hay 15 datos a la derecha de la mediana. La mediana de los 15 datos es el octavo; por tanto
Q1=3.2
Paso 4: Se encuentra el tercer cuartil
Hay 15 datos a la derecha de la mediana. La mediana de los 15 datos es el dato número 23;
Q3=5.9
Paso 5: Se identifican el valor menor y el valor mayor; el menor es 0.5 y el mayor es 18.2.
El diagrama correspondiente se ve así:
0.5, 2.2, 2.3, 2.5, 2.7, 3.0, 3.2, 3.2, 3.5, 3.5, 3.8, 4.0, 4.1, 4.3, 4.3, 4.5, 4.7, 4.8, 4.8, 5.2, 5.8, 5.8,
5.9, 6.5, 6.6, 7.2, 7.3, 7.6, 12.9, 18.2 4.4
Paso 6: Se construye una escala numérica y se colocan marcas (puntos) debajo de los 5 valores
básicos:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Paso 7: Se dibuja una caja (rectángulo) utilizando los dos cuartiles. Se traza en la mediana una
línea vertical de un lado al otro de la caja. Finalmente se dibujan dos “bigotes “, líneas de los dos
cuartiles a sus extremos más cercanos.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Interpretación del diagrama de cajas y bigotes


A fin de poder interpretar el diagrama de cajas y bigotes, conviene reflexionar sobre varios
aspectos que se plantean a continuación como una actividad.

Cuando un conjunto de datos es perfectamente simétrico alrededor de la media, la mediana


coincide con la media, la media y la mediana quedan entonces exactamente en el centro de la
caja y los dos bigotes tienen la misma longitud. Por tanto, una gráfica de cajas y bigotes puede

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.
usarse para apreciar el grado de simetría de los datos, de acuerdo con las posiciones relativas del
cuartil inferior y el cuartil superior respecto a la mediana y las longitudes relativas de los bigotes.
El diagrama mostrado en este ejemplo, muestra cierta asimetría debido a que la mediana no está
en el centro de la caja y el bigote derecho es más grande que el bigote izquierdo. Globalmente
significa que los datos se agrupan estrechamente de la mediana al extremo inferior y quedan más
dispersos de la mediana al extremo superior; esto es, se tiene un sesgo a la derecha.

Bibliografía
NIEVES, A., DOMINGUEZ,C. F., Probabilidad y Estadística para Ingeniería, México Mc Graw Hill Education, 2012.

©UPGTO. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Politécnica del Guanajuato.

También podría gustarte