Está en la página 1de 37

ESTADISTICA

DESCRIPTIVA CON
MINITAB

1
ESTADISTICA DESCRIPTIVA CON MINITAB

INDICE
1. Tabla de frecuencia
2. Gráfico de barras
3. Histograma
4. Percentiles
5. Box-plot
6. Gráfico de tarta o circular
7. Medidas características
8. Caso: duración de una transmisión telemática

ESTADÍSTICA BÁSICA 2
1. Tabla de frecuencias

El fichero Cardata.MTW tiene información de las características de una muestra de


automóviles del mercado.

ESTADÍSTICA BÁSICA 3
1. Tabla de frecuencias

¿Cómo es la cilindrada de estos vehículos?

ESTADÍSTICA BÁSICA 4
1. Tabla de frecuencias

• Hay 104 autos con 4 cilindros, que suponen el 67.1% de los datos
• el 89,03% de los datos tiene 6 cilindros o menos.

ESTADÍSTICA BÁSICA 5
2. Gráfico de barras

El gráfico de barras de esta tabla es:

ESTADÍSTICA BÁSICA 6
2. Gráfico de barras

Gráfica de cylinders

100

80
Conteo

60

40

20

0
3 4 5 6 8
cylinders

El número de cilindros más frecuente es 4. Es muy raro que


tengan un número impar de cilindros.

ESTADÍSTICA BÁSICA 7
3. Histograma
Para datos cuantitativos continuos (o discretos pero con muchos valores diferentes) la representación
ideal es el histograma.

Histograma de price
40

30
Frecuencia

20

10

0
2000 4000 6000 8000 10000 12000 14000
price

ESTADÍSTICA BÁSICA 8
3. Histograma

Para cambiar el número de clases:


1- Click en las barras del histograma
2- Botón derecho del ratón y seleccionamos ‘Editar barras’
3- En ‘Seccionamiento’ elegimos el número de intervalos (clases o secciones)

Aquí leemos las ‘marcas de clase’ o


centros de los intervalos

ESTADÍSTICA BÁSICA 9
3. Histograma

Si queremos saber los valores numéricos de cada clase:


1-Hacemos el histograma
2-Ponemos como etiquetas los valores numéricos correspondientes a la frecuencia de cada intervalo

Histograma de price
40
36
34
33

30
Frecuencia

20 19

13

10 8
6

3
1 1 1
0 0 0
0
2000 4000 6000 8000 10000 12000 14000
price

ESTADÍSTICA BÁSICA 10
3. Histograma

Si nos posicionamos sobre dada rectángulo podemos ver los extremos de los intervalos, y la
frecuencia. Esta es la misma información que proporciona una tabla de frecuencia con datos
agrupados (el Minitab no hace tablas de datos agrupados).

ESTADÍSTICA BÁSICA 11
3. Histograma

Para tener algo similar a una tabla y un polígono de frecuencias acumuladas:


1-Hacemos el histograma
2-Ponemos como etiquetas los valores numéricos correspondientes a la frecuencia de cada intervalo
(ver transparencia anterior)
3-En la Escala, ‘Tipo de escala Y’ seleccionamos ‘Acumular valores’

ESTADÍSTICA BÁSICA 12
3. Histograma

Para tener algo similar a una tabla y un polígono de frecuencias acumuladas:


1-Hacemos el histograma
2-Ponemos como etiquetas los valores numéricos correspondientes a la frecuencia de cada intervalo
(ver transparencia anterior)
3-En la Escala, ‘Tipo de escala Y’ seleccionamos ‘Acumular valores’.
4-En ‘Mostrar datos…’, ‘Presentación de datos’ no seleccionar nada, para que no ponga barras, o
seleccionar ‘Símbolos’.

ESTADÍSTICA BÁSICA 13
3. Histograma

Y en esta gráfica tenemos el histograma con frecuencias absolutas acumuladas.

ESTADÍSTICA BÁSICA 14
3. Histograma

Con esta opción se consiguen las


frecuencias relativas

ESTADÍSTICA BÁSICA 15
3. Histograma - ojiva

Si queremos dibujar una ojiva (polígono de frecuencias acumuladas):

En ‘Mostrar datos…’, ‘Suavizador’ ponemos los siguiente (esta opción es para


que simplemente una los puntos superiores del histograma con rectas, por
tanto no es indispensable)

ESTADÍSTICA BÁSICA 16
3. Histograma - ojiva

Histograma de price
100
98,064598,709798,709798,709798,709799,3548
100 96,129
92,2581
87,0968

80 74,8387
Porcentaje acumulado

60 53,5484

40
30,3226

20
8,3871

0
2000 4000 6000 8000 10000 12000 14000
price

¿Qué porcentaje de autos, aproximadamente, cuesta menos de 8000 dólares?

ESTADÍSTICA BÁSICA 17
3. Histograma - ojiva

Para facilitar la lectura de algún punto concreto usamos ‘cruces’ (botón


derecho del ratón). Los puntos sobre las líneas azules pueden
interpretarse como percentiles calculados como una interpolación lineal
entre las frecuencias relativas (acumuladas) de los intervalos.

El 83% de los carros, aproximadamente, tiene un precio menor o igual a 5653 dólares.

ESTADÍSTICA BÁSICA 18
3. Histograma - ojiva

Otra alternativa es construir lo que se denomina una Función de Distribución Empírica


(para cada dato se contabiliza el % de datos menores o iguales a ese ). Vamos a verlo
para la variable ‘Horsepower’ (potencia)

CDF empírica de horsepower

100

80
Porcentaje

60

Como no se hacen
intervalos, la curva 40

no es ‘suave’
20

50 75 100 125 150 175


horsepower

ESTADÍSTICA BÁSICA 19
4. Percentiles
No hay una definición universal de percentil, a pesar de ser un concepto muy intuitivo.
La definición que usa Minitab es : Percentil es un valor en una escala de 100 que indica el porcentaje de
una distribución que es igual o inferior a ella.
Lo podemos calcular con la ‘Calculadora’ del Minitab, y la función ‘Percentil’.

El resultado
se guarda en
esta variable

Percentil que queremos


calcular, o variable con
los percentiles

Variable con los datos


ESTADÍSTICA BÁSICA 20
4. Percentiles

Creo una variable con los percentiles que deseo…

El 60% de los vehículos tiene una


potencia menor o igual a 90 hp

ESTADÍSTICA BÁSICA 21
5. Box-plot

ESTADÍSTICA BÁSICA 22
5. Box-plot

Si queremos construir un box-plot del precio (Price) en función del año de matriculación (year):

Gráfica de caja de price


16000

14000

12000

10000
price

8000

6000

4000

2000

0
78 79 80 81 82
year

ESTADÍSTICA BÁSICA 23
6. Gráfico de tarta

Gráfica circular o de tarta (piechart)

Gráfica circular de cylinders


Categoría
3
4
5
6
8

ESTADÍSTICA BÁSICA 24
7. Medidas características

Medidas características de un conjunto de datos:

ESTADÍSTICA BÁSICA 25
7. Medidas características

Nota: la curtosis es realmente el “exceso


de curtosis” (se ha restado 3)

Histograma (con curva normal) de mpg


Gráfica de caja de mpg
Media 28,79
50
Desv .Est. 7,377
20
N 154

45

15
40
Frecuencia

35
10

mpg
30

5
25

20
0
15 20 25 30 35 40 45
mpg 15

ESTADÍSTICA BÁSICA 26
Podemos hacer un resumen que incluya gráficos y medidas características.
Con el fichero AlumnosIndustriuales.MTW:

MÉTODOS DE INVESTIGACIÓN CUANTITATIVOS 27


Se puede desagregar por
valores de otra variable,
que sea categórica.

MÉTODOS DE INVESTIGACIÓN CUANTITATIVOS 28


8. Caso: duración de una transmisión telemática

El centro de computación de una agencia meteorológica envía de forma telemática a sus clientes
información en tiempo real sobre un conjunto de variables procedente de su red de estaciones. El fichero
DuracionTransmision.MTW tiene las duraciones, en segundos, de una muestra de dichas
transmisiones recogidas de forma consecutiva. Los datos se envían cada 5 minutos, y la duración de la
transmisión debe ser lo más rápida posible. El objetivo de calidad es que la duración media sea inferior a
10 segundos y que nunca dure más de 12. Tras un primer estudio de los datos los analistas se mostraron
muy satisfechos al comprobar que la duración media de las transmisiones era inferior a 10 segundos.
Vamos a describir el estado en que se encuentra este servicio.

ESTADÍSTICA BÁSICA 29
8. Caso: duración de una transmisión telemática

Como los datos forman una serie temporal (observaciones tomadas a lo largo del tiempo a
intervalos regulares), LO PRIMERO es visualizar su evolución temporal.

ESTADÍSTICA BÁSICA 30
8. Caso: duración de una transmisión telemática

La variable parece
estacionaria. Es decir,
evoluciona alrededor de
una línea horizontal (valor
medio constante) . Tiene
entonces sentido hacer un
resumen estadístico de su
media, varianza, etc.

Si tuviese una tendencia,


creciente o decreciente,
implicaría que la media iría
cambiando con el tiempo
(creciendo o decreciendo).
La media de los datos no
tendría ninguna utilidad.

ESTADÍSTICA BÁSICA 31
8. Caso: duración de una transmisión telemática

En primer lugar visualizamos la variable y después sintetizamos sus propiedades con


las medidas características

ESTADÍSTICA BÁSICA 32
8. Caso: duración de una transmisión telemática

Histograma de Duration Histograma (con curva normal) de Duration


40 40 Media 9,954
Desv.Est. 1,332
N 100
30

30
Frecuencia

20

Frecuencia
10
20

0
4 6 8 10 12
Duration
10

0
4 6 8 10 12
Duration

Los datos siguen una distribución simétrica en


torno a 10 segundos, con un valor anómalo
Gráfica de caja de Duration
(atípico). Ese dato es demasiado bajo y podría 13

ser porque la transmisión se interrumpió. 12

11

¿En qué puede perjudicar? Duration


10

9
Lo más conveniente sería eliminar ese dato y 8

continuar el análisis con el resto. 7

ESTADÍSTICA BÁSICA 33
8. Caso: duración de una transmisión telemática

Histograma (con curva normal) de Duration


20 Media 10,01

Eliminando ese dato de la Desv .Est.


N
1,200
99

hoja de cálculo… 15

Frecuencia
10

0
7 8 9 10 11 12 13
Duration

Gráfica de caja de Duration


13

12

Duration 11

10

(Nota: hay varias maneras de separar datos del análisis) 7

ESTADÍSTICA BÁSICA 34
8. Caso: duración de una transmisión telemática

Otra forma de filtrar los datos para excluir esa observación (con un valor menor que 5 segundos.)

ESTADÍSTICA BÁSICA 35
8. Caso: duración de una transmisión telemática

Medidas características sin eliminar el dato atípico


Estadísticas descriptivas: Duration

Variable Media Desv.Est. Mínimo Mediana Máximo Asimetría Kurtosis


Duration 9,954 1,332 4,103 9,964 12,751 -0,71 2,91

Medidas características tras eliminar el dato atípico


Resultados para: Subconjunto de DuracionTransmision.MTW

Estadísticas descriptivas: Duration

Variable Media Desv.Est. Mínimo Mediana Máximo Asimetría Kurtosis


Duration 10,013 1,200 7,087 9,970 12,751 0,07 -0,04

El dato atípico desvirtuaba completamente los valores de las medidas


características. En esta muestra, la duración media es superior a 10 s.
Por otra parte, la distribución es muy simétrica y muy similar a la Normal

ESTADÍSTICA BÁSICA 36
8. Caso: duración de una transmisión telemática

Aproximadamente, el 7% de las transmisiones dura más de 12 segundos, lo


que muestra una calidad deficiente.

ESTADÍSTICA BÁSICA 37

También podría gustarte