Está en la página 1de 12

ESTADSTICA

DESCRIPTIVA

1 MECATRNICA
EUPLA

PABLO GARCA
CARBONELL

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

ESTADSTICA

Trabajo 73
Los siguientes datos son los tiempos de sistema observados (tiempo de espera
ms tiempo de servicio) para 200 clientes en una tienda:

Analizar descriptivamente los datos.

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

Este trabajo tiene como finalidad el estudio de la suma del tiempo que un
cliente espera a ser atendido y el tiempo que pasa siendo atendido. Para
facilitar el estudio descriptivo de este trabajo utilizare el programa de
estadstica R, calculando con el todos los datos necesarios para poder realizar
un estudio estadstico correcto.

Lo primero que he calculado es la cantidad de veces que se repiten los


tiempos en los que el cliente es atendido, para ello he creado una tabla de
frecuencias absolutas obteniendo estos resultados:
0.4
1
3.3
2
4.8
3
6.9
2
9
1
11.1
2
14.7
1
17.4
1
19.8
1
27.6
1

0.8
1
3.4
1
5
4
7.1
3
9.1
1
11.7
1
15
2
17.5
1
20.2
2
28.4
1

1.2
1
3.5
1
5.1
2
7.2
1
9.2
1
11.9
1
15.1
1
17.6
1
20.6
1
30.1
1

1.3
1
3.6
4
5.2
2
7.3
3
9.3
3
12.2
1
15.3
1
17.7
1
20.8
1
31.3
1

1.4
1
3.7
2
5.4
1
7.4
2
9.4
1
12.6
1
15.4
1
17.8
1
22
1
31.8
1

1.8
2
3.8
1
5.5
2
7.7
2
9.6
1
12.7
2
15.9
2
17.9
2
22.6
1
33.1
1

2
1
3.9
2
5.6
2
7.9
2
9.8
1
12.8
1
16.1
2
18.2
1
22.7
2
33.6
1

2.1
2
4
2
5.7
1
8.1
1
9.9
1
13.1
1
16.2
1
18.6
2
23.3
1
35.2
1

2.3
4
4.1
1
6
1
8.2
2
10.1
2
13.2
2
16.3
1
18.7
1
24.9
1
35.3
1

2.7
1
4.3
1
6.2
2
8.3
2
10.2
1
13.7
2
16.4
1
18.8
2
25
1
35.9
1

2.8
1
4.4
1
6.4
4
8.4
2
10.4
1
13.8
1
16.6
1
19
1
27
1
45.2
1

2.9
1
4.5
1
6.5
1
8.7
1
10.6
2
13.9
1
16.9
1
19.3
1
27.2
1
48.4
1

3
2
4.6
5
6.6
2
8.8
2
10.7
1
14.1
1
17.1
2
19.5
1
27.4
1

3.1
1
4.7
1
6.8
1
8.9
1
10.8
2
14.4
1
17.3
1
19.7
2
27.5
1

Con esta tabla podemos saber la frecuencia con la que se repiten los tiempos
que un cliente emplea en total. En esta tabla podemos observar que el tiempo
que ms se repite es 4.6.

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

Lo siguiente que he hecho es obtener una tabla de frecuencias absolutas


acumuladas para poder ver el nmero de veces que una variable ha
aparecido con un valor menor o igual a ella misma, comprobando as que he
utilizado todos los nmeros de la tabla anterior
0.4
1
3.3
22
4.8
48
6.9
75
9
100
11.1
120
14.7
137
17.4
155
19.8
173
27.6
189

0.8
2
3.4
23
5
52
7.1
78
9.1
101
11.7
121
15
139
17.5
156
20.2
175
28.4
190

1.2
3
3.5
24
5.1
54
7.2
79
9.2
102
11.9
122
15.1
140
17.6
157
20.6
176
30.1
191

1.3
4
3.6
28
5.2
56
7.3
82
9.3
105
12.2
123
15.3
141
17.7
158
20.8
177
31.3
192

1.4
5
3.7
30
5.4
57
7.4
84
9.4
106
12.6
124
15.4
142
17.8
159
22
178
31.8
193

1.8
7
3.8
31
5.5
59
7.7
86
9.6
107
12.7
126
15.9
144
17.9
161
22.6
179
33.1
194

2
8
3.9
33
5.6
61
7.9
88
9.8
108
12.8
127
16.1
146
18.2
162
22.7
181
33.6
195

2.1
9
4
35
5.7
62
8.1
89
9.9
109
13.1
128
16.2
147
18.6
164
23.3
182
35.2
196

2.3
11
4.1
36
6
63
8.2
91
10.1
111
13.2
130
16.3
148
18.7
165
24.9
183
35.3
197

2.7
15
4.3
37
6.2
65
8.3
93
10.2
112
13.7
132
16.4
149
18.8
167
25
184
35.9
198

2.8
16
4.4
38
6.4
69
8.4
95
10.4
113
13.8
133
16.6
150
19
168
27
185
45.2
199

2.9
17
4.5
39
6.5
70
8.7
96
10.6
115
13.9
134
16.9
151
19.3
169
27.2
186
48.4
200

3
19
4.6
44
6.6
72
8.8
98
10.7
116
14.1
135
17.1
153
19.5
170
27.4
187

3.1
20
4.7
45
6.8
73
8.9
99
10.8
118
14.4
136
17.3
154
19.7
172
27.5
188

Esta tabla
la he
representado en
una grfica de
puntos donde el
eje Y representa
los 200 clientes y
el eje X
representa los
tiempos. Este
grafico no es muy
til debido a
todos los datos
que poseemos

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

Ahora vamos a calcular la frecuencia relativa y la frecuencia relativa


acumulada. Para ello hemos obtenido estas dos tablas.
En esta tabla estn los valores de las frecuencias relativas
0.4
0.005
3.3
0.010
4.8
0.015
6.9
0.010
9
0.005
11.1
0.010
14.7
0.005
17.4
0.005
19.8
0.005
27.6
0.005

0.8
0.005
3.4
0.005
5
0.020
7.1
0.015
9.1
0.005
11.7
0.005
15
0.010
17.5
0.005
20.2
0.010
28.4
0.005

1.2
0.005
3.5
0.005
5.1
0.010
7.2
0.005
9.2
0.005
11.9
0.005
15.1
0.005
17.6
0.005
20.6
0.005
30.1
0.005

1.3
0.005
3.6
0.020
5.2
0.010
7.3
0.015
9.3
0.015
12.2
0.005
15.3
0.005
17.7
0.005
20.8
0.005
31.3
0.005

1.4
0.005
3.7
0.010
5.4
0.005
7.4
0.010
9.4
0.005
12.6
0.005
15.4
0.005
17.8
0.005
22
0.005
31.8
0.005

1.8
0.010
3.8
0.005
5.5
0.010
7.7
0.010
9.6
0.005
12.7
0.010
15.9
0.010
17.9
0.010
22.6
0.005
33.1
0.005

2
0.005
3.9
0.010
5.6
0.010
7.9
0.010
9.8
0.005
12.8
0.005
16.1
0.010
18.2
0.005
22.7
0.010
33.6
0.005

2.1
0.005
4
0.010
5.7
0.005
8.1
0.005
9.9
0.005
13.1
0.005
16.2
0.005
18.6
0.010
23.3
0.005
35.2
0.005

2.3
0.010
4.1
0.005
6
0.005
8.2
0.010
10.1
0.010
13.2
0.010
16.3
0.005
18.7
0.005
24.9
0.005
35.3
0.005

2.7
0.020
4.3
0.005
6.2
0.010
8.3
0.010
10.2
0.005
13.7
0.010
16.4
0.005
18.8
0.010
25
0.005
35.9
0.005

2.8
0.005
4.4
0.005
6.4
0.020
8.4
0.010
10.4
0.005
13.8
0.005
16.6
0.005
19
0.005
27
0.005
45.2
0.005

2.9
0.005
4.5
0.005
6.5
0.005
8.7
0.005
10.6
0.010
13.9
0.005
16.9
0.005
19.3
0.005
27.2
0.005
48.4
0.005

3
0.010
4.6
0.025
6.6
0.010
8.8
0.010
10.7
0.005
14.1
0.005
17.1
0.010
19.5
0.005
27.4
0.005

3.1
0.005
4.7
0.005
6.8
0.005
8.9
0.005
10.8
0.010
14.4
0.005
17.3
0.005
19.7
0.010
27.5
0.005

Y esta segunda tabla corresponde a las frecuencias relativas acumuladas.


0.4
0.005
3.3
0.110
4.8
0.240
6.9
0.375
9
0.500
11.1
0.600
14.7
0.685
17.4
0.775
19.8
0.865
27.6
0.945

0.8
0.010
3.4
0.115
5
0.260
7.1
0.390
9.1
0.505
11.7
0.605
15
0.695
17.5
0.780
20.2
0.875
28.4
0.950

1.2
0.015
3.5
0.120
5.1
0.270
7.2
0.395
9.2
0.510
11.9
0.610
15.1
0.700
17.6
0.785
20.6
0.880
30.1
0.955

1.3
0.020
3.6
0.140
5.2
0.280
7.3
0.410
9.3
0.525
12.2
0.615
15.3
0.705
17.7
0.790
20.8
0.885
31.3
0.960

1.4
0.025
3.7
0.150
5.4
0.285
7.4
0.420
9.4
0.530
12.6
0.620
15.4
0.710
17.8
0.795
22
0.890
31.8
0.965

1.8
0.035
3.8
0.155
5.5
0.295
7.7
0.430
9.6
0.535
12.7
0.630
15.9
0.720
17.9
0.805
22.6
0.895
33.1
0.970

2
0.040
3.9
0.165
5.6
0.305
7.9
0.440
9.8
0.540
12.8
0.635
16.1
0.730
18.2
0.810
22.7
0.905
33.6
0.975

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

2.1
0.045
4
0.175
5.7
0.310
8.1
0.445
9.9
0.545
13.1
0.640
16.2
0.735
18.6
0.820
23.3
0.910
35.2
0.980

2.3
0.055
4.1
0.180
6
0.315
8.2
0.455
10.1
0.555
13.2
0.650
16.3
0.740
18.7
0.825
24.9
0.915
35.3
0.985

2.7
0.075
4.3
0.185
6.2
0.325
8.3
0.465
10.2
0.560
13.7
0.660
16.4
0.745
18.8
0.835
25
0.920
35.9
0.990

2.8
0.080
4.4
0.190
6.4
0.345
8.4
0.475
10.4
0.565
13.8
0.665
16.6
0.750
19
0.840
27
0.925
45.2
0.995

2.9
0.085
4.5
0.195
6.5
0.350
8.7
0.480
10.6
0.575
13.9
0.670
16.9
0.755
19.3
0.845
27.2
0.930
48.4
1.000

3
0.095
4.6
0.220
6.6
0.360
8.8
0.490
10.7
0.580
14.1
0.675
17.1
0.765
19.5
0.850
27.4
0.935

3.1
0.100
4.7
0.225
6.8
0.365
8.9
0.495
10.8
0.590
14.4
0.680
17.3
0.770
19.7
0.860
27.5
0.940

El siguiente paso en nuestro estudio estadstico es la representacin grfica de


los datos aportados por el enunciado, puesto que, hoy en da este tipo de
grficos ha superado en uso a las tablas de frecuencia obtenidas
anteriormente, pasando a una utilidad secundaria.

La primera
grafica que he
representado es
un histograma
donde
podemos
observar las
frecuencias
mximas y
mnimas.

Con este grafico podemos observar en el eje X todos los tiempos registrados
para los 200 clientes de nuestro estudio, y, en el eje Y podemos ver la
frecuencia con la que se repiten dichos tiempos. En este histograma
claramente se ve que la barra de color naranja del intervalo 5-10 es la que
posee la mayor frecuencia de todos nuestros datos. Por otra parte el intervalo
45-50 tambin de color naranja registra la menor frecuencia del grfico.
Tambin podemos observar una ligera distribucin asimtrica por la derecha, la
cual confirmaremos posteriormente de manera numrica.

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

Existen muchos ms tipos de grficos, pero, debido al gran nmero de datos


que poseemos he optado por elegir este ya que, nos ofrece una visin clara de
la frecuencia de repeticin de los distintos tiempos.

Despus de haber estudiado nuestros datos mediante la ayuda de un grfico,


vamos a proceder a la obtencin de nmeros estadsticos concretos. Estos
nmeros son distintas medidas que nos ayudaran a profundizar en nuestro
estudio de una manera ms exhaustiva.
Los primeros nmeros que vamos a obtener son medidas de posicin:

El nmero mximo registrado es : 48.4

El nmero mnimo registrado es : 0.4

Media aritmtica. La media aritmtica nos permite obtener el valor


promedio de nuestros datos, sumando todos nuestros datos para despus
dividirlo entre los 200 clientes de nuestro trabajo mediante esta frmula:
El valor obtenido mediante la
media aritmtica es: 11.68

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

Las siguientes medidas de posicin son los Cuantiles son puntos


tomados a intervalos regulares de la funcin de distribucin de
una variable aleatoria. Estos a su vez se dividen en:

La Mediana tiene un valor de: 9.05

Los Cuartiles nos indican el 25% y el 75% de los datos de


nuestro trabajo
25%
75%
5.000 16.675

Los Percentiles son las ltimas medidas de posicin y son


todos los valores de nuestro trabajo divididos en 100 partes

10%
3.280
20%
4.600
30%
5.600
40%
7.300
50%
9.050
60%
11.340
70%
15.160
80%
17.900
90%
22.700
100%
48.400

11%
3.389
21%
4.600
31%
5.907
41%
7.359
51%
9.249
61%
12.017
71%
15.545
81%
18.276
91%
23.444

12%
3.588
22%
4.678
32%
6.200
42%
7.574
52%
9.300
62%
12.638
72%
15.956
82%
18.618
92%
25.160

13%
3.600
23%
4.800
33%
6.400
43%
7.814
53%
9.494
63%
12.737
73%
16.127
83%
18.800
93%
27.214

14%
3.686
24%
4.952
34%
6.400
44%
8.012
54%
9.846
64%
13.136
74%
16.326
84%
19.048
94%
27.506

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

15%
3.785
25%
5.000
35%
6.565
45%
8.200
55%
10.100
65%
13.375
75%
16.675
85%
19.530
95%
28.485

16%
3.900
26%
5.074
36%
6.728
46%
8.300
56%
10.288
66%
13.734
76%
17.100
86%
19.714
96%
31.320

17%
4.000
27%
5.173
37%
6.900
47%
8.400
57%
10.600
67%
13.966
77%
17.323
87%
20.200
97%
33.115

18%
4.246
28%
5.344
38%
7.100
48%
8.752
58%
10.742
68%
14.496
78%
17.522
88%
20.624
98%
35.202

19%
4.481
29%
5.500
39%
7.161
49%
8.851
59%
10.923
69%
15.000
79%
17.721
89%
22.066
99%
35.993

Los siguientes nmeros que vamos a obtener son las medidas de dispersin:

El primero que vamos a calcular es el Rango que indica el nmero


mayor y menor de la serie, estos coinciden con los valores mximos y
mnimos obtenidos anteriormente: 0.4

48.4

El siguiente es el Rango intercuartlico. Este nmero representa la


diferencia que hay entre el primer y el tercer cuartil. El primer cuartil
corresponde al 25%, el segundo cuartil el 50% (El cual coincide con la
mediana ya que es justo la mitad) y el tercer cuartil es el 75%.
El rango intercuartlico es: 16.675-5.000= 11.675

Otras medidas son la Cuasi-varianza y la Cuasi-desviacin tpica


Estas poseen unos valores de 75.91347 y 8.712833 respectivamente.

Existe una ltima medida llamada Coeficiente de variacin de Pearson


la cual es utilizada para la comparacin de grupos de datos en donde la
escala es muy diferente. En nuestro trabajo utilizando esta medida hemos
obtenido un valor de: 74.59618.
Pero como en nuestro trabajo no hay datos muy dispares, esta medida
no es muy relevante.

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

Ahora vamos a proceder a obtener el Coeficiente de asimetra de Fisher. Este


se obtiene mediante:

El valor obtenido aplicando la frmula del coeficiente de asimetra de Fisher ha


sido de: 1.351163. Este valor al ser superior confirma que existe una asimetra por
la derecha como ya dijimos en el apartado de grficos.

Otro dato importante en nuestro estudio es el Coeficiente de apuntamiento.


Este dato nos permitir saber qu tipo de distribucin posee nuestro histograma.
Para ello aplicaremos la frmula:

Una vez utilizada la formula, el resultado obtenido ha sido de: 2.04016


Este valor es superior a cero, esto implica que nuestro histograma tiene una
distribucin leptocrtica.

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

10

Otro paso que debemos seguir en nuestro estudio estadstico es la


representacin de Grficos de Tukey
El primer grafico que vamos a representar es un diagrama de cajas

Podemos observar la asimetra en la ligera desviacin hacia abajo que sufre la


lnea (Mediana) de dentro del rango intercuartlico, esto significa que no lo
divide en dos mitades iguales. En la parte superior tambin podemos observar
una serie de puntos desperdigados, estos reflejan valores puntuales de nuestro
trabajo que no tienen una frecuencia establecida.
Tambin podemos ver en este diagrama que, el lmite superior es mucho ms
grande que el lmite inferior. Esto refleja un mayor nmero de resultados atpicos
por encima de la media que por debajo de ella.

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

11

El otro grafico de Tukey utilizado es el Diagrama de tallos y hojas


0 | 4823488
2 | 01337777890013345666677899
4 | 00134566666788800001122455667
6 | 02244445668991112333447799
8 | 122334478890123334689
10 | 1124667881179
12 | 267781227789
14 | 1470013499
16 | 11234691134567899
18 | 266788035778
20 | 2268
22 | 06773
24 | 90
26 | 02456
28 | 4
30 | 138
32 | 16
34 | 239
36 |
38 |
40 |
42 |
44 | 2
46 |
48 | 4

Este diagrama recuerda, de una manera numrica, a un histograma. Los


espacios en blanco significan que esos nmeros no poseen ningn decimal.
Este diagrama est en desuso.

Despus de haber expuesto todos estos datos, podemos dar por terminado
nuestro estudio estadstico. Viendo que por lo general los clientes permanecen
en establecimiento entre 5 y 10 minutos.

ESTADSTICA DESCRIPTIVA PABLO GARCA CARBONELL

12

También podría gustarte