Está en la página 1de 12

1.

IDENTIFICANDO LOS DATOS ATÍPICOS MEDIANTE:


a) DIAGRAMA DE CAJAS
También conocido como diagrama de caja y bigotes, es un gráfico que está
basado en cuartiles y mediante el cual se visualiza la distribución de un conjunto
de datos. Está compuesto por un rectángulo (la caja) y dos brazos (los bigotes).
Es un gráfico que suministra información sobre los valores mínimo y máximo, los
cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la
simetría de la distribución. Primero es necesario encontrar la mediana para luego
encontrar los 2 cuartiles restantes.

Donde:

Máx : Máximo valor de todos los datos

Mín : Mínimo valor de todos los datos

Q1 : Primer cuartil (cuartil inferior)

Q2 : Mediana o segundo cuartil

Q3 : Tercer cuartil (cuartil superior)

RI : Rango intercuartílico (Q3-Q1)

P1 : Q1-1.5*(RI)

P2 : Q3+1.5*(RI)
UTILIDAD:

 Proporcionan una visión general de la simetría de la distribución de los datos; si la


mediana no está en el centro del rectángulo, la distribución no es simétrica.
 Son útiles para ver la presencia de valores atípicos también llamados outliers.
 Pertenece a las herramientas de la estadística descriptiva.
 Permite ver cómo es la dispersión de los puntos con la mediana, los percentiles 25 y 75
y los valores máximos y mínimos. Ponen en una sola dimensión los datos de un
histograma, facilitando así el análisis de la información al detectar que el 50% de la
población está en los límites de la caja.
APLICANDO DIAGRAMA DE CAJAS PARA IDENTIFICAR LOS DATOS ATIPICOS:

Se va obtener 2 cajas por día y como son dos días se obtendrán finalmente 4 cajas, también se
muestra el flujo de autos (multiplicado ya cada vehículo con sus respectivos pesos) en intervalo
de 5 minutos desde 5:45 a 9:00 am, resultando 39 intervalos.

NORTE A SUR (MARTES)


FLUJO TOTAL
1 85.25 Mínimo 73
2 97.5 Q1 145.75
3 145.5 Mediana 190
4 73 Q3 243.25
5 83.5 Máximo 284.5
6 112.5 RI 97.5
7 123.25 P1 -0.5
8 121.75 P2 389.5
9 192.25
10 182.5
11 221.25
12 186.75
13 205
14 263
15 210.75 DIAGRAMA DE CAJA
16 262.25
17 243.5
18 284.5
19 276.25
20 261.75
21 271
22 252
23 243.25 0 50 100 150 200 250 300
24 261.25 N° de vehiculos
25 191.25
26 221.75
27 145.75
28 162.5
29 148.75
30 170.75
31 189.75
32 139
33 238.25
34 160.75
35 199.75
36 178
37 192
38 190
39 173
SUR A NORTE
(MARTES)


FLUJO TOTAL
1 79.75 Mínimo 79.75
2 100.5 Q1 248.5
3 109.25 Mediana 326.25
4 112.25 Q3 340.75
5 139.5 Máximo 379
6 140.75 RI 92.25
7 172.5 P1 110.125
8 200 P2 479.125
9 245.25
10 274.75
11 336.5
12 290.25
13 328.25
14 304.5 DIAGRAMA DE CAJA
15 332.5
16 330.75
17 344.75
18 338.25
19 343
20 332.75
21 341.5
22 340.75
23 352.75
0 50 100 150 200 250 300 350 400
24 358.25
N° de vehiculos
25 353.5
26 379
27 319.5
28 320.25
29 319
30 332.75
31 307.5
32 334.75
33 354.75
34 344.75
35 317.25
36 326.25
37 330.75
38 248.5
39 315
NORTE A SUR
(JUEVES)


FLUJO TOTAL
1 83.25 Mínimo 83.25
2 94 Q1 174.25
3 104.5 Mediana 219.75
4 95 Q3 261.75
5 133.5 Máximo 319
6 136 RI 87.5
7 145.5 P1 43
8 138.5 P2 393
9 152.5
10 190
11 204.75
12 253.5
13 182.75
14 276
DIAGRAMA DE CAJA
15 235.5
16 268.25
17 281.25
18 303
19 283.25
20 319
21 261.75
22 303
23 271.25
24 259.75 0 50 100 150 200 250 300 350
25 261.75 N° de vehiculos
26 272.5
27 246.5
28 252.5
29 234
30 197.25
31 229.75
32 241
33 194.75
34 217.25
35 175.25
36 177
37 174.25
38 179.75
39 219.75
SUR A NORTE (JUEVES)


FLUJO TOTAL
1 89.75
2 84.75
3 114.5
4 103.75
Mínimo 84.75
5 144.75
Q1 269
6 132
Mediana 315.25
7 188.5
8 228.5 Q3 343.75
9 271.75 Máximo 450
10 297 RI 74.75
11 343 P1 156.875
12 357 P2 455.875
13 352.5
14 338.75
15 343.75
16 365.5
17 370.25 DIAGRAMA DE CAJAS
18 343
19 382.5
20 373.5
21 336
22 366
23 450
24 223
25 343.5 0 100 200 300 400 500
26 325.75 N° de vehículos
27 337.5
28 299.5
29 269
30 391
31 312.25
32 297
33 323.75
34 311.25
35 317.5
36 315.25
37 302
38 314.5
39 306
A DOS DESVIACIONES: [𝑿 − 𝟐𝝈; 𝑿 + 𝟐𝝈]

MARTES:
DE NORTE A SUR:
[72.36182553; 305.1125334]
DE SUR A NORTE:
[ 115.5589523; 456.3769451]
JUEVES:
DE NORTE A SUR:
[84.0417222; 338.9839188]
DE SUR A NORTE:
[109.4081991; 473.4507753]

A TRES DESVIACIONES: [𝑿 − 𝟑𝝈; 𝑿 + 𝟑𝝈]


MARTES:
DE NORTE A SUR:
[14.17414855; 363.3002104]
DE SUR A NORTE:
[30.35445415; 541.5814433]
JUEVES:
DE NORTE A SUR:
[20.30617305; 402.719468]
DE SUR A NORTE:
[18.39755501; 564.4614193]

IDENTIFICANDO DATOS ATIPICOS:


MARTES:
DE NORTE A SUR:
En los casos totales se concluye que no se eliminaría ni un dato (intervalo de
tiempo) ya que para que se elimine el dato debe estar fuera de [-0.5,389.5].
DE SUR A NORTE:
Se concluye que los tres primeros datos son atípicos por el diagrama de cajas y
el 4) dato es atípico por el criterio de dos desviaciones ya que los tres primeros
son menores a P1(110.125) y el 4) menor a 115.5589523 extremo mínimo de [
115.5589523; 456.3769451]
1 79.75
2 100.5
3 109.25
4 112.25

JUEVES:
DE NORTE A SUR:
Se concluye que el primer dato es atípico por el criterio de dos desviaciones ya
que es menor a 84.0417222 extremo mínimo de [84.0417222; 338.9839188]
1 83.25

DE SUR A NORTE:
Se encontró que los 6 primeros datos son datos atípicos por el diagrama de cajas
ya que es menor al P1(156.875).
1 89.75
2 84.75
3 114.5
4 103.75
5 144.75
6 132

b) CRITERIO DE CHAUVENET
Según el criterio de Chauvenet’s una lectura puede ser rechazada si la
probabilidad de obtener esta desviación en particular con respecto a la media es
menor de 0.5 n. Basándose en cuánto difiere el valor dudoso de la media, se
utiliza la función de distribución normal (o la tabla de la misma) para determinar
la probabilidad de que un dato dado sea del valor del dato dudoso.
Para ello se debe tener la hoja de cálculo con los datos tomados, y por la gráfica
que presenta el histograma se dice que es una distribución normal, además se
debe obtener la media y la desviación estándar según al tipo que pertenece cada
dato.
Al obtener estos datos se recurre a hallar la desviación de la media, siendo ésta
igual a la diferencia positiva entre la media el dato obtenido.
Desviación a la media=
Luego la desviación a la media de los puntos individuales es dividido por la
desviación estándar del ensayo (obteniéndose el “coeficiente”) y comparados
con los valores dados en la siguiente tabla.

En esta ocasión se utilizaría cuando sea menor que 2.5 ya que el número de
procesos es 39 y se acerca al 40.
TOMANDO DE UNA MANERA GENERAL:

Es decir, si sumamos los autos, camionetas, camiones, motos, etc.


Obtendríamos la cantidad total de carros que pasarían en un determinado
intervalo de tiempo, y aplicando el criterio de Chauvenet a esta cantidad total
obtendríamos.
DATOS ATÍPICOS TOTALES DEL DÍA MARTES (DIRECCIÓN DE SUR A NORTE):

Por la gráfica que presenta el histograma (en el excel), presenta una distribucion
normal.
COEFICIENTE:
N° HORA DE CONTEO DESVIACION A LA
MEDIA/DESVIACIÓN
1 5:45-5:50 2.420
2 5:50-5:55 2.177
3 5:55-6:00 2.074
4 6:00-6:05 2.039
5 6:05-6:10 1.719
6 6:10-6:15 1.704
7 6:15-6:20 1.332
8 6:20-6:25 1.009
9 6:25-6:30 0.478
10 6:30-6:35 0.132
11 6:35-6:40 0.593
12 6:40-6:45 0.050
13 6:45-6:50 0.496
14 6:50-6:55 0.218
15 6:55-7:00 0.546
16 7:00-7:05 0.526
17 7:05-7:10 0.690
18 7:10-7:15 0.614
19 7:15-7:20 0.669
20 7:20-7:25 0.549
21 7:25-7:30 0.652
22 7:30-7:35 0.643
23 7:35-7:40 0.784
24 7:40-7:45 0.848
25 7:45-7:50 0.793
26 7:50-7:55 1.092
27 7:55-8:00 0.394
28 8:00-8:05 0.402
29 8:05-8:10 0.388
30 8:10-8:15 0.549
31 8:15-8:20 0.253
32 8:20-8:25 0.573
33 8:25-8:30 0.807
34 8:30-8:35 0.690
35 8:35-8:40 0.367
36 8:40-8:45 0.473
37 8:45-8:50 0.526
38 8:50-8:55 0.440
39 8:55-9:00 0.341

En los casos totales se concluye que no se eliminaría ni un dato (intervalo de


tiempo). Aunque los valores que se acercan al 2.5 se produjeron debido a que;
en algún momento por algunos temas policiales (como accidentes), los policías
se trasladaban en su moto y en forma colectiva, además en algún momento del
campo pasó varios buses de transporte personal (como el bus de policías).
DATOS ATÍPICOS TOTALES DEL DÍA MARTES (DIRECCIÓN DE NORTE A SUR):

Por la gráfica que presenta el histograma (en el excel), presenta una distribucion
normal.
COEFICIENTE:
N° HORA DE CONTEO DESVIACION A LA
MEDIA/DESVIACIÓN
1 5:45-5:50 1.780
2 5:50-5:55 1.569
3 5:55-6:00 0.743
4 6:00-6:05 1.991
5 6:05-6:10 1.810
6 6:10-6:15 1.311
7 6:15-6:20 1.126
8 6:20-6:25 1.152
9 6:25-6:30 0.061
10 6:30-6:35 0.106
11 6:35-6:40 0.560
12 6:40-6:45 0.033
13 6:45-6:50 0.281
14 6:50-6:55 1.279
15 6:55-7:00 0.380
16 7:00-7:05 1.266
17 7:05-7:10 0.943
18 7:10-7:15 1.649
19 7:15-7:20 1.472
20 7:20-7:25 1.257
21 7:25-7:30 1.417
22 7:30-7:35 1.090
23 7:35-7:40 0.939
24 7:40-7:45 1.249
25 7:45-7:50 0.044
26 7:50-7:55 0.569
27 7:55-8:00 0.739
28 8:00-8:05 0.451
29 8:05-8:10 0.687
30 8:10-8:15 0.309
31 8:15-8:20 0.018
32 8:20-8:25 0.855
33 8:25-8:30 0.853
34 8:30-8:35 0.481
35 8:35-8:40 0.190
36 8:40-8:45 0.184
37 8:45-8:50 0.057
38 8:50-8:55 0.023
39 8:55-9:00 0.270

En los casos totales se concluye que no se eliminaría ni un dato (intervalo de


tiempo).
DATOS ATÍPICOS TOTALES DEL DÍA JUEVES (DIRECCIÓN DE A SUR NORTE):

Por la gráfica que presenta el histograma (en el excel), presenta una distribucion
normal.
COEFICIENTE:
N° HORA DE CONTEO DESVIACION A LA
MEDIA/DESVIACIÓN
1 5:45-5:50 2.153
2 5:50-5:55 2.207
3 5:55-6:00 1.886
4 6:00-6:05 2.002
5 6:05-6:10 1.559
6 6:10-6:15 1.697
7 6:15-6:20 1.087
8 6:20-6:25 0.655
9 6:25-6:30 0.188
10 6:30-6:35 0.084
11 6:35-6:40 0.581
12 6:40-6:45 0.732
13 6:45-6:50 0.683
14 6:50-6:55 0.535
15 6:55-7:00 0.589
16 7:00-7:05 0.824
17 7:05-7:10 0.875
18 7:10-7:15 0.581
19 7:15-7:20 1.007
20 7:20-7:25 0.910
21 7:25-7:30 0.505
22 7:30-7:35 0.829
23 7:35-7:40 1.736
24 7:40-7:45 0.714
25 7:45-7:50 0.586
26 7:50-7:55 0.395
27 7:55-8:00 0.522
28 8:00-8:05 0.111
29 8:05-8:10 1.162
30 8:10-8:15 1.099
31 8:15-8:20 0.249
32 8:20-8:25 0.084
33 8:25-8:30 0.373
34 8:30-8:35 0.238
35 8:35-8:40 0.306
36 8:40-8:45 0.281
37 8:45-8:50 0.138
38 8:50-8:55 0.273
39 8:55-9:00 0.181

En los casos totales se concluye que no se eliminaría ni un dato (intervalo de


tiempo). Los datos que se acercan al 2.5 se debe a que en algun momento pasó
varias mobilidades particulares (empresa) que estaban llevando a sus
trabajadores, también que en un instante varias motos piliciales pasaron por ese
lugar debido a que habia un accidente cerca a dicho lugar.
DATOS ATÍPICOS TOTALES DEL DÍA JUEVES (DIRECCIÓN DE NORTE A SUR):

Por la gráfica que presenta el histograma (en el excel), presenta una distribucion
normal.
COEFICIENTE:
N° HORA DE CONTEO DESVIACION A LA
MEDIA/DESVIACIÓN
1 5:45-5:50 2.012
2 5:50-5:55 1.844
3 5:55-6:00 1.679
4 6:00-6:05 1.828
5 6:05-6:10 1.224
6 6:10-6:15 1.184
7 6:15-6:20 1.035
8 6:20-6:25 1.145
9 6:25-6:30 0.925
10 6:30-6:35 0.337
11 6:35-6:40 0.105
12 6:40-6:45 0.660
13 6:45-6:50 0.450
14 6:50-6:55 1.013
15 6:55-7:00 0.378
16 7:00-7:05 0.892
17 7:05-7:10 1.096
18 7:10-7:15 1.437
19 7:15-7:20 1.127
20 7:20-7:25 1.688
21 7:25-7:30 0.790
22 7:30-7:35 1.437
23 7:35-7:40 0.939
24 7:40-7:45 0.758
25 7:45-7:50 0.790
26 7:50-7:55 0.958
27 7:55-8:00 0.550
28 8:00-8:05 0.644
29 8:05-8:10 0.354
30 8:10-8:15 0.223
31 8:15-8:20 0.287
32 8:20-8:25 0.425
33 8:25-8:30 0.262
34 8:30-8:35 0.091
35 8:35-8:40 0.568
36 8:40-8:45 0.541
37 8:45-8:50 0.584
38 8:50-8:55 0.498
39 8:55-9:00 0.130

En los casos totales se concluye que no se eliminaría ni un dato (intervalo de


tiempo). Los datos que se acercan a 2.5 se debe a que en algun momento pasó
varias mobilidades particulares (empresa) que estaban llevando a sus
trabajadores, también que en un instante varias motos piliciales pasaron por ese
lugar debido a que habia un accidente cerca a dicho lugar.

También podría gustarte