Está en la página 1de 48

EDAD PESO SEXO

CARLOS 5 18 1
MARIA 10 28 2
JUAN 0 3 1
16.3 1

Columna VARIABLE
Fila UNIDAD DE OBSERVACIÓN
Celda DATO
H01. DISTRIBUBUCION DE FRECUENCIA NO AGRUPADA

1 VARIABLE
CUALITATIVA. BINARIA, ORDINAL O NOMINAL UO PERSONA
Eventualmente las de conteo VARIABLE X: COLOR DE AUTO
X ni hi Ni Hi
1 25 19%
2 35 26% 1 NEGRO
3 45 33% 2 ROJO
4 15 11% 3 BLANCO
5 10 7% 4 AZUL
6 5 4% 5 AMARILLO
135 6 OTRO

n
n3 45 Existen 45 personas de 135 que p
n Frecuencia total h3 33% El 33% de las personas prefieren
ni Frecuencia absoluta 1 de cada 3 pesonas prefiere un a
p Numero de clases, catagorias El color de auto preferido es blan

hi Frecuencia relativa RESUMIR


X
1
1
SERIE ESTADISTICA 1
Lista de datos eventualmente ordenada 1
1
1
1
1
1
1
1
1
1
1
xisten 45 personas de 135 que prefieren el color de auto blanco 1
33% de las personas prefieren un auto de color blanco 1
de cada 3 pesonas prefiere un auto blanco 1
color de auto preferido es blanco 1

RESUMIR 1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
H02. DISTRIBUBUCION DE FRECUENCIA AGRUPADA

1 Variable X: INGRESO ($us/mes)


Cuantitativa (continua) UO: PEA

Xi CLASE ni hi Ni Hi
500 0 1000 30 5% 30 5%
1500 1000 2000 120 19% 150 24%
2500 2000 3000 250 40% 400 63%
3500 3000 4000 185 29% 585 93%
4500 4000 5000 45 7% 630 100%
630 100%

n 630 n3 250
p 5 h3 40%
N3 400
H3 63%

Limites de clase: Valores frontera de las clases: mínimo, máximo


RESUMI
Marca de clase: Valor al centro de los limites de clase
Amplitud de clase. Diferencia entre los limites de clase
Valores extremos. Valores propios de cada clase
clase ni clase
0 10 0 10.5
11 20 10.5 20.5
x 21 30 20.5 30.5
15 31 40 30.5 40
23 LIMITES DE CLASE
31
30.2
30.7
30.5
ingreso
2500
X 3400
567.0
1200.0
3000.0
450.0

ni Frecuencia abosoluta
hi Frecuencia relativa
Ni Frecuencia absoluta acumulada
Hi Frecuencia relativa acumulada

Existen 250 PEA, de las 630, que tienen un ingreso entre 2000 a 3000 $us/mes
40% de las PEA ganan entre 2000 a 3000 $us/mes
400 personas de las 630 ganan menos de 3000
63% de las PEA ganan menos de 3000
37% de las PEA ganan mas de 3000

RESUMIR
H03. DIAGRAMA DE BARRAS
1 VARIABLE 35%
CUALITATIVA. BINARIA, ORDINAL O NOMINAL
Eventualmente las de conteo 30%

25%
X ni hi Ni Hi
1 25 19% 20% 19%
2 35 26% 1 NEGRO
3 45 33% 2 ROJO 15%
4 15 11% 3 BLANCO
10%
5 10 7% 4 AZUL
6 5 4% 5 AMARILLO
5%
135 6 OTRO
0%
NEGRO

RESUMIR
35% 33%

30%
26%
25%

20% 19%

15%
11%
10%
7%

5% 4%

0%
NEGRO ROJO BLANCO AZUL AMARILLO OTRO

RESUMIR
H04. DIAGRAMA DE TORTA, SECCIONES, PIE CHART
1 VARIABLE
CUALITATIVA. NOMINAL
Eventualmente las de conteo

X ni hi Ni Hi
1 25 19%
2 35 26% 1 NEGRO
3 45 33% 2 ROJO
4 15 11% 3 BLANCO
5 10 7% 4 AZUL
6 5 4% 5 AMARILLO
135 6 OTRO

RESUMIR
4%
7%
19%

11%

26%

33%

NEGRO ROJO BLANCO AZUL AMARILLO OTRO

RESUMIR
Clase Frecuencia
1536.2528 1
1615.01176 0
1693.77072 0
1772.52967 2
1851.28863 5
1930.04759 12
2008.80655 11
2087.56551 18
2166.32447 16
2245.08343 42
2323.84238 53
2402.60134 54
2481.3603 64
2560.11926 68
2638.87822 68
2717.63718 65
2796.39614 43
2875.15509 37
2953.91405 31
3032.67301 10
3111.43197 11
3190.19093 12
3268.94989 3
3347.70885 1
3426.4678 2
y mayor... 1
H05. HISTOGRAMA

1 Variable X: INGRESO ($us/mes)


Cuantitativa (continua) UO: PEA

Xi CLASE ni hi Ni Hi
500 0 1000 30 5% 30 5%
1500 1000 2000 120 19% 150 24%
2500 2000 3000 250 40% 400 63%
3500 3000 4000 185 29% 585 93%
4500 4000 5000 45 7% 630 100%
630 100%
ingreso
2143
2399
2666 Este gráfico no está disponible en su versión de Excel.
2400
Si edita esta forma o guarda el libro en un formato de archivo diferente, el
2596 gráfico no se podrá utilizar.
2916
3248
2378
2438
2881
2284
2518
2761
2200
2749
3217
2548
2682
3085
2506
3028
1889
2997
2723
2721
2358
2247
2619
2925
3012
2511
1950
2723
2629
1913
2434
2531
2643
2934
2152
2457
2806
2858
2704
2716
2175
1899
2401
2576
2722
2194
2837
2633
2508
2573
2502
2493
2471
2079
2360
2467
3003
2384
2669
2302
2584
2188
2343
2619
2801
2155
2425
2716
2258
2493
2666
2641
2658
2286
2596
2623
2195
2062
2859
1994
2275
2535
2729
2215
2328
2605
2418
2842
2502
2263
2180
2071
2676
2293
3027
2551
2845
2840
2854
2602
2632
2891
2575
2508
2044
2691
2592
2563
2203
2809
2381
2507
2052
2578
2415
2114
2330
2268
2182
2696
2285
2227
2372
3058
2763
2494
2320
2836
2134
2540
2262
2656
2609
1740
2298
2236
3021
2943
2553
2420
3124
2196
3395
2507
3042
2811
2602
2299
2718
2444
2765
2374
2347
2349
2775
2420
2552
2601
3155
2346
2461
2583
2478
2301
2883
2179
2452
1911
2231
2971
2639
1928
2515
2778
2290
2334
2652
2816
2255
2915
2646
2626
2340
2482
2696
2897
1797
2301
2469
2434
2612
2446
3189
2498
3024
2425
2351
2031
2256
2473
3081
2764
2076
2014
2788
1997
2623
2630
3422
2699
2612
1940
2899
2254
2651
2641
2827
3126
2693
2428
2261
2824
2743
3154
2813
2478
2788
2365
2072
2925
3170
2639
2800
2732
2930
2859
2063
2227
2764
2463
2720
2034
2727
2670
2297
2464
2431
2346
2756
2642
2705
2270
2611
2765
2541
2196
2883
2378
2732
2349
2309
2578
2477
2730
3079
2620
2490
2743
2385
2562
2461
2719
2385
2441
2636
2760
2309
1923
2397
2479
2697
2899
2400
2601
2701
2552
2287
2021
2873
3505
2320
2537
2294
2409
2361
2673
2161
2354
2617
2536
1986
2630
2708
2336
2797
3123
2168
3175
2847
2599
2471
2609
2480
2433
2682
2367
2572
2684
2229
2952
2389
3062
2614
2853
2620
2620
2668
2295
2539
2733
2493
2514
2355
2181
2542
2648
2652
3305
2326
2640
1843
2678
2463
2404
2618
2636
2512
2657
2388
2249
2466
2181
2281
1804
2689
2501
2245
2510
2673
2261
1968
2923
2546
2609
1859
2454
2183
2907
2678
2448
2458
2851
2171
2381
2882
2487
2321
2942
2839
2287
2638
2704
2718
2868
2433
2676
2626
2080
2374
2687
2733
2644
2896
2399
2893
2054
2277
2233
2682
2312
2995
2232
3068
1884
2837
2329
2237
2734
2098
2687
2507
2494
2379
1935
2699
2114
2062
2761
2789
3175
2357
1536
2767
2501
2229
2583
2408
2310
2161
2913
2766
2945
2557
2210
2829
2534
1919
2661
2615
2497
2367
2594
2795
1929
2170
2539
2189
2238
2417
2480
2602
2623
2185
2571
2348
3093
2163
2548
2479
2840
2066
2465
2142
2919
2488
2821
2388
2695
2709
2363
2250
2629
2322
2776
2304
1813
2702
2086
2536
2875
2479
2345
2472
2364
2508
2741
2706
2639
2602
2231
2511
2477
2349
2465
1974
2509
2538
2187
3189
2684
2592
2405
2495
2172
2583
2449
2512
2540
2449
2623
2651
2230
2140
2344
2289
2301
2714
2440
2255
3054
2275
2912
2498
2263
2527
2763
2430
2225
1747
2221
2500
2251
2408
2441
2485
2214
2718
2305
2341
1971
2855
2890
2297
2506
2412
2825
2673
2910
2702
2573
2499
1890
2571
2865
2877
1954
2413
3063
2662
2568
2153
2686
2515
1827
2547
2334
2361
2529
2601
2566
2374
2287
3088
3113
2467
2240
2395
2835
2582
3216
2908
2886
2468
2557
2495
2597
1908
2169
2134
2541
2450
2757
2163
2939
2104
2595
2235
2294
2802
2560
2460
2508
1988
3003
2721
2597
3187
2476
2669
2065
2675
2828
2753
2405
2659
2303
2501
2705
2259
2541
2805
2582
2681
2272
2433
Histograma de INGRESOS

90

80

70

60
Frecuencia

50

40

30

20

10

0
1500 1800 2100 2400 2700 3000 3300
INGRESOS
H06. ESTADÍGRAFOS DE POSICIÓN

RESUMIR
PROMEDIO, MEDIA ARITMETICA MEDIA

PESO DIFERENCIAS PESO


15 -3 15
10 -8 10
25 7 25
30 12 30
10 -8 10
18 0 90
18
n 5

El promedio es un valor tal que la suma de las diferencias, frente a EL, es exactamente 0

𝑋 ̅=(∑24_(𝑖=1)^𝑛▒𝑋_𝑖 )/𝑛
MEDIANA 𝑋 ̃ 10 10
20 20
60 60
PROMEDIO 30 MEDIANA 20

El promedio "siente" la presencia de datos extremos La mediana "no siente" la presen


ROBUSTEZ

13
23
35
36
45
67
90

13
23
35
35.5
36
45
67

NOTA. EL PROMEDIO Y LA MEDIANA SE CALCULAN PARA VARIABLES CUANTITATIVAS CONTINUAS

MODA
Se utiliza para cualquier tipo de dato, incluyendo los cualitativos

X ni
1 25
2 35 La moda es el valor que más veces se repite
3 45
4 15 3: Blanco
5 10
6 5
135
ESTADÍGRAFOS DE POSICIÓN CENTRAL
PROMEDIO
1 NEGRO MEDIANA Continuo
2 ROJO MODA Para cualquier tipo de dato
3 BLANCO
4 AZUL
5 AMARILLO
6 OTRO

CUARTILES Valores que dividen la serie de datos en cuatro partes


Q1
Q2 O MEDIANA
Q3
EJEMPLO Estadísticas
Variable N N* Media Desv.Est.
ingreso 42 0 501.4 121.8

MEDIANA 497.5 50% de las personas tienen un ingreso inferior a 497,5


CUARTIL 1 382.8 25% de las personas tienen ingreso inferior a 382,8
CUARTIL 3 584 75% de las personas tienen un ingreso inferior a 584

PERCENTILESValores que diven la serie de datos en 100 partes

P90
P75 Q3
P25 Q1
P50 MEDIANA
mediana "no siente" la presencia de datos extremos

La mediana es el valor que se encuentra al centro en términos del número de datos

23
13
35
67
45
36
35.5
502
703
485
572
570
320
734
719
Mínimo Q1 Mediana Q3 Máximo 493
320 382.8 497.5 584 750 620
432
rior a 497,5 504
75% de las personas tienen un ingreso superior a 382,5 350
25% de las personas tienen un ingreso superior a 584 373
370
334
540
450
350
345
394
629
750
462
641
562
508
562
441
383
550
461
418
375
413
508
636
680
621
545
382
370
mediana 497.5
cuartil 1 385.75 382.75 385.75
cuartil 3 571.5
percentil 90 676.1

90 % de las personas tiene un ingreso inferior a 676,1


10% de las personas tiene un ingreso superior a 676,1
erior a 676,1
erior a 676,1
Estadísticas

Variable N N* Media Mínimo Mediana Máximo


ingreso 42 0 501.4 320 497.5 750

Estadísticas

Variable vivienda N N* Media Mínimo Mediana


ingreso 0 19 0 412.8 320 394
1 23 0 574.5 370 562
N para
Modo moda
350; 370; 508; 562 2

N para
Máximo Modo moda
641 350 2
750 562 2
H07. ESTADÍGRAFOS DE DISPERSIÓN
Xi
VARIANZA. 𝑆^2 10
20
60
Mide el grado alejamiento de las observaciones en relación al promedio 30
Siempre es positiva.
Puede ser cero. Todas las observaciones son identicas
𝑆^2
^2=(∑24_(𝑖=1)^𝑛▒(𝑋_𝑖−𝑋 ̅ )^2 )/𝑛
n 52
promedio 70
varianza
Varianza es el promedio de las diferencias elevadas al cuadrado

MIDE LA DISPERSIÓN O VARIABILIDAD DE LOS DATOS PROMEDIO 3 VASOS DE AGUA


N 5000
VARIANZA 0
La unidades de la varainza son siempre al cuadrado

Desviación estadar o típicaS


GRUPO 1 GRUPO 2
n 50 30
𝑆=√(𝑆^2 )
Promedio 70 90
Unidades son las mismas que la variable s 10 12
CV 14% 13%

Coeficiente de variación. CV

𝐶𝑉=𝑆/𝑋 ̅ ∗100

cuidado. Para comparar variabilidad se utiliza el coeficiente de variación

Amplitud o rango total


Diferencia entre el valor máximo menos el valor mínimo PROMEDIO DEL PESO
S
𝑊=𝑋_𝑚𝑎𝑥−𝑋_𝑚𝑖𝑛 𝑆≈𝑊/4 Xmax
Xmin
W

Rango intercuartil. RIQ

𝑅𝐼𝑄=𝑄_3−𝑄_1
di di2
-20 400
-10 100
30 900
0 1400

466.7

VASOS DE AGUA 750

83
67

75 KG
8 KG
88 KG
55 kg
33 KG
Estadísticas
Variable vivienda n Media Desv.Est. CoefVar Mínimo
45% ingreso 0 19 413 76.2 18.47 320
55% 1 23 575 102.6 17.86 370
42

HISTORIA
55% de las personas entrevistas tienen vivienda propia
El ingreso promedio de las personas con vivienda propia es significativamente mayor al grupo de pe
Existe una mayor variabilidad del ingreso en el grupo de personas que no tiene casa propia compara
DATA SCIENCE

PASO 1. Enteder el requerimiento o necesidad RESUMIR


PASO 2. Recolectar los datos
PASO 3. Limpieza y control de calidad de los datos
PASO 4. Realizar el análisis de datos. Aprovechamiento
PASO 5. Comunicación. Contar una historia Existe una distribución desquilibrada del ingre

Estadísticos descriptivos
Desv.
N Rango Mínimo Máximo Media Desviación
ingreso 42 430 320 750 501.36 121.813
N válido (por 42
lista)

Estadísticos descriptivos

vivienda N Rango Mínimo Máximo Media


0 ingreso 19 321 320 641 412.79
N válido (por 19
lista)
1 ingreso 23 380 370 750 574.52
N válido (por 23
lista)

Estadísticas
Variable sexo N N* Media Desv.Est. CoefVar
gasto varon 21 0 471 121.7 26
mujeres 21 0 493 128.9 26
Amplitud
Máximo Rango
641 321
750 380

tivamente mayor al grupo de personas que no tienen vivienda propia


ue no tiene casa propia comparativamente al grupo con tenencia de vivienda propia

ribución desquilibrada del ingreso en los máas pobres

Desv.
Desviación cv
76.246 18.5%

102.596 17.9%

Mínimo Máximo
270 800
300 800
ESTADÍSTICA DESCRIPTIVA 1 VAR Resumir
Herramientas para resumir datos

Clasificación

1. Distribuciones de frecuencia Tablas H01, H02


2. Gráficas Gráficas H03, H04, H05
3. Estadígrafos Valores
3.1. Estadígrafos de posición H06
3.2. Estadígrafos de dispersión H07
3.3. Estadígrafos de forma H08
H08. DIAGRAMA DE CAJA O DIAGRAMA BOX-PLOT

Xmax
Q3
Mediana
Q1
RIQ
XMIN

NOTA 70
Más del 50% de los estudinates tienen nota por encima 70
NIVELES DE INTERPRETACIÓN DEL BOX-PLOT
ANÁLISIS DE POSICIÓN
Las personas que tiene vivienda propia tiene un ingreso promedio mayor que las personas que no tienen vivienda propia
ANÁLISIS DE DISPERSIÓN
Existe mayor variabilidad del ingreso en el grupo con vivienda propia
ANÁLISIS DE FORMA
Ambas distribuciones son simétricas
ANÁLISIS DE DATOS INFLUYENTES

ta por encima 70

Más del 50% de los estudiantes tiene nota por debajo de 70


no tienen vivienda propia

También podría gustarte