Está en la página 1de 40

ESTADÍSTICA BÁSICA

JUAN LUIS CORPORÁN (829-860-0220)


INSTITUTO SUPERIOR BONÓ
ESTADÍSTICA ACTUAL (UNIÓN DE DOS DISCIPLINAS)

Inferencia
CÁLCULO DE
El azar PROBILIDADES l

ESTADÍSTIC
A ACTUAL

Censos
LA CIENCIA Descriptiva
DEL ESTADO
TIPO DE ESTADÍSTICA

Métodos para organizar, resumir y presentar datos


Descriptiva
de manera informativa.

Tipo de
estadística
Métodos que se emplean para determinar una
Inferencial propiedad de una población con base en la
información de una muestra de ella.
OBJETIVOS DE APRENDIZAJE

 0A1 Hacer una table de frecuencias a partir de un grupo de datos


 0A2 Organizar los datos cualitativos en una gráfica de barra
 0A3 Presentar un grupo de datos como gráfica de pastel
 0A4 Crear una distribución de frecuencias de un grupo de datos
 0A5 Crear y comprender una distribución de frecuencias relativas
 0A6 Representar una distribución de frecuencias de datos por medio de histogramas o
polígonos de frecuencia.
 0A7 Construir e interpreter una distribución de frecuencia acumulada
*Hijos en una familia,
*Carreras en juego de
Discreta
pelota, *televisores en
una casa

Cuantitativa
Distribución
de
Precipitación anual en
frecuenicias
Continua el DN,
*El peso de estudiante
Tipos de variables

Cualitativa
* Estado civil Tabla de
* Género frecuenci
a
FRECUENCIAS CON DATOS CUALITATIVOS
TABLA DE FRECUENCIAS, GRÁFICAS DE BARRA Y PASTEL
0A1 HACER
UNA TABLE DE GRUPO DE
FRECUENCIAS
A PARTIR DE DATOS Y TABLE
UN GRUPO DE
DATOS DE FRECUENCIA
TABLA DE FRECUENCIAS

 Recordemos que al grupo de técnicas que se utilizan para describir un conjunto de datos se les
denominó estadística descriptiva
 En otras palabras, la estadística descriptiva se encarga de organizar datos con el fin de mostrar la
distribución general de éstos y el lugar en donde tienden a concentrarse, además de señalar valores de
datos poco usuales o extremos.
 El primer procedimiento que se emplea para organizar y resumir un conjunto de datos es una tabla de
frecuencias:
 TABLA DE FRECUENCIAS es una agrupación de datos cualitativos en clases mutuamente excluyentes que
muestra el número de observaciones en cada clase.
EJERCICIO (AGRUPAR)

  SOLTERO SOLTERO CASADO

CASADO UNIÓN LIBRE SOLTERO UNIÓN LIBRE

SOLTERO CASADO UNIÓN LIBRE CASADO

DIVORCIADO   UNIÓN LIBRE DIVORCIADO


VIUDO SOLTERO CASADO UNIÓN LIBRE

VIUDO UNIÓN LIBRE SOLTERO SOLTERO

SOLTERO UNIÓN LIBRE DIVORCIADO UNIÓN LIBRE


a b c d e f g h i j k l m n o p q r s t u v w x y z Total

Casado x x x x x 5

Soltero x x x x x x x x 8

Unión libre x x x x x x x x 8

Divorciado x x x 3

Viudo x x 2

26
TABLA DE FRECUENCIAS
 TABLA DE FRECUENCIAS es una
TABLA: Frecuencia de estado civil estudiantes de agrupación de datos cualitativos en clases
ingeniería civil 2021 mutuamente excluyentes que muestra el
número de observaciones en cada clase.
Estado Civil Número de estudiantes
Casado 5 *agrupación de datos cualitativos
Soltero
Unión libre
8
8
*en clases mutuamente excluyentes
Divorciado 3 *que muestra el número de
Viudo 2 observaciones en cada clase.
  26
Fuente: Encuesta Universidad RD 2021
FRECUENCIAS RELATIVAS DE CLASE

TABLA 1: Frecuencia de estado civil


estudiantes de ingeniería civil 2021 TABLA: Frecuencia de estado civil TABLA: Frecuencia de estado civil
Número de Frecuencia estudiantes de ingeniería civil 2021 estudiantes de ingeniería civil 2021
Estado Civil estudiantes relativa
Casado 5 =5/26  Número de Frecuencia Número de Frecuencia
Estado Civil estudiantes relativa Estado Civil estudiantes relativa
Soltero 8  =8/26
Unión libre 8 =8/26  Casado 5 0.192 Casado 5 19%
Divorciado 3  =3/26 Soltero 8 0.308 Soltero 8 31%
Viudo 2  =2/26 Unión libre 8 0.308 Unión libre 8 31%
 Total 26  =26/26 Divorciado 3 0.115 Divorciado 3 12%
Fuente: Encuesta Universidad RD 2021 Viudo 2 0.077 Viudo 2 8%
  26 1.000   26 100%
Fuente: Encuesta Universidad RD 2021 Fuente: Encuesta Universidad RD 2021

Es posible convertir las frecuencias de clase en frecuencias relativas de clase para mostrar la fracción del número
total de observaciones en cada una de ellas
OA2
ORGANIZAR
LOS DATOS
CUALITATIVO
GRÁFICA DE
S EN UNA
GRÁFICA DE
BARRAS
BARRAS.
REPRESENTACIÓN GRÁFICA DE DATOS CUALITATIVOS

8 GRÁFICA DE BARRAS En
ella, las clases se representan
7
Número de estudiantes

5 en el eje horizontal y la
frecuencia de clase en el eje
4

2
vertical. Las frecuencias de
clase son proporcionales a las
1

0
Casado Soltero Unión libre Divorciado Viudo

Estado Civil alturas de las barras.


OA3 PRESENTAR
UN GRUPO DE
DATOS COMO
GRÁFICA DE
UNA GRÁFICA DE
PASTEL.
PASTEL
GRÁFICA DE PASTEL DE ESTADO CIVIL

Viudo
8%

Divorciado
Casado
19% GRÁFICA DE PASTEL
12%

Gráfica que muestra la


parte o porcentaje que
representa cada clase del
Unión libre
31%
Soltero
31%
total de números de
frecuencia.
GRÁFICA DE PASTEL VS GRÁFICA DE BARRAS

GRÁFICA DE PASTEL GRÁFICA DE BARRAS


 En la mayoría de los casos, las  Es preferible usar una gráfica de
gráficas de pastel son las más barras cuando el objetivo es
informativas cuando se trata de comparar el número de
comparar la diferencia relativa en el observaciones en cada categoría.
porcentaje de observaciones de
cada una de las variables de la
escala nominal.
FRECUENCIAS CON DATOS CUANTITATIVOS
FRECUENCIAS, HISTOGRAMA, POLÍGONO DE FRECUENCIAS Y OJIBA
CONSTRUCCIÓN DE
OA4 CREAR UNA
DISTRIBUCIÓN DE
DISTRIBUCIONES DE
FRECUENCIAS
UN GRUPO DE
DE FRECUENCIAS:
DATOS. DATOS
CUANTITATIVOS
DISTRIBUCIÓN DE FRECUENCIAS

DISTRIBUIÓN DE FRECUENCIAS: Agrupación de datos en clases


mutuamente excluyentes, que muestra el número de
observaciones que hay en cada clase.
A diferencia de la tabla de frecuencia (cualitativa), la
distribución de frecuencia (cuantitativa) se deben construir las
clases y, partir de ahí, distribuir en cada clase las observaciones
correspondientes.
CONSTRUCCIÓN DE LAS CLASES

EJERCICIO
 La señora Kathryn Ball, de AutoUSA, desea tablas,  n= Observaciones
diagramas y gráficas para mostrar el precio típico de
venta en diversas concesionarias. La tabla 2-4  K=número de clases
contiene la ganancia de cada uno de los 180
vehículos que se vendieron el mes pasado en  H= valor mayor
Applewood Auto Group. ¿Cuál es la ganancia típica
de cada venta? ¿Cuál es la ganancia más alta? ¿Cuál
 L=valor menor
la ganancia más baja? ¿Alrededor de qué valor  i = intervalo de clase
tienden a acumularse las ganancias?
DISTRIBUCIÓN DE 1387 2148 2201 963 820 2230 3043 2584 2370
FRECUENCIAS 1754
1817
2207
2252
996
2813
1298
1410
1266
1741
2341
3292
1059
1674
2666
2991
2637
1426
1040 1428 323 1553 1772 1108 1807 934 2944
1273 1889 352 1648 1932 1295 2056 2063 2147
1529 1166 482 2071 2350 1344 2236 2083 1973
3082 1320 1144 2116 2422 1906 2928 2856 2502
1951 2265 1485 1500 2446 1952 1269 2989 783
2692 1323 1509 1549 369 2070 1717 910 1538
1206 1761 1638 2348 978 2454 1797 1536 2339
 n=180
1342 1919 1961 2498 1238 1606 1955 1957 2700
 H=3292 443 2357 2127 294 1818 1680 2199 2240 2222
754 2866 2430 1115 1824 1827 2482 2695 2597
 L=294 1621 732 1704 1124 1907 1915 2701 1325 2742
870 1464 1876 1532 1938 2084 3210 2250 1837
1174 1626 2010 1688 1940 2639 377 2279 2842
1412 1761 2165 1822 2197 842 1220 2626 2434
1809 1915 2231 1897 2646 1963 1401 1501 1640
2415 2119 2389 2445 1461 2059 2175 1752 1821
1564 1766 335 2886 1731 2338 1118 2058 2487
Regla de 2 a la k.
DISTRIBUCIÓN DE Esta guía sugiere que se elija el menor número (k) para el número de clases,
FRECUENCIAS de tal manera que 2^k (en palabras, dos elevado a la k-ésima potencia) sea
mayor que el número de observaciones (n).
(DOS MÉTODOS DE Entonces:
OBTENER A K) n = 180. Si se supone que k = 7, lo cual significa que utilizará siete clases,
entonces 2^7 = 128, algo menos que 180. De ahí que 7 no represente
suficientes clases.

O sea….
 n=180
Si k = 8, entonces 2^8 = 256, que es mayor que 180. Por lo tanto, el número
 H=3292
de clases que se recomienda es de 8.
 L=294
 K= 8
Fórmula de Sturges:

K=1+3.322*LOG(n)

K=1+ 3.322*LOG (180)=8.49201526 ,

aproximadamente k=8
DISTRIBUCIÓN DE El intervalo o ancho de clase debería ser el mismo para todas
las clases. Todas las clases juntas deben cubrir por lo menos
FRECUENCIAS la distancia del valor más bajo al más alto de los datos.
Expresado esto en una fórmula sería:

 n=180  n= Observaciones

 H=3292  K=número de clases

 L=294  H= valor mayor

 K= 8  L=valor menor

 i= 400  i = intervalo de clase

En la práctica, por lo general este tamaño de


intervalo se redondea a una cifra conveniente, tal
como un múltiplo de 10 o 100. En este caso, el
valor de $400 podría emplearse sin
inconvenientes.
CONSTRUCCIÓN DE LAS CLASES

 Ya temenos valores cuantitativos que se pueden incluir en intervalos convetidos en categorías


 Recordemos que las clases deben ser mutuamente excluyentes: esto quiere decir es importante y
necesario que sea posible incluir cada observación en una sola categoría. Esto significa que debe
evitar la superposición de límites de clase confusos.
 n1 <= x <n2
 Dos elementos que son tanteos importantes:
 ..i (intervalo de clase) varió de 374.75 a 400 para ajustar
 Varía el rango. Que reviere Rango= H-L en la fórmula o sea 3292-294= 2998 pero se llevó a 3200
8(400) = 3200

https://www.youtube.com/watch?v=9piGuCi1R-w
Intervalo Empezando en 0 Empezando en 200 Empezando en 294

DISTRIBUCIÓN DE 1 [0 - 400) [200 - 600) [294 - 694)


2 [400 - 800) [600 - 1000) [694 - 1094)
FRECUENCIAS 3 [800 - 1200) [1000 - 1400) [1094 - 1494)
4 [1200 - 1600) [1400 - 1800) [1494 - 1894)
5 [1600 - 2000) [1800 - 2200) [1894 - 2294)
6 [2000 - 2400) [2200 - 2600) [2294 - 2694)
Mayor o igual Menor 7 [2400 - 2800) [2600 - 3000) [2694 - 3094)
que que 8 [2800 - 3200) [3000 - 3400) [3094 - 3494)
x<= ni ni<x
1 200 600 *Si empezamos el primer intervalo en 0 podemos observar que ni siquiera
cubrimos la totalidad del conjunto de datos, puesto que existen valores por
2 600 1000 encima de 3200.
3 1000 1400
4 1400 1800 •Si tomamos el valor mínimo de nuestro conjunto de datos, como el límite
inferior de nuestro primer interval, podríamos llevar a cabo sin ningún
5 1800 2200
inconveniente la realización de la tabla de distribución de frecuencias.
6 2200 2600
7 2600 3000 •Una mejor opción es redondear los límites a un valor conveniente, esto
8 3000 3400 dependerá de los datos, así como del criterio del investigador, en este caso
hemos utilizado como límite inferior del primer intervalo el valor de 200. Esto
nos permite cumplir con los 8 intervalos con un ancho de clase de 400 unidades.

Por tanto, los límites de clase estarán dados por:


DISTRIBUCIÓN DE 1387 2148 2201 963 820 2230 3043 2584 2370
FRECUENCIAS 1754
1817
2207
2252
996
2813
1298
1410
1266
1741
2341
3292
1059
1674
2666
2991
2637
1426
1040 1428 323 1553 1772 1108 1807 934 2944
1273 1889 352 1648 1932 1295 2056 2063 2147
1529 1166 482 2071 2350 1344 2236 2083 1973
Mayor o igual Menor
que que 3082 1320 1144 2116 2422 1906 2928 2856 2502
1951 2265 1485 1500 2446 1952 1269 2989 783
x<= ni ni<x
2692 1323 1509 1549 369 2070 1717 910 1538
1 200 600 1206 1761 1638 2348 978 2454 1797 1536 2339
2 600 1000 1342 1919 1961 2498 1238 1606 1955 1957 2700
443 2357 2127 294 1818 1680 2199 2240 2222
3 1000 1400
754 2866 2430 1115 1824 1827 2482 2695 2597
4 1400 1800 1621 732 1704 1124 1907 1915 2701 1325 2742
5 1800 2200 870 1464 1876 1532 1938 2084 3210 2250 1837
1174 1626 2010 1688 1940 2639 377 2279 2842
6 2200 2600
1412 1761 2165 1822 2197 842 1220 2626 2434
7 2600 3000 1809 1915 2231 1897 2646 1963 1401 1501 1640
8 3000 3400 2415 2119 2389 2445 1461 2059 2175 1752 1821
1564 1766 335 2886 1731 2338 1118 2058 2487
DISTRIBUCIÓN DE FRECUENCIAS

CONTABILIZAR CADA VALOR EN EL INTERVALO FRECUENCIA ABSOLUTA


Ganancia
Mayor o FRECUENCIA
igual que Menor que
x<= ni ni<x
200 600 8
600 1000 11
1000 1400 23
1400 1800 38
1800 2200 45
2200 2600 32
2600 3000 19
3000 3400 4
OA5 COMPRENDER CONCLUSIONES Y
UNA DISTRIBUCIÓN DE
FRECUENCIAS FRECUENCIA
RELATIVAS.
RELATIVA
DISTRIBUCIÓN DE FRECUENCIAS

DISRIBUCIÓN DE FRECUENCIA CONCLUSIONES


 1. Las ganancias por vehículo oscilan entre $200
Ganancia FRECUENCIA FRECUENCIA RELATIVA %
y $3 400.
8 0.04  2. Las ganancias se concentran entre $1 000 y
200 600 4%
600 1000 11 0.06 6% $3 000. Las ganancias de 157 vehículos, u 87%,
23 0.13 caen dentro de este rango.
1000 1400 13%
1400 1800 38 0.21 21%  3. La máxima concentración, o frecuencia más
1800 2200 45 0.25 25% alta, se encuentra en la clase que va de $1 800 a
2200 2600 32 0.18 18% $2 200. Hay 45 observaciones. La mitad de esta
2600 3000 19 0.11 11% clase se ubica en $2 000. De manera que $2 000
4 0.02 representa la ganancia típica de venta de un
3000 3400 2%
vehículo. (1800+2200)/2=2000
    180 1.00 100%
OA6 REPRESENTAR UNA
DISTRIBUCIÓN DE
FRECUENCIAS DE DATOS
POR MEDIO DE
HISTOGRAMAS
HISTOGRAMAS
POLÍGONOS
O
DE
POLÍGONOS
FRECUENCIA.
HISTOGRAMA
HISTOGRAMA Gráfica en la que las clases se señalan en el eje horizontal y las frecuencias de clase en el eje
vertical. Las frecuencias de clase se representan por medio de las alturas de las barras, que se dibujan de
manera adyacente.
DISTRIBUCIÓN DE FRECUENCIA HISTOGRAMA
50
45
45

Ganancia FRECUENCIA FRECUENCIA RELATIVA % 40 38

35
32

Vehículos vendidos
200 600 8 0.04 4% 30

600 1000 11 0.06 6% 25 23

1000 1400 23 0.13 13% 20 19

1400 1800 38 0.21 21% 15


11
1800 2200 45 0.25 25% 10 8

2200 2600 32 0.18 18% 5 4

2600 3000 19 0.11 11% 0


(200-600) (600-1000) (1000-1400) (1400-1800) (1800-2200) (2200-2600) (2600-3000) (3000-3400)

3000 3400 4 0.02 2% Ganancia


    180 1.00 100%
https://www.youtube.com/watch?v=yZ2K8FZrM0A&t=8s
HISTOGRAMA VS GRÁFICO DE BARRA

HISTOGRAMA
9 50
8 8 45
8 45

7 40 38
Número de estudiantes

35 32

Vehículos vendidos
6
5 30
5
25 23
4
20 19
3
3
15
2 11
2
10 8
1 5 4

0 0
Casado Soltero Unión libre Divorciado Viudo (200-600) (600-1000) (1000-1400) (1400-1800) (1800-2200) (2200-2600) (2600-3000) (3000-3400)

Estado Civil Ganancia


POLÍGONO DE FRECUENCIA

POLÍGONO DE FRECUENCIA ACONDICIONAR LA DISTRIBUCIÓN


 Un polígono de frecuencias también Ganancia PUNTO MEDIO FRECUENCIA
0 200 100 0
muestra la forma que tiene una 200 600 400 8
distribución y es similar a un histograma. 600 1000 800 11
1000 1400 1200 23
Consiste en segmentos de recta que 1400 1800 1600 38
conectan los puntos que forman las 1800 2200 2000 45
intersecciones de los puntos medios de 2200 2600 2400 32
2600 3000 2800 19
clase y las frecuencias de clase 3000 3400 3200 4
Para graficar el polígono de frecuencia hay que valerse:
3400 3800 3600 0
1. Puntos medios o marcas de clase
2. Dos clases ficticias
https://www.youtube.com/watch?v=ALcuw0-I3DM
POLÍGONO DE FRECUENCIA

DISTRIBUCIÓN POLÍGONO DE FRECUENCIA


50
Ganancia PUNTO MEDIO FRECUENCIA
45 45
0 200 100 0
40
38

Número de carros vendidos


200 600 400 8 35
32
600 1000 800 11 30

1000 1400 1200 23 25


23
20
1400 1800 1600 38 19
15
1800 2200 2000 45 11
10
2200 2600 2400 32 8
5 4
2600 3000 2800 19 0 0 0
100 400 800 1200 1600 2000 2400 2800 3200 3600
3000 3400 3200 4
Ganancia
3400 3800 3600 0

MARCAS DE CLASE UN POLÍGONO DE FRECUENCIA DEBE


ESTAR CERRADO
https://www.youtube.com/watch?v=ALcuw0-I3DM&t=220s
POLÍGONO-HISTOGRAMA 50

45
45

40
38

35
 P-H
32

30
Vehículo vendidos

25
23

POLÍGONO
20 19

15
11
10
8

5 4

0 0
0
100 400 800 1200 1600 2000 2400 2800 3200 3600

Ganancia
OA7 CONSTRUIR E
INTERPRETAR
DISTRIBUCIÓN
UNA
DE
FRECUENCIA
FRECUENCIA
ACUMULATIVA.
ACUMULADA Y OJIVA
OJIVA

En estadística, una ojiva es un


Ganancia FRECUENCIA ACUMULADA %
gráfico que muestra la curva
(200-600) 8 8 4.44%
de una función de distribución (600-1000) 11 19 10.56%
acumulativa dibujada a mano (1000-1400) 23 42 23.33%
o en software de (1400-1800) 38 80 44.44%
computadora. Los puntos (1800-2200) 45 125 69.44%
trazados son el límite de la (2200-2600) 32 157 87.22%
clase superior y la frecuencia (2600-3000) 19 176 97.78%
(3000-3400) 4 180 100.00%
acumulativa correspondiente.
FREUENCIA ACUMULADA

FRECUENCIA ACUMULADA OJIVA


200

180 176 180

160 157
140
125
120

100

80 80

60

40 42

20 19
8
0
(200-600) (600-1000) (1000-1400) (1400-1800) (1800-2200) (2200-2600) (2600-3000) (3000-3400)

https://www.youtube.com/results?search_query=construcci%C3%B3n+de+una+ojiva+con+excel
GRACIAS
JLCORPORAN@GMAIL.COM

También podría gustarte