Está en la página 1de 8

UNIVERSIDAD MAYOR DE SAN ANDRÉSCIV-271 PROBABILIDAD Y ESTADÍSTICA

FACULTAD DE INGENIERÍA – INGENIERÍA CIIVL AUX. LEONEL URIEL TAPIA SANDY - 76794755

CAPÍTULO 01 INTRODUCCIÓN
A LA ESTADÍSTICA
1.1 DEFINICIÓN
La estadística recopila datos en función a un diseño, planeamiento y/o desarrollo de
investigaciones, los organiza de acuerdo a un orden específico, determina valores que representan
a estos datos organizados para así sacar conclusiones o un análisis de sucesos de probabilidad en
función a un objetivo.

1.2 CLASIFICACIÓN DE LA ESTADÍSTICA


Con la definición dada de la estadística podemos dividirlo en:
✓ ESTADÍSTICA DESCRIPTIVA: Se ocupa de recopilar datos, organizarlos de
acuerdo a un orden, obtener representaciones de dichos datos y obtención gráfica
de lo anterior.
✓ ESTADÍSTICA INFERENCIAL: Se ocupa de hacer predicciones, inducciones
o generalizaciones acerca de características de una población de datos en base a
la información de una muestra de la población (dados por la estadística
descriptiva).
1.2.1 ESTADÍSTICA DESCRIPTIVA
Con la definición anterior se va definir los siguientes aspectos:
1. RECOLECCIÓN DE DATOS:
se puede buscar datos ya publicados por otras fuentes:
a) POBLACIÓN: Conjunto total de muestras a analizar.
b) MUESTRA O INDIVIDUO: Elemento de la población.
c) ATRIBUTO: Característica investigada en el análisis, o tema referente que la
estadística va analizar.
1.2.1.2 ORGANIZACIÓN DE DATOS:
Sean los datos de ejemplo de una encuesta de 90 edades de estudiantes de la carrera de inegniería,
dados de 21 a 30 años recopilados de forma aleatoria el cuál se presenta en la siguiente tabla:

DATOS RECOPILADOS
25 27 23 24 25 24 30 25 25 28
27 22 28 29 26 25 25 27 23 22
25 28 30 22 26 30 26 25 25 30
26 25 26 28 23 28 23 24 23 24
23 26 24 28 29 23 28 21 26 29
28 29 24 25 24 27 27 26 22 23
27 25 26 25 24 21 22 23 29 27
26 30 27 24 28 28 21 24 21 27
26 26 25 24 22 28 27 27 23 27
29 24 25 21 24 26 22 27 26 29
1. Ordenar los datos de forma creciente, o decreciente (se puede realizar un
Pictograma):

1
UNIVERSIDAD MAYOR DE SAN ANDRÉSCIV-271 PROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA – INGENIERÍA CIIVL AUX. LEONEL URIEL TAPIA SANDY - 76794755

PICTOGRAMA DE FRECUENCIAS
Frecuencia
TIPO VALOR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
"𝐧𝐢 "
x1 21 21 21 21 21 4
x2 22 22 22 22 22 22 22 6
x3 23 23 23 23 23 23 23 23 23 23 23 10
x4 24 24 24 24 24 24 24 24 24 24 24 24 11
x5 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 14
x6 26 26 26 26 26 26 26 26 26 26 26 26 26 12
x7 27 27 27 27 27 27 27 27 27 27 27 27 27 12
x8 28 28 28 28 28 28 28 28 28 28 28 28 11
x9 29 29 29 29 29 29 5
x10 30 30 30 30 30 30 5
#N = Número Total de Muestras = 90
1. Realizar la tabla de frecuencias

[1] [2] [3] [4] [5] [6] [7] [8] [9]

veces se repita
Suma de cada
valor, cuantas
% Frecuencia

% Frecuencia
Acumulada

Acumulada

Acumulada
Frecuencia

Frecuencia

Frecuencia

Frecuencia

MUESTRA
Valor de
Relativa

Relativa

Relativa

Relativa

muestra
TIPO

VAL
OR

𝐧𝐢 𝐍𝐢 𝐟𝐢 𝐅𝐢 𝐟𝐢 % 𝑭𝐢 % 𝐱𝐢 𝐱 𝐢 ∙ 𝐧𝐢

x1 21 4 = 4 0,0444 0,0444 4,44 4,44 21 84


+
x2 22 6 = 10 0,0667 0,1111 6,67 11,11 22 132
+
x3 23 10 = 20 0,1111 0,2222 11,11 22,22 23 230
+
x4 24 11 = 31 0,1222 0,3444 12,22 34,44 24 264
+
x5 25 14 = 45 0,1556 0,5000 15,56 50,00 25 350
+
x6 26 12 = 57 0,1333 0,6333 13,33 63,33 26 312
+
x7 27 12 = 69 0,1333 0,7667 13,33 76,67 27 324
+
x8 28 11 = 80 0,1222 0,8889 12,22 88,89 28 308
+
x9 29 5 = 85 0,0556 0,9444 5,56 94,44 29 145
+
x10 30 5 = 90 0,0556 1,0000 5,56 100,00 30 150
=
#𝐍 = 90 ∑ 𝐱 𝐢 ∙ 𝐧𝐢 = 2299

Se entiende los siguientes conceptos:


a) [𝟐] FRECUENCIA “𝐧𝒊 ”: Es la cantidad de veces que se repite un tipo de muestra o
individuos, llamado también frecuencia absoluta.

2
UNIVERSIDAD MAYOR DE SAN ANDRÉSCIV-271 PROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA – INGENIERÍA CIIVL AUX. LEONEL URIEL TAPIA SANDY - 76794755

b) NÚMERO DE MUESTRAS TOTALES “#𝐍”: Es la cantidad total de muestras o


individuos, o también es la sumatoria de todas las frecuencias de cada tipo de muestra
que se tiene.
c) TIPO DE MUESTRA Y VALOR DE MUESTRA: "𝐱𝐢 = 𝐕𝐚𝐥𝐨𝐫𝐢 ": El tipo de muestra,
está dado por filas desde 1 hasta cuantos tipos de muestra haya 𝑥1 ; 𝑥2 ; 𝑥3 ; ⋯ ; 𝑥𝑛 , y el
valor que tiene cierto tipo de muestra de denomina Valor de Muestra.

d) [𝟑] FRECUENCIA ACUMULADA“𝐍𝐢 ”: Es ir acumulando los valores de la frecuencia,


a medida que se va bajando hasta llegar a la última fila cantidad de veces que se repite un
tipo de muestra o individuos.
e) [𝟒] FRECUENCIA RELATIVA “𝐟𝐢 ”: La frecuencia relativa "f𝑖 " es proporcional a la
1 1
frecuencia absoluta, y el valor de proporción es igual a Número de Muestras = N es decir
que:
ni
fi =
#N
Se observa que se tiene el porcentaje de cada una de las muestras, es decir que representa el
porcentaje de participación de cada una de las muestras, entonces es un porcentaje expresado en
tanto por uno, también es recomendable tener la frecuencia acumulada con 4 decimales, para que
al multiplicar por 100 para obtener el porcentaje, sea exacto y directo.
f) [𝟓] FRECUENCIA RELATIVA ACUMULADA “𝐅𝐢 ”: Es ir acumulando los valores
de la frecuencia relativa a medida que se llena la tabla de arriba abajo, el último valor
siempre tiene que ser igual a la unidad.
g) [𝟔] % FRECUENCIA RELATIVA “%𝐟𝐢 ”: Es igual a la frecuencia relativa multiplicada
por 100:
%𝐟𝐢 = 𝐟𝐢 ∙ 𝟏𝟎𝟎
h) [𝟕] % FRECUENCIA RELATIVA ACUMULADA “%𝐅𝐢 ”: Es igual a la frecuencia
relativa acumulada multiplicada por 100:
%𝐅𝐢 = 𝐅𝐢 ∙ 𝟏𝟎𝟎
i) [𝟖] VALOR DE MUESTRA “𝒙𝐢 ”: Es el valor que se puede adoptar cada muestra, y que
al ordenarlo se tiene el tipo de muestra, nombrada desde el 1 al último.
i) [𝟗] SUMA DE TODOS LOS VALORES DE UN SOLO TIPO DE MUESTRA“𝐱𝐢 ∙
𝐧𝐢 ”: Se tiene 4 muestras igual a 21, entonces se tiene:
21 + 21 + 21 + 21 = 84, que también es igual a multiplicar el valor de un tipo de
muestra multiplicado por la frecuencia de un solo tipo: 21 ∙ 4 = 84.
j) El valor del tipo de muestra depende del tipo de variable, discreta (valores puntuales) y
variables continuas (intervalos, para obtener el xi de este caso, únicamente se obtiene el
promedio) y el rango es el espacio que hay en cada intervalo.
1.2.1.3 TENDENCIA CENTRAL
Cuando se tiene un grupo de observaciones, se desea describirlo a través de un sólo número. Para
tal fin, no se usa el valor más elevado ni el valor más pequeño como único representante, ya que
sólo representan los extremos. Una de las propiedades más sobresalientes de la distribución de
datos es su tendencia a acumularse hacia el centro de la misma. Esta característica se denomina
tendencia central.
Las medidas de tendencia central más usuales son:
3
UNIVERSIDAD MAYOR DE SAN ANDRÉSCIV-271 PROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA – INGENIERÍA CIIVL AUX. LEONEL URIEL TAPIA SANDY - 76794755

✓ MEDIA ARITMÉTICA M
✓ MEDIANA Me
✓ MODA Mo
1.2.1.3.1 MEDIA ARITMÉTICA
La media aritmética de N valores, es igual a la suma de todos ellos dividida entre N. Se denota
por 𝑥̅ .Esto es:
∑N
i=1 xi
M=
#N
Cuando los datos tienen más de una frecuencia, para obtener la media aritmética se agrega otra
columna a la tabla estadística con el producto de las observaciones y sus frecuencias. Es decir, si
se cuenta con una distribución de datos entonces se aplica la fórmula:
∑N
i=1 xi ∙ 𝑛i
𝑀=
#N
1.2.1.3.2 MEDIANA
La mediana es el valor del punto central de una serie de datos ordenados de forma ascendente o
descendente.
De acuerdo al número de casos o datos, hay dos formas para calcular la mediana: para número
impar y para número par:
Para encontrar la posición, se toma en cuenta si la cantidad de términos “# N” del desarrollo
tiene característica Par o Impar:
Si #N es IMPAR
CUANDO N ES IMPAR
𝑛=7 TIENE 1 TÉRMINO CENTRAL

𝑡1 𝑡2 𝑡3 𝑡4 𝑡5 𝑡6 𝑡7
▪ Si n es PAR CUANDO N ES PAR
TIENE 2 TÉRMINOS CENTRAL
𝑛 = 10
𝑡1 𝑡2 𝑡3 𝑡4 𝑡5 𝑡6 𝑡7 𝑡8 𝑡9 𝑡10
APRENDEMOS A ENCONTRAR ESTAS POSICIONES Y SI TIENE 1 O 2 TÉRMINOS
CENTRALES:
Recordar los números:
0
1
2
❖ Cantidad de términos centrales
Sabemos que el 1 es impar, entonces hay 1 termino central cuando n sea IMPAR
Sabemos que el 0 y 2 son PAR, entonces hay 2 términos centrales cuando n sea PAR
❖ Posición de términos centrales
1𝑒𝑟 𝑇. 𝐶. 𝑡𝑐1 = 𝑡𝑘 = 𝑡𝑛+0 ← 0
2
1 → 𝑡𝑐 = 𝑡𝑘 = 𝑡𝑛+1 Ú𝑛𝑖𝑐𝑜 𝑇. 𝐶.
2𝑑𝑜 𝑇. 𝐶. 𝑡𝑐2 = 𝑡𝑘 = 𝑡𝑛+2 ← 2 2
2

4
UNIVERSIDAD MAYOR DE SAN ANDRÉSCIV-271 PROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA – INGENIERÍA CIIVL AUX. LEONEL URIEL TAPIA SANDY - 76794755

❖ Número impar de datos ordenados de menor a mayor o de mayor a menor: la


mediana es el valor que queda justo al centro.

Ejemplo:
Obtener la mediana de los siguientes datos: 4, 7, 1, 9, 2, 5, 6.
Solución. Ordenando de forma ascendente: 1, 2, 4, 5, 6, 7, 9.
El valor que queda al centro es el 5, porque hay tres datos antes y tres datos después de él, entonces
la mediana es 5.
❖ Número de datos par: en este caso se busca la media aritmética entre los dos
valores centrales.
Ejemplo:
Obtener la mediana de los siguientes datos: -3, 5, 18, 4, 11, -6, 9, 10, -1, 2.
Solución. Ordenando de forma ascendente: -6, -3, -1, 2, 4, 5, 9, 10, 11, 18.
Los valores centrales son 4 y 5. Su media aritmética es:
4+5
𝑀𝑒 = = 4.50
2
En este caso, la mediana de este conjunto no pertenece al conjunto de datos.
Las características de la mediana son:
❖ En su cálculo no se incluyen todos los valores de la variable.
❖ La Mediana no es afectada por valores extremos.
❖ Puede ser calculada en distribuciones de frecuencia con clases abiertas.
No es lógica desde el punto de vista algebraico.
1.2.1.3.3 MODA
La moda de un conjunto de datos numéricos es el valor que más se repite, es decir, el que tiene el
mayor número de frecuencias absolutas. La moda puede ser no única e inclusive no existir.
La moda es una medida de tendencia central muy importante, porque permite planificar, organizar
y producir para satisfacer las necesidades de la mayoría.
Ejemplo.
Obtener la moda de los siguientes datos: -3, 3, -2, 0, 3, -1, -2, 4, 5, -2, 0, 1.
Solución. Ordenando de forma ascendente: -3, -2, -2, -2, -1, 0, 0, 1, 3, 3, 4, 5.
El valor que más se repite es el -2, por lo tanto, ese valor es su moda.
Las características de la moda son:
❖ En su cálculo no se incluyen todos los valores de la variable.
❖ El valor de la moda puede ser afectado grandemente por el método de designación de
los intervalosde clases.
❖ No está definida algebraicamente.
❖ Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
❖ No es afectada por valores extremos.

5
UNIVERSIDAD MAYOR DE SAN ANDRÉSCIV-271 PROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA – INGENIERÍA CIIVL AUX. LEONEL URIEL TAPIA SANDY - 76794755

1.3 EJEMPLOS
EJEMPLO 1. Del ejercicio que se ha planteado en la teoría:

[1] [2] [3] [4] [5] [6] [7] [8] [9]

veces se repita
Suma de cada
valor, cuantas
% Frecuencia

% Frecuencia
Acumulada

Acumulada

Acumulada
Frecuencia

Frecuencia

Frecuencia

Frecuencia
MUESTRA

Valor de
Relativa

Relativa

Relativa

Relativa

muestra
TIPO

VAL
OR

𝐧𝐢 𝐍𝐢 𝐟𝐢 𝐅𝐢 𝐟𝐢 % 𝑭𝐢 % 𝐱𝐢 𝐱 𝐢 ∙ 𝐧𝐢

x1 21 4 = 4 0,0444 0,0444 4,44 4,44 21 84


+
x2 22 6 = 10 0,0667 0,1111 6,67 11,11 22 132
+
x3 23 10 = 20 0,1111 0,2222 11,11 22,22 23 230
+
x4 24 11 = 31 0,1222 0,3444 12,22 34,44 24 264
+
x5 25 14 = 45 0,1556 0,5000 15,56 50,00 25 350
+
x6 26 12 = 57 0,1333 0,6333 13,33 63,33 26 312
+
x7 27 12 = 69 0,1333 0,7667 13,33 76,67 27 324
+
x8 28 11 = 80 0,1222 0,8889 12,22 88,89 28 308
+
x9 29 5 = 85 0,0556 0,9444 5,56 94,44 29 145
+
x10 30 5 = 90 0,0556 1,0000 5,56 100,00 30 150
=
#𝐍 = 90 ∑ 𝐱 𝐢 ∙ 𝐧𝐢 = 2299

✓ MEDIA ARITMÉTICA (NOS AYUDA LA COLUMNA [9])


∑N
i=1 𝐱 𝐢 ∙ 𝐧𝐢 2299
M= = = 25.55
#N 90
✓ MEDIANA (NOS AYUDA LA COLUMNA [3])
Siendo n Par es el entre los valores de las posiciones: 90/2 y 92/2
25 + 26
= 25.5 Me =
2
✓ MODA (NOS AYUDA LA COLUMNA [2])
Nos fijamos el valor que más se repite
Mo = 𝟐𝟓
Graficar el histograma significa dibujar un diagrama de barras, en el cual se representa los
valores y las frecuencias respectivas

6
UNIVERSIDAD MAYOR DE SAN ANDRÉSCIV-271 PROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA – INGENIERÍA CIIVL AUX. LEONEL URIEL TAPIA SANDY - 76794755

HISTOGRAMA DE FRECUENCIA
16
Polígono de
14
frecuencias
12

10

0
21 22 23 24 25 26 27 28 29 30

EJEMPLO 2

HISTOGRAMA DE FRECUENCIAS
12

10

0
8 23 38 53 68 83 98

7
UNIVERSIDAD MAYOR DE SAN ANDRÉSCIV-271 PROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA – INGENIERÍA CIIVL AUX. LEONEL URIEL TAPIA SANDY - 76794755

EJEMPLO 3

Frecuancia Frecuancia
Frecuencia Frecuecia Frecuencia Frecuencia
INTERVALO = 14 Relativa Relativa Valor Medio
Absoluta Acumulada Relativa Relativa
Acumulada Acumulada
li ls ni Ni fi Fi fi% Fi xi (prom) xi*ni
1 1 15 3 3 0,0375 0,04 3,75 3,75 8 =1+15/2 24
2 16 30 12 15 0,1500 0,19 15,00 18,75 23 =16+30/2 276
3 31 45 15 30 0,1600 0,35 16,00 34,75 38 =31+45/2 570
4 46 60 18 48 0,2250 0,57 22,50 57,25 53 =46+60/2 954
5 61 75 22 70 0,2750 0,85 27,50 84,75 68 =61+75/2 1496
6 76 90 4 74 0,0500 0,90 5,00 89,75 83 =76+90/2 332
7 91 105 6 80 0,0750 0,97 7,50 97,25 98 =91+105/2 588
N= 80 MEDIA 53 4240
RANGO 14 MEDIANA 53
MODA 53

HISTOGRAMA DE FRECUENCIAS
12

10

0
8 23 38 53 68 83 98

EJEMPLO 4

También podría gustarte