Está en la página 1de 16

TEXTO CONSULTA: ESTADÍSTICA DESCRIPTIVA DE RUFINO MOYA CALDERON

TEMA 1: INTRODUCCIÓN A LA ESTADÍSTICA APLICADA


¿QUÉ ES LA ESTADÍSTICA?
Definición 1.- Es un ciencia que proporciona un conjunto de métodos que se utilizan
para recolectar datos, resumir, clasificar, analizar e interpretar el comportamiento de
los “datos” con respecto a una característica materia de estudio o investigación.
DIVISIÓN DE LA ESTADÍSTICA:

1. ESTADÍSTICA DESCRIPTIVA
Definición 2.- Es el conjunto de métodos que implican la recolección, presentación y
caracterización de un conjunto de datos a fin de describir en forma apropiada las
diversas características de estas.
2. ESTADÍSTICA INFERENCIAL
Definición 3.- Es el conjunto de métodos o técnicas que posibilitan la generalización o
toma de las decisiones en base a una información parcial obtenida mediante técnicas
descriptivas.
Ejemplo 1: Un gerente de personal desea conocer las aptitudes de cinco secretarias que
trabajan en una dependencia particular de una compañía. Se aplica una prueba de
aptitudes a las cinco secretarias y las calificaciones son 85, 90, 93, 82 y 95 puntos.
Supongamos que la medida estadística que emplea el gerente de personal es la aptitud
promedio o media aritmética.
85 + 90 + 93 + 82 + 95 435
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = = = 89 𝑝𝑢𝑛𝑡𝑜𝑠
5 5
Estadística descriptiva: el promedio de calificación de las 5 secretarias es 89 puntos.
Estadística inferencial: el promedio general de todas las secretarias de la compañía tiene
87 puntos.
Ejemplo 2: Cuatro bombillas de marca A dejaron de funcionar después de 1100, 980,
900, 1020 horas de uso continuo. Cinco bombillas de marca B dejaron de funcionar
después de 960, 1050, 1065, 845 y 980 horas de uso continúo. Se llega a las siguientes
conclusiones:
a) La duración promedio de las cuatro bombillas marca A es de 1000 hrs., mientras
que la duración promedio de las cinco bombillas marca B es de 980 hrs.
La duración promedio de las bombillas marca A es:
1100 + 980 + 900 + 1020 4000
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑀𝑎𝑟𝑐𝑎 𝐴 = = = 1000 ℎ𝑟𝑠.
4 4
La duración promedio de las bombillas marca B es:
960 + 1050 + 1065 + 845 + 980 4900
𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑀𝑎𝑟𝑐𝑎 𝐴 = = = 980 ℎ𝑟𝑠.
5 5
ESTE ENUNCIADO CORRESPONDE A UNA ESTADÍSTICA DESCRIPTIVA YA QUE NO DA
CONCLUSION, SINO SOLO DESCRIBE UN PARAMETRO.
b) La duración promedio de todas las bombillas marca A es mayor que la de todas
las bombillas marca B.
PUESTO QUE SE ESTA GENERALIZANDO, QUE LA DURACIÓN PROMEDIO DE TODAS LAS
BOMBILLAS MARCA ES MAYOR QUE TODAS LAS BOMBILLAS MARCA B, LA CONCLUSIÓN
PROVIENE DE UNA ESTADÍSTICA INFERENCIAL.
c) La diferencia entre los dos promedios es de 20 hrs.
Diferencia = Promedio marca A – Promedio marca B = 1000 hrs. – 980 hrs. = 20 hrs.
EL ENUNCIADO CORRESPONDE A UNA ESTADÍSTICA DESCRIPTIVA.
d) La diferencia entre los dos promedios es demasiado pequeño para llegar a la
conclusión de que las bombillas marca A son mejores que las bombillas marca B.
SE ESTA USANDO LOS PROMEDIOS DE LOS DATOS OBSERVADOS PARA INFERIR SOBRE
LA DIFERENCIA DE TODAS LAS BOMBILLAS. POR TANTO, EL ENUNCIADO CORRESPONDE
A UNA ESTADÍSTICA INFERENCIAL.
e) Si se selecciona o prueba otra bombilla marca A, probablemente durara más que
el promedio de las bombillas marca B.
SE HACE UNA GENERALIZACIÓN QUE CUALQUIER BOMBILLA MARCA DURARÁ MÁS QUE
EL PROMEDIO DE LAS BOMBILLAS MARCA B, PROVIENE DE LA INFERENCIA ESTADÍSTICA.
f) Usted decide comprar bombillas marca A en vez de bombillas marca B.
USTEDES ESTAN GENERALIZANDO QUE LAS BOMBILLAS MARCA A DURARAN MAS QUE
LAS BOMBILLAS MARCA B. POR LO TANTO, ES UNA INFERENCIA ESTADÍSTICA.
¿Cuáles de las conclusiones provienen de la Estadística Descriptiva y cuáles de la
Inferencia Estadística?

POBLACIÓN Y MUESTRA
Definición 4.- Población es la colección de todos los individuos, objetos u observaciones
que poseen al menos una característica común.
Ejemplos
1. Las edades de los estudiantes del Perú.
2. Las edades de los trabajadores del área de salud.
3. Las edades de los profesores activos.
4. Los pesos de los melones de una cosecha de la granja “ABC”.
5. Las razas de los perros de la ciudad de Cochabamba.
Población finita.- Una población finita es aquella que tiene un número limitado de
elementos.
Notación: El tamaño de la población finita lo denotaremos por “N”.
Ejemplo: Las estaturas de todos los estudiantes que actualmente estudian en la
Universidad Mayor de San Simón.
Población infinita.- Una población infinita es aquella que no tiene un límite o cotas, es
decir, tiene un número infinito de elementos.

Ejemplo: La calidad de todas las unidades producida mediante un proceso


manufacturero.
Definición 5.- Parámetro una medida resumen que describe una característica de toda
la población.
Ejemplo: Promedio de edad de los estudiantes de UMSS.
Definición 6.- Muestra es una parte o un subconjunto representativo de la población.
Notación: El número de observaciones (o tamaño) de la muestra se denota por “n”.
Definición 7.- Estadístico o Estadígrafo es una medida resumen que describe una
característica de la muestra.
Ejemplo: Se realiza una votación preliminar para determinar las preferencias de los
electores en una elección presidencial. Con este fin se entrevistan 1500 electores
registrados y entre ellos 860 están a favor del candidato A. Respondan lo siguiente:
a. ¿Qué constituye la muestra?
La muestra está constituida por las respuestas de los 1500 electores registrados.
b. ¿Qué constituye la población?
La población está constituida por las respuestas de todos los electores
registrados.
c. ¿La población es finita o infinita?
La población es finita.
d. ¿Cuál es el parámetro de la población?
El parámetro de la población será la proporción de todos los electores
registrados que están a favor del candidato A.
e. ¿Cuál es el estadístico de la muestra?
El estadístico de la muestra es la proporción de los 1500 electores registrados
que están a favor del candidato A.
860
𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑐𝑎𝑛𝑑𝑖𝑑𝑎𝑡𝑜 𝐴 = = 0.57 (57%)
1500
Porcentaje
1500 electores registrados 100%
860 electores registrados x%
860 𝑒𝑙𝑒𝑐𝑡𝑜𝑟𝑒𝑠 𝑟𝑒𝑔𝑖𝑠𝑡𝑟𝑎𝑑𝑜𝑠 ∗ 100%
𝑥=
1500 𝑒𝑙𝑒𝑐𝑡𝑜𝑟𝑒𝑠 𝑟𝑒𝑔𝑖𝑠𝑡𝑟𝑎𝑑𝑜𝑠
𝑥 = 57 %
Exposición Externa: Primer Parcial 28/10/2020
Michel Uso de la Estadística
Emma Método Estadístico
Eloy Recolección de los Datos
Juan Pablo Muestreo
Florentino Muestreo
Informe: Introducción, desarrollo y conclusión.
Exposición
Diapositivas o papelografos
TEMA 2: ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS
Introducción.- conjunto de datos
 Revisión y corrección de los datos.
 Construcción de tablas de frecuencias.
 Representación tabular o cuadros estadísticos y gráficas.
Revisión y Corrección de los Datos.- (Huber, 1984), Una regla empírica ampliamente
contrastada es esperar entre un 2 y un 5% de observaciones con errores de medición,
transcripción, etc.
Tablas de Distribución de Frecuencias.-
Definición 2.1: Se llama frecuencia absoluta del valor yi al número de veces que aparece
este valor en el conjunto de observaciones y se representa por “n i”, i = 1, 2, 3, … , m.

Valores diferencias Frecuencia Absoluta


observados yi ni
y1 n1
y2 n2
y3 n3
. .
. .
. .
ym nm
Total n
Ejemplo 2.1: Se realiza una encuesta a un conjunto de 16 familias sobre el número de
hijos. Los resultados en el orden obtenido son:
x1 = 2, x2 = 1, x3 = 3, x4 = 1, x5 = 2, x6 = 1,
x7 = 3, x8 = 0, x9 = 2, x10 = 1, x11 = 2, x12 = 3,
x13 = 4, x14 = 1, x15 = 1, x16 = 2.
Valor de la frecuencia absoluta n = 16

Valores diferencias Frecuencia Absoluta


observados yi ni
0 1
1 6
2 5
3 3
4 1
Total 16
Interpretación.-
n1 = 1, significa que en las familias encuestadas, una no tiene hijos.
n2 = 6, significa que en las familias encuestadas, seis tienen un hijo cada una.
n3 = 5, significa que en las familias encuestadas, cinco tienen a dos hijos cada una.
n4 = 3, significa que en las familias encuestadas, tres tienen a tres hijos cada una.
n5 = 1, significa que en las familias encuestadas, una tiene cuatro hijos.
Definición 2.2: Se llama Frecuencia Absoluta Acumulada “MENOR QUE”
correspondiente al valor yi, al número de observaciones menores o iguales a yi (xi <= yi).
Si denotamos esta frecuencia por “Ni”, entonces:
Ni = n 1 + n 2 + n 3 + … + n i

Valores diferencias Frecuencia Absoluta Frecuencia Absoluta


observados yi ni Acumulada Ni
y1 = 0 n1 = 1 N1 = 1
y2 = 1 n2 = 6 N2 = 7
y3 = 2 n3 = 5 N3 = 12
y4 = 3 n4 = 3 N4 = 15
y5 = 4 n5 = 1 N5 = 16
Total n = 16
N1 = n 1 N1 = 1
N2 = n 1 + n 2 N2 = 1 + 6 = 7
N3 = n 1 + n 2 + n 3 N3 = 1 + 6 + 5 = 12
N4 = n 1 + n 2 + n 3 + n 4 N4 = 1 + 6 + 5 + 3 = 15
N5 = n 1 + n 2 + n 3 + n 4 + n 5 N5 = 1 + 6 + 5 + 3 + 1 = 16
Definición 2.3: Se llama Frecuencia Absoluta Acumula “MAYOR QUE” correspondiente
al valor yi, al número de observaciones mayores o iguales a yi (xi >= yi). Si se denota esta
frecuencia por “Ni*”, entonces:
Ni* = ni + ni+1 + … + nm.

Valores Frecuencia Frecuencia Frecuencia


diferencias Absoluta Absoluta Absoluta
observados yi ni Acumulada “Menor Acumulada
Que” Ni “Mayor Que” Ni*
y1 = 0 n1 = 1 N1 = 1 N1* = 16
y2 = 1 n2 = 6 N2 = 7 N2* = 15
y3 = 2 n3 = 5 N3 = 12 N3* = 9
y4 = 3 n4 = 3 N4 = 15 N4* = 4
y5 = 4 n5 = 1 N5 = 16 N5* = 1
Total n = 16
N1* = n1 + n2 + n3 + n4 + n5 = 1 + 6 + 5 +3 + 1 = 16
N2* = n2 + n3 + n4 + n5 = 6 + 5 + 3 + 1 = 15
N3* = n3 + n4 + n5 = 5 + 3 + 1 = 9
N4* = n4 + n5 = 3 + 1 = 4
N5* = n5 = 1
Definición 2.4.- Se llama frecuencia relativa del valor yi, al cociente de la frecuencia
absoluta de yi y el número total de observaciones.
Esta frecuencia se denota por “hi”.
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒 𝑦𝑖
ℎ𝑖 =
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑛𝑖
ℎ𝑖 =
𝑛
Valores Frecuencia Frecuencia Frecuencia Frecuencia
diferencias Absoluta Absoluta Absoluta Relativa
observados ni Acumulada Acumulada hi
yi “Menor Que” Ni “Mayor Que” Ni*
y1 = 0 n1 = 1 N1 = 1 N1* = 16 h1 = 0.0625
y2 = 1 n2 = 6 N2 = 7 N2* = 15 h2 = 0.375
y3 = 2 n3 = 5 N3 = 12 N3* = 9 h3 = 0.3125
y4 = 3 n4 = 3 N4 = 15 N4* = 4 h4 = 0.1875
y5 = 4 n5 = 1 N5 = 16 N5* = 1 h5 = 0.0625
Total n = 16 h=1
𝑛1 1
ℎ1 = = = 0.0625
𝑛 16
𝑛2 6
ℎ2 = = = 0.375
𝑛 16
𝑛3 5
ℎ3 = = = 0.3125
𝑛 16
𝑛4 3
ℎ4 = = = 0.1875
𝑛 16
𝑛5 1
ℎ5 = = = 0.0625
𝑛 16
Interpretación:
h1 = 0.0625, se interpreta como la proporción de familias que no tienen hijos en la
muestra.
h2 = 0.375, se interpreta como la proporción de familias que tienen un hijo en la muestra.
h3 = 0.3125, se interpreta como la proporción de familias que tienen dos hijos en la
muestra.
h4 = 0.1875, se interpreta como la proporción de familias que tienen tres hijos en la
muestra.
h5 = 0.0625, se interpreta como la proporción de familias que tienen cuatro hijos.
Definición 2.5.- Se llama frecuencia relativa porcentual, a la frecuencia relativa h i
multiplicada por 100% (100hi%), y se representa por el porcentaje de observaciones que
corresponde al valor yi.

Valores Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


diferencias Absoluta Absoluta Absoluta Relativa Relativa
observados ni Acumulada Acumulada hi Porcentual
yi “Menor Que” “Mayor Que” 100hi%
Ni Ni*
y1 = 0 n1 = 1 N1 = 1 N1* = 16 h1 = 0.0625 6.25
y2 = 1 n2 = 6 N2 = 7 N2* = 15 h2 = 0.375 37.5
y3 = 2 n3 = 5 N3 = 12 N3* = 9 h3 = 0.3125 31.25
y4 = 3 n4 = 3 N4 = 15 N4* = 4 h4 = 0.1875 18.75
y5 = 4 n5 = 1 N5 = 16 N5* = 1 h5 = 0.0625 6.25
Total n = 16 h=1 100
Interpretación
100h1% = 6.25 %, porcentaje de familias que no tienen hijos en la muestra de tamaño
16.
100h2% = 37.5%, porcentaje de familias que tienen un hijo en la muestra.
100h3% = 31.25%, porcentaje de familias con dos hijos en la muestra.
100h4% = 18.74%, porcentaje de familias con 3 hijos en la muestra.
100h5% = 6.25%, porcentaje de familias con 4 hijos en la muestra.
Definición 2.6.- Se llama frecuencia relativa acumulada “MENOR QUE” del valor y i a la
frecuencia relativa total de las observaciones menores o iguales a y i.
Si denotamos esta frecuencia por “Hi”.
𝐻𝑖 = ℎ1 + ℎ2 + ℎ3 + ⋯ + ℎ𝑖
𝑛1 + 𝑛2 + 𝑛3 + ⋯ + 𝑛𝑖
𝐻𝑖 =
𝑛
Valores Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
diferencias Absoluta Absoluta Absoluta Relativa Relativa Relativa
observados ni Acumulada Acumulada hi Porcentual Acumulada
yi “Menor “Mayor 100hi% “Menor
Que” Ni Que” Ni* Que” Hi
y1 = 0 n1 = 1 N1 = 1 N1* = 16 h1 = 0.0625 6.25 H1 = 0.0625
y2 = 1 n2 = 6 N2 = 7 N2* = 15 h2 = 0.375 37.5 H2 = 0.4375
y3 = 2 n3 = 5 N3 = 12 N3* = 9 h3 = 0.3125 31.25 H3 = 0.75
y4 = 3 n4 = 3 N4 = 15 N4* = 4 h4 = 0.1875 18.75 H4 = 0.9375
y5 = 4 n5 = 1 N5 = 16 N5* = 1 h5 = 0.0625 6.25 H5 = 1
Total n = 16 h=1 100
H1 = h1 = 0.0625
H2 = h1 + h2 = 0.0625 + 0.375 = 0.4375
H3 = h1 + h2 + h3 = 0.0625 + 0.375 + 0.3125 = 0.75
H4 = h1 + h2 + h3 + h4 = 0.0625 + 0.375 + 0.3125 + 0.1875 = 0.9375
H5 = h1 + h2 + h3 + h4 + h5 = 0.0625 + 0.375 + 0.3125 + 0.1875 + 0.0625 = 1
Interpretación:
H1 = 0.0625, es la proporción de las familias bajo estudio que no tienen hijos.
H2 = 0.4375, es la proporción de las familias bajo estudio con a lo más 1 hijo.

H3 = 0.75, es la proporción de las familias bajo estudio con a lo más dos hijos.
H4 = 0.9375, es la proporción de las familias bajo estudio con a lo más tres hijos.
H5 = 1, es la proporción de las familias bajo estudio con a lo más cuatro hijos.
Definición 2.7.- Se llama frecuencia relativa acumulada “MAYOR QUE” del valor y i a la
frecuencia relativa total de las observaciones mayores o iguales a y i.
Si denotamos por “Hi*”.
𝐻𝑖 ∗ = ℎ𝑖 + ℎ𝑖+1 + ⋯ + ℎ𝑚
Valores Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
diferentes Absoluta Absoluta Absoluta Relativa Relativa Relativa Relativa
observados ni Acumulada Acumulada hi Porcentual Acumulada Acumulada
yi “Menor “Mayor 100hi% “Menor “Mayor Que”
Que” Ni Que” Ni* Que” Hi Hi*
y1 = 0 n1 = 1 N1 = 1 N1* = 16 h1 = 0.0625 6.25 H1 = 0.0625 H1* = 1
y2 = 1 n2 = 6 N2 = 7 N2* = 15 h2 = 0.375 37.5 H2 = 0.4375 H2* = 0.9375
y3 = 2 n3 = 5 N3 = 12 N3* = 9 h3 = 0.3125 31.25 H3 = 0.75 H3* = 0.5625
y4 = 3 n4 = 3 N4 = 15 N4* = 4 h4 = 0.1875 18.75 H4 = 0.9375 H4* = 0.25
y5 = 4 n5 = 1 N5 = 16 N5* = 1 h5 = 0.0625 6.25 H5 = 1 H5* = 0.0625
Total n = 16 h=1 100
H1* = h1 + h2 + h3 + h4 + h5 = 0.0625 + 0.375 + 0.3125 + 0.1875 + 0.0625 = 1
H2* = h2 + h3 + h4 + h5 = 0.375 + 0.3125 + 0.1875 + 0.0625 = 0.9375
H3* = h3 + h4 + h5 = 0.3125 + 0.1875 + 0.0625 = 0.5625
H4* = h4 + h5 = 0.1875 + 0.0625 = 0.25

H5* = h5 = 0.0625
Interpretación:
H1* = 1, es la proporción de familias en la muestra con por lo menos 4 hijos.
H2* = 0.9375, es la proporción de familias en la muestra con por lo menos 1 hijo.
H3* = 0.5625, es la proporción de familias en la muestra con por lo menos 2 hijos.
H4* = 0.25, es la proporción de familias en la muestra con por lo menos 3 hijos.
H5* = 0.0625, es la proporción de familias en la muestra con 4 hijos.
EJERCICIO 1: Un ingeniero agrónomo visita 25 cooperativas agrarias de naranjas en el
valle de Huaral y en cada una anotó el número de plantas atacadas por cierto hongo, de
lo cual resultaron los siguientes datos:
15 20 25 15 18 16 17 18 20 18 18 18
19 16 17 19 16 17 17 17 19 18 19 18

15
a. Diga qué tipo de datos son estos.
b. Construya una tabla de distribución de frecuencias adecuada a este conjunto de
valores.
c. ¿Cuántas cooperativas agrarias tienen a lo más 20 plantas atacadas por hongos?
d. ¿Cuántas cooperativas agrarias tienen por lo menos 17 plantas atacadas por
hongos?
e. ¿Qué proporción de cooperativas bajo estudio tienen 18 plantas atacadas por
hongos?
f. ¿Qué proporción de cooperativas tienen 18 o menos plantas atacadas por
hongos?
g. ¿Qué porcentaje de cooperativas tienen 18 o menos plantas atacadas por
hongos?

TEMA 2: TIPOS DE DATOS


Variable.- es una característica de la población que se va a investigar y que puede tomar
diferentes valores.
Variable cualitativa.- se llaman así, cuando la variable está asociada a una característica
cualitativa.

Ejemplo: profesión: Ingeniero, Medico, Biólogo, Economistas, etc.


Variables cualitativas nominales.- son aquellas que establecen la distinción de los
elementos en las categorías sin implicar orden entre ellas.
Ejemplo: Sexo: Masculinos o Femeninos
Estado civil: soltero, casado, viudo, etc.
Variables cualitativas ordinales.- son aquellas que agrupan a los objetos, individuos, en
categorías ordenadas, para establecer relaciones comparativas.
Ejemplos: Clasificar a grupo de personas por su hábito de fumar:
No fumadores
Fumadores leves
Fumadores moderados

Fumadores severos
Clasificar un grupo de individuos por su grado de instrucción:
Analfabetos
Primaria
Secundaria
Superior
Variables cuantitativas.- se llaman así, cuando la variable está asociada a una
característica cuantitativa.
Ejemplo: Ingreso de una familia, número de accidentes de tránsito, longitud, tiempo,
etc.
Variables cuantitativas discretas.- son aquellas que surgen por el procedimiento de
conteo.
Ejemplo: el número de hijos por familia, el número de estudiantes por colegio, el
número de habitantes por ciudad, etc.
Variable cuantitativa continua.- son aquellas que surgen cuando se mide alguna
característica.
Ejemplo: la estatura, el peso, ingresos, etc.
Ejercicio:
a) Tiempo de servicio de los empleados de una empresa.
Resp. Variable cuantitativa continúa.
b) Número de cheques girados diariamente en un mes.
Resp. Variable cuantitativa discreta.
c) Número de acciones comunes vendidas cada día en la Bolsa de Valores de
Bolivia.
Resp. Variable cuantitativa discreta.
d) Lugar de nacimiento de las personas que viven en Ivirgarzama.
Resp. Variable cualitativa nominal
e) Nivel de educación y religión de los cochabambinos.
Resp. Variables cualitativas Nivel de educación ordinal, religión nominal.
f) Temperatura y humedad diaria de Ivirgarzama.
Resp. Variable cuantitativa continúas.

TEMA 3: ORGANIZACIÓN Y CLASIFICACION DE LOS DATOS


Tabla de distribución de frecuencias.- para variables discretas.
Sean x1, x2, x3, … xn un conjunto de observaciones discretas y sean y 1, y2, y3, … ym el
conjunto de valores diferentes que toman los datos. (m<= n)
Definición.- se llama frecuencia absoluta del valor yi al número de veces que aparece
este valor en el conjunto de observaciones y se representa por “ni”, i = 1, 2, 3, … m.

Valores diferentes Frecuencias


observados absolutas
yi ni
y1 n1
y2 n2
y3 n3
…. …
Ym nm
Totales N
Ejemplo: Se realiza una encuesta a un conjunto de 16 familias sobre el número de hijos.
Los resultados en el orden obtenido son:
x1 = 2, x2 = 1, x3 = 3, x4 = 1, x5 = 2, x6 =1
x7 = 3, x8 = 0, x9 =2, x10 = 1, x11 = 2 x12 = 3
x13 = 4, x14 = 1, x15 = 1, x16 = 2.
a. Construya una tabla de frecuencias absolutas para estos datos.
b. Interprete casa frecuencia absoluta.

Número de hijos Frecuencias


yi absolutas
ni
0 n1 = 1
1 n2 = 6
2 n3 = 5
3 n4 = 3
4 n5 = 1
Totales n = 16
Interpretación:
n1 = 1, significa que en las familias encuestadas, una no tiene hijos.

n2 = 6, significa que en las familias encuestadas, seis tienen un hijo cada una.
Definición.- Se llama frecuencia absoluta acumulada “MENOR QUE” corresponde al
valor yi, al número de observaciones menores o iguales a y i (xi<= yi).
Si denotamos esta frecuencia por “Ni”.
𝑁𝑖 = 𝑛1 + 𝑛2 + 𝑛3 + ⋯ + 𝑛𝑖
Número de hijos Frecuencias Frecuencia
yi absolutas acumulada absoluta
ni “MENOR QUE”
Ni
0 n1 = 1 N1 = 1
1 n2 = 6 N2 = 7
2 n3 = 5 N3 = 12
3 n4 = 3 N4 = 15
4 n5 = 1 N5 = 16
Totales n = 16
N1 = n 1 = 1
N2 = n 1 + n 2 = 1 + 6 = 7
N3 = n1 + n2 + n3 = 1 + 6 + 5 = 12
N4 = n1 + n2 + n3 + n4 = 1 + 6 + 5 + 3 = 15
N5 = n1 + n2 + n3+ n4+ n5 = 1 + 6 + 5 + 3 + 1 = 16
Interpretación:
N1 = 1, significa, que en la encuesta hay 1 familia con 0 hijos.
N2 = 7, significa, que en la encuesta hay 7 familias con 1 o menos hijos.

N3 = 12, significa, que en la encuesta hay 12 familias con a lo más 2 hijos.


Definición.- Se llama frecuencia absoluta acumulada “MAYOR QUE”, correspondiente al
valor yi, al número de observaciones mayores o iguales a yi (xi>= yi).
Si se denota esta frecuencia con “Ni*”
𝑁𝑖 ∗ = 𝑛𝑖 + 𝑛𝑖+1 + ⋯ + 𝑛𝑚
Número de hijos Frecuencias Frecuencia Frecuencia
yi absolutas acumulada acumulada
ni absoluta “MENOR absoluta
QUE” “MAYOR QUE”
Ni Ni*
0 n1 = 1 N1 = 1 N1* = 16
1 n2 = 6 N2 = 7 N2* = 15
2 n3 = 5 N3 = 12 N3* = 9
3 n4 = 3 N4 = 15 N4* = 4
4 n5 = 1 N5 = 16 N5* = 1
Totales n = 16
N1* = n1 + n2 + n3 + n4 + n5 = 1 + 6 + 5 + 3 + 1 = 16
N2* = n2 + n3 + n4 + n5 = 6 + 5 + 3 + 1 = 15
N3* = n3 + n4 + n5 = 5 + 3 + 1 = 9
N4* = n4 + n5 = 3 + 1 = 4
N5* = n5 = 1
Interpretación:

N1* = 16, significa, las familias encuestadas tienen entre 0 y 4 hijos inclusive.
N2* = 15, significa, que en la encuesta, 15 familias tienen por lo menos 1 hijo.
N3* = 9, significa, que en la encuesta, 9 familias tienen por lo menos 2 hijos.
N4* = 4, significa, que en la encuesta, 4 familias tiene por lo menos 3 hijos.
N5* = 1, significa que de las familias encuestadas, solo una familia tiene 4 hijos.
Tema 4: Tabla de Distribución de Frecuencias
Definición 4.1: Se llama clases a cada uno de los grupos en que se divide el conjunto de
datos.
Xmax = max [x/i = 1, 2, 3, …, n]
Xmin = min [x/i = 1, 2, 3, … , n]
R
Xmin xmax

Definición 4.2: Amplitud del recorrido (l), es la longitud del recorrido del conjunto de
datos.
𝑙 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Definición 4.3: Amplitud de clase es la longitud del intervalo que define la clase.

𝑐𝑖 = 𝑦𝑖 ´ − 𝑦𝑖−1 ´ , 𝑖 = 1, 2, 3, … , 𝑚
𝑙
𝑐=
𝑚
Definición 4.4: La marca de clase es el punto medio del intervalo que representa a dicha
clase.
𝑦𝑖 = 1, 2, 3, … , 𝑚
𝑦𝑖−1 ´ + 𝑦𝑖 ´
𝑦𝑖 = , 𝑖 = 1, 2, 3, … , 𝑚.
2
Definición 4.5: La frecuencia absoluta (ni) de la clase i-esima, es el número de
observaciones del conjunto original que pertenecen a dicha clase.
Ejemplo: Suponga que se han registrado 50 observaciones referentes a los pesos de 50
lingotes de acero producidos por SIDERPERU, la muestra fue obtenida de la producción
semanal y las unidades están dadas en kg.
94.3 93.0 95.5 95.3 92.4 94.4 92.8 93.2 93.6 95.5
92.9 93.6 95.7 93.8 94.8 93.9 92.7 91.6 93.6 93.7
94.2 95.7 94.7 94.3 92.7 94.5 96.2 95.4 93.7 91.9

94.7 92.7 95.0 93.0 92.9 93.7 92.7 93.3 94.6 96.4
94.1 93.7 94.2 93.7 94.0 93.9 93.6 94.6 92.3 94.4
Solución:
m=5
xmin = 91.6 xmax = 96.4
𝑙 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 96.4 − 91.6 = 4.8
𝑙 4.8
𝑐= = = 0.96
𝑚 5
𝑐=1
y´0 = xmin = 91.5
y´1 = y´0 + c = 91.5 + 1 = 92.5
y´2 = y´1 + c =92.5 + 1 = 93.5
y´3 = y´2 + c = 93.5 +1 = 94.5

y´4 = y´3 + c = 94.5 +1 = 95.5


y´5 = y´4 + c = 96.5 + 1 = 96.5
hallar nuestras marcas de clases:
91.5 + 92.5
𝑦1 = = 92.0
2
92.5 + 93.5
𝑦2 = = 93.0
2
93.5 + 94.5
𝑦3 = = 94.0
2
94.5 + 95.5
𝑦4 = = 95.0
2
95.5 + 96.5
𝑦5 = = 96.0
2
Intervalo Marca de Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frec
de clase clase Absoluta Absoluta Absoluta Relativa Relativa Relativa Re
(y´i-1 , y´i) yi ni Acumulada Acumulada hi Porcentual Acumulada Acu
“Menor “Mayor 100hi% “Menor “May
Que” Ni Que” Ni* Que” Hi
91.5 – 92.5 92.0 4
92.5 – 93.5 93.0 11
93.5 – 94.5 94.0 20
94.5 – 95.5 95.0 9
95.5 – 96.5 96.0 6
Total n = 50 h=1 100

También podría gustarte