Está en la página 1de 14

UNIVERSIDAD NACIONAL SAN CRISTÓBAL DE HUAMANGA

DEPARTAMENTO DE FÍSICA Y MATEMÁTICA


Escuela Profesional de Ingeniería Agrícola

ESTADÍSTICA ................................................................................................................ 1
I. DEFINICIÓN: ..................................................................................................... 1
II. NOMENCLATURA ESTADISTICA: ........................................................... 1
III. ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS. ............................... 3
1
IV. REVISIÓN Y CORRECCIÓN DE LOS DATOS ......................................... 3
V. PRESENTACIÓN DE DATOS ...................................................................... 4

ESTADÍSTICA

I. DEFINICIÓN:
La Estadística es una ciencia que proporciona un conjunto de métodos y técnicas para
recolectar, clasificar información y luego analizarla a fin de inferir “algo” respecto de la
fuente de información.
La estadística como ciencia cumple los aspectos principales del método científico.
1. Realización de experimentos y observaciones.
2. Obtención de conclusiones o proposiciones objetivas a partir de los resultados de dichos
experimentos y observaciones.
3. Formulación de leyes que simplifiquen la descripción de un gran número de experiencias
u observaciones.

II. NOMENCLATURA ESTADISTICA:


Considerando que existe un conjunto de términos que se usarán frecuentemente en la
Estadística, es necesario precisar el significado de algunos de ellos:
✓ ESTADÍSTICAS: Se toma como sinónimo de DATOS ESTADÍSTICOS, servirá para
designar a toda colección sistemática de datos referentes a un determinado fenómeno.
✓ ESTADÍSTICO: Es la persona que se dedica al estudio de la ESTADÍSTICA, es el
profesional que analiza estadísticas, desarrolla métodos y modelos estadísticos y
contribuye a la ciencia estadística.
✓ ESTADÍGRAFO: Es cualquier función de datos empíricos que se usan con fines
descriptivos o analíticos; son medidas de resumen estadístico de un conjunto de datos.

Dr. Alex M. Pereda Medina


Por ejemplo: La media aritmética, la mediana, la varianza, el coeficiente de correlación,
etc.
✓ DATO: Es el valor o respuesta que adquiere la variable en cada unidad de análisis. Dato
es el resultado de la observación, entrevista o recopilación en general. Los datos son la
materia prima de la estadística.
✓ INFORMACIÓN: Es el resultado de los datos procesados de acuerdo a ciertos objetivos.
No hay información sin datos.
✓ INDICADORES: Son elementos característicos que describen una situación o fenómeno
permitiendo su análisis. Estos son: Índices, proporciones, estadígrafos, o medidas de 2
resumen en general.
Los indicadores no determinan la realidad, la realidad determina el valor del indicador.
La validez y confiabilidad del indicador depende de la validez de los datos utilizados y
de la lógica de su relación o construcción.
✓ MUESTRA: Es una parte o subconjunto de una población de estudio. La muestra está
constituida de elementos seleccionados de forma aleatoria, con la finalidad de investigar
las propiedades de la población.
✓ PARÁMETRO: Es un valor obtenido para describir en forma resumida las características
más importantes acerca de la población, en tanto las medidas de resumen de una muestra
se llaman estadígrafos.
✓ POBLACIÓN O UNIVERSO: Es un conjunto completo de individuos u objetos de
estudio que poseen alguna característica común observable. Población es el universo de
estudio que está integrado por la totalidad de todas las unidades de análisis.
✓ UNIDAD DE ANÁLISIS: Es el objeto o elemento indivisible que será estudiado en una
población, sobre los cuales se va a obtener datos. La unidad de análisis no es el fenómeno
investigado si no el que genera el fenómeno y proporciona datos concretos.
✓ VARIABLE: Es una característica que puede tomar diferentes valores. Las variables son
características observables susceptibles de adoptar distintos valores o ser expresados en
varias categorías. La variable adquiere un valor determinado en cada unidad de análisis.
Las variables se denotan por X, Y, Z, etc.
Las variables se clasifican en:
a. VARIABLE CUALITATIVA: Indican una cualidad de la unidad de análisis, se
clasifican a su vez en nominales y ordinales.

Variable Cualitativa Nominal: Son aquellas donde las categorías o modalidades de la


variable no siguen un orden específico.
Ejemplo:
Variable: Profesión

Dr. Alex M. Pereda Medina


Categoría: Ingeniero, Médico, Arquitecto, Profesor.

Variable Cualitativa Ordinal: Son aquellas donde las categorías o modalidades de la


variable siguen un orden o son susceptibles a una ordenación.
Ejemplo:
Variable: Calidad de semilla
Categoría: Mala, Media, Buena.

b.VARIABLE CUANTITATIVA: Indica en que cantidad se posee una determinada 3


característica, se clasifica en discretas y continúas.

Variable Cuantitativa Discreta: Surge por el procedimiento de conteo, generalmente


la variable toma valores enteros.
Ejemplo:
Variable: Números de carros de una empresa agrícola.
Variable: Número de trabajadores.

Variable Cuantitativa Continúa: La variable puede tomar cualquier valor de un


intervalo.
Ejemplo:
Variable: El peso de los lingotes de oro.
Variable: Las ventas del día.
Variable: La densidad de los diseños de aceite.

III. ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS.


Frente a un conjunto de datos, lo primero que se debe realizar es expresar y clasificar de
acuerdo a criterios convenientes, en alguna forma simple de tal manera que se observe
rápidamente todas las características posibles para obtener conclusiones útiles ya sea
directamente o por medio de cálculos posteriores. Se consideran los siguientes pasos:
✓ Revisión y corrección de los datos.
✓ Construcción de tablas de frecuencias.
✓ Representación tabular o cuadros estadísticos y graficas.

IV. REVISIÓN Y CORRECCIÓN DE LOS DATOS


En el que hacer de la estadística, la variación o el error está inmerso en los datos, por lo que
es necesario limpiarlos para procesarlos, por tanto, un análisis estadístico, por acabado y
seguro que sea, es capaz de suministrar respuestas adecuadas a un problema en estudio, si

Dr. Alex M. Pereda Medina


aquel se basa en una información incorrecta, en consecuencia, es importante revisar y corregir
los datos recolectados previamente.

V. PRESENTACIÓN DE DATOS
Si los datos son números es necesario clasificarlos en un cuadro resumen de las observaciones
originales a las que se les conoce como TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS o
SIMPLEMENTE TABLA DE FRECUENCIAS.

4
5.1. TABLA DE FRECUENCIAS DE DATOS DE VARIABLES DISCRETAS

Sean 𝑥1 , 𝑥2 , . . . , 𝑥𝑛 un conjunto de “n” observaciones discretas y sean 𝑦1 , 𝑦2 , . . . , 𝑦𝑚 el


conjunto de valores diferentes que toman los datos originales (m <= n).

DEFINICIÓN 01: Se llama FRECUENCIA ABSOLUTA del valor 𝑦𝑖 al número de veces


que aparece este valor en el conjunto de observaciones y se representa por "𝑛𝑖 " donde 𝑖 =
1,2, . . . , 𝑚

Entonces la TABLA DE FRECUENCIAS ABSOLUTAS tiene la siguiente forma:

Valores diferentes observados 𝑦𝑖 Frecuencias absolutas 𝑛𝑖


𝑦1 𝑛1
𝑦2 𝑛2
. .
. .
. .
𝑦𝑚 𝑛𝑚
Total n

EJEMPLO:
Se realiza un estudio en la Empresa Agrícola “ABC” que exporta tomate, por lo que hace un
control de plagas desde los primeros días de haber germinado el tomate hasta la cosecha, el
supervisor de campo selecciona al azar cuatro parcelas que tiene plantas de una edad de 30 días
y de estas parcelas selecciona al azar cuatro plantas para evaluar el número pulgones por planta,
se obtuvo la siguiente información:

Dr. Alex M. Pereda Medina


𝑥1 = 2 𝑥2 = 0 𝑥3 = 3 𝑥4 = 0 𝑦1 =0
𝑥5 = 2 𝑥6 = 0 𝑥7 = 3 𝑥8 = 3 𝑦2 =2
𝑥9 = 2 𝑥10 = 0 𝑥11 = 2 𝑥12 = 3 𝑦3 =3
𝑥13 = 4 𝑥14 = 0 𝑥15 = 0 𝑥16 = 2 𝑦4 =4
Con la información construya una tabla de frecuencias absolutas e interprete la frecuencia máxima
y mínima.

Nº de Pulgones Nº de Plantas 𝒏𝒊
0 6
2 5
5
3 4
4 1
Total 16

INTERPRETACIÓN:
Hay en la Institución Educativa seis Padres de familia que tienen un hijo, así como, un Padre que
tiene cuatro hijos.
DEFINICIÓN 02: Se llama FRECUENCIA ABSOLUTA ACUMULADA “MENOR QUE”
correspondiente al valor𝑦𝑖 , al número de observaciones menores o iguales a 𝑦𝑖 (𝑥𝑖 ≤ 𝑦𝑖 ). Si
denotamos esta frecuencia por “𝑁𝑖 ”, entonces: 𝑁𝑖 = 𝑛1 + 𝑛2 +. . . +𝑛𝑖
Usando la notación de sumatoria, la frecuencia absoluta acumulada se escribe:𝑁𝑖 = ∑𝑖𝑗=1 𝑛𝑗

EJERCICIO: Calcular las frecuencias absolutas acumuladas del ejemplo anterior.

DEFINICIÓN 03: Se llama FRECUENCIA ABSOLUTA ACUMULADA “MAYOR QUE”


correspondiente al valor𝑦𝑖 , al número de observaciones mayores o iguales a 𝑦𝑖 (𝑥𝑖 ≥ 𝑦𝑖 ), Si
denotamos a esta frecuencia por “𝑁𝑖∗ ”, entonces:𝑁𝑖∗ = 𝑛𝑖 + 𝑛𝑖+1 +. . . +𝑛𝑚
En notación de sumatoria, se escribe:𝑁𝑖∗ = ∑𝑚
𝑗=𝑖 𝑛𝑗

DEFINICIÓN 04: Se llama FRECUENCIA RELATIVA del valor𝑦𝑖 , al cociente de la


frecuencia absoluta de 𝑦𝑖 y el número total de observaciones.
𝑛𝑖
Esta frecuencia se denota por “ℎ𝑖 ” entonces: ℎ𝑖 =
𝑛

DEFINICIÓN 05: Se llama FRECUENCIA RELATIVA PORCENTUAL, a la frecuencia


relativa ℎ𝑖 multiplicada por 100% (100ℎ𝑖 %), y representa el porcentaje de observaciones que
corresponde al valor 𝑦𝑖
DEFINICIÔN 06: Se llama FRECUENCIA RELATIVA ACUMULADA “MENOR QUE”
del valor 𝑦𝑖 a la frecuencia relativa total de las observaciones menores o iguales a 𝑦𝑖 .
Si denotamos a esta frecuencia por “𝐻𝑖 ”, entonces:𝐻𝑖 = ℎ1 + ℎ2 +. . . +ℎ𝑖
En notación de sumatoria se tiene: 𝐻𝑖 = ∑𝑖𝑗=1 ℎ𝑗

Dr. Alex M. Pereda Medina


DEFINICIÓN 07: Se llama FRECUENCIA RELATIVA ACUMULADA “MAYOR QUE”
del valor 𝑦𝑖 a la frecuencia relativa total de las observaciones mayores o iguales a 𝑦𝑖 .
Si denotamos por “𝐻𝑖∗ ” esta frecuencia entonces:𝐻𝑖∗ = ∑𝑚
𝑗=1 ℎ𝑗 = ℎ𝑖 + ℎ𝑖+1 +. . . +ℎ𝑚

DEFINICIÓN 08: Se llama FRECUENCIA RELATIVA ACUMULADA PORCENTUAL a


la frecuencia acumulada 𝐻𝑖 ó (𝐻𝑖∗ ) multiplicado por 100%. Es decir, 100𝐻𝑖 % ó (100𝐻𝑖∗ %), y
representa el porcentaje de observaciones menores o iguales a 𝑦𝑖 (mayores o iguales a 𝑦𝑖 ).

5.1.1. PROPIEDADES DE LAS FRECUENCIAS


6
Las propiedades que a continuación se presentan son consecuencias de las definiciones
anteriores de frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa y
frecuencia relativa acumulada.

PROPIEDAD 01: Las frecuencias absolutas y frecuencias absolutas acumuladas son siempre
enteros no negativos. Es decir:

𝑛𝑖 ≥ 0, 𝑁𝑖 ≥ 0, 𝑁𝑖∗ ≥ 0 ∀𝑖 = 1,2, . . . , 𝑛
PROPIEDAD 02: La suma de todas las frecuencias absolutas es igual al número total del
conjunto de observaciones. Es decir:
𝑚

∑ 𝑛𝑖 = 𝑛1 + 𝑛2 +. . . +𝑛𝑚 = 𝑛
𝑖=1

PROPIEDAD 03: Las frecuencias relativas y las frecuencias relativas acumuladas son
siempre números fraccionarios no negativos, no mayores que uno. Es decir:
0 ≤ ℎ𝑖 ≤ 1, 0 ≤ 𝐻𝑖 ≤ 1, 0 ≤ 𝐻𝑖∗ ≤ 1 ∀𝑖 = 1,2, . . . , 𝑚

PROPIEDAD 04: La frecuencia absoluta acumulada MENOR QUE correspondiente al


valor 𝑦𝑚 coincide con el número total del conjunto de observaciones. Es decir:
𝑚

𝑁𝑚 = ∑ 𝑛𝑖 = 𝑛
𝑖=1

PROPIEDAD 05: La frecuencia absoluta acumulada MAYOR QUE correspondiente al


valor 𝑦1 coincide con el número total del conjunto de observaciones. Es decir:
𝑚

𝑁1∗ = ∑ 𝑛𝑖 = 𝑛
𝑖=1

PROPIEDAD 06: La frecuencia relativa acumulada MENOR QUE correspondiente al valor


𝑦𝑚 coincide con la unidad. Es decir:

Dr. Alex M. Pereda Medina


𝑚

𝐻𝑚 = ∑ ℎ𝑖 = 1
𝑖=1

PROPIEDAD 07: La frecuencia relativa acumulada MAYOR QUE correspondiente al valor


𝑦1 coincide con la unidad. Es decir:
𝑚

𝐻1∗ = ∑ ℎ𝑖 = 1
𝑖=1

PROPIEDAD 08: La frecuencia absoluta acumulada MENOR QUE correspondiente al


7
valor 𝑦1 es 𝑛1 . Es decir:
1

𝑁1 = ∑ 𝑛𝑖 = 𝑛1
𝑖=1

PROPIEDAD 09: La frecuencia absoluta acumulada MAYOR QUE correspondiente al


valor 𝑦𝑚 es 𝑛𝑚 . Es decir:
𝑚

𝑁𝑚 = ∑ 𝑛𝑖 = 𝑛𝑚
𝑖=𝑚

PROPIEDAD 10: La frecuencia relativa acumulada MENOR QUE correspondiente al


valor𝑦1 es ℎ1 . Es decir:
1

𝐻1 = ∑ ℎ𝑖 = ℎ1
𝑖=1

PROPIEDAD 11: La frecuencia relativa acumulada MAYOR QUE correspondiente al


valor 𝑦𝑚 es ℎ𝑚 . Es decir:
𝑚

𝐻𝑚 = ∑ ℎ𝑖 = ℎ𝑚
𝑖=𝑚

PROPIEDAD 12: Las frecuencias absolutas acumuladas cumplen las desigualdades


siguientes:

𝑛1 = 𝑁1 ≤ 𝑁2 ≤. . . ≤ 𝑁𝑚 = 𝑛
𝑦 𝑁𝑖 = 𝑁𝑖−1 + 𝑛𝑖 , ∀𝑖 = 1,2, . . . , 𝑚
𝑦 𝑁0 = 0. 𝑐𝑜𝑚𝑜 𝑛𝑖 = 𝑁𝑖 − 𝑁𝑖−1

𝑛 = 𝑁1∗ ≥ 𝑁2∗ ≥. . . ≥ 𝑁𝑚
∗ =𝑛
𝑚

𝑦 𝑁𝑖∗ = 𝑁𝑖−1

− 𝑛𝑖−1 , ∀𝑖 = 2,3, . . . , 𝑚

𝑦 𝑛𝑖−1 = 𝑁𝑖−1 − 𝑁𝑖∗

PROPIEDAD 13: Las frecuencias relativas acumuladas cumplen las desigualdades


siguientes:

Dr. Alex M. Pereda Medina


ℎ1 = 𝐻1 ≤ 𝐻2 ≤. . . ≤ 𝐻𝑚
𝑦 𝐻𝑖 = 𝐻𝑖−1 + ℎ𝑖 , ∀𝑖 = 1,2, . . . , 𝑚
𝑑𝑜𝑛𝑑𝑒 𝐻0 = 0, ℎ𝑖 = 𝐻𝑖 − 𝐻𝑖−1
1 = 𝐻1∗ ≥ 𝐻2∗ ≥. . . ≥ 𝐻𝑚
∗ =ℎ
𝑚

𝑦 𝐻𝑖∗ = 𝐻𝑖−1

− ℎ𝑖−1 , ∀𝑖 = 2,3, . . . , 𝑚

𝑑𝑜𝑛𝑑𝑒 ℎ𝑖−1 = 𝐻𝑖−1 − 𝐻𝑖∗
EJEMPLO:
Construya todas las frecuencias estudiadas para la distribución de Padres de familia según
8
número de hijos (Tabla anterior). Interprete una frecuencia de cada columna.
SOLUCIÓN:

Nº pulgones Nº de plantas 𝒏𝒊 𝑁𝑖 𝑁𝑖∗ ℎ𝑖 ℎ𝑖 % 𝐻𝑖 𝐻𝑖 % 𝐻𝑖∗


0 6 6 16 0.38 38 0.38 38 1.00
2 5 11 10 0.31 31 0.69 69 0.62
3 4 15 5 0.25 25 0.94 94 0.31
4 1 16 1 0.06 6 1.00 100 0.06
Total 16 1.00 100

INTERPRETACIÓN:
𝒏𝟑 : En el cultivo de tomate se tiene cuatro plantas que tienen tres pulgones
𝑵𝟑 : En el cultivo de tomate se tiene 15 plantas que tienen de cero a tres pulgones o tienen
como máximo tres pulgones.
𝑵∗𝟐 : Hay diez plantas de tomate que tienen por lo menos dos pulgones.
𝒉𝟐 : La proporción de plantas de tomate que tienen dos pulgones, es de 0.31.
𝒉𝟐 %: El 31% de las plantas de tomate tienen dos pulgones.
𝑯𝟐 %: El 69% de las plantas de tomate tienen como máximo dos pulgones.
𝑯∗𝟐 : La proporción de plantas de tomate que tienen por lo menos dos pulgones, es de 0.62

5.2. TABLA DE FRECUENCIAS DE DATOS DE VARIABLE CONTINUA

Sean 𝑥1 , 𝑥2 , . . . , 𝑥𝑛 un conjunto de observaciones, siendo “n” el tamaño de la muestra y donde


los datos son del tipo continuo. En este caso debido a que la magnitud de la característica
puede tomar al menos una teóricamente, una infinidad de valores, el proceso de reducción,
agrupación o condensación de los datos originales, que conducen a la construcción de tablas
de frecuencia, no es tan simple como en el caso discreto, puesto implica realizar algunos
cálculos previos a la elaboración de la tabla de frecuencias.

Dr. Alex M. Pereda Medina


DEFINICIÓN 09: AMPLITUD DEL RECORRIDO ó RANGO ( R ), es la longitud del
recorrido del conjunto de datos. Es decir:

𝑅 = 𝑥 𝑚 í 𝑛𝑚 á𝑥

Donde :
𝑥𝑚 á𝑥 : Observación de valor máximo
𝑥𝑚 í𝑛 : Observación de valor mínimo

DEFINICIÓN 10: Se llama CLASES ó INTERVALOS DE CLASE a cada uno de los 9


grupos en que se divide el conjunto de datos.
Si la variabilidad de los datos es grande, entonces se fijará un número de intervalos pequeños
de tal forma que no se pierda la representatividad de la información. Por otro lado, si no se
conoce nada algo con respecto al comportamiento de los datos se utiliza la REGLA DE
STURGES:

𝑚 = 1 + 3.332 𝑙𝑜𝑔( 𝑛)

Donde:
m: Número de Intervalos
n: Número total de observaciones

DEFINICIÓN 11: AMPLITUD DE CLASE ( C ), es la longitud del intervalo que define la


clase y se define como:

𝑅
𝐶=
𝑚

CONSTRUCCIÓN DE LOS INTERVALOS DE CLASE

Los intervalos de clase se construyen partiendo de un 𝑥𝑚𝑖𝑛 , al que se le va asignado


consecutivamente a las clases, los limites inferior y superior de clase, de la siguiente manera:

𝑙𝑖𝑚 𝑖𝑛𝑓: 𝑦0 = 𝑥 𝑙𝑖𝑚 𝑠𝑢𝑝: 𝑦1 = 𝑥𝑚 í𝑛 𝑚 í𝑛


𝑙𝑖𝑚 𝑖𝑛𝑓: 𝑦1 = 𝑥 𝑙𝑖𝑚 𝑠𝑢𝑝: 𝑦2 = 𝑥𝑚 í𝑛 𝑚 í𝑛
.
.
lim inf:𝑦m-1 =xmín + (m-1)𝑐 limsup: 𝑦𝑚 =xmín +mc=xmáx

DEFINICIÓN 12: LA MARCA DE CLASE es el punto medio del intervalo que representa
a dicha clase. Se denota por "𝑦𝑖 " 𝑖 = 1,2, . . . , 𝑚. Es decir:

Dr. Alex M. Pereda Medina


𝑦𝑖−1 + 𝑦𝑖
𝑦𝑖 =
2

DEFINICIÓN 13: La frecuencia absoluta (𝑛𝑖 ) de la clase i-ésima, es el número de


observaciones del conjunto original que pertenecen a dicha clase. Entonces, la tabla de
distribución de frecuencias tiene la siguiente forma:

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE DATOS DISCRETOS

Intervalo Marca de clase frecuencia 10


𝒚𝒊−𝟏 − 𝒚𝒊 𝒚𝒊 𝒏𝒊

𝑦0 − 𝑦1 𝑦1 𝑛1
𝑦1 − 𝑦2 𝑦2 𝑛2
. . .
. . .
. . .
. . .
. . .
𝑦𝑚−1 − 𝑦𝑚 𝑦𝑚 𝑛𝑚
Total n

EJEMPLO:
La Empresa ABC tiene en su nómina a 60 trabajadores que tienen acumulados desde el mes julio
a septiembre una cantidad de horas de trabajo pendientes de pago; los datos se presentan a
continuación:
Trabajador horas Trabajador horas Trabajador horas Trabajador horas Trabajador horas
1 74 13 64 25 94 37 63 49 69
2 70 14 60 26 90 38 61 50 70
3 78 15 68 27 98 39 65 51 74
4 72 16 62 28 92 40 60 52 68
5 76 17 66 29 96 41 66 53 70
6 110 18 84 30 79 42 75 54 104
7 108 19 80 31 75 43 80 55 100
8 118 20 88 32 81 44 76 56 107
9 108 21 82 33 80 45 80 57 102
10 112 22 86 34 80 46 75 58 106
11 80 23 65 35 63 47 75 59 79
12 85 24 60 36 80 48 101 60 100
Con los datos, realizar lo siguiente:
(a) Organizar los datos en una tabla de distribución de frecuencias.
(b) Interprete las frecuencias.

SOLUCIÓN:
(a) Pasos para organizar los datos en una tabla de distribución de frecuencias:

Dr. Alex M. Pereda Medina


1º. Identificar el valor máximo y mínimo del conjunto de datos:

𝑥𝑚í𝑛 = 60, 𝑥𝑚á𝑥 = 118

2º. Determinar el recorrido de la variable o rango “R”:

𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 = 118 − 60 = 58

3º. Determinar el número de intervalos a confeccionar “m”, aplicando la regla de Sturges: 11

𝑚 = 1 + 3.3 𝑙𝑜𝑔( 𝑛) = 1 + 3.3 𝑙𝑜𝑔( 60) = 6.87 ≈ 7

4º. Calcular la amplitud del intervalo “C”:

𝑅 58
𝐶= = = 8.29 ≈ 8
𝑚 7

5º. Elaborar los intervalos:

Se inicia el proceso de construcción de los intervalos, el primer intervalo a partir del


valor mínimo 𝑥𝑚í𝑛 = 60
[Intervalo>
60 68
68 76
76 84
84 92
92 100
100 108
108 116

OBSERVACIÓN:
A. Un criterio para resolver el problema que el ultimo intervalo contenga al valor
máximo se estila sumar una unidad al calcular el rango de la variable, es decir: 𝑅 =
𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 + 1 = 118 − 60 + 1 = 59, luego C = 59/7 = 8.43 , se redondea a 8
o por exceso a 9, si es grande el error se estima y se distribuye en las clases.

B. Estimar el error y redistribuirlo en las clases, por tanto, al confeccionar los


intervalos hay que fijarse que el valor máximo esté contenido en el último intervalo
[108 – 116>, en efecto, no contiene a 118.

Dr. Alex M. Pereda Medina


Para solucionar el inconveniente, aplicamos el criterio de calcular el exceso
asumido al aplicar el redondeo sobreestimando.

CALCULAR EL NUEVO RECORRIDO (R’): Si se efectúa el cálculo con los


resultados presentados en los pasos 3º y 4º el nuevo recorrido es:
R’ = C . m = 7 ( 8 ) = 56, Lo cual no es recomendable, puesto que observamos que
el séptimo intervalo no contiene a 118, por lo que, es conveniente redondear la
amplitud sobreestimando:
𝑅 58
𝐶= = = 8.29 ≈ 9 12
𝑚 7
El nuevo recorrido es R’ = C . m = 9 ( 8 ) = 63, lógicamente este cálculo genera un
exceso que debe calcularse y redistribuirlo en todos los intervalos
CALCULO DEL EXCESO “E”
E = R’ – R = 63 – 58 = 5
Si, el exceso es un número par, se redistribuye la mitad del exceso a los dos
extremos del recorrido original, para obtener una distribución de los datos en
forma simétrica. Es decir:
𝐸 𝐸
𝑥𝑚í𝑛 − , 𝑥𝑚á𝑥 +
2 2
Si, el exceso es número impar se presenta dos casos:
Cuando los datos están medidos considerando hasta las cifras decimales, el exceso
se distribuye en forma simétrica. Es decir:
𝐸 𝐸
𝑥𝑚í𝑛 − , 𝑥𝑚á𝑥 +
2 2
Cuando los datos son números enteros y el exceso es un número impar, nos
alejamos ligeramente de la simetría, para redistribuir el exceso de la forma
siguiente:
𝐸−1 𝐸+1
𝑥𝑚í𝑛 − [ ] , 𝑥𝑚á𝑥 + [ ]
2 2
Luego aplicando el criterio para números enteros se tiene:
𝐸−1 𝐸+1
𝑥𝑚í𝑛 − [ ] = 60 − 2 = 58, 𝑥𝑚á𝑥 + [ ] = 118 + 3 = 121
2 2

Con las observaciones hechas: Empezamos a elaborar los intervalos; donde el


primer intervalo esta dado por:
Extremo inferior + amplitud = 58 + 9 = 67
En consecuencia el primer intervalo es [ 58 - 67 > ; los demás intervalos se
confeccionan de forma similar.

Dr. Alex M. Pereda Medina


6º. Construir la tabla de distribución de frecuencias:

[Horas> 𝒏𝒊 𝑁𝑖 ℎ𝑖 ℎ𝑖 % 𝐻𝑖 𝐻𝑖 %
58 67 12 12 0,20 20 0,20 20
67 76 13 25 0,22 22 0,42 42
76 85 15 40 0,25 25 0,67 67
85 94 5 45 0,08 8 0,75 75
94 103 7 52 0,12 12 0,87 87
103 112 6 58 0,10 10 0,97 97
112 121 2 60 0,03 3 1,00 100
60 1,00 100
(b) Interpretar las frecuencias 13
𝒏𝟑 : En la Empresa ABC, hay 15 trabajadores a quienes se les debe entre 76 y 85
horas de trabajo.
𝑵𝟑 : En la Empresa ABC, hay 40 trabajadores a quienes se les debe entre 58 y 85
horas de trabajo.
𝒉𝟐 : En la Empresa ABC, la proporción de trabajadores a quienes se les debe entre
67 y 76 horas de trabajo, es de 0.22.
𝒉𝟐 % : En la Empresa ABC, al 22% de los trabajadores se les debe entre 67 y 76 horas
de trabajo.
𝑯𝟓 % : En la Empresa ABC, al 87% de los trabajadores se les debe entre 58 y 103 horas
de trabajo.
5.3. TABLA DE FRECUENCIAS DE DATOS DE VARIABLE CUALITATIVA

En el caso de datos cualitativos, la tabla de distribución de frecuencias adoptara la


siguiente forma:

Variable Frec. abs. ni Frec. relativas hi hi %

Característica A nA hA 100 h A
Característica B nB hB 100 h B
. . . .
. . . .
Característica Z nZ hZ 100 h Z

Totales n 1.00 100 %

EJEMPLO:

La Revista de AgroNegocios del Perú, efectuó una encuesta a pequeños agricultores para
conocer ¿Si están preparados para producir productos de calidad para exportar?. Se seleccionó
a un total de 419 parceleros en una muestra aleatoria simple. Los siguientes datos reflejan las
respuestas de las personas encuestadas a la pregunta.

Dr. Alex M. Pereda Medina


Respuesta Frec. abs. ni hi hi %

Si 293
No 80
No sabe resp 46

Total 419 1.00 100%

Responda lo siguiente:

i. ¿Qué proporción de personas no saben responder frente a la pregunta?.


14
ii. ¿Qué porcentaje de personas contestaron Si están preparados para producir productos
de calidad para exportar?

EJERCICIO:
Se solicito a 20 estudiantes de la UNSCH, llenar una ficha académica donde debían registrar
su auto evaluación en su formación profesional, según la siguiente escala: Muy Buena (MB),
Buena (B), Regular (R). Los datos son los siguientes:
R; MB; B; MB; MB; B; B; MB; R; MB; R; B; MB; B; R; B; MB; B; B; R.
Determinar:
(a) La variable de estudio.
(b) Elaborar una tabla de frecuencias.

Dr. Alex M. Pereda Medina

También podría gustarte