Está en la página 1de 24

Curso: Estadística y probabilidades Profesor: Mg.

Carlos Alarcón Jaimes

CONCEPTOS BASICOS – ESTADISTICA


En todas las áreas de estudio está disponible una gran cantidad de datos. La ciencia estadística se
encarga del análisis y la representación de los datos, para la toma de decisión. La estadística se
aplica a todos los campos, tales como la economía, administración, ingeniería, sociología,
comunicación, educación, medicina, etc., y es una herramienta primordial en el desarrollo de la
investigación científica.
A partir de un conjunto de datos, se realiza la descripción y resumen de los datos vía las tablas,
gráficos y resúmenes numéricos, esto es llamado, estadística descriptiva; mientras que, si los datos
son de una muestra extraída de una población, a partir de la muestra se pueden sacar conclusiones
que van hacia la población, con un grado de incertidumbre, medido con probabilidad, esto es
llamado, estadística inferencial.
Mediante la estadística se puede estudiar muchos fenómenos de la realidad, ya sea, naturales y
sociales, partiendo de los datos se crean modelos que sirven para explicar y predecir un
determinado fenómeno con cierto grado de incertidumbre.

ESTADISTICA
Es una ciencia que estudia los métodos y técnicas para la recolección, organización, análisis,
presentación e interpretación de los datos, para la toma de decisiones.
RECOLECCION - ORGANIZACION - ANALISIS - PRESENTACION - INTERPRETACION

CLASIFICACION DE LA ESTADISTICA
Según el tipo de función que realiza puede ser, Estadística DESCRIPTIVA e INFERENCIAL:
Estadística DESCRIPTIVA
Se encarga de la descripción y resumen de los datos, a través de tablas, gráficos y medidas de
resumen. El objetivo es proporcionar una imagen clara y simplificada de los datos.
Ejemplo: Se requiere presentar los resultados de un examen obtenidos por los estudiantes de la
sección del1er. año.

Estadística INFERENCIAL
Se encarga de cómo a partir de los datos de una muestra, se extrae conclusiones que van hacia la
población de la que se extrajo la muestra, con un grado de incertidumbre medida a través de la
probabilidad.
El propósito es inferir resultados, realizar predicciones y generalizaciones sobre la población.
Ejemplo: Predecir el resultado de una elección en un país en base a una encuesta (muestra).

1
APLICACIONES
- Pronostico de ventas de una empresa
- Segmentar grupos de clientes
- Explicar una variable a partir de otras
- Encontrar variables que están asociadas
- Describir el comportamiento de una variable
- Determinar la efectividad de nuevos fármacos
- Control de calidad de productos y servicios
- Estudio de la satisfacción de clientes
- Optimizar la producción

CONCEPTOS BASICOS
Población
Es el conjunto de elementos (que consiste de personas, entidades, u objetos, etc.) que presentan
alguna característica en común, y sobre los que se toma información para un determinado estudio.

Ejemplo
1.- La población formada por todos los estudiantes de la UNI.
2.- La población formada por todos los habitantes de un distrito.
3.- La población formada por todas las empresas de la ciudad de Lima.

Muestra
Es una parte o subconjunto de una población. Este subconjunto de la población debe ser
representativo, es decir, tiene que presentar las mismas características de la población.
Met. Probabilísticos: Aleatorio simple, Estratificado, sistemático, conglomerados,…
Met. No probabilísticos: Por conveniencia, por cuotas, bola de nieve, …

Unidad de Análisis
Es el elemento u objeto que será estudiado en la población, sobre la cual se va a obtener datos.

Ejemplo
1.- De la población formada por todos los estudiantes de la UNI,
la unidad de análisis será: el estudiante de la UNI.
2.- De la población formada por todos los habitantes de un distrito,
la unidad de análisis será: el habitante del distrito.

2
Parámetro
Es una medida de resumen usada para describir alguna característica de la población.
Las más usadas son:
- La media o promedio poblacional (  ).
- La varianza poblacional (  2 ).
- La proporción poblacional ( P ).
Si se tiene la población conformada por todos los estudiantes de una universidad y se analiza la edad
promedio de todos los estudiantes, ello es un ejemplo de parámetro.

Ejemplo:
Población: Los trabajadores de la ciudad de Lima.
Sea la variable X: Sueldo X1 , X 2 ,... X N

Parámetro
µ : Sueldo promedio de la población
µ= ? Presenta Inconvenientes: tiempo, costo, ..

Estadística
Es una medida de resumen usada para describir alguna característica de la muestra.
Las más usadas son:
- La media o promedio muestral ( x ).
- La varianza muestral ( s 2 ).
- La proporción muestral ( p ).
Si se considera a los estudiantes de una clase, entonces la edad promedio de los estudiantes en esa clase, es
un ejemplo de estadística.

Ejemplo: De la Población de los trabajadores de la ciudad de Lima. X1 , X 2 ,... X N

Parámetro
µ : Sueldo promedio de la población
µ= ?

Muestra: ( x1 , x2 ,..., xn ) sea por ejemplo n= 500 (trabajadores)

Estadística
x : Sueldo promedio de la muestra

x = 1400 soles

Interpretación: El sueldo promedio estimado de la población es de 1400 soles.

3
Variable
Es una característica definida en la población, que puede tomar diferentes valores, cualidades o
números (cantidades). La variable se representa por una letra mayúscula: X, Y, …
Las variables cualitativas colocan a la persona u objeto en una cualidad o categoría. Las variables
cuantitativas toman valores con unidades, como peso en gramos y tiempo en horas.
Si la variable fuera estadio civil de la persona, algunos resultados serían soltero, casado, divorciado,
etc, la variable seria cualitativa. Si la variable fuera puntaje obtenido por un estudiante al final de un
periodo, entonces la variable sería cuantitativa.
Ejemplo
Sea la población constituida por los estudiantes de la UNI.
Algunas variables estadísticas definidas en esta población son:
X: Edad: 21 años, 19 años, 23 años, ……
Y: Sexo: Femenino, Masculino
Z: Talla: 1.60 m, 1.75 m, 1.78 m, ……
W: Tipo de atención: Mala, Regular, Buena

Clasificación de las variables


Según la naturaleza de la variable se clasifican en:
VARIABLE CUALITATIVA y VARIABLE CUANTITATIVA

Tipo de variables

Cualitativas Cuantitativas

Nominal Ordinal Discretas Continuas

Sin orden Con orden Enteros Con decimales

1. VARIABLE CUALITATIVA
Es aquella que expresa una cualidad o atributo, es llamada también categórica; sus datos se
expresan mediante una palabra. La variable cualitativa puede ser nominal u ordinal.
Ejemplo
- Sexo: Masculino, Femenino.
- Estado civil: Soltero, Casado, Divorciado, …
- Nivel socioeconómico: Bajo , Medio, Alto

1.1. Variable cualitativa Nominal


Es aquella en que las categorías de la variable se nombran e identifican, pero no tienen un orden.
Ejemplo
- Sexo: Femenino, Masculino
- Color de ojos: Negros, Marrones, Celestes, …
- Profesión: Ingeniero, Periodista, Abogado, …

4
1.2. Variable cualitativa Ordinal
Es aquella en que las categorías de la variable se caracterizan por tener un orden.
Ejemplo
- Nivel socioeconómico: Bajo, medio, alto
- Grado de la enfermedad: Leve, moderado, avanzado
- Nivel de satisfacción: Muy insatisfecho, insatisfecho, indiferente, satisfecho, muy satisfecho

2. VARIABLE CUANTITATIVA
Es aquella que se expresa por un valor numérico. Los datos cuantitativos son el resultado del conteo
o medición de las características de una población. El peso, la estatura, el número de personas que
habitan en una vivienda y el número de estudiantes por salón son ejemplos de datos cuantitativos.
La variable cuantitativa puede ser discreta o continua.
Ejemplo
- Edad: 28 años, 19 años, …
- Ingreso: 1500.50 soles, 2600.40 soles, ….
- Número de hermanos: 0,1,2,3, …

2.1. Variable cuantitativa Discreta


Es aquella variable que toma valores enteros (números enteros). Los valores resultan de la
operación de conteo.
Si cuenta el número de llamadas telefónicas que recibe por cada día de la semana, puede obtener
valores como cero, uno, dos o tres, etc., la variable de estudio número de llamadas telefónicas será
discreta.
Ejemplo
- Número de hijos por familia: 0,1,2,3, …
- Número de estudiantes por salón: 20, 30, …

2.2. Variable cuantitativa Continua


Es cuando el valor de la variable se obtiene por medición. Las variables continuas pueden tomar
cualquier valor dentro de un intervalo (son números reales, número con decimales).
Ejemplo
- Peso: 68.50 kg., 72.40 kg., 63.80 kg., …
- Talla: 1.50 m, 1.70 m, …
- Nivel de hemoglobina: 12.5 hb/mg, 13.2 hb/mg

5
Ejercicios:
1.- Del siguiente enunciado indicar la población, la unidad de análisis, y la variable.
Se llevó a cabo un estudio sobre el nivel socioeconómico de los habitantes del Departamento de
Lima.
Solución:
a) Población: Los habitantes del Departamento de Lima. X1,X2,…, XN
b) Unidad de análisis: El habitante del Departamento de Lima.
c) Variable: El nivel socioeconómico.

2) En el siguiente enunciado indique la población, variable y parámetro de estudio si es que hubiera.


Se desea realizar un estudio para estimar la edad promedio de los estudiantes de las universidades
particulares del Perú.
- Población: Los estudiantes de las universidades particulares del Perú.
- Variable: Edad del estudiante
- Parámetro:
µ: Edad promedio en la población
Edad promedio de los estudiantes de las universidades particulares del Perú.
N
   Xi = ?
i 1

Obs:
Estadística: Muestra (18, 23, 17, …., 24)

x : Edad promedio en la muestra


n
x   xi = 22 años
i 1

Interpretación: El edad promedio estimado de la población es de 22 años.

6
UNFV – Facultad de Ciencias Sociales
Especialidad: Ciencias de la comunicación
Curso: Estadística y probabilidades Profesor: Mg. Carlos Alarcón J.

ANALISIS DESCRIPTIVO DE LOS DATOS


(Tabla de frecuencias – Gráficos – Medidas de resumen)

Para analizar los datos se dispone, esencialmente, de instrumentos como: tablas (o cuadros),
gráficos y medidas que resumen la información.
El objetivo es siempre el mismo, proporcionar una imagen clara y simplificada de los datos.
El tipo de variable que se analiza determina, en parte, las técnicas que se emplean. En esta lección
se distingue si la variable que se analiza es de tipo cualitativo o cuantitativo. Como ya se ha visto
anteriormente, el primer tipo de variable se define a partir de cualidades o atributos (sexo,
nacionalidad, estado civil, etc.), mientras que la segunda se define mediante valores numéricos
(edad, sueldo, etc.).
Para describir una variable cualitativa principalmente se emplean tablas y gráficos.
En la descripción de una variable cuantitativa además de emplear tablas y gráficos, es posible
obtener medidas de resumen de los datos. Dentro de las medidas de resumen se expondrán, las
medidas de tendencia central, medidas de posición, medidas de dispersión y las medidas de forma
de la curva de los datos.

TABLA (O CUADRO) DE FRECUENCIAS


Una tabla de frecuencias (o distribución de frecuencias) es una representación de un conjunto de
datos. En ella se muestra como se distribuyen los valores de la variable estadística junto a sus
respectivas frecuencias.
En esta tabla de frecuencias, como producto de la operación de conteo, se observa cuantos
elementos (frecuencia o repetición) hay en cada categoría, valor o intervalo de la variable.
Para una población o muestra, de “ n ” observaciones, la forma general de una tabla de distribución
de frecuencias es la siguiente:

Tabla.- Distribución de frecuencias


Categorías Frecuencia Frecuencia Frecuencia Frecuencia Relativa
o clases fi Relativa hi Acumulada Fi Acumulada H i
f1
C1 f1 h1  F1  f1 H1  h1
n

C2 f2 h2 
f2 F2  f1  f 2 H2  h1  h2
n
. . . . .
. . . . .
. . . . .

Cm fm hm 
fm Fm  f1  f 2  ...  f m H m  h1  h2  ...  hm
n
m m
Total n   fi h i 1
i 1 i 1

m : Número de categorías. n : Número total de datos.

1
Frecuencia (o Frecuencia Absoluta) “ f i ”
Es el número de datos observados en cada categoría, modalidad o intervalo. La suma de todas las
frecuencias es igual al total “ n ” de datos observados.
m
Se denota mediante: f i Propiedad: f1  f 2  ...  f m  f
i 1
i n

Frecuencia Relativa “ hi ”
La frecuencia relativa “ hi ” de la categoría “ C i ” es el cociente entre la frecuencia de dicha
categoría y el número total de observaciones. Indica la proporción de elementos en cada categoría,
modalidad o intervalo. La suma de todas las frecuencias relativas es igual a 1.
m


fi
Su formula es: hi  Propiedad: h1  h2  ...  hm  hi  1
n i 1

Frecuencia Acumulada “ Fi ”
Es el número de elementos Fi , que se encuentra sumando las frecuencias desde la primera
categoría hasta la categoría que se analiza.

Frecuencia Relativa Acumulada “ H i ”


También se encuentra sumando las frecuencias relativas desde la primera categoría hasta la
categoría que se analiza.

2
ANÁLISIS DESCRIPTIVO DE UNA VARIABLE CUALITATIVA
Para describir este tipo de variables no se emplean técnicas complejas.
Se emplean principalmente:
- Tabla de frecuencias
- Gráficos (de Barras, de Sectores)

Las variables cualitativas pueden ser de tipo nominal u ordinal.

TABLA DE FRECUENCIAS para Variable CUALITATIVA

La tabla de frecuencias de una variable cualitativa suele tener la presentación que se muestra en la
siguiente tabla.
Supongamos que en una muestra de “ n ” datos, se observan “ m ” categorías o modalidades
diferentes de una variable cualitativa,
C1 , C2 , . . . , Cm

Tabla.- Distribución de frecuencias de variable cualitativa


Categoría Frecuencia Frecuencia Relativa Porcentaje
fi hi (%)
f1
C1 f1 h1  .....%
n
f2 .....%
C2 f2 h2 
n
. . . .
. . . .
. . . .

Cm fm fm .....%
hm 
n

Total n 1.00 100%

3
Ejemplo:
Se realizó una encuesta para conocer la opinión del turista acerca del tipo de atención que
recibieron de un servicio, 20 turistas dieron las siguientes repuestas.

Turista Tipo de atención


1 Regular
2 Buena
3 Buena
4 Regular
5 Mala
6 Buena
7 Buena
8 Regular
9 Regular
10 Buena
11 Regular
12 Buena
13 Buena
14 Mala
15 Regular
16 Buena
17 Regular
18 Mala
19 Regular
20 Buena

Una vez recogida la información, lo usual sería presentarla de una manera similar a la siguiente
tabla.
Tabla.- Distribución del tipo de atención que recibieron los turistas
Frecuencia Frec. Relativa hi Porcentaje Fi Hi
Tipo de fi (% )
atención
f1
MALA 3 h1  =3/20 = 0.15 15% 3 0.15
n
8/20 = 0.40
REGULAR f2 = 8 40% 11 0.55
9/20= 0.45
9 45% 20 1.00
BUENA

Total ---- ----


n=20 1 100%

Interpretar:
- f 2  8 : Hay 8 turistas que recibieron un tipo de atención regular.

- h1  0.15 : El 15% de los turistas recibieron un tipo de atención mala.

Interpretación de los Resultados


Puede observarse que el tipo de atención más frecuente en la muestra es buena, presentándose en
9 de los 20 turistas (Total) o, lo que es equivalente, presentándose en el 45% de los casos.

4
GRAFICOS para Variable CUALITATIVA

Una tabla de frecuencias se puede acompañar de ayudas gráficas que facilitan la lectura de la
información. Para una variable cualitativa los gráficos que se utilizan comúnmente son:
- Gráfico de Barras
- Grafico de Sectores (o Circular)

GRAFICO DE BARRAS
Se representa mediante una serie de rectángulos separados, y consiste en colocar sobre el eje
horizontal las categorías de la variable cualitativa y levantar sobre cada una de las categorías un
rectángulo cuya altura sea igual a su frecuencia o a su frecuencia relativa.
Su objetivo es disponer de una visualización clara y rápida de la importancia de cada una de las
categorías de la variable.

Ejemplo: Del ejemplo anterior, del tipo de atención que recibieron 20 turistas, se pide realizar el
gráfico de barras de dicha variable.
Solución:

Gráfico de barras del tipo de atención

fi
10
9
8
Número
de turistas 5

0 Mala Regular Buena


Tipo de atención

Empleando el programa SPSS

5
GRAFICO DE SECTORES ( O CIRCULAR)
Se representa mediante un círculo particionado, y consiste en dividir un círculo en tantas
porciones como categorías tenga la variable cualitativa, de modo que a cada categoría le
corresponde una porción del círculo, proporcional a su frecuencia o a su frecuencia relativa.
La porción de cada categoría se calcula usando una regla de tres:
n  360º 360º f i
X iº 
fi  X iº
n

Ejemplo: Del ejemplo anterior, del tipo de atención que tuvieron 20 turistas, se pide realizar el
gráfico de sectores.
Solución:
n  360º 360º f i
Utilizando la regla de tres: X iº 
fi  X iº
n

360º f1 360º x3
Para el tipo de atención MALA: X 1º    54°
n 20
360º f 2 360º x8
Para el tipo de atención REGULAR: X 2º    144°
n 20
360º f 3 360º x9
Para el tipo de atención BUENA: X 3º    162°
n 20

Gráfico de sectores del tipo de atención

Mala

Buena

Regular

Empleando el programa SPSS

6
Ejercicio:
Se hizo un estudio sobre la preferencia de la marca de vehículo en la ciudad de Lima. A
continuación, se presentan los datos sobre las preferencias de los 50 encuestados de una muestra.

Toyota Hyundai Toyota Toyota Toyota


Toyota Toyota Chevrolet Kia Kia
Hyundai Toyota Kia Hyundai Toyota
Kia Kia Hyundai Toyota Chevrolet
Toyota Hyundai Toyota Toyota Hyundai
Kia Kia Kia Hyundai Chevrolet
Toyota Hyundai Hyundai Toyota Chevrolet
Hyundai Hyundai Chevrolet Hyundai Toyota
Chevrolet Hyundai Kia Hyundai Toyota
Toyota Hyundai Toyota Hyundai Kia

a) ¿Estos datos son cualitativos o cuantitativos?


b) Proporcione las distribuciones de frecuencia y de frecuencia relativa.
c) Construya una gráfica de barras y una gráfica de sectores.
d) De acuerdo con la muestra, ¿qué marca de vehículo tiene la mayor preferencia? ¿Cuál es el
segundo?
Solución:
a) ¿Estos datos son cualitativos o cuantitativos?
Los datos son cualitativos (nominal)

b) Proporcione las distribuciones de frecuencia y de frecuencia relativa.

Tabla.- Distribución de la preferencia de la marca de vehículo


Marca de Frecuencia Frec. Relativa hi Porcentaje
vehículo fi (% )

Chevrolet 6 0.12 12%

Hyundai 16 0.32 32%

Kia 10 0.20 20%

Toyota 18 0.36 36%

Total 50 1 100%

c) Construya una gráfica de barras y una gráfica de sectores.


FALTA (realizar)

d) De acuerdo con la muestra, ¿qué marca de vehículo tiene la mayor preferencia? ¿Cuál es el
segundo?
La marca de vehículo que tiene la mayor preferencia es Toyota.
La segunda marca de mayor preferencia es Hyundai.

7
Curso: Estadística y probabilidades Profesor: Mg. Carlos Alarcón Jaimes

ANALISIS DESCRIPTIVO DE VARIABLE CUANTITATIVA


Las variables clasificadas como cuantitativas permiten un tratamiento más amplio, que las variables
cualitativas.
Para describir una variable cuantitativa se emplean:
- Tabla de frecuencias
- Gráficos (Histograma, polígono (o curva), ojivas, etc)
- Medidas de resumen (Media, desviación estándar, etc)

Se distingue entre variables cuantitativas discretas ó continuas. Estas se analizan de manera


diferente.

Variable Cuantitativa DISCRETA


TABLA DE FRECUENCIAS de Variable Discreta
Se tiene “ n ” datos de una variable cuantitativa discreta X , denotados por:
X1 , X 2 , ... , X n
Si algunos valores se repiten y se obtienen “ m ” ( m  n) valores distintos, digamos que
X 1 , X 2 , ... , X m , con frecuencias respectivas f1 , f 2 , ... , f m , la distribución de frecuencias de
estos “ n ” datos se resume en la siguiente tabla.

Tabla.- Distribución de frecuencias de Variable Cuantitativa DISCRETA


Valores de Frecuencia Frecuencia Frecuencia Frecuencia Relativa
X fi Relativa hi Acumulada Fi Acumulada H i

f1
X1 f1 h1  F1  f1 H1  h1
n

X2 f2 h2 
f2 F2  f1  f 2 H2  h1  h2
n
. . . . .
. . . . .
. . . . .

Xm fm hm 
fm Fm  f1  f 2  ...  f m H m  h1  h2  ...  hm
n

Total n 1 --------- ---------

Observación: Cuando el número de valores distintos de una variable discreta es muy grande (por
ejemplo, más de 15), en este caso, para resumir los datos, es conveniente agruparlos por intervalos,
para ello, se utiliza el método de organización de variable continua por intervalos (ver sección
siguiente).
1
Ejemplo: Se tiene la siguiente información del número de hijos por familia de una muestra de 20
familias.
Familia Número de hijos
1 2
2 1
3 2
4 4
5 1
6 3
7 2
8 3
9 2
10 0
11 3
12 2
13 1
14 3
15 2
16 3
17 3
18 1
19 2
20 4

Una vez recogida la información, lo usual sería presentarla en una tabla de frecuencias.
Tabla.- Distribución del Número de hijos por familia
Número Frecuencia Frecuencia Frecuencia Frec. Relativa
de hijos fi Relativa hi Acumulada Fi Acumulada H i

0 1 1/20=0.05 1 0.05

1 4 h2=4/20=0.20 5 0.25

2 7 0.35 12 0.60

3 f4 = 6 0.30 F4= 18 0.90

4 2 0.10 n= 20 1.00
Total n=20 1.00 ---- ----
Interpretar:
f 4  6 : Hay 6 familias que tienen 3 hijos.
h2  0.20 : El 20% de las familias tienen 1 hijo.
F4  18 : Hay 18 familias que tienen de 0 a 3 hijos ( o a lo más 3 hijos)
H 3  0.60 : El 60% de las familias tienen 2 o menos hijos.
Interpretación de los Resultados
Se observa que la mayor cantidad o porcentaje de familias tienen 2 hijos, los cuales son 7 de las 20
familias o , lo que es equivalente, representan el 35% del total de las familias.
2
GRAFICOS para Variable Discreta
Para el gráfico de una variable DISCRETA, se utiliza en algunos casos el Gráfico de Barras o de
Bastones.

Ejemplo: Con los datos del ejemplo anterior, del número de hijos por familia de una muestra de 20
familias. Realizar un gráfico para los datos.

Solución:

Gráfico de barras del número de hijos por familia

fi
10

Número de 7
familias 6
5
4

|
2
1
0 1 2 3 4
Número de hijos

3
Variable Cuantitativa CONTINUA

TABLA DE FRECUENCIAS para Variable Continua


(o de Intervalos, o de datos Agrupados)
La tabla de frecuencias por intervalos (o clases) se usa cuando la variable estadística es continua.
También se usa cuando el número de valores distintos de una variable discreta es muy grande (por
ejemplo, más de 15 líneas).
Esta distribución de frecuencias se obtiene dividiendo el rango de variación de los datos en “ m ”
intervalos, y se calcula el número (frecuencia) de datos que contiene cada intervalo; como se
muestra en la siguiente tabla:

Tabla.- Distribución de frecuencias de Variable Cuantitativa CONTINUA

Intervalos Marca de Frecuencia Frecuencia Frecuencia Frecuencia Relativa


[Linf Lsup  Clase xi fi Relativa hi Acumulada Fi Acumulada H i

f1
[ . x1 f1 h1  F1  f1 H1  h1
> n
[ > x2 f2 h2 
f2 F2  f1  f 2 H2  h1  h2
. n
. . . . . .
. . . . .
. . . . .
.
fm
[ > xm fm hm  Fm  f1  f 2  ...  f m H m  h1  h2  ...  hm
n

Total ------- n 1
----------- -------------

Donde:
Linf : Límite inferior del intervalo.
Lsup : Límite superior del intervalo.
xi : Marca de clase.

Para construir la distribución de frecuencia de intervalos, hay varios procedimientos, se recomienda


lo siguiente:
- Elegir no más de 15 intervalos ni menos de 4, ya que muchos intervalos pueden complicar la
presentación de los datos, y pocos intervalos podrían omitir características importantes de los datos.
- Elegiremos todos los intervalos de igual amplitud, “ c ” .

Marca de Clase “ xi ”
Es el punto medio del intervalo, este valor se obtiene como la semisuma o media aritmética de los
límites de los intervalos. Se denota mediante: xi

4
Construcción de la Tabla de Frecuencias de Variable CONTINUA
Dado “ n ” valores de una variable cuantitativa X continua, uno de los métodos para construir la
distribución de frecuencias es:
1) Determinar el Rango: “ R ”
El rango de variación de los datos se define por:
R  X máx  X mín
2) Determinar el Número de intervalos: “ m ”
Casos: i) Lo especifica el investigador (elección arbitraria o subjetiva)
ii) Utilizando la regla de Sturges:
m  1  3.32log( n) ; n : Número total de datos.
3) Determinar la Amplitud del intervalo: “ c ”
La amplitud del intervalo se obtiene dividiendo el rango entre el número de intervalos.
R
c
m
4) Determinar los extremos de los intervalos
[ Xmin , Xmin + c >
[ Xmin + c , Xmin + 2c >

5
Ejemplo: Una empresa, con el fin de contratar a un grupo de obreros, aplicó una prueba a todos los
postulantes, consiste en un trabajo que debían realizar, se registraron los tiempos de ejecución en
horas para una muestra de 30 obreros, obteniéndose los siguientes resultados: Clasifique en una
tabla de distribución de frecuencias.
0,9 1,1 2,3 2,5 2,6 2,9
3,1 3,2 3,4 3,4 3,6 3,6
3,7 3,9 4,0 4,0 4,1 4,2
4,3 4,5 4,6 4,8 5,0 5,1
5,6 5,6 5,8 5,9 6,0 6,2
Solución:
Sea la variable X: Tiempo de ejecución de la prueba
Pasos: n=30
1) Rango
R= Xmáx – Xmín = 6.2 – 0.9 = 5.3
2) Número de intervalos
m=1+3.32 log(n) =1+3.32[log(30)]=1+3.32[1.48]=5.91 (aproximar al entero inmediato mayor)
m= 6
Observación: Por ejemplo, Si m= 7.32 …. m=8
3) Amplitud de clase
c=R/m= 5.3/6 = 0.883 = 0.9 (aproximación a 1 decimal ya que los datos originales tienen 1 decimal)
R’=6*0.9= 5.4
4) Límites de los intervalos
[ Xmin , Xmin + c > = [ 0.9 , 1.8 >
[ 1.8 , 2.7 >
.
Marca de clase: X1=(0.9+1.8)/2= 1.35

Tabla.- Distribución del tiempo de ejecución de la prueba


Tiempo de ejecución Xi fi hi Fi Hi
[ 0.9 1.8 > 1.35 2 2/30=0.067 2 0.067
[ 1.8 2.7 > 2.25 3 0.100 5 0.167
[ 2.7 3.6 > 3.15 5 0.167 10 0.334
[ 3.6 4.5 > 4.05 9 0.300 19 0.634
[ 4.5 5.4 > 4.95 5 0.167 24 0.801
[ 5.4 6.3 > 5.85 6 0.200 30 1
Total ---- 30 1 ----- ------
Interpretar:
f2= 3: Hay 3 obreros que registraron un tiempo de ejecución desde 1.8 a menos de 2.7 horas.
h3= 0.167 : El 16.7% de los obreros registraron un tiempo de ejecución de 2.7 a menos de 3.6 horas.
F5= 24: Hay 24 obreros que registraron un tiempo de ejecución desde 0.9 a menos de 5.4 horas..
H4= 0.634: EL 63.4% de los obreros registraron un tiempo de ejecución desde 0.9 a menos de 4.5 horas.

6
Ejercicios:
1) ¿Qué cantidad de trabajadores tuvieron tiempos de ejecución menores a 2.7 horas?
Solución:

0.9 1.8 2.7


f1=2 f2=3

Rpta: f1 + f2 = 2 + 3 = 5 obreros.

2) ¿Qué porcentaje de trabajadores tuvieron tiempos de ejecución entre 2 horas y 4.5 horas?
Solución:
---- x----

0.9 1.8 2 2.7 3.6 4.5


---- h2=0.100--- h3=0.167 h4=0.
Hallando x:
(1.8 – 2.7): 0.9 --------- 0.100
(2 - 2.7): 0.7 --------- x
0.9x  0.7*0.1
0.07
x
0.9
x  0.078
Rpta: x + h3 + h4
0.078 + 0.167 + 0.300
0.545
54.5% de trabajadores

7
GRAFICOS para Variable Continua
Una tabla de frecuencias se puede acompañar de ayudas gráficas que facilitan la lectura de la
información. Para una variable cuantitativa continua las gráficas que se utilizan comúnmente son:
- El histograma
- El polígono (o curva para los datos)

HISTOGRAMA
Es una gráfica de barras rectangulares, verticales y juntas. La base de cada barra corresponde a la
amplitud del intervalo, y la altura es proporcional a su frecuencia ( o frecuencia relativa).
Se usa cuando se tiene una variable cuantitativa continua.
Se construye:
1) Se coloca los límites de los intervalos en el eje horizontal (eje de las abscisas o eje X ).
2) Se levanta cada intervalo a una altura proporcional a la frecuencia o frecuencia relativa.

Ejemplo:
Con los datos del ejemplo anterior, de los tiempos de ejecución de una prueba de 30 obreros.
Graficar el histograma de frecuencias.
Solución:
Gráfico del Histograma del tiempo de ejecución

10
9

Número de 6
obreros 5

3
2
1

0.9 1.8 2.7 3.6 4.5 5.4 6.3


Tiempo de ejecución

Empleando el programa SPSS


Histograma de frecuencia

8
POLIGONO
Es una gráfica poligonal cerrada, que se obtiene uniendo con segmentos de recta, los puntos que
tienen como abscisa a la marca de clase y como ordenada su frecuencia respectiva. Se cierra ambos
extremos con las marcas de clase adyacentes de frecuencia cero.

Ejemplo:
Con los datos del ejemplo anterior, de los tiempos de ejecución de una prueba de 30 obreros.
Graficar el polígono de frecuencias.
Solución:

Gráfico del Polígono del tiempo de ejecución (línea roja)

10
9

Número de 6
obreros 5

3
2
1

0.9 1.8 2.7 3.6 4.5 5.4 6.3


Tiempo de ejecución

Histograma y polígono de frecuencias

9
Ejemplo: Las notas que obtuvieron 120 alumnos que llevan el curso de Matemática se encuentran
en una tabla de distribución de frecuencias con 5 intervalos de clase.
Límite inferior del segundo intervalo igual a 6. Límite superior del quinto intervalo igual a 18.
h1=0.15 , f2=30 , H4=0.95 , H3=0.70 . Reconstruir la tabla de distribución de frecuencias
Solución:
Tabla.- Distribución de las notas de los alumnos

Notas Xi fi hi Fi Hi
[ 3 6 > 4.5 18 h1=0.15 18 0.15
[6 6+c > 7.5 f2= 30 0.25 48 0.40
[ 6+c 6+2c > 10.5 36 0.30 84 H3=0.70
[6+2c 6+3c> 13.5 30 h4=0.25 114 H4= 0.95
[6+3c 18 > 16.5 6 0.05 120 1
Total ---- 120 1 ---- ----

m=5 (número de intevalos)


n= 120

Sea c: amplitud

6+4c = 18
4c= 12
c= 3

Completando, empleando propiedades, la tabla de frecuencias será:

Tabla.- Distribución de las notas de los alumnos

Notas Xi fi hi Fi Hi
[3 6> 4.5 18 h1=015 18 0.15
[6 9> 7.5 f2= 30 0.25 48 0.40
[9 12 > 10.5 36 0.30 84 H3=0.70
[12 15 > 13.5 30 h4=0.25 114 H4= 0.95
[15 18 > 16.5 6 0.05 120 1
Total ---- 120 1 ---- ----

10
Ejercicio:
En una distribución simétrica de 8 intervalos de clase se conoce la siguiente información:
8
f1  4 , F8  120 , F5  92 , F3  f 7  20 , c  6 , X
i 4
i  220 .

Observación: Distribución simétrica ( f 1  f m ; f 2  f m1 ;... ) ; para el ejercicio m  8 .


Construya la tabla de frecuencias completo.

Solución:
Tabla.- Distribución de frecuencias

Intervalo Xi fi hi Fi Hi
[ 11 17 > 14 a =4 0.033 4 0.033
[ 17 23 > 20 b =8 0.067 12 0.100
[ 23 29 > 26 d=16 0.133 28 0.233
[ 29 35 > X4= 32 e = 32 0.267 60 0.500
[ 35 41 > X5=X4+6= 38 e= 32 0.267 92 0.767
[ 41 47 > X6=X4+12=44 d=16 0.133 10808 0.900
[ 47 53 > X7=X4+18=50 b=8 0.067 116 0.967
[ 53 59 > X8=X4+24=56 a=4 0.033 120 1
Total ---- n=120 1 --- ---

De los datos:

c: Amplitud c=6

De la condición Además F3  f 7  20 con F3=4+b+d , f7=b


8

X
i 4
i  220 4+b+d-b = 20

X4+X5+X6+X7+X8= 220 d = 16
X4+ X4+6+X4+12+X4+18+X4+24 = 220
5X4 + 60 = 220
5X4= 160
X4= 32
m
Se cumple n   fi
i 1

2e+2(4+8+16)=120
2e+56=120
e = 32

11

También podría gustarte