Está en la página 1de 123

ASIGNATURA ESTADÍSTICA

DOCENTE TITULAR: MG. CARMEN BARRETO R.

AÑO 2013
CONTENIDO

Pág.
1. RECOLECCIÓN Y PRESENTACIÓN DE DATOS Y MEDIDAS ESTADÍSTICAS 1
1.1. DEFINICIÓN DE ESTADÍSTICA 1
1.2. CLASIFICACIÓN DE LA ESTADÍSTICA 1
1.3. TÉRMINOS DE ESTADÍSTICA 1
1.4. RECOLECCIÓN DE DATOS 4
1.5. DISTRIBUCIÓN DE FRECUENCIAS: DEFINICIÓN Y CLASIFICACIÓN 7
1.6. GRÁFICOS ESTADÍSTICOS 23
2.1. MEDIDAS ESTADÍSTICAS 41
2.2. MEDIDAS DE TENDENCIA CENTRAL 42

3.1. MEDIDAS DE DISPERSIÓN 56

3.2. MEDIDAS DE FORMA 74

4.1. EXPERIMENTO 86

4.2. ESPACIO MUESTRAL 86

4.3. EVENTOS 87

4.4. OPERACIONES CON EVENTOS 90


4.5. EVENTOS MUTUAMENTE EXCLUYENTES Y COLECTIVAMENTE 92
EXHAUSTIVOS
4.6. PROPIEDADES DE LAS OPERACIONES CON EVENTOS 92
4.7. PROBABILIDAD Y ENFOQUES DE PROBABILIDAD 94
4.8. REGLAS DE PROBABILIDAD 98
4.9. PROBABILIDAD CONDICIONAL 100
4.10. TABLAS DE PROBABILIDAD 112
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

CAPITULO I

RECOLECCIÓN Y PRESENTACIÓN DE DATOS

1.1. DEFINICIÓN DE ESTADÍSTICA


La estadística es una ciencia que proporciona un conjunto métodos y técnicas
que se utilizan para recolectar, organizar, presentar, analizar e interpretar el
comportamiento de los datos con respecto a una característica materia de estudio
e investigación con la finalidad de obtener conclusiones válidas y tomar
decisiones razonables de acuerdo a tales análisis.

1.2. CLASIFICACIÓN DE LA ESTADÍSTICA


La Estadística se clasifica en dos grandes áreas: Estadística Descriptiva y
Estadística Inferencial.

a) Estadística descriptiva: Parte de la estadística que analiza y describe un


conjunto de datos de una muestra o de una población sin sacar conclusiones
de tipo general. Cuadros

Análisis
Recolección Organización Presentación Descriptivo
Gráficos

b) Estadística inferencial: Parte de la Estadística que infiere o induce leyes de


comportamiento para una población a través de una muestra aleatoria
seleccionada de dicha población.

Población Muestreo Muestra


(N) (n)

Estadística Inferencial

_________________________________________ 1
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

1.3. TÉRMINOS DE ESTADÍSTICA


Considerando que existe un conjunto de términos que se usan frecuentemente en
estadística conviene precisar el significado de algunos de ellos.

1.3.1. POBLACIÓN (N)


Es el conjunto de todos los individuos objetos u observaciones que poseen alguna
característica observable común.
Ejemplo 1:
La población de estudiantes de la Escuela de Contabilidad de la Universidad Los
Ángeles de Chimbote
Una población puede clasificarse como finita o infinita.

● Población finita: Es aquella que tiene un número limitado de elementos.


Ejemplo 2:
Las edades de todos los estudiantes de la Universidad Los Ángeles de Chimbote.

● Población infinita: Es aquella que tiene un número ilimitado de elementos.


Ejemplo 3:
El número de unidades producidas en un proceso de producción continúo.

1.3.2. MUESTRA (n)


Es una parte o un subconjunto representativo de la población y al proceso de
obtener la muestra se llama muestreo. La selección y el estudio de la muestra,
tiene por objeto la extracción de conclusiones que sean válidas para la población
de la cual se obtuvo dicha muestra.
Ejemplo 4:
Estudio de una muestra aleatoria de 200 estudiantes de la Escuela de
Contabilidad de la ULADECH según su nivel socio económico

1.3.3. VARIABLES
Es una característica de la población que se va investigar y puede tomar
diferentes valores.

_________________________________________ 2
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

Las variables se clasifican en: cuantitativas y cualitativas:


Variables cuantitativas: Cuando el valor de la variable es de carácter numérico.
Las variables cuantitativas pueden ser discretas y continúas.

a.1) Variable cuantitativa discreta: Cuando el valor de la variable está


representado solo por números enteros (positivos).
Ejemplo 5:
X: número de hijos

a.2) Variable cuantitativa continua: cuando el valor de la variable puede


tomar cualquier valor dentro de un rango dado, por tanto se expresa por cualquier
número real.
Ejemplo 6:
X: Precio en soles

b) Variable cualitativa: Cuando expresan una cualidad, o atributo, tienen


carácter cualitativo, sus datos se expresan mediante una palabra, es no numérico.
La variable cualitativa puede ser: nominal u ordinal.

b.1) Variable cualitativa nominal: Son aquellas que establecen la distinción de


los elementos en las categorías sin implicar orden entre ellas.
Ejemplo 7:
X: Sexo: Masculino, Femenino.

b.2) Variable cualitativa ordinal: Son aquellas que agrupan a los objetos,
individuos, en categorías ordenadas, para establecer relaciones comparativas.
Ejemplo 8:
Y: Nivel de pobreza: No pobre, pobre, muy pobre, extremadamente pobre.

_________________________________________ 3
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

1.3.4. UNIDAD DE OBSERVACIÓN: También se le conoce como unidad


estadística o unidad de análisis. Es el elemento u objeto indivisible de la población
que será analizado y sobre los cuales se obtendrán los datos.

Ejemplo 9:
Si se quiere estudiar el rendimiento académico de los alumnos de la Universidad
Los Ángeles de Chimbote, la unidad de observación serán los alumnos.

1.3.5. OBSERVACIONES: A los datos también se le conoce como


observaciones. Son los valores recopilados como resultado de las observaciones
de una variable.

1.3.6. PARÁMETRO: Es un valor obtenido para describir en forma resumida las


características pertinentes o más importantes de una población.

Ejemplo 10:
El sueldo promedio de todos los trabajadores de la Empresa Sider Perú de
Chimbote.

1.3.7. ESTADÍGRAFO: También se le conoce como estadístico(a). Es una


medida descriptiva de una muestra. El estadígrafo sirve como estimación del
parámetro.
Ejemplo 11:
El sueldo promedio del 25% de los empleados de la Empresa Sider Perú de
Chimbote.

1.4. RECOLECCIÓN DE DATOS


La recolección o recopilación de datos es el momento en el cual el investigador se
pone en contacto con los sujetos, objetos o elementos sometidos a estudio con el
propósito de obtener los datos o respuestas de las variables consideradas; a partir
de estos datos se prepara la información estadística, se calculará las medidas de
resumen e indicadores para el análisis estadístico.

_________________________________________ 4
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

Para recoger la información se toma en cuenta las siguientes modalidades: Las


fuentes de información, los sistemas de recolección y las técnicas de recolección.

1.4.1. Modalidades de Recolección de Datos:

1.4.1.1. Fuentes de información:


Es el lugar, la institución o persona donde están los datos que se necesitan para
cada una de las variables o aspectos de la investigación. Las fuentes de
información pueden ser:

a) Fuentes primarias: Cuando los datos se obtienen directamente de la misma


persona o entidad utilizando ciertas técnicas.
Ejemplo 12:
Llevar a cabo una encuesta para conocer el grado de satisfacción laboral en los
trabajadores de una empresa “X”.
b) Fuentes secundarias: Cuando los datos ya han sido elaborados y procesados
por otras personas o instituciones.
Ejemplo 13:
La información estadística que publica el INEI de los diferentes ministerios del
Perú.

1.4.1.2. Sistemas de recolección: Son procedimientos que se utilizan para


recoger información.
Pueden ser:
a) Los registros: Son libros, padrones, etc. en donde se anotan en forma regular
permanente y obligatoria los hechos ocurridos.
Ejemplo 14:
Registros Civiles, RENIEC, Registros Públicos, Registros Electrónicos, etc.

b) Las encuestas: Son procedimientos de obtención de información estructurada


según criterios previos de sistematización que se efectúa con un propósito
específico en toda la población o en un sector de ella.

_________________________________________ 5
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

Pueden ser:
b.1) Encuesta censal: Cuando abarca toda la población en estudio.
Ejemplo 15:
Censos de población y vivienda de una localidad o país.

b.2) Encuesta muestral: Cuando abarca una parte de la población en estudio.


Ejemplo 16:
Llevar a cabo una Encuesta de preferencia electoral.

1.4.1.3. Técnicas de recoleccion


Son procedimientos que se utilizan para recolectar información según la
observación, naturaleza del trabajo de investigación.
Pueden ser: La observación, el cuestionario, la entrevista, test, etc.

a) La observación: Es la acción de mirar con rigor, en forma sistemática y


profunda, con el interés de descubrir la importancia de aquello que se observa.

b) El cuestionario: Es un instrumento constituido por un conjunto de preguntas


sistemáticamente elaboradas, que se formulan al encuestado o entrevistado, con
el propósito de obtener datos de las variables consideradas en estudio.

c) La entrevista: Es un diálogo entre personas, es una técnica donde una


persona llamada entrevistador, encuestador o empadronador solicita al
entrevistado, le proporcione algunos datos e información.

d) El test : Pruebas o exámenes con ayuda de un cuestionario o escala que mide


determinadas funciones, generalmente cognitivas.

_________________________________________ 6
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

1.5. DISTRIBUCIONES DE FRECUENCIAS: DEFINICIÓN Y CLASIFICACIÓN

Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y


categorías y determinar las frecuencias de las clases, o sea, el número de
elementos que pertenecen a una clase. El ordenamiento tabular de los datos por
clases conjuntamente con las frecuencias de clases se denomina distribución de
frecuencias.
1.5.1. DEFINICIÓN:
Es un arreglo tabular en donde se presentan a los datos de una muestra o de una
población bajo un ordenamiento convencional predeterminado de acuerdo a la
característica en estudio.

1.5.1.1. Partes de una distribución de frecuencias:

CÓDIGO

TITULO: Deber ser completo y conciso

c
o Yi fi Fi hi Hi hi% Hi% Encabezado
l
u
Y1 f1 F1 h1 H1 h1% H1%
m Y2 f2 F2 h2 H2 h2% H2%
n Y f3 F3 h3 H3 h3% H3%
a . . . . . . .
. . . . . . .
m Total n - 1.00 - 100 -
a Fuente:
t
r
i
z
Cuerpo del Cuadro

a) Código: Número de identificación.


b) Título: Expresa en forma resumida la información que contiene, se coloca en
la parte superior de la tabla.
El título de un cuadro estadístico debe ser completo y conciso.
Se refiere a completo en que debe tener los cuatro elementos fundamentales:
población, variable, lugar y tiempo.
Se refiere a conciso en que debe ser breve.

________________________________________________________ 7
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

c) Encabezado: Primera fila del cuadro, explica las categorías y el objeto de


cada una de las columnas.
d) Columna principal o matriz: Formada por la primera columna y nos indica
también las características.
e) Cuerpo: Su formación se presenta en filas y columnas.
f) Fuente: Se coloca en la parte inferior del cuadro y nos indica el lugar en
donde se obtuvieron los datos contenidos en la tabla.

1.2. Términos elementales para construir una distribución de frecuencias:

a) Clase o intervalo de clase: Son los grupos que se forman con los valores de
la variable cuando la variable es cuantitativa discreta (clase) o continua (intervalo
de clase). Cuando la variable es cualitativa nominal u ordinal toma el nombre de
categoría.

b) Frecuencia absoluta: Es el número de veces que se repite un determinado


valor de la variable; en el caso de intervalos es el número de observaciones
comprendidas en dicho intervalo. Se representa por f i con (i=1,2... m); donde “m”
representa el número de valores distintos que toma la variable Y i o el número de
intervalos considerados (mn). Asimismo, la suma de las frecuencias absolutas
simples es igual al número total de observaciones y se expresa del siguiente
modo:
m
f 1  f 2  .....  f m   f i  n
i 1

c) Frecuencia relativa: Es el cociente de la frecuencia absoluta de cada clase


entre el número total de observaciones. Esta frecuencia se denota por hi con
(i=1,2,...m). entonces:

frecuencia absoluta de cada clase f i


hi  
número total de observaciones n

La frecuencia relativa simple toma valores comprendidos entre 0 y 1, es


decir:

O  hi  1

________________________________________________________ 8
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

Asi mismo, la suma de las frecuencias relativas simples es igual 1, es decir:

m
h1  h2  ...  hm   hi  1
i 1

d) Frecuencia relativa porcentual: Es la frecuencia relativa multiplicada por 100.


Se representa por hi % y se considera como el porcentaje de observaciones
correspondientes a cada clase. La frecuencia porcentual está comprendida entre
0 y 100.

e) Frecuencia absoluta acumulada: Resulta de acumular o sumar


sucesivamente las frecuencias absolutas, se representa por Fi . Donde:
F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
.

Fm = f1 + f2 +… fm=n

f) Frecuencia relativa acumulada: Resulta de acumular o sumar sucesivamente


las frecuencias relativas se representa por H i . Donde :
H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
.

Hm = h1 + h2 + h3 +… hm = 1

La frecuencia relativa acumulada toma valores comprendidos entre 0 y 1 es


decir:
0  Hi  1

________________________________________________________ 9
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

g) Frecuencia relativa acumulada aorcentual: Es la frecuencia relativa


acumulada multiplicada por 100%. Se representa por H i % y se considera como
el porcentaje de observaciones acumuladas hasta cierta clase.

1.5.2. CLASIFICACIÓN DE DISTRIBUCION DE FRECUENCIAS:


Las distribuciones de frecuencias se construyen de acuerdo a la variable y su
clasificación está dada por: distribuciones de frecuencias en puntos aislados,
distribuciones de frecuencias en intervalos de clase y distribuciones de
frecuencias por atributos o categorías, tal como se muestra en el siguiente mapa
conceptual.

________________________________________________________ 10
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

1.5.2.1. DISTRIBUCIÓN DE FRECUENCIAS EN PUNTOS AISLADOS


Se utiliza cuando la variable es cuantitativa discreta ya que generalmente los
valores de la variable son pocos, por lo que puede considerarse cada uno de ellos
como una clase.

 La distribución de frecuencias absolutas toma la siguiente forma:


TABLA N° 1
Distribución de frecuencias absolutas
en puntos aislados
Valores de la variables Frecuencias absolutas
Yi fi
Y1 f1
Y2 f2
. .
. .
. .
Ym fm
Total n

 La distribución de frecuencias ampliada toma la siguiente forma:

TABLA N° 2
Distribución de frecuencias ampliada
Yi fi fi hi Hi hi Hi
Y1 f1 F1 h1 H1 h1% H1%
Y2 f2 F2 h2 H2 h2% H2%
Y3 f3 F3 h3 H3 h3% H3%
. . . . . . .
. . . . . . .
. . . . . . .
Ym fm Fm hm Hm hm% Hm%
Total n - 1.00 - 100 -

Ejemplo 17:
Los siguientes datos hipotéticos corresponden a una muestra aleatoria de 30
empresas de la ciudad de Lima según su número de accidentes de trabajo
durante el año 2007:
0 3 3 3 4 4 0 2 3 1
2 2 3 1 3 4 1 2 2 2
3 3 2 2 2 3 1 2 2 4

________________________________________________________ 11
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

La información fue obtenida mediante una encuesta realizada por la Empresa


Datum S.A.
Se pide:
a) Identificar la unidad de observación y la variable en estudio.
b) Construir la tabla de conteo.
c) Construir una distribución de frecuencias ampliada.
d) f3, F3, h3% y H3%.
d) Determinar cuantas empresas no han tenido accidentes de trabajo.
e) Determinar que porcentaje de empresas han tenido por lo menos 3 accidentes
de trabajo.
f) Determinar que porcentaje de empresas han tenido a lo más 2 accidentes de
trabajo.

Solución:
a) Unidad de observación: Las empresas
Variable: N° de accidentes de trabajo

b) A continuación le mostraremos como construír la tabla de conteo:


 En primer lugar se observa que el número de observaciones es de tamaño 30
(n=30).

 En segundo lugar identificamos el número de observación diferentes, m=5.


Estos valores son y1=0, y2=1, y3=2, y4=3 y y5=4. Los cuales se ubican (en ese
orden) en la primera columna de la tabla N° 3.

 Seguidamente contamos el número de empresas con 0, 1, 2, 3 y 4 accidentes


de trabajo. Esto se hace utilizando la segunda columna de la tabla N° 3
llamada “conteo”, usando el método de los palotes que consiste en colocar
una raya vertical o tarja (/) cada vez que se aparece el valor en cuestión,
destacando cada cinco unidades con el fin de facilitar el cómputo final.
Finalmente se cuenta el número de palotes, obteniéndose las frecuencias
absolutas (fi).

En este caso:
f1= 2, f2= 4, f3= 11, f4= 9, y f5= 4

________________________________________________________ 12
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

De esta manera se ha construido tabla de conteo de las 30 empresas segun


su número de accidentes de trabajo , tal como se observa en el tabla N° 3:

Tabla N° 3
Distribución de empresas según su número de accidentes de trabajo
N° de accidentes de N° de
trabajo empresas
Y CONTEO f
i i
0 II 2
1 IIII 4
2 IIII IIII I 11
3 IIII IIII 9
4 IIII 4
Total ____ 30

Asi mismo el Cuadro N° 1 muestra una distribución de frecuencias ampliada.


 Las frecuencias absolutas (f) se obtienen en el proceso de conteo, que vienen
a ser las unidades correspondientes a cada clase.

 Las frecuencias acumuladas (F) se obtienen sumando en forma acumulativa


las frecuencias absolutas. Así:
F1 = f1 = 2
F2 = f1 + f2 = 2 + 4 = 6
F3 = f1 + f2 + f3 = 2 + 4 + 11 = 17
F4 = f1 + f2 + f3 + f4 = 2 + 4 + 11 + 9 = 26
F5 = f1 + f2 + f3 + f4 + f5 = 2 + 4 + 11+ 9 + 4 = 30

 Las frecuencias relativas se obtienen dividiendo las frecuencias absolutas


entre el tamaño de la muestra.

________________________________________________________ 13
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

f1 2 f2 4
h1 = = = 0.07 h2 = = = 0.13
n 30 n 30

f 3 11 f4 9
h3 = = = 0.37 h4 = = = 0.30
n 30 n 30

f5 4
h5 = = = 0.13
n 30

La suma de las frecuencias relativas es igual a 1:


5

åh
i =1
i = h1 + h 2 + h 3 + h 4 + h 5

åh
i =1
i = 0.07 + 0.13 + 0.37 + 0.30 + 0.13 = 1.00

 Las frecuencias relativas acumuladas se obtienen sumando en forma


acumulativa las frecuencias relativas. Así:
H1 = h1 = 0.07
H 2 = h1 + h 2 = 0.07 + 0.13 = 0.20
H 3 = h1 + h 2 + h 3 = 0.07 + 0.13 + 0.37 = 0.57
H 4 = h1 + h 2 + h 3 + h 4 = 0.07 + 0.13 + 0.37 + 0.30 = 0.87
H 5 = h1 + h 2 + h 3 + h 4 + h 5 = 0.07 + 0.13 + 0.37 + 0.30 + 0.13 = 1.00
 Las frecuencias relativas porcentuales se obtienen multiplicando por 100 las
frecuencias relativas. Así:
h1 % = h1 ´100 = 0.07 ´100 = 7
h 2 % = h 2 ´100 = 0.13 ´100 = 13
h 3 % = h 3 ´100 = 0.37 ´100 = 37
h 4 % = h 4 ´100 = 0.30 ´ 100 = 30
h 5 % = h 5 ´100 = 0.13 ´100 = 13
 Las frecuencias relativas porcentuales acumuladas se obtienen por 100 las
frecuencias relativas acumuladas. Así:

________________________________________________________ 14
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

H1 % = H1 ´100 = 0.07 ´100 = 7


H 2 % = H 2 ´100 = 0.20 ´ 100 = 20
H 3 % = H 3 ´100 = 0.57 ´ 100 = 57
H 4 % = H 4 ´100 = 0.87 ´ 100 = 87
H 5 % = H 5 ´100 = 1.00 ´100 = 100

c)
CUADRO N° 1
Distribución de empresas según su número de accidentes de trabajo
Lima : Año - 2007
N° de accid. N° de Frec. Frec. Frec. Frec. Frec.
de trabajo empresas acumulada relativa relativa porcentual porcentual
Y acumulada acumulada
i
fi Fi hi Hi hi % Hi %
0 2 2 0.07 0.07 7 7
1 4 6 0.13 0.20 13 20
2 11 17 0.37 0.57 37 57
3 9 26 0.30 0.87 30 87
4 4 30 0.13 1.00 13 100
Total 30 - 1.00 - 100 -
Fuente: Encuesta realizada por la Empresa Datum S.A.

b) Interpretación:
f3 : 11 empresas han tenido 2 accidentes de trabajo.
F3 : 17 empresas han tenido 2 accidentes de trabajo o menos.
h3% : El 37 % de las empresas han tenido 2 accidentes de trabajo.
H3% : El 57% de las empresas han tenido 2 accidentes de trabajo o menos.

________________________________________________________ 15
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

1.5.2.2. DISTRIBUCIÓN DE FRECUENCIAS EN INTERVALOS DE CLASE

Se utiliza generalmente cuando la variable es cuantitativa continua, aquí los


valores de las variables son números por lo que no puede considerarse cada uno
de ellos como una clase, lo cual es necesario agruparlos en intervalo de clase.
Se siguen los siguientes pasos para su construcción:

a) Determinar el rango (R): Se obtiene restando el valor máximo y el mínimo.


Así
R = Valor Máximo – Valor Mínimo

b) Determinar el número de intervalos (m): El criterio a seguir para


determinar el número de intervalos generalmente del mismo tamaño es que el
mismo sea suficientemente pequeño para lograr la simplificación deseada, pero lo
suficientemente grande para minimizar los posibles errores de clasificación.
Naturalmente, no es conveniente utilizar muchos intervalos de pequeña amplitud
ya que en un caso extremo, equivaldría a trabajar con los datos originales. Por
otra parte, un número muy reducido de intervalos, significa cierta concentración y
la pérdida de información consiguientemente, como ocurriría en otro caso, si se
considerase un solo intervalo. Se recomienda:

b.1) considerar el número de intervalos entre 5 y 20.


5  m  20

b.2) Utilizar la regla de Sturges para determinar el número de intervalos:


m = 1 + 3.33 log n
Donde: n es el número de observaciones.

a) Determinar la amplitud interválica (C): También se le conoce como ancho


del intervalo y se obtiene dividiendo el rango entre el número de intervalos.
C= R.
m

b) Determinar los límites de clase, de manera que cada observación se


clasifique sin ambigüedades en una sola clase.

________________________________________________________ 16
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

LI(i) – LS(i)
[y´0 - y´1 )
[y´1 - y´2 )
:
:
[y´m-1 - y´m)

c) Determinar las marcas de clases, la marca de clase o punto medio de cada


intervalo se halla mediante la semisuma del límite inferior y del límite superior.
Así:
LI  LS(i )
Yi  (i )
2

Los cuales presentamos a continuación:

Intervalos Marca de clase


LI(i) – LS(i) Yi
[y´0 - y´1 ) Y1
[y´1 - y´2 ) Y2
: :
: :
[y´m-1 - y´m) Ym

d) Finalmente se halla frecuencia absoluta de cada clase. Así:

TABLA N° 4
Distribución de frecuencias absolutas
en intervalos de clase
Intervalos Marca de clase Frecuencia absoluta
simple
LI (i )  LS (i ) yi
fi
[y´0 - y´1 ) y1 f1
[y´1 - y´2 ) y2 f2
. : :
: : :
[y´m-1 - y´m) ym fm
Total - n

________________________________________________________ 17
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

Ejemplo 18:
Los siguientes datos corresponden a una muestra aleatoria de 20 jubilados de la
AFP Integra de la ciudad de Chimbote según su monto de pensión mensual en
soles correspondiente al mes de Enero del 2007:

500 650 650 800 700 730 760 790 520 870
600 670 1000 850 720 750 780 840 400 860

La información fue obtenida de los Registros de Atención al Usuario de la AFP


Integra.

a) Determinar la unidad de observación y la variable en estudio.


b) Construir la tabla de conteo. Utilice la regla de Sturges.
c) Construir una distribución de frecuencias ampliadas.
d) Interpretar f2, F2, h2% y H2%.
e) Determinar cuantos jubilados han tenido un monto de pensión de 640 soles o
más pero menos de 880 soles.
f) Determinar que porcentaje de jubilados han tenido un monto de pensión
mensual comprendido entre 760 y 1000 soles.

Solución:
a) Unidad de observación: Los jubilados.
Variable en estudio: monto de pensión en soles.

b) Siguiendo los pasos establecidos:

 Hallando el Rango (R):


R = Valor Máximo – Valor Mínimo
R = 1000 – 400 = 600

 Hallando el Número de Intervalos (m):


m = 1 + 3.33 log n
n = 20 log 20 = 1.30
m = 1 + 3.33 x 1.30 = 5.33
m = 5 intervalos

________________________________________________________ 18
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

 Hallando la Amplitud Interválica (C):


C = R = 600 = 120
m 5

 Determinando los límites de clases y sus respectivas marcas de clase.

Monto de pensión en soles Marca de clase


LI (i )  LS (i ) Yi
[400 – 520) 460
[520 – 640) 580
[640 – 760) 700
[760 – 880) 820
[880 – 1000] 940

c) Determinando la distribución de frecuencias absolutas:

Tabla N° 5
Distribución de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007
Monto de pensión en soles Marca de N° de jubilados
LI  LS
(i ) (i )
Clase Conteo f i
yi
[400 – 520) 460 II 2
[520 – 640) 580 II 2
[640 – 760) 700 IIII II 7
[760 – 880) 820 IIII III 8
[880 – 1000] 940 I 1

Total - 20

d) A continuación le mostramos la distribución de frecuencias ampliada para las


diferentes frecuencias dadas:

________________________________________________________ 19
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

CUADRO N° 2
Distribución de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007
Monto de pensión en Marca de N° de jub.
soles clase f i
LI (i )  LS (i ) yi FI hi Hi hi % Hi %
[400
– 520) 460 2 2 0.10 0.10 10 10
[520
– 640) 580 2 4 0.10 0.20 10 20
[640
– 760) 700 7 11 0.35 0.55 35 55
[760
– 880) 820 8 19 0.40 0.95 40 95
[880
– 1000] 940 1 20 0.05 1.00 5 5
Total - 20 - 1.00 - 100 -
Fuente: Registros de Atención al Usuario.

e) Interpretando:
f2 : 2 jubilados han tenido un monto de pensión de 520 soles o más pero
menos de 640 soles..
F2 : 4 jubilados han tenido un monto de pensión de 400 soles o m;as pero
menos de 640 soles.
h2% : El 10% de los jubilados han tenido un monto de pensión de 520 soles
o más pero menos 640 soles.
H2% : El 20% de los jubilados han tenido un monto de pensión de 400 soles
o más pero menos de 640 soles.
f) Sumanos las frecuencias absolutas simples de los intervalos 3 y 4 obteniendo:
( 7 + 8 ) =15 trabajadores.
g) Sumamos las frecuencias porcentuales simples de los intervalos 4 y 5
obteniendo : (40% +5%) = 45%

1.5.2.3. DISTRIBUCIÓN DE FRECUENCIAS POR ATRIBUTOS O


CATEGORÍAS

Este tipo de distribución se utiliza para clasificar los datos de una variable
cualitativa nominal u ordinal.

________________________________________________________ 20
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

TABLA N° 6
Distribución de frecuencias para variables cualitativas
Frecuencia Frecuencia Frecuencia relativa
Variable absoluta relativa porcentual
Xi fi hi hi %
x1 f1 h1 h1%
x2 f2 h2 h2%
. . . .
, . . .
, . . .
xm fm hm hm%
Total n 1.00 100%

Ejemplo 19:
Los siguientes datos obtenidos mediante una encuesta realizada por la Empresa
AMC en el mes de Febrero del 2007 corresponden a una muestra aleatoria de 40
empresas de la ciudad de Chimbote según motivo del uso de Internet:

P O F F F P F RP P F
O P F F F O P RP P P
P P P RP O P P F O RP
RP P F RP P P P F P F

Donde:
P: “PUBLICIDAD” F: “FACTURACION”
RP: “RECEPCION DE PAGOS” O: “OTROS”

Se pide:
a) Identificar la unidad de observación y la variable en estudio.
b) Construir una distribución de frecuencias (absolutas y porcentuales).
c) Interpretar f2 y h2%.

Solución:
a) Como resultado de la clasificación y tabulación se tiene:

________________________________________________________ 21
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
______________________________________________________________________________________________

CUADRO N° 3
Distribución de empresas según su motivo de uso de Internet
Cabina Alfa Net - Chimbote
Mayo - 2005
Motivo de uso de
Internet N° de empresas Frecuencia relativa Frecuencia relativa
X f h porcentual
i i i
hi %
Publicidad 17 0.425 42.50
Facturación 12 0.300 30.00
Recepción de Pagos 6 0.150 15.00
Otros 5 0.125 12.50
TOTAL 40 1.000 100.00
FUENTE: Encuesta realizada por la Empresa AMC

b) Interpretando:
f2 : 12 empresas manifiestan que el motivo de uso de Internet es por
facturación.
h2% : El 30% de las empresas manifiestan que el motivo de uso de Internet
es por facturación.

________________________________________________________ 22
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
_________________________________________________________________________________________

1.6. GRÁFICOS ESTADÍSTICOS

1.6.1. DEFINICIÓN: Un gráfico es la representación de un fenómeno estadístico


por medio de figuras geométricas (puntos, líneas, rectángulos, paralelepípedos,
etc.) cuyas dimensiones son proporcionales a la magnitud de los datos
representados. Su objetivo principal es la representación de los datos en forma
gráfica, que permita a simple vista darse cuenta del conjunto de elementos
presentados y de evidenciar sus variaciones y características. El gráfico es un
auxiliar del cuadro estadístico no lo sustituye, sino lo complementa.

1.6.1.1. Partes de un gráfico: Al igual que un cuadro estadístico en el gráfico


se consideran las siguientes partes:

CÓDIGO

TÍTULO
(FRECUENCIA)

CUERPO

VARIABLE
FUENTE

1.6.1.2. Escalas usadas en el trazado de un gráfico: La mayoría de los


gráficos se representan en las llamadas “Sistema de Coordenadas Cartesianas”
donde hay dos ejes, X (Eje horizontal) e Y (eje vertical). En el eje X se colocan las
diferentes clases de la variable y en el eje Y se colocan las frecuencias (absolutas
o porcentuales). La escala de medida que se usan deben ser de la misma longitud
o algo mayor la horizontal que la vertical. En general, las 2 escalas deben guardar
una proporción 1 a 1 y 1 a 2, es decir, que si el eje vertical mide 10cm. el eje

_______________________________________________ 23
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
_________________________________________________________________________________________

horizontal debe medir entre 10 y 20. Esta exigencia se hace con el fin de no
distorsionar el fenómeno que se estudia.

1.6.2. CLASIFICACIÓN DE GRÁFICOS


Entre los gráficos más usuales tenemos: gráfico de bastones, histograma de
frecuencias, polígono de frecuencias, gráfico de barras simples, gráfico de
sectores circulares y gráfico Lineal, tal como se muestra en el siguiente mapa
conceptual.

_______________________________________________ 24
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
_________________________________________________________________________________________

1.6.2.1. GRÁFICOS DE BASTONES


También se le conoce como diagrama de frecuencias, se utiliza generalmente
para describir datos cuando la variable es cuantitativa discreta y su construcción
se hace levantando segmentos perpendiculares al eje de la variable y con una
altura proporcional a su frecuencia absoluta o relativa porcentual.

Ejemplo 20:
Los Gráficos N° 1 y N° 2 muestra el gráfico de bastones para frecuencias
absolutas y relativas porcentuales del Cuadro N° 1 de la pag. 15:

GRÁFICO N° 1
Empresas según s u número de accidentes de trabajo
Lima : 2007

12

9
Nº de empresas

Nº de accidentes
de trabajo
0 1 2 3 4
Fuente: Encuesta realizada por la Empresa
Datum S.A.

Comentario: En el Grafico N° 1 observamos que el menor número de empresas


(2) no han tenido accidentes de trabajo y el mayor (11) ha tenido 9 accidentes de
trabajo.

_______________________________________________ 25
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
_________________________________________________________________________________________

GRÁFICO N° 2
Porcentaje de empresas según s u número de accidentes de trabajo
Lima : 2007

40

30
Porcentaje

20

10

Nº de accidentes
de trabajo
0 1 2 3 4
Fuente: Encuesta realizada por la Empresa
Datum S.A.

Comentario: En el Grafico N° 2 observamos que el menor porcentaje de


empresas (7%) no han tenido accidente de trabajo y el mayor porcentaje de
empresas (37%) han tenido 2 accidentes de trabajo.

1.6.2.2. HISTOGRAMA DE FRECUENCIAS


Este gráfico se utiliza para describir datos cuando la variable es cuantitativa
continua. Su construcción se hace levantando sobre el eje de la variable
rectangular que tengan por base la amplitud del intervalo de clase y una altura
proporcional a su frecuencia absoluta o relativa porcentual.

Ejemplo 21: Los Gráficos N° 3 y N° 4 muestran el histograma de frecuencias para


frecuencias absolutas y relativas porcentuales del Cuadro N° 2 de la pag. 19.

_______________________________________________ 26
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
_________________________________________________________________________________________

GRÁFICO N° 3

Número de jubilados según su monto de pensión en soles


AFP INTEGRA - Chimbote: Enero - 2007

6
Nº de jubilados

Monto de pensión en
soles

0 400 520 640 760 880 1000

Fuente: Registros de Atención al Usuario.

Comentario: En el Grafico N° 3 observamos que el menor número de jubilados


(1) han tenido un monto de pensión que varia entre 880 soles y 1000 soles y el
mayor número de jubilados (8) han tenido un monto de pensión en soles de 760
soles o más pero menos de 880 soles.

_______________________________________________ 27
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
_________________________________________________________________________________________

GRÁFICO N° 4
Porcentaje de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007

40

30
Porcentaje

20

10

Monto de pensión en
soles
0 400 520 640 760 880
1000
Fuente: Registros de Atención al Usuario.

Comentario: En el Grafico N° 4 observamos que el menor porcentaje de jubilados


(5%) han tenido un monto de pensión que varia entre 880 soles y 1000 soles y el
mayor porcentaje de jubilados (40%) han tenido un monto de pensión en soles de
760 soles o más pero menos de 880 soles.

_______________________________________________ 28
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
_________________________________________________________________________________________

1.6.2.3. POLÍGONO DE FRECUENCIAS


Este se utiliza también para describir datos cuando la variable es cuantitativa
continua. Su construcción se hace uniendo los puntos medios superiores de los
rectángulos en el histograma.

Ejemplo 22:
Los Gráficos N° 5 y N° 6 muestran el polígono de frecuencias para frecuencias
absolutas y frecuencias relativas porcentuales del Cuadro N° 2 de la pág. 19.

GRÁFICO N° 5
Número de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007

8
Nº de jubilados

Monto de pensión
en soles

0 340 460 580 700 820 940 1060


Fuente: Registros de Atención al Usuario.

En el Grafico N° 5 observamos que el menor número de jubilados (2) han tenido


un monto de pensión de 940 soles y el mayor número de hogares (8) han tenido
un consumo mensual de 820 soles.

_______________________________________________ 29
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
_________________________________________________________________________________________

GRÁFICO N° 6

Porcentaje de jubilados según su monto de pensión en soles


AFP INTEGRA - Chimbote: Enero - 2007

40

30
Porcentaje

20

10

Monto de pensión
en soles

0 340 460 580 700 820 940 1060

Fuente: Encuesta realizada por la Empresa Data S.A.

En el Grafico N° 6 observamos que el menor porcentaje de jubilados (5%) han


tenido un monto de pensión de 940 soles y el mayor porcentaje de jubilados
(40%) han tenido un monto de pensión de 820 soles.

_______________________________________________ 30
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

1.6.2.3. GRÁFICO DE BARRAS SIMPLES

Este gráfico se utiliza para describir datos cuando la variable es cualitativa nominal
u ordinal presentados en cuadro de entrada simple. Su construcción se hace
levantando barras proporcionales a la frecuencia absoluta o relativa porcentual de
la cualidad que representan.

 Recomendaciones para su construcción:


- Todas las barras deben tener el mismo grosor.
- El espacio entre barras debe ser de la misma magnitud y constituye la mitad
del ancho de la barra.
- El ancho de la barra debe ser el doble del espacio que se deja entre barra y
barra.
- La escala de frecuencia debe empezar por cero.
- Las barras por estética deben ordenarse de mayor a menor cuando se pueda.
- No se debe recargar las barras tratando de expresar muchos productos en
cada uno de ellas.
- Si el gráfico tiene muchas barras es mejor expresarlo con un gráfico lineal.

Ejemplo 24:
Los Gráficos N° 7 y N° 8 muestran el gráfico de barras simples para frecuencias
absolutas y frecuencias relativas porcentuales del Cuadro N° 3 de la pag. 21.

_______________________________________________ 31
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

GRAFICO N° 7
Empresas según su motivo de uso de Internet
Cabina Alfa Net: Chimbote - Mayo 2005
20
17

15
N° de Em pres as

12

10

6
5
5

0 FUENTE: Encuesta realizada por la Empresa Consultora OMEGANET.


Publicidad Facturación Recepción de Otros
Pagos

Motivo de Uso de Internet


Fuente: Encuesta realizada por la Empresa Data S.A.

Comentario: En el Grafico N° 7 observamos que el menor número de empresas


(5) manifiestan que usan internet por otros motivos y el mayor número de
empresas (17) manifestan que el motivo de uso de internet es por publicidad.

_______________________________________________ 32
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

GRAFICO N° 8
Porcentaje de empresas según su motivo de uso de Internet
Cabina Alfa Net : Chimbote - Mayo 2005
45 %
42.5

36
30
%
Porcentaje

27

18 15
% 12.5
%
9

0
Publicidad Facturación Recepción de Otros
Pagos

Motivo de Uso de Internet


Fuente: Encuesta realizada por la Empresa Data S.A.

%
Comentario: En el Grafico N° 8 observamos que el menor porcentaje de
empresas (12.5%) manifiestan que usan internet por otros motivos y el mayor
porcentaje de empresas (42.5%) manifestan que el motivo de uso de internet es
por publicidad.

1.6.2.4. GRÁFICO DE SECTORES CIRCULARES O PASTEL


Al igual que el gráfico de barras este gráfico se utiliza generalmente para
representar variables cualitativas (nominal u ordinal). Se usa frecuentemente
cuando se desea comparar cada categoría de la variable con respecto al total.
Para su elaboración se utiliza una circunferencia, siendo necesario que los valores
absolutos y/o porcentuales sean traducidos en grados. A cada categoría le
corresponde un sector de la circunferencia.

Hallando los ángulos para cada sector:

_______________________________________________ 33
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

Tipos de Caso Angulos(oi)


17
Publicidad a o1 = ´ 360° = 153°
40

12
Facturación ao 2 = ´ 360° = 108°
40

6
Recepcción de Pagos ao3 = ´ 360° = 54°
40

5
Otros ao4 = ´ 360° = 45°
40

Total 360°

Se puede comprobar que la suma de los cuatro sectores da 360°.

Ejemplo 25:
Los Gráficos N° 9 y N° 10 muestran el gráfico de barras simples para frecuencias
absolutas y frecuencias relativas porcentuales del Cuadro N° 3 de la pag. 21.

GRAFICO N° 9
Empresas según su motivo de uso de Internet
Cabina Alfa Net : Chimbote - Mayo 2005

Otros 5

Publicidad 17 Recepción de Pagos 6

Facturación 12

Fuente: Encuesta realizada por la Empresa Data S.A.

_______________________________________________ 34
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

Comentario: En el Grafico N° 9 observamos que el menor número de empresas


(5) manifiestan que usan internet por otros motivos y el mayor número de
empresas (17) manifestan que el motivo de uso de internet es por publicidad.

GRAFICO N° 10
Porcentaje de empresas según su motivo de uso de Internet
Cabina Alfa Net : Chimbote - Mayo 2005

%
Otros 12.5

% %
Recepción de Pagos 15
Publicidad 42.5

%
Facturación 30

Fuente: Encuesta realizada por la Empresa Data S.A.

Comentario: En el Grafico N° 10 observamos que el menor porcentaje de


empresas (12.5%) manifiestan que usan internet por otros motivos y el mayor
porcentaje de empresas (42.5%) manifestan que el motivo de uso de internet es
por publicidad.

1.6.2.5. GRÁFICO LINEAL


Estos gráficos se utilizan para representar series cronológicas o sea distribuciones
que se desarrollan a través del tiempo. Se representan en los ejes de
coordenadas cartesianas mediante líneas rectas o quebradas. En el eje horizontal
se ubica el tiempo (años, meses, días, etc.) y en el eje vertical el valor de los
datos. Puede incluir más de un hecho o situación.

_______________________________________________ 35
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

Ejemplo 26:
El Gráfico N° 11 le muestra el gráfico de líneas utilizando los datos del Cuadro N°
4.

CUADRO N° 4
Numero de usuarios mensuales de la Cabina Alfa Net
Chimbote: Año - 2005
Años EN FE M A M J J A S O N D
N° de usuarios 150 210 350 400 600 450 800 650 700 350 200 500
Fuente: Encuesta realizada por la Empresa Consultora OMEGANET.

GRAFICO N° 11
Numero de usuarios de la Cabina Alfa Net
Chimbote: Año - 2005
800 800
700
650
600 600
N° de usuarios

500
450
400 400
350 350

200 210 200


150

0
E F M A M J J A S O N D

MESES

Fuente: Encuesta realizada por la Empresa Consultora OMEGANET.

Comentario: En el Grafico N° 11 observamos que el número de usuarios de la


Cabina Alfanet presentan un crecimiento ascendente en los meses de enero a
mayo, de junio a julio el número de usuarios que llegan a dicha cabina presentan
un comportamiento irregular.

_______________________________________________ 36
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

AUTOEVALUACIÓN 01

1. Los siguientes datos corresponden a una muestra aleatoria de 30 unidades operativas


de la ULADECH CATÓLICA según su número de supervisiones realizadas en el año
2012:
2 2 3 3 2 4 1 2 2 3
3 3 3 4 5 3 2 4 1 5
4 4 3 4 5 3 2 3 3 4

La información fue proporciona por la Oficina de Gerencia de Calidad ULADECH


CATÓLICA
Se pide:
a) Identificar la unidad de observación y la variable en estudio.
b) Construir una tabla de distribución de frecuencias absolutas. (Tabla de Conteo)
c) Construir una de distribución de frecuencias ampliada.
d) Interpretar f4, F4, h4% y H4%.
e) Determinar cuántos trabajadores han tenido más de 3 supervisiones.
f) Determinar qué porcentaje de trabajadores han tenido a lo más 3 supervisiones.

2. Los siguientes datos corresponden a una muestra aleatoria de 20 trabajadores de la


Empresa “Sol y Sombra” de la ciudad de Chimbote según monto de CTS en soles Julio
del 2012:

200 400 410 350 420 550 480 380 470 700
250 450 500 590 600 330 650 460 580 430

Los datos fueron obtenidos de la Oficina de Personal de dicha entidad.

Se pide:
a) Identificar la unidad de observación y la variable en estudio.
b) Construir una distribución de frecuencias ampliada. Utilice m=5 de intervalos.
c) Interpretar f2, F2, h2% y H2%.
d) Determinar que porcentaje de trabajadores tienen un monto de CTS de 200 soles o
más pero menos de 500 soles. (1punto)

3. Los siguientes datos corresponden a una muestra aleatoria de 40 administradores de


hoteles de la ciudad de Chimbote según opinión acerca del problema que afecta la
actividad turística en Marzo del 2012:

F S S I O I I I F I
I F I I I I O O F I
O O O I I S S I I I
I I I I S S S I I I
Donde:

_______________________________________________ 37
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

F: Falta de promoción I: Insuficiente Infraestructura S: Inseguridad


O : Otros

Los datos fueron obtenidos mediante una encuesta realizada por la Empresa Apoyo S.A.
a) Identificar la unidad de observación y la variable en estudio.
b) Construir una distribución de frecuencias absolutas y porcentuales.
c) Interpretar f2 y h2%.
d) Construir un gráfico adecuado para frecuencias porcentuales.

4. Dado del siguiente cuadro:

CUADRO N° 1
POBLACIÓN ECONOMICAMENTE ACTIVA OCUPADA
DE 14 A 29 AÑOS POR SEXO
PERU: AÑO 2005 - 2008

AÑO 2005 2006 2007 2008

HOMBRE 2440 2582 2700 2800


S
MUJERE 3000 2500 2300 2200
S
Fuente: Encuesta de hogares. INEI

Construir un gráfico lineal y comentar. (3 puntos)

5. Identificar cada una de las siguientes variables según su clasificación:

• N° de caidas del sistema ………………………………………


• Marcas de impresoras ………………………………………
• Velocidad en mg. ……………………………..............
• Nivel socio económico ...……………………………………

6. Identifique la unidad de observación y la variable de estudio en el siguiente


enunciado:

Población de usuarios de Internet según modalidad speedy de su preferencia:

Unidad de observación:………………………………………………………………
Variable:………………………………………………………………

7. Determine si es una Población “N” o muestra “n” en las siguientes afirmaciones:

a) Estudio del nivel socio – económico de todos los estudiantes de la ULADECH. ( )


b) Estudio del 5% de trabajadores de una empresa “X” según su sexo. ( )

_______________________________________________ 38
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
__________________________________________________________________________________________

c) Distribución del 30% de clientes del Banco de Crédito de una población de 1000
según sus ahorros mensuales en soles. ( )
d) Encuesta a 100 trabajadores de la Empresa TASA S.A según su sueldo en soles. ( )

8. De dos ejemplos de población relacionados a su campo porfesional.

9. De 4 ejemplos de variables según su clasificación

a) Variable Cuantitativa discreta: ............................................................

b) Variable cuantitiativa continua: ............................................................

c) Variable cualitativa nominal: ...........................................................

d) Variable cualitativa ordinal: ...........................................................

10. Identifique el tipo de fuente de información en las siguientes proposiciones:


a) La información estadística que tiene el registro de contribuyentes de la SUNAT.

……………………………………………………………….

b) El número de arribos extranjeros registrados por el Ministerio de Comercio y Turismo.


……………………………………………………………….

11. De 1 ejemplos relacionados de fuente de información primaria y secundaria


respectivamente.

......................................................................................................................

......................................................................................................................

12. De 1 ejemplo de encuesta muestral realizadas en su campo profesional.

......................................................................................................................

_______________________________________________ 39
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

CAPITULO II

MEDIDAS DE TENDENCIA CENTRAL

2.1. MEDIDAS ESTADISTICAS

2.1.1. DEFINICION:

Las medidas estadísticas son medidas de resumen que se calculan a partir de una
muestra y que describen ciertos aspectos de una serie o distribución de datos para
poder tener un mejor conocimiento de la población.

2.1.2. CLASIFICACIÓN:
A continuación presentamos un mapa conceptual de la clasificación de las medidas
estadísticas más usadas.

_________________________________________ 41
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

2.2. MEDIDAS DE TENDENCIA CENTRAL

2.2.1. DEFINICIÓN
Son estadígrafos que se ubican en la parte central de un conjunto de datos o de una
distribución.
Los estadígrafos de tendencia central más importantes y más usuales son: la media
aritmética, mediana y moda.

2.2.2. LA MEDIA ARITMÉTICA: También se le conoce como media o promedio. Se


obtiene sumando todos los valores de los datos observados y se divide entre el
número total de ellos.

Media Aritmética = Suma de los valores de la variable


Número total de datos

Se denota por: x o M[x

2.2.2.1. Formas de cálculo de la media aritmética:


a) Para datos no agrupados: La media aritmética para datos no agrupados está
dado por la siguiente fórmula:
n

x i
x i 1

n
Ejemplo 26:
Los siguientes datos corresponden a los sueldos mensuales en soles de 10 familias:

Xi : 650, 750, 850, 1000, 750, 820, 850, 1200, 1000, 1000

Calcular la media aritmética e interpretar.

Solución:

Sustituyendo los datos en la fórmula se tiene:

_________________________________________ 42
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

10

åx i
x1 + x 2 + ... + x10 650 + 750 + 850 + 1000 + 750 + 820 + 850 + 1200 + 1000 + 1000
x= i =1
= =
10 10 10

x = 887 soles mensuales.


Interpretación: Los trabajadores tienen un sueldo mensual promedio de 887 soles.

b) Para datos agrupados: La media aritmética para datos agrupados está dada por
la siguiente fórmula:
m

y  f i i
y i 1

n
Donde " yi " es la clase o marca de clase de cada grupo o intervalo.
La media aritmética se obtiene sumando el producto de las clases o marcas de clase
por la frecuencia correspondiente y dividiendo la suma entre el número total de
datos.

b.1.) Media aritmética cuando la variable es cuantitativa discreta.


A continuación presentamos un ejemplo para calcular la media aritmética cuando la
variable es cuantitativa discreta.

Ejemplo 27: Los siguientes datos de la Tabla N° 07 corresponde a una muestra


aleatoria de 100 cabinas de Internet según su número de cibernautas que acudieron
el mes anterior:
Tabla N° 07
N° de cibernautas N° de cabinas
yi fi
40 10
45 20
50 40
55 15
60 10
65 5
Total 100

Calcular la media aritmética e interpretar.

_________________________________________ 43
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución:
En la siguiente tabla de trabajo le mostraremos como calcular la media aritmética
cuando la variable es discreta, debemos multiplicar los valores de cada clase con
sus respectivas frecuencias finalmente se suma esos resultados y se divide entre el
número de observaciones, tal como se muestra en la siguiente Tabla N° 8:

Tabla N° 08
N° de cibernautas N° de cabinas
yi f i 44 yi  f i
40 10 400
45 20 900
50 40 2000
55 15 825
60 10 600
65 5 325
TOTAL 100 5050

Luego:
6

y i  fi
40  10  45  20  50  40  55  15  60  10  65  5 5050
y i 1
 
100 100 100

y  50.5  51 cibernautas

Interpretación: A las cabinas de Internet acuden en promedio 51 cibernautas


durante el mes anterior.

b.2.) Media aritmética cuando la variable es cuantitativa continua:


A continuación le mostraremos cono calcular la media aritmética cuando la variable
es cuantitativa continua:

Ejemplo 28:
La siguientes datos de la Tabla N° 09 corresponde a una muestra aleatoria de 300
trabajadores según su edad en años:

_________________________________________ 44
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Tabla N° 09
Edad en N° de
en años trabajadores
LI - LS fi
[25 - 30) 40
[30 - 35) 60
[35 - 40) 100
[40 - 45) 92
[45 - 50) 8
TOTAL 300
Se pide:
Calcular la media aritmética e interpretar

Solución:

Para calcular la media aritmética para datos agrupados cuando la variable es


continua debemos hallar la marca de clase o punto medio de cada intervalo y luego
ese valor hallado multiplicarlo por su respectiva frecuencia, finalmente debemos
sumar los resultados hallados y dividir entre el número total de observaciones, tal
como se muestra en la siguiente tabla N° 10:
TABLA N° 10

N° de
Edad en años Marca de Clase
trabaj.
LI (i )  LS(i ) yi yi  f i
fi
i
1 [25 - 30) 27.5 40 1100
2 [30 - 35) 32.5 60 1950
3 [35 - 40) 37.5 100 3750
4 [40 - 45) 42.5 92 3910
5 [45 - 50) 47.5 8 380
Total - 300 11090

Luego:
6

åy ´f i i
27.5 ´ 40 + 32.5 ´ 60 + 37.5 ´100 + 42.5 ´ 92 + 47.5 ´ 8
y= i =1
=
1300 300

11090
y= = 36.97 años.
300

Interpretación: Los trabajadores tienen en promedio 36.97 años.

_________________________________________ 45
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

2.2.2.2. Características:
• Es la más conocida y más usada en el análisis estadístico.
• Para su cálculo intervienen todas las observaciones.
• Es una medida única, es decir un conjunto de datos tiene una sola media.
• Es sensible a los valores extremos demasiados altos o demasiados bajos.
• No se puede calcular cuando presenta clases abiertas en los extremos.

2.2.3. LA MEDIANA: Es una medida de tendencia central que divide al total de n


observaciones debidamente ordenadas o tabuladas en dos partes de igual tamaño,
cada una con el 50% de los datos observados.

Notación: Me.

2.2.3.1. Formas de cálculo


a) Para datos no agrupados: Para calcular la mediana, los n datos originales se
ordenan en forma ascendente o descendente, luego se halla el lugar en donde se
encuentra la mediana (lugar = (n + 1)/2) y finalmente se determina su valor. Se
presenta dos casos:

a.1.) Para un número par de datos: La mediana será el promedio de los dos
valores centrales..

Ejemplo 29:
Calcular e interpretar la mediana del Ejemplo 26 de la pag. 38.:
Xi : 650, 750, 850, 1000, 750, 820, 850, 1200, 1000, 1000

Solución:
 Ordenando en forma ascendente
650 750 750 820 850 850 1000 1000 1000 12000

Lugar 5.5

 Ubicando el lugar en donde se encuentra la Me


n + 1 10 + 1
Lugar = = = 5.5
2 2

_________________________________________ 46
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

 Cuando se tiene un número par de datos la mediana será el valor será el


promedio de los dos valores centrales:
850 + 850
Me =
2

Me = 850 soles.

 Interpretación: El 50% de los trabajadores tienen un ingreso máximo de 850


soles , no más del 50% supera dicho ingreso.

a.2.) Para un número impar de datos: La mediana será el valor que está
ocupando la posición central.

Ejemplo 30:
Los siguientes datos corresponden a los tiempos de acceso en minutos a 11
Páginas Web cargadas por la tarde en el horario de 14 a 15 horas desde un
ordenador domestico:

Xi: 2.9, 1.4, 1.2, 3.4, 1.3, 2.5, 1.6, 1.8, 2.3, 1.5, 1.0

Solución:
 Ordenando los datos en forma ascendente
1.0 1.2 1.3 1.4 1.5 1.6 1.8 2.3 2.5 2.9 3.4

Lugar 6

 Hallando el lugar en donde se encuentra la mediana:

n + 1 11 + 1
Lugar = = =6
2 2

 Cuando se tiene un número impar de datos la mediana será el valor que está
ocupando la posición central.

_________________________________________ 47
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

● Interpretación: El 50% de las páginas Web son cargadas en un tiempo de acceso


máximo de 1.6 minutos., el otro 50% supera dicho tiempo.

b) Para datos agrupados


b.1) La mediana cuando la variable es cuantitativa discreta: Cuando la variable
es cuantitativa discreta y los datos se encuentra agrupados la mediana será el valor
de la variable cuya frecuencia acumulada sea la primera en exceder a n/2, así:

Me = Xi tal que: Fi  n/2


“i” determina clase
en donde se encuentra la Me.
Ejemplo 31:
Calcular e interpretar la mediana de los datos de la tabla N° 07 de la página 39.

Tabla N° 11
N° de cabinas N° de cibernautas
i yi fi Fi
1 40 10 10
2 45 20 30
50 40 70
3
55 15 85
4 60 10 95
5 65 5 100
6 Total 100 -

Aquí vemos que n = 100, luego n/2 = 50


n
Entonces la primera frecuencia acumulada que excede a = 50 es 70, esto es:
2

70  50

F3  10

“i = 3”, la mediana se encuentra


en la 3ra. clase.

Me = 50 cibernautas
Interpretación: Al 50% de las cabinas acuden como máximo 50 cibernautas durante
el mes anterior, el otro 50% de las cabinas supera dicho número.

_________________________________________ 48
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

b.2.) La mediana cuando la variable es cuantitativa continua: Para calcular la


mediana cuando la variable es cuantitativa continua se utilizará la siguiente fórmula:

Me  LI (i )  Ci 
n / 2  Fi 1 
fi
Se debe cumplir la siguiente relación:

n
Fi 1   Fi
2
“i” determina el intervalo en
donde se encuentra la Me.
Cuando:
n
Fi 1 
2

La mediana está dado por:


Me = LI (i )

Además:
LI (i )
: Límite inferior del intervalo en donde se encuentra la Me.
Ci : Amplitud o ancho del intervalo en donde se encuentra la Me.
n : Número de observaciones de la muestra.
Fi 1 : Frecuencia acumulada inmediata anterior al intervalo en donde se
encuentra la Me.
fi : Frecuencia absoluta del intervalo en donde se encuentra la Me

_________________________________________ 49
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Ejemplo 32:
Calcular e interpretar la mediana de los datos de la Tabla N° 09 de la página 41:

Solución:
Tabla N° 12
Edad en N° de
en años trabajadores
Fi
i LI - LS fi
1 [25 - 30) 40 40
2 [30 - 35) 60 100
3 [35 - 40) 100 200
4 [40 - 45) 92 292
5 [45 - 50) 8 300
TOTAL 300 -

n
Vemos que n = 300 = 150
2

y de acuerdo a la relación dada tenemos:

100  150  200


F2  150  F3
“i = 3”, la mediana se
encuentra en el 3er. intervalo.

Reemplazando el subíndice i=3 en la fórmula y los valores correspondientes


tenemos:

Me = LI(3) + C3 ´
[ n / 2 - F2 ]
f3

Me = 35 + 5 ´
[150 - 100]
100

Me = 37.5 años.

Interpretación: El 50% de los trabajadores tienen una edad máxima de 37.5 años,
el otro 50% supera dicha edad.

_________________________________________ 50
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

2.2.3.2. Características:
 La mediana es un estadígrafo que no está afectada por valores extremos muy
altos o muy bajos y por lo tanto es más representativa que la media
aritmética, o cuando las distribuciones son poco simétricas.
 Es útil cuando los datos agrupados tienen clases abiertas en los extremos.
 Es una medida única; esto es, una distribución tiene solamente una mediana.

2.2.4. LA MODA: Es una medida de tendencia central que corresponde al valor de


la variable que tiene frecuencia máxima.

Notación: Md.

Una distribución puede ser amodal sino tiene ninguna moda, unimodal si tiene una
moda, bimodal si tiene dos modas y multimodal si tiene tres o más modas.
En consecuencia es necesario considerar modas absolutas y modas relativas.

2.2.4.1. Formas de cálculo


a) Para datos no agrupados
La moda será el valor que se repite el mayor número de veces.

Ejemplo 33:
Calcular e interpretar la moda del Ejemplo 26 de la pag. 38.

Solución:
Observamos que el valor que se repite frecuentemente es 850 y 1000.
Entonces: Md = 850 y 1000 soles.

Interpretación: El mayor número de trabajadores tiene un sueldo mensual de 850 y


1000 soles.

Ejemplo 34:
Calcular e interpretar la moda del coeficiente intelectual expresado en puntaje del
siguiente grupo de alumnos.
Xi: 95, 100, 105, 110, 95, 100, 110, 110, 95

_________________________________________ 51
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución:
Md = 95 y 110

Interpretación:
El mayor número de alumnos tiene un coeficiente intelectual de 95 y 110 puntos. En
este caso la serie es bimodal.

b) Para datos agrupados


b.1.) La moda cuando la variable es cuantitativa discreta
La moda será clase cuya frecuencia es máxima. Así:

Md = yi Tal que: fi-1  fi  fi + 1


“i” determina la clase en
donde se encuentra la Moda
Ejemplo 35:
Calcular e interpretar la moda de los datos de la tabla N° 07 de la pag. 39.
Solución:
Tabla N° 13
N° de N° de cabinas
cibernautas fi
i yi
1 40 10
2 45 20
3 50 40
4 55 15
5 60 10
6 65 5
Total 100

Observamos que la mayor frecuencia es 40 y se cumple que:


20 40  15
f2  f3  f4

“i” = 3 la moda se encuentra en la 3ra. clase.


Por lo tanto:
Md = 50 cibernautas

_________________________________________ 52
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Interpretación: Al mayor número de cabinas acudieron 50 cibernautas durante el


mes anterior.

b.2.) La moda cuando la variable es cuantitativa continua: Para calcular la moda


cuando la variable es continua se utilizará la siguiente fórmula:
d1
Md = LI(i) + Ci ´
d1 + d 2

Se debe cumplir la siguiente relación:


f i -1 < fi > f i +1
' i ” determina el intervalo en donde
se encuentra la Moda.
Además:
d1 = fi – fi-1
d2 = fi – fi+1

Ejemplo 36:
Calcular e interpretar la moda de los datos dados en la tabla N°09 de la página 41.

Solución:
Tabla N° 14
Edad en
N° de trabajadores
en años
i fi
LI - LS
1 [25 - 30) 40
2 [30 - 35) 60
3 [35 - 40) 100
4 [40 - 45) 92
5
[45 - 50) 8
TOTAL 300

Observamos en la tabla N° 14 que la mayor frecuencia es 100 y se cumple que:


60  100  92
f2  f3  f4
i=3, la Md. se encuentra en el 3er.
intervalo.
d1= f3 – f2 = 100 – 60 = 40
d2= f3 – f4 = 100 – 92 = 8

_________________________________________ 53
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Reemplazando el subíndice i=3 en la fórmula y los valores correspondientes


tenemos:
d1
Md = LI(3) + C3 ´
d1 + d 2

æ 40 ö
Md = 35 + 5 ´ ç ÷
è 48 ø

Md = 39.17 años.

Interpretación: El mayor número de trabajadores tiene 39.17 años.

2.2.4.2. Características:
• No se encuentra afectada por valores extremos.
• Puede usarse cuando los datos presentan clases abiertas en los extremos.
• No es significativa a menos que la distribución contenga un gran número de
datos y exista significativa repetición de alguno de ellos.
• Muchas veces la serie no tiene moda porque ningún valor se repite.
• Cuando la serie tiene dos, tres, o más modas, se hace difícil su interpretación y
comparación.
AUTOEVALUACIÓN 02

1. Para lanzar un nuevo producto al mercado, una empresa estudia el tiempo publicidad, en
segundos, empleados en los medios audiovisuales por otra empresa que produce un
producto similar, los datos se muestran en la siguiente tabla:

Tiempo de publicidad en N° de anuncios


segundos fi Se pide calcular e interpretar:
LI - LS
a) La media.
[00 - 20) 10 b) La mediana.
c) La moda
[20 - 25) 30

[25 - 30) 50

[30 - 35) 40
[35 - 40) 20
Total 150

_________________________________________ 54
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

2. La siguiente tabla corresponde a una muestra aleatoria de 30 pequeñas empresas de la


ciudad de Chimbote según el número de empleados:

N° de empleados N° de empresas
Yi fi
2 3
3 7
4 10
5 7
6 3
TOTAL 30
Calcular e interpretar:

a) La moda b) La mediana. c) La media aritmética

3. Los siguientes datos corresponden al importe de las facturas en dólares por gastos
consumo en un hotel 3 estrellas de la ciudad de Chimbote de 11 turistas:

Xi: 500, 700, 600, 910, 510, 700, 700, 700, 650, 700, 800

a) Calcular el importe de las facturas por gastos de consumo del mayor número de turistas.
b) Calcular el importe promedio de las facturas por consumo de los turistas.
c) Calcular el importe de las facturas por gastos de consumo de la mitad de turistas.

4. Los siguientes datos corresponden a 11 clientes del de la Caja Municipal del Santa
según sus préstamos en dólares:
Xi: 4000, 3200, 4500, 3100, 4200, 3500, 4100, 4900, 5100, 3000, 3450

Que medida de tendencia central se ajusta al conjunto de datos dato. ¿Cuál es su valor?

_________________________________________ 55
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

CAPITULO III

MEDIDAS DE DISPERSIÓN Y MEDIDAS DE FORMA

3.1. MEDIDAS DE DISPERSIÓN


3.1.1. DEFINICIÓN
Las medidas de dispersión son aquellas que cuantifican el grado de concentración o
de dispersión de los valores de la variable en torno de un valor central, generalmente
la media aritmética. Las medidas de dispersión se utilizan para dos propósitos
básicos:
a) Para verificar la confiabilidad de los promedios y
b) Para que sirva como base para el control de la variación misma.
Las medidas de dispersión que se utilizan con mayor frecuencia son:
 Varianza.
 Desviación estándar.
 Coeficiente de variación.

3.1.2. LA VARIANZA
Es una medida que cuantifica el grado de dispersión o de variación de los valores de
una variable cuantitativa con respecto a su media aritmética. Si los valores tienden a
concentrarse alrededor de su media, la varianza será pequeña. Si los valores tienen
a distribuirse lejos de la media, la varianza será grande.
La varianza calculada a partir de una muestra se denota por s 2 y referida a la
población se denota por  2 o V [x.
La varianza se define como la media aritmética de los cuadrados de las desviaciones
de los datos respecto a su media aritmética. La varianza es una medida de
dispersión con unidades de medición al cuadrado: S/. 2, $2, km2, etc. La varianza
siempre es positiva.

a) La varianza para datos no agrupados:


Se utiliza la siguiente fórmula:
 Para n  30

_________________________________________ 56
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

 (x i  x) 2
s2  i 1

 Para n  30 [varianza de Cochran]


n

 (x i  x) 2
s2  i 1

n 1

Ejemplo 36:
Los siguientes datos corresponden a una muestra al azar de 8 clientes según su
tiempo en minutos que han visitado la página de Internet Google:

Xi : 2.3, 4.5, 4.2, 3.2, 4.4, 2.1, 1.6, 4.3

Calcular e interpretar la varianza:

Solución:
a) Para hallar la varianza primero debemos hallar el tiempo promedio de visita de los
clientes:
8

x
i 1
i
26.6
x   3.3 min utos
8 8

A continuación construiremos una tabla de trabajo para calcular la varianza:


Tabla N° 15
i xi (x i  x) (x i  x) 2
1 2.3 -1.0 1.00
2 4.5 1.2 1.44
3 4.2 0.9 0.81
4 3.2 -0.1 0.01
5 4.4 1.1 1.21
6 2.1 -1.2 1.44
7 1.6 -1.7 2.89
8 4.3 1.0 1.00
Total 26.6 - 9.80

_________________________________________ 57
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Donde:
8

 (x
i 1
i  x ) 2  9.80

Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=8 <


30.
8

å (x i - x) 2
9.80
s2 = i =1
= = 1.4 min utos 2
8 -1 7

Interpretación: La variabilidad de los tiempos de visita de los clientes a la pagina


Web Google respecto de su valor central es de 1.4 minutos 2 .

b) La varianza para datos agrupados:


Se utiliza la siguiente formula:
m

å (y i - y) 2 ´ f i
s2 = i =1
; para n > 30
n

å (y i - y) 2 ´ f i
s2 = i =1
; para n £ 30 (Varianza de Cochran)
n -1

Ejemplo 37 :
Los siguientes datos de la tabla que se da a continuación corresponden a 240
trabajadores de una Empresa “X” según su número de inasistencias:
Tabla N° 16
N° de N° de trabajadores
inasistencias
yi fi
3 10
5 30
7 100
9 80
11 20
Total 240

Calcular e interpretar la varianza.

_________________________________________ 58
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución:
a) Hallando en primer lugar el número promedio de inasistencias:
5

å y ´f i i
1820
y= i =1
= = 7.58 inasistencias
240 240

b) A continuación construiremos una tabla de trabajo para calcular la


varianza:
Tabla N° 17

yi fi
(y i - y) (yi - y) 2 (yi - y) 2 ´ f i
3 10 -4.58 20.98 209.8
5 30 - 2.58 6.66 199.8
7 100 - 0.58 0.34 34.0
9 80 1.42 2.02 161.6
11 20 3.42 11.70 234.0
Total 240 - - 839.2
Donde:
5 2

å (yi - y) ´ fi = 839.2
i =1

Reemplazando dicho valor en la formula de la varianza para n=240 > 30.


5

å (y i - y) 2 ´ f i
(y1 - y) 2 ´ f1 + (y 2 - y) 2 ´ f 2 + (y3 - y)3 ´ f 3 + (y 4 - y) 4 ´ f 4 + (y5 - y) 5 ´ f 5
s2 = i=1
=
240 240
5

å (y i - y) 2 ´ f i
20.98 ´10 + 6.66 ´ 30 + 0.34 ´ 100 + 2.02 ´ 80 + 11.70 ´ 20
s2 = i=1
=
240 240
5

å (y i - y) 2 ´ f i
209.8 + 199.8 + 34 + 161.6 + 234
s =
2 i=1
=
240 240
5

å (y i - y) 2 ´ f i
839.2
s2 = i=1
=
240 240
5

å (y i - y) 2 ´ f i
s2 = i=1
= 3.5 @ 4 inasistencias 2 .
240

_________________________________________ 59
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Interpetración: La variabilidad de las inasistenicas es de 4 inasistencias 2 respecto


de su valor central.

Ejemplo 38:
La siguiente tabla corresponde a 280 trabajadores de una Empresa “X” según su edad en
años:
Tabla N° 18
Edad en N° de trabajadores
en años fi
LI - LS
[25 - 30) 40
[30 - 35) 50
[35 - 40) 100
[40 - 45) 50
[45 - 50) 40
TOTAL 280

Calcular e interpretar la varianza.

Solución:
Hallando en primer lugar el promedio:
5

å y ´f i i
10500
y= i =1
= = 37.5 años
280 280

A continuación construiremos una tabla de trabajo para calcular la varianza:


Tabla N° 19

Li - Ls y fi
(yi - y) (yi - y) 2 (yi - y)2 ´ f i
[25 - 30) 27.5 40 -10 100 4000
[30 - 35) 32.5 50 -5 25 1250
[35 - 40) 37.5 100 0 0 0
[40 - 45) 42.5 50 5 25 1250
[45 - 50) 47.5 40 10 100 4000
Total - 280 - - 10500

Donde:

5 2

å (y
i =1
i - y) ´ f i = 10500

_________________________________________ 60
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Reemplazando dicho valor en la formula de la varianza para n=240 > 30.


5

å (y - y)
i
2
´ fi
(y1 - y) 2 ´ f1 + (y 2 - y) 2 ´ f 2 + (y3 - y) 3 ´ f 3 + (y 4 - y) 4 ´ f 4 + (y 5 - y) 5 ´ f 5
s =
2 i =1
=
280 280
5

å (y - y)
i
2
´ fi
100 ´ 40 + 25 ´ 50 + 0 ´100 + 25 ´ 50 + 100 ´ 40
s =
2 i =1
=
280 280

å (y - y)
i
2
´ fi
4000 + 1250 + 0 + 1250 + 4000
s =
2 i =1
=
280 280

å (y - y)
i
2
´ fi
10500
s =
2 i =1
=
280 280

å (y - y)
i
2
´ fi
s =
2 i =1
= 37.5 años 2
280

Interpetración: La variabilidad de las edades de los trabajadores es de 37.5 años 2


respecto de su valor central.

3.1.3. La desviación estándar o típica


Se define como la raíz cuadrada positiva de la varianza:

s  var ianza

Es uno de los estadígrafos de dispersión de mayor uso, la cual se expresa en


unidades reales de la variable, es decir ya no están elevadas al cuadrado. La
desviación estándar, al igual que la varianza, es no negativa (s  0), puesto que es la
raíz positiva de la varianza. A mayor dispersión le corresponderá una mayor
desviación estándar.

_________________________________________ 61
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Ejemplo 39:
Calcular e interpretar la desviación estándar de los datos del Ejemplo 36 de la pag.
54..

Solución:
s = 1.4 = 1.2 min utos

Interpretación: Los tiempos de visita de los clientes se alejan en promedio de su


valor central en 1.95 puntos.

Ejemplo 40 :
Calcular e interpretar la desviación del Ejemplo 37 de la pag. 55:

Solución:
s = 3.5 = 1.87 @ 2 inasistencias.

Interpretación: Las asistencias de los trabajadores se dispersan o se alejan en


promedio de su valor central en 2 inasistencias.

Ejemplo 41 :
Calcular e interpretar la desviación del Ejemplo 38 de la pag. 57:

Solución:
s = 37.5 = 6.12 años.

Interpretación: Las edades de los trabajadores se dispersan o se alejan en


promedio de su valor central en 6.12 años.

3.1.4. El coeficiente de variación


Es una medida de dispersión relativa exenta de unidades y expresada en porcentaje,
se utilizan para comparar la variación de dos distribuciones siempre que las
variables se expresen en las mismas unidades de medida y sean aproximadamente
del mismo tamaño promedio. Sin embargo, a veces es necesario comparar dos
conjuntos de datos expresados en unidades diferentes (tales como soles y

_________________________________________ 62
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

kilogramos). En estos casos las medidas de dispersión absoluta no son comparables


y deben utilizarse medidas de dispersión relativa.

El coeficiente de variación de un conjunto de datos se denota por c.v. y se expresa


como:

s
c.v.   100
y

Donde:

s  Desviación estándar

y  Media aritmética

 Si c.v.  15%, los datos son homogéneos, es decir tienen una baja variabilidad.
 Si c.v. > 15%, los datos son heterogéneos, es decir tienen una alta variabilidad.

Ejemplo 42:
Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 36 de la
pag. 54.

Solución:

1.2
c.v.   100  36.4%  15%
3.3

Interpretación: Las dispersiónes de los tiempos utilizados por los clientes en visitar
la página Google respecto de su valor central son heterogéneos.

Ejemplo 43:
Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 37 de la
pag. 55:

Solución:
1.87
c.v. = ´ 100 = 24.67% > 15%
7.58

_________________________________________ 63
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Interpretación: Las dispersiones de las inasistencias de los trabajadores respecto


de su valor central son heterogéneos.

Ejemplo 44:
Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 38 de la
pag. 57:
Solución:
6.12
c.v. = ´100 = 16.32% > 15%
37.5

Interpretación: Las dispersiones de las edades de los trabajadores respecto de su


valor central son heterogéneos.

Ejemplo 45:
Los siguientes datos corresponden a una muestra aleatoria de los gastos mensuales
en soles de 7 estudiantes de administración:

Xi : 200, 250, 250, 400, 270, 300, 420

a) ¿Cuánto es la dispersión de los gastos mensuales respecto de su valor


central?
b) ¿Son los gastos mensuales homogéneos?

Solución:
a) Hallando en primer lugar el promedio:
7

åx i
2090
x= i =1
= = 298.57 soles.
7 7

b) A continuación construiremos una tabla de trabajo para calcular la


varianza:
Tabla N ° 20
i xi (x i  x) (x i  x) 2
1 200 -98.57 9716.04
2 250 -48.57 2359.04
3 250 -48.57 2359.04
4 400 101.43 10288.04
5 270 -28.57 816.24

_________________________________________ 64
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

6 300 1.43 2.04


7 420 121.43 14745.24
Total 2090 - 40285.68
Donde:
7

å (x
i =1
i - x) 2 = 40285.68

Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=7 <


30.
7

å (x i - x) 2
40285.68
s2 = i =1
= = 6714.28 soles 2 .
7 -1 6

c) Hallando la desviación estándar :

s = 6714.28 = 81.94 soles.

d) Hallando el coeficiente de variación:


De acuerdo a las operaciones realizadas tenemos:

x = 298.57 soles.

s = 81.94 soles.

entonces:

s 6.12
c.v. = ´100 = ´100 = 16.32% > 15%
x 37.5

Los gastos mensuales de los estudiantes no son homogéneos.

Ejemplo 46:
Los siguientes datos corresponden a una muestra aleatoria de los ahorros
mensuales en dólares de 5 clientes del Banco de Crédito del Perú:

Xi: 500, 550, 220, 340, 180

_________________________________________ 65
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

El gerente del Banco piensa hacer un aumento en la tasa de interés solo si los
ahorros mensuales son regulares. ¿Qué decisión tomará el gerente del Banco.
(Hallar coeficiente de variación).
Solución:
a) Hallando en primer lugar el ahorro mensual promedio:

åx i
1790
x= i =1
= = 358dólares.
5 5

b) A continuación construiremos una tabla de trabajo para calcular la


varianza:
Tabla N° 21
i xi (x i  x) (x i  x) 2
1 500 142 20164
2 550 192 36864
3 220 -138 19044
4 340 - 18 324
5 180 -178 31684
Total 1790 - 108080

Donde:
5

å (x
i =1
i - x) 2 = 108080

Reemplazando dicho valor en la formula de la varianza de Cochran ya que


n=5 < 30.
5

å (x i - x) 2
108080
s2 = i =1
= = 27020 dólares 2 .
5 -1 4

c) Hallando la desviación estándar :

s = 27020 = 164.38 dólares.

d) Hallando el coeficiente de variación:


De acuerdo a las operaciones realizadas tenemos:

_________________________________________ 66
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

x = 358 dólares.

s = 164.38 dólares.
entonces:
s 164.38
c.v. = = ´ 100 = 45.92% > 15%
x 358

Los ahorros mensuales de los clientes son heterogéneos; es decir no son


regulares. Por lo tanto el gerente del banco no subirá la tasa de interés. El gerente
no subirá la tasa de interés ya que los ahorros mensuales no son regulares.

Ejemplo 47:
Los siguientes datos corresponden a una muestra aleatoria de los ahorros
mensuales en dólares de dos grupos de clientes del Banco Continental :
Tabla N° 22
GRUPO 1 2 3 4 5 6
1 500 550 540 530 520 550
2 400 450 500 460 450 470

¿En que grupo los ahorros son más estables? (Hallar coeficiente de variación)

Solución:
Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada
uno de los grupos se obtiene los siguientes resultados:

● Para el Grupo 1
a) Hallando el ahorro mensual promedio para el Grupo 1:
6

åx i
3190
x1 = i =1
= = 531.67soles.
6 6

b) Hallando la varianza:

_________________________________________ 67
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Tabla N° 23
i xi (x i - x ) (x i - x ) 2
1 500 -31.67 1002.99
2 550 18.33 335.99
3 540 8.33 69.39
4 530 -1.67 2.79
5 520 -11.67 136.19
6 550 18.33 335.99
Total 3190 - 1883.34
Donde:
6

å (x
i =1
i - x) 2 = 1883.34

Reemplazando dicho valor en la formula de la varianza de Cochran ya que


n=6 < 30.
6

å (x i - x) 2
1883.34
s12 = i =1
= = 376.67 soles 2 .
6 -1 5

c) Luego hallamos la desviación estándar :


s1 = 376.67 = 19.41 soles.

d) Finalmente hallamos el coeficiente de variación:

s1 19.41
c.v1 = = ´100 = 3.65% < 15%
x1 531.67

● Para el Grupo 2
a) Hallando el ahorro mensual promedio para el Grupo 2:
6

åx i
2730
x2 = i =1
= = 455soles
6 6

b) Hallando la varianza:

_________________________________________ 68
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Tabla N° 24
i xi (x i - x ) (x i - x ) 2
1 400 -55 3025
2 450 -5 25
3 500 45 2025
4 450 -5 25
5 460 5 25
6 470 15 225
Total 2730 - 5350
Donde:
6

å (x
i =1
i - x) 2 = 5350

Reemplazando dicho valor en la formula de la varianza de Cochran ya que


n=6 < 30.
6

å (x i - x) 2
5350
s 22 = i =1
= = 1070 soles 2 .
6 -1 5

c) Luego hallamos la desviación estándar :


s 2 = 1070 = 32.71 soles.

d) Finalmente hallamos el coeficiente de variación:

s2 32.71
c.v1 = = ´100 = 7.19% < 15%
x2 455

La siguiente tabla muestra los resultados obtenidos en forma resumida:

Tabla N° 25
GRUPO x s c.v.
1 531.67 19.41 3.65% < 15%
2 455 32.71 7.19% <15%

Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos,


se observa que en el Grupo 1 los ahorros son más estables.

_________________________________________ 69
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Ejemplo 48:
Los siguientes datos corresponden a dos muestras aleatorias de dos grupos de
trabajdores según su sueldo mensual en soles:

Tabla N° 26 - GRUPO 1
Sueldo mensual en soles N° de trabajadores
LI - LS fi
[550 - 650) 40
[650 - 750) 60
[750 - 850) 100
[850 - 950) 40
[950 - 1050) 20
Total 260

Tabla N° 27 - GRUPO 1
Sueldo mensual en soles N° de trabajadores
LI - LS fi

[750 - 850) 30
[850 - 950) 50
[950 - 1050) 80
[1050 - 1150) 40
[1150 - 1250) 10
TOTAL 210

¿Qué grupo tiene sueldos mensuales más homogéneos?

Solución:
Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada
uno de los grupos se obtiene los siguientes resultados:

● Para el Grupo 1
a) Hallando en primer lugar el promedio:
5

åy ´f i i
202000
y1 = i =1
= = 776.92 soles
260 260

b) A continuación construiremos una tabla de trabajo para calcular la


varianza:

_________________________________________ 70
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Tabla N° 28

Li - Ls yi fi (yi - y) (yi - y) 2 (yi - y)2 ´ f i


[550 - 650) 600 40 -176.92 31300.69 1252027.6
[650 - 750) 700 60 -76.92 5916.69 355001.4
[750 - 850) 800 100 23.08 532.69 53269.0
[850 - 950) 900 40 123.08 15148.69 605947.6
[950 - 1050) 1000 20 223.08 49764.69 995293.8
Total 260 - - 3261539.4

Donde:
5 2

å (y - y)
i =1
i ´ f i = 3261539.4

Reemplazando dicho valor en la formula de la varianza para n=260 > 30.


5

å (y - y) i
2
´ fi
(y1 - y) 2 ´ f1 + (y 2 - y) 2 ´ f 2 + (y3 - y)3 ´ f 3 + (y 4 - y) 4 ´ f 4 + (y 5 - y)5 ´ f 5
s =
2
1
i =1
=
260 260
5

å (y - y) i
2
´ fi
31300.69 ´ 40 + 5916.69 ´ 60 + 53269.0 ´100 + 15148.69 ´ 40 + 49764.69 ´ 20
s =
2
1
i =1
=
260 260

å (y - y) i
2
´ fi
1252027.6 + 355001.4 + 53269.0 + 605947.6 + 995293.8
s =
2
1
i =1
=
260 280

å (y - y) i
2
´ fi
3261539.4
s =
2
1
i =1
=
260 260

å (y - y) i
2
´ fi
s =
2
1
i =1
= 12544.38soles 2
260

c) Hallando la desviación estándar:


s1 = 12544.48 = 112.00 soles.

_________________________________________ 71
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

d) Hallando el coeficiente de variación:

s1 112.00
c.v1 = = ´100 = 14.42% < 15%
y1 776.92

● Para el Grupo 2
a) Hallando en primer lugar el promedio:
5

åy ´f i i
205000
y2 = i =1
= = 976.19 soles
210 210

b) A continuación construiremos una tabla de trabajo para calcular la


varianza:
Tabla N° 29

Li - Ls yi fi (yi - y) (yi - y) 2 (yi - y)2 ´ f i


[ 750 - 850) 800 30 -176.19 31042.92 931287.60
[ 850 - 950) 900 50 - 76.19 5804.92 290246.00
[ 950 - 1050) 1000 80 23.81 566.92 45353.60
[1050 - 1150) 1100 40 123.81 15328.92 613156.80
[1150 - 1250) 1200 10 223.81 50090.92 500909.16
Total - 210 - - 2380953.16

Donde:

5 2

å (y - y)
i =1
i ´ f i = 2380953.16

Reemplazando dicho valor en la formula de la varianza para n=210 > 30.

_________________________________________ 72
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

å (y - y)
i
2
´ fi
(y1 - y)2 ´ f1 + (y 2 - y) 2 ´ f 2 + (y 3 - y) 3 ´ f 3 + (y 4 - y) 4 ´ f 4 + (y5 - y)5 ´ f 5
s =
2
2
i =1
=
210 210
5

å (y - y)
i
2
´ fi
31042.92 ´ 30 + 5916.69 ´ 60 + 566.92 ´ 80 + 15328.92 ´ 40 + 50090.92 ´10
s =
2
1
i =1
=
210 210

å (y - y)
i
2
´ fi
931287.60 + 290246.00 + 45353.60 + 613156.80 + 500909.16
s =
2
1
i =1
=
210 210

å (y - y)
i
2
´ fi
2380953.16
s =
2
1
i =1
=
210 210

å (y - y)
i
2
´ fi
s =
2
1
i =1
= 11337.87soles 2
210

c) Hallando la desviación estándar:


s1 = 11337.87 = 106.48 soles.
d) Hallando el coeficiente de variación:

s1 106.48
c.v1 = = ´ 100 = 10.91% < 15%
y1 976.19

Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada
uno de los grupos se obtiene los siguientes resultados:
Tabla N° 30
GRUPO x s c.v.
1 776.92 112 14.42% < 15%
2 976.19 106.47 10.91% <15%

Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos,


se observa que en el Grupo 2 los sueldos mensuales son más homogéneos.

_________________________________________ 73
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

3.2. MEDIDAS DE FORMA


3.2.1. DEFINICIÓN
Miden la forma de distribución de los valores de la serie y se clasifican en simétricas
o asimétricas y en puntiagudas o no. Por sus características requieren que los datos
sean cuantitativos y por lo general continuos.
3.2.1. MEDIDAS DE ASIMETRIA
Son medidas que miden el grado de deformación horizontal de una serie de datos o
de distribución de frecuencias.
Se dice que una distribución de frecuencias es simétrica, si los intervalos
equidistantes del intervalo central tienen iguales frecuencias. También se dice que
una distribución es simétrica si su curva de frecuencias es simétrica con respecto al
centro de los datos.
Dos distribuciones pueden tener la misma media y la misma desviación estándar,
pero pueden diferir en el grado de asimetría.
Si la distribución es simétrica, entonces la media, la mediana y la moda coinciden.
En contraposición, si estos 3 promedios no coinciden la distribución es asimétrica.
Entre las medidas de asimetría más usuales tenemos:

- El Coeficiente de asimetría de Pearson


Se expresa como:

3(x  Me)
As 
s

Si:
AS = 0 La serie de datos o la distribución es simétrica. Ver fig. 1.
AS > 0 La serie de datos o la distribución es asimétrica positiva
(sesgada a la derecha). Ver fig. 2.
AS < 0 La serie de datos o la distribución es asimétrica negativa
(sesgada a la izquierda). Ver fig. 3.

_________________________________________ 74
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Distribución
Distribución Distribución
Asimétrica Negativa
Asimétrica Positiva Simétrica
x < Me < Md
Md < Me < x x = Me = Md
fig.3
fig. 1 fig.2

NOTA:
Si As 0, entonces se dice que la distribución es aproximadamente
simétrica o ligeramente sesgada. Será tanto más sesgada cuanto más As
se aleje de cero.

Ejemplo 49:
Calcular e interpretar el coeficiente de asimetría de los datos del Ejemplo 36 de la
página 54.

Solución:
Utilizando el coeficiente de asimetría de Pearson :
3( x  Me)
As 
s

De los datos dados se ha obtenido:

x = 3.3min utos
Me = 3.7 min utos
s = 1.2 min utos

Reemplazando en la fórmula obtenemos:

_________________________________________ 75
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

3(3.3  3.7)
As   1
1.2

Interpretación: Este valor indica que la serie de tiempos de los clientes que visitan
la página Google es asimétrica negativa.

Ejemplo 50:
Hallar el coeficiente de asimetría de Pearson del Ejemplo 37 de la página 55.

Solución:
Utilizando el coeficiente de asimetría de Pearson :

3(y - Me)
As =
s

De los datos dados se ha obtenido:

y = 7.58inasistencias
Me = 7inasistencias
s = 1.87inasistencias

Reemplazando en la fórmula obtenemos:

3(7.58 - 7)
As = = 0.93
1.87

Interpretación: La distribución de trabajadores según su número de inasistencias es


asimétrica positiva.

En el siguiente gráfico podemos observar que que hay mayor concentración de


datos a la derecha:

_________________________________________ 76
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

100
Nº de trabajadores

80

60

40

20

N° de inasistencias
0 3 5 7 9
11

Ejemplo 51:
Hallar el coeficiente de asimetría de Pearson del Ejemplo 38 de la página 57.
Solución:
Utilizando el coeficiente de asimetría de Pearson :

De los datos dados se ha obtenido:

y = 37.5 años.
Me = 37.5 años.
s = 6.12 años.

Reemplazando en la fórmula obtenemos:

3(37.5 - 37.5)
As = =0
6.12

Interpretación: La distribución de trabajadores según su edad en años es simétrica.

_________________________________________ 77
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

En el gráfico se observa que en hay igual concentración de datos a la izquierda y


derecha.

100

80
Nº de trabajadores

60

40

20

0
Edad en años

0 25 30 35 40 45 50

37.5
y = Me = Md

3.2.2. MEDIDAS DE CÚRTOSIS


La Kúrtosis es el grado de apuntamiento de una distribución. La cúrtosis se analiza
amparando la distribución con la forma de una curva normal o simétrica, con igual
media aritmética y desviación estándar de la distribución que se estudia.

Si una distribución tiene relativamente un elevado pico o apuntamiento, se llama


leptocúrtica, mientras si es achatada se denomina platicúrtica. La distribución
normal constituye una distribución mesocúrtica, tal como se puede ver en las
siguientes figuras:

_________________________________________ 78
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Leptocúrtica Mesocúrtica Platicúrtica

fig. 4 fig. 5 fig. 6

El estadígrafo para analizar el apuntamiento es el coeficiente de kúrtosis y se


expresa como:
M4
k
s4
Donde:
s 4 = (s 2 ) 2

s 2 = Varianza

å (y i - y)4 ´ f i
M4 = i =1
n

M 4 se llama: “cuarto momento respecto a la media”


Si:
K  3 , la distribución es normal o mesocúrtica.
K  3 , la distribución es platicúrtica.
K  3 , la distribución es leptocúrtica.

_________________________________________ 79
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Ejemplo 52:
Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 37 de la pag. 55.

Solución:
a) Hallando en primer lugar el promedio de los datos dados:
5

åy ´f i i
1820
y= i =1
= = 7.58 inasistencias
240 240

b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la
cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los
valores hallados en la última columna, tal como se muestra en la siguiente tabla:
Tabla N° 31

yi fi
(y i - y) (yi - y) 4 (yi - y) 4 ´ f i
3 10 -4.58 440.01 4400.01
5 30 - 2.58 44.31 1329.30
7 100 - 0.58 0.11 11.00
9 80 1.42 4.07 325.60
11 20 3.42 136.81 2736.20
Total ** - -
Expresión ** Expresión
errónea ** errónea **
Donde:
5 4

å (y
i =1
i - y) ´ f i = 8802.11

c) Luego hallamos los momentos de orden 4 (M 4 ) :

å (y i - y) 4 ´ f i
440.01 ´ 10 + 44.31 ´ 30 + 0.11 ´100 + 4.07 ´ 80 + 136.81 ´ 20
M = 4 i =1
=
240 240

å (y i - y) 4 ´ f i
4400.1 + 1329.30 + 11 + 325.60 + 2736.20
M = 4 i =1
=
240 240

å (y i - y) 4 ´ f i
8802.11
M4 = i =1
=
240 240

å (y i - y) 4 ´ f i
M = = 36.68 inasistencias 4
_________________________________________
4 i =1 80
Elaborado por 240
: Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Además:
s 2 = 3.5 inasistencias 2
Entonces :
s 4 = 12.25 inasistencias 4

Por lo tanto el coeficiente de cúrtosis está dado por:


M4
k=
s4
36.68
k=
12.25
k = 2.99 < 3

Interpretación: La distribución de trabajadores según su número de inasistencias es


platicúrtica.

Ejemplo 53:
Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 38 de la pag. 57

a) Hallando en primer lugar el promedio de los datos dados:


5

åy ´f i i
10500
y= i =1
= = 37.5 años
280 280

b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la
cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los
valores hallados en la última columna, tal como se muestra en la siguiente tabla:
Tabla N° 32

Li - Ls y fi
(yi - y) (yi - y) 4 (yi - y)4 ´ f i
[25 - 30) 27.5 40 -10 10000 400000
[30 - 35) 32.5 50 -5 625 31250
[35 - 40) 37.5 100 0 0 0
[40 - 45) 42.5 50 5 625 31250
[45 - 50) 47.5 40 10 10000 400000
Total - 280 - - ** Expresión
errónea **

_________________________________________ 81
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Donde:

5 4

å (yi - y) ´ fi = 862500
i =1

c) Luego hallamos los momentos de orden 4 (M 4 ) :


5

å (y i - y) 4 ´ f i
10000 ´ 40 + 625 ´ 50 + 0 ´ 100 + 625 ´ 50 + 10000 ´ 40
M4 = i =1
=
280 280

å (y i - y) 4 ´ f i
400000 + 31250 + 0 + 31250 + 400000
M4 = i =1
=
280 280

å (y i - y) 4 ´ f i
862500
M = 4 i =1
=
280 280

å (y i - y) 4 ´ f i
M = 4 i =1
= 3080.36años 4
280

Además:

s 2 = 37.5 años 2

Entonces :

s 4 = 1406.25 años 4

Por lo tanto el coeficiente de cúrtosis está dado por:

M4
k=
s4

3080.36
k=
1406.25

k = 2.19 < 3

La distribución de trabajadores según su edad de años es platicúrtica.

_________________________________________ 82
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

AUTOEVALUACIÓN 03

1. La siguiente tabla corresponde a consumo de teléfono en soles de dos locutorios


durante 7 meses:

Locutorio 1 300 250 280 27 320 290


0
Locutorio 2 500 800 400 30 200 700
0

a) Calcular la varianza para el locutorio 1.


b) Calcular la varianza para el locutorio 2.
c) Calcular la desviación estándar para el locutorio 1.
d) Calcular la desviación estándar para el locutorio 2.
e) Calcular el coeficiente de variación para el locutorio 1.
f) Calcular el coeficiente de variación para el locutorio 2.
g) ¿En que locutorio el consumo es más regular?

2. Los siguientes datos corresponden al índice de precios al consumidor en % (IPC)


de la ciudad de Chimbote del año 2005:

AÑO E F M A M J J A S O N D

IPC 105.3 105.24 105.5 105.3 105.89 105.26 105.2 104.93 109.0 104.75 105.2 105.6
0 9 1 8 4 4

a) Calcular la varianza e interpretar.


b) Calcular la desviación estándar e interpretar.
c) Calcular el coeficiente de variación e interpretar.
d) ¿Se han mantenido estable el IPC en la ciudad de Chimbote para el año
2005?
e) Calcular el coeficiente de asimetría e interpretar
3. Dos Empresas “X” e “Y” que pertenecen al rubro financiero ha considerado
evaluar a sus trabajadores obteniéndose los siguientes resultados respecto a sus
calificaciones

Empresa X Empresa Y
Calificación media 60 60
Desviación estándar 20 15

¿Qué empresa tiene calificaciones más estables?

_________________________________________ 83
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

4. El gerente de una empresa analiza las ventas mensuales en dólares de sus


promotores en los últimos 6 meses y considera que si la desviación estándar es
menor de 747 dólares considera que sus ventas son regulares y decidirá contratarlos
para los próximos 6 meses siguientes:

Xi : 5000, 4500, 4800, 4600, 6000

¿Qué decisión tomara el gerente?

5. Los siguiente tabla corresponde a las ventas mensuales en dólares de 32


empresas de productos agroinustriales:

Ventas mensuales Nº de empresas


en $ fi
LI - LS
[250 - 300) 6
[300 - 350) 8
[350 - 400) 12
[400 - 450) 4
[450 - 500) 2
Total 32

a) Calcular la varianza e interpretar.


b) Calcular la desviación estándar e interpretar.
c) Calcular el coeficiente de variación e interpretar.
d) Calcular el coeficiente de asimetría e interpretar.
e) Calcular el coeficiente de cúrtosis e interpretar.

6. Las siguientes tablas corresponden a 2 hoteles turísticos categoría 3 estrellas de


una misma cadena de hoteles según su consumo mensual en soles de los turistas
hospedados:
Hotel A
Consumo mensual en N° de turistas
$ fi
Li - Ls
[550 - 600) 10
[600 - 650) 20
[650 - 7 00) 40
[700 - 750) 20
[750 - 800) 10
Total 100

_________________________________________ 84
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Hotel B
Consumo mensual N ° de turistas
en $ fi
Li - Ls
[600 - 700) 5
[700 - 800) 10
[800 - 900) 15
[900 - 1000) 8
[1000 - 1100) 4
Total 42

a) Calcular la varianza para el Hotel A.


b) Calcular la varianza para el Hotel B.
c) Calcular la desviación estándar para el Hotel A.
d) Calcular la desviación estándar para el Hotel B.
e) Calcular el coeficiente de variación para el Hotel A.
f) Calcular el coeficiente de variación para el Hotel B.
¿Qué hotel es más regular respecto al consumo mensual de los turistas
hospedados?
g) Cacular el coeficiente de asimetría para ambas distribuciones, además
graficar y comentar.
h) Calcular el coeficiente de cúrtosis para ambs distribuciones, además
graficar y comentar.

_________________________________________ 85
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

CAPÍTULO IV

NOCIONES DE PROBABILIDAD

4.1. EXPERIMENTO
Un experimento es un proceso mediante el cual se obtiene el resultado de una
observación. Un experimento puede ser determinístico o aleatorio.

4.1.1. Experimento determinístico: Cuando el resultado de la observación es


determinado en forma precisa por las condiciones bajo las cuales se realiza el
experimento.

Ejemplo 54:
- Lanzar una pelota en un tanque de agua y ver si flota o se hunde.
- Soltar una piedra en el aire.
- Observar la suma de dos números naturales pares.

4.1.2. Experimento aleatorio: Un experimento es aleatorio o no determinístico,


cuando los resultados de la observación no se puede predecir con exactitud, antes
de realizar el experimento.

Ejemplo 55:
- Observar el tiempo de vida de una computadora.
- Elegir un presidente de un grupo de 50 personas.
- Lanzar un dado y ver el número que aparece en la cara superior.

4.2. ESPACIO MUESTRAL


Es el conjunto de resultados posibles de un experimento aleatorio.
 = {w/w es un resultado particular simple de la realización de un exp. aleat.}
Los resultados posibles de un experimento se llaman puntos de muestra.

Ejemplo 56:
E1: Lanzar un dado y el observar el número que aparece en la cara superior.
1 = {1, 2, 3, 4, 5,6}

E2: Observar los resultados de un partido de fútbol.

____________________________________________ 86
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

2 = {gana, pierde, empata}

E3= Preguntar a una ciudadano en particular su edad en años.


3= {w  R+/ w≥18}

Los espacios muestrales se clasifican en:


a) Espacio muestral discreto: Si se tiene un número finito o infinito numerable de
elementos.
b) Espacio muestral continuo: Cuando sus elementos son todos los puntos de un
intervalo.

4.3. EVENTOS
Son subconjuntos de un espacio muestral (). En particular el espacio muestral ()
y el conjunto vacío () son eventos. Al espacio muestral () se le llama evento
seguro y al conjunto () se le llama evento imposible.
Los eventos se denotan por las letras mayúsculas del abecedario: A, B, C, etc.

4.3.1. Tipos de eventos:


a) Evento simple: Cuando contiene solamente un punto del espacio muestral.
b) Evento Compuesto: Cuando puede expresarse como la unión de dos o más
eventos simples.

Ejemplo 57:
Sea el experimento: lanzar una moneda dos veces y observar la cara superior.
a) Liste los elementos del espacio muestral.
b) Determinar los siguientes eventos:
A1: Ocurre cara en el primer lanzamiento.

A2: Ocurre sello en el segundo lanzamiento.

A3: Ocurre por lo menos una cara.

A4: Ocurre lo mismo en ambos lanzamiento.

____________________________________________ 87
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución: Diagrama del árbol

C
S

C
S
S

a)  = {(c,c), (c,s), (s,c), (s,s)

b) A1 = {(c,c), (c,s)}
A2 = {(c,s); (s,s)}
A3 = {(c,s), (s,c), (c,c)}
A4 = {(c,c), (s,s)}

Ejemplo 58:
Dado el siguiente experimento:

E: Preguntar a dos empresas que venden por Internet su fuente principal de


ingreso de comercio electrónico.
Teniendo en cuenta que fuente principal de comercio electrónico es:
P: Publicidad C: Comisiones y V: Venta de productos/Servicios

a) Liste los elementos del espacio muestral.


b) Determine los elementos de los siguientes eventos:
A: Que en ambas empresas la fuente principal de ingreso de comercio
electrónico sea por venta productos / servicios.

B: Que solamente en la segunda empresa la fuente principal de ingreso de


comercio electrónico sea por comisiones.

C: Que en ninguna empresa la fuente principal de ingreso de comercio


electrónico sea por publicidad.

D: Que la fuente principal de ingreso de comercio electrónico sea por


publicad o comisiones.

____________________________________________ 88
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución:

DIAGRAMA DEL ARBOL

C
P

V
P

C C

V
P

V
C

a)
W = {PP, PC, PV, CP, CC, CV, VP, VC, VV}

b)

A = {VV}

B = {PC, VC}

C = {CC, CV, VC, VV}

D = {PP, PC, CP, CC}

____________________________________________ 89
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

4.4. OPERACIONES CON EVENTOS


Usando las operaciones con conjuntos podemos formar nuevos eventos. Estos
nuevos eventos serán nuevamente subconjunto del mismo espacio muestral de los
eventos dados.

a) Unión de eventos: A  B
Sean A y B dos eventos cualesquiera de un espacio muestral Ω. La unión de
eventos es el evento que ocurre si A ocurre o B ocurre o ambos ocurren.

Simbólicamente:
A  B = {w /wA v w B}



 A B A
A B
B

AB AB AB

b) Intersección de eventos: A  B
Sean A y B dos eventos cualesquiera de un espacio muestral Ω, la intersección de
estos eventos, es el evento que ocurre si A y B ocurren simultáneamente.

Simbólicamente:
A  B = {w  / w  A  w  B}


A B

AB

c) Complemento de un evento: A
Si A es un evento del espacio muestral , se llama complemento del evento A, al
evento que ocurre si A no ocurre.

____________________________________________ 90
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Simbólicamente:
A = {w  / w  A}

AC A

d) Diferencia de Eventos: A – B
Sean A y B dos eventos de un espacio muestral Ω, se llama diferencia de los
eventos A y B, al evento formado por los elementos que son favorables a A pero que
no son favorables a B.

Simbólicamente:
A – B = {w   / w  A  w B}


A B

A-B = AÇB
e) Inclusión de eventos: A  B
Dado dos eventos A y B de un espacio muestral Ω, se dice que el evento A está
contenido B, si siempre que ocurre A ocurre B.

Simbólicamente: A  B, si W  a  W  B

B
 
A

AÌB

____________________________________________ 91
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

4.5. EVENTOS MUTUAMENTE EXCLUYENTES Y EVENTOS


COLECTIVAMENTE EXHAUSTIVOS

a) Una colección de eventos A1, A2,..., Ak definidos sobre un mismo espacio


muestral. Se dice que son mutuamente excluyentes, si la ocurrencia de uno de ellos
excluye la ocurrencia de los otros, es decir:

Ai Ç Aj =  " i ¹ j ; i = 1, 2, ......., k

b) Se dice que una colección de eventos A 1, A2,...., Ak, definidos sobre el mismo
espacio muestral son colectivamente exhaustivos, si la unión de ellos de ello es igual
al espacio muestral.

k
A1 È A2 È .... Ak = È Ai = W ; i = 1, 2, ......., k
i =1

4.6. PROPIEDADES DE LAS OPERACIONES CON EVENTOS


Dado los eventos A, B y C de un espacio muestral Ω, se verifican las siguientes
propiedades básicas de unión e intersección de eventos.

a) Ley conmutativa.
AB=BA
AB=BA

b) Ley asociativa
(AB)  C = A  (BC)
(AB)  C = A  (BC)

c) Ley Distributiva
A  (B  C) = (A  B)  (A  C)
A  (B  C) = (A  B)  (A  C)

d) Complemento del complemento


c
C
(A ) = A

____________________________________________ 92
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

e) A =
A =A
A  AC = 
AA =A

f) A =A
A=
A  AC = 
AA=A

g) Leyes de Morgan

 AÈ B = AÇ B


A B

 AÇ B = AÈ B


A B

i) A = ( A Ç B) È ( A Ç B)

AÇB 

AÇB

____________________________________________ 93
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

j) Si A  B, entonces AB=ByAB=A


B

4.7. PROBABILIDAD Y ENFOQUES DE PROBABILIDAD

Frecuentemente se usa el término probabilidad para sugerir que existe duda o


incertidumbre sobre lo que ocurrió, lo que ocurre ocurrirá. La experiencia humana
demuestra que existe una serie de hechos, acontecimientos, experimentos cuyos
resultados no se pueden determinar anticipadamente; sin embargo si es posible
definir, estimar o predecir el probable resultado. Podemos conocer el pasado, pero
nunca el futuro, pero existe un permanente interés por despejar las incertidumbres.

Las situaciones que implican incertidumbre varían desde simples juegos al azar,
como la ruleta, los dados, los naipes, la lotería, los tragamonedas, etc. A otros
experimentos y acontecimientos tan variados, complejos e importantes dentro de las
ciencias médicas, ciencias sociales, la economía, las industrias, los negocios, los
seguros, las inversiones, etc. Permanente interesa predecir o estimar lo que
sucederá en ciertas circunstancias. Un empresario decide comercializar un producto
si sabe que la probabilidad de aceptación es alta. El aficionado de fútbol, puede
apostar contra su equipo favorito si sabe que la probabilidad de que gane es muy
pequeña. Los inversionistas no deciden invertir en un país políticamente y
económicamente inestable si saben que porque la probabilidad de obtener
rendimientos futuros es baja. Es posible que ninguno de ellos sepa definir o medir la
probabilidad, pero si encontrará útil la idea de estimarla intuitivamente.

El propósito de esta sesión es ilustrar las formas en las que pueden medirse la
posibilidad o probabilidad de ocurrencia de eventos futuros. Al mejorar la habilidad
para juzgar la ocurrencia de eventos futuros, se puede minimizar el riesgo y la
especulación arriesgada relacionada con el proceso de toma de decisiones.

4.7.1. PROBABILIDAD
Es la posibilidad numérica de la ocurrencia de un evento casual.

____________________________________________ 94
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

4.7.2. AXIOMAS DE PROBABILIDAD


a) La probabilidad de un evento cualquiera, es siempre positiva.
P ( A) ³ 0
b) La probabilidad de un evento cierto o seguro, es la probabilidad del espacio
muestral, que equivale a la unidad.
P (W ) = 1
c) La probabilidad de la unión de una familia de eventos mutuamente excluyentes
es igual a la suma de las probabilidades de dichos eventos.
P ( A1 È A2 È ..... È Ak ) = P ( A1 ) + P ( A2 ) + ....P ( Ak )

k
æk ö
P ç È Ai ÷ = å P ( Ai )
è i =1 ø i =1

4.7.3. TEOREMAS DE LOS AXIOMAS DE PROBABILIDAD


De los axiomas de probabilidad resultan los siguientes teoremas:
a) La probabilidad de un evento toma valores entre cero y uno. Es decir:
0 £ P( A) £ 1
b) La probabilidad de un evento nulo o imposible, es cero. Es decir:
P (f ) = 0
c) La probabilidad del complemento de un evento está dada por:
P ( A) = 1 - P( A)
d) Si el evento A es un subconjunto del evento B, entonces:
P ( A) £ P( B)

4.7.4. ENFOQUES O TIPOS DE PROBABILIDAD


Existen tres enfoques para el estudio de la probabilidad.

a) Enfoque clásico
Llamada también probabilidad a priori debido a que es posible conocer el resultado
con anterioridad, es decir, sin llevar a cabo el experimento y sólo basado en el
razonamiento lógico. Se basa en el supuesto en que cada elemento del espacio
muestral tiene la misma posibilidad de ser elegido.

____________________________________________ 95
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Para un evento A cualquiera, entonces:

Casos favorables de ocurrencia del evento A


P ( A) =
Total de casos posibles

n( A)
P ( A) =
n (W )

Ejemplo 59:
Hallar la probabilidad de obtener cara en el lanzamiento de una moneda.

Solución:
El espacio muestral será:
  {c, s}

Sea el evento A: obtener cara.

Luego:
n( A)
P ( A) =
n (W )

1
P ( A) = = 0.5
2

Ejemplo 60:
Hallar la probabilidad de obtener el número 2 en el lanzamiento de un dado.

Solución:
El espacio muestral será:
  {1,2,3,4,5,6}
Sea el evento B: Obtener el número 2.
Luego:

____________________________________________ 96
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

n( B )
P( B) =
n (W )

1
P( B) = = 0.17
6

Las probabilidades clásica, se utiliza para experimentos simples, como los


mencionados anteriormente. En la vida real se presentan situaciones más complejas
que requieren el cálculo de probabilidad desde otro enfoque.

b) Enfoque relativo
El cálculo de este tipo de probabilidad se basa en la repetición de la ocurrencia de
un evento, al realizar una gran cantidad de pruebas o experimentos.

Para un evento A cualquiera, entonces:

Número de veces que ocurrió el evento A


P ( A) =
Número total de observaciones

f
P ( A) =
n

La probabilidad de frecuencia relativa, es llamada también empírica o a posteriori,


debido a que se obtiene el resultado después de llevar a cabo el experimento.

Ejemplo 61:
En una encuesta realizada a 1500 pequeñas empresas de la ciudad de Lima, sobre
el número de medidas de seguridad se encontró los siguientes resultados:

____________________________________________ 97
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

TABLA N° 33
N° de medidas de N° de Empresas
seguridad
Ai fi P ( Ai )
0 100 0.07
1 800 0.53
2 300 0.20
3 250 0.17
4 50 0.03
Total 1500 1.00

a) ¿Cuál es la probabilidad de que las pequeñas empresas tengan 2 medidas de


seguridad?
P(A2)=0.20
El 20% de las empresas tienen 2 medidas de seguridad.

b) ¿Cuál es la probabilidad de que las pequeñas empresas tengan más de 2


medidas de seguridad?
P(Ai > 2) = P(A4) + P(A5) = 0.17 + 0.03 = 0.20
El 20% de las pequeñas empresas tienen más de 2 medidas de seguridad.

c) Enfoque subjetivo
Es la probabilidad asignada bajo un criterio personal, basado en cualquier tipo de
evidencia disponible.
Las probabilidades subjetivas se asignan a eventos que pueden suceder solo una
vez o muy pocas veces.

Ejemplo 62:
a) La probabilidad que una mujer llegue a ser presidenta de los EE.UU.
b) La probabilidad que el hombre viva eternamente.
c) La probabilidad que quiebre la bolsa de valores de New York.

4.8. REGLAS DE PROBABILIDAD


Estudiaremos la probabilidad del producto y de la suma.

____________________________________________ 98
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

4.8.1. PROBABILIDAD DEL PRODUCTO: P(AB)


Se utiliza para calcular la probabilidad conjunta o simultánea de dos o más eventos.

Ω
A B

P(A Ç B)
Se toman en cuenta dos aspectos:
a) Que los eventos A y B sean dependientes,
Entonces la ocurrencia conjunta de los eventos es:
P ( A Ç B ) = P( A) ´ P( B / A)

b) Que los eventos A y B sean independientes, se debe cumplir:


P ( A / B ) = P( A)
Entonces la ocurrencia simultánea de los eventos independientes A y B es:
P ( A Ç B ) = P( A) ´ P( B )

4.8.2. PROBABILIDAD DE LA SUMA: P(AB)


Se usa cuando se desea averiguar la probabilidad de ocurra al menos un evento.

Se toma en cuenta dos aspectos:


a) Que los eventos sean traslapados o unidos:

P ( A È B ) = P( A) + P( B ) - P( A Ç B)

A B

P(A Ç B) ¹ 0

____________________________________________ 99
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Si A y B son independientes, entonces:

P ( A È B ) = P ( A) + P ( B ) - P ( A) ´ P ( B )

b) Que los eventos A y B sean mutuamente excluyentes, la probabilidad de que


ocurra A ó B es:
P ( A È B ) = P( A) + P( B )

A B

P(A  B)  0

4.9. PROBABILIDAD CONDICIONAL


Es utilizada cuando se desea conocer la probabilidad de ocurrencia de un evento
condicionado a la ocurrencia previa de otro evento.
Se calcula mediante la fórmula:

P( A Ç B )
P( A / B) = con P( B) ¹ 0
P ( B)

El símbolo / se lee: DADO, SI y expresa condición.


Donde:
P(A/B) se lee: Probabilidad deque ocurra el evento A, dado que el evento B ya
ha ocurrido.

Ejemplo 63:
Se ha determinado que la probabilidad de televidentes que ven los programas A y B
son respectivamente 0.40 y 0.5. Cada televidente ve los programas independientes
uno del otro. Si se elige al azar uno de tales televidentes ¿Qué probabilidad hay de
que vea ambos programas?

____________________________________________ 100
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución:
A: Televidentes que ven el programa A. P(A) = 0.4

B: Televidentes que ven el programa B. P(B) = 0.5

AB: Televidentes que ven el programa ambos programas.

A y B son independientes P(BA) = P(A) x P(B) = 0.2

Gráficamente observamos:

P(A) = 0.4 P(B) = 0.5

0.2

P(A Ç B)

La probabilidad de que los televidentes vean ambos programas es 0.2.

Ejemplo 64:
Los alumnos del II ciclo de Ingeniería de Sistemas tienen que realizar dos pruebas,
una teórica y otra practica en la signatura de estadística. La probabilidad de que un
estudiante apruebe la parte teórica es de 0.6, la probabilidad de que apruebe la
práctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5.

1. ¿Cuál es la probabilidad de que el alumno no apruebe ninguno de los


exámenes?
2. ¿Cuál es la probabilidad de que el alumno apruebe solamente la parte teórica?
3. ¿Cuál es la probabilidad de que el alumno apruebe al menos uno de los cursos?

____________________________________________ 101
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución:
Sean los eventos:
T : El alumno aprueba la parte teórica. P(T) = 0.6
C : El alumno aprueba la parte práctica. P(C) = 0.8
TC : El alumno apruebe la parte teórica y la parte práctica.
P(TC) = 0.5

P(A) = 0.60 P(B) = 0.80

P(A È B) = 0.90
0.5 0.30
P(A - B) 0.10
P(B - A)

P(A Ç B)

P(A È B) = 0.1

a) P(A È B) = P(A Ç B) = 0.1

b)
P(A - B) = P(A) - P(A Ç B)
P(A - B) = 0.10

c)
P(A È B) = P(A) + P(B) - P(A Ç B)
P(A È B) = 0.6 + 0.8 - 0.5
P(A È B) = 0.9

____________________________________________ 102
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Ejemplo 65:

Si P(A)= 3/5, P(B) = 3/6 y P(A∩B) = 1/4

Calcular:

a) P(B) b) P(A  B) c) P( A  B)

d) P ( B  A) e) P(A / B)

Solución:

P(A) = 0.6 P(B) = 0.5

P(A È B) = 0.85
0.25 0.25
P(A - B) 0.35
P(B - A)

P(A Ç B)

P(A È B) = 0.15

a) P(B) = 1 - P(B)
P(B) = 1 - 0.5
P(B) = 0.5

b)
P(A - B) = P(A) - P(A Ç B)
P(A - B) = 0.6 - 0.25
P(A - B) = 0.35

____________________________________________ 103
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

c) P(A È B) = P(A) + P(B) - P(A Ç B)


P(A È B) = 0.6 + 0.5 - 0.25
P(A È B) = 0.85

d) P(B È A) = P(A È B)
P(A È B) = 1 - P(A È B)
P(A È B) = 1 - 0.85
P(A È B) = 0.15

e) P(A Ç B)
P(A / B) =
P(B)

0.25
P(A / B) =
0.5

P(A / B) = 0.50

Ejemplo 66:
Si P(A) = 1/5 y P(B) = 1/4 y los eventos A y B son independientes, hallar:

a) P(A Ç B) b) P( A  B) c) P(A / B)

d) P(B - A) e) P ( A  B)

____________________________________________ 104
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución:

P(A) = 0.2 P(B) = 0.25

P(A È B) = 0.45
0.05 0.20
P(A - B) 0.15
P(B - A)

P(A Ç B)

P(A È B) = 0.55

a) P(A Ç B) = P(A) ´ P(B)


P(A Ç B) = 0.2 ´ 0.25
P(A Ç B) = 0.05

b) P(A È B) = 1 - P(A È B)
P(A È B) = 1 - 0.45
P(A È B) = 0.55

c) P(A Ç B)
P(A / B) =
P(B)

0.05
P(A / B) =
0.25

P(A / B) = 0.20

____________________________________________ 105
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

d)
P(B - A) = P(B) - P(A Ç B)
P(B - A) = 0.25 - 0.05
P(B - A) = 0.20

e)
P(A Ç B) = P(A È B) = 1 - P(A È B)
P(A È B) = 1 - 0.45
P(A È B) = 0.55

Ejemplo 67:
En la Escuela de Administración de Empresas, 3 de 4 estudiantes saben informática,
el 50% saben manejar Windows y el 30% saben manejar Linux.
a) ¿Que porcentaje saben manejar los dos sistemas?
b) ¿Que porcentaje sabe manejar solamente Windows?
c) ¿Que porcentaje sabe manejar solamente Linux?
d) ¿Que porcentaje no saben informática?

Solución:

Análisis:
i) Se sabe que 3 de 4 estudiantes saben informatica, lo que quiere decir que:
P(A È B) = 0.75

ii) Entonces 1 de 4 estudiantes no saben informática, lo que quiere decir:

P(A È B) = 0.25

iii) El 50% saben manejar windows, lo que quiere decir:


P(A) = 0.5

iii) El 30% saben manejar linux, lo que quiere decir:


P(B) = 0.3

____________________________________________ 106
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

iv) ¿Cuántos manejan ambos programas?


P(A Ç B) = ?

Sabemos que:
P(A Ç B) = P(A) + P(B) - P(A È B)
P(A Ç B) = 0.5 + 0.3 - 0.75
P(A Ç B) = 0.05

P(A) = 0.5 P(B) = 0.3

P(A È B) = 0.75

P(A - B) 0.45
0.05 0.25
P(B - A)

P(A Ç B)

P(A È B) = 0.25

a) P(A Ç B) = P(A) + P(B) - P(A È B)


P(A Ç B) = 0.5 + 0.3 - 0.75
P(A Ç B) = 0.05

El 5% de los estudiantes saben manejar los dos sistemas.

b) P(A - B) = P(A) - P(A Ç B)


P(A - B) = 0.5 - 0.05
P(A - B) = 0.45

El 45% de los estudiantes saben manejar solamente windows.

c) P(B - A) = P(B) - P(A Ç B)


P(B - A) = 0.3 - 0.05
P(B - A) = 0.25

____________________________________________ 107
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

El 25% de los estudiantes saben manejar solamente linux.

d) P(A È B) = 0.25

El 25% de los estudiantes no saben informática.

Ejemplo 68:
El 40% de las empresas de una ciudad realizan su publicidad a través de la TV. el
20% a través de Internet y el 15% en ambos medios de comunicación.
a) ¿Cuál es la probabilidad que una empresa realice su publicidad en al menos uno
de los medios de comunicación?
b) ¿Cuál es la probabililidad de que una empresa haga su publicidad solamente en
la TV.?
c) ¿Cuál es la probabilidad de que una empresa no realice publicidad en ninguno de
los medios de comunicación?
d) ¿Son los dos eventos mutuamente excluyentes?
e) ¿Son los dos eventos independientes estadísticamente?
f) ¿Son los eventos colectivamente exhaustivos?

Solución:

Sean los eventos:


A : La empresas realizan su publicidad en la TV.
P(A) = 0.4
B : La empresas realizan su publicidad por Internet.
P(B) = 0.2
AB : La empresas realizan su publicidad en ambos medios de
comunicación.
P(AB) = 0.15

____________________________________________ 108
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

P(A) = 0.4 P(B) = 0.2

P(A È B) = 0.45

P(A - B) 0.25
0.15 0.05
P(B - A)

P(A Ç B)

P(A È B) = 0.55

a) P(A È B) = P(A) + P(B) - P(A Ç B)


P(A È B) = 0.4 + 0.2 - 0.15
P(A È B) = 0.45

b) P(A - B) = P(A) - P(A Ç B)


P(A - B) = 0.4 - 0.15
P(A - B) = 0.25

c) P(A È B) = 1 - P(A È B)
P(A È B) = 1 - 0.45
P(A È B) = 0.55

d) Para que los eventos sean mutuamente excluyentes se debe cumplir lo siguiente:

P(A Ç B) = 0

pero

P(A Ç B) = 0.15 ¹ 0

____________________________________________ 109
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

e) Para que los eventos sean independientes estadísticamente se debe cumplir lo


siguiente:
P(A Ç B) = P(A) ´ P(B)
P(A Ç B) = 0.4 ´ 0.2
P(A Ç B) = 0.08

pero

P(A Ç B) = 0.15 ¹ 0.08

P(A Ç B) = 0.05

Por lo tanto los eventos no son independientes estadísticamente.

f) Para que los eventos sean colectivamente exhautivos:


AÈB = W
pero
W = A È B È (A È B)
por lo tan to :
AÈB ¹ W

Los eventos A y B no son colectivamente exhautivos.

Ejemplo 69:

Se sabe que la probabilidad de que una persona viaje al Perú en la linea aérea
TACA es de 0.7 y de que viaje en la linea aérea STARPERU de 0.5. (Eventos
Independientes).
a) ¿Cuál es la probabilidad de que una persona viaje al Perú en ambas líneas
aéreas.
b) ¿Cuál es la probabilidad de que una persona viaje solo en la linea aérea TACA.
c) ¿Cuál es la probabilidad de una persona viaje en al menos una de las líneas
aéreas?

Solución:

____________________________________________ 110
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Sean los eventos:


A : Las personas viajan al Perú en la linea aérea TACA.
P(A) = 0.7
B : Las personas viajan al Perú en la linea aérea STARPERU.
P(B) = 0.5
AB : Las personas viajan al Perú en ambas lineas aéreas.
P(AB) = 0.35

P(A) = 0.7 P(B) = 0.5

P(A È B) = 0.85

P(A - B) 0.35
0.35 0.05
P(B - A)

P(A Ç B)

P(A È B) = 0.15

a) P(A Ç B) = P(A) ´ P(B)


P(A Ç B) = 0.7 ´ 0.5
P(A Ç B) = 0.35

b) P(A - B) = P(A) - P(A Ç B)


P(A - B) = 0.7 - 0.35
P(A - B) = 0.35

c) P(A È B) = P(A) + P(B) - P(A Ç B)


P(A È B) = 0.7 + 0.5 - 0.35
P(A È B) = 0.85

____________________________________________ 111
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

4.10. TABLAS DE PROBABILIDAD

4.10.1. DEFINICIÓN.- Son aquellas que se obtienen a través de las tablas de


contingencia aplicando los criterios dados.

La siguiente Tabla N° 34 de probabilidades muestra las probabilidades conjuntas y


marginales para una Tabla de Contingencia de manera general:

Tabla N° 34
P(Bj) P(B1) P(B2) ...... P(BK) Total
P(Ai)
P(A1) P(A1B1) P(A1B1) ...... P(A1BK) P(A1)
P(A2) P(A2B1) P(A2B2) ...... P(A2BK) P(A2)
. . . . . .
. . . . . .
. . . . .
.
P(Ar) P(ArB1) P(ArB2) ...... P(ArBK) P(Ar)
Total P(B1) P(B2) ...... P(BK) 1

Ejemplo 70:
Se llevó acabo una encuesta con respecto a la preferencia del consumidor respecto
a tres marcas competitivas de computadoras (A, B y C) y la modalidad de Speedy
para el uso del Internet en su hogar, los resultados se muestran en la siguiente tabla:

Tabla N° 35
MODALIDAD SPEEDY
MARCA DE SPEEDY 200 SPEEDY 400 SPEEDY 600
COMPUTADORA TOTAL
A 100 200 300 600
B 300 250 400 950
C 200 300 450 950
TOTAL 600 750 1150 2500

Si se elige un consumidor al azar, calcular la probabilidad de que

a) Prefieran la modalidad Speedy 400.


b) Prefiere la computadora de marca A.
c) Prefiera computadora de marca B y la modalidad Speedy 600.

____________________________________________ 112
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

d) Prefiera la computadora de marca C, si la modalidad Speedy 200


e) Prefieran la modalidad Speedy 200, si la computadora es de marca A.
f) Prefiera la computadora de la marca A o B.
Solución:
Tabla N° 36
MARCA DE MODALIDAD SPEEDY
P(200) P(400) P(600) TOTAL
COMPUT.
P(A) 100/2500=0.04 200/2500=0.08 300/2500=0.12 600/2500=0.24
P(B) 300/2500=0.24 250/2500=0.12 400/2500=0.16 950/2500=038
P(C) 200/2500=0.08 300/2500=012 450/2500=0.18 950/2500=0.38
TOTAL 600/2500=0.24 750/2500=0.30 1150/2500=0.46 1.00

a) P(400)=0.30
El 30% de los consumidores prefieren la modalidad Speedy 400.

b) P(A)=0.24
El 24% de los consumidores prefieren la computadora de la marca A.

c) P(B600)=0.16
El 16% de los consumidores prefieren la computadora de la marca B y la
modalidad Speedy 600.

P(C  200) 0.08


d) P(C / 200)    0.33
P(200) 0.24
El 33% de los consumidores que prefieren la modalidad Speedy 200, prefieren la
computadora la computadora de la marca C.

P( 200  A) 0.04
e) P(200 / A)    0.17
P( A ) 0.24
El 17% de los consumidores que prefieren la computadora de la marca A
prefieren la modalidad Speedy 200.

f) P(A  B)  P(A)  P(B)  0.24  0.38  0.62


El 62% de los consumidores prefieren la computadora de la marca A o marca B.

____________________________________________ 113
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Ejemplo 71:
Una empresa que fabrica cámaras de video produce un modelo básico y un modelo
de lujo. El año pasado, 40% de las cámaras vendidas han sido del modelo básico.
De los compradores del modelo básico, 35% compran una garantía ampliada,
mientras que 50% de los compradores de lujo también lo hacen así.
Se pide:
11. Construir la tabla de probabilidad.
12. Si elige un comprador al azar, calcular la probabilidad de que:
b.1) Tenga una cámara de video de un modelo de lujo.
b.2) Tenga una cámara de video de un modelo de lujo, si tiene una garantía
ampliada.
b.3) Tenga una cámara de video de un modelo de básico y compre una garantía
ampliada.
b.4) Compre una garantía ampliada, si la cámara de video es de modelo de lujo.

Solución:
a) Construyendo la tabla de probabilidad:

B: El comprador compra una cámara de video de modelo básico.


P(B)=0.40
L: El comprador compra una cámara de video de modelo de lujo.
P(L)=0.60
A: El comprador compra una garantía ampliada.
A : El comprador no compra una garantía ampliada.
Además
i) P(A / B) = 0.35

P(A Ç B)
P(A / B) =
P(B)

Entonces :

P(A Ç B) = P(B) ´ P(A / B)

P(A Ç B) = 0.40 ´ 0.35

P(A Ç B) = 0.14

____________________________________________ 114
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

ii)
P(A / L) = 0.50

P(A Ç L)
P(A / L) =
P(L)

Entonces :

P(A Ç L) = P(L) ´ P(A / L)

P(A Ç L) = 0.60 ´ 0.50

P(A Ç L) = 0.30

A través de las operaciones realizadas se obtiene la siguiente tabla de probabildad:


Tabla N° 37
Modelo
Garantía P(B) P(L) Total
P(A) 0.14 0.30 0.44
P( A ) 0.26 0.30 0.56
Total 0.40 0.60 1.00

b) Hallando las probabilidades de los eventos dados:

b.1.)
P(L) = 0.60

El 60% de los compradores tienen una cámara de lujo.

b.2.) P(L Ç A)
P(L / A) =
P(A)

0.30
P(L / A) = = 0.68
0.44

____________________________________________ 115
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

El 68% de los compradores que compran una garantía ampliada tiene una
cámara de video de lujo.

b.3.) P(L Ç A) = 0.30

El 30% de los compradores compran una garantía ampliada y tienen una cámara
de video de lujo.

b.4.) P(A Ç L)
P(A / L) =
P(L)

0.30
P(A / L) = = 0.50
0.60
El 50% de los compradores que tienen una cámara de video de lujo, han
comprado una garantía ampliada.

Ejemplo 72:
La siguiente tabla corresponde a 1000 turistas peruanos según la forma de pago
que acostumbran en sus viajes de vacaciones y el tipo de ciudad que eligieron para
pasar sus vacaciones:
Tabla N ° 38
Forma de Pago Ciudad
Cuzco Huaraz Total
Efectivo 200 150 350
Tarjeta crédito 300 200 500
Cheques de viajero 100 50 150
Total 600 400 1000

a) Construya la tabla de probabilidad.


b) Si se elige un turista al azar calcular la probabilidad de que :
b.1) Pague en efectivo y elija la ciudad del Cuzco para viajar.
b.2) Elija viajar al Cuzco.
b.3) Pague con tarjeta de crédito.
b.4) Pague con tarjeta de crédito, si elige viajar a Huaraz.
b.5) No viaje al Cuzco, ni pague en efectivo.

____________________________________________ 116
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Solución:
a) Construyendo la tabla de probabilidad:
Tabla N° 39
Forma de Pago Ciudad
P(B1) P(B2) Total
P(A1) 0.20 0.15 0.35
P(A2) 0.30 0.20 0.50
P(A3) 0.10 0.05 0.15
Total 0.60 0.40 1.00

b)

b.1)
P(A1 Ç B1 ) = 0.20

El 20% de los turistas pagan en efectivo y eligen la ciudad del Cuzco para viajar.

b.2)
P(B1 ) = 0.60
El 60% de los turistas eligen la ciudad del Cuzco para viajar.

b.3)
P(A 2 ) = 0.50

El 50% de los turistas pagan con tarjeta de crédito.

b.4)
P(A 2 Ç B2 )
P(A 2 / B2 ) =
P(B2 )

0.20
P(A 2 / B2 ) =
0.40

P(A 2 / B2 ) = 0.50

El 50% de los turistas que eligen viajar a Huaraz, pagan con tarjeta de crédito.

____________________________________________ 117
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

b.5)
P(B1 Ç A1 ) = P(A 2 Ç B 2 ) + P(A 3 Ç B 2 )

P(B1 Ç A1 ) = 0.20 + 0.05

P(B1 Ç A1 ) = 0.25

El 25% de los turistas no viajan al Cuzco, ni pagan en efectivo.

Ejemplo 73:

El 35% de los créditos de un banco es para vivienda, el 50% para industrias y el


15% para consumo diverso. Resultan fallidos el 20% de los créditos para vivienda,
el 15% de los créditos para industrias y el 70% para créditos para consumo.

a) Construir la tabla de probabilidad.


b) Si se elige un crédito al azar, calcular la probabilidad de que:
b.1) resulte exitoso y sea para vivienda.
b.2) resulte exitoso, si es para industria.
b.3) resultoso exitoso.
b.4) sea para vivienda o industria

Solución:

Determinado los eventos:

V: Los crédito son para vivienda. P(V) = 0.50

I: Los créditos son para industria. P(I) = 0.35

C: Los créditos son para consumo diverso. P(C) = 0.15

E: Los créditos son éxitosos. P(E) = ?

F : Los créditos son fallidos. P(F) = ?

Además:

____________________________________________ 118
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

i) Resultan fallidos el 20% de los créditos para vivienda:

P(F / V) = 0.2

Entonces :

P(F Ç V)
P(F / V) =
P(V)

P(F Ç V)
0.2 =
0.35

P(F Ç V) = 0.07

ii) Resultan fallidos el 15% de los créditos para industria:

P(F / I) = 0.15

Entonces :

P(F Ç I)
P(F / I) =
P(I)

P(F Ç I)
0.15 =
0.5

P(F Ç I) = 0.075

iii) Resultan fallidos el 70% de los créditos para consumo diverso:

____________________________________________ 119
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

P(F / C) = 0.7

Entonces :

P(F Ç C)
P(F / C) =
P(C)

P(F Ç C)
0.7 =
0.15

P(F Ç V) = 0.105

a) Construyendo la tabla de probabilidad:


Tabla N° 39
Resultado de Tipo de crédito
crédito Total
P(V) P(I) P(C)
P(E) P(E∩V)=0.28 P(E∩I)=0.425 P(E∩C)=0.045 0.75
P(F) P(F∩V)=0.07 P(F∩I)=0.075 P(F∩C)=0.105 0.25
Total 0.35 0.50 0.15 1.00

b)
b.1) P(E Ç V) = 0.28

b.2) P(E Ç V)
P(E / V) =
P(V)

0.28
P(E / V) =
0.35

P(E / V) = 0.8

b.3) P(E) = 0.75

____________________________________________ 120
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

b.4) P(V È I) = P(V) + P(I)


P(V È I) = 0.35 = 0.50
P(V È I) = 0.85

AUTOEVALUACIÓN 04

1. Si P(A)= 0.3, P(B) = 074 ; Sabiendo que A y B son independientes.

Calcular:
a) P( A È B ) b) P( A - B ) c) P( B ) d) P( B / A )

2. La clase de estadística tiene 35 estudiantes. 20 cursan la clase de matemáticas, 18 cur-


san la clase de economía y 10 cursan ambas materias. Encuentre la probabilidad de que, al
seleccionar un estudiante al azar, el estudiante:
a) Curse economía o matemáticas.
b) Ni curse matemáticas ni curse economía.
c) Curse economía pero no matemáticas.
d) Curse economía o matemáticas pero no ambas.

3. Hay 1000 trabajadores en la empresa Kiddie Carts International, de esos 770 son de pro-
ducción, 20 son supervisores, 100 son secretarias y el resto son administrativos Suponga
que se selecciona un trabajador de ese grupo, calcular la probabilidad de:

a) Sea de producción.
b) No sea secretaria.
c) Sea secretaria o administrativo.
d) No sea de producción, ni supervisor.

4. Una bolsa tiene 20 fichas numeradas del 1 al 20. Si se saca una al azar ¿Cuál es la pro-
babilidad de que la ficha extraída tenga un número que sea múltiplo de 4.

5. Se realizó una encuesta a 1200 personas según sexo en la ciudad de Chimbote para
conocer el uso del vehículo a favor de mejorar el medio ambiente

USO DE SEXO Total


VEHICULO
MASCULINO FEMENINO
Renunciar 200 100 300
Reducir 300 400 700
No haría caso 150 50 200
Total 650 550 1200

____________________________________________ 121
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA

Se pide:
a) Construir la tabla de probabilidad.
b) Si se elige una persona al azar calcular la probabilidad de que :
b.1) Sea de sexo femenino y reducir el uso del vehículo.
b.2) Renuncie al uso del vehículo, si es de sexo femenino.
b.3) Que no haga caso al uso del vehículo.
b.4) Que no renuncien al uso del vehículo, ni sean de sexo femenino.

6) El 20% de los empleados de una empresa son ingenieros y el otro 20% son economistas.
El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también,
mientras los que no son ingenieros ni economistas solamente el 20% ocupan un puesto
directivo. Se pide:
a) Construir la tabla de probabilidad.
b) Si se elige un empleado al azar calcular la probabilidad de que:
b.1) No sea directivo.
b.2) No sea economista, ni directivo.
b.3) Sea directivo, si es ingeniero.
b.4) que no sea ingeniero.

7. Determine el enfoque de probabilidad en los siguientes enunciados:

a) La probabilidad de obtener un número par en 10 fichas numeradas del 1 al 10 es 0.5.

…………………………………………

b) La probabilidad de que ocurrencia de femicidio en nuestro país va en aumento.

…………………………………………

5. REFERENCIAS BIBLIOGRÁFICAS
· Barreto, C.R, (2007). Estadística Básica – Aplicaciones (2da. Ed.), Edit. SUA
Uladech. Chimbote – Perú.
· Córdova, M. (2002). Estadística Inferencial (4ta. Ed.). Edit. Moshera. Lima – Perú.
· Behar, R. (2006). 55 respuestas a dudas típicas de estadística. Obtenido de
http://site.ebrary.com/lib/bibliocauladechsp/docDetail.action?
docID=10135772&p00=estadistica
· De la Puente, V. (2009). Estadística descriptiva e inferencial y una introducción al
método científico. Obtenido de
http://site.ebrary.com/lib/bibliocauladechsp/docDetail.action?
docID=10378624&p00=estadistica.
• Ruiz, D. (s.f). Manual de Estadística. Recuperado de
http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm.

____________________________________________ 122
Elaborado por : Mg. Carmen Barreto R.
Fecha : Julio 2013
Versión :3

También podría gustarte