Está en la página 1de 46

-

CAPITULO I
ESTADSTICA DESCRIPTIVA.
1.1 Definicin de La Estadstica.
Definimos la estadstica, como la ciencia que nos proporciona un conjunto de mtodos, tcnicas o
procedimientos mediante las cuales se recopilan, organizan (clasifican, agrupan), representan y
analizan datos. A partir de este anlisis se extraen conclusiones que sirven de base para tomar
decisiones.
1.2 Estadstica descriptiva y estadstica inferencial.
Los administradores aplican algunas tcnicas estadstica a virtualmente todas las ramas de las
empresas pblicas y privadas. Estas tcnicas son tan diversas que los estadsticos, por lo general,
la dividen en dos grandes categoras: estadstica descriptiva y estadstica inferencial.
La estadstica descriptiva incluye las tcnicas que se relacionan con el resumen en y la descripcin
de datos numricos. Estos mtodos pueden, ser tablas (o grficos) o pueden, incluir anlisis
mediante clculos de determinadas medidas estadsticas, como: medidas de posicin, medidas de
variabilidad e ndices.
La inferencia estadstica comprende aquellas tcnicas por medio de las cuales se toman
decisiones sobre un universo basados en una muestra. Debido a que esas decisiones se toman en
condiciones de incertidumbre, se requiere el uso de conceptos de probabilidad. Considerando que
las caractersticas medidas en una muestra se denominan estadsticas mustrales, las
caractersticas medidas en un universo se llaman parmetros poblaciones. El proceso de medir las
caractersticas de todos los miembros de un universo definido recibe el nombre de censo.
1.3.- Poblacin y muestra.
Universo.
Se denomina universo, a un conjunto de elementos (que consiste de personas, objetos, etc. ) que
contienen una o ms caractersticas observables de naturaleza cualitativa o cuantitativa que se
pueden medir en ellos.
Unidad elemental o unidad estadstica.
A cada elemento de un universo se denomina unidad elemental.
Por ejemplo, los empleados de una empresa en un da laborable, constituyen un Universo en la
que cada empleado (unidad estadstica), tiene muchas caractersticas a ser observadas, como por
ejemplo: sexo, estado civil, lugar de procedencia, grado de instruccin, etc. (caracterstica
cualitativa), o nmero de hijos, ingresos mensuales, etc. (caracterstica cuantitativas).
El resultado de medir una caracterstica observable de una unidad elemental, se denomina dato
estadstico o valor observado o simplemente observacin.
Poblacin.
Por otra parte, el universo viene definido por la investigacin estadstica a realizarse. Y como la
medicin de la caracterstica especificada por la investigacin se hace a cada unidad elemental, se
puede considerar a la poblacin como la totalidad de valores posibles de una caracterstica
particular especificada por la investigacin estadstica.
Parmetro.
Se denomina parmetro a una medida descriptiva que resume una caracterstica de la poblacin,
tal como la media () o la varianza (
2
), calculada a partir de los datos observados de toda la
poblacin.
Muestra
Es una parte extrada de la poblacin, con el fin de obtener informacin acerca de la poblacin de
la cual proviene. La muestra debe ser seleccionada de manera que sea representativa de la
poblacin.
Estadstica o estadgrafo:
Es una medida descriptiva que resume una caracterstica de la muestra, tal como la media ( X ) o
la varianza (S
2
) calculada a partir de los datos observados de una muestra aleatoria.
1.4. Variables estadsticas.
Una variable estadstica es una caracterstica de la poblacin que interesa y que puede tomar
diferentes valores. Las variables estadsticas generalmente se denotan con las letras X, Y, Z, etc.
Las variables se pueden clasificar de la forma siguiente:
1.4.1. Variable Cuantitativa.- son aquellas variables que se obtienen como resultado de
mediciones y conteos. Son variables cuantitativas: el peso de las personas, temperatura, la presin
sangunea, el salario mensual, el nmero de personas por hogar, el nmero de piezas
ensambladas que se han encontrado defectuosos.
Las variables cuantitativas se clasifican en Discretas y continuas.
a) Una variable discreta slo puede tener valores observados en puntos aislados a lo largo
de la escala. En la estadstica de negocios, esa informacin suele presentarse a travs del
proceso de conteo; de ah que los valores se expresen generalmente como nmeros
enteros. Como ejemplo de datos discretos se cita el nmero de personas por hogar, las
unidades de un articulo en inventario, la asistencia a la reunin anual de una determinada
compaa y el nmero de componentes ensamblados que se han encontrado defectuosos.
b) Una variable continua puede tomar cualquier valor en un intervalo especificado. Los datos
continuos se generan por el proceso de medicin. Ejemplo de datos continuos son el
salario, el peso de un embarque, la presin sangunea, el tiempo transcurrido antes de que
falle un dispositivo y el nmero promedio de personas por hogar en una comunidad
grande.
1.4.2. Variable Cualitativa.- Son variables cuyos valores consisten en categoras de
clasificacin, o sea se refiere a la cualidad que presenta la poblacin, que no lleva clasificacin
numrica. Por ejemplo, la variable "estado civil" puede adoptar las modalidades: soltero, casado,
divorciado, viudo, etc. Tambin son ejemplos de variables cualitativas, "clase social" con las
posibles modalidades: bajo, medio alto; "partidos polticos" con las posibles modalidades:
conservador, liberal, independiente y socialista.
1.5. Obtencin de datos a travs experimentos y encuestas.
Una manera de obtener datos es a travs de la observacin directa. Un experimento estadstico es
una forma de observacin directa en la que se controlan algunos o todos los factores que pueden
influir sobre la variable que se estudia.
En algunas situaciones, no es posible obtener datos en forma directa, sino que, ms bien, la
informacin debe obtenerse a partir de respuestas individuales. Una encuesta estadstica es el
proceso de recopilar datos pidiendo a personas que proporcionen informacin. Los datos pueden
obtenerse con mtodos como la entrevista personal o telefnica, o travs de un cuestionario
escrito.
1.5.1. Mtodos de muestreo aleatorio.
El muestreo aleatorio es aqul en el que cada uno de los elementos de la poblacin a estudiar, o
poblacin objetivo, como se le conoce tiene una probabilidad conocida, y frecuentemente igual, de
ser elegido para la muestra. A las muestras aleatorias se les denomina tambin muestras
probabilsticas. Son cuatro los principales mtodos de muestreo aleatorio: aleatorio simple,
sistemtico, estratificado y por conglomerado.
Una muestra aleatoria simple es aqulla en la que los elementos se escogen en forma individual y
al azar de la totalidad de la poblacin. Est seleccin al azar es similar a la que se realiza en la
extraccin aleatoria de nmeros en una lotera. Sin embargo en el muestreo estadstico, por lo
general se utiliza un programa computarizado de tablas de nmeros aleatorios o un generador de
nmeros aleatorios para identificar los elementos numerados de la poblacin que se eligen para la
muestra.
Una muestra sistemtica es una muestra aleatoria en la cual se eligen los elementos de la
poblacin a intervalos uniformes, a partir de un listado ordenado, tal como elegir cada dcima
cuenta por cobrar para la muestra. La primera de las cuentas de la muestra se elegira al azar
(quizs utilizando una tabla de nmeros aleatorios).
En el muestreo estratificado, lo primero que hace es clasificar los elementos de la poblacin en
subgrupos de acuerdo con una o ms caractersticas importantes. Despus, se obtiene por
separado una muestra aleatoria simple o sistemtica de cada estrato. Puede utilizarse este tipo de
muestreo para asegurar una representacin proporcional de diversos subgrupos en la muestra.
El muestreo por conglomerado es un tipo de muestreo aleatorio en el que los elementos de la
poblacin se dividen en forma en natural en subgrupos. As, se eligen al azar los subgrupos que
forman la muestra.
1.6. Presentacin de los datos.
Despus de obtener un conjunto de datos, es necesario presentarlos en forma tal, que facilite su
compresin y su posterior anlisis y utilizacin. No servir de nada que estas medidas se
presenten en un simple listado. Lo mejor ser ordenarlos en tablas o cuadros y luego representarlo
en grficos.
Si se tienen pocos datos, y estos son valores discretos, entonces conviene presentar una
distribucin de frecuencias sin intervalos; pero si se tiene valores continuos o muchos valores
discretos, conviene presentar una distribucin de frecuencia por intervalos.
1.6.1. Distribucin de frecuencias sin intervalos:
Supngase que ante la pregunta del numero de hijos por familia (variable X) una muestra de 20
hogares, marc las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2, 3, 4 que se
repiten respectivamente 1, 4, 7, 6,2 veces. La distribucin de frecuencias de X se da en la tabla 1.1
Tabla 1.1.- Distribucin de frecuencias del nmero de hijos por familia.
Nmero de Frecuencias Frecuencias Frecuencias
hijos Absolutas Relativas Porcentajes
Xi ni hi hi (%)
O 1 0.05 5
1 4 0.20 20
2 7 0.35 35.
3 6 0.30 30
4 2 0.10 10
Total 20 1.00 100
Fuente.- datos obtenidos de los formularios de la encuesta.
Grfica.
La representacin grfica ms comn para este tipo distribucin de frecuencias es el diagrama de
barras que consiste en trazar en cada valor distinto de la variable, segmentos de lneas
proporcionales a su frecuencia.
Nmero de hijos por familia
Figura 1.1. Diagrama de barras para los datos de la tabla 1.1.
1.5.2. Distribucin de frecuencias por intervalos.








N

m
e
r
o

d
e

f
a
m
i
l
i
a
s
8
6
4
2
0
0 1 2 3 4
Numero de Hijos
La distribucin de frecuencia por intervalos o clases se usa cuando la variable estadstica es
contina o cuando el nmero de valores distintos de una variable discreta es grande.
Elaboracin de las tablas de frecuencias.
Para esclarecer la construccin de la tabla de frecuencias para datos agrupados en intervalos de
clase, desarrollaremos un ejemplo, tomando como datos las observaciones del nmero de
pasajeros a bordo de 50 autobuses cuando salen del terminal terrestre de castilla a los distintos
distritos de la provincia de Piura. Los autobuses tienen 55 asientos cada uno y los pasajeros
adicionales deben viajar de pie.
56 42 59 50 38 46 45 49 57 48 47 53 48 39 55 51 50 51 64 48 45 40 56 51 52
46 51 47 48 31 49 42 54 50 51 47 56 46 53 58 41 50 49 52 48 55 45 35 36 43.
Se pide representar los datos en una tabla de frecuencias.
Solucin
1. Debemos de determinar el rango (R) de variacin de los datos que se define
por:
R = Xmax - Xmin
En nuestro ejemplo, tenemos:
Valor mnimo Xmin = 31 Valor mximo Xmax = 64
Luego el rango es R = 64 31 = 33
2. Tenemos que calcular Cuntas clases deben formarse?.- para eso se usa la frmula de
Sturges:
K = 1 + 3.322 log n
Donde: K=nmero de clases
n=nmero de elementos en la muestra (tamaa de la muestra).
Est formula es muy til porque orienta el principiante. Sin embargo, es un poco conservador y
tiende a dar un nmero de clases un poco menor del que se utiliza en la practica.
En nuestro ejemplo. K = ?
n = 50
Aplicando la frmula tenemos:
K = 1 + 3.322 log 50 = 6.644
Redondeando al entero inmediato mayor por que, como ya se indico, la formula es un poco
conservadora, obtenemos:
K=7
Nota.-por razones extradas de la prctica, se adoptan los siguientes lmites para K
5 K 15
3. La idea es resumir los valores con el fin de percibir algunas caractersticas o propiedades de los
datos que no aparecen a simple vista. Para esto vamos a clasificar los 50 autobuses en 7 clases,
de acuerdo con la frmula de Sturges.
La amplitud de cada intervalo de clase que representamos con la letra c, se obtiene por medio de
la frmula
Aplicando los datos a la frmula anterior, se tiene:
Redondeamos a 5.
Luego c=5 y por tanto, el nuevo recorrido ser: R

= C x K = 5x7 = 35
4. Teniendo en cuenta que este recorrido es mayor que el recorrido original, buscamos el exceso:
Exceso = 35 32= 2 pasajeros
Debemos repetir este exceso a los dos extremos del recorrido original, mitad a cada lado, en este
caso 1 a cada extremo. Sumamos el nmero 1 al valor mximo: 64 + 1 = 65 y restamos el nmero
1 al valor mnimo: 31 1 = 30.
A partir de este valor 30 agregamos sucesivamente la amplitud 5 y obtenemos los puntos de
divisin que determinan los 7 intervalos (ver figura 1.2).
30 35 40 45 50 55 60 65
Figura 1.2
Sin embargo una dificultad se presenta cuando algunos de los datos coincide con cualquier de los
puntos de divisin: 35, 40, 45, 50, 55 y 60.
5. Supongamos que un dado es 35 Dnde lo colocamos?.- en el primer intervalo cuyos
extremos son 30 y 35?.- (ver la fig. 2.1) en el segundo intervalo que tiene por extremos 35 y 40?
Para aclarar est ambigedad adoptamos, el intervalo abierto por la izquierda que no incluye al
valor 30 (lmite inferior del intervalo) y cerrado por la derecha que incluye al valor 35 (lmite
superior). Este tipo de intervalo se representa matemticamente por: ( ] donde

representa el lmite inferior del intervalo y representa el lmite superior.
As en nuestro ejemplo el primer intervalo lo escribiremos como (30 -35].
Por tanto los intervalos de clase quedan definidos como:
Intervalo
de clases
(30 - 35] (35 - 40] (40 - 45] (45 - 50] (50 - 55] (55 - 60] (60 - 65]
Nota.- Tambin existen otros dos tipos de intervalos de clases, definidas como:
Intervalo semi-cerrado. Este intervalo es cerrado por la izquierda (incluye al lmite
inferior del intervalo) y abierto por la derecha (no incluye al lmite superior del intervalo).
( ] Intervalo cerrado. Este incluye a ambos lmites del intervalo.
6. Es conveniente que todos y cada uno de los datos que se hallen dentro de un mismo intervalo,
estn representados por un mismo valor. Este valor caracteriza a la clase y por eso se llama marca
de clase, se obtiene promediando los lmites de cada intervalo. Una frmula para calcular la marca
de clase de un intervalo es:
2
' '
1
i
i
Y Y
Y
i +


7. A continuacin debemos realizar la clasificacin y conteo de los datos (ver tabla 1.2), es decir,
colocar cada uno de ellos dentro de su clase, todos representados por un mismo signo: una tarja
Tabla 1.2
Intervalo de clase
( ]
Marca de clase
Yi
Conteo Frecuencia
ni
30 35 32.5
35 40 37.5
40 45 42.5
45 50 47.5
50 55 52.5
55 60 57.5
60 65 62.5
A continuacin presentamos la tabla 1.3 conocida como tabla de distribucin de frecuencias
absolutas.
Tabla 1.3 Distribucin de frecuencias de 50 autobuses segn el nmero de pasajeros a bordo.
Salida del terminal de autobuses de Piura. Enero del 2002.
Intervalo de
clase
Marca de
clase
Yi
Frecuencia
ni
Frecuencia
relativa
Frecuencia
acumulada
Frecuencia
acumulada
30 35 32.5 2 0.04 2 0.04
35 40 37.5 4 0.08 6 0.12
40 45 42.5 7 0.14 13 0.26
45 50 47.5 18 0.36 31 0.62
50 55 52.5 12 0.24 43 0.86
55 60 57.5 6 0.12 49 0.98
60 65 62.5 1 0.02 50 1.00
Total 50 1.00
Fuente.- Registro de salida del terminal de autobuses de la cuidad de Piura. 15 de Enero del 2002.
Frecuencia Absoluta: (ni)
Llamaremos frecuencia absoluta de un valor xi de la variable estadstica x, al nmero de veces
aparece repetido dicho valor en el conjunto de las observaciones realizadas.
Propiedades.- n1 + n2 + . + nk =
Frecuencia absoluta acumulada: (Ni)
La frecuencia absoluta de un valor xi de la variable x es igual a la suma de los valores inferiores o
iguales a dicho valor evidentemente. As, la frecuencia absoluta acumulada del ltimo valor ser n
(donde n = nmero de observaciones realizadas).
Ni = n1 + n2 + . + ni =
Propiedades.- Ni =Ni-1 + ni , de donde ni = Ni - Ni-1
Frecuencia relativa: (hi)
Llamaremos frecuencia relativa de un valor observando xi de la variable, al cociente entre su
frecuencia absoluta y el nmero d observaciones realizadas (n), y se denota por.
hi=
n
N
i
, 0 hi 1 , i=1,2,.,k
Propiedades.- h1 +h2 + . + hk = 1
Frecuencia relativa acumulada: (Hi)
Se llama frecuencia acumulada de un valor xi de la variable X, al cociente entre su frecuencia
absoluta acumulada y el nmero d observaciones realizadas (n), y se denota por.
H
i
=
Propiedades.- Hi = Hi-1 +hi
Interpretacin.-
n2 = 4, se significa que 4 autobuses tuvieron a bordo un nmero mayor de 35 pasajeros y menor o
igual a 40 pasajeros.
N4 = 31, significa que 31 autobuses tuvieron a bordo un nmero mayor de 30 y menor o igual que
50 pasajeros o tambin significa que 31 autobuses tuvieron a bordo un nmero menor o igual a 50
pasajeros.
h3 = 0.14, significa que el 14 % de los autobuses tuvieron a bordo nmero mayor de 40 pasajeros y
menor o igual a 45 pasajeros.
H5 = 0.86, significa que el 86% del total de autobuses tuvieron a bordo un nmero mayor que 30 y
menor o igual que 55 pasajeros, o tambin significa que 86% del total de autobuses tuvieron a
bordo un nmero menor o igual a 55 pasajeros.
N6 N2 =49 6 = 43 autobuses tuvieron a bordo un nmero mayor que 40 y menor o igual que 60
pasajeros.
Grfica de la distribucin por intervalos.
Las grficas ms usadas son: Histograma, Polgono de frecuencias y polgono de frecuencias
acumuladas u ojiva.
a) Histograma.
Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos de
clase, mediante una serie de rectngulos contiguos que tienen:
sus bases sobre un eje horizontal y cuya longitud ser igual al tamao de los intervalos de
clase.
Las alturas proporcionales a la frecuencia (absoluta o relativa).
Histograma de frecuencias del nmero de pasajeros a bordo de los autobuses
Nmero de hijos por familia








N

m
e
r
o

d

a
u
t
o
b
u
s
e
s

(
n
i
)
(
21
18

15

12

8


6

3

0
30 35 40 45 50 55 60
65
Numero de Hijos
Figura 1.3. Histograma de la distribucin del nmero de pasajeros por
autobs de la tabla 1.3
b)Polgono de frecuencia.
Cuando la variable est agrupada en intervalo de clase, el polgono de frecuencia se obtiene
uniendo los puntos medios de las bases superiores de cada rectngulo en el histograma.
Polgono de frecuencias del nmero de pasajero a bordo de los autobuses
21
18
15
12
9
6
N

m
e
r
o



d
e

b
u
s
e
s

a
u
t
o
b
u
s
e
s
3
0
27,5 32,5 37,5 42,5 47,5 52,5 57,5 62,5 67,5 Nmero de
Pasajeros
Figura 1.4. Polgono de frecuencias del nmero de pasajeros por autobs de la tabla 1.3.
c) Polgono de frecuencias acumuladas u ojivas.
Est representacin es vlida para variables estadsticas agrupadas en intervalos de clase. En el
eje de las abscisas representamos los distintos intervalos de clase que han de estar naturalmente
traslapados, En el extremo superior de cada intervalo se levanta una vertical con altura igual a la
frecuencia (absoluta o relativa) acumulada, luego se unen los extremos superiores de las verticales
con segmentos rectilneos. As el polgono de frecuencias acumuladas absolutas alcanzar su
mxima altura en el ltimo intervalo.
Polgono de frecuencias acumuladas del nmero de pasajeros a bordo por autobs
50
40
30
20
10
0
30 35 40 45 50 55 60 65
Nmero de pasajeros
Figura 1.5. Polgono de frecuencias acumuladas del nmero de pasajeros por autobs de la
tabla 1.3.
N

m
e
r
o

d
e

a
u
t
o
b
u
s
e
s
1.5.3 Distribucin de frecuencias: Variable cualitativa
Consideremos el siguiente ejemplo:
En una encuesta de opinin acerca de las preferencias de una marca de bebidas gaseosas por sus
colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas:
B,N,N,B,R,N,N,B,B,N,B,N,N,R,B,N,B,R,B,N.
Construir la distribucin de frecuencias.
Solucin.
La tabulacin de estos datos, donde la variable cualitativa es X; Color de bebida gaseosa, es la
distribucin de frecuencias de la tabla 1.4.
Tabla 1.4. Distribucin de personas por su color preferido de una marca de bebida de gaseosa
Color de
Bebida
Nmero de
Consumidores: ni
Frecuencia
relativas: hi
Frecuencias Porcentajes:
hi(%)
Blanco (B)
Negro (N)
Rojo (R)
8
9
3
0.40
0.45
0.15
40
45
15
Total 20 1.00 1.00
Fuente.- datos obtenidos de la encuesta realizada.
Grficas.
Las graficas ms comunes para la distribucin de frecuencias de variable cualitativa son la de
diagrama de barras y la de sectores circulares. En un Diagrama de rectngulos los datos de cada
una de las modalidades (caracteres cualitativos) se representa por un rectngulo vertical (u
horizontal), cuya altura (o largo) es proporcional a su frecuencia (absoluta o relativa). Los
rectngulos se dibujan dejando un espacio entre ellos.
Diagrama de rectngulos de las bebidas gaseosas de acuerdo a su color
10





































N

m
e
r
o

d
e

p
e
r
s
o
n
a
s
8
6
4
2
0
Blanco Negro Rojo
Colores de las bebidas gaseosas
Figura 1.6. Diagrama de rectngulos para los datos de la tabla 1.4
En una grfica circular, los datos de cada categora se representan por un sector circular. Es
utilizado principalmente cuando se pretende comparar cada valor de la variable con el total. Para
construir se divide el circulo en sectores, cuyas reas sern proporcionales a los valores de la
variable. Est divisin es obtenida a travs de la regla de 3 simples.
Total 360

Parte X

Diagrama de Sectores para las personas por su color preferido


Figura 1.7. Grfico circular para los datos de la tabla 1.4.
CAPITULO II
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN.
2.1.- MEDIDAS D.E TENDENCIA CENTRAL.
En el Capitulo anterior estudiamos de que manera los datos podran ser presentados en forma
compacta, comprensible mediante tablas y grficos. Sin embargo, con frecuencia necesitamos
resumir an ms para facilitar el anlisis e interpretacin de la informacin. Cuando la variable en
estudio es cuantitativa, el investigador puede estar interesado en encontrar un solo valor, que
pueda caracterizar ms ntidamente la naturaleza de los datos que se estn midiendo.
Un valor que refleja la tendencia de los datos puede darse mediante las medidas de tendencia
central o de posicin. Las ms importantes y muy usadas son: la media aritmtica o media, la
mediana, la media geomtrica y la media armnica. Tambin podemos mencionar a la moda, los
cuartiles, los percentiles, etc. Estas medidas o estadgrafos son considerados como medidas de
localizacin, puesto que sealan la localizacin de los valores ms frecuentes o de valores
extremos.
2.1.1- La Media Aritmtica.
a) Datos no agrupados.
Sea X1, X2,..., Xn valores de la variable X. La media aritmtica simple de X representada por X es
dado por:
X
= donde n: es el tamao de la muestra.
b) Datos agrupados.
Sean X1, X2,..., Xk valores de la variable X ponderada por sus respectivas frecuencias absolutas: n1,
n2,..., nk. La media aritmtica de la variable X es dado por:
n
n x
X
i
n
i
i
.
1

, donde n =

k
i
i
n
1
Ejemplo. Considerando la informacin contenida en la tabla 2.1, determinar el nmero medio de
pasajeros a bordo por autobs.
Tabla 2.1. Distribucin de frecuencia de 50 autobuses segn el nmero de pasajeros a bordo
( ]
Yi Ni Yi ni
30 35 32.5 2 65
35 40 37.5 4 150
40 45 42.5 7 297.5
45 50 47.5 18 855
50 55 52.5 12 630
55 60 57.5 6 345
60 65 62.5 1 62.5
Total 50 2405
Luego la media aritmtica de estos daos ser:
n
n y
Y
i
k
i
i
.
1

= 48.1 pasajeros por autobs


Observacin.-
Si consideramos muestras de tamao n1 + n2 +. + nr de una poblacin, a los cuales le
corresponden medias aritmticas X1, X2, , Xr respectivamente, entonces la media asociada
a la muestra de tamao n1 + n2 +. + nr est dado por:

X
= =
Donde n =
Si p1, p2,pr son los pesos o ponderaciones asociados a los valores de la variable X: x1,x2,
xr respectivamente, entonces la media aritmtica ponderada ser:
X
p
=

r
i
i
r
i
i i
p
x p
1
1
.
Ejemplo. La empresa a tiene 100 empleados, con un sueldo promedio mensual por empleado de
S/. 1500. La empresa B tiene 200 empleados con un sueldo promedio mensual de S/. 1400.
a) Cul es el sueldo promedio mensual de las dos empresas en conjunto?
b) Si a las dos empresas se agrega una tercera con 50 empleados y un sueldo promedio
mensual por empleado de S/. 1600,Cul es el sueldo promedio para las tres empresas en
conjunto ?
Solucin.-
a) nA = 100, XA = 1500, nB = 200, XB = 1400
SI XA+B es el promedio mensual de las dos empresas en conjunto,
X = = = S/. 1433.33
b) Ahora tenemos que:
300 = 1433.33, = 50 =1600
Entonces, = = 1457.14
Desventajas de la media aritmtica.
1.- La media aritmtica puede verse afectado por los valores extremos que no son representativos
de! resto de las observaciones.
2.- No se puede calcular la 'media aritmtica en las distribuciones que tienen intervalos de clase
abierto en los extremos.
2.1.2.- La Mediana.
La mediana es un valor que divide a un conjunto de observaciones ordenadas en forma
ascendente o descendente en dos grupos de igual nmero de observaciones. La notacin que
vamos a emplear ser:
X
~
= Med (X) = mediana
Calculo de la mediana
a) Datos no agrupados.
Para calcular el valor de la mediana de los dalos XI, X2,.., Xn se tendr el cuenta el siguiente
procedimiento:
1) Se ordenan los datos en forma ascendente o descendente.
2) Si n es impar, el valor de la mediana ese! valor del centro, es decir.
Me = X(n+1)/2
Donde es la posicin de la mediana
3) si n es par, el valor de la mediana va a estar dado por:
Me =
2
1 2 / 2 / +
+
n n
X X
Esto quiere decir, que el valor de la mediana se encuentra entre los valores cuya posicin
son: n/2 y (n/2+1).
Ejemplo 1.- Las siguientes cifras son los importes del consumo (en soles) de 13 personas en un
restaurante:
13,15, 20, 20, 25,35, 25, 40,44, 48, 50, 44, 30.
Determine la mediana de estos importes.
Solucin.
Ordenando la informacin en forma ascendente, tenemos:
13,15, 20, 20, 25, 30, 35,40, 44, 44, 48, 50.
Como el nmero de datos es impar (n=13), se tiene que la posicin de la mediana es:
= 7 , luego la mediana de los importes es :
X
~
= Med(x) = soles
Esto significa que el 50% de las personas (es decir, 6 de ellos) tienen un importe menor o igual
que 30 soles y el 50% restante de las personas tienen un importe mayor que 30 soles.
Ejemplo 2 - Un experto en estndares de trabajo observa el tiempo que se requiere para preparar
una muestra de 10 cartas de negocios en una oficina, y obtiene los siguientes resultados en orden
y redondeados al minuto ms prximo: 5, 5, 5, 7, 9, 14, 15, 15, 16 y 18. Determine la mediana para
este grupo de valores.
Solucin.
En este caso, n es par, por consiguiente la mediana se localiza cutre los valores centrales X5 y X6 ,
es decir, entre los valores 9 y 14. Por tanto, el valor mediano es:
Me = = 11.5 puntos
b) Datos agrupados.
En este caso el problema consiste en determinar un punto dentro del intervalo en que est
comprendida la mediana.
Procedimiento:
1 . Calcular la posicin de orden
2. Por las frecuencias acumuladas se identifica la clase que contiene a la mediana, esto es la
clase para el cual se cumple:
,
Con lo cual la mediana estar en la clase que tiene como frecuencia acumulada Ni 3. Utilizar la
frmula:
X
~
=
1
1
1
1
]
1

1
1
'
1
2
.
j
j
N
j
j
N
N
n
c X
Donde:
'
1 j
X = limite inferior de la clase que contiene a la mediana.
n = tamao de la muestra.
c = amplitud de la clase que contiene a la mediana.
Nj = frecuencia acumulada de la clase que contiene a la mediana.
Nj-1 = frecuencia acumulada de la clase inmediatamente anterior a la clase que contiene a la
mediana.
Ejemplo 3 - A partir de la distribucin de frecuencia de los 50 autobuses segn el nmero de
pasajeros a bordo (ver tabla 2.1), se pide determinar el nmero mediano de pasajeros por autobs.
Solucin.
( ]
Yi ni Ni
30 35 32.5 2 2
35 40 37.5 4 6
40 45 42.5 7 13
45 50 47.5 18 31
50 55 52.5 12 43
55 60 57.5 6 49
60 65 62.5 1 50
Total 50
1. posicin
2. Se identifica la clase que contiene a la mediana por la frecuencia acumulada, esto es, a
travs de la desigualdad.
N3 = 13 < 25 < N4 = 31
En este caso, la clase que contiene a la media es el cuarto
3. Reemplazar los datos en la forma obtenemos:
X = 45 + 5. = 48.33 pasajeros
Interpretacin.- Este valor mediano significa, que el 50% de los autobuses tuvieron a bordo un
nmero menor o igual que 48.33 pasajeros, en tanto que el otro 50% tuvieron a bordo un nmero
mayor que 48.33 pasajeros.
Ventajas de la mediana.
l. Algunas veces es un valor ms representativo de un conjunto de dalos que otros promedios (por
ejemplo, que la media aritmtica), gracias a su independencia, a sus valores extremos.
2. La mediana se puede calcular an cuando los intervalos de clase de la distribucin de
frecuencias son de lmites abiertos.
2.1.3.- Cuartiles.-
Los cuartiles son valores que dividen a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales (figura 2.1)
0% 25% 50% 75% 100%
Q
1
Q
2
Q
3

Figura 2.1
Q1= 1
er
cuartil, deja 25% de las observaciones menores o iguales a l y el 75% superior a l.
Q2= 2
do
cuartil, coincide con la mediana.
Q3= 3
er
cuartil, deja 75% de las observaciones inferiores o iguales a l y el 25% superiores a l.
Es importante notar que entre dos cuartiles se derivan de la formula utilizada para calcular la
mediana y los pasos para el clculo son los mismos.
Procedimiento:
1 . Se calcular , para r = 1,2,3.
2. Se identifica la clase que contiene a Qr por medio de las frecuencias acumuladas, esto es, por
la desigualdad:
,
3. Utilizar la formula:
Qr = r = 1,2,3.
Donde:
Xj-1 = limite inferior de Ia clase que contiene a la mediana.
n = tamao de la muestra.
c = amplitud de la clase que contiene a Qr.
Nj = frecuencia acumulada de la clase que contiene a Qr.
Nj-1 = frecuencia acumulada de la clase inmediatamente anterior a la clase que contiene a Qr.
Ejemplo. Dado la siguiente distribucin, determinar los cuartiles Q1 y Q3
( ]
Yi ni Ni
30 35 32.5 2 2
35 40 37.5 4 6
40 45 42.5 7 13
45 50 47.5 18 31
50 55 52.5 12 43
55 60 57.5 6 49
60 65 62.5 1 50
Total 50
Solucin.-
1 . = = 12.5 , = = 37.5
2. Por las frecuencias acumuladas identificamos la clase que contiene a Q1 y Q3. Como
12.5 13 = N3 , entonces el intervalo de clases que contiene a Q1 es (40 45] y
como N4 =31 = 37.5 43 = N5 , entonces el intervalo de clases que contiene a Q3 es (50 - 55].
3. Utilizar la frmula:
Q1 = = 40 + 5 [ ] = 44.64 pasajeros
Q3 = = 50 + 5 [ ] = 52.71 pasajeros
De acuerdo a estos resultados, podemos afirmar que est distribucin tenemos:
25% 25% 25% 25%
30 Q1=44.64 Q2=48.33 Q3=52.71 65
2.1.4. Percentiles.-
Son valores que dividen la muestra ordenada en forma ascendente o descendente en 100 partes
iguales.
0% 1% 2% 50% 98% 99% 100%
P1 P2 P50 P98 P99
Figura 2.2
P1= 1
er
percentil, deja 1% de las observaciones menores o iguales a l y el 99% superior a l.
P99= 99
vo
percentil, deja 99% de las observaciones menores o iguales a l y el 1% superior a l.
Las frmulas para determinar los percentiles, son parecidos a los cuartiles, as:
Pr = , r = 1,2,, 99.
Donde:
Xj-1 = lmite inferior de Ia clase que contiene a Pr = 1,2,.., 99.
n = tamao de la muestra.
c = amplitud de la clase que contiene a Pr.
Nj = frecuencia acumulada de la clase que contiene a Pr
Nj-1 = frecuencia acumulada de la clase anterior a la clase que contiene a Pr.
Ejemplo. Determinar los valores de los puntos percentiles 10 y 90, para los datos de la altura de
los alumnos de la tabla 2.1 (pgina 18).
2.1.5. La Moda.-
La moda denotada por = M0 , es un valor de la variable que tiene la ms alta frecuencia, esto
es, es el valor ms frecuente en un conjunto de datos. La moda puede no existe, incluso si existe
puede no ser nica.
Ejemplo 1.- En mes, 8 vendedores de artculos electrnicos vendieron los siguientes nmeros
de aparatos: 8, 11, 5, 14, 8, 11, 16 y 11. Considerando a este mes como a la poblacin estadstica
que interesa, el nmero modal de unidades vendidas es:
= M0 =.
Ejemplo 2.- Considere la distribucin de los pesos (en kilos) de adultos: 63, 67, 70, 69, 81, 57,
63, 73, 68, 63, 71, 71, 71, 83. La moda de estas observaciones es:
=. kilo y =. kilos
En este caso la distribucin se llamar bimodal.
Ejemplo 3.- Las notas promocinales de 7 alumnos son: 15, 16, 17, 1 4, 13, 12, 11. Estos datos
No tienen moda. Las distribuciones de este tipo se llaman uniforme.
En general, se tiene lo siguiente:
i) La distribucin que tiene una sola moda se llama unimodal.
ii) La distribucin que tiene dos modas se llama bimadal.
iii) La distribucin que tiene ms de dos modas se l1ama multimodal.
Clculo de la M oda para datos agrupados.
Para datos agrupados en intervalos de clase, aplicaremos el siguiente procedimiento para el
clculo de la moda.
1. Se identifica la clase modal (la clase con mayor frecuencia).
2. Se aplica la frmula:
=

Donde:
Xj-1 = lmite inferior de Ia clase que modal.
= frecuencia de la clase modal.
= n1 (n1= frecuencia de la clase inmediatamente anterior a la clase modal)
= n2 (n2= frecuencia de la clase inmediatamente posterior a la clase modal).
c = amplitud de la clase que contiene a la mediana.
Ejemplo. Determine la moda para la siguiente distribucin (tabla 2.1).
( ]
Yi ni
30 35 32.5 2
35 40 37.5 4
40 45 42.5 7
45 50 47.5 18
50 55 52.5 12
55 60 57.5 6
60 65 62.5 1
Total 50
Solucin.
1. El intervalo de clase de mayor frecuencia absoluta (18) es el cuarto intervalo: ( 45 - 50]
=18-7=11 =18-12=6
c=5.
2. Aplicando la formula tenemos:
= 45 48.235 pasajeros
Este valor modal significa que: el nmero de pasajeros a bordo ms frecuente en los autobuses es
de 48; o tambin que la mayora de los autobuses tienen a bordo de nmero de pasajeros igual a
48.
2.2. Relacin entre la Media, Mediana y Moda.
a) Distribuciones simtricas.
Se dice que una distribucin de frecuencia es simtrica cuando valores de la variable equidistantes
de un valor central tienen las mismas frecuencias. Es importante destacar en este caso que:
=
b) Para una distribucin sesgada hacia la derecha (si la cota mayor se presenta a la derecha de
la distribucin) se tiene que:
Para una distribucin sesgada a la izquierda tenemos:
Ejercicio. Considerando la distribucin de la tabla 2.1 (pagina 18), se pide analizar la asimetra
de la distribucin.
2.3. Medida de dispersin o de variabilidad.
Todos los valores representativos discutidos en las secciones precedentes han sido una especie
de promedio o medida de posicin. Sin embargo, el uso de un solo valor para describir una
distribucin oculta muchos fenmenos importantes. Por ejemplo, dos grupos separados de datos
pueden contener la misma media, pero un grupo puede estar ms disperso o esparcido alrededor
del valor promedio que el otro.
Par lo que es necesario una medida de la dispersin, esparcimiento o variacin para ayudar ms
completamente la distribucin. Mientras menor es la dispersin, ms tpico es el valor de la media
para toda la distribucin.
Las medidas de dispersin que se utilizan con mayor frecuencia son: la varianza la desviacin
estndar y el coeficiente de variacin.
2.3.1. La varianza.-
Definicin 1. (Para datos no agrupados). La varianza de una muestra X1, X2,,Xn de la
variable X, es dado por:
S
2
=
Definicin 2. (Para datos agrupados). La vat1anza de los valores una muestra y1, y2,..., yk de Y
con frecuencias absolutas n1., n2,..., nk respectivamente, es dado por:
V (Y) = S
2
=
Observaciones.
1. La varianza poblacional se defina en trminos de la medida poblacional , esto es:

2
=
Donde N es el tamao de la poblacin.
2. Con la finalidad de reducir el volumen de operaciones en el clculo de la varianza, podemos
usar las frmulas:
S
2
= para datos no agrupados
Y
S
2
=
1
1
1
1
1
1
1
1
]
1

,
_

k
i
k
i
n x
i i
n
n x
n
i i
1
2
1
.
2
.
1
1
para datos agrupados
2.3.2.- La desviacin Estndar.-
Definicin.- La desviacin estndar o tpica de los valores de la variable X se define como la
raz positiva de la varianza, y se denota por S = .
El valor numrico de S cuantifica el grado de dispersin de los valores de una variable con
respecto a su media. Mientras mayor es la dispersin de las observaciones, mayor es la magnitud
de sus desviaciones respecto a la media y por ende, ms alto el valor numrico de la desviacin
estndar.
Ejemplo 1.- Se determin los pesos de una muestra de cartas procesadas en una oficina postal,
pesadas hasta el gramo ms prximo, son: 21, 18, 30, 12, 14, 17, 28, 10, 16 y 25.
Determine a) la varianza y b) la desviacin estndar.
Solucin.-
a) Clculo de la varianza.
b) Aplicaremos la frmula de definicin de la varianza para datos no agrupados, donde es
la media aritmtica del conjunto de observaciones.
En efecto, tenemos que la media aritmtica es:
= = = = 19.1 gramos.
Luego aplicando frmula para varianza:
S
2
= = = 45.6555 gramos al cuadrado.
ii) aplicando el mtodo abreviado, tenemos:
= 21+18++25 = 191 y = = 4059
Luego:
S
2
= = = 45.6555
b) Clculo de la desviacin estndar.
La desviacin estndar ser la raz cuadrada del valor obtenido en la varianza, es decir:
S = = 6.7569 gramos.
Ejemplo 2. Determine la desviacin estndar de la siguiente distribucin de frecuencia dada
(tabla 2.1)
Yi ni
)
2
)
2
30 35 32.5 2 243.36 486.72
35 40 37.5 4 112.36 449.44
40 45 42.5 7 31.36 219.52
45 50 47.5 18 0.36 6.48
50 55 52.5 12 19.36 232.32
55 60 57.5 6 88.36 530.16
60 65 62.5 1 207.36 207.36
Total 50 2132
Solucin.-
a) Aplicando la frmula del a definicin.
Se sabe que la media aritmtica de est distribucin es:
= 48.1 pasajeros
Luego aplicando la frmula de definicin la varianza, tenemos:
S
2
=
( )
1
2
1

n
y y n
i
k
i
i
=
49
2132
= 43.5102 pasajeros a bordo al cuadrado
Por lo tanto la desviacin estndar es S= 6.596226 pasajeros a bordo.
b) Aplicando el mtodo abreviado
Yi ni Yi . ni Yi
2
. ni
30 35 32.5 2 65 2112.5
35 40 37.5 4 150 5625
40 45 42.5 7 297.5 12643.75
45 50 47.5 18 855 40612.5
50 55 52.5 12 630 33075
55 60 57.5 6 345 19837.5
60 65 62.5 1 62.5 3906.25
Total 50 2405 117812.5
Luego tenemos:
S
2
=
1
1
1
1
1
1
1
1
]
1

,
_

k
i
k
i
n x
i i
n
n x
n
i i
1
2
1
.
2
.
1
1
=
( )
1
]
1

2
2405
50
1
5 . 117812
49
1
=43.5102
Por lo tanto la desviacin estndar es S= 6.59622 pasajeros a bordo.
2.3.3.- Medidas de dispersin relativa.-
Las medidas de dispersin que se han descrito en la seccin anterior se expresan en las
unidades originales de medida, tales como altura, salarios, kilogramos, puntajes, etc. Se pueden
utilizar para comparar la variacin de dos distribuciones siempre que las variables se expresen en
las mismas unidades de medida y sean aproximadamente del mismo tamao promedio. Sin
embargo, a veces es necesario comparar dos o ms conjuntos de datos expresados en unidades
diferentes. Es en esta situacin que hay que utilizar una medida relativa de dispersin que seria el
coeficiente de variacin.
Definicin. El coeficiente de dispersin, es una medida de dispersin relativa de la desviacin
estndar con respecto a la media, es decir:
Coeficiente de variacin= C:V =
x
S
Generalmente el coeficiente de variacin se expresa como porcentaje. El C:V es un nmero puro
independiente de la unidad de medida.
Observacin.
Si el C:V es menor del 10% hay poca dispersin
Si el C:V oscila entre el 10% y 33% la dispersin es aceptable
Si el C:V oscila entre el 33% y 50 % hay alta dispersin
Pero si el C:V es mayor del 50% la dispersin es muy alta.
Ejemplo 1.- Calcular la dispersin relativa para los datos de la tabla 2.1
En efecto tenemos que = 48.1 y S= 6.596226, entonces el C:V es:
C:V = 100 *
1 . 48
596226 . 6
= 13.71%
Como el valor del C:V = 13.71% se encuentra entre 10% y %, indica que la dispersin es
aceptable.
Ejemplo 2.- Para 2 acciones comunes de empresa de la industria electrnica, el precio promedio
de cierre en el mercado de valores durante un mes fue, para la accin A, de $1500, con una
desviacin estndar de $500. Para la accin B, el precio promedio fue de $5000, con una
desviacin estndar de $300.
a) Efectuar una comparacin de la variabilidad absoluta de las acciones.
b) Realizar una comparacin de la variabilidad con respeto al nivel medio de los precios.
Solucin.-
a) Al hacer una comparacin absoluta, resulto ser superior la variabilidad en el precio de la
accin a debido a que muestra una mayor desviacin estndar.
b) Con respecto a la variabilidad relativa, deben compararse los respectivos coeficientes de
variacin:
C.V(A) = y C.V (B) =
Por ello, puede concluirse que el precio de la accin A ha sido casi 5 veces ms variable que el
precio de la accin B (con respecto al precio promedio para cada una de las dos)
FIN
PRACTICA DIRIGIDA I
1. Indicar el tipo de variable estadstica:
a. Distribucin de alumnos de la UAP por lugar de procedencia.
b. Distribucin de profesionales por estatura y peso.
c. Distribucin de accidentes por causa.
d. Distribucin de docentes de la UAP por sueldo.
e. Consumo de corriente (kw) mensual en un ao.
f. Estado civil, opinin pblica, lugar de nacimiento de las personas que
viven en Piura.
g. Marca y pas de procedencia de los automviles vendidos durante el ao
en el Per.
h. Tiempo de servicio de los empleados de una empresa.
i. Nmero de cheques girados diariamente en un mes.
j. Nmero de acciones comunes cada da en la Bolsa de Valores de Lima.
k. Nivel educacional y religin de las Piuranas.
l. Temperatura y humedad diaria de Lima.
m.- Nivel educacional, estatura y color ojos de las cajamarquinas
2.- Indica si es verdadero o falso los siguientes enunciados. De ser falso
argumenta tu respuesta.
Un histograma es una serie de rectngulos, cada uno proporcional en
ancho al nmero de elementos que caen dentro de una clase especifica
de datos.
Si uniramos los puntos medios de los consecutivos intervalos de un
histograma de frecuencias con una serie de rectas, estaramos graficando
un polgono de frecuencias.
Como regla general, los estadsticos consideran que una distribucin de
frecuencias est incompleta si tiene menos de veinte clases.
Siempre es posible construir un histograma a partir de un polgono de
frecuencias.
Las frecuencias absolutas son valores que admiten fracciones.
La suma de las frecuencias relativas puede ser mayor a 1.
El ltimo trmino de la frecuencia absoluta acumulada es igual a n.
3.- Qu entiende usted por:
a) Distribucin de frecuencias b)Variable discreta c)Frecuencia absoluta
d) Frecuencia relativa
4.- D contestacin a los siguientes puntos, sealando con una X si es cierto o
falso.
a) H
5
=

0.36 N
4
=

30 n
5
=

6 n

=

50
b) Para calcular las marcas de clase, se suman el lmite inferior al superior
del intervalo y se divide entre dos
c) El nmero de accidentes segn sus causas, es una variable discreta.
d)Si H
6
=

0.7 y H
4
=

0.3 un 40% de los valores de la variable es menor
que Y
6
y mayor que Y
4
e) H
5
=

1.10 H
4
=

0.80 h
5
=

0.30
f) La suma de las frecuencias absolutas es igual a 1.
5.- Las calificaciones de 60 alumnos que presentaron examen de admisin a la
facultad de educacin de la Universidad A ubicada en la ciudad de Piura
(Marzo de 2010), utilizando una escala de 0 a 100 fueron:
64 76 53 78 81 60 62 66 76 59 65 85 60 57
67
76 52 70 72 72 77 63 81 73 60 80 75 63 79 62
64 54 75 66 76 80 58 86 71 69 65 73 70 67 86
67 56 83 78 65 77 70 66 58 71 68 82 70 84 58
a) Elabore una tabla de distribucin de frecuencias.
b) Obtenga un histograma, un polgono de frecuencias.
6.- En una compaa, el sueldo mnimo y mximo de 200 empleados es de
$150 y $300 respectivamente. Tales sueldos se tabulan en una distribucin
de frecuencias de 5 intervalos de igual amplitud. Si se sabe que 20
empleados ganan al menos $150, pero menos de $180, 60 ganan menos
de $210, 110 ganan menos de $240, 180 ganan menos de $270 y el 10%
restante de empleados ganan a lo ms $300; reconstruir la distribucin y
graficar su polgono de frecuencias.
7.- La siguiente distribucin muestra el peso en gramos de 30 paquetes de un
determinado producto.
Gram
os
10 - 14 15 - 19 20 - 24 25 - 29
30 - 34
h
i
0.13 k 2k 0.17
k/2
a) Trazar un histograma de frecuencia y una ojiva menor que.
8.- En la siguiente serie de nmeros: 2000 2500 3000 3000 3250 4000
5000 6500 7500 50000
Calcule: a) La media b) La mediana c) La moda. d) Qu valor afecta la
media aritmtica?
e) Cul de las medidas estima usted ms representativa de la serie?
9.-De 500 estudiantes de secundaria, cuya estatura media es de 160.96
centmetros se divide en dos grupos, uno con una estatura media de 163.4
centmetros y otro con una de 157.3 centmetros. Cuntos estudiantes hay en
cada grupo?
10.- El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen
dos alternativas de aumento:
a) S/. 75 a cada uno, b) 15% de su sueldo ms 10 soles a cada uno.
Si la empresa dispone a lo ms de S/. 94,000 para pagar sueldos, cul
alternativa es ms conveniente?
11.- En un curso hay 35 hombres con una edad media de 17.5 aos y 15 mujeres
las que, en promedio, son 22% ms jvenes. Cul es la edad media del curso
12.- Una estacin de servicio automotriz gasta $500 en latas de aceite que cuestan
$10 la docena; $500 en latas que cuestan $12.5 la docena; $500 ms en latas
que cuestan $20 la docena y $500 en otras que cuestan $25 la docena.
a) Determinar el costo promedio por docena de las latas de aceite.
b) En promedio, cuntas docenas se compr?
13.- Completar la TDF y calcule la D.S.
[ )
s i
L L
i
X
i
f
i
F
i i
f X
i i
f X
2
30 - 15 495 16335
39 25
- 48 45 91125
51 140
54 - 175 1995 113715
63 25

14.- Hallar m+n siendo ab y ba un nmero de dos cifras
[ )
s i
L L
i
h
i
H
0.18
ab 7% m
- 13%n
- ba 0.25 0.90
-
15.- La siguiente tabla presenta los datos obtenidos de 20 ex-presos
polticos.
Identifica
cin
Edad a
la
aprensi
Nmero
de hijos
Ocupaci
n
Militancia
poltica
Instrucci
n
Meses
preso
n
1 27 1 estudiante Apra secundaria 11
2 52 3 obrero Apra primaria 23
3 34 2 empleado Unidad Nacional secundaria 5
4 23 1 estudiante izquierda secundaria 17
5 43 1 obrero Apra secundaria 23
6 23 0 obrero izquierda universitaria 12
7 37 0 desocupado Apra secundaria 8
8 44 2 docente izquierda universitaria 5
9 19 0 estudiante izquierda secundaria 4
10 27 1 docente Apra universitaria 20
11 29 1 obrero Unidad Nacional primaria 9
12 41 3 docente Apra universitaria 16
13 18 0 estudiante izquierda secundaria 1
14 17 0 estudiante
Fuerza
democrtica secundaria 1
15 51 5 obrero Unidad Nacional secundaria 3
16 32 2 obrero Apra secundaria 4
17 25 2 empleado
Fuerza
democrtica universitaria 9
18 20 1 docente Unidad Nacional secundaria 13
19 27 0 estudiante Apra secundaria 8
20 50 1 obrero Unidad Nacional Universitaria 2
a) Identifique el tipo de variable en cada uno de las variables
estudiadas.
b) Construir la matriz de datos con el Software SPSS.
c) Calcule el valor ms frecuente (moda) para cada uno de las
variables estudiadas.
16.- La tabla que se presenta a continuacin corresponde a un nmero de
personas que se encontr en una muestra tomada en 4 distritos y que son
consumidores de un producto. La tabla muestra la clasificacin por distrito
y por edad y sexo:
Edad Hombres Edad Mujeres
Distrito 20
30
30
40
40
50
20
30
30
40
40
50
Lince 15 45 32 22 18 60
Lima 50 32 28 35 44 22
Pueblo libre 15 36 45 32 60 18
Surco 40 24 14 46 45 24
a) Compare la variabilidad de las edades de los hombres y mujeres de Lince.
b) Compare la variabilidad de las edades en Lince y Pueblo Libre.
c) Compare la variabilidad de las edades de hombres y mujeres de la muestra.
d)Halle la varianza de las edades de toda la muestra
PRACTICA DIRIGIDA II
1. Dado el siguiente cuadro estadstico con ancho de clase constante igual a 20. Determine la
media de los datos.
[ )
s i
L L
i
X
i
f
i
F
i i
f X
880
1950
35 1800
13
200)
4 70
2. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nacin
reportadas aparecen en la siguiente tabla de frecuencias. Calcule e interprete la media, la
mediana y la moda. Adems, calcule e interprete: Q1, Q2, D10, D60, P15, P90.
Edades Frecuencias
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1
3. Los siguientes datos pertenecen a la distribucin de la produccin de papas (en Tn.) en 40
zonas del pas: Y1=20 f2-f5=2 Y5= 100 f1=4 f3=20. Si se sabe que la
distribucin es simtrica y presenta 5 intervalos de clase.
a) Reconstruya los intervalos de clase y obtenga las frecuencias absolutas
b) Calcule la media, la mediana y moda e interprtelos
c) Calcule la variancia, desviacin estndar y coeficiente de variabilidad
4. De las edades de cuatro personas, se sabe que la media es igual a 24 aos, la mediana es 23
y la moda es 22. Encuentre las edades de las cuatro personas.
5. En el curso de Estadstica I; se tiene las notas de los alumnos distribuidas segn el siguiente
histograma de frecuencias, entonces la nota promedio del curso es:
0
2
4
6
8
10
12
14
16
4 6 8 10 12 14
Alumnos
Notas
6. Las ganancias diarias de los establecimientos de un centro comercial se presentan en una
tabla de frecuencias con 6 intervalos de clase y se sabe que: la mnima ganancia es de $6, el
rango es 36, el promedio de ganancias diarias es $25.14, el 50% de los establecimientos
ganan ms de 25.58 dlares diarios, H2=0.15, F2=120, h3=0.25, H5=0.93, f4=304, f2=2f1.
Reconstruir la distribucin de todas las frecuencias y hallar la ganancia ms frecuente y la
ganancia promedio.
7. Dada la siguiente distribucin de frecuencias, calcular el valor de n sabiendo que la moda es
60 y pertenece al tercer intervalo
[ )
s i
L L
i
f
16 32 6
32 48 n
48 64 8
64 80 3n
80 - 96 3
8. De una muestra de tamao tres se sabe: la suma de los cubos de las tres observaciones es
1971, la media aritmtica es 7 y la mediana es 6. Calcular el valor de cada una de las
observaciones.
9. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos alternativas
de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo ms 10 soles a cada uno. Si la
empresa dispone a lo ms de S/. 94,000 para pagar sueldos, cul alternativa es ms
conveniente?.
10. Al calcular la meda de 125 datos, result 42. Un chequeo posterior mostr que en lugar del
valor 12.4 se introdujo 124. Corregir la media.
11. El siguiente cuadro muestra la distribucin de la renta anual (en miles de soles) en que
incurren 50 viviendas:
a) Halle e interprete segn el enunciado
i) Media, mediana y moda.
ii) Desviacin estndar y coeficiente de variabilidad.
b) Estime el porcentaje de viviendas con rentas superiores o iguales a 26 000 soles pero menores
que 32 000 soles.
c) Si las rentas menores que 28 300 soles se incrementaron en 2 500 soles y las rentas mayores
o iguales que 28 300 soles se redujeron en un 30%. Calcule la nueva renta promedio.
PROBLEMAS
Problema #1:Una granja ganadera registro durante febrero el nacimiento de 29 terneros,
cuyos pesos al nacer (en kilogramos) fue el siguiente:
22 31 33 34 35 36 37 38 38 39
40 40 40 41 41 42 42 42 42 42
43 43 44 45 46 46 46 46 50

Marca de Clase 18.85 21.55 24.25 26.95 29.65 32.35 35.05
N de Viviendas 3 2 7 7 11 11 9
Los datos anteriores al ser dispuestos en una tabla de distribucin de frecuencias se obtuvo
la siguiente tabla resultante.
Calcule en las dos variantes (datos no agrupados y datos agrupados) la media aritmtica, la
mediana y la moda.
Problema #2: El peso en kilogramos de un grupo de estudiantes del sexo masculino en un
curso de educacin fsica, son los siguientes:
clases f
i
21.5 26.5 1
26.5 31.5 1
31.5 36.5 4
36.5 41.5 9
41.5 46.5 13
46.5 51.5. 1
Total 29
Encuentre la media, la mediana y la Moda.
Compare los resultados utilizando la frmula
sealada anteriormente en el texto relativa a
la correspondencia entre estas tres medidas
de tendencia central.
Problema #3:SANDOVALICH ha decidido utilizar un promedio ponderado al calcular
las calificaciones finales de los estudiantes que asistieron Al curso de Mtodos Estadsticos.
El promedio de las tareas hechas en casa representan el 20% de cada calificacin, el
examen parcial, 25%; el examen final, 35%; el examen trimestral, 10% y los problemas de
practica, 10%. Con los datos anexos calcule el promedio final de los cinco estudiantes que
asistieron al seminario
Alumno Tarea escolar Problemas
Examen
trimestral
Examen
parcial
Examen
final
1 85 89 94 87 90
2 78 84 88 91 92
3 94 88 95 86 89
4 82 79 83 84 93
5 95 90 92 82 88
clases f
i
52.5 57.5 8
57.5 62.5 9
62.5 67.5 6
67.5 72.5 4
72.5 77.5 2
77.5 82.5. 1
Total 30
Problemas 04
I. Si x
1
=4; x
2
=8; x
3
=10; x
4
=12; x
5
=15; x
6
=5; x
7
=4; x
8
=14; x
9
=16 lleva a cabo las
siguientes operaciones
II. Dado que
x
1
=4; x
2
=6; x
3
=-5; x
4
=1; y
1
=2; y
2
=3; y
3
=5; y
4
=7; z
1
=3; z
2
=8; z
3
9; z
4
=10
Halla
PRACTICA DIRIGIDA DE METODOS ESTADISTICOS
Para cada uno de los siguientes datos, presente los datos utilizando la
distribucin de frecuencias adecuada, construya el histograma y la ojiva,
diagrama rectangular y pastel segn el caso, determine la media,
mediana, moda, varianza, coeficiente de variacin, determine e
interprete el tercer cuartel, el decil 8, percentil 60.
1.- Los siguientes datos muestran las observaciones del nmero de
pasajeros a bordo de 50 autobuses, cuando salen del Terminal terrestre
de castilla a los distintos distritos de la provincia de Piura. Los autobuses
tienen 55 asientos cada uno y los pasajeros adicionales deben viajar de
pie.
56 42 59 50 38 46 45 49 57 48 47 53 48 39 55 51 50
51 64 48 45 40 56 51 52 46 51 47 48 31 49 42 54 50
51 47 56 46 53 58 41 50 49 52 48 55 45 35 36 43 .
2.- En una encuesta de opinin acerca de las preferencias de una marca de
bebidas gaseosas por sus colores: Negro(N), Blanco (B), Rojo(R), 20
consumidores dieron las siguientes respuestas:
B N N B R N N B B N B N N R B N B R B N.
3.- La agencia de viaje Sandovalich, ofreces tarifas especiales en ciertas
travesas por el Caribe a ciudadanos de la tercera edad. El presidente de
la agencia quiere informacin adicional sobre las edades de las personas
que trabajan. Una muestra aleatoria de 40 clientes que hicieron un
crucero el ao pasado dio a conocer las siguientes edades:
77 18 63 84 38 54 50 59 54 56 36 26 50 34 44 41
58 58 53 51 62 43 52 53 63 62 62 65 61 52 60 60
45 66 83 71 63 58 61 71 .
4..- Los siguientes datos presenta las cantidades semanales ( en dlares)
gastadas en comestibles segn una muestra de 45 hogares.:
271 363 159 76 227 337 295 319 250 279 205 279 266
199 177 162 232 303 192 181 321 309 246 278 50 42 335
116 100 151 240 474 297 170 188 320 429 294 570 342
279 235 434 123 325
5.- Los datos siguientes representan las declaraciones trimestrales de
impuestos sobre las ventas, que 50 establecimientos comerciales de una
tienda del mercado de Piura presentaron a la SUNAT.
10.3 13.0 11.1 10.0 9.3 11.1 11.2 10.2 12.9 11.5 9.6 7.3
11.1 9.2 10.7 9.0 5.3 9.9 10.0 11.6 14.5 12.5 9.8 12.8
7.8 13.0 8.0 11.6 12.5 10.5 6.7 11.8 15.1 9.3 7.6 11.0
8.7 12.5 10.4 10.1 8.4 10.6 6.5 12.7 8.9 10.3 9.5 7.5
10.5 8.6.
SANDOVALICH,, HUGO ALEXIS

También podría gustarte