Está en la página 1de 119

ESTADISTICA.

INTRODUCCIN
La estadstica o los mtodos estadsticos, como se denomina a veces, estn
jugando un papel importante en casi todas las facetas del comportamiento
humano. Ocupada inicialmente en asuntos de Estado, y de ah su nombre, la
influencia de la Estadstica se ha extendido ahora a la agricultura, biologa,
negocios, comunicaciones, economa, y otros muchos campos de la ciencia y
la ingeniera.
El propsito de esta materia, es presentar los principios bsicos de la
Estadstica que sern de utilidad para todo tipo de calculo sea este empresarial
o personal.
Cada captulo viene con definiciones claras, junto con problemas resueltos y
suplementarios que en muchos casos se utilizan datos obtenidos en situaciones
estadsticas reales. Los problemas resueltos sirven para ilustrar y ampliar la
teora, proporcionan la oportunidad de repetir los principios bsicos, vital para
un aprendizaje eficaz.
OBJETIVOS GENERALES:
1.- Hacer que la estadstica sea ms fcil de aprender, iniciar con lo que los
estudiantes ya conocen a partir de su experiencia personal
2.- Cubrir todos los temas estadsticos para poder resolver cualquier caso ya
sea en la vida empresarial, profesional o personal.
3.- Utilizar una notacin matemtica comprensiva para los estudiantes.
4.- Se tratar en lo mximo de utilizar ejemplos del mundo real y actualizado
para as saber sobre la situacin de nuestro medio y del pas en general.
1
CAPITULO I
VARIABLES Y REPRESENTACIONES.
ESTADSTICA.-
La estadstica esta ligada por los mtodos cientficos que permiten la
toma, organizacin, recopilacin, presentacin y anlisis de datos,
tanto para la deduccin de conclusiones como para tomar decisiones
razonables de acuerdo al anlisis.
El objeto fundamental de la estadstica es presentar un fenmeno a
travs de un conjunto de datos llamados estadsticas, as se habla de
la estadstica de empleos, de salarios, de accidentes, etc.
POBLACIN Y MUESTRA.-
Poblacin o Universo: Es la recoleccin completa de todas las
observaciones: individuos, objetos o medidas de inters para el
investigador.
Muestra: Es una parte representativa de la poblacin que se selecciona
para ser estudiada ya que la poblacin es demasiado grande y
analizarla es muy costoso o demanda mucho tiempo.
Cuando se lo quiere analizar a todo un grupo, poblacin o universo se
utiliza el SISTEMA O MTODO DE CENSO y cuando se analizan las
caractersticas de un grupo menor o reducido se llama MUESTRA.
2
VARIABLES: Es una caracterstica de la poblacin que se analiza en
un estudio estadstico. Puede ser:
CUALITATIVA O ATRIBUTO si se mide de manera no numrica, por
ejemplo: el sexo de los estudiantes, la raza, el color de cabello,
etc.
a) CUANTITATIVA O NUMERICA: Si las observaciones pueden
expresarse numricamente, por ejemplo: los ingresos
salariales, las notas de los estudiantes.
Adems las variables cuantitativas pueden ser discretas y continuas:
VARIABLES DISCRETAS: Son aquellas que no permiten valores
intermedios, ejemplo: nmero de hijos, nmero de edificios
VARIABLES CONTINUAS: Son aquellas que pueden tomar
tericamente cualquier valor entre dos valores, ejemplo:
temperatura, estatura, peso, etc.
Una variable no es ms que un smbolo que representa cada caso de
un conjunto observado y que esta representado generalmente por las
ltimas letras del abecedario X, Y, Z.
EJERCICIOS DE VARIABLES
* Decir cules de los que siguen representan datos discretos y cules continuos.
a.- Centmetros de lluvia en una ciudad durante varios meses
(continua)
b.- Velocidad de un coche Km./h
(Continua)
c.- Nmero de billetes de veinte en circulacin en EE.UU. en cada momento.
(Discreta)
d.- Volumen de negocio diario en la Bolsa de Tokio
(discreta)
REDONDEO DE DATOS.-
El redondeo de datos no es ms que la aproximacin de un valor
numrico con exactitudes de miles, millones, decimales, etc. Y en
estadstica se utiliza el siguiente mecanismo para redondear datos para
una determinada exactitud presentndose tres casos:
3
1) Cuando el nmero o cantidad a redondearse es ms que 5, se
redondea al entero o cantidad que le antecede ms prximo;
ejemplo
73.8 =74 70.277 =70,28
2) Si la cantidad a redondearse es menos a 5, se elimina la
cantidad; ejemplo:
73.4 = 73 68.2 = 68
3) Cuando la cantidad a redondearse es 5, se redondea al par
ms prximo; ejemplo:
72.5 = 72 83.5 = 84
Nota: Por ser tambin el sistema que utilizan las computadoras en la
entrega de datos: USAR COMA PARA SEPARAR CENTENAS Y PUNTOS
PARA SEPARAR CIFRAS DECIMALES.
EJERCICIOS
Redondear cada nmero con la precisin indicada:
a.- 3,256 centenas 3,300
b.- 5,781 decenas 5,780
c.- 0.0045 milsimas 0.004
d.- 46.7385 centsimas 46.74
e.- 125.9995 dos cifras decimales 126.00
f.- 3,502,378 millones 4,000,000
ECUACIONES:
Probar que: a) el producto y b) el cociente de 72.48 y 5.16, supuesto que tienen cuatro y
tres dgitos significativos, respectivamente, no admiten ms de tres dgitos significativos.
Escribir los resultados con la mejor precisin posible.
a.- 72.48 x 5.16 72.48
X 5.16
43488 Respuesta a) 374
4
7248
36440
373,9968
b.- 72.48 / 5.16 72.48 |5.16
2088 14.04 Respuesta 14.0

c.- 0.36 x 781.4 = 281.304 Respuesta 280
Evaluar lo que sigue sabiendo que: U = -2, V = , W = 3, X = - 4 Y = 9, Z= 1/6, donde
todos los nmeros son exactos.
a.- 4U + 6V 2W = 4(-2) + 6 () 2 (3) = -8 + 3 6 = R= -11
b.-
uvw
xyz
=
) 3 )( 2 / 1 )( 2 (
) 6 / 1 )( 9 )( 4 (

=
3
6

= R= 2
FUNCIONES.-
Si a cada valor de una variable X le corresponde uno o ms valores de
otra variable Y, decimos que Y esta en funcin de X
Y = f (X)
A la variable X se le conoce como variable independiente y a la variable
Y como variable dependiente; ejemplo:
P = f (T)
P = Poblacin
T = Tiempo
La dependencia o relacin de una funcin se expresa en una tabla de
valores pero puede tambin ser expresado en forma de una ecuacin;
ejemplo:
2
2X 3 = Y 3X 5X + 4 = Y
5
Y = 10 4(1)
Y = 10 -4
Y = 6
Y = 10 4(2)
Y = 10 8
Y = 2
Y = 10 4(3)

Y = 10 -12

Y = -2

Y = 10 4(4)
Y = 10 -16
Y = - 6

Y = 10 4(-2.4)
Y = 10 + 9.6
Y = 19.6
Y = 10 4(-1.6)
Y = 10 +6.4
Y = 16.4
Y = 10 4(2.7)
Y = 10 10.8
Y = - 0.8
Y = 10 4(3.5)
Y = 10 14
Y = - 4
Y = 10 4(4.6)
Y = 10 18.4
Y = - 8.4


COORDENADAS RECTANGULARES.-
RECOLECCIN DE DATOS Y FORMAS DE PRESENTAR LA
INFORMACIN.
REPRESENTACION GRAFICA: La presentacin de la informacin en
grficos y dibujos es un verdadero arte, que no solo sirve para
representar datos si no tambin para expresar ideas que se desee
destacar.
La representacin grfica debe tener presente lo siguiente:
1.- Recurdese que en lgebra se considera un plano coordenado con
cuatro cuadrantes que forman una cuadrilla. Obsrvese en la
ilustracin siguiente que tanto los valores X como los Y son positivos
en el cuadrante I. Puesto que la mayora de los datos de
administracin o negocios son positivos, es el que se usa con ms
frecuencia.
2.- Elegir escala ms adecuada.
3.- Hacer constar, en un grfico de pastel: Ttulo, grfico y leyenda.
4.- El ancho de las barras debe ser uniforme, en un grfico de barras.
+1 +2 +3
+X
-1 -2 -3
- X
+1
+2
+3
-1
-2
-3
+Y
-Y
Cuadrante I
X Positiva
Y Positiva
Cuadrante III
X Negativa
Y Negativa
Cuadrante IV
X Positiva
Y Negativa
Cuadrante II
X Negativa
Y Positiva
6
Y = 10 4(1)
Y = 10 -4
Y = 6
Y = 10 4(2)
Y = 10 8
Y = 2
Y = 10 4(3)

Y = 10 -12

Y = -2

Y = 10 4(4)
Y = 10 -16
Y = - 6

Y = 10 4(-2.4)
Y = 10 + 9.6
Y = 19.6
Y = 10 4(-1.6)
Y = 10 +6.4
Y = 16.4
Y = 10 4(2.7)
Y = 10 10.8
Y = - 0.8
Y = 10 4(3.5)
Y = 10 14
Y = - 4
Y = 10 4(4.6)
Y = 10 18.4
Y = - 8.4


Y = 10 4(1)
Y = 10 -4
Y = 6
Y = 10 4(2)
Y = 10 8
Y = 2
Y = 10 4(3)

Y = 10 -12

Y = -2

Y = 10 4(4)
Y = 10 -16
Y = - 6

Los grficos que tienen mayor funcionalidad en el campo estadstico
son:
a) Pictogramas, Pictgrafos o Diagramas de Figuras.
b) Grficos de barras
c) Histogramas
d) Polgono de frecuencia
e) Grficos circulares.
FUNCIONES, TABLAS Y GRFICOS
Una variable Y queda determinada por otra X mediante Y=10 4x
a.- Hallar Y tal que X = -3, -2, -1, 0, 1, 2, 3, 4 y 5 y poner los resultados en una tabla.




b.- Hallar Y tal que X = -2.4, -1.6, -0.8, 1.8, 2.7, 3.5 y 4.6.

c.- Expresar X explcitamente como funcin de Y
X Y
-3 22
-2 18
-1 14
0 10
1 6
2 2
3 -2
4 -6
5 -10
X Y
- 2.4 19.6
- 1.6 16.4
- 0.8 13.2
1.8 2.8
2.7 - 0.8
3.5 - 4
4.6 - 8.4
7
Y = 10 4(-3)
Y = 10 +12
Y = 22
Y = 10 4(-2)
Y = 10 +8
Y = 18
Y = 10 4(-1)
Y = 10 +4
Y = 14
Y = 10 4(0)
Y = 10 + 0
Y = 10
Y = 10 4(1)
Y = 10 -4
Y = 6
Y = 10 4(2)
Y = 10 8
Y = 2
Y = 10 4(3)

Y = 10 -12

Y = -2

Y = 10 4(4)
Y = 10 -16
Y = - 6

Y = 10 4(5)
Y = 10 - 20
Y = -10
Y = 10 4(-2.4)
Y = 10 + 9.6
Y = 19.6
Y = 10 4(-1.6)
Y = 10 +6.4
Y = 16.4
Y = 10 4(-0.8)
Y = 10 + 3.2
Y = 13.2
Y = 10 4(1.8)
Y = 10 -7.2
Y = 2.8
Y = 10 4(2.7)
Y = 10 10.8
Y = - 0.8
Y = 10 4(3.5)
Y = 10 14
Y = - 4
Y = 10 4(4.6)
Y = 10 18.4
Y = - 8.4


Y = 10 4(1)
Y = 10 -4
Y = 6
Y = 10 4(2)
Y = 10 8
Y = 2
Y = 10 4(3)

Y = 10 -12

Y = -2

Y = 10 4(4)
Y = 10 -16
Y = - 6

X=
4
1
(10 - Y)
4X = 10 Y
X=
4
10 Y
D .- Si W = 3XZ - 4Y
2
+ 2XY, calcular W cuando: (a) X= 1, Y=- 2, Z= 4, y (b) X= - 5, Y= -
2, Z= 0 (c) Con la notacin funcional W = F (X, Y, Z), calcular F (3, 1, -2)
(a) W = 3(1)x(4)-4(-2)
2
+2(1)(-2)
W= 12 16 4
W = - 8
(b) W = 3(-5)(0) 4(-2)
2
+2(-5)(-2)
W = 0 16 + 20
W = 4
e.- Localizar en un sistema de coordenadas rectangulares los puntos de coordenadas:
) a (3, 2); (2, 3); (-4, 4); (4, -4); (-3,-2); (-2, -3); (-4.5, 3); (-1.2, 2.4); (0,-3); (1.8, 0)
Representar las ecuaciones
a.- Y= 10 4x


X Y
-3 22
-2 18
-1 14
0 10
1 6
2 2
3 -2
4 -6
5 -10
8
Y = 10 4(-3)
Y = 10 +12
Y = 22
Y = 10 4(-2)
Y = 10 +8
Y = 18
Y = 10 4(-1)
Y = 10 +4
Y = 14
Y = 10 4(0)
Y = 10 + 0
Y = 10
Y = 10 4(1)
Y = 10 -4
Y = 6
Y = 10 4(2)
Y = 10 8
Y = 2
Y = 10 4(3)

Y = 10 -12

Y = -2

Y = 10 4(4)
Y = 10 -16
Y = - 6

Y = 10 4(5)
Y = 10 - 20
Y = -10
3; 2
2; 3
-4; 4
4; -4
-3; -2
-2; -3
-4,5; 3
-1,2; -2,4
0; -3
1,8; 0
-5
-4
-3
-2
-1
0
1
2
3
4
5
-5 -4 -3 -2 -1 0 1 2 3 4 5
a.- PICTOGRAMAS, PICTOGRAFOS O DIAGRAMAS DE FIGURAS.-
Son smbolos que se utilizan para representar datos estadsticos de tal
forma que llame la atencin a toda clase de pblico que lo vea, para
realizar esta clase de grficos se necesita que ponga en juego su
originalidad, creatividad o ingeniosidad.
Ejemplo: Si se trata de vivienda se puede disear grficos de casas, si
es de maz, trigo se podr utilizar grficos de sacos, quintales, etc.
b.- GRAFICO DE BARRAS.-
b.1. GRAFICOS DE BARRAS VERTICLAES.-
Son un conjunto de rectngulos que se encuentran ubicados en el
primer cuadrante de un sistema de coordenadas y cuyas reas son
proporcionales a los datos de un fenmeno.
Para su construccin se procede de la siguiente manera:
* En el eje de las abscisas o eje de las X los datos de la
variable vendra a ser la base de los rectngulos.
* En el eje de las ordenadas o eje de las Y se localizan las
frecuencias.
Ejercicio: Represente en un grfico de barras verticales la produccin
de trigo de los aos 1992 a 1999.
9
-3; 22
-2; 18
-1; 14
0; 10
1; 6
2; 2
3; -2
4; -6
5; -10
-15
-10
-5
0
5
10
15
20
25
-4 -3 -2 -1 0 1 2 3 4 5 6
PRODUCCION DE
TRIGO
TON. DE TRIGO
AOS (X) (Y)
1992 8000
1993 8200
1994 8500
1995 7000
1996 7500
1997 9500
1998 10000
1999 4000
b.2. GRAFICOS DE BARRAS HORIZONTALES.-
Estos grficos tienen la particularidad de que en el eje de las abscisas
o eje de las X se colocan las frecuencias y en el eje de las ordenadas
o eje de las Y los datos de la variable que vendran a ser la base de
los rectngulos.
PAISES INCREMENTO
PORCENTUAL
JAPON 2,7
EEUU 5,5
CANADA 7,4
NUEVA ZELANDA 12
GRECIA 20,7
PORTUGAL 23,2
TURQUIA 37,8
PRODUCCION
0
2000
4000
6000
8000
10000
12000
1 2 3 4 5 6 7 8
AOS
T O N
.
T R I G O
TON. DE TRIGO
199
2
1993 1994 1995 1996 1997 1998 1999
10
b.3. GRAFICOS DE BARRAS COMPUESTAS.-
Esta clase de grfico se utiliza cuando tenemos dos o ms series de
datos y queremos realizar una comparacin entre dichos valores.
EJERCICIO: Una cadena de tiendas de descuento est organizada en tres grupos para ventas y
compras. Cada grupo est dirigido por el gerente general. El cambio de ventas totales para los aos
1987, 1988, 1989, y el cambio para cada grupo en relacin con el total se han de presentar en una
grfica de barras compuestas.
Las ventas de cada grupo son:
VENTAS
(EN MILLONES DE DLARES)
GRUPO 1987 1988
1989
ROPA $2 $3 $4
MEDICINAS Y ARTICULOS 10 8 8
AUTOMOVILES Y
ARTICULOS
4 8 18
TOTAL 16 19
23
Para elaborar una grfica de barras compuestas, primero se grafican
las ventas de ropa por $ 2 millones (dlares) del ao 1987
INCREMENTOS PORCENTUALES EN PRECIOS AL CONSUMIDOR
0 10 20 30 40
JAPON
CANADA
GRECIA
TURQUIA
P A I S E S

INCREMENTO X
2,7
5,5
7,4
12
20,7
23,2
37,8
11
VENTAS EN MILLONES DE DOLARES
0
5
10
15
20
25
1987 1988 1989
AOS
A
R
T
I
C
U
L
O
S
Automoviles
Medicinas
Ropa
Las ventas para los tres aos se presentan en el diagrama anterior.
Obsrvese que para cada ao, primero se marcaron las ventas de ropa
en la parte inferior de la barra, en la parte superior de las ventas de
ropa se marcaron las ventas de medicina y artculos domsticos, y el
ltimo componente o seccin que se marc fue el de las ventas de
automviles y artculos deportivos. La interpretacin de la grfica de
barras seccionada es:
* Las ventas totales aumentaron durante los tres aos.
* Las ventas de ropa permanecieron relativamente constantes
durante el periodo de tres aos.
* Las ventas de medicina y artculos domsticos disminuyeron
como un componente del total.
* Las ventas de automviles y artculos deportivos aumentaron
con rapidez como un componente del total.
c.- HISTOGRAMAS.- Tambin utilizan barras para la representacin de
la informacin estadstica, estos nos dan una apreciacin visual de la
distribucin de frecuencias. Es la representacin grfica de una
distribucin de frecuencias de variables cuantitativas y continas.
Para construir un histograma empleamos el primer cuadrante de un
sistema de coordenadas, en el eje de las X las marcas de clase o
puntos medios y en el eje de las Y la frecuencia respectiva, las barras
se dibujan sin dejar espacio entre ellas.
EJEMPLO.- El siguiente cuadro contiene las calificaciones de matemticas de cuarto curso de un
colegio de la ciudad de Azogues. Construya un histograma.
12
CALIFICACIONE
S
f X
6 8 12 7
9 11 10 10
12 14 18 13
15 17 14 18
18 - 20 6 19
Ojo (Las barras van unidas y no separadas como estn en la representacin)
d.- POLIGONO DE FRECUENCIA.- Es un grfico lineal cerrado que se
obtiene por la interseccin de la variable con la frecuencia, en el eje de
las abscisas o eje de las X se ubican los puntos medios y en el eje
de las ordenadas o eje de las Y las frecuencias respectivas.
EJEMPLO: Para este ejemplo el trazo o elaboracin de un polgono de frecuencias se ilustra
utilizando de nuevo las rentas mensuales de condominios. Se necesitan los puntos medios de clase
que se ubican en el eje X, y las frecuencias de clase, que estn eje el eje Y. (Recuerde que un
punto medio de clase es un valor que se obtiene sumando el lmite inferior ms el superior dividido
para dos).
Limites Establecidos Marca de
clase
(X)
Frecuencias
$ 600 799 699,5 3
800 899 899,5 7
1000 1199 1099,5 11
1200 1399 1299,5 22
1400 1599 1499,5 40
1600 1799 1699,5 24
1800 1999 1899,5 9
2000 2199 2099,5 4
CALIFICACIONES- HISTOGRAMA
0
2
4
6
8
10
12
14
16
18
20
1 2 3 4 5
PUNTOS MEDIOS (Marca de clase)
F R E C U E N C I A S
7 10
13 18 19
13
TOTAL 120
Obsrvese que en la figura que para completar el polgono de
frecuencia, se agregaron puntos medios de 499,5 y 2299,5 a los dos
extremos, y el polgono se ancl al eje horizontal a la frecuencia
cero. Estos dos valores se obtuvieron restando el intervalo de clase de
200 al punto medio mayor (2099,5), al anclar los dos extremos del
polgono de frecuencias al eje X, el rea total bajo el polgono es ahora
al total de las frecuencias
d.- GRAFICOS CIRCULARES O DE SECTORES (PASTEL).-
Este tipo de grficos es adecuado para aquellos casos en que deseen
que los datos estadsticos lleguen a todo tipo de personas, incluso
aquellos que no tienen una formacin cientfica.
Este grfico consiste en repartir los 360 grados de la circunferencia en
forma proporcional a las frecuencias de cada una de las variables.
EJEMPLO: En la biblioteca de la Municipalidad de Azogues, entre los libros que existen hay 100 de
Estadstica, 200 de Matemtica, 220 de Historia, 500 de Economa y 380 de ingls, elaborar un
grfico circular.
Desarrollo: Primeramente determinamos cuantos grados de los 360 corresponden a cada materia.
Estadstica 71 , 25
1400
360 * 100

Matemtica
43 , 51
1400
360 * 200

LIBROS FRECUENCIA ANGULO


Estadstica 100 25,71 grados
Matemtica 200 51,43
Historia 220 56,57
Economa 500 128,57
Ingls 380 97,71
------------ --------------- -------------
Total 1400 360
Trabajadores no
agrcolas (millones)
14
Historia 57 , 56
1400
360 * 220

EJEMPLOS:
La tabla muestra el nmero de trabajadores, agrcolas o no, en Brasil, durante 1940- 1980.
Representar los datos usando:
AO
TRABAJADORES
AGRCOLAS
(MILLONES)
TRABAJADORES
NO AGRCOLAS
(MILLONES)
1840 3,72 1,70
1860 6,20 4,33
1880 8,59 8,80
1900 10,90 18,17
1920 11,46 30,97
1940 9,22 43,75
1960 4,19 65,70
1980 2,33 103,76
a.- Grfico de trazos
LIBROS DE BIBLIOTECA Estadstica
Matemtica
Historia
Economa
Ingls
ESTADISTICA 25,71
MATEMATICA 51,43
HISTORIA 56,57
ECONOMIA 128,57
INGLES 97,71
Trabajadores no
agrcolas (millones)
15
b.- Grfico de barras
c.- Grfico de barras componentes
GRAFICO DE TRAZOS
0
20
40
60
80
100
120
1800 1850 1900 1950 2000
Trabajadores
Agrcolas (millones)
Trabajadores no
agrcolas (millones)
GRFICO DE BARRAS
0,00
20,00
40,00
60,00
80,00
100,00
120,00
1840 1860 1880 1900 1920 1940 1960 1980
Ao
M
i
l
l
o
n
e
s
TRABAJADORES
AGRICOLAS (MILLONES)
TRABAJADORES NO
AGRICOLAS (MILLONES)
16
GRAFICOS DE BARRAS EN COMPONENTES
0,00
20,00
40,00
60,00
80,00
100,00
120,00
1 2 3 4 5 6 7 8
AOS
M
I
L
L
O
N
E
S
TRABAJADORESNO
AGRICOLAS(MILLONES)
TRABAJADORES
AGRICOLAS(MILLONES)
EJERCICIOS PROPUESTOS:
1. Decir cual de los que siguen representa datos discretos y
cuales continuos.
a) Nmero de estudiantes matriculados en una Universidad en varios
aos:
b) Nmero de sacos de trigo producido por hectrea en un campo en
varios aos.
c) Nmero N de miembros en una familia.
d) Estado civil de una persona
e) Tiempo de vuelo T de un misil.
f) Nmero de ptalos de una flor.
2.- REDONDEO DE DATOS, NOTACIN CIENTFICA Y DGITOS
SIGNIFICATIVOS.
a) 148.475 unidades
b) 0.000098501 millonsimas
c) 2184.73 dcimas
d) 43.87500 centsimas
4.- Evaluar manualmente lo que sigue, sabiendo que: u = -2,
v=, w = 3, x = -4, y = 9, z = 1/6.
a) 3 y x u +
2
) ( =
17
b)
w uv u + 2
2
=
c) 3x (4y + 3z) 2y (6x-5y) 25=
5.- FUNCIONES, TABLAS Y GRFICOS.
1.- Si ,
2 2
y x z calcular z cuando:
a) x = -2, y = 3.
b) x = 1, Y = 5.
c) En notacin funcional z = f(x,y), cuando f(-3.-1).
2.- Si W = 3XZ - 4
2
Y + 2XY, calcular W cuando:
a) X = 1, Y = -2, Z = 4.
b) X = -5, Y = -2, Z = 0.
c) Con la notacin funcional W=F(X, Y, Z), calcular (3,1,-2)
6.- REPRESENTAR LAS ECUACIONES.
Localizar en un sistema de coordenadas rectangulares los puntos de
coordenadas.
a) Y = 10 -4X.
X -3 -2 -1 0 1 2 3 4 5
b) Y = 2X + 5.
X -3 -2 -1 0 1 2 3 4
c) 2X + 3Y = 12.
X -3 0 3 6 9
d) 10 2
2
+ x x Y .
X -3 -2 -1 0 1 2 3
e) 6 12 4
2 3
+ x x x Y
X 0 1 2 3 -1
7.- PICTOGRAMAS, HISTOGRAMAS
18
1.- Con los datos de la tabla construir un grfico que muestre el porcentaje
de trabajadores a) agrcolas, b) no agrcolas y c) Construir otro que las
muestre a la vez.
AO
Trabajadores
agrcolas
Trabajadores
no agrcolas
% Trab.
Agrcolas
% Trab. No
Agrcolas
1840 3,72 1,7
1860 6,2 4,33
1880 8,59 8,8
1890 10,9 18,17
1920 11,46 30,97
1940 9,22 43,75
1960 4,19 65,7
1980 2,33 103,76
TOTAL 56,61 277,18
2.- En la tabla se ven los nmeros (en millones) de estudiantes en
enseanza primaria, media y superior en Amrica del Sur. Representar los
datos, usando: a.-) grfico de trazos, b.-) grfico de barras y c.-) grfico de
barras en componentes.
AO 1960 1965 1970 1975 1980
ELEMENTAL 32.4 35.5 37.1 33.8 30.6
MEDIA 10.2 13.0 14.7 15.7 14.6
SUPERIOR 3.6 5.7 7.4 9.7 10.2
3.- La tabla muestra el estado civil de hombres y mujeres en Ecuador el
2007. Representar los datos mediante: a) Dos grficos circulares de igual
dimetro y b) Uno de diseo propio.
a) Dos grficos circulares de igual dimetro
Estado
Civil
Varones
(% total)
Mujeres
(% total)
Varones
grados
Hembras
grados
soltero 25,1 18,4
Casado 66,7 64,3
Viudo 2,4 12,4
Divorciado 5,8 7,9
TOTAL
100 100
4.- En la tabla se ven las reas de los ocanos en millones de millas
cuadradas. Representar los datos usando: a.-) un grfico de barras
horizontales y verticales; y b.-) grfico circular.
Ocano rea Grados
19
(millones de
millas
cuadradas)
Pacfico
Atlntico
Indico
Antrtico
rtico
63.8
31.5
28.4
7.6
4.8
Total 136.1
8.- ECUACIONES
1.- Resolver las siguientes ecuaciones manualmente:
a) 16-5C=36
b) 2Y-6=4-3Y
c) 4(X-3)-11=15-2(X +4)
d) 3(2U+1)=5(3-U)+3(U-2)
e) 3(2(X +1)-4)=10-5(4-2X)
CAPITULO II
20
DISTRIBUCIONES DE FRECUENCIA.
TOMA DE DATOS: Es la obtencin de datos de un fenmeno, el
mismo que se desea analizarlo estadsticamente, ejemplo; edades de
los estudiantes matriculados en el primer ao de la Universidad
Tcnica Jos Peralta. Estos datos no pueden estar ordenados.
ORDENACIN: Es la colocacin de los datos numricos del fenmeno
en relacin a un orden ascendente o descendente. A la diferencia entre
el mayor y el menor de los datos se le denomina rango o recorrido.
Rango o recorrido (R= X mxima X mnima). Ejemplo: Si la
altura mayor de 100 estudiantes es 1,74 metros y la menor es 1.60
metros, su rango ser igual a 0.14 centmetros.
DISTRIBUCIN DE FRECUENCIAS: Es una tcnica que nos permite
ordenar los datos en una tabla si estos se dividen en clases,
debindose registrar el nmero de observaciones en cada clase.
Ejemplo:
ALTURA DE LOS ESTUDIANTES DE LA UNIVERSIDAD:
ALTURA NUMERO DE
PULGADAS ESTUDIANTES
60 62 5
63 65 18
66 68 42
69 71 27
72 74 8
TOTAL 100
INTERVALOS DE CLASE: El smbolo que define una clase se conoce
con el nombre de intervalo de clase, ejemplo 63 65 son los lmites de
la segunda clase de la distribucin.
LIMITES DE CLASE: El nmero menor de la clase es 63 y se lo llama
LIMITE INFERIOR DE CLASE, y al 65 se le denomina LIMITE
SUPERIOR. Los trminos clase o intervalo de clase se utiliza
indistintamente. Un intervalo de clase que al menos tericamente no
tiene lmite superior o inferior se conoce como intervalo de clase
21
abierto. Ejemplo: Al referirse a la poblacin los mayores de 65 aos es
un intervalo de clase abierto.
LIMITES REALES DE CLASE: Se denomina as a los valores que
tericamente incluyen valores o cantidades representadas por sus
medidas exactas y que corresponden a 5 dcimas menos del limite de
clase inferior cuando son enteros, y cuando se trata de decimales hay
que restar el nmero que le corresponde; y, 5 dcimas ms al del
limite de clase superior; se aplica la misma teora para el limite inferior,
denominndoseles a cada uno de ellos como LIMITE REAL INFERIOR Y
LIMITE REAL SUPERIOR respectivamente. Una manera de determinar
el intervalo de clase (C) es restando el limite real superior del limite
real inferior.
TAMAO O ANCHURA DE UN INTERVALO DE CLASE: Es la
diferencia entre los limites reales de clase y en la mayora de las
distribuciones, el intervalo de clase es igual en todas las clases.
MARCA DE CLASE: Es el punto medio o media aritmtica entre los
limites superior o inferior de clase de cada grupo. Ejemplo:
PULGADAS
Nmero de
estudiantes X
X
2
122
;
2
62 60 +

60 62 5 61
63 65 18 64 61 X
66 68 42 67
69 71 27 70
72 74 8 73
TOTAL 100
REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DE
FRECUENCIA:
1.- Determinar el rango o recorrido de las observaciones:
R = X mxima - X mnima.
2.- Dividir el rango en un nmero conveniente de intervalos de
clase del mismo tamao y de no ser posible utilizar intervalos de clase
de diferente tamao o intervalos de clase abiertos. El nmero de
22
intervalos no deber ser ni menor que 5 ni mayor que 20 dependiendo
de los datos. Los intervalos de clase se rigen tambin de forma que las
marcas de clase o puntos medios coincidan con los datos observados
realmente para de esta manera evitar el error de agrupamiento de
datos.
3.- Nmero de clases: Se la representa por C o k. En una
tabla de frecuencias es algo arbitrario. Se puede seguir una regla
simple para aproximar el nmero de clases a utilizar, c o k, es:
n o n nT
K C
> 2 2
En donde:
n = Es el nmero de observaciones
C o K = Es un nmero entero positivo, que representa el nmero de
clases a utilizar.
El nmero de clases es la menor potencia a la cual se eleva la base 2,
de manera que el resultado sea igual o mayor que le nmero de
observaciones.
PARA NMEROS ENTEROS PARA NMEROS DECIMALES
declases
RANGO
C
#
1 +

declase
RANGO
C
#
001 . 0 +

Nota: Para nmeros decimales hay que tomar en cuenta que si se esta
trabajando como por ejemplo 3.94 y 1.00; entonces el valor de 1 se
convierte en 0.001 ya que el ejercicio esta en centsima, por lo tanto
tiene que tener un nmero ms, como en este caso es 0.001
4.- Rango del intervalo que es igual a
CLASES DE
RANGO
C
#
1 +

Ejemplo:
Puntuacin de 80 estudiantes en el primer ciclo de administracin:
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
23
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
1) Ordenar los datos sea en forma ascendente o en forma descendente; en este ejemplo aplicamos en forma
ascendente del menor al mayor.
53 57 59 60 60 60 61 61 62 62
62 62 63 63 65 65 65 66 67 67
68 68 68 69 71 71 71 72 72 73
73 73 73 74 74 74 75 75 75 75
75 75 75 76 76 76 76 77 77 78
78 78 78 78 79 79 79 80 81 82
82 83 84 85 85 85 86 87 88 88
88 89 90 93 93 94 95 95 96 97
2) Rango o recorrido:
X max = 97
X min = 53
R = X max X min
97 53 = 44
3)
a) Nmero de clases tomado en este ejemplo de 9 Decisin personal, tratar de que salgan datos
exactos y no con decimales, en el mejor de los casos, y en el caso de que salgan con decimales aplicar el
redondeo de datos:
b) n o n nT
K C
> 2 2
80 128 80 2 2
7
> > n
K
O sea se puede trabaja con 9 o con 7 para este ejercicio.
4) a) 5
9
45
9
1 44
#
1

+ +

deClases
Rango
C ; b) 6
7
45
7
1 44
#
1

+ +

deClases
Rango
C
HISTOGRAMAS: Consisten en una serie
de barras tipo rectngulo que tienen sus
bases sobre los ejes horizontal con
centros en las marcas de clase o medias
aritmticas y longitud igual al tamao
del intervalo de clase.
Las alturas de los rectngulos son
proporcionales a las frecuencias de clase, generalmente y en caso de
CALIFICACIONES f i X r
53 - 57 2 55
58 - 62 10 60
63 - 67 8 65
68 - 72 9 70
73 - 77 20 75
78 - 82 12 80
83 - 87 6 85
88 - 92 6 90
93 - 97 7 95
TOTAL 80
24
que las frecuencias sean numricamente grandes se acostumbra a
utilizar escala.
POLIGONO DE HISTOGRAMA O BARRAS
AOS
SACOS
DE TRIGO
1950 200
1951 185
1952 225
1953 250
1954 240
1955 195
1956 210
1957 225
1958 250
1959 230
1960 235
POLGONO DE FRECUENCIA: Es un grfico de lnea trazada sobre las
marcas de clase y se lo obtiene uniendo los puntos medios de los
techos de los rectngulos del histograma.
POLIGONO DE PICTOGRAMA O PUNTOS
AOS
SACOS DE
MAIZ
1950 75
1951 90
1952 100
1953 85
1954 80
1955 100
1956 110
1957 105
1958 95
1959 110
1960 100
DISTRIBUCIN DE FRECUENCIAS RELATIVAS: Se llama frecuencia
relativa de una clase al valor de la frecuencia de clase (frecuencia
absoluta) dividido para el total de las observaciones, y expresado
generalmente en porcentajes.
CALIFICACIONES f i X Fre Absoluta o Relativa Fre % o menos o ms
Fi Ac Fi Ac
53 - 57 2 55 0.025 2.5 2 80
58 - 62 10 60 0.125 12.5 12 78


80 Ojiva O Menos
70
60
50
40
30
20
10
Ojiva O Ms
55 60 65 70 75 80 85 90 95
25
63 - 67 8 65 0.1 10 20 68
68 - 72 9 70 0.1125 11.25 29 60
73 - 77 20 75 0.25 25 49 51
78 - 82 12 80 0.15 15 61 31
83 - 87 6 85 0.075 7.5 67 19
88 - 92 6 90 0.075 7.5 73 13
93 - 97 7 95 0.0875 8.75 80 7
TOTAL 80 1 100
X = 53 - 57 = 110 / 2 = 55
Fre. = 2 / 80 = 0.025 Frecuencia Relativa O
Frecuencia absoluta
Fre % = 0.025 * 100 = 2.5 Frecuencia porcentual
Fi Ac = Frecuencia acumulada o menos = 2 +10 = 12
Fi Ac = Frecuencia acumulada o ms = 80 - 2 = 78
Si las frecuencias de la tabla o grfico de frecuencias se sustituyen por
las correspondientes frecuencias relativas, la tabla se llama
DISTRIBUCIN DE FRECUENCIAS RELATIVAS O DISTRIBUCIN
PORCENTUAL DE FRECUENCIAS RELATIVAS.
DISTRIBUCIN DE FRECUENCIAS ACUMULADAS: La frecuencia
total de todos los valores menores que el lmite real superior de clase
de un intervalo se conoce como FRECUENCIA ACUMULADA HASTA ESE
INTERVALO INCLUSIVE, DENOMINADO TAMBIN FRECUENCIA
ACUMULADA O MENOS.
En algunos casos es preferible considerar una distribucin de
frecuencias acumuladas de todos los valores mayores o iguales al
lmite real inferior de clase, denominndose a este tipo de
DISTRIBUCIN ACUMULADA O MS. Los grficos de dichas
distribuciones de frecuencias acumuladas se denominan ojivas.
DISTRIBUCIN DE FRECUENCIAS RELATIVAS ACUMULADAS: Son
las frecuencias acumuladas divididas para el total de observaciones,
para que se conviertan en frecuencia relativa porcentual acumulada, se
multiplica por 100. Los criterios para distribuciones relativas


80 Ojiva O Menos
70
60
50
40
30
20
10
Ojiva O Ms
55 60 65 70 75 80 85 90 95
26
acumuladas ms o menos son los expresados para distribuciones
acumuladas. LOS GRFICOS DE DICHAS DISTRIBUCIONES DE
FRECUENCIAS ABSOLUTAS O RELATIVAS SE LES DENOMINAN OJIVAS.
CURVAS DE FRECUENCIA U OJIVAS SUAVIZADAS: Una ojiva o un
polgono de frecuencias se forma por el conjunto de puntos obtenidos
por la unin de una distribucin de frecuencias (marca de clase),
mientras el intervalo entre las marcas de clase sea menor a la unin
del conjunto de puntos nos dar una curva, por lo que todo polgono
es necesario suavizarlo (curva a mano alzada).
Las curvas de frecuencias presentan determinadas formas,
caractersticas que las distinguen:


80 Ojiva O Menos
70
60
50
40
30
20
10
Ojiva O Ms
55 60 65 70 75 80 85 90 95
X
27
Y

a) CURVA SIMTRICA: O bien formada se caracteriza porque las
observaciones equidistan del mximo central.
b y c) CURVA DE FRECUENCIAS MODERADAMENTE ASIMTRICAS:
O sesgada hacia la derecha sesgo positivo, o hacia la izquierda
llamada sesgo negativo.
d y e ) CURVAS EN FORMA DE J. O DE J INVERTIDA: Con mximos
a los extremos corresponden generalmente a curvas de frecuencias
acumuladas.
f) CURVA DE FRECUENCIAS EN FORMA DE U: Con el mximo en sus
extremos (curva parablica).
g) CURVA DE FRECUENCIA BIMODAL: Porque tiene 2 mximos.
h) CURVA DE FRECUENCIA MULTIMODAL: Aquella que tiene ms de
tres puntos mximos.
EJERCICIOS PROPUESTOS:
1.- ORDENAR LOS NMEROS
a) Ordenar los nmeros en forma ascendente y descendente de:
12,56,42,21,5,18,10,3,61,34,65 y 24
Ascendente, descendente:
b) Hallar el rango.
2.- LA TABLA MUESTRA UNA DISTRIBUCIN DE FRECUENCIAS DE LAS
VIDAS DE 400 FOCOS DE LA EMPRESA XYZ. DETERMINAR DE STA TABLA.
a) b) c) d)
e) f) g) h)
28
Tabla 2
Vida de media
(horas)
Nmero de
tubos
300-399
400-499
500-599
600-699
700-799
800-899
900-999
1000-1099
1100-1199
14
46
58
76
68
62
48
22
6
TOTAL 400
a) El lmite superior de la quinta clase =
b) El lmite inferior de de la octava clase =1000
c) Marca de la sexta clase = Las fronteras de clase de la ltima clase
d) La anchura de intervalos de clase = Frecuencia cuarta clase
e) Frecuencia relativa sexta clase =
f) Porcentajes de tubos de la vida media no pasa de 600 horas
g) Porcentaje de tubos cuya vida media es mayor o igual a 900 horas =
h) Porcentaje de tubos cuya vida media es de al menos 500 horas, pero
menor que 1000 horas =
3.- CON LOS DATOS CORRESPONDIENTES A LA DISTRIBUCIN DE
FRECUENCIAS DE LA SIGUIENTE TABLA CONSTRUIR:
Vida de
media
(horas)
Nmero
de tubos
300-399 14
400-499 46
500-599 58
600-699 76
700-799 68
800-899 62
900-999 48
1000-1099 22
1100-1199 6
TOTAL 400
a) Un histograma
b) Un polgono de frecuencias
4.- PARA LOS DATOS DE LA TABLA CONSTRUIR:
a) Una distribucin de frecuencias relativas.
29
Vida de media
(horas)
Nmero de tubos x Frecuencia relativa
300-399 14
400-499 46
500-599 58
600-699 76
700-799 68
800-899 62
900-999 48
1000-1099 22
1100-1199 6
TOTAL 400
b) Un histograma de frecuencias relativas
c) Polgono de frecuencias relativas
d) Una distribucin de frecuencias acumuladas
e) Una distribucin acumulada en porcentajes
f) Una ojiva
g) Una ojiva de porcentajes
h) Frecuencias del modo o ms y o menos
5.- LOS DIMETROS INTERNOS DE LOS TUBOS FABRICADOS POR UNA
EMPRESA SE MIDE CON PRECISIN DE MILSIMAS DE PULGADA. SI LAS
MARCAS DE CLASE DE UNA DISTRIBUCIN DE FRECUENCIAS DE ESOS
DIMETROS VIENEN DADAS POR 0.321, 0.324, 0.327, 0.330, 0.333, 0.336,
HALLAR:
a) Anchura de intervalo de clase o limite real superior menos limite real
inferior
b) Fronteras de clase o limites reales superiores o inferiores
6.- LA TABLA ADJUNTA MUESTRA LOS DIMETROS EN CENTMETROS DE
UNA MUESTRA DE 60 BOLAS DE MANUFACTURA DE UNA FBRICA.
CONSTRUIR UNA DISTRIBUCIN DE FRECUENCIA CON INTERVALOS DE
CLASE APROBADOS.
1,738 1,729 1,743 1,740 1,736 1,741
1,735 1,731 1,726 1,737 1,728 1,737
1,736 1,350 1,724 1,733 1,742 1,736
30
1,739 1,735 1,745 1,736 1,742 1,740
1,728 1,738 1,725 1,733 1,734 1,732
1,733 1,730 1,732 1,730 1,739 1,734
1,738 1,739 1,727 1,735 1,735 1,732
1,735 1,727 1,734 1,732 1,736 1,741
1,736 1,744 1,732 1,737 1,731 1,746
1,735 1,735 1,729 1,734 1,730 1,740
7.- PARA LOS DATOS DEL PROBLEMA DEL EJERCICIO 6 CONSTRUIR.
a) Un histograma
b) Un polgono de frecuencia.
c) Un histograma de frecuencias relativas
d) Un polgono de frecuencias
e) Una ojiva
f) Una ojiva de frecuencia acumulada.
8.- LA TABLA MUESTRA LA DISTRIBUCIN DE PORCENTAJES DE VENTAS
TOTALES PARA PLANTACIONES DE TIPO FAMILIAR EN EUROPA EN 1982.
USANDO ESA TABLA, RESPONDER LAS SIGUIENTES CUESTIONES.
VENTAS (DLARES)
EXPLOTACIONES (%)
Menos de 2500 25,9
2500 4999 13,2
5000 9999 13,0
10000 19999 11,7
20000 39999 11,0
40000 99999 14,4
100000 249999 8,5
250000 499999 1,8
500000 o ms 0,6
a) Cul es la anchura del segundo intervalo de clase y del sptimo?
b) Cuntos tamaos diferentes de intervalos de clase hay?
c) Cuntos intervalos de clase abiertos hay?
d) Cmo habra que escribir el primer intervalo de clase para que su
anchura sea igual a la del segundo
e) Cul es la marca de clase del segundo intervalo de clase? y del sptimo?
f) Cules son las fronteras de clase del cuarto intervalo de clase?
g) Qu porcentaje de las plantaciones tuvo ventas de $20.00 a ms? y por
debajo de $ 10.000?
h) Qu porcentaje logr ventas de al menos $ 10.000 pero mayores que $
40.000?
31
i) Qu porcentaje tuvo entre $15.000 y $ 25.000? Qu hiptesis se han
hecho en ese clculo?
j) Por qu los porcentajes de la tabla no sumas 100%?
9.- CALCULAR LO SIGUIENTE DEL CUADRO:
vida de
media
(horas)
Nmero
de tubos
300-399
400-499
500-599
600-699
700-799
800-899
900-999
1000-1099
1100-1199
14
46
58
76
68
62
48
22
6
TOTAL 400
a) Un histograma
b) Un polgono de frecuencia.
c) Una ojiva
d) Una ojiva de frecuencia acumulada.
10. UN CONJUNTO DE DATOS CONSTA DE 38 OBSERVACIONES CUANTAS
CLASES RECOMENDARA PARA LA DISTRIBUCIN DE FRECUENCIAS?
DATOS ORDENADOS
10 13 15 17 19 19
19 22 23 24 25 27
29 30 32 35 37 42
43 47 52 55 56 56
58 58 58 60 60 60
61 62 63 72 76 78
85 86
11.- Un conjunto de datos esta integrado por 45 observaciones que van
desde 0 hasta 39 dlares Qu tamao de intervalo de clase recomendara?
DATOS DESORDENADOS
0 1 12 15 14
25 0 29 28 26
11 4 5 9 10
12 14 17 13 16
32
25 8 5 2 0
1 3 4 5 7
17 39 25 18 15
4 9 10 20 25
14 12 2 18 14

CAPITULO III
MEDIDAS DE CENTRALIZACIN.
33
REDUCCIN DE DATOS: Generalmente una muestra o fenmeno a
estudiarse contiene gran cantidad de datos los mismos que requieren
ser presentados en cuadros llamados de distribuciones, cuya
caracterstica es presentar en forma resumida la situacin de la
muestra o fenmeno y de los que es necesario todava reducirlos a
medidas que representen la situacin promedio de dicha muestra o
fenmeno. A este procedimiento se lo conoce con el nombre de
reduccin de datos expresados en valores o parmetros de formas
diferentes llamadas medias y que son:
MEDIDAS DE CENTRALIZACIN: Las medidas de tendencia central son
las ms conocidas y utilizadas en nuestras vidas diarias. Estas nos
proporcionan un valor alrededor del cual se distribuyen las
observaciones.
Las medidas de centralizacin mas utilizadas son: media aritmtica,
media geomtrica, media armnica, mediana, moda o valor modal,
cuartilas, declas y centilas.
A continuacin describiremos la simbologa o notacin a utilizarse para
las frmulas de las medidas de centralizacin:
X = Representa la media aritmtica de una muestra

= Representa la media aritmtica de una poblacin
= Sumatoria de un conjunto de valores
Xj= X1 + X2 + X3 + ......Xn
f = Frecuencia de clase
X = Marca de clase
A = Media supuesta
dj = Desviacin de la marca de clase con respecto a una media
cualquiera (x-A).
n = Indica el nmero de elementos de la muestra
N = Indica el nmero de elementos de la poblacin
Nota: Es aconsejable presentar los resultados redondeados a dos
decimales.
34
PROMEDIO O MEDIDAS DE CENTRALIZACIN: Un promedio es un
valor que es tpico o representativo de un conjunto de datos y
generalmente estn situados en el centro del conjunto de datos
ordenados. A estos promedios se los denomina como medidas de
centralizacin.
1.- MEDIA ARITMTICA: Es posible que usted este familiarizado con
la media aritmtica pues se trata del valor que halla al promediar algo.
Por ejemplo si usted desea saber el nmero promedios de horas al da
que ha trabajado durante los ltimos 15 das, basta sumar las horas
que ha trabajado cada da y dividir para 15. Al realizar esto usted
estar calculando la media aritmtica.
FORMULA DE LA MEDIA ARITMTICA: Como la media aritmtica no
es ms que el promedio de un conjunto de observaciones su frmula
queda definida:
n
X
X

Para datos originales
En caso de existir una distribucin de frecuencias o datos agrupados su
frmula se expresa de la siguiente manera:
n
fX
X

Para datos agrupados
MEDIA PONDERADA: Es aquella expresin de la media aritmtica en
la que se emplea la frecuencia de los datos para expresarla de forma
comprimida. La frmula a utilizarse es la siguiente:

W
WX
X
W
) (
Ejemplo: Calcular la media de la siguiente serie de calificaciones de
exmenes en la asignatura de estadstica: 6, 8, 3, los mismos que
tienen un valor del 30%, 60% y del 10% respectivamente, de la nota
final.
35

W
WX
X
W
) (
9 , 6
100
690
10 60 30
) 10 ( 3 ) 60 ( 8 ) 30 ( 6

+ +
+ +

W
X
Este ejercicio se puede interpretar como una media aritmtica en la
que el valor 6 aparece 30 veces; es decir, la frecuencia absoluta
correspondiente al valor 6 es de 30. La que corresponde al valor 8 es
de 60 y la frecuencia absoluta del valor 3 es de 10
PROPIEDADES DE LA MEDIA ARITMTICA:
1.- Es una medida de tendencia central que depende de todos los
valores de la serie y se encuentra afectada por el recorrido demasiado
amplio de los valores extremos, con respecto a la media.
2.- De la frmula de la media aritmtica puede despejar
cualquiera de sus elementos:
3.- Podemos calcular la de un conjunto de promedios.
APLICACIONES DE LA MEDIA ARITMETICA:
1.- Obtener un promedio que tenga representatividad en la serie
2.- Comparar 2 o ms series
3.- Obtener otros tipos de medidas, como por ejemplo: medidas de
dispersin, de correlacin y para verificar hiptesis.
Ejemplo 1 Media aritmtica para datos originales:
8, 3, 5, 10, 12
n
X
X

5
12 10 8 5 3 + + + +
X
5
38
X

6 , 7 X

dj = 0
dj= (3 7,6) + (5 7,6) + (8 7,6) + (10 7,6) + (12 7,6) = 0
36
X X dj
6 , 7 X
Ahora con una media supuesta, preferentemente uno de los valores de las observaciones del
mismo ejemplo:
A= 3

dj = (3 3) + (5 3) + (8 3) + (10 3) + (12 3)

dj = 0+2+5+7+9 = 23
n
dj
A X

+
5
23
3 + X 6 , 4 3 + X 6 , 7 X
PARA DATOS AGRUPADOS
Ejemplo 2
Altura en
pulgadas
Frecuencias
(f)
60 62 5
63 65 18
66 68 42
69 71 27
72 74 8
---------- ------------
TOTAL 100
Altura en
pulgadas
Frecuencias
(f)
Marca de
clase
(X)
fX A=67
dj
(X-A)
fdj
60 62 5 61 305 - 6 - 30
63 65 18 64 1152 - 3 - 54
66 68 42 67 2814 0 0
69 71 27 70 1890 3 81
72 74 8 73 584 6 48
---------- ------------ --------
-
--------
TOTAL 100 6745 45
( )
( ) ( ) 54 3 18 30 6 5
3 67 64 6 67 61
305 61 5
61
2
62 60
) (


fdj
dj
X fX
x clase de Marca
37
Primera frmula (Mtodo de compilacin) para calcular la media
aritmtica:
45 , 67
100
6745


n
fX
X
Segunda frmula (Mtodo largo) para calcular la media aritmtica: De
la marca de clase (tomamos el valor central en caso de que sean
impares; mientras que cuando son pares se toma cualquiera de los
valores centrales, en este caso es A = 67)
A = 67
45 , 67
100
45
67 + +

n
fdj
A X
Tercera frmula (Mtodo Clave) para calcular la media aritmtica:
U = Unidades de intervalo
C = Intervalo diferencia de limites reales de clase
Altura en
pulgadas
Frecuencias
(f)
Marca de
clase
(X)
A=67
dj
(X-A)
U
dj/C
(X-A)/C
f U
60 62 5 61 - 6 - 2 - 10
63 65 18 64 - 3 - 1 - 18
66 68 42 67 0 0 0
69 71 27 70 3 1 27
72 74 8 73 6 2 16
--------- ----------- ------
TOTAL 100 15
U= LIMITE REAL SUPERIOR (se suma 5 dcimas al limite superior,
dependiendo si se esta trabajando con decimales, caso contrario si se
esta trabajando con decimales hay que sumar de acuerdo a los
decimales que tengamos); y se resta del LIMITE REAL INFERIOR (se
realiza de la misma manera de lo que se explico anteriormente con el
limite real superior, pero en este caso se resta).
U = 62,5 59,5 = 3
38
C = (X-A)/U (61-67)/3 = - 2
(64-67)/3 = - 1
X xU
n
fU
A X 45 , 67 3
100
15
67 + +

2.- LA MEDIANA:
CONCEPTO: Es el valor que queda ubicado justo en el medio de un
conjunto de datos, cuando estn ordenados ya sea en sentido
ascendente o descendente.
FORMULAS DE LA MEDIANA:
1) Para datos originales puede presentarse 2 casos:
a) Que las n observaciones sea impar siendo el valor de la mediana
el valor central de las observaciones una vez ordenada la
muestra
Ejemplo: Dadas las siguientes observaciones:
3, 10, 12, 1, 7.
Se ordena: 1, 3, 7, 10, 12. El valor central es = 7, Md = 7 MEDIANA
b) Si el nmero de observaciones es par entonces habr 2
observaciones centrales y la mediana ser la media aritmtica de
esas 2 observaciones centrales.
Ejemplo: 3, 8, 12, 10, 7, 1
Se ordena: 1, 3, 7, 8, 10, 12. El valor central es 7 + 8 / 2 = 7,5 Mediana.
2) La frmula de la mediana para datos agrupados: Para el
clculo de la mediana es necesario utilizar una columna
para las frecuencias acumuladas, y en la clase en donde
se incluyen el 50% de las observaciones se deber
determinar por interpolacin el valor de la mediana
siendo su frmula.
39
c
fm
fai
n
Lri Md

,
_

2
Md = Mediana
Lri = Limite real inferior de la clase mediana
n = Nmero total de observaciones
fai = Sumatoria de las frecuencias acumuladas inferiores a la
mediana
f m = Frecuencia de la clase mediana
c = Intervalo de clase, pero de la clase mediana.
PROPIEDADES DE LA MEDIANA:
1.- Es una medida de tendencia central que ocupa el lugar central de
la serie.
2.- Es un valor central y para su clculo no es necesario conocer todos
los elementos de la serie
3.- Los valores de la variable, grandes o pequeos no influyen en el
clculo de la mediana.
APLICACIONES DE LA MEDIANA:
1.- Se emplea para determinar el valor central de la serie
2.- Se emplea para dividir el rea del polgono de frecuencia en dos
partes iguales.
Ejemplo:
Altura en
pulgadas
Frecuencias
(f)
X fa
frecuencias acumuladas
60 62 5 61 5
63 65 18 64 23
66 68 42 6
7
65
69 71 27 70 92
72 74 8 73 100
--------- -----------
TOTAL 100
40
42 , 67 3
42
3
2
100
5 , 65
2
x c
fm
fi
n
Li Md

,
_

,
_

Lri = Limite real inferior de la clase mediana = 65,5


n = Nmero total de observaciones = 100
fai = Sumatoria de las frecuencias acumuladas inferiores a la
mediana = 23
fm = Frecuencia de la clase mediana = 42
C = Intervalo de clase pero de la clase mediana = 3
3.- LA MODA O MODO:
DEFINICIN: Es el dato que ms veces se repite. Esta ltima medida
de tendencia central es la ms sencilla de las 3 medidas y para su
determinacin, no necesita clculo alguno, basta observar en la
columna de las frecuencias el dato que tiene mayor frecuencia, o que
ms se repite.
2.2; 5.7; 9.99; -10; -10; -11; -12; 18. En este caso el nmero que ms
veces se repite es el nmero -10, por lo tanto ste es la moda.
Por lo general las distribuciones son un modales, es decir slo tienen
una moda, sin embargo es posible que una distribucin tenga varias
modas como por ejemplo si tenemos la serie:
5, 6, 6, 6, 7, 8, 8, 9, 8. Es bimodal, ya que la moda fuera el (6 y 8)
La moda se utiliza para distribuciones de frecuencias con gran
concentracin de datos en la regin, cercana al centro de la
distribucin, esta medida de centralizacin carece de significacin para
distribuciones de pocos datos, la frmula para datos centralizados es:
c Lri Mo
,
_

+
2 1
1
Mo = Moda o modo
Lri = Limite real inferior de la clase modal
41
1
= Incremento 1 = Diferencia la frecuencias de la clase modal y la
frecuencia de inmediata inferior.
2
= Incremento 2 = Diferencia entre la frecuencia de la clase modal
y la frecuencia de la clase inmediata superior.
C = Intervalo de la clase modal.
PROPIEDADES DE LA MODA:
1.- Es el valor que ms se repite en una serie.
2.- La moda no se altera por valores muy grandes que existan en la
serie.
3.- La moda no tiene ninguna significacin en una serie de pocos
elementos y que no se repite ninguno de ellos.
4.- Cuando calculamos la moda en una serie de intervalos de clase,
como lo realizamos anteriormente, solo se obtienen un valor
aproximado.
APLICACIONES DE LA MODA:
1.- Es una medida muy fcil de calcular, pero solo se obtiene un valor
aproximado.
2.- En algunas distribuciones puede no existir, pero en otras
aplicaciones puede haber dos, tres modas, etc. En dichos casos la
distribucin se denomina bimodal, trimodal y multimodal
respectivamente.
3.- Se la emplea para identificar el salario ms comn, la calificacin
que ms se repite, pero en otros casos se tiene muy poca aplicabilidad.
Altura en
pulgadas
Frecuencia
(f)
Marca de clase
(X)
60 - 62 5 61
63 65 18 64
66 68 42* 67
69 71 27 70
72 74 8 73
-----------
-
----------
TOTAL 100
15 27 42 2
24 18 42 1


42
34 , 67 3
15 24
24
5 , 65
2 1
1
X c Li Mo
,
_

+
+
,
_

+
CARACTERISTICAS DE LA MEDIA, LA MEDIANA Y LA MODA.=
a. INTRODUCCION.-
En las partes anteriores hemos aprendido que la media es una medida
de tendencia central en la que la suma de las desviaciones respecto a
ella es cero; que la mediana es la medida de tendencia central que
divide el rea de un histograma o el rea bajo la curva de distribucin
en dos partes iguales, de manera que el nmero de observaciones por
debajo de la mediana es igual al nmero de observaciones por encima
de ella y, por ltimo, que la moda es el valor que se presenta con
mayor frecuencia. En esta parte nos referimos al uso de estas
medidas de tendencia central, a algunas de sus caractersticas y las
relaciones ms importantes que hay entre ellas.
b.- TRATAMIENTO ALGEBRAICO.-
De las tres medidas de tendencia central, la media es la nica que se
presta a tratamientos algebraicos. As, de la expresin de la media
n
X
X

, se desprenden las siguientes relaciones:



X
X
N X N X ; .
Utilizando desarrollos algebraicos se demuestran varias propiedades de
la media, algunas de las cuales se utilizan para calcular el valor de la
media por el llamado mtodo corto o mtodo clave, que es de gran
importancia cuando no se dispone de una calculadora electrnica.
La mediana, al igual que la moda, no se presta para tratamientos
algebraicos como la media aritmtica.
c.- EFECTO DE LOS VALORES EXTREMOS.-
De las tres medidas tendencia central, la media aritmtica es muy
sensible a los valores extremos, en tanto que la mediana y la moda no
son afectadas por los valores de los extremos.
43
EJEMPLO: En la serie 3, 5, 7, 7, 8 la media es 6
5
8 7 7 5 3

+ + + +
; si cambiamos el valor extremo 8
por 18, se tiene la serie 3, 5, 7, 7, 18, cuya media es 8
5
18 7 7 5 3

+ + + +
, es decir, la media
varia de 6 a 8. La mediana, por ser insensible a los valores extremos, no vari al cambiar 8 por 18
y es 7 en ambas series. La moda en ambas series es 7 por ser el valor ms frecuente.
Debido a la gran sensibilidad de la media aritmtica a los valores extremos, muchas veces resulta
que su valor produce efectos engaosos. Por ejemplo, si se est estudiando el ingreso diario de un
grupo de personas y, se tienen los valores $320, 400, 400, 450, 500, 550, 2000, y 2900, a esta
serie le corresponde:
Media = $ 880
Mediana = $ 450
Moda = $ 400
Observe que slo dos personas tiene ingresos altos y las siete
restantes tienen salarios de $ 550 o menos, o sea que en este caso la
media result atpica (no tpica). La mediana de $ 450 y la moda de $
400 resultan ms representativas para esta distribucin. El
conocimiento de las tres medidas de tendencia central da una buena
apreciacin de la distribucin de los valores. Pero si se debe hacer una
apreciacin con una sola de las medidas, es mejor usar la mediana que
corresponde al valor del medio.
d.- EFECTO DE LA ASIMETRA.-
En una distribucin simtrica las tres medidas de la tendencia central
son idnticas, y si la distribucin se torna asimtrica no se produce
cambio en la moda; la mediana y la media se corren en la direccin de
la asimetra. La asimetra es positiva hacia la derecha y negativa hacia
la izquierda. En la asimetra positiva la mediana aumenta por el mayor
nmero de frecuencias hacia la derecha y la media aumenta ms, ya
que hay un incremento en la frecuencia y en el valor de las
observaciones. En las asimetras negativas ocurre lo contrario; la
mediana disminuye y la media se reduce ms que la mediana.
En el siguiente ejemplo se muestra el polgono de frecuencias de la
distribucin de frecuencias agrupadas que se da en el cuadro. El
polgono se construyo utilizando las ordenadas correspondientes a las
marcas de cada clase y en l se muestra la posicin de la media, la
44
mediana y la moda. Para la moda se consider la marca de la clase de
mayor frecuencia; en realidad esta manera de calcular la moda es una
forma aproximada y para su exacta ubicacin en la clase modal existen
mtodos de interpolacin en los que intervienen las frecuencias de las
clases vecinas a la clase modal.
INTERVALO DE CLASE f
16, 5 19,5 1
19,5 22,5 5
22,5 25, 5 9
25,5 28,5 6
28,5 31,5 5
31,5 34,5 4
34,5 37,5 2
---------------------- -------
TOTAL 32
0
1
2
3
4
5
6
7
8
9
10
1 2 3 4 5 6 7 8 9
Marca de clase
f
r
e
c
u
e
c
i
a
s
Serie1
18 21 24 27 30 33 36
Media (X) = 26,7
Mediana (Me) = 26
Moda (Mo) = 24
Mo Me X
e.- Qu MEDIDA DE TENDENCIA CENTRAL ESCOGER?
La medida de tendencia central que debe utilizarse depende de la
informacin que se tenga y del objetivo que se persigue.
Si la distribucin es casi simtrica, pueden utilizarse indistintamente las
tres medidas, que resultan aproximadamente iguales.
45
Si los datos no estn ordenados, puede resultar ms fcil el clculo de
la media aritmtica que el de la mediana; la moda se encuentra por
simple bsqueda del valor ms frecuente.
Si los datos son irregulares y hay algunas en los valores de la clase de
la mediana, esta medida de tendencia central no es buena, ya que su
ubicacin puede resultar falsa.
Si se desea calcular totales, la nica medida utilizable es la media
aritmtica. As, si basados en una experiencia deseamos conocer en
una empresa el posible gasto de energa elctrica para un periodo
futuro, la nica medida que puede usarse es la media.
Si desea ubicarse las condiciones de una persona en una clase, la
mediana resulta la medida ms indicada, ya que por comparacin pone
en evidencia si la persona est por sobre la mitad o por debajo de ella.
4.- MEDIA GEOMTRICA: DEFINICIN.- Se lo define como media
geomtrica al estadgrafo de centralizacin que es igual a la raz
ensima del producto de las Xj observaciones. Esta medida de
centralizacin se caracteriza por dar mayor importancia a los valores
menores o por estar influenciada por dichos valores en una
distribucin, es una que trata de reducir la importancia de los valores
con relacin a los valores menores.
La media geomtrica no es aplicable para el caso en el que uno o unos
de los valores de una muestra sean igual a cero.
FORMULAS PARA DATOS ORIGINALES:
Para facilitar la utilizacin de la formula de la media geomtrica es
conveniente convertir a la misma en operaciones con logaritmos de
manera que las frmulas anteriores expresadas en logaritmos se
describan a continuacin:
n
X
G

log
log PARA DATOS ORIGINALES
46
n
X f
G

log
log PARA DATOS AGRUPADOS
Ejemplo:
Altura en
pulgadas
Frecuencia
(f)
Marca de
clase
(X) Log X f logX

60 - 62 5 61 1.79 8.93
63 - 65 18 64 1.81 32.51
66 - 68 42 67 1.83 76.69
69 - 71 27 70 1.85 49.82
72 - 74 8 73 1.86 14.91
------------------ -----------------
total 100 182.86
La media geomtrica es til en el clculo de tasa de crecimiento.
5.- MEDIA ARMONICA.-
Se lo define como el estadgrafo que es igual al reciproco de la media
aritmtica del reciproco de los nmeros a semejanza de la media
geomtrica, es una medida que esta influenciada por los valores
pequeos de la distribucin e igual que la medida geomtrica cuando
uno de los valores de la variable es igual a cero, la media armnica
deja de ser representativa, esta medida es utilizada especialmente
para la determinacin de velocidades medias, as como tambin en el
consumo o gasto del presupuesto familiar.
H= media armnica.

X
n
H
1
Datos simples
47

X
f
n
H
Datos agrupados.
Ejemplo:
Altura pulg. f x f/x

60 - 62 5 61 0.082
63 - 65 18 64 0.28
66 - 68 42 67 0.63
69 - 71 27 70 0.39
72 - 74 8 73 0.11
total 100 1.49
6.- CUANTILAS: CUARTILES, DECLES Y PERCENTILES O (centiles):
La frmula general para hallar su ubicacin es:
En donde:

p
L
Es el sitio, lugar o la posicin del percentil buscado en una serie ordenada.
n = Es el nmero de observaciones
p = es el percentil buscado.
CUARTILES, PARA DATOS ORIGINALES:
Es la serie que dividen en cuatro partes, sus frmulas son:
( )
100
25
* 1
25
+ n L
=
4
1
1
+

n
PosQ
( )
100
50
* 1
50
+ n L
=Me=
2
1
2
+

n
PosQ
( )
100
75
* 1
75
+ n L
=
4
) 1 ( 3
3
+

n
PosQ
DECILES, PARA DATOS ORIGINALES:
48
32 . 67
48536 . 1
100
H
( )
100
* 1
p
n L
p

Es la serie que divide en 10 partes iguales, sus frmulas son:
( )
10
1
* 1
1
+ n L
=
( )
10
1
1
+

n
PosD
( )
10
3
* 1
3
+ n L
=
( )
10
1 3
3
+

n
PosD
( )
10
5
* 1
5
+ n L
=Me=
( )
2
1
5
+

n
PosD
( )
10
9
* 1
9
+ n L
=
( )
10
1 9
9
+

n
PosD
PERCENTILES O CENTILES, PARA DATOS ORIGINALES:
Es la serie que divide en 100 partes iguales, sus frmulas son:
( )
100
10
* 1
10
+ n L
=
( )
10
1
10
+

n
PosP
( )
100
30
* 1
30
+ n L
=
( )
10
1 3
30
+

n
PosP
( )
100
50
* 1
50
+ n L
=Me=
( )
2
1
50
+

n
PosP
( )
100
90
* 1
90
+ n L
=
( )
10
1 9
90
+

n
PosP
Ejemplo: Ordenar los siguientes datos que corresponden a una serie simple y calcular los cuartles
uno, dos y tres, los deciles uno, tres y nueve:; y, los percentiles diez, cincuenta y noventa.
La edad de los trabajadores es: 33, 26, 66, 45,28, 59, 33, 36, 26, 45, 62, 45. n=12
Primeramente ordenamos los nmeros:
X= 26 26 28 33 33 36 45 45 45 59 62 66
Posici
n
1 2 3 4 5 6 7 8 9 10 11 12
Calcular los cuartles: uno, dos y tres:
49
Cuartil 1:
25 , 3
4
1 12
4
1
1

+

n
Q
Observamos que la respuesta es 3,25; o sea esta entre la 3 y la 4 posicin. Esta a 0,25 de la
distancia entre ellos. Como el tercer valor es 28, y el cuarto es 33, obtenemos restando el valor de
33 28 = 5. Para obtener el valor lo que realizamos es una multiplicacin entre la diferencia que
salio (5) y la distancia entre la tercera y la cuarta posicin que es (0,25); entonces, (5)*(0,25) =
1,25. Para determinar el cuartil 1 lo que tenemos que hacer es sumar la tercera posicin que es
(28) ms 1,25 que salio de la multiplicacin entonces el cuartil 1 es igual a:
25 , 29 25 , 1 28
1
+ Q
Cuartil 2:
5 , 6
4
1 12
2
1
2

+

n
Q
O sea 45 36 = 9; luego 9*(0,50) = 4,5.
Luego se suma la posicin 6 que es igual a 36 + 4,5 = 40,5
Cuartil 3:
75 , 9
4
) 1 12 ( * 3
4
) 1 ( * 3
3

+

n
Q
O sea 59 45 = 14; luego 14*(0,75) = 10,50
Luego se suma la posicin 9 que es igual a 45 + 10,50 = 55,5
Calcular los deciles: uno, tres y nueve:
Decil 1:
3 , 1
10
13
10
1 12
10
1
1

+

n
D
O sea 26, aqu se da un caso que entre 1 y 2 son las mismas cantidades por lo
tanto el decil 1 es igual a 26.
Decil 3:
50
9 , 3
10
39
10
) 1 12 ( 3
10
) 1 ( 3
3

+

n
D
O sea 33 28 = 5; luego 5 * (0,90) = 4,5
Luego se suma la posicin 3 que es igual a 28 + 4,5 = 32,5
Decil 9:
70 , 11
10
117
10
) 1 12 ( 9
10
) 1 ( 9
9

+

n
D
O sea entre las posiciones 12 y 11 que es 66 62 = 4; luego 4 * (0,70) = 2,80.
Luego se suma el valor de la posicin 11 que es igual 62 + 2,80 = 64,8
Calcular los centiles o percentiles: diez, cincuenta y noventa
Centil o percentil 10:
3 , 1
100
13
10
) 1 12 ( 1
100
) 1 ( 10
10

+

n
P
Igual que en el decil entre la posicin 1 y la 2 es la misma cantidad por lo tanto el
centil es igual a 26.
Centil o percentil 50:
5 , 6
2
13
2
) 1 12 ( 1
100
) 1 ( 50
10

+

n
P
O sea entre la posicin 6 y 7, 45 36 = 9; luego 9 * (0,50) = 4,5.
Luego se suma el valor de la posicin 6 que es 36 + 4,5 = 40,5
Centil o percentil 90:
70 , 11
10
117
10
) 1 12 ( 9
100
) 1 ( 90
90

+

n
P
O sea entre la posicin 11 y 12, 66 62 = 4; luego 4 * (0,70) = 2,8
Luego se suma el valor de la posicin 11 que es 62 + 2,8 = 64,80
51
CUARTILES, DECILES Y PERCENTILES PARA DATOS AGRUPADOS
CON FRECUENCIAS:
Se calculan de la misma manera que la mediana, solo que se cambia la
frmula de posicin, por la que corresponda.
Se encuentra la posicin del cuartil, decil o percentil que se desee
calcular con las frmulas utilizadas para una serie estadstica.
Se calcula el valor del cuaritl, decil o percentil con las siguientes
frmulas.
CUARTILES DECILES CENTIL
C
f
fa
N
L Q
i
.
4
1

+
C
f
fa
N
L D
i
.
10
1

+ C
f
fa
N
L P
i
.
100
10
10

+
C
f
fa
N
Li Q .
4
2
2

+ C
f
fa
N
L D
i
.
10
2
2

+ C
f
fa
N
L P
i
.
100
20
20

+
C
f
fa
N
Li Q .
4
3
3

+ C
f
fa
N
L D
i
.
10
3
3

+ C
f
fa
N
L P
i
.
100
30
30

+
C
f
fa
N
L D
i
.
10
4
4

+ C
f
fa
N
L P
i
.
100
40
40

+
C
f
fa
N
L D
i
.
10
5
5

+ C
f
fa
N
L P
i
.
100
50
50

+
C
f
fa
N
L D
i
.
10
6
6

+ C
f
fa
N
L P
i
.
100
60
60

+
C
f
fa
N
L D
i
.
10
7
7

+ C
f
fa
N
L P
i
.
100
70
70

+
C
f
fa
N
L D
i
.
10
8
8

+ C
f
fa
N
L P
i
.
100
80
80

+
C
f
fa
N
L D
i
.
10
9
9

+ C
f
fa
N
L P
i
.
100
90
90

+
EJEMPLO:
Calcular el decil SIETE de la siguiente tabla estadstica:
X f fai
101 - 300 12 12
52
301 - 500 17 29
501 - 700 6 35
701 - 900 10 45
901 - 1100 12 57
1101 - 1300 8 65
1301 - 1500 6 71
TOTAL 71
Primeramente calculo la posicin 7 que es igual:
( ) ( )
4 , 50
10
504
10
1 71 7
10
1 7
7

+

n
D
Se encuentra la clase que contiene la posicin del decil siete, la misma que
corresponde al intervalo 901 1100
5 , 978 78 5 , 900
200 *
12
7 , 4
5 , 900 200 *
12
45
10
) 71 ( 7
5 , 900 .
10
7
7
+
+

+ C
f
fa
N
L D
i
EJERCICIOS PROPUESTOS:
1.- LAS NOTAS DE UN ESTUDIANTE HAN SIDO 85, 76, 93, 82 Y 96. HALLAR
SU MEDIA ARITMTICA POR LOS DOS METODOS.
Calificaciones.
85
76
93
82
96
432

2.- LOS TIPOS DE REACCIN DE UN INDIVIDUO ENTRE DIVERSOS
ESTMULOS, MEDIOS POR UN PSICLOGO, FUERON 0.53, 0.46, 0.50, 0.49,
0.52, 0.53, 0.44 Y 0.55 SEGUNDOS RESPECTIVAMENTE. DETERMINAR SU
TIEMPO MEDIO DE REACCIN POR LOS DOS METODOS.
3.- UN CONJUNTO DE NMEROS CONTIENE 6 SEISES, 7 SIETES, 8 OCHOS,
9 NUEVES Y 10 DIECES CUL ES SU MEDIA ARITMTICA?
53
Nmeros F
6 6
7 7
8 8
9 9
10 10
total 40
4.- EN LABORATORIO, TEORA Y PROBLEMAS DE FSICA UN ESTUDIANTE
HA SACADO 71, 79,89 PUNTOS RESPECTIVAMENTE
a) CON PESOS 2, 4,5 ASIGNADOS RESPECTIVAMENTE A ESAS PRUEBAS
CUAL ES SU PUNTUACIN MEDIA?
b) DEM CON LOS TRES PESOS IGUALES: DATOS: 71, 78, 89
5.- TRES PROFESORES DE ECONOMA DIERON NOTAS MEDIAS EN SUS
CURSOS, CON 32, 25 Y 17 ESTUDIANTES DE 79, 74 Y 82 PUNTOS,
RESPECTIVAMENTE. HALLAR LA PUNTUACIN MEDIA DE LOS TRES
CURSOS.
6.- LA TABLA MUESTRA LA DISTRIBUCIN DE CARGAS MXIMAS EN
TONELADAS CORTAS (1 TONELADA CORTA = 2000 LB.) QUE SOPORTAN
LOS CABLES PRODUCIDOS EN CIERTA FBRICA. DETERMINAR LA CARGA
MXIMA MEDIA, USANDO LOS TRES METODOS:
CARGA MXIMA
(toneladas cortas)
NMERO DE
CABLES
9,3 - 9,7 2
9,8 - 10,2 5
10,3 - 10,7 12
10,8 - 11,2 17
11,3 - 11,7 14
11,8 - 12,2 6
12,3 - 12,7 3
12,8 - 13,2 1
TOTAL 60
7.- HALLAR LA
X
PARA LOS DATOS DE LA TABLA, USANDO:
a) El mtodo largo
b) El mtodo de compilacin
X F Fx Dj Fdj
462 98
480 75
498 56
516 42
534 30
552 21
570 15
588 11
606 6
624 2
Total 356
54
8.- LA TABLA MUESTRA LA DISTRIBUCIN DE LOS DIMETROS DE LOS
REMACHES SALIDOS DE UNA FBRICA. CALCULAR EL DIMETRO MEDIO.
DIMETRO F
0,7247 - 0,7249 2
0,7250 - 0,7252 6
0,7253 - 0,7255 8
0,7256 - 0,7258 15
0,7259 - 0,7261 42
0,7262 - 0,7264 68
0,7265 - 0,7267 49
0,7268 - 0,7270 25
0,7271 - 0,7273 18
0,7274 - 0,7276 12
0,7277 - 0,7279 4
0,7280 - 0,7282 1
TOTAL 250
9.- CALCULAR LA MEDIA PARA LOS DATOS DE LA TABLA
Clase f x
(x-
A)
fd
j
10 15 3 12.5
15 20 7 17.5
20 25 16 22.5
25 30 12 27.5
30 35 9 32.5
35 40 5 37.5
40 45 2 42.5
5
4
10.- Hallar la media y la mediana de estos conjuntos de nmeros:
a) 5, 4, 8, 3, 7, 2, 9
b) 18.3, 20.6, 19.3, 22.4, 20.2, 18.8, 19.7, 20.0
55
11.- Hallar la puntuacin media del problema
76, 82, 85, 93, 96
12.- Hallar la mediana del tiempo de reaccin del problema:Los tipos de
reaccin de un individuo ante diversos estmulos, medidos por un psiclogo,
fueron 0.53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44 y 0.55 segundos,
respectivamente. Determinar su tiempo medio de reaccin.
13.- Hallar la mediana de las cargas mximas del problema:La tabla
muestra la distribucin de cargas mximas en toneladas cortas (1 tonelada
corta = 2000 lb.) que soportan los cables producidos en cierta fbrica.
CARGA MXIMA
(toneladas cortas)
F F. a
9,3 - 9,7 2 2
9,8 - 10,2 5 7
10,3 - 10,7 12 19
10,8 - 11,2 17 36
11,3 - 11,7 14 50
11,8 - 12,2 6 56
12,3 - 12,7 3 59
12,8 - 13,2 1 60
TOTAL 60
14.- HALLAR LA MEDIANA PARA LA DISTRIBUCIN DEL PROBLEMA:
OBSERVACIONES f X Fa
453 471 98
472 488 75
489 507 56
508 524 42
525 543 36
544 560 21
561 579 15
580 596 11
597 615 6
616 - 632 2
TOTAL 362
15.- Hallar la mediana, la media, la moda de cada uno de estos conjuntos:
a) 7, 4, 10, 9, 15, 12, 7, 9, 7
b) 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7
56
16.- HALLAR LA MODA DEL PROBLEMA: Las notas de un estudiante han sido
85, 76, 93, 82 y 96.
17.- HALLAR EL TIEMPO DE REACCIN MODAL EN EL PROBLEMA
0.44 0.46 0.49 0.50 0.52 0.53 0.53 0.55
18.- HALLAR LA MODA DEL CONJUNTO DE DATOS DEL PROBLEMA
19) HALLAR LA MODA DE LAS CARGAS MXIMAS DEL PROBLEMA:
toneladas # de cables x
9.3 9.7 2
9.8 10.2 5
10.3 10.7 12
10.8 11.2 17
11.3 11.7 14
11.8 12.2 6
12.3 12.7 3
12.8 13.2 1
60
20.-HALLAR EL DIMETRO MODAL DE LOS REMACHES DE LA TABLA
21.- HALLAR LA MODA DE LA DISTRIBUCIN DEL SIGUIENTE PROBLEMA
CLASE FRECUENCIA
10 HASTA 15 3
f x
0.7247 - 0.7249 2
0.7250 - 0.7252 6
0.7253 - 0.7255 8
0.7256 - 0.7258 15
0.7259 - 0.7261 42
0.7262 - 0.7264 68
0.7265 - 0.7267 49
0.7268 - 07270 25
0.7271 - 0.7273 18
0.7274 - 0.7276 12
0.7277 - 0.7279 1
250
57
15 HASTA 20 7
20 HASTA 25 16
25 HASTA 30 12
30 HASTA 35 9
35 HASTA 40 5
40 HASTA 45 2
TOTAL 54
22.-HALLAR LA MEDIA GEOMTRICA DE LOS NMEROS:
a) 4.2 Y 16.8 b) 3.00 Y 6.00

23.- HALLAR A) LA MEDIA GEOMTRICA Y B) LA MEDIA ARITMTICA DE
LOS NMEROS 2, 4, 8, 16, 32
24.- HALLAR LA G DE LA DISTRIBUCIN DE LOS PROBLEMAS Y COMPARAR
LA MEDIA GEOMTRICA ES MENOR O IGUAL A LA
X
PARA ESTOS CASOS.
CARGA MXIMA
(toneladas cortas)
F X Log x f. log x
9,3 - 9,7 2 9,5
9,8 - 10,2 5 10
10,3 - 10,7 12 10,5
10,8 - 11,2 17 11
11,3 - 11,7 14 11,5
11,8 - 12,2 6 12
12,3 - 12,7 3 12,5
12,8 - 13,2 1 13
TOTAL 60
25.- HALLAR LA MEDIA ARMNICA DE LOS NMEROS A) 2, 3, 6, B) 3.2,
5.2, 4.8, 6.1, 4.2
26.- HALLAR A) LA MEDIA ARITMTICA, B) LA MEDIA GEOMTRICA Y C)
LA MEDIA ARMNICA DE LOS NMEROS 0, 2,4 Y 6
27.- USAR EL PROBLEMA PARA HALLAR LA MEDIA ARMONICA DE LAS
DISTRIBUCIONES DE:
Altura F X F/X
60 65 5
63 65 18
58
66 68 42
69 71 27
72 74 8
TOT
AL 100
28.- DEL EJERCICIO 6, CALCULAR EL CUARTEL 2 Y 3
29.- DEL EJERCICIO 7 CALCULAR EL DECIL 5, 7, 8, 9
30.- DEL EJERCICIO 8 CALCULAR EL CENTIL 38, 45,75,89,15
CAPITULO IV
MEDIDAS DE DISPERSIN.
59
POR QU ESTUDIAR LA DISPERSIN?
Luego de determinar las medidas de tendencia central (punto medio)
de un conjunto de observaciones es importante tener una idea de cun
dispersas se encuentran dichos datos. Las medidas descriptivas que
permitan especificar esta caracterstica se denominan medidas de
dispersin o medidas de variabilidad.
Una pequea medida de dispersin indica que los datos se
encuentran muy agrupados.
Una medida de dispersin grande indica que los datos estn
ampliamente extendidos.
MEDIDAS DE DISPERSION.- La amplitud de variacin o intervalo se
basa en la localizacin de los valores ms grande y ms pequeo de un
conjunto de datos. La desviacin media, la varianza y la desviacin
estndar se basan en las desviaciones respecto de la media.
AMPLITUD (O INTERVALO) DE VARIACION.-
La medida de dispersin ms sencilla es la amplitud de variacin. Se
trata de la diferencia entre el valor ms grande y el ms pequeo de
un conjunto de datos. Nos indica el recorrido de los datos observados
de la variable que se investiga. Expresada como ecuacin:
AMPLITUD DE VARIACION = Valor ms grande Valor ms pequeo
Ejemplo: Determine la amplitud de variacin del nmero de computadoras producidas en las
plantas industriales de Quito y Guayaquil. Interprete los dos intervalos.
La amplitud de variacin en la produccin diaria de computadoras en la planta de Quito es 4, se
obtiene de la diferencia entre la produccin diaria mayor, que es 52, y la menor, que es 48. La
amplitud de variacin de la produccin diaria en la planta de Guayaquil es 20 computadoras, ya que
20 = 60 40. Por tanto, puede concluirse que: 1.- Hay menos dispersin en la produccin diaria en
la planta de Quito que en la de Guayaquil, porque la amplitud de variacin de 4 computadoras es
menor que la de 20 computadoras, y 2.- La produccin en la planta de Quito se acumula ms cerca
de la media de 50, que la produccin en la planta de Guayaquil (porque el intervalo de variacin
de 4 es menor que uno de 20). De esta forma, la produccin media en la planta de Quito (50
computadoras) es un promedio ms representativo que la media de 50 computadoras para la
planta de Guayaquil.
60
AMPLITUD DE VARIACION CON FRECUENCIAS:
Recurdese que la amplitud (o intervalo de variacin) se define como
la diferencia entre el valor ms grande y el ms pequeo de una
poblacin. Para calcular la amplitud de variacin a partir de datos
agrupados en una distribucin de frecuencias, se resta el lmite inferior
de la clase ms baja, del lmite superior de la clase ms alta
1) Supngase que se agrup una muestra de 47 sueldos por hora (en dlares) en la siguiente
distribucin de frecuencias.
Sueldo por hora (en dlares) Frecuencias
5 hasta 10 6
10 hasta 15 12
15 hasta 20 19
20 hasta 25 7
25 hasta 30 3
La amplitud de variacin es de 25, que se obtiene 30 5
AT = X max X min AT = 30 5 AT = 25
DESVIACION MEDIA: Es el promedio aritmtico de los valores
absolutos de las desviaciones con respecto a la media aritmtica.
En trminos de una formula queda:
n
X X
DM

Donde:
X
Es el valor de cada desviacin
X Es la media aritmtica de los valores
n Es el nmero de observaciones en la muestra.
ll Indica el valora absoluto. En otras palabras, cuando no se
toman en cuenta los signos algebraicos de las desviaciones respecto de
la media.
Por qu no se consideran los signos de las desviaciones respecto de la
media? Si no se hiciera as, las desviaciones positivas y negativas se
compensaran, y la desviacin media siempre sera igual a cero. Tal
61
medida (cero) sera un valor estadstico intil. Como se consideran
desviaciones absolutas, la desviacin media suele denominarse
tambin desviacin media absoluta, simbolizada por DMA.
Generalmente se abreviar como DM.
Ejemplo: El nmero de pacientes atendidos en la sala de urgencias del Hospital Regional, para una
muestra de 5 das el ao pasado fue: 103, 97, 101, 106 y 103. Determine e interprete la desviacin
media.
La desviacin media es el promedio segn el cual las observaciones individuales se desvan
respecto de la media aritmtica. Para obtener la desviacin media de un conjunto de datos, se
comienza evaluando la media aritmtica. La media del nmero de pacientes es 102, valor obtenido
de (103 + 97 + 101 + 106 + 103) /5. Despus se determina la magnitud en que cada observacin
se desva respecto de la media. Luego se suman esas diferencias, omitiendo sus signos, y se divide
la suma entre el nmero de observaciones. El resultado es el valor medio en que las observaciones
se desvan con respecto al promedio. Un valor pequeo en la desviacin indica que la media es
representativa de los datos, en tanto que un valor grande en la desviacin indica dispersin en los
datos. A continuacin se muestran los detalles de los clculos utilizando la formula.
Nmero de casos
( ) X X
Desviacin absoluta
103 (103 102) = 1 1
97 (97 102) = - 5 5
101 (101 102) = -1 1
106 (106 102) = 4 4
103 (103 102) = 1 1
TOTAL 12
n
X X
DM

4 , 2
5
12
DM
La desviacin media es 2,4 pacientes por da. El nmero de esta varia, en promedio, en 2,4
pacientes por da respecto de la media de 102 enfermos diarios.
La desviacin media tiene dos ventajas. Primero, utiliza en su clculo
todos los valores en la muestra. Segundo, es fcil de comprender, pues
representa el promedio en que los valores se desvan con respeto a la
media. Sin embargo, su principal desventaja es el uso de valores
absolutos, ya que generalmente es difcil trabajar con ellos. En
consecuencia, la desviacin media no se usa con la misma frecuencia
que las otras medidas de dispersin, como es el caso de la desviacin
estndar.
2.1.- DESVIACION MEDIA DE UNA SERIE ESTADISTICA DE
FRECUENCIAS.
62
La desviacin media de una serie estadstica de frecuencia se la
obtiene con la siguiente frmula:
n
X X f
DM

que es la misma
anterior, solamente se introduce un nuevo elemento que es la
frecuencia.
EJEMPLO:

El peso en Kg., registrado para un grupo de seoritas es:
X f
51 1
50 2
49 3
48 5
47 3
46 2
45 2
44 1
Hallar la desviacin media:
a) Obtenemos la media aritmtica
n
fx
X

b) Se resta la media de cada valor


c) Se multiplican la frecuencia por las desviaciones absolutas.
d) Se divide la suma de los productos entre el nmero de
valores.
X f f*X
X X X X f *
51 1 51
37 , 3
3,37
63
50 2 100
37 , 2
4,74
49 3 147
37 , 1
4,11
48 5 240
37 , 0
1,85
47 3 141
63 , 0
1,89
46 2 92
63 , 1
3,26
45 2 90
63 , 2
5,26
44 1 44
63 , 3
3,63
-------- ----- -----
-
---------
TOTAL 19 905 28,11
Kg
n
fX
X 63 , 47
19
905


Kg
n
X X f
DM 48 , 1
19
11 , 28


1,48 Kg. Es el valor con el cual cada valor de la variable difiere con respecto a la media aritmtica.
2.2.- DESVIACION MEDIA DE UNA SERIE ESTADISTICA DE
INTERVALOS.-
La frmula que nos permite hacer los clculos correspondientes a la
desviacin media de una serie estadstica de intervalos es:
n
X X f
DM

En donde:
DM = Desviacin media

X X f
= Sumatoria del producto de las frecuencias por las
desviaciones.
n = Nmero de casos.
EJEMPLO:
64
Mediante la aplicacin de un cuestionario se recogieron los siguientes datos, que tienen relacin
con la edad de un grupo de personas.
X f
16 19 4
20 23 3
24 27 2
28 31 8
32 35 12
36 39 20
40 43 10
44 47 5
48 51 0
52 55 1
--------- --------
TOTAL 65
Hallar la desviacin media: Para trabajar seguimos los siguientes pasos:
a) Obtenemos los puntos medios
2
Li Ls +
b) Se determina la media aritmtica.
n
fX
X

c) Se encuentra las desviaciones


X X
d) Se determina el producto de las frecuencias por las
desviaciones
X X f *
e) Se suma aritmticamente el producto de las desviaciones por
las frecuencias y se divide para el nmero de casos.
X f X f*X
X X
f* X X
65
16 - 19 4 17,5 70
42 , 17
69,68
20 23 3 21,5 64,5
42 , 13
40,26
24 27 2 25,5 51
42 , 9
18,84
28 31 8 29,5 236
42 , 5
43,36
32 35 12 33,5 402
42 , 1
17,04
36 39 20 37,5 750
58 , 2
51,60
40 43 10 41,5 415
58 , 6
65,80
44 47 5 45,5 227,5
58 , 10
52,90
48 51 0 49,5 0
58 , 14
0
52 55 1 53,5 53,5
58 , 18
18,58
---------- -------- --------
-
---------
TOTAL 65 2269,5 378,06
Kg
n
fX
X 92 , 34
65
5 , 2269


aos
n
X X f
DM 82 , 5
65
06 , 378


5,82 aos es el valor que indica con cuanto se separan las edades de cada una de las personas con
respecto a la media.
VARIANZA Y DESVIACIN ESTNDAR:
VARIANZA: La media aritmtica de las desviaciones cuadrticas con
respecto a la media
Cabe indicar que la varianza es no negativa, y es cero solamente si
todas las observaciones son iguales
DESVIACION ESTANDAR: La raz cuadrada positiva de la varianza.
VARIANZA POBLACIONAL: Las frmulas para la varianza poblacional y
la varianza muestral son un poco diferentes. Primero se considerar la
varianza poblacional (Recurdese que una poblacin es la totalidad de
las observaciones o datos que se estudian). La varianza poblacional de
66
datos no agrupados, es decir, los datos que no estn tabulados en una
distribucin de frecuencias, se obtienen por medio de la frmula.
VARIANZA POBLACIONAL
DATOS ORIGINALES
( )
N
U X

Donde:
2

Es el smbolo de la varianza de una poblacin (

es la letra
griega sigma minscula). Se expresa comnmente como sigma al
cuadrado
X Es el valor de una observacin en la poblacin
U Es a media aritmtica de la poblacin
N Es el nmero total de observaciones en la poblacin.
Ejemplo: Las edades de los pacientes del pabelln de aislados en el Hospital XYZ, son 38, 26, 13,
41 y 22 aos. Cul es la varianza de esa poblacin?.
( )
8 , 106
5
534
28
5
140
;
2
2

N
U X
N
X
U

La suma de las desviaciones de la media debe ser


igual a cero.
Igual que la amplitud de variacin y la desviacin media, la varianza se utiliza para comparar la
dispersin en dos o ms conjuntos de observaciones. Por ejemplo, se calcul que 106,8 es la
varianza de las edades de los pacientes del pabelln. Si tal medida para las edades de todos los
enfermos de cncer en el hospital es 342,9, puede decirse que:
1) hay menos dispersin en la distribucin de las edades de los hospitalizados en aislamiento, que
en la de los pacientes de cncer (porque 106,8 es menor que 342,9);
2) las edades de los pacientes aislados se acumulan ms cerca de la media de 28 aos, que las de
los enfermos de cncer. De modo que, la edad media para aqullos es un promedio ms
representativo en comparacin con la media para todos los pacientes que padecen enfermedades
cancerosas.
DESVIACION ESTNDAR POBLACIONAL:
EDAD (X) X - U
( )
2
U X
38 10 100
26 - 2 4
13 - 15 225
41 13 169
22 - 6 36
-----------
-
------- ----------
140

0
534
67
La interpretacin de la amplitud de variacin y la desviacin media es
fcil. La primera, es la diferencia entre los valores ms alto y ms bajo,
de un conjunto de datos. La segunda es el promedio de las
desviaciones respecto a la media. Sin embargo, resulta difcil
interpretar la varianza para un solo conjunto de observaciones. La
varianza de 106,8 para las edades de los pacientes en aislamiento, no
est en trminos de aos, sino en aos al cuadrado.
Al obtener la raz cuadrada de la varianza poblacional, se transforma a
un valor que tiene la misma unidad de medicin que se utiliza en los
datos originales. La raz cuadrada de 106,8 aos al cuadrado, es 10,3
aos. A esta magnitud: raz cuadrada de la varianza poblacional, se
denomina desviacin estndar poblacional. Una frmula para datos no
agrupados es:
DESVIACION ESTANDAR POBLACIONAL
PARA DATOS ORIGINALES
( )
N
U X

Tenemos dos frmulas de la Varianza y estas son:


VARIANZA MUESTRAL FRMULA DE LA DESVIACIN PARA DATOS
ORIGINALES
( )
1
2
2


n
X X
S
VARIANZA MUESTRAL FRMULA DIRECTA PARA DATOS ORIGINALESS

( )
1
2
2
2



n
n
X
X
S
EJERCICIOS:
1) Las edades de los pacientes del pabelln de aislados en el Hospital TWX, SON 38, 26, 13, 41, 22.
Cul es la varianza de esa poblacin y la desviacin estndar?
28 ;
5
140
;
5
22 41 13 26 38
;
+ + + +


N
X
U
68
Varianza poblacional
( )
80 , 106 ;
5
534
;
2
2
N
U X





Desviacin estndar
( )
33 , 10 ; 80 , 106 ;
2
N
U X



2) Los salarios por hora en una muestra de operarios de medio tiempo en la empresa FRUIT
PACKERS, son (en dlares); 2, 10, 6, 8, 9. Cul es la varianza muestral?
a) Varianza muestral
7 ;
5
9 8 6 10 2
;
+ + + +


n
X
X
( )
;
1 5
40
;
1
2
2


n
X X
S
cuadrado al S 10 $
2

Formula directa:
( )
1
2
2
2



n
n
X
X
S
( )
cuadrado al S 10 ;$
1 5
5
35
285
2
2

b) La desviacin estndar es:


DDlare S S 16 , 3 ; 10 ;
2

EJEMPLO: Los salarios por hora en una muestra de operarios de medio tiempo en la empresa Fruit,
son (en dlares): $ 2, 10, 6, 8, 9. Cul es la varianza muestral?
Edad (X)
( ) U X
( )
2
U X
38 10 100
26 - 2 4
13 - 15 225
41 13 169
22 - 6 36
----------- ---------- ----------
5 0 534
Salarios por hora (X)
( ) X X
( )
2
X X
2 - 5 25
10 3 9
6 - 1 1
8 1 1
9 2 4
------------------------ -------- ----------
75 0 40
Salario por hora (X)
( )
2
X
2 4
10 100
6 36
8 64
9 81
---------------------- ------
35 285
69
La varianza muestral se calcula utilizando dos mtodos. A la izquierda se presenta el mtodo de la
desviacin, utilizando la frmula
( )
1
2
2


n
X X
S
. A la derecha se indica el mtodo directo, en
el que se aplica la frmula
( )
1
2
2
2

n
n
X
X
S
7
5
35
;

n
X
X
EMPLEANDO LAS DESVIACIONES
AL CUADRADO CON RESPECTO A
LA MEDIA
( )
1
2
2


n
X X
S
10 ;
1 5
40
2

S (Dlares al cuadrado)
USANDO LA FORMULA
DIRECTA
Salario por hora
(X)
2
X
2 4
10 100
6 36
8 64
9 81
-------------------- -----
35 285
Salario
Por hora
(X)
( ) X X
( )
2
X X
2 - 5 25
10 3 9
6 1 1
8 1 1
9 2 4
--------- --------- ---------
35 0 40
70
( )
1
2
2
2



n
n
X
X
S

( )
10
1 5
40
;
1 5
5
35
285
2
2

S
(Dlares al cuadrado)
DESVIACION ESTANDAR MUESTRAL: Este concepto se utiliza como un
estimador de la desviacin estndar poblacional. Segn se indic
antes, esta ltima es la raz cuadrada de la varianza de la poblacin.
En forma semejante, la desviacin estndar muestral es la raz
cuadrada de la varianza muestral. La desviacin muestral para datos
no agrupados se obtiene fcilmente como sigue:
DESVIACION MUESTRAL
ESTANDAR FORMULA
( )
2
2
2
;
1
S S o
n
n
X
X
S



DIRECTA
EJEMPLO: La varianza muestral en el ejemplo anterior de los salarios por hora result ser igual a
10. Cul es la desviacin estndar de la muestra?
La desviacin estndar muestral es $ 3,16 (dlares), que se obtiene de
10
. Observe de nuevo
que la varianza muestral est en trminos de dlares al cuadrado, pero al obtener la raz cuadrada
de 10 resulta $ 3,16 en dlares simples, y por tanto est en las mismas unidades monetarias que
los datos originales.
OTROS METODOS DE LA VARIANZA PARA DATOS ORIGINALES.-
PRIMER METODO
( )
n
X X
S

2
2
EJEMPLOS:
Calculamos primero la media aritmtica
10, 12, 2, 9, 15, 6, 7, 8, 12, 9
9
10
90
10
9 12 8 7 6 15 9 2 12 10

+ + + + + + + + +


n
X
X
71
Luego aplicamos la frmula de la varianza por el mtodo:
( )
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
8 , 11
10
9 9 9 12 9 8 9 7 9 6 9 15 9 9 9 2 9 12 9 10
2
2 2 2 2 2 2 2 2 2 2
2
2
2

+ + + + + + + + +


S
S
n
X X
S
SEGUNDO METODO
10, 12, 2, 9, 15, 6, 7, 8, 12, 9
9
10
90
10
9 12 8 7 6 15 9 2 12 10

+ + + + + + + + +


n
X
X
8 , 11 81
10
928
9
10
9 12 8 7 6 15 9 2 12 10
2
2
2 2 2 2 2 2 2 2 2 2
2
2
2
2

+ + + + + + + + +



S
S
X
n
X
S
LA VARIANZA PARA DATOS AGRUPADOS.-
PRIMER METODO:
Hallar la varianza de la siguiente tabla de frecuencias:
Intervalo f X
Marca de
clase
fX
X X X X f ( )
2
X X
( )
2
X X f
27 29 1 28 28 9 9 81 81
30 32 10 31 310 6 60 36 360
33 35 14 34 476 3 42 9 126
36 38 33 37 1221 0 0 0 0
39 41 14 40 560 3 42 9 126
42 44 7 43 301 6 42 36 252
72
45 47 3 46 138 9 27 81 243
----------- --- --------- ----- ------- --------
TOTAL 82 3034 222 1188
( )
49 . 14
82
1188
37
82
3034
2
2

n
X X f
S
n
fX
X
PROCEDIMIENTOS ABREVIADOS PARA EL CLCULO DE LA
VARIANZA.
El procedimiento de la varianza puede simplificarse mediante procedimientos
que son una generalizacin de los ya presentados en relacin al clculo de la
media aritmtica.
VARIANZA CON DATOS AGRUPADOS CON FRECUENCIAS:
PRIMER METODO DE COMPILACIN:
( )
n
X X f
S

2
2
EJEMPLO:
Altura En
pulgadas
Frecuencia
(f)
Marca de Clase
(X)
fX
( ) X X
( )
2
X X ( )
2
X X f
60 62 5 61 305 - 6,45 41,60 208
63 65 18 64 1152 - 3,45 11,90 214,2
66 68 42 67 2814 - 0,45 0,20 8,4
69 71 27 70 1890 2,55 6,50 175,5
72 74 8 73 582 5,55 30,80 246,4
-----------
-
---------- --------
-
-----------
TOTAL 100 6745 852,5
( )
45 , 3 45 , 67 64
45 , 6 45 , 67 61
45 , 67
100
6745




X X
n
fX
X
73
( )
52 , 8
100
5 , 852
2
2


n
X X f
S
SEGUNDO METODO:
2 2
2
X X S
Altura En
pulgadas
Frecuencia
(f)
Marca de Clase
(X)
fX
2
X
2
fX
60 62 5 61 305 3721 18605
63 65 18 64 1152 4096 73728
66 68 42 67 2814 4489 188538
69 71 27 70 1890 4900 132300
72 74 8 73 582 5329 42632
-----------
-
---------- --------
-
-----------
TOTAL 100 6745 455803
2 2
2
X X S
53 , 8
100
6745
100
455803
2
2 2
2

,
_

,
_


n
fX
n
fX
S
TERCER METODO: LARGO (MEDIA SUPUESTA A):
A X dj
n
dj f
n
dj f
S
dj dj S

,
_




2 2
2
2 2
2
Altura En
pulgadas
Frecuencia
(f)
Marca de Clase
(X)
fX Dj=(X-A)
A=67
( )
2
2
dj
A X
F(X-A)
( )
2
2
dj
A X f
60 62 5 61 305 - 6 36 - 30 180
63 65 18 64 1152 - 3 9 - 54 162
66 68 42 67 2814 0 0 0 0
69 71 27 70 1890 3 9 81 243
72 74 8 73 584 6 36 48 288
----------- ---------- ----- ------ --------
TOTAL 100 6745 45 873
74
A X dj
n
dj f
n
dj f
S
dj dj S

,
_




2 2
2
2 2
2
53 , 8
100
45
100
873
2
2
2

,
_

S S
CUARTO METODO: CLAVE
( )
3 5 , 65 5 , 68
) (
; *
2
2
2
2
2
2 2 2 2

1
1
]
1

,
_




C
C
A X
C
dj
U C
n
fU
n
fU
S
C U U S
Altura En
pulgadas
Frecuencia
(f)
Marca Clase
(X)
fX (X-A) U
2
U
fU
2
fU
60 62 5 61 305 - 6 - 2 4 - 10 20
63 65 18 64 1152 - 3 - 1 1 - 18 18
66 68 42 67 2814 0 0 0 0 0
69 71 27 70 1890 3 1 1 27 27
72 74 8 73 584 6 2 4 16 32
----------- ---------- ------ -----
-
-------
TOTAL 100 6745 15 97
3 5 , 65 5 , 68
1
3
6 ) (
6 67 61 ) (


C
C
A X
U
A X
( ) 52 , 8 3
100
15
100
97
2 2
2
2
2
2
2
2

1
1
]
1

,
_


,
_

1
1
]
1

,
_

,
_


S S
C
n
fU
n
fU
S
75
DESVIACIN TIPICA O ESTNDAR Y DISPERSION RELATIVA.-
DESVIACION TIPICA O ESTANDAR.-
La varianza
2
S , que estudiamos en la parte anterior como medida del
grado de variabilidad de las distribuciones, tiene el inconveniente de
expresar la dispersin de una variable en unidades distintas a la que
mide la variable; as, si estudiamos la dispersin de la altura de las
personas respecto a la media de su grupo, el valor X X mide la
desviacin en centmetros, en tanto que la varianza
2
S mide la
dispersin en centmetros cuadrados. Al extraer la raz cuadrada
regresamos a la unidad de medida de las variables, de lo cual nos
resulta la desviacin tpica o estndar (s).
La desviacin tpica o estndar es la raz cuadrada de la varianza.
Desviacin tpica o estndar = Varianza
Desviacin estndar = s =
2
S
NO AGRUPADOS:
DESVIACION ESTANDAR = S=
( )
n
X X


2
Utilizando las frmulas modificadas que se demostraron en el estudio
de la varianza,
2
2

,
_



n
X
n
X
S

PARA DATOS AGRUPADOS
2
2

,
_



n
fX
n
fX
S
EJEMPLOS:
76
1.- Hallar la desviacin estndar de la serie 10, 12, 2, 9, 15, 6, 7, 8,
12, 9. En el ejemplo se calcula la varianza por dos mtodos y se tiene:
9
10
90
10
9 12 8 7 6 15 9 2 12 10

+ + + + + + + + +


n
X
X
Calculamos la varianza por el mtodo:
( )
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
8 , 11
10
9 9 9 12 9 8 9 7 9 6 9 15 9 9 9 2 9 12 9 10
2
2 2 2 2 2 2 2 2 2 2
2
2
2

+ + + + + + + + +


S
S
n
X X
S
La desviacin estndar es:
44 , 3 81 , 11
2
S S S
2.- Averiguar la desviacin estndar de las distribuciones agrupadas
del siguiente ejercicio:
Intervalo f X
Marca
de
clase
fX
X X X X f ( )
2
X X
( )
2
X X f
2
X
2
fX
27 29 1 28 28 9 9 81 81 784 784
30 32 10 31 310 6 60 36 360 961 9610
33 35 14 34 476 3 42 9 126 1156 16184
36 38 33 37 1221 0 0 0 0 1369 45177
39 41 14 40 560 3 42 9 126 1600 22400
42 44 7 43 301 6 42 36 252 1849 12943
45 47 3 46 138 9 27 81 243 2116 6348
----------- --- --------
-
----- ------- -------- ------
TOTAL 82 3034 222 1188 113446

77
( )
49 . 14
82
1188
37
82
3034
2
2

n
X X f
S
n
fX
X
La desviacin es:
81 , 3
82
3034
82
113446
2
2
2

,
_

,
_



n
fX
n
fX
S
INTERPRETACION Y USOS DE LA DESVIACION ESTANDAR.
TEOREMA DE CHEBYSHEV.-
La desviacin estndar se emplea como una medida para comparar la
dispersin en dos o ms conjuntos de observaciones. Por ejemplo si
tenemos para una distribucin una desviacin estndar de 7,51 y para
otra 10,47 y los valores medios son aproximadamente iguales, esto
nos indicara que en la primera distribucin los datos no se dispersan
tanto como en el segundo caso porque 7,51< 10,47 por tanto el valor
medio para la primera distribucin es una medida ms confiable que la
correspondiente a la segunda distribucin.
La desviacin estndar no proporciona una imagen completa de la
informacin en este sentido tiene una funcin importante en la toma
de decisiones crticas con respecto a la composicin de una cartera de
inversiones.
La desviacin estndar es til para describir un conjunto de datos
midiendo el grado de dispersin de las observaciones individuales
alrededor de su media. Existen dos aplicaciones adicionales para la
desviacin estndar.
1. Teorema de Chebyshev.
2. La regla emprica.
-3S -2S -1S Media 1S 2S 3S
78
Se ha dicho que una desviacin estndar pequea para un conjunto de
datos indica que stos se encuentran localizados cerca de la media.
Por el contrario, una desviacin estndar de gran valor revela que las
observaciones estn lejos de la media. El matemtico ruso Chebyshev
(1821 1894) desarroll un teorema que permite determinar la
proporcin mnima de los valores que se encuentran dentro de un
nmero especfico de desviaciones estndares con respecto de la
media. Por ejemplo con base en el teorema de Chebyshev, al menos 3
de 4 valores, es decir el 75% deben encontrarse entre la media ms
dos desviaciones estndares y la media menos dos de tales
desviaciones
( ) S X 2 t . Esta relacin se aplica sin que importe la forma
de la distribucin. Adems, al menos 8 de cada 9 valores, es decir el
88,9% estarn entre la
( ) S X 3 t y al menos 24 de 25 valores, es decir
96% se encontrarn entre
( ) S X 5 t .
TEOREMA DE CHEBYSHEV: Establece que para un conjunto cualquiera
de observaciones (muestra o poblacin), la proporcin mnima de los
valores que se encuentran dentro de k desviaciones estndares desde
la media es al menos
2
1
1
k

, donde K es una constante mayor que 1


EJEMPLO: Una muestra de las cantidades que los empleados de Duprein invierten quincenalmente
en el plan de participacin de utilidades, la media aritmtica fue de $ 51,54 dlares y se obtuvo una
desviacin estndar de $ 7,51 dlares. Al menos, qu porcentaje de las contribuciones se
encuentran entre ms 3,5 desviaciones estndar, y menos 3,5 desviaciones estndar, respecto de
la media?
Aproximadamente 92%, valor que se obtiene como sigue:
( )
92 , 0
25 , 12
1
1
5 , 3
1
1
1
1
2 2

k
REGLA EMPRICA.-
El teorema de Chebyshev se refiere a cualquier conjunto de valores;
esto es, la distribucin de los valores puede tomar cualquier forma. Sin
embargo, en una distribucin simtrica en forma de campana, como la
de la figura siguiente, se obtiene mayor precisin al explicar la
dispersin con respecto a la media. Estas relaciones entre la desviacin
-3S -2S -1S Media 1S 2S 3S
79
estndar y la media constituyen la llamada regla emprica, que algunas
veces se conoce como regla normal.
En una distribucin de frecuencias simtrica, con forma de campaa,
aproximadamente 68% de las observaciones estarn entre ms una y
menos una desviacin estndar desde la media; aproximadamente
95% de las observaciones se encontrarn entre ms dos y menos dos
desviaciones estndares desde la media; prcticamente todas las
observaciones 99,7% se hallarn entre ms tres y menos tres
desviaciones estndar, a partir del valor medio.
Se ha observado que si una distribucin es simtrica con forma de
campana, prcticamente todas las observaciones se encuentran entre
la media ms y menos tres desviaciones estndares. De esta forma si
la 100 X y S =10, prcticamente todas las observaciones se hallan
entre 100 +3(10) y 100 3(10), o sea 70 y 130. Por lo tanto, la
amplitud de variacin es 60, que se obtiene por 130 70
Recprocamente, si se sabe que esta ltima es 60, podemos aproximar
la desviacin estndar dividiendo entre 6 la amplitud de variacin. Para
70 80 90 100 110 120 130
68%
95%
99,7%
Grafica simtrica de campana, que muestra las relaciones entre la desviacin estndar y
la media.
-3S -2S -1S Media 1S 2S 3S
80
este ejemplo, la desviacin estndar vale: amplitud de variacin para 6
= 10.
EJEMPLO: Una muestra de las cantidades mensuales de dinero que destina a sus alimentos un
ciudadano de la tercera edad que vive solo sigue aproximadamente una distribucin de
frecuencias simtrica, del tipo de campana. La media muestral es de $ 150 (dlares), y la
desviacin estndar es $ 20. Utilizando la regla emprica indique:
1.- Aproximadamente, entre qu cantidades est 68% de los gastos mensuales en alimentos?
2.- Aproximadamente, entre qu cantidades se halla 95% de los gastos mensuales por alimentos?
3.- Aproximadamente, entre qu montos estn todos los gastos mensuales?
1.- Aproximadamente 68% est entre $ 130 y $ 170, que se obtiene por:
130 20 150 170 20 150 ) 20 ( 1 150 1 + t t S X
2.- aproximadamente 95% est entre $ 110 y $ 190, que se obtiene por:
110 40 150 ) 20 ( 2 150 190 40 150 ) 20 ( 2 150 ) 20 ( 2 150 2 + + t t S X
3.- Casi todos los casos 99,7% estn entre $ 90 y $ 210, lo que se obtiene mediante:
90 60 150 ) 20 ( 3 150 2100 60 150 ) 20 ( 3 150 ) 20 ( 3 150 3 + + t t S X
1.- De acuerdo con el teorema de Chebyshev, al menos qu porcentaje de cualquier conjunto de
observaciones se encontrar a no ms de 1,8 desviaciones estndar desde la media?
( )
% 69 % 69 , 0
24 , 3
1
1
8 , 1
1
1
1
1
2 2
k

2.- El ingreso medio de un grupo de observaciones muestrales es $ 500, la desviacin estndar es
$ 40. De acuerdo con el teorema de Chebyshev, al menos que porcentaje de los ingresos se
encontrar entre $ 400 y $ 600?
a) Aproximadamente en 68%
460 40 500 ; 1
540 40 500 ; 1

+ t
S X
S X
b) Aproximadamente en 95%
420 80 500 ) 40 ( 2 500 ; 1
580 80 500 ) 40 ( 2 500 ; 2

+ + t
S X
S X
c) Aproximadamente en 99,7%
81
380 120 500 ) 40 ( 3 500 ; 1
620 120 500 ) 40 ( 3 500 ; 2

+ + t
S X
S X
La respuesta esta entre un total del 95%.
DISPERSION RELATIVA.-
Resulta imposible una comparacin directa de dos o ms medidas de
dispersin (por ejemplo, la desviacin estndar de una distribucin de
ingresos anuales y la desviacin estndar de una distribucin de
inasistencias, ambas del mismo grupo de empleados). Se puede decir
que la desviacin estndar, $ 1200 (dlares), de la distribucin del
ingreso es mayor que la desviacin estndar de 4,5 das de la
distribucin de faltas de asistencia? Obviamente no es as porque no
podemos comparar directamente dlares y das de inasistencia al
trabajo. A fin de realizar una comparacin significativa de la
distribucin de ingresos y las faltas, se necesita convertir cada una de
esas medidas a un valor relativo, es decir, aun porcentaje.
Kart Pearson (1857 1936), contribuyo de manera importante a la
ciencia estadstica, y desarroll una medida relativa denominada
COEFIENTE DE VARIACION (CV). Es una medida muy til cuando:
1.- Los datos estn en unidades diferentes (como dlares y das de
inasistencia)
2.- Los datos estn en las mismas unidades, pero los valores medios
estn muy distantes (como sucede con los ingresos de ejecutivos
superiores, y los ingresos de empleados no calificados)
COEFICIENTE DE VARIACION: Es la razn (cociente) de la desviacin
estndar y la media aritmtica, expresada como un porcentaje.
En trminos de una frmula para una muestra queda:
) 100 (
X
S
CV
Al multiplicar por 100 se convierte la expresin decimal a %
EJEMPLO: Un estudio sobre el monto de bonos pagados y los aos de servicio de varios empleados,
dio como resultado los siguientes datos estadsticos: la media de los bonos pagados fue $ 200
(dlares), y la desviacin estndar fue $ 40. La media del nmero de aos de servicio fue 20 aos,
82
y la desviacin estndar, 2 aos. Compare las dispersiones relativas de las dos distribuciones
empleando el coeficiente de variacin.
Las distribuciones estn en unidades diferentes (dlares y aos de servicio). Por tanto se convierten
en coeficientes de variacin.
PARA LOS BONOS
% 20
) 100 (
200
40
) 100 (

CV
CV
X
S
CV
PARA LOS AOS DE SERVICIO
% 10
) 100 (
20
2
) 100 (

CV
CV
X
S
CV
Al interpretar se puede ver que existe mayor dispersin relativa con respecto a la media en la
distribucin de los bonos pagaos en comparacin con la distribucin de los aos de servicio (ya que
20% es mayor que 10%).
EJEMPLOS:
1.- Se va a comparar la variacin en los ingresos anuales de varios ejecutivos con la variacin en
los ingresos de trabajadores no calificados. En una muestra de ejecutivos, la media = $ 500.000
(dlares) y S= $ 50.000. Para Una muestra de empleados no calificados la media es = $ 32.000 y
S= $ 3200. Uno se ve tentado a afirmar que hay mayor dispersin en los ingresos anuales de los
ejecutivos porque $ 50000 es mayor que $ 3200. Sin embargo, las medias son tan distantes que se
necesitan convertir los valores estadsticos a coeficientes de variacin para poder efectuar una
comparacin significativa de las variaciones en los ingresos anuales.
PARA LOS EJECUTIVOS:
% 10
) 100 (
500000
50000
) 100 (

CV
CV
X
S
CV
PARA LOS TRABAJADORES NO CALIFICADOS:
83
% 10
) 100 (
32000
3200
) 100 (

CV
CV
X
S
CV
No existe diferencia en la dispersin relativa de los dos grupos.
ASIMETRIA.-
Se conoce como sesgo el grado de asimetra de una distribucin es
decir cuando se aparta de la simetra. Si la curva de frecuencias
(polgono de frecuencias suavizado) de una distribucin tiene a la
derecha una cola ms larga que a la izquierda, se dice sesgada ala
derecha, o de sesgo positivo. En caso contrario, sesgada a la izquierda,
o de sesgo negativo.
Recurdese que si una distribucin de frecuencias es simtrica, no
tiene sesgo es decir, su asimetra es nula. Si una o ms
observaciones son sumamente grandes, la media de la distribucin se
vuelve mayor que la mediana o la moda. En tales casos se dice que la
distribucin tiene asimetra positiva o sesgo positivo. Por lo contrario,
si hay una o ms observaciones muy pequeas, la media es la menor
de las tres medidas de tendencia central, y se dice que la distribucin
tiene asimetra negativa o sesgo negativo. Lo anterior se ilustra en el
siguiente grfico:
84


F
R
E
C
U
E
N
C
I
A
1,000
Media
Mediana
Dimetros
exteriores
SIMETRICA
S = 0,09 F
R
E
C
U
E
N
C
I
A
Y Y
X
36 38 39
Mo Md X
SESGO POSITIVO
Edades
S = 4,0
Y SESGO NEGATIVO
COEFIENTE DE ASIMETRIA DE PEARSON:
Kart Pearson desarroll tambin una medida, para evaluar el grado de
orientacin al sesgo, denominada coeficiente de asimetra. Para
distribuciones sesgadas, la media tiende a estar del mismo lado de la
moda que la cola larga. Luego una medida de asimetra viene dada por
la diferencia: media moda, que puede hacerse adimensional
dividindola por una medida de dispersin, tal como la desviacin
tpica, lo que lleva a la definicin del primer y segundo coeficientes de
sesgo de Pearson.
S
Mo X
tpica desviacin
Moda Media
Sesgo

Para evitar el uso de la moda, podemos recurrir a la frmula emprica y


definir:
COEFIENTE DE ASIMETRIA
s
Mediana Media
CA
) ( 3


( )
s
Mo X
CA

(DE PEARSON)
COEFIENTE DE ASIMETRIA DE SOFTWARE:
La frmula permite entender mejor la asimetra. El segundo miembro
de la frmula contiene la diferencia de cada valor respecto de la
media, dividida entre la desviacin estndar. Esto es la porcin
( ) s X X / de la frmula. A esto se le lama estandarizacin. Hay que
observar que el resultado de esto es indicar la diferencia entre cada
valor y la media, en unidades de la desviacin estndar. Si esta
85
POLIGONOS DE FRECUENCIA QUE ILUSTRAN LA ASIMETRIA
F
R
E
C
U
E
N
C
I
A
X
10 11 13
X Md Mo
Tiempo de servicio
S = 3.0
diferencia es positiva, el valor de que se trata es mayor que la media;
si es negativa, es menor que la media. Cunado se elevan al cubo estos
valores, se conserva la informacin relativa al sentido de la diferencia.
Debe recordarse que en la expresin de la desviacin estndar como
resultado que todos los valores sean positivos.
Si el conjunto de valores que se considera es simtrico, al elevar al
cubo los valores estandarizados y sumarlos se obtendr un resultado
cercano a cero. Si hay varios valores grandes, claramente alejados de
los otros, la suma de las diferencias al cubo ser un valor positivo
grande. Varios valores mucho ms pequeos darn como resultado
una suma de cubos negativa.
COEFICIENTE DE ASIMETRIA
( ) ( )
1
1
]
1

,
_


3
2 1 s
X X
n n
n
CA
(SOFTWARE)
EJEMPLO: A continuacin se da la ganancia por accin, en el ao 2000, de una muestra de 15
empresas productoras de software. Las ganancias se ordenaron de menor a mayor, y son
cantidades en dlares.
$0,09 0,13 0,41 0,51 1,12 1,20 1,49 3,18 3,50 6,36 7,83 8,92 10,13 12,99 16,40
Calcule la media, la mediana y la desviacin estndar. Encuentre el coeficiente de asimetra usando
la estimacin de Pearson y los mtodos usados por los paquetes de software. Qu se concluye
respecto a la forma de la distribucin?
MEDIA ARITMETICA
15
40 , 16 99 , 12 13 , 10 92 , 8 83 , 7 36 , 6 50 , 3 18 , 3 49 , 1 20 , 1 12 , 1 51 , 0 41 , 0 13 , 0 09 , 0 + + + + + + + + + + + + + +


X
n
X
X
95 , 4
15
26 , 74
X X
LA MEDIANA:
Es el valor central de los 15 nmeros y es MD= 3,18
LA DESVIACION ESTANDAR:
86
( )
( )
22 , 5
1 15
15
26 , 74
3720 , 749
1
2
2
2



S
S
n
n
X
X
S
COEFICIENTE DE ASIMETRIA PEARSON:
( )
( )
017 , 1
22 , 5
18 , 3 95 , 4 3
3

CC CA
s
MEDIANA MEDIA
CA
Esto indica que en los datos de las ganancias por accin hay una mediana asimtrica positiva.
Usando el mtodo de software se obtiene un resultado simular, pero no exactamente igual
CALCULO DEL COEFIENTE DE ASIMETRIA SOFTWARE.
8070 , 0
22 , 5
95 , 4 09 , 0
3

,
_

,
_


S
X X
8274 , 11
3

1
1
]
1

,
_

n
X X
COEFICIENTE DE AISMETRIA POR SOFTWARE
( ) ( )
( )
( ) ( )
[ ] 975 , 0 8274 , 11
2 15 1 15
15
2 1
3

1
]
1


C CA
s
X X
n n
n
CA
X
2
X
0,09 0,0081
0,13 0,0169
0,41 0,1681
0,51 0,2601
1,12 1,2544
1,20 1,44
1,49 2,2201
3,18 10,1124
3,50 12,25
6,36 40,4496
7,83 61,3089
8,92 79,5664
10,13 102,6169
12,99 168,7401
16,40 268,96
-----------
-
------------
74,26 749,3720
Ganancia por
accin
( )
s
X X
3

,
_


s
X X
0,09 -0,9310 -0,8070
0,13 -0,9234 -0,7873
0,41 -0,8697 -0,6579
0,51 -0,8506 -0,6154
1,12 -0,7337 -0,3950
1,20 -0,7184 -0,3708
1,49 -0,6628 -0,2912
3,18 -0,3391 -0,0390
3,50 -0,2778 -0,0214
6,36 0,2701 0,0197
7,83 0,5517 0,1679
8,92 0,7605 0,4399
10,13 0,9923 0,9772
12,99 1,5402 3,6539
16,40 2,1935 10,5537
-------------- ------------- -------------------
11,8274
87
Se concluye que los valores de las ganancias por accin son un poco asimtricos positivamente.
EJERCICIOS PROPUESTOS:
AMPLITUD DE VARIACION
1) HALLAR EL RANGO DE LAS ALTURAS DE LOS ESTUDIANTES DE LA
SIGUIENTE TABLA:
ALTURA Nmero de estudiantes
60 62 5
63 65 8
66 68 42
69 71 27
72 74 8
TOTAL 100
2) HALLAR EL RANGO DE LAS CARGAS MXIMAS DE:
Carga
Mxima
Nmero de cables
9,3 - 9, 7 2
9,8 10,2 5
10,3 10,7 12
10,8 11,2 17
11,3 11,7 14
11,8 12,2 6
12,3 12,7 3
12,8 13,2 1
TOTAL 60
3) DETERMINAR EL RANGO DE LOS DATOS:
a)
Edades (aos) Varones (miles) Mujeres (miles)
18 19 121 481
20 24 2441 4184
25 29 5930 6952
30 34 6587 7193
35 44 11788 11893
45 54 9049 9022
55 64 8749 8171
65 74 5786 4654
75 y ms 2581 1524
4) CONSIDERAR LOS DATOS DE PRODUCCIN DE TELEVISORES
A COLOR DE 20 PULGADAS DURANTE LOS DAS DE LA SEMANA
88
DE LUNES A VIERNES, SE HA PRODUCIDO LO SIGUIENTE: 40,
35, 20, 35, 25; HALLAR LA DESVIACIN MEDIA.
5) EL NMERO DE PACIENTES ATENDIDOS EN LA SALA DE
EMERGENCIA DEL HOSPITAL H.C.C., PARA UNA MUESTRA DE 5
DAS EN EL MES ANTERIOR FUE: 103, 97, 101, 106, 103.
DETERMINA E INTERPRETE LA AMPLITUD TOTAL Y LA
DESVIACIN MEDIA.
6) HALLAR EL RANGO DE LOS SIGUIENTES CONJUNTOS: 12, 6,
7, 3, 15, 10, 18, 5.
7) LA MAYOR DE 50 MEDIDAS ES 8,34 KG. SI EL RANGO ES 0,46
KG. HALLAR EL MENOR DE ESAS MEDIDAS.
8) LOS PESOS DE UN GRUPO DE CAJAS QUE SE VAN A ENVIAR A
IRLANDA SON (EN DLARES): 95, 103, 105,110, 104, 104, 112, 90
a) CUL ES LA AMPLITUD DE VARIACIN DE LOS PESOS?
b) CALCULE LA MEDIA ARITMTICA DE LOS VALORES
c) DETERMINE LA DESVIACIN MEDIA DE LOS PESOS.
9) DE LOS SIGUIENTES EJERCICIOS CALCULAR A) LA
VARIACIN DE AMPLITUD (AT); B) LA MEDIA ARITMTICA; C)
LA DESVIACIN MEDIA; D) INTERPRETAR LA AMPLITUD DE
VARIACIN Y LA DESVIACIN MEDIA.
10) CONSIDERE LOS 5 VALORES SIGUIENTES COMO UNA
POBLACIN: 8, 3, 7, 3, 4. CALCULAR:
a) DETERMINAR LA MEDIA DE LA POBLACIN
b) EVALU LA VARIANZA POBLACIONAL.
11) CONSIDERE LOS SEIS VALORES SIGUIENTES COMO UNA
POBLACIN: 13, 3, 8, 10, 8 Y 6.
a) CALCULAR LA MEDIA DE LA POBLACIN
b) HALLE EL VALOR DE LA VARIANZA.
89
12) LOS CINCO VALORES SIGUIENTES SON UNA MUESTRA 11, 6,
10, 6, 10
a) CALCULAR LA MEDIA DE LA POBLACIN
b) HALLE EL VALOR DE LA VARIANZA.
13) EL EJERCICIO SE REFIERE A LA EMPRESA DAVES, QUE SE
DEDICA A INSTALAR MECANISMOS AUTOMTICOS PARA
ABRIR PUERTAS DE GARAJE. CON BASE EN UNA MUESTRA, LOS
SIGUIENTES SON LOS TIEMPOS, EN MINUTOS, REQUERIDOS
PARA INSTALAR 10 PUERTAS: 28, 32, 24, 46, 44, 40, 54, 38, 32 Y 28
a) CALCULAR LA MEDIA DE LA POBLACIN
b) HALLE EL VALOR DE LA VARIANZA.
14) EN UNA MUESTRA DE ESTUDIANTES DE LA FACULTAD DE
ADMINISTRACIN DE EMPRESAS DE LA UNIVERSIDAD XYZ, LA
MEDIA DE LOS PROMEDIOS DE CALIFICACIONES ES 3,10, CON
UNA DESVIACIN ESTNDAR DE 0,25. CALCULE EL
COEFICIENTE DE VARIACIN?
15) LA EMPRESA TVZ ESTUDIA EL PESO DE EQUIPAJE PARA
CADA PASAJERO. EN UN GRUPO GRANDE DE VIAJEROS EN
VUELOS NACIONALES, LA MEDIA ES 47 LIBRAS, CON UNA
OBSERVACIN ESTNDAR DE 10 LIBRAS. EN UN GRUPO
GRANDE DE PASAJEROS DE VUELOS INTERNACIONALES, LA
MEDIA ES 78 LIBRAS Y LA DESVIACIN ESTNDAR ES DE 15
LIBRAS. CALCULE LA DISPERSIN RELATIVA DE CADA GRUPO.
COMENTE A CERCA DE LA DIFERENCIA EN DICHA DISPERSIN
RELATIVA.
16) A CONTINUACIN SE PRESENTAN LOS SUELDOS INICIALES
EN MILES DE DLARES EN UNA MUESTRA DE CONTADORES
QUE TERMINARON SUS ESTUDIOS Y EMPEZARON A TRABAJAR
COMO CONTADORES PBLICOS EL AO PASADO. DE LA
SIGUIENTE TABLA:
36, 26, 33, 28, 31
CALCULAR LO SIGUIENTE
90
a) LOS VALORES DE LA MEDIA, MEDIANA Y DESVIACIN
ESTNDAR
b) DETERMINE EL COEFICIENTE DE ASIMETRA USANDO
EL MTODO DE PEARSON
c) DETERMINE EL COEFICIENTE DE ASIMETRA USANDO
EL MTODO DE SOFTWARE
17) A CONTINUACIN SE DAN LOS SALARIOS, EN MILES DE
DLARES, PARA UNA MUESTRA DE 15 EJECUTIVOS DE LA
INDUSTRIA ELECTRNICA.
516, 548, 566, 534, 586, 529, 546, 523, 538, 523, 551, 552, 486, 558, 574
CALCULAR LO SIGUIENTE
a) LOS VALORES DE LA MEDIA, MEDIANA Y DESVIACIN
ESTNDAR
b) DETERMINE EL COEFICIENTE DE ASIMETRA USANDO
EL MTODO DE PEARSON
c) DETERMINE EL COEFICIENTE DE ASIMETRA USANDO
EL MTODO DE SOFTWARE
18) A CONTINUACIN SE INDICAN LAS COMISIONES (EN MILES
DE DLARES) OBTENIDOS EL AO PASADO POR LOS
REPRESENTANTES DE VENTAS DE LA EMPRESA FRUIT, LOS
DATOS SON LOS SIGUIENTES:
3,9 5,7 7,3 10,
6
13,
0
13,
6
15,
1
15,
8
17,
1
17,
4
17,
6
22,3
38,
6
43,
2
87,
7
CALCULAR LO SIGUIENTE
a) LOS VALORES DE LA MEDIA, MEDIANA Y DESVIACIN
ESTNDAR
b) DETERMINE EL COEFICIENTE DE ASIMETRA USANDO
EL MTODO DE PEARSON
91
c) DETERMINE EL COEFICIENTE DE ASIMETRA USANDO
EL MTODO DE SOFTWARE
CAPITULO V
REGRESION LINEAL Y CORRELACION.
Qu es un anlisis de correlacin?
Es el estudio de la relacin que existe entre las variables. Para
explicar lo anterior supngase que el gerente de ventas de la
compaa XEROX, empresa que tiene una gran fuerza de ventas
en todo Ecuador y Per, desea determinar si existe una relacin
entre el nmero de llamadas telefnicas de ventas hechas en un
mes, y la cantidad de copiadoras vendidas durante ese lapso. El
gerente selecciona al azar una muestra de 10 representantes, y
determina el nmero de tales llamadas que hizo cada uno el mes
anterior y la cantidad de productos vendidos. La informacin
muestral tenemos a continuacin:
Representantes
De ventas
Nmero de
llamadas
Nmero de
Copiadoras vendidas
Juan 20 30
Pedro 40 60
Lus 20 40
Jorge 30 60
Roco 10 30
Karina 10 40
Jos 20 40
Antonio 20 50
Oswaldo 20 30
Nube 30 70
Para haber cierta relacin entre el nmero de llamadas y la cantidad de
unidades vendidas. Esto es, el agente que realiz el mayor nmero de
llamadas vendi ms copiadoras. Sin embargo, la relacin no es
perfecta o exacta Por ejemplo Nube Hizo menos llamadas que Pedro,
pero ella vendi ms unidades.
92
En vez de hablar en lo general, como se ha hecho hasta ahora, se
desarrollarn algunas medidas estadsticas para presentar en forma
ms precisa la relacin entre las dos variables: llamadas de ventas y
copiadoras vendidas. A este conjunto de tcnicas estadsticas se le
denomina anlisis de correlacin.
ANALISIS DE CORRELACION: Conjunto de tcnicas estadsticas
empleado para medir la intensidad de la asociacin entre dos variables.
El principal objetivo del anlisis de correlacin consiste en determinar
qu tan intensa es la relacin entre dos variables. Normalmente, el
primer paso es mostrar los datos en un diagrama de dispersin.
DIAGRAMA DE DISPERSION: Grfica que representa la relacin entre
dos variables.
EJEMPLO:
La empresa XEROX, vende copiadoras a negociaciones grandes,
medianas y pequeas en Ecuador y Per. La seorita Mnica Tello fue
promovida recientemente al puesto de gerente nacional de ventas. A la
prxima junta de ventas asistirn los representantes de todo el pas. A
ella le gustara hacerles notar la importancia de hacer llamadas extra
cada da, Decide reunir alguna informacin acerca de la relacin entre
el nmero de llamadas y el nmero de productos vendidos. Seleccion
al azar una muestra de 10 representantes y determin el nmero de
llamadas que hicieron el ltimo mes, y el de copiadoras que vendieron.
La informacin muestral se tiene en la tabla siguiente:
Representantes
De ventas
Nmero de
llamadas
Nmero de
Copiadoras vendidas
Juan 20 30
Pedro 40 60
Lus 20 40
Jorge 30 60
Roco 10 30
Karina 10 40
Jos 20 40
Antonio 20 50
Oswaldo 20 30
93
Nube 30 70
-------------- ---------- ------------------
220 450
Qu observaciones puede hacer usted acerca de la relacin entre el
nmero de llamadas y la cantidad de copiadoras vendidas? Trace un
diagrama de dispersin para representar esta informacin.
SOLUCION AL PROBLEMA:
La seorita Tello sospecha que existe una relacin entre el nmero de
llamadas hechas en un mes, y la cantidad de copiadoras que se
vendieron. Nube vendi el mayor nmero de unidades el mes anterior,
y era una de las tres representantes que hizo 30 o ms llamadas. Por
otra parte, Roco y Karina correspondieron al menor nmero de
copiadoras vendidas entre los representantes en la muestra.
La deduccin es que el nmero de copiadoras vendidas tiene relacin
con la cantidad de llamadas realizadas. A medida que aumenta el
nmero de llamadas telefnicas crece la cantidad de unidades
vendidas. El nmero de llamadas de venta se denomina variable
independiente, y la cantidad d copiadoras vendidas, variable
dependiente.
VARIABLE DEPENDIENTE: La variable que se predice o calcula
VARIABLE INDEPENDIENTE: Una variable que proporciona las bases
para el clculo. Es la variable de prediccin (suposicin).
Con los datos anteriores graficar el diagrama de dispersin.
COPIADORAS VENDIDAS (Y)
0
20
40
60
80
0 5 10 15 20 25 30 35 40 45
Llamadas telfonicas
U
n
i
d
a
d
e
s

v
e
n
d
i
d
a
s
Correlacin negativa perfecta
Y
La lnea tiene
Pendiente negativa
.
.
.
.
.
r = -1 .
.
. X
Correlacin positiva perfecta
Y
r = +1 .
.
.
.
.
La lnea tiene
. Pendiente positiva
.
X
94
El diagrama de dispersin indica grficamente que los representantes
de ventas que hacen ms llamadas telefnicas, tienden a vender ms
copiadoras. Es razonable que la seorita Tello, la gerente nacional de
ventas de la empresa mencionada, diga sus representantes que
cuanto mayor sea el nmero de llamadas a clientes que hagan, ms
copiadoras podrn esperar vender. Obsrvese que aunque parece
existir una relacin positiva entre las dos variables, no todos los puntos
quedan en una misma lnea recta.
Del mismo ejemplo, primeramente calculamos la media aritmtica de X
y la media aritmtica de Y, que resultan los valores
22
10
220


n
X
X 45
10
450


n
Y
Y
Estas dos rectas pasan por el centro de los datos y dividen al diagrama
de dispersin en cuatro cuadrantes. Puede considerarse que origen el
origen se desplaza de (0,0) a (22,45). Si la relacin entre las dos
variables es positiva, entonces el nmero de copiadoras vendidas es
mayor que la media, el nmero de llamadas a clientes tambin ser
mayor que la media
COEFICIENTE DE CORRELACIN:
Originado por el investigador Kart Pearson, el coeficiente de
correlacin describe la intensidad de la relacin entre dos conjuntos de
variables de nivel de intervalo (o variables de nivel de relacin o
razn). Se le denota por la letra r. Puede tomar cualquier valor de -1
a +1, inclusive. Un coeficiente de correlacin de -1 o de +1 indica una
correlacin perfecta. Por ejemplo, un coeficiente de correlacin para el
ejemplo anterior calculado como +1, sealara que el nmero de
llamadas era un pronstico perfecto de la cantidad de copiadoras
vendidas. Esto es, el nmero de telefonemas y el de productos
vendidos estn perfectamente relacionados en un sentido lineal
positivo. Un valor -1 indicara que las llamadas a clientes y el nmero
de copiadoras vendidas estn perfectamente relacionadas en un
sentido lineal negativo. La forma como quedara el diagrama de
Correlacin negativa perfecta
Y
La lnea tiene
Pendiente negativa
.
.
.
.
.
r = -1 .
.
. X
Correlacin positiva perfecta
Y
r = +1 .
.
.
.
.
La lnea tiene
. Pendiente positiva
.
X
Correlacin negativa y dbil
(X y Y tienen cierta relacin lineal)
. . .
. . . .. .
. . . . . . .. ..
. . . . .. ..
. . . . .
. .
. . .. . .. . .. ..
.. .. . . . . .. . .. ..
. . . . . . ...
C
a
n
t
i
d
a
d

v
e
n
d
i
d
a
Correlacin positiva y fuerte
(X y Y tienen una relacin lineal intensa
. . . . .
.. . . .
. . . . .
. . . . . . ..
. . . . . .


95
dispersin si la relacin entre ambos conjuntos de datos fuera lineal y
perfecta
Si no existe en absoluto alguna relacin entre los dos conjuntos de
variables, la r de Pearson ser cero. Un coeficiente de correlacin r
cercano a cero (por ejemplo 0,08) indica que la relacin es muy dbil.
Se llega a la misma conclusin si r = -0,08. Coeficientes de 0,91 y
+0,91 tienen igual fuerza; ambos indican una correlacin muy intensa
entre los dos conjuntos de variables. De modo que la fuerza de la
correlacin no depende de la direccin (ya sea o +).
En el siguiente grfico se muestran diagramas de dispersin para r =
0; una r dbil r = -0,23 y una r fuerte r = + 0,87.
Correlacin negativa perfecta
Y
La lnea tiene
Pendiente negativa
.
.
.
.
.
r = -1 .
.
. X
Correlacin positiva perfecta
Y
r = +1 .
.
.
.
.
La lnea tiene
. Pendiente positiva
.
X
Diagramas de dispersin que ilustra una correlacin negativa perfecta y una correlacin positiva perfecta
Correlacin negativa y dbil
(X y Y tienen cierta relacin lineal)
. . .
. . . .. .
. . . . . . .. ..
. . . . .. ..
. . . . .
. .
. . .. . .. . .. ..
.. .. . . . . .. . .. ..
. . . . . . ...
C
a
n
t
i
d
a
d

v
e
n
d
i
d
a
Correlacin positiva y fuerte
(X y Y tienen una relacin lineal intensa
. . . . .
.. . . .
. . . . .
. . . . . . ..
. . . . . .


Correlacin Correlacin
Negativa Sin positiva
Perfecta Correlacin perfecta
Correlacin Correlacin Correlacin Correlacin Correlacin Correlacin
Negativa negativa negativa positiva positiva positiva
Intensa moderada dbil dbil moderada
intensa
- 1 - 0,50 0 + 0,50
+ 1
Correlacin negativa Correlacin positiva
96
El siguiente cuadro resume la intensidad y la direccin del coeficiente
de correlacin:
Correlacin cero
r = 0
X y Y no tienen relacin lineal.
.
.
.
.
.
.
.
S
A
L
A
R
I
O
A
N
U
A
L
Nmero de hijos
Correlacin negativa y dbil
(X y Y tienen cierta relacin lineal)
. . .
. . . .. .
. . . . . . .. ..
. . . . .. ..
. . . . .
. .
. . .. . .. . .. ..
.. .. . . . . .. . .. ..
. . . . . . ...
C
a
n
t
i
d
a
d

v
e
n
d
i
d
a
Precio
Correlacin positiva y fuerte
(X y Y tienen una relacin lineal intensa
. . . . .
.. . . .
. . . . .
. . . . . . ..
. . . . . .


G
P
A
U
n
i
v
e
r
s
i
t
a
r
i
o
GPA Bachillerato
Correlacin Correlacin
Negativa Sin positiva
Perfecta Correlacin perfecta
Correlacin Correlacin Correlacin Correlacin Correlacin Correlacin
Negativa negativa negativa positiva positiva positiva
Intensa moderada dbil dbil moderada
intensa
- 1 - 0,50 0 + 0,50
+ 1
Correlacin negativa Correlacin positiva
97
COEFICIENTE DE CORRELACION: Medida de la intensidad de la
relacin lineal entre dos variables.
Tienen dos frmulas:
1. COEFICIENTE DE CORRELACION
( )( )
( )
Y X
S S n
Y Y X X
r
* * 1

FORMA CONCEPTUAL.
2. COEFICIENTE DE CORRELACION
FORMA DIRECTA
( ) ( )( )
( ) ( ) [ ] ( ) ( ) [ ]
2
2
2
2
*


Y Y n X X n
Y X XY n
r
Donde:
n = Es el nmero de pares de observaciones

X
=Es la suma de los valores de la variable X

Y
= Es la suma de los valores de la variable Y
( )

2
X
= Es la suma de los cuadrados de los valores de la variable X
( )
2

X = Es el cuadrado de la suma de los valores de la variable X


( )

2
Y
= Es la suma de los cuadrados de los valores de la variable Y
( )
2

Y = Es el cuadrado de la suma de los valores de la variable Y

XY
= Suma de los productos de X y Y.
Correlacin Correlacin
Negativa Sin positiva
Perfecta Correlacin perfecta
Correlacin Correlacin Correlacin Correlacin Correlacin Correlacin
Negativa negativa negativa positiva positiva positiva
Intensa moderada dbil dbil moderada
intensa
- 1 - 0,50 0 + 0,50
+ 1
Correlacin negativa Correlacin positiva
98
Para la primera frmula tenemos que calcular primeramente la
desviacin estndar tanto de X como de Y
( )
n
n
X
X
S
X
;
1
2
2



Trabajadores X Y X2 Y2 XY
Juan 20 30 400 900 600 -2,0000 -15 30
Pedro 40 60 1600 3600 2400 18,0000 15 270
Luis 20 40 400 1600 800 -2,0000 -5 10
Jorge 30 60 900 3600 1800 8,0000 15 120
Rocio 10 30 100 900 300 -12,0000 -15 180
Karina 10 40 100 1600 400 -12,0000 -5 60
Jos 20 40 400 1600 800 -2,0000 -5 10
Antonio 20 50 400 2500 1000 -2,0000 5 -10
Oswaldo 20 30 400 900 600 -2,0000 -15 30
Nube 30 70 900 4900 2100 8,0000 25 200

TOTAL 220 450 5600 22100 10800 900
22
45
n = 10
Primer
Mtodo
Conceptual
Segundo
mtodo
99
( )
1 10
10
220
5600
2

S
19 , 9 S
( )
n
n
Y
Y
S
Y
;
1
2
2


( )
1 10
10
450
22100
2

S
( ) X X ( ) Y Y ( )( ) Y Y X X
( )( )
( )
Y X
S S n
Y Y X X
r
* * 1

( ) ( ) ( )
76 , 0 ;
34 , 14 * 19 , 9 * 1 10
900

r r
( ) ( )( )
( ) ( ) [ ] ( ) ( ) [ ]
2
2
2
2
*


Y Y n X X n
Y X XY n
r
n
X
X

n
Y
Y

directo
r = 0,76
Cmo se interpreta un coeficiente de correlacin igual a 0,76? Primero
es positivito, de manera que se ve que hay una relacin directa entre
el nmero de llamadas a clientes y la cantidad de copiadoras vendidas.
El valor de 0,76 est bastante cercano a +1, por lo que se concluye
que la relacin es fuerte. Dicho de otra manera, un aumento de 25%
en las llamadas posiblemente llevara a un aumento de 25% en las
ventas.
COEFICIENTE DE DETERMINACIN: En el ejemplo anterior respecto a
la relacin entre el nmero de llamadas telefnicas y la cantidad de
productos vendidos, el coeficiente de correlacin r = 0,76, se
interpret como fuerte. Sin embargo, los trminos como dbil,
moderado y fuerte no tienen significado preciso. Una media que tiene
una acepcin (significado), ms fcil de interpretar es el coeficiente de
determinacin. Se calcula elevando al cuadrado el coeficiente de
correlacin. Para el ejemplo, dicho coeficiente de determinacin,
2
r ,
vale 0,58, que proviene de
( )
2
76 , 0 r
. Esta es una proporcin o
porcentaje, puede decirse que 58% de la variacin en el nmero de
copiadoras vendidas se explica por la variacin en el nmero de
llamadas a los clientes.
DEFINICION: La porcin de la variacin total en la variable
dependiente Y, que se explica por la variacin en la variable
independiente X.
( ) % 58 100 * 76 , 0 ; 100 *
2 2
r r r r
ANALISIS DE REGRESIN:
100
( ) ( ) ( )
( ) ( ) [ ] ( ) ( ) [ ]
2
4 5 0 2 2 1 0 0 1 0 *
2
2 2 0 5 60 0 1 0
4 5 0 2 2 0 1 0 8 0 0 1 0


r
En la tabla anterior se presenta el nmero de llamadas telefnicas y
cantidad de unidades vendidas para una muestra de 10 representantes
de ventas de la empresa XEROX. El diagrama muestra esta informacin
en un diagrama de dispersin. Ahora se desarrolla una ecuacin lineal
que exprese la relacin entre el nmero de llamadas a clientes y la
cantidad de unidades vendidas. La ecuacin de la lnea recta empleada
para calcular Y, con base en X, se conoce como ecuacin de regresin.
DEFINICION: Es una ecuacin que define la relacin lineal entre dos
variables.
La forma general de la ecuacin de regresin lineal es:
bX a Y +
*
Donde:
*
Y = Se lee Y prima, es el valor pronosticado de la variable Y para un
valor seleccionado de X.
a = Es la ordenada de la interseccin con el eje Y, es decir, el valor
estimado de cuando X = 0. Dicho de otra forma, corresponde al valor
estimado de Y, donde la recta de regresin cruza el eje Y, cuando X=0
b = Es la pendiente de la recta, o el cambio promedio en
*
Y por
unidad de cambio (incremento o decremento) en la variable
independiente X.
X = Es cualquier valor seleccionado de la variable independiente.
Debe observarse que la ecuacin de regresin lineal para la muestra
de vendedores es slo una estimacin de la relacin entre las dos
variables en la poblacin. De modo que la regresin estimada, o
simplemente coeficiente de regresin queda con las siguientes
frmulas.
1.- PENDIENTE DE LA
( ) ( ) ( )
( ) ( )
2
2
*

X X n
Y X XY n
b
101
LINEA DE REGRESION
2.- PUNTO DONDE SE
INTERCEPTA CON EL
n
X
b
n
Y
a


EJE Y
Donde:
X = Es un valor de la variable independiente
Y = Es un valor de la variable dependiente
n = Es el nmero de elementos en la muestra.
EJEMPLO:
Volviendo al ejemplo anterior de la compaa XEROX, la gerente de
ventas recopil informacin respecto al nmero de llamadas telefnicas
hechas y la cantidad de copiadoras vendidas, para una muestra
aleatoria de 10 representantes de ventas. Como parte de su
presentacin en la prxima junta de ventas, a la seorita Tello, gerente
de esa rea, le gustara ofrecer informacin especifica referente a la
relacin entre el nmero de llamadas y la cantidad de productos
vendidos. Cul es el nmero esperado de copiadoras vendidas por un
representante que realiza 20 llamadas a sus clientes?
Trabajadores X Y X2 Y2 XY
Juan 20 30 400 900 600
Pedro 40 60 1600 3600 2400
Lus 20 40 400 1600 800
Jorge 30 60 900 3600 1800
Roco 10 30 100 900 300
Karina 10 40 100 1600 400
Jos 20 40 400 1600 800
Antonio 20 50 400 2500 1000
Oswaldo 20 30 400 900 600
Nube 30 70 900 4900 2100

TOTAL 220 450 5600 22100 10800
22
102
n
X
X

( ) ( ) ( )
( ) ( )
2
2
*

X X n
Y X XY n
b
45
n = 10
Por lo tanto, la ecuacin de regresin es
X Y 1842 , 1 9476 , 18
*
+
. De modo
que si un vendedor hace 20 llamadas telefnicas, puede esperarse que
venda 42,6316 copiadoras, valor que se obtiene de
6316 , 42 ) 20 ( 1842 , 1 9476 , 18
*
+ Y
.
El valor de b = 1,1842 significa que para cada llamada adicional que
realizan los representantes de ventas pueden esperar aumentar en casi
1,2 el nmero de copiadoras vendida. Para decirlo de otra forma, cinco
llamadas extra en un mes resultarn en casi seis copiadoras vendidas
adicionalmente.
El valor de a = 18,9476 es el punto donde la ecuacin cruz el eje Y.
Una traduccin literal es que si no se hacen llamadas, esto es, X = 0,
Se vendern 18,9476 copiadoras. Obsrvese que X = 0 se encuentra
fuera del intervalo de valores incluidos en la muestra y, por tanto, no
debe emplearse para calcular el nmero de productos vendidos. Las
llamadas a clientes fueron de 10 a 40, as que los clculos se den
hacer dentro de esa gama de valores.
TRAZO DE LA LINEA DE REGRESION:
La ecuacin
X Y 1842 , 1 9476 , 18
*
+
, se puede graficar en el diagrama de
dispersin. El primer representante de ventas en la muestra, quien hizo
20 llamadas telefnicas, y as sucesivamente con cada uno de los
agentes de ventas multiplicando por la cantidad que le corresponda;
luego esto se grafica en el diagrama de dispersin con los valores de X
y los valores de Y y de
*
Y
Trabajadores X
103
n
Y
Y

( ) ( ) ( )
( ) ( )
1 8 4 2 , 1
2 2 0 5 6 0 0 1 0
4 5 0 * 2 2 0 1 0 8 0 0 1 0
2



b b
n
X
b
n
Y
a


9 4 76 , 1 8
1 0
22 0
1 84 2 , 1
10
45 0


a a
``
Y

Juan 20 42,6316
Pedro 40 66,3156
Lus 20 42,6316
Jorge 30 54,4736
Roci 10 30,7896
Karina 10 30,7896
Jos 20 42,6316
Antonio 20 42,6316
Oswaldo 20 42,6316
Nube 30 54,4736

TOTAL 220 0
a = 18,9476
b = 1,1842
Tal recta tiene caractersticas interesantes. Segn se anlizo, no existe
otra lnea recta que pase por los datos y tenga una suma de
desviaciones al cuadrado que sea menor. Adems, esta recta pasar
por los puntos representados por las medias respectivas de los valores
X y Y, esto es 45 22 Y y X
EL ERROR ESTANDAR DE ESTIMACION:
Obsrvese en el grfico de dispersin anterior que no todos los puntos
quedan con exactitud en la recta de regresin. Si todos hubieran
quedado en la lnea y si el nmero de observaciones hubiera sido
suficientemente grande, no existira error en el clculo del nmero de
unidades vendidas. Dicho de otra forma, si todos los puntos estuvieran
104
X Y 1842 , 1 9476 , 18
*
+
en la recta de regresin, las unidades vendidas podran pronosticarse
con una precisin del 100%. Entonces no habra error al pronostica la
variable Y con base en la variable X.
Obtener una prediccin perfecta en los aspectos de economa y
administracin es prcticamente imposible. Por ejemplo, los ingresos
anuales provenientes de ventas de gasolina (Y) con base en los
registros de automviles (x) hasta cierta fecha, sin duda podran
aproximarse con gran exactitud, pero el pronstico no sera preciso
con redondeo a unidades monetarias enteras, o tal vez hasta el millar
de unidades monetarias. Entonces, lo que se necesita es una medida
que indique qu tan preciso es el pronstico de Y con base en X o, por
el contrario, cun inexacta podra ser la prediccin. A esta medida se le
denomina ERROR ESTNDAR DE ESTIMACION, el cual se representa
por
*
, x y
S
DEFINICION: Medida de la dispersin de los valores observados, con
respecto a la lnea de regresin.
FORMULA DEL ERROR ESTANDAR DE ESTIMACIN:
PRIMER MTODO
( )
2
2
*
,


n
Y Y
S
x y
Si la suma de los cuadrados de las desviaciones es pequea, esto
significa que la lnea de regresin es representativa de los datos. Si los
cuadrados de las desviaciones son grandes, entonces la recta de
regresin puede no representar a los datos.
Ventas
reales
Ventas
calculadas Desviacin Desviacin al cuadrado
Trabajadores Y
105
``
Y
( )
*
Y Y ( )
2
*
Y Y
Juan 30 42,6316 -12,6316 159,557
Pedro 60 66,3156 -6,3156 39,887
Lus 40 42,6316 -2,6316 6,925
Jorge 60 54,4736 5,5264 30,541
Roco 30 30,7896 -0,7896 0,623
Karina 40 30,7896 9,2104 84,831
Jos 40 42,6316 -2,6316 6,925
Antonio 50 42,6316 7,3684 54,293
Oswaldo 30 42,6316 -12,6316 159,557
Nube 70 54,4736 15,5264 241,069

TOTAL 450 0 784,211
a = 18,9476
b = 1,1842
La frmula
( )
2
2
*
,


n
Y Y
S
x y
para el error estndar de estimacin sirve
para mostrar la semejanza que existe, en concepto y clculo, entre la
desviacin estndar y el error estndar de estimacin
( )
n
n
X
X
S
X
;
1
2
2



FORMULA DEL ERROR ESTANDAR DE ESTIMACIN:
SEGUNDO MTODO
( ) ( )
2
2
,


n
XY b Y a Y
S
x y
Trabajadores Nmero de Nmero de
llamadas copiadoras (X*Y)
X Y
Juan 20 30 400 900 600
Pedro 40 60 1600 3600 2400
Lus 20 40 400 1600 800
106
X Y 1842 , 1 9476 , 18
*
+
( )
2
2
*
,


n
Y Y
S
x y
( )
90 , 9 ;
2 10
211 , 784
, ,


x y x y
S S
2
X
2
Y
Jorge 30 60 900 3600 1800
Roco 10 30 100 900 300
Karina 10 40 100 1600 400
Jos 20 40 400 1600 800
Antonio 20 50 400 2500 1000
Oswaldo 20 30 400 900 600
Nube 30 70 900 4900 2100

TOTAL 220 450 10800
a = 18,9476
b = 1,1842
INTERVALOS DE CONFIANZA Y DE PREDICCIN:
El error estndar de estimacin tambin se utiliza para establecer
intervalos de confianza cuando el tamao de la muestra es grande y la
dispersin con respecto a la lnea de regresin se aproxima ala
distribucin normal. En el ejemplo relacionado con el nmero de
llamadas telefnicas y la cantidad de copiadoras vendidas, el tamao
de la muestra es pequeo; por tanto, se necesita un factor de
correccin que considere el tamao de la muestra. Adems, al alejarse
del valor medio de la variable independiente, los clculos estn sujetos
a mayor variacin, y esto tambin se debe corregir.
1.- El primero, denominado INTERVALO DE CONFIANZA, presenta el
valor medio de Y para un valor dado de X.
2.- El segundo tipo se conoce como INTERVALO DE PREDICCIN e
informa acerca de la gama de valores de Y para un valor particular
de X.
1.- INTERVALO DE
107
X Y 1842 , 1 9476 , 18
*
+
( ) ( )
2
2
,


n
XY b Y a Y
S
x y
( ) ( )
2 10
10800 1842 , 1 450 9476 , 18 22100
,


x y
S
90 , 9
,

x y
S
CONFIANZA
( )
( )
( )

+ t
n
X
X
X X
n
S t Y
x y
2
2
2
,
1
* * *
Donde:
*
Y `=Es el valor pronosticado para cualquier valor X seleccionado
X = Es cualquier valor seleccionado
X = Es la media de las X, evaluada mediante
n
X

n = Es el nmero de observaciones
x y
S
,
= Es el error estndar de estimacin
t = Es un valor tomado para n 2 grados de libertad del apndice del
libro.
Ejemplo: Con los datos del ejemplo anterior de llamadas telefnicas y
venta de copiadoras calcular el intervalo de confianza. Cuando se
hacen 25 llamadas y el valor de t = 2,306
X Y bX a Y 1842 , 1 9476 , 18 ; *
*
+ +
En este caso multiplicamos por 25 que son
las llamadas telefnicas y nos queda:
5526 , 48 ; ) 25 ( 1842 , 1 9476 , 18 * ; 1842 , 1 9476 , 18 ; *
* *
+ + + Y Y X Y bX a Y
t = 2,306
x y
S
,
= 9,901
n = 10
X = 25 son las llamadas telefnicas que se dan para calcular los
intervalos.
X = 22; media aritmtica que se calculo al inicio del problema.

2
X
= 5600

X
= 220
( )
( )
( )

+ t
n
X
X
X X
n
S t Y
x y
2
2
2
,
1
* * *
108
( )
( )
( )

+ t
10
220
5600
22 25
10
1
* 901 , 9 * 306 , 2 5526 , 48
2
2
48,5526 + 7,6356 = 56,19
48,5526 7,6356 = 40,92
Por tanto, el intervalo de confianza de 95% para todos los
representantes de ventas que realizan 25 llamadas telefnicas va
desde 40,9170 hasta 56,1882. Para interpretarlo se redondean los
valores. Si un vendedor hace 25 telefonemas, puede esperar vender
48,6 copiadoras. Es probable que sus ventas varen de 40,9 a 56,2 de
tales mquinas.
2.- INTERVALO DE
PREDICCION
( )
( )
( )

+ + t
n
X
X
X X
n
S t Y
x y
2
2
2
,
1
1 * * *
Donde:
*
Y `=Es el valor pronosticado para cualquier valor X seleccionado
X = Es cualquier valor seleccionado
X = Es la media de las X, evaluada mediante
n
X

n = Es el nmero de observaciones
x y
S
,
= Es el error estndar de estimacin
t = Es un valor tomado para n 2 grados de libertad del apndice del
libro.
Ejemplo: Con los datos del ejemplo anterior de llamadas telefnicas y
venta de copiadoras calcular el intervalo de prediccin. Cuando se
hacen 25 llamadas y el valor de t = 2,306
X Y bX a Y 1842 , 1 9476 , 18 ; *
*
+ +
En este caso multiplicamos por 25 que son
las llamadas telefnicas y nos queda:
5526 , 48 ; ) 25 ( 1842 , 1 9476 , 18 * ; 1842 , 1 9476 , 18 ; *
* *
+ + + Y Y X Y bX a Y
109
t = 2,306
x y
S
,
= 9,901
n = 10
X = 25 son las llamadas telefnicas que se dan para calcular los
intervalos.
X = 22; media aritmtica que se calculo al inicio del problema.

2
X
= 5600

X
= 220
( )
( )
( )

+ + t
n
X
X
X X
n
S t Y
x y
2
2
2
,
1
1 * * *
( )
( )
( )

+ + t
10
220
5600
22 25
10
1
1 * 901 , 9 * 306 , 2 5526 , 48
2
2
48,5526 + 24,0746 = 72,6272
48,5526 24,0746 = 24,4780
El intervalo va desde 24,478 hasta 72,627 copiadoras. Se concluye que
el nmero de productos vendidos se encontrar entre
aproximadamente 24 y 73 para un representante de ventas en
particular. Este intervalo es muy grande. Es mucho mayor que el
intervalo de confianza para todos los vendedores que hicieron 25
llamadas. Sin embargo, es lgico que exista mayor variacin en el
estimado de ventas para un individuo que para un grupo.
ALGO MS ACERCA DEL COEFICIENTE DE DETERMINACION:
La frmula
Es una expresin conveniente para calcular el coeficiente de
correlacin. El coeficiente de determinacin se obtuvo elevando al
cuadrado el coeficiente de correlacin.
FORMULA:
110
( ) ( )( )
( ) ( ) [ ] ( ) ( ) [ ]
2
2
2
2
*


Y Y n X X n
Y X XY n
r
COEFICIENTE DE
DETERMINACION
total Variacin
licada no Variacin total Variacin
r
exp
2

( ) ( )
( )

2
2
2
2
"
Y Y
Y Y Y Y
r
Para examinar ms de cerca el concepto bsico del coeficiente de
determinacin, supngase que interesa la relacin entre los aos de
permanencia en el trabajo (X), y la produccin semanal (Y). Los datos
muestrales son los siguientes
Emplead
o
Aos de servicio
(X)
Produccin
(Y)
X*Y X^2
Jorge 14 6 84 196
Oswaldo 7 5 35 49
Jos 3 3 9 9
Antonio 15 9 135 225
Karina 11 7 77 121
TOTAL 50 30 340 600
Primeramente calculamos
bX a Y + *
, con las frmulas siguientes:
( ) ( ) ( )
( ) ( )
( ) ( ) ( )
( ) ( )
4 , 0 ;
50 600 * 5
30 * 50 340 * 5
;
*
* *
2 2
2



b b
X X n
Y X XY n
b
( )
2 ;
5
50
4 , 0
5
30
;

a a
n
X
b
n
Y
a
Entonces nos queda:
X Y bX a Y 4 , 0 2 * * + +
Calculamos para cada valor de X que tenemos en la tabla anterior y
nos queda.
111
4 , 6 * ) 11 ( 4 , 0 2 * ; 4 , 0 2 * *
8 * ) 15 ( 4 , 0 2 * ; 4 , 0 2 * *
2 , 3 * ) 3 ( 4 , 0 2 * ; 4 , 0 2 * *
8 , 4 * ) 7 (` 4 , 0 2 * ; 4 , 0 2 * *
6 , 7 * ) 14 ( 4 , 0 2 * ; 4 , 0 2 * *
+ + +
+ + +
+ + +
+ + +
+ + +
Y Y X Y bX a Y
Y Y X Y bX a Y
Y Y X Y bX a Y
Y Y X Y bX a Y
Y Y X Y bX a Y
Emplead
o
Aos de servicio
(X)
Produccin
(Y)
X*Y X^2
*
Y
Jorge 14 6 84 196 7,6
Oswaldo 7 5 35 49 4,8
Jos 3 3 9 9 3,2
Antonio 15 9 135 225 8
Karina 11 7 77 121 6,4
TOTAL 50 30 340 600
Luego graficamos en el diagrama de dispersin:
Comparacin de aos de servicio con la produccin
semanal
0
5
10
0 5 10 15 20
Aos de servicio
P
r
o
d
u
c
c
i

n

s
e
m
a
n
a
l
Serie1
Serie2
Emplead
o
Aos de servicio
(X)
Produccin
(Y)
*
Y
*
Y Y
2 *
) ( Y Y
Jorge 14 6 7,6 -1,6 2,56
Oswaldo 7 5 4,8 0,2 0,04
Jos 3 3 3,2 - 0,2 0,04
Antonio 15 9 8 1 1
Karina 11 7 6,4 0,6 0,36
TOTAL 50 30 0 4
Nota *) ) (
*
Y Y SIEMPRE DEBE SER CERO (0)
Supngase que ahora se conoce solo Y; entonces debemos calcular la
media aritmtica de Y 6
5
30
;

Y Y
n
Y
Y
112
Emplead
o
Produccin
(Y)
Media aritmtica
De Y
( ) Y Y
( )
2
Y Y
Jorge 6 6 0 0
Oswaldo 5 6 - 1 1
Jos 3 6 - 3 9
Antonio 9 6 3 9
Karina 7 6 1 1
TOTAL 30 20
Nota *) ) ( Y Y SIEMPRE DEBE SER CERO (0)
Entonces se aplica la frmula del coeficiente de determinacin que es
igual a:
( ) ( )
( )
80 , 0
exp 20
exp 16
;
20
4 20
;
"
2 2 2
2
2
2
2


r
licada no Variacin
licada Variacin
r r
Y Y
Y Y Y Y
r
El 80% de la variacin en la produccin semanal (Y), esta determinado
o explicado por su relacin lineal con los aos de permanencia en el
trabajo (X).
EJERCICIOS PROPUESTOS:
1) SE SELECCIONARON AL AZAR LAS SIGUIENTES
OBSERVACIONES DE MUESTRA.

X Y
4 4
5 6
3 5
6 7
10 7
28 29
a) ESTABLEZCA LA ECUACIN DE REGRESIN
b) OBTENGA EL VALOR DE Y' CUANDO X VALE 7
2) SE SELECCIONARON AL AZAR LAS SIGUIENTES
OBSERVACIONES MUSTRALES.

X Y
113
5 13
3 15
6 7
3 12
4 13
4 11
6 9
8 5
39 85
a) DETERMINE LA ECUACIN DE REGRESIN
b) OBTENGA EL VALOR DE Y' CUANDO X ES 7
3) UN RECIENTE ARTCULO EN BUSINESS WEEK PRESENT
UNA LISTA DE LAS MEJORES COMPAAS PEQUEAS.
HAY INTERS EN LOS RESULTADOS ACTUALES DE LAS
VENTAS Y GANANCIAS DE LAS EMPRESAS. SE SELECCION
UNA MUESTRA ALEATORIA DE 12 COMPAAS. A
CONTINUACIN SE INDICA LAS VENTAS Y GANANCIAS, EN
MILLONES DE DLARES.
Compaa Ventas
(mil.US$)
Ganancias
(mil. US$)
Papa John's
International
$89.2 $4.9
Applied
Innovation
$18.6 $4.4
Integracare $18.2 $1.3
Wall Data $71.7 $8.0
Davidson
Associates
$58.6 $6.6
chico's Fas $46.8 $4.1
Checkmate
Electronics
$17.5 $2.6
Royal Grip $11.9 $1.7
M-wave $19.6 $3.5
Serving-N-Slide $51.2 $8.2
Dais $28.6 $6.0
Cobra Golf $69.2 $12.8
501.1 64.1
LAS VENTAS SERN LA VARIABLE INDEPENDIENTE Y LAS GANANCIAS
LA VARIABLE DEPENDIENTE.
a) TRACE UN DIAGRAMA DE DISPERSIN
b) CALCULE EL COEFICIENTE DE CORRELACIN
114
c) COEFICIENTE DE CORRELACIN CONCEPTUAL
d) EVALU EL COEFICIENTE DE DETERMINACIN
e) DETERMINE LA ECUACIN DE REGRESIN
f) CALCULE LAS GANANCIAS DE UNA COMPAA PEQUEA
CON 50 MILLONES DE DLARES EN VENTAS
4) SE ESTUDIAN LOS FONDOS DE BONOS MUTUALES PARA
INVERTIR EN ELLOS. ESTE ANLISIS EN PARTICULAR SE
CENTRA EN LOS ACTIVOS DE UN FONDO Y SU
RENDIMIENTO A CINCO AOS. LA PREGUNTA ES PUEDE
CALCULARSE LA TAZA DE RENDIMIENTO A CINCO AOS EN
LOS ACTIVOS DEL FONDO? SE SELECCIONARON 9
MUTUALIDADES AL AZAR Y A CONTINUACIN SE
MUESTRAN SUS ACTIVOS Y TASAS.
a) TRACE
UN
DIAGRAMA DE DISPERSIN
b) CALCULE EL COEFICIENTE DE CORRELACIN
c) COEFICIENTE DE CORRELACIN CONCEPTUAL
d) EVALU EL COEFICIENTE DE DETERMINACIN
e) DETERMINE LA ECUACIN DE REGRESIN. UTILICE
LOS ACTIVOS COMO LA VARIABLE INDEPENDIENTE.
f) ESTABLEZCA LA TASA DE RENDIMIENTO EN CINCO
AOS (EN PORCENTAJE) DE UN FONDO CON 400
MILLONES DE DLARES EN VENTAS

5.- DEL EJERCICIO CALCULAR LO SIGUIENTE:
Fondos Activos
(mil dolares)
(X)
Rendimiento
(%)
(Y)
AARP Hig Quality Bond $622.2 10.8
Babson Bond L $160.4 11.3
Compass Capital Fixed
Income
$275.7 11.4
Galaxi Bond Rentail $433.2 9.1
Keystone Custodian B-1 $437.9 9.2
MFS Bond A $494.5 11.6
Nichols Income $158.3 9.5
T. Raive Price Short-term $681.0 8.2
Thompson Income B $241.3 6.8
33089.1 87.9
115
a. EVALU EL ERROR ESTNDAR DE ESTIMACIN
b. SUPNGASE QUE SE SELECCIONA UNA MUESTRA
AGRANDE EN VES DE SOLO 10
N de
habitaciones
Consumo(Miles/Kwh)
12 9
9 7
14 10
6 5
10 8
8 6
10 8
10 10
5 4
7 7
91 74
6.- DEL EJERCICIO CALCULAR:
a- DETERMINE EL ERROR ESTNDAR DE ESTIMACIN
b- SUPNGASE QUE SE SELECCIONA UNA MUESTRA GRANDE (EN
VEZ DE NICAMENTE 10 SE SEALO 13) ENTRE QUE PAR DE
VALORES ESTARA APROXIMADAMENTE EL 95% DE LAS
PREDICCIONES REFERENTES A LAS VENTAS?
# de
contactos
Ventas
miles
de ($)
x y
14 24
12 14
20 28
116
16 30
46 80
23 30
48 90
50 85
55 120
50 110
334 611
7.- DEL EJERCICIO DETERMINAR: EL ERROR ESTNDAR DE
ESTIMACIN.
Ciudad Polica
#
delitos
x y
Quito 15 17
Guayaquil 17 13
Cuenca 25 5
Manta 27 7
Portoviejo 17 7
Azogues 12 21
Ambato 11 19
Riobamba 22 6
n=8 146 95
8.- DEL EJERCICIO DETERMINAR:
a. DETERMINE EL INTERVALO DE CONFIANZA 95 PARA EL VALOR
MEDIO PRONOSTICADO CUANDO X = 7 Y EL VALOR
CONSTANTE ES DE 2,365
b. ESTABLEZCA EL INTERVALO DE PREDICCIN 0.95 PARA UN
VALOR INDIVIDUAL PRONOSTICADO CUANDO X = 7 Y EL
VALOR CONSTANTE T = 2,365
X Y
4 4
5 6
3 5
6 7
10 7
28 29
117
9.- DEL EJERCICIO DETERMINAR
a).- OBTENGA EL INTERVALO DE CONFIANZA DE 95 PARA EL
VALOR MEDIO PRONOSTICADO CUANDO X = 10. T = 2,447.
b) INTERVALO DE PREDICCIN PARA EL VALOR
PRONOSTICADO CUANDO X = 10 Y T = 2,447
Ciudad Polica
#
delitos
x y
Quito 15 17
Guayaquil 17 13
Cuenca 25 5
Manta 27 7
Portoviejo 17 7
Azogues 12 21
Ambato 11 19
Riobamba 22 6
n=8 146 95
10.- DEL EJERCICIO DETERMINAR:
# de habitaciones
consumo (miles de
kwh)
12 9
9 7
14 10
6 5
10 8
8 6
10 8
10 10
5 4
7 7
91 74
a) HALLE EL INTERVALO DE CONFIANZA 0.95, EN MILES DE
KILOWATTS-HORA, PARA LA MEDIA DE TODAS LAS CASAS CON SEIS
HABITACIONES Y T = 2,306
b) DETERMINE EL INTERVALO DE PREDICCIN 0.95, EN MILES DE
KILOWATTS-HORA, PARA LA MEDIA DE TODAS LAS CASAS CON SEIS
HABITACIONES EN PARTICULAR.
118
11.- DEL EJERCICIO: EL NMERO DE ACCIONES DE LA EMPRESA
ICOM. INC. QUE VARIARON DURANTE UN MES Y EL PRECIO AL
FINAL DEL MES, SE ENLISTAN EN LA SIGUIENTE TABLA.
ADEMS, SE DAN LOS PUNTOS Y EN LA RECTA QUE PASA POR
LOS DATOS OBSERVADOS.
Movimiento
(X)
precio actual
(Y)
4 2
1 1
5 4
3 2
2 1
15 10
A) ELABORE UN DIAGRAMA DE DISPERSIN Y HAGA PASAR UNA
LNEA RECTA A TRAVS DE LOS PUNTOS.
B) CALCULE EL COEFICIENTE DE DETERMINACIN.
C) COMO VERIFICACIN, UTILICE LA FORMULA PARA R.
D) INTERPRETE EL COEFICIENTE DE DETERMINACIN.
119
n
Y
Y

( ) ( )( )
( ) ( ) [ ] ( ) ( ) [ ]
2
2
2
2
*


Y Y n X X n
Y X XY n
r
( )( ) Y Y X X
n
Y
Y

( ) X X ( ) ( )( )
( ) ( ) [ ] ( ) ( ) [ ]
2
2
2
2
*


Y Y n X X n
Y X XY n
r
( ) ( ) ( )
( ) ( ) [ ] ( ) ( ) [ ]
2
450 22100 10 *
2
220 5600 10
450 220 10800 10


r
( )
n
n
Y
Y
S
Y
;
1
2
2

También podría gustarte