0% encontró este documento útil (0 votos)
382 vistas37 páginas

Módulo I. Estadística Descriptiva PDF

Este documento presenta una introducción a la estadística descriptiva. Explica que la estadística se originó como una herramienta para que los gobiernos manejaran grandes conjuntos de datos demográficos y económicos. Ahora se ha convertido en una disciplina científica clave y un método para analizar datos en muchas áreas. Define conceptos estadísticos básicos como universo, variable, dato y muestra. Explica cómo se pueden presentar datos cuantitativos a través de tablas y gráf
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
382 vistas37 páginas

Módulo I. Estadística Descriptiva PDF

Este documento presenta una introducción a la estadística descriptiva. Explica que la estadística se originó como una herramienta para que los gobiernos manejaran grandes conjuntos de datos demográficos y económicos. Ahora se ha convertido en una disciplina científica clave y un método para analizar datos en muchas áreas. Define conceptos estadísticos básicos como universo, variable, dato y muestra. Explica cómo se pueden presentar datos cuantitativos a través de tablas y gráf
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADISTICA DESCRIPTIVA.- UNP.

CAPITULO I.
ESTADÍSTICA DESCRIPTIVA
1.1. SIGNIFICADO DE LA ESTADÍSTICA. La palabra ―Estadística‖ se
origina en la Edad Antigua del término ―Estado‖ debido a que fueron los gobiernos
quienes manejaban grandes conjunto de datos demográficos y económicos importantes para
el Estado como registros de la población ; nacimientos ; defunciones ; cosechas ;
impuestos y otras actividades de conteo. A partir de este modesto comienzo la Estadística
se ha ido convirtiendo en uno de las principales disciplinas de las matemáticas y en un
método científico de análisis y aplicación a todas las ciencias sociales y naturales; así
como también a la empresa como la estadística económica (ingreso nacional; empleo;
precios) y en fin a diversos asuntos del quehacer cotidiano. Un ejemplo de aplicación
podemos considerar las encuestas de opinión para conocer el probable triunfo de un
candidato a ocupar un cargo; digamos se consulta a un conjunto de 100 votantes (muestra)
de los cuales 55 de ellos están a favor, diremos entonces que el 55 % de electores votarían
por el candidato. En la Edad Media con el Cálculo de Probabilidades, la Estadística se
estructura como una ciencia o un método de investigación científica; es decir que a partir de
un problema determinado, se formulan hipótesis; se recopila datos; se procesa; presenta;
describe; interpreta; analiza; se extrae conclusiones y emite sugerencias

Un concepto profano de Estadística es la recolección de grandes masas de datos y su


presentación (tablas o gráficas y cálculo de totales; promedios; porcentajes; etc.) para tomar
decisiones y resolver determinados problemas. Si embargo esto es sólo una pequeña parte
de la Estadística. La Estadística comprende los diseños de experimentos; control de calidad;
muestreo; análisis multivariante y otras disciplinas afines. Algunos autores definen a la
Estadística como: la tecnología del método científico (1); un método de toma de decisiones
frente a la incertidumbre (2)

La Estadística puede dividirse en dos ramas : La Estadística descriptiva que está


relacionada con el resumen de datos y su descripción ya sea en la muestra o en la
población y la Estadística Inferencial, relacionada con el proceso de utilizar los datos dela
muestra y a partir de ellos tomar decisiones y extraer conclusiones generales en la
población.

Actualmente con el desarrollo de la Informática, la computadora se ha convertido en una


herramienta importante en la presentación y análisis de los datos. La mayor parte del
análisis estadístico se realiza utilizando una biblioteca de programas estadísticos, donde el
usuario introduce los datos y luego selecciona los tipos de análisis y la presentación de los
resultados que interesan. Entre los paquetes más utilizados están el SPSS (Paquete
Estadístico para Ciencias Sociales ) y el Statgraphics .
1
Mood Graybill. ―Introducción a la Teoría de la Estadística
2
Ya lun Chou. ―Análisis estadístico‖
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 6

1.2. CONCEPTOS BÁSICOS:


1.2.1. UNIVERSO. Total de unidades de análisis definidas en el espacio y en el tiempo.
Así: Todos los trabajadores de la Municipalidad, al 31-12-07; total de familias del distrito
de Castilla al 31-08-07; total de computadoras de una Facultad en un periodo dado; todas
las pequeñas y medianas empresas (PYMES) de la región en el último quinquenio; total de
clientes particulares de una tienda ―Alfa‖ de Piura, periodo Octubre a Noviembre del
2007.

1.2.2. UNIDAD DE ANÁLISIS. Llamada también unidad experimental, i.e.; son los
sujetos u objetos en estudio. Asia : alumnos; docentes ; trabajadores; clientes ; pacientes;
gerente; empresa; aula; Centro educativo; familiar; comunidad campesina; sindicato;
asociación ; cultivo ; crianza; ovino; vacuno; unidad ganadera; maquinaria; motor;
vehículo; refinería; producto; etc.

1.2.3. VARIABLE. Característica o atributo de la u.e., cuyos valores están sujetos a


variación. Pueden ser de tipo : cuantitativas, si asumen valores numéricos y categóricas, si
asume valores no numéricos .Así : sexo ; estado civil;; lugar de procedencia ;grado de
instrucción ; Número de hijos ; ingresos ; consumos; etc..

1.2.4. DATO. Llamado también observación experimental; o.e.; es el valor de la


variable. Así:
Unidad experimental: Variable Tipo Valores
( u.e) (datos u o.e)
Ingreso $/mes Cuantitativa 500 ; 750;...
Ahorro $/mes Cuantitativa 120; 300,...
Nº de personas Cuantitativa 6; 5;...
Consumo $/mes: Cuantitativa 300; 250;...
Grado Instruí. Del padre Categórica Sup.; Prim.;
Familia Posee carro Categórica No; .Si.
Tamaño de su vivienda Categórica Grande; pequeña;..
Edad dela madre (años) Cuantitativa 35; 45;......
Nº de cilindros Cuantitativa 3; 5;..
Motor Potencia Cuantitativa 300; 200;
Marca Categórica Toyota; Honda;.
Año de fabricación Cuantitativa 2001; 2002;.
Octanaje Cuantitativa 84 ; 95;..
Gasolina Precio/galón Cuantitativa 9; 12;..
Densidad Cuantitativa 1.5 ; 1.3;..
Rdto. (Km/galón) Cuantitativa 20; 25 ; 40
Edad en años Cuantitativa 18; 21;..
Gasto : S/mes: Cuantitativa 200;150;..
Rdto. Académ. Cuantitativa 15; 14;..
ESTADISTICA DESCRIPTIVA.- UNP. 7

Alumno Rdto. Académ. Categórica bueno; regular;


Talla en cms. Cuantitativa 171; 180;..
Procedencia Categórica Piura; Lima;...
I.Q: Cuantitativa 120; 135;.....
Nº de trabajadores Cuantitativa 10; 23;...
Nº de unidades Cuantitativa 15; 10;...
Empresa de Ingreso S/día Cuantitativa 250; 150;...
transportes Gasto S/día Cuantitativa 96; 67;...
Tamaño Categórica pequeña;...
1.2.5. POBLACIÓN – MUESTRA.

a) POBLACIÓN. Característica de los elementos de un universo ; Universo con alguna


variable en estudio ; Variable correspondiente a un conjunto de elementos. Así:
Rendimiento Académico de los alumnos UNP. a diciembre 2008.; Ingreso S/mes de las
familias en el distrito de Castilla en el periodo septiembre a diciembre.

b) MUESTRA. Subconjunto de una Población ( Universo). Puede referirse sólo al


tiempo; sólo al espacio; ambos. EJEMPLOS :

POBLACIÓN: Rendimiento académico de los alumnos UNP, semestre II-06. Algunas


muestras son: Rendimiento académico de los alumnos de la Facultad de Ciencias;
Rendimiento académico de los alumnos en la UNP, en la primera evaluación;
Rendimiento académico de 100 alumnos UNP.

MUESTRA: 50 vehículos, taxi-tico, que circulan en la ciudad de Piura en el mes de


diciembre del 2006.

Algunos universos, pueden ser: Todos los vehículos taxi-tico; todos los vehículos taxis;
todos los vehículos del parque automotor; en la ciudad de Piura, en el mes de diciembre
del 2007.

NOTAS: Una misma variable puede expresarse en términos cuantitativos o categóricos


Desde un universo pueden derivarse más de una población (variables)

1.3. PRESENTACIÓN DE LOS DATOS. (Variable cuantitativa)


Podemos hacerlo mediante un análisis exploratorio de datos que puede comprender
diagramas de tallos y hojas; diagramas de cajas ; cuadros y gráficas.

1.3.1. FORMACIÓN DE UN CUADRO. Llamado también cuadro de distribución


de frecuencias, el mismo que puede construirse para intervalos o para valores aislados de
la variable; es decir, dado un conjunto de datos : X1; X2;...; Xn ; donde ― n ‖ es el tamaño
de una muestra grande, el procedimiento para formar un cuadro es el siguiente :
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 8

A. CUADRO CON INTERVALOS DE FRECUENCIAS:

a) Determinar el rango, R :

a.1) R = Xmáx –Xmín + 1; si Xi fueran enteros.

a.2) R = Xmáx – Xmín ; si Xi no fueran enteros.

b) Determinar el número de intervalos, clases o celdas al que llamaremos ―m‖, donde:

1  3.3. log .n : MétododeSt urges



m=  n

 Arbitrario

En cualquiera de los casos el valor de ―m‖ debe obedece redondearse por exceso. El

Método arbitrario, obedece a un valor pre-establecido, donde el valor de ―m‖ puede variar
entre 5 a 8 ; 10 a 15; u otro valor, depende del valor de ―n ―; valor de R o los valores de Xi (
enteros o decimales )

c) Conocidos los valores de R y m, obtenemos el valor de la amplitud o ancho de la


R
celda o intervalo, C = , valor que debe redondearse por exceso y debe tener igual
m
número de cifras decimales que los datos Xi.

R
Si R y C , fueran conocidos, entonces el valor de m = , Al redondearse por exceso
c
tenemos un nuevo rango R* = m.C > R ; R*– R = E : exceso que debe distribuirse
E
equitativamente en ambos extremos (  ), obteniendo los límites inferior y superior
2
E E
del cuadro. Límite Inf. = Xmín  ; Límite superior : Xmáx 
2 2
d) Determinar los intervalos Generalmente de la forma: [... .) ó ( ]. El
software Statgraphics, utiliza los intervalos: ( ]

A partir del primer límite inferior, se obtiene los demás límites sumando sucesivamente la
amplitud de cada intervalo ―Ci ― que por lo general es constante .Así:

´X 1 = X1 + C ; ´X 2 = X2 + C y así sucesivamente. Además ´ X i = Xi+1


Ci [... .) o ( ] ni
C1 X1— ´X 1 n1
C2 X2 – ´X 2 n2
ESTADISTICA DESCRIPTIVA.- UNP. 9

Cm Xm – ´ X m nm
m
C1 = C2 =... = C = Cte. n. = n
1
i

e) Se determina el conteo de los datos (frecuencias) correspondientes a cada intervalo, los


que simbolizaremos como: ni o fi

EJEMPLO: X : representan gastos S/mes de los alumnos de una Facultad :


554 519 564 525 542 564 561 553 545 549 538 542 556 547 535 544 563 546
568 573 544 557 538 550 536 547 546 548 550 545 535 528 535 552 540 558
526 532 576 540
Ordenar los datos, utilizando los métodos de: Sturges; la raíz cuadrada; arbitrario
donde C = 5

SOLUCION:
Según el método de Sturges, el número de intervalos es m = 1 + 3.3 log.40 = 6.28 = 7
58
R = 576 – 519 + 1 = 58 ; C= = 8.3 = 9 ; R* = m.C = 7x9 = 63. Se obtiene
7
exceso E, donde este exceso E = 63 –58 = 5. Distribuyendo el exceso en ambos
extremos: ± 2.5, tenemos: Límite Inf. = 519 – 2.5 = 516.5 = 517 ; Límite Sup. = 576
+ 2.5 = 578.5 = 579; obteniendo el cuadro siguiente:

CUADRO Nº 01 GASTOS S / MES DE LOS ALUMNOS DE UNA FACULTAD.

Ci [. S/mes ) ni o fi
C1 517 --- 526 2
C2 526 --- 535 3
C3 535---- 544 10
C4 544--- - 553 13
C5 553---- 562 6
C6 562--- - 571 4
C7 571---- 580 2
m = 7 ; C1 = C2 =... = C = 9 = Cte n = 40
FUENTE: ENCUESTA A LOS ALUMNOS.
Los demás métodos (raíz cuadrada y arbitraria), queda como ejercicio para el lector
B. CUADROS CON VALORES AISLADOS ( sin intervalos )

Si en lugar de intervalos utilizamos puntos o valores aislados (generalmente números


enteros), el procedimiento se reduce a lo siguiente:

a) Registrar los diferentes valores o puntos aislados de la variable.

Hagamos : X i , i: 1, 2... m, donde m es el número de valores aislados diferentes.


Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 10

b) Determinar el conteo de los datos correspondientes a cada valor aislado : ni o fi.


Valores aislados Frecuencias
de la variable ni o fi hi
X 1 n1 h1
X 2 n2 h2
X 3 n3 h3
..
..
X m nm hm
m m
n=  ni
1
 h =1.00
1
i

EJEMPLO: Los siguientes datos representan el número de hijos/trabajador de los


empleados de una empresa :
Xi: 3 0 4 6 2 3 4 2 1 0 2 5 3 3 1 4 5 2 4
3 5 1 4 5 3 3 2 3 4 3
CUADRO Nº 02 . NÚMERO DE HIJOS DE TRABAJADORES EN UNA EMPRESA:

Número de hijos Número de trabajadores


Valores aislados ni o fi
0 2
1 3
2 5
3 9
4 6
5 4
6 1
m
n= n
1
i = 30
FUENTE. ARCHIVOS DE LA EMPRESA.

1.3.2. PARTES DE UN CUADRO: Número; título; matriz (columna de


intervalos o valores aislados y frecuencias) y fuente o pie.
1.3.3. LIMITES DE CLASE Y PUNTOS MEDIOS. En un cuadro, tenemos

a) Los límites de clase o límites de intervalos. Estos pueden ser simplemente límites
de clase, si lo son cerrados en ambos extremos; límites reales de clases, si lo son
semicerrados, de modo que un :

Límite Sup. Real = Límite Inf. + C


ESTADISTICA DESCRIPTIVA.- UNP. 11

b). Punto medio. Llamado también marca de clase, es la semisuma de los límites de un
intervalo; simbolizaremos por Xi, donde:

LímiteInf .  LímiteSup .
Xi = = Xi-1 + C = Xi+1 – C
2
C C
= Límite Inf. + = Límite Sup. ─ ; donde i = 1 , 2, 3, ..., m
2 2
NOTA: El punto medio reemplaza al conjunto de valores del intervalo; puede
considerarse como valor aislado de la variable.

1.3.4. FRECUENCIAS. Son el total o porcentaje de valores correspondientes a cada


intervalo. Pueden ser:

a) Absolutas simples: ni o fi , corresponden a un conteo inicial de los datos

ni
b) Relativa simples: hi = , dado en decimal o porcentaje;
n
i
c) Acumuladas simples: Ni =  n j = Ni-1 + ni
1

i
d) Acumuladas relativas: Hi =  h j = Hi-1 + hi, indicados en decimal o porcentaje.
1

Las frecuencias acumuladas, pueden ser ascendentes ( ≤ ) o descendentes ( ≥ )

Ordenando los datos en un cuadro de distribución de frecuencias, se tiene:


intervalos Punto medio frecuencias simples frecuencias acumuladas
i [. ) ó ( ] Xi ni o fi Ni o Hi
1 X1 n1 o f1 N1 o H1
2 X2 n2 o f2 N2 o H2
3 X3 n3 o f3 N3 o H3

m Xm nm o fm Nm o Hm
m = Nº de intervalos; C = Cte. n o 1.00

EJEMPLO: Sea X: utilidades (miles de $) de 40 empresas de la región, último año.


Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 12

CUADRO Nº 03 UTILIDADES EN MILES DE DÓLARES DE 40 EMPRESAS :


intervalos Punto medio frecuencias simples frecuencias acumuladas
i [ . )ó( ] Xi ni ó fi Ni ó Hi
% ≤ ≥ ≤ % ≥
1 6 a 8 7 3 o 0.075 o 7.5 3 40 0.075 o 7.5 1.000
2 8 a 10 9 5 o 0.125 o 12.5 8 37 0.200 o 20.0 0.925
3 10 a 12 11 8 o 0.200 o 20.0 16 32 0.400 o 40.0 0.800
4 12 a 14 13 14 o 0.350 o 35.0 30 24 0.750 o 75.0 0.600
5 14 a 16 15 6 o 0.150 o 15.0 36 10 0.900 o 90.0 0.250
6 16 a 18 17 4 o 0.100 o 10.0 40 4 1.000 o 100.0 0.100
m = 6; C = 2 = Cte. n = 40 1.00 100.0

FUENTE: ARCHIVOS DE LAS EMPRESAS.

Algunos resultados del cuadro anterior son:

a) Puntos medios o marcas de clase:

10.  12. C C
X3 = = X2 + C = X4 – C = 10. + = 12 – ;
2 2 2
22 2 2
X3 = = 9 + 2 = 14 – 2 = 10. + = 12 – = 11. Significa que 8 empresas arrojan
2 2 2

b) Frecuencias:
ni 3
b.1) Relativa simple: h1 = = = 0.075 = 7.5 %. Significa que el 7.5 % de las
n 40
empresas tiene utilidades mayores o iguales a 6mil y menores que 8 mil dólares

b.2) Acumulada simple:


4
N4 = n
1
j = n1 + n2 + n3 + n4 = N3 + n4 = 3 + 5 + 8 + 14 = 16 + 14 = 30. Significa

que 30 empresas tienen utilidades menores que 14 mil dólares


b.3) Relativa acumulada: acumulada relativa:
El 20 % de las empresas tienen utilidades mayores o iguales a 10 mil dólares y menores
que 12 mil dólares. Equivalente también a decir que 8 empresas tienen utilidades de 11
mil dólares, cada una.
3
H3 =  h j = H2 + h3 = 0.075 + 0.125 + 0.200 = 0.20 + 0.20 = 0.40 = 40.0 % (decimal o
1
porcentaje).Significa que el 40 % de las empresas tienen utilidades menores a 12 mil $.
ESTADISTICA DESCRIPTIVA.- UNP. 13

CUADRO Nº 04. Gastos de alumnos ( S /.mes).


Distribución de frecuencias de gastos ( $/mes), de alumnos de una Facultad
--------------------------------------------------------------------------------
Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
--------------------------------------------------------------------------------
1 516.0 525.0 520.5 2 0.0500 2 0.0500
2 525.0 534.0 529.5 3 0.0750 5 0.1250
3 534.0 543.0 538.5 10 0.2500 15 0.3750
4 543.0 552.0 547.5 13 0.3250 28 0.7000
5 552.0 561.0 556.5 6 0.1500 34 0.8500
6 561.0 570.0 565.5 4 0.1000 38 0.9500
7 570.0 579.0 574.5 2 0.0500 40 1.0000
--------------------------------------------------------------------------------
m = 7 ; C = 9 n = 40 1.0000
--------------------------------------------------------------------------------
Fuente . Ampliación del CUADRO Nº 01
1.4. GRAFICAS.-DEFINICIÓN.- CLASES
1.4.1. DEFINICIÓN. Es la representación objetiva de los datos de un cuadro
1.4.2. CLASES. Tenemos: Histogramas; polígonos de frecuencias; ojivas;
sectores circulares (torta); lineales (series de tiempo); etc.
a) Histogramas de frecuencias : Intervalos Vs frecuencias..En el primer cuadrante de
un sistema de coordenadas cartesianas, el histograma de frecuencias es una sucesión
de rectángulos cuyas bases equivalen a los intervalos (eje de las abscisas) y cuyas
alturas son las frecuencias (eje de las ordenadas). EJEMPLO:

Histograma de frecuencias de lgastos de alumnos de una Facultad


40
Número de alumnos

30

20

10

0
516 525 534 543 552 561 570 579
Gastos Soles por mes

Fuente: Datos del CUADRO Nº 04


b) El polígono de frecuencias: Puntos medios Vs frecuencias En el primer cuadrante
de un sistema de coordenadas cartesianas, el polígono de frecuencias es una sucesión
de líneas que se unen en puntos o pares ordenados (puntos medios; frecuencias). La
línea poligonal o polígona de frecuencias se inicia y termina en el eje de las abscisas;
para esto deben crearse dos intervalo o puntos medios artificiales en los extremos de la
variable con frecuencias iguales a cero. EJEMPLO:
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 14

Poígono de frecuencias de lgastos de alumnos de una Facultad


40
Número de alumnos

30

20

10

0
511.5 520.5 529.5 538.5 547.5 556.5 565.5 574.5 583.5
Gastos Soles por mes

Fuente: Datos del CUADRO Nº 04


c) Ojivas: Intervalos Vs. Frecuencias acumuladas (%).En el primer cuadrante de un
sistema de coordenadas cartesianas, la Ojiva , es una línea poligonal ascendente (
descendente) que une los puntos o pares ordenados correspondientes a los límites de
los intervalos con sus frecuencias relativas acumuladas. EJEMPLO:
Poígono de frecuencias acumuladas de gastos de alumnos de una Facultad
100
Porcentaje de alumnos

80

60

40

20

0
516 525 534 543 552 561 570 579
Gastos Soles por mes

Fuente: Datos del CUADRO Nº 04


d) Barras o bastones. Intervalos o atributos Vs frecuencias relativas simples En el primer
cuadrante de un sistema de coordenadas cartesianas, las barras, verticales, es una sucesión
rectángulos cuyas bases (eje de las abscisas) representan a los valores de la variable en
términos categóricos y cuyas alturas son las frecuencias simples. También las barras pueden
ser horizontales. EJEMPLO: Ver página siguiente :
e) Sectores circulares Es una gráfica que representa una sucesión de sectores circulares
correspondientes a los valores de las frecuencias simples. La unidad de medida puede ser el
grado sexagesimal o el porcentaje. . Ver página siguiente :
Gastos de alumnos de una Facultad, según categorías : A ; B; A ; …..; C ; n = 40 datos de
variable categórica.
f) Series de tiempo. Gráfica lineal o poligonal: Tiempo Vs. valores de la variable, donde el
tiempo el tiempo es una secuencia de años.

1.5. USO DE SOFTWARE. STATGRAPHICS:


a) Formación de un cuadro de frecuencias: Seguir la secuencia:
ESTADISTICA DESCRIPTIVA.- UNP. 15

Describe  Numerical data  one variable  Análisis  Tabular options


 Frecuency y tabulacion
b) Gráficas : Seguir la secuencia: Describe  Numerical data  one variable  análisis :
b.1) Graphical options  frecuency histogram . Si deseamos otras gráficas
continuar la secuencia, haciendo clic en botón derecho (mause) Pane options :
Plot type  poligon ; Counts  cumulative  plot type 
poligon (ojiva)
b.2) Describe  categorical data  tabulation data  graphical options
barcchart(barras) o picchart(torta)
EJEMPLO : Reordenando los datos del CUADRO Nº 01 en 5 categorías, se tiene :
Gastos de alumnos de una Facultad por categorías

------------------------------------------------------------------------
Frrecuencias Simples. Frecuencias Acumuladas
Categoría Absolutas Relativas Absolutas Relativas
------------------------------------------------------------------------
A 5 0.1250 5 0.1250
B 10 0.2500 15 0.3750
C 13 0.3250 28 0.7000
D 6 0.1500 34 0.8500
E 6 0.1500 40 1.0000
------------------------------------------------------------------------

Diagrama de gastos de alumnos de una Facultad por categgorías


15
Número de alumnos

12

0
A B C D E

Categorías de gastos

Diagrama de sectores de gastos de alumnos de una Facultad


15.00% 12.50% Categoría s
A
B
C
15.00% D
25.00% E

32.50%

Fuente : Datos del Cuadro anterior .


Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 16

1.5. EJERCICIOS RESUELTOS Y PROPUESTOS:


01. Dados los siguientes datos ( muestras ) presentarlos en cuadros de distribución de
frecuencias según los diferentes métodos estudiados en clase:
a) Intereses pagados en $ a clientes en una entidad bancaria de la localidad :

65 72 52 75 63 63 50 38 30 36 44 62 63 39 89 59 69 74 75 63
67 64 87 58 82 61 59 38 53 95 87 79 76 75 68 81 52 84 53 43
75 77 73 82 95 69 72 84 48 49 55 66 73 59 70 48

b). Monto de compras S/día por diferentes conceptos en una tienda comercial:

52 42 59 63 47 65 64 34 55 35 54 50 48 55 55 58 58 40 39 58 48
53 48 52 43 39 72 53 46 52 51 62 51 63 38 42 45 69 50 46 49 56

c). Remuneraciones de trabajadores ( $/mes):

94 89 96 77 80 112 87 107 98 86 80 89 73 86 116 100 79 104


97 88 67 105 105 92 96 91 87 87 107 66 79 103 87 77 87 77
69 97 78 86 74 90 83 98 95 86 9 3 82 93 94

d) Préstamos en cientos S/semana en la Caja Municipal de Piura.

133 107 90 115 136 108 95 130 93 93 107 120 122 104 124 108
140 118 98 124 99 110 97 96 114 112 109 115 130 105 118 106
108 110 102 110 92 102 103 125

e) Para una campaña de ventas, la gerencia de una compañía, convoca y administra un test
de suficiencia a 50 candidatos. Los resultados, son los siguientes :

88 53 42 35 41 60 39 65 61 94 77 94 35 55 54 84 55 98 74 74 69
33 57 59 63 81 68 67 52 41 45 65 50 78 76 67 91 66 89 64 48 60
65 63 66 71 47 85 85 80

f). Cincuenta estudiantes de Administración de Empresas, rinden una prueba de


Estadística. Los resultados (escala centesimal) son:

60 65 15 35 65 55 31 45 56 30 39 51 56 54 47 43 55 57 24 49 77
48 25 58 68 21 41 54 64 53 24 57 50 59 33 74 34 28 69 12 23 67
45 43 40 44 41 64 36 38

g) . Los siguientes datos representan tiempos de atención (minutos) de clientes


que ingresan a un taller de mecánica para reparar su vehículo:

52.5 48.6 43.2 45.2 47.2 58.1 46.2 49.1 55.4 40.2 51.3 64.5 63.1
58.3 53.2 46.2 34.2 58.1 62.5 59.3 50.3 52.1 42.4 65.2 61.4 44.3
51.2 42.5 54.1 48.3 38.3 65.2 55.2 72.3 50.3 53.1 35.8 53.1 63.2
55.2 39.2 69.2 47.2 52.4 56.3
ESTADISTICA DESCRIPTIVA.- UNP. 17

h) Los datos siguientes representan los tiempos de procesamiento de un pagador (


en minutos) para un conjunto de clientes que arriban a un banco:

2.5 1.2 2.0 1.5 2.3 3.8 2.8 1.1 1.7 3.3 1.3 0.8 0.9 4.8 1.0 6.1
1.4 5.0 1.4 1.0 1.7 1.2 2.0 1.3

SOLUCIÓN:

R = 95 ─ 30 +1 = 66 ( por ser datos numéricos enteros )

a.1) m = 6.7 =7 (Sturges) ; C = 9.4 = 10; Exceso = 4 ; Límite Inf. = 28; Límite Sup.= 97
a.2) m = 8 (arbitrario) ; C = 8.3 = 9 ; Exceso = 6 ; Límite Inf. = 27 ; Límite Sup. = 98
a.1) Método de Sturges a.2) Método arbitrario
[ ) ni [ ) ni
28 --- 38 2 27 --- 36 1
38 - ---48 5 36 -- - 45 6
48 --- 58 9 45 -- 54 8
58 -- 68 14 54 --- 63 7
68 --- 78 15 63 -- 72 12
78 - 88 8 72 -- 81 12
88 - 98 3 81 - 90 8
90 -- 99 2
m = 7 ; C = 10 n = 56 m=8 ; C=9 n = 56
b) R = 72 ─ 34 +1 = 39 ( por ser datos numéricos enteros )
m = 6.3 = 7 (Sturges) ; C = 5.5 = 6 ; Exceso = 3 ; Límite Inf. = 33 ; Límite Sup. = 74

d) R = 140 ─ 90 +1 = 51 ( por ser datos numéricos enteros )


m = 6.3 = 7 (Sturges) ; C = 7.4 = 8 ; Exceso = 5 ; Límite Inf. = 88 ; Límite Sup. =143

f).R = 75 ─ 12 +1 = 64 (por ser datos numéricos enteros )


m = 6.6 = 7 (Sturges) ; C = 9.4 = 10 ; Exceso = 4 ; Límite Inf. = 10 ; Límite Sup. = 79

h). R = 72.3 ─ 34.2 = 38.1 ( por ser datos numéricos decimales )


m = 6.5 = 7 (Sturges); C = 5.44 = 5.5; Exceso = 0.4 ; Lím. Inf. = 34.0 ; Lím. Sup.=73.0

(b) (d) (f) (g)


[ ) ni [ ) ni [ ) ni [ ) ni
33—39 3 88 --- 96 5 10 --20 2 34.0—39.5 4
39 – 45 6 96 ---104 7 20 - 30 6 39.5 – 45.0 5
45 --51 10 104 --112 12 30 --40 8 45.0 – 50.5 10
51-- 57 12 112 - 120 6 40 – 50 11 50.5 --56.0 11
57-- 63 5 120 --128 5 50---60 13 56.0 – 61.5 7
63-- 69 4 128-- 136 3 60---80 8 61.5 --67.0 6
69 – 75 2 136 --144 2 70--- 80 2 67.0 -- 72.5 2
m= 7 ; C = 6 ; n =42 m = 7 ; C = 8 ; n =40 m = 7 ; C = 10; n=50 m = 7; C =5.5; n =45
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 18

02.:Sea Xi : número de llamadas por minuto a una centralita telefónica:


0 1 1 2 1 4 1 0 3 1 1 0 4 2 0 0 3 1 0 1 2 1 0
1 0 0 2 1 0 1 1 0 0 1 3 0 1 1 0 1 2 0 0 1 3 1
1 1 0 0 0 2 0 2 3 2 0 1 0 4 0 2 0 2 1 0 2 0 2
2 0 1 0 0 1 3 2 1 0 6
Formar un cuadro de distribución de frecuencias con puntos aislados y presentarlo
gráficamente.

03. Los siguientes datos representan: Opinión de 28 personas acerca de la política


económica del país:

M NC NC NC NC B B B M M M R NC NC R B R B R R NC
M B R R NC NC NC
Formar un cuadro de distribución de frecuencias y presentarlo gráficamente.

1.6. MEDIDAS ESTADÍSTICAS DESCRIPTIVAS


Además de presentar los datos en cuadros y gráficas, se requiere con frecuencia resumirlos
aún más a través de valores o medidas estadísticas para facilitar su análisis e interpretación.
Presentaremos fórmulas o procedimientos para calcular las medidas tanto para pocos datos
como para muchos datos.
1.6.1. POCOS DATOS.. Dado Xi : X1; X2; ...; Xn, donde ―n‖ es pequeña, podemos
calcular las principales medidas:

[Link] DE POSICIÓN.
n

X i
a) Media aritmética: x  1

n
n

 log . X .i
b) Media geométrica: x g  Anti log 1

n
n
c) Media armónica: x h 
1
X
i

d) Mediana, Me : para calcularse esta medida debe ordenarse primero los datos Xi ,
ya sea en forma ascendente o descendente, obteniendo : X(1); X(2); X(3);...;X(n), luego :
ESTADISTICA DESCRIPTIVA.- UNP. 19

  n  1
 X  : n..impar
  2 
Me =   n   n 
 X  2   X  2  1
     : [Link]. par
 2

Valor que divide al conjunto en dos grupos de igual número de datos.

e) Moda o valor modal: Md = Xi más común o más frecuente; puede haber más
de una valor modal o puede no existir el Xi común.

NOTA : De las tres medias o promedios, se tiene la relación : xh  xg  x .

B. .MEDIDAS DE VARIACIÓN O DISPERSIÓN.

El uso de una sola medida estadística (promedio) para describir un conjuntote datos puede
ser incompleto y se puede estar ocultando características importantes. Así, si tenemos dos
conjuntos de datos que arrojan el mismo promedio, no significa necesariamente que se trata
de los mismos valores, uno de los grupos puede estar más disperso alrededor de su
promedio que el otro. Por esta razón es necesario calcular también una medida de
dispersión, variación o esparcimiento para describir mejor un conjunto de datos. Las
medidas de dispersión más utilizadas son: rango ; desviación estándar y coeficiente de
variación. Así:

a) Rango: R = Xmáx. – Xmín


n n

 ( X i  x) 2 X i
2
n
 
2
b) Varianza: S2 = 1 1
.x
n 1 n 1 n 1

c) Desviación estándar: S =  S 2

S
d) Coeficiente de variación: CV = , decimal o porcentaje.
x
El rango y la desviación estándar se expresan en unidades originales de la variable y se usan
para comparar la variación de dos o más conjuntos de datos con la misma variable. En
ocasiones hay un solo conjunto de datos o dos o más conjuntos expresados en unidades
diferentes; en estos casos utilizaremos el coeficiente de variación. Para un solo conjunto de
datos se tiene lo siguiente:

CV : < del 10 % ( poca variación ) ; CV : 10 al 33 % ( dispersión aceptable o


regular) ; CV : 33 % a 50 % ( alta dispersión ) ; CV > del 50 % (muy alta dispersión )

EJEMPLO: Sea X: 6; 9; 5; 4; 3; 2; donaciones en millones de dólares de países


amigos. Aquí ―n‖ es pequeño (n = 6 países). Entonces:
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 20

a).Medidas de posición:
n

X i
6  9  ...  2 29
Media aritmética: x  1
=   4.83 millones de $.
n 6 6
n

 log . X .i
Media geométrica: x g  Anti log 1
=
n
log .6  log .9  ...  log 2
= Anti log  Anti log .0.6326  4.3178 millones de $.
6
n 6 6
Media armónica: x h  =   3.843 millones de $.
1 1 1 1
X   ... 
6 9 2
1.5611
i

Mediana, Me : Ordenando primero los datos Xi, digamos en forma descendente,


obtenemos : X(1); X(2); X(3);...;X(6); es decir : 9 ; 6 ; 5 ; 4 ; 3 ; 2., luego :

n n 
X    X   1
Me =  
2  2  = X 3  X 4  5  4  4.5 millones de $ . El 50 % de
2 2 2
las donaciones ( es decir 3 de ellas ) ascienden a 4.5 millones de dólares.

Moda o valor modal : Md = Ф, vacía, no existe Xi más común;.

b). Medidas de variación o dispersión.

Rango: R = Xmáx. – Xmín = 9 – 2 = 7 ;


n n

 ( X i  x) 2 X i
2
n
 
2
Varianza: S2 = 1 1
.x =
n 1 n 1 n 1
62  92  ...  22 6
=  .(4.83)2  6.2053 millones2
5 5

Desviación estándar: S =  S 2 =  6.2053  2.491 millones de $;

S 2.491
Coeficiente de variación: CV = =  0.516 = 51.6 %,
x 4.83
NOTA: La media geométrica, se utiliza cuando las Xi son razones o proporciones;
crecimiento poblacional; interés compuesto, con tasa de crecimiento constante.
ESTADISTICA DESCRIPTIVA.- UNP. 21

La media armónica, se usa cuando las Xi son velocidades; precios u otros valores
análogos.

EJEMPLO: Sean los datos (notas): Xi : 15 ; 10 ; 14 ; 16 ; 9. puntos. Calcular la


mediana, Me, para n = 5 (impar). Ordenamos los datos, digamos en forma creciente

X(1) ; X(2) ; X(3) ; X(4) y X(5) ; es decir : 9 ; 10 ; 14 ; 15 ; 16.,respectivamente :

 n 1
Luego la mediana es: Me = X   = X(3) = 14 puntos.
 2 

EJEMPLO. Sea Xi : 10; 10; 2; 4; 7 ; 10; 14 ; 12; 15 ; 12, tiempo en minutos de


llamadas telefónicas . Verifique los resultados siguientes:

x  9.6 min.; Me = Md = 10 min. ; S = 3.96 min ; CV = 0.413 = 41.3 %

EJEMPLO .Los salarios de los trabajadores de las empresas ―1‖ y ―2‖ son :

Empresa ―1‖ : x1 = 1500 $ con S1 = 500 $; Empresa ―2‖ : x2 = 5000 $ con S2 = 300$
Comparar la variabilidad de los salarios de los trabajadores de las dos empresas en
términos: a) absolutos y b) Con respecto al salario promedio.

a) Comparación absoluta. Se observa que la variación de los salarios de la empresa ―1‖


es muy superior a los salarios de la empresa ―2‖.

500
b) En la variabilidad relativa, se obtiene: CV1   0.333  33.3% y
1500
300
CV2   0.06  6.0% .Se concluye que la variabilidad de los salarios en la
5000
empresa ―1‖ es poco más de 5 veces la variabilidad en los salarios de la empresa ―2‖

1.6.2. MUCHOS DATOS. Dado Xi: X1; X2; X3; ... ; Xn, donde ―n‖ es grande.

Podemos calcular las medidas estadísticas utilizando las mismas fórmulas de pocos datos.
Sin embargo, se sugiere ordenar los datos, por que estos son muchos, en un cuadro de
distribución de frecuencias y luego utilizar nuevas fórmulas. Así:
i [ ) Xi ni Ni hi Hi Xini X i2 ni Zi Zini Z i2 ni
1 X1 n1 N1 h1 H1 X1n1 Z1 Z1n1
2 X2 n2 N2 h2 H2 X2n2 Z2 Z2n2
3
..
m Xm nm Nm hm Nm Xmnm Zm Zmnm
Totales  ni = n 1.00  X i ni  X i2ni  Zi ni  Zi2ni
A. MEDIDAS DE POSICIÓN:
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 22

a) Media o promedio aritmético:


m m

 X i ni m Z n i i m
X i  Ot
x 1
  X i hi  C 1
 Ot  C  Z i hi  Ot ; Donde Zi 
,
n 1 n 1 C
variable que simplifica el procedimiento; Ot llamado origen de trabajo , equivalente al
Xi central, si m es impar o cualquiera de los dos centrales, si m es par.

b). Media geométrica:


m

 n .log .X
i i m
xg  Anti log . 1
 Anti log . hi . log . X i
n 1

n
C. Media armónica : xh  m
;
ni
1 X
i

n 
 2  N j 1   0.5  H j 1 
d). Mediana, Me = Lj +  .C j  L j   .C j ; donde:
 n j  
 h j 
 

n
ó 0.5 : término pívot, señala el intervalo donde se encuentra el valor de Me ;
2
Nj o hj : frecuencia correspondiente al intervalo de Me ;

Nj-1 o Hj-1 : frecuencia acumulada, correspondiente al intervalo anterior al de la Me

Cj: amplitud del intervalo de la Me. Generalmente Cj = C = constante;

Lj: límite inferior del intervalo de la Me.

 1 
e) Moda: Md = Lj +  .C j ; donde: 1  n j  n j 1  h j  h j 1
 1   2 

 2  n j  n j 1  h j  h j 1 ; nj = hj : valor máximo (término pívot)

f) Cuantiles o percentiles. Tienen significado similar a la mediana Estos son :


ESTADISTICA DESCRIPTIVA.- UNP. 23

 i.n   i 
 100  N j 1   100  H j 1 
Pi = Lj +  .C j  L j   .C j ; para i = 1; 2; 3; ...; 99, donde :
 nj   hj 
   

i.n i
..ó.. : Término pívot, señala el intervalo donde se encuentra el percentil ;
100 100
nj o hj : frecuencia simple correspondiente al intervalo percentil ;

Nj-1 o Hj-1 : frecuencia acumulada anterior al del intervalo percentil ;

Lj : límite inferior del intervalo percentil ;

Cj : amplitud del intervalo percentil, generalmente constante

Si i = 50 , el percentil se llama mediana. Simbolizamos como P50 = Me

Si i = 25; 50 ; 75: los percentiles reciben el nombre de cuartiles. Son tres medidas que
simbolizamos como: P25 = Q1 ; P50 = Q2 ; P75 = Q3 y que dividen al conjunto de
datos ordenados en forma ascendente o descendente en cuatro partes iguales. Así:
0% 25% 50% 75% 100%

Q1 Q2 Q3
er
Q1 = 1 cuartil, contiene 25% de las observaciones menores o iguales a él y el 75%
superiores a él.
Q2 = 2do cuartil, coincide con la mediana.
Q3 = 3er cuartil, contiene 75% de las observaciones inferiores o iguales a él y el 25% del
resto son superiores a éestge valor. Debe notarse que entre dos cuartiles consecutivos
se halla el 25% del número de valores.

Si i = 10; 20, ... ; 90, los percentiles se llaman deciles. Son nueve medidas que

Simbolizaremos como: P10 = D1 ; P20 = D2 ; ... ; P90 = D9

Si i = 1; 2; 3;...; 99; los percentiles se llaman centiles o simplemente percentiles,


cuya simbolización será: P1 ; P2 ; P3; ...; P99 y que dividen la muestra ordenada en forma
ascendente o descendente en 100 partes iguales. Así:
0% 1% 2% 50% 98% 99% 100%

P1 P2 P50 P98 P99


Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 24

P1 = 1er percentil, contiene 1% de las observaciones menores o iguales a él y el 99% superiores a


él y así sucesivamente, hasta llegar al percentil 99: P99 = 99vo percentil, que contiene 99% de las
observaciones menores o iguales a él y el 1% superiores a él.

B. MEDIDAS DE DISPERSIÓN O VARIACIÓN.

a). Rango: R = Xmáx. ─ Xmín ;

m m  m 2  m  
2

 ( X i  x)2 .ni  X i2 .ni  i i   i i  


Z .n Z .n
  x  C 2 . 1  1  
2
b). Varianza S2 = 1 1

n n  n  n  
   
   

c) Desviación estándar S =+ var ianza

S
d) Coeficiente de variación o dispersión: CV.= , decimal o porcentaje; cuyo valor:
x
Si es menor del 10% se dice que hay poca dispersión; oscila entre el 10% y el 33% la
dispersión es aceptable o regular; si oscila entre el 33% y el 50% se dice que hay alta
dispersión y si es mayor del 50% se dice que la dispersión es muy alta.

ni
Si los datos están dados en frecuencias relativas, reemplazar en las fórmulas: hi =
n

C. MEDIDAS DE DEFORMACIÓN:

Puede ser de interés conocer el sentido o dirección de la variación (deformación). Esta dirección
puede ser horizontal (medida de asimetría) o vertical (medida de curtosis o apuntamiento)

 ..0
3.x  Me 
a). Coeficiente de asimetría (de Pearson): As = .. ..0 ; recibiendo los nombres
S  ..0

de: asimetría positiva o a la derecha; asimetría nula o simetría y asimetría negativa o a la
izquierda, respectivamente

Si x  Me  Md Se tiene As (+) o sesgo a la derecha.

Si x  Me  Md Se tiene As (-) o sesgo a la izquierda.

Si x  Me  Md Se tiene As. Nula o es insesgado

GRÁFICA. Asimetría: ―As ―de los datos


ESTADISTICA DESCRIPTIVA.- UNP. 25

ni ni

Md  M e  X X  Me  Md

  0.263
q3  q1 
b). Coeficiente de apuntamiento: K = .   ...0.263 ; recibiendo el
2.P90  P10  .  0.263

nombre, respectivamente: Platicúrtica; mesocúrtica y leptocúrtica.

GRÁFICA. Distribuciones leptocúrtica y platicúrtica


ni
Leptocúrtica
Mesocúrtica
Platicúrtica

X
La distribución mesocúrtica es una gráfica ideal, ni muy levantada ni muy plana, llamada
también normal
El software Statgraphics calcula las medidas estadísticas según fórmulas de pocos datos.

EJEMPLO: Sean los datos X: notas o puntajes (escala centesimal) en el curso de


Estadística de 82 alumnos: 90.8; 85.7; ... ; 98.1. Aquí tenemos una muestra grande
Ordenando los datos en un cuadro de frecuencias se tiene:
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 26

CUADRO Nº 05. NOTAS O PUNTAJES DE 82 ALUMNOS

[ Notas ) Xi ni Ni hi Hi Xini X i2 ni Zi Zini Z i2 ni


%
83.3-- 85.8 84.55. 4 4 0.04880 4.9 338.20 8594.810 –3 –12 36
85.8-- 88.3 87.05 10 14 0.12195 17.07 870.50 75777.025 – 2 –20 40
88.3-- 90.8 89.55 31 45 0.37804 54.87 2776.05 248595.2775 –1 –31 31
90.8-- 93.3 92.05 25 70 0.30487 85.4 2301.25 211830.0625 0 0 00
93.3 -- 95.8 94.55 8 78 0.09756 95.2 756.40 71517.6200 1 8 8
95.8 -- 98.3 97.05 2 80 0.02439 97.6 194.10 18837.4050 2 4 8
98.3 a + 99.55 2 82 0.02439 100.0 199.10 19820.4050 3 6 18
m = 7 ; C = 2.5 n = 82 1.000 7435.6 674972.585 – 45 141

FUENTE: REGISTROS DE EVALUACIÓN

a). Medidas de posición:


m m

 X i ni 7435.6 1 Zi ni   45 
a.1).Media x  1
 C  Ot  2.5   92.05  90.678 pts.
n 82 n  82 
El promedio de notas por alumno es 90.678 pts. O la nota promedio de los alumnos es
90.678 pts.
n 
 2  N j 1   41  14 
a.2) Mediana, Me = Lj +  .C j  88.3    x 2.5  90.477 pts.:.El 50 %
 n j   31 
 
de los alumnos obtuvieron notas menores de 90.477 pts.; en tanto que el otro 50 %,
obtuvieron notas mayores o iguales a 90.477 pts.

 1   21 
a.3) Moda: Md = Lj +  .C j  88.3    x2.5  90.244 pts...Las notas más
 1   2   21  6 
frecuentes es 90.244 pts. O la mayoría de los alumnos obtienen notas iguales o se aproximan a
90.244 pts.

a.4) Cuantiles o percentiles:

 10.n 
 100  N j 1   8.2  4 
P10 = Lj +  .C j  85.8    x 2.5  86.85 puntos;
 nj   10 
 
ESTADISTICA DESCRIPTIVA.- UNP. 27

 25.n 
 100  N j 1   20.5  14 
P25 = Lj +  .C j  88.3    x 2.5  88.824 puntos
 nj   31 
 
 75.n 
 100  N j 1   61.5  45 
P75 = Lj +  .C j  90.8    x 2.5  92.45 puntos
 nj   25 
 

Según la distribución de los puntajes tenemos los cuartiles Q1 ; Q2 ; Q3 y el percentil P90:

25% 25% 25% 25%

83.3 Q1 = 88.8 Q2 = 90.477 Q3 = 92.45 100.8


 90.n 
 100  N j 1   73.8  70 
P90 = Lj +  .C j  93.3    x 2.5  94.487 puntos
 n j   8 
 

b)...Medidas de dispersión o variación.

b.1) Rango: R = Xmáx.─ Xmín

X i
2
.ni
674972.585
x   (90.678) 2  8.8646 pts2
2 1 2
b.2) Varianza: S =
n 82

 m 2  m  
2

  Z i .ni   Z i .ni      45  
2
2 2  1
S =C .   1   2 141
 (2.5) .     8.8646 pts.
2
 n  n    82  82  
   
   

b.3) Desviación estándar: S =+ var ianza = + 8.8646. pts 2  2.977 puntos


2.977
b.4) Coeficiente de variación: CV.=  0.0328  3.28%
90.678

c).Medidas de deformación

c.1). Coeficiente de asimetría (de Pearson):


Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 28

3.x  Me 3.90.678  90.477 


As = .  0.2025 ;
S 2.977
q3  q1 92.45  88.824
c.2). Coeficiente de apuntamiento: K=   0.237.
2.P90  P10  2.(94.48  86.85)

EJEMPLO: Sea X: ingresos S/día de 80 trabajadores de una empresa: 35; 40;......; 60

CUADRO Nº 06. INGRESOS S/DÍA DE LOS TRABAJADORES DE UNA EMPRESA

ni
[ ) Xi ni Ni Xini X i2 ni [Link] [Link] Zi Zini Z i2 ni
Xi
-- 35 32.5 4 4 130.0 4225.00 1.5119 6.0475 –4 –16 64 0.1231
35--40 37.5 7 11 262.5 9847.75 1.5740 11.0182 –3 –21 63 0.1867
40--45 42.7 10
45--50 47.5 13
50--55 52.5 20
55--60 57.5 15
60--65 62.5 6
65--70 67.5 3
70—75 72.5 2 80 145.0 10512.5 1.8603 3.7207 4 8 32 0.0276

m = 7 ; C =5 n = 80 4070.0 213800.0 135.9287 –26 278 1.7246


FUENTE: ARCHIVOS DE LA EMPRESA

Verificar las siguientes medidas : x  50.875 ; x g  50.02 ; x h  46.387 ; Me = 51.5 ;


Md = 52.92 ; q1 = 44.5 ; q3 = 57.0; P10 = 37.85 ; P90 = 62.5 ; S2 = 84.2344 ; S = 9.178 ;
CV = 0.1804 ; As = - 0.204 ; K = 0.254.

EJEMPLO: Sea X: gastos semanales ($), de un conjunto de estudiantes de una Facultad


CUADRO Nº 07... GASTOS SEMANALES ($.) DE ESTUDIANTES DE UNA
FACULTAD.
ni
[ $ ) Xi ni Ni Xini X i2 ni [Link] [Link] Zi Zini Z i2 ni
Xi
15 a 20 17.5 9 9 157.5 1.2430 11.1873 –3 – 27 81 0.5143
20 a 25 22.5 14 23 315.0 1.3822 18.9305 –2 – 28 56 0.6222
25 a 30 27.5 18
30 a 35 32.5 11
35 a 40 37.5 7
40 a 45 42.5 4
45 a 50 47.5 1 64 47.5 1.6767 1.6767 3 3 9 0.0211
M = 7 ; C =5 n = 64 1805.0 91.8650 –55 187 2.4314
FUENTE: ARCHIVOS DE LA FACULTAD
ESTADISTICA DESCRIPTIVA.- UNP. 29

Verificar los siguientes resultados: x  28.203 ; x g  27.251 ; x h  26.321; Me = 27.5;

Md = 26.82 ; q1 = 22.5 ; q3 = 33.18 ; P10 = ; P90 = ; S2 = 54.5837 ; S = 7.388 ;

CV = 0.262 ; As = + 0.285 ; K = 0.26

1.7. PRESENTACIÓN DE DATOS. (Variable categórica). Puede hacerse


mediante cuadros y gráficas.

1.7.1. FORMACIÓN DE UN CUADRO. Si X1; X2;...Xn, son valores de una variable


categórica (no numéricos), el procedimiento es el siguiente:

a) Definir los atributos o cualidades : A1 ; A2 ; ...; Ak

a) Determinar las frecuencias absolutas : n1 ; n2 ; ...; nk o frecuencias relativas :

h 1 ; h2 ; ...; hk : Así :
i Atributos Frecuencias
Absolutas Relativas
1 A1 n1 h1
2 A2 n2 h2

k Ak nk hk
 ni = n 1.00

EJEMPLO: Encuesta a 50 personas acerca dela política económica del país


Sea Xi : X1 ; X2 ; X3 ; . . . .; X50 Equivalente a lo valores categóricos :

MM MM MM MM MM MM MM MM M M M M M M M M M
M R R R R R R R R R R R R R R R R
R R R R B B B B B B B MB MB MB MB MB

Donde: MM (muy malo); M (malo); R (regular); B (bueno). Ordenando en un cuadro :


Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 30

CUADRO Nº 08. OPINIÓN ACERCA DE LA POLÍTICA ECONÓMICA

i Atributos Frecuencias
Absolutas: ni Relativas: %
1 MM 8 16
2 M 10 20
3 R 20 40
4 B 7 14
5 MB 5 10
 ni = 50 100
FUENTE. DATOS DE ENCUESTA

1.7.2. GRÁFICAS: Barras ; sectores circulares (torta); otros.

a) Barras o bastones. Intervalos o atributos Vs frecuencias relativas simples En el primer


cuadrante de un sistema de coordenadas cartesianas, las barras, verticales, es una sucesión de
rectángulos cuyas bases (eje de las abscisas) representan a los valores de la variable en
términos categóricos y cuyas alturas son las frecuencias simples. También las barras pueden
ser horizontales. EJEMPLO:
Diagrama de barras sobre la opinión de la política económica
20
Nº de personas : (ni)

16

12

0
MM M R B MB

Fuente: Datos del CUADRO Nº 08


b) Sectores circulares Es una gráfica que representa una sucesión de sectores circulares
correspondientes a los valores de las frecuencias simples. La unidad de medida puede ser el
grado sexagesimal o el porcentaje. EJEMPLO:
Diagrama de sectores sobre la política económica
10.00%
16.00%
Ley enda :
MM
14.00% M
R
B
20.00% MB

40.00%
ESTADISTICA DESCRIPTIVA.- UNP. 31

Fuente: Datos del CUADRO Nº 08


1.7.3. MEDIDAS ESTADÍSTICAS. Si X1; X2; .... ; Xn, son valores no numéricos
(atributos) de una variable categórica, podemos calcular la proporción de valores correspondientes
a un atributo en particular. Así:
[Link] .del .atributo  X i
p=  . La proporción es un caso particular de la
Tamañ[Link] n
media aritmética donde la variable categórica asume valores de ceros y unos. Son unos si
corresponde al atributo en estudio y ceros en los demás casos o atributos.

EJEMPLO: Rendimiento académico de siete alumnos:


Alumnos : Luis; Pedro; Manuel; Luis; María ; Inés; Carlos; Juan y Teresa, con
rendimientos académicos respectivos: B ; B ; M ; M ; R ; R ; R. , R ; M ; donde B (
bueno ) ; M ( malo) ; R ( regular). Luego la proporción de alumnos, digamos con el
atributo de bueno, es:
2
p =  0.222  2.22%
9
1.8. PROPIEDADES PRINCIPALES DE LAS MEDIDAS
ESTADISTICAS. Variable cuantitativa.

1.8.1. Si X1 ; X2 ; X3 ; .... ; Xn son valores de una muestra, además:

a) Si Xi = K, constante. Entonces:
x  xh  xg  M e  Md  qi  K ; Rx = S2 = S = CV = 0; As y K (curtosis), no están
definidas.

b).Si Yi = K Xi , donde K = constante. Entonces.


y  K x;.... y g  K x g ;... y h  K x h ; Mdy = KMdx ; Mey = KMex ; q0 = Kqx
Ry = KRx ; Sy = KSx ; CVy = CVx ; Asy = Asx ; Ky = Kx

c).Si Yi = a + bX, donde a y b son constantes. Entonces:


y  a  b x ; Mdy = a + b. Mdx ; Mey = a + b. Mex ; Py = a + bPx ; Ry = a + [Link]
b.S x
S y2  b2 .S x2 ; Sy = [Link] ; CVy  ; Asy = Asx ; Ky = Kx ;
a  b.x
d).Si los valores Xi son tales : x  M e  Md ; As = 0 ; K = 0.25 o también :
x  S : comprende al 68.28 % ; x  2.S, comprende al 95.45 % ; x  2.S, comprende
al 97.75 % , entonces los datos Xi se distribuyen como una Normal.

1.8.2. Si una muestra de tamaño ―n‖ se divide en K sub muestras o grupos:


Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 32

1 2 ….... k

x1 ; S12 ; n1 x 2 ; S 22 ; n2 x k ; S k2 ; nk
……

 n .x i i

Media aritmética global : X golobal  1


k
2
; Varianza global : S global = Ver ANVA.(*)
n 1
i

EJEMPLO. La empresa ―X‖ tiene 100 empleados con un sueldo promedio mensual por
empleado de S/.1500. La empresa ―Y‖ tiene 200 empleados con un sueldo promedio
mensual de S/. 1400.
a) ¿ Cuál es el sueldo promedio mensual de los trabajadores de la dos empresas ?
b) Si a las dos empresas se agrega una tercera empresa ―Z‖ con 50 empleados y un sueldo
promedio mensual por empleado de S/. 1600 . ¿ Cuál es el sueldo promedio de los
trabajadores de las tres empresas?
SOLUCION
a) nx = 100 ; x  1500 ; ny = 200 ; y  1400 ;
x.n  [Link] x 1500 x100  1400 x200
Promedio de x+y =   1433.33
nx  n y 100  200

b) nx+y = 300 xx  y  1433.33 ; nz = 50 ; z  1600

300 x1433.33  50 x1600


Promedio : X x  y  z   1457.14
300  50
1.9. PRACTICAS CALIFICADAS
1.9.1. SIMULACRO DE PRUEBA Nº 01.
01. Formule ejemplos diferentes a los vistos en clase y relacionados con su especialidad:
a).Universo; b) Población (variable cuantitativa) ;c) Población (variable categórica) ; d)
Muestra ; e) Llene los espacios :
Unidad de análisis Variable 10 datos u observaciones experimentales
1............................. Categórica ....................................................................
2............................. Cuantitativa .....................................................................

02. Se sabe que los salarios en dólares semanales ( enteros ) de los 60 trabajadores de una
empresa oscila entre 95 a 78. Según Sturges definir los intervalos semicerrados [......) del
rango total.

03...Los datos siguientes representan los tiempos de procesamiento de un pagador ( en


minutos) para un de clientes que arriban a la ventanilla de un banco:
ESTADISTICA DESCRIPTIVA.- UNP. 33

2.5 1.2 2.0 1.5 2.3 3.8 2.8 1.1 1.7 3.3 1.3 0.8 0.9 4.8 1.0 6.1
1.4 5.0 1.4 1.0 1.7 1.2 2.0 1.3.
Ordenar los datos en un cuadro de distribución de frecuencias con 6 intervalos.

04. Los siguientes datos representan gastos $/semana de un conjunto de estudiantes de una
Facultad:
32 30 33 32 36 36 41 43 28 32 31 45 41 39 39 45 30 38
36 41 32 35 34 35 38 43 36 35 32 38 40 42 30 23 31 29
31 35 37 38 33 30 22 40 37 27 26 37 28 33
Según el método de Sturges ordene los datos en un cuadro de frecuencias :
[ $/semana ) Vs Ni

05. Los siguientes datos representan: Xi : Notas en un curso de Estadística de 56 alumnos de


una Facultad :
i [ Xi : Notas ) hi %
1 - 5 10.7
2 5 a 8 17..9
3 8 a 11 32.1
4 11 a 14 21.4
5 14 a 17 12..5
6 17 a más 5.4
a) Determinar : puntos medios o marcas de clase ; frecuencias : Hi % : ↑ ; ↓
b) Interpretar los valores :
Notas : 8 a 14 ; 5 a 17 ; X < 14 ; X ≥ 8 ; X3 ; X5 ; h3 ; n5 ; H4 ≤ ; H2 ≥
c) Graficar: Histograma; polígono; ojiva: Describa cada gráfica en un máximo de 2 líneas.
06. Los siguientes datos representan tiempos en minutos en atender a un conjunto de vehículos
que llegan a una estación de servicio:
7 6 7 10 8 8 8 7 6 6 7 7 5 8 8 9 7 9 10 7 7 7 9 8
8 6 15 6 9 6 . Presentar los datos a través de:
a) Un cuadro de distribución de frecuencias con puntos aislados; b)Una gráfica adecuada;
c) Interprete sus resultados
07. Presente gráficamente, utilizando sectores circulares y barras, la distribución de total de
gasto por su consumo telefónico (último mes) según: cargos; consumo fijo; larga distancia;
celulares; IGV ; otros.

SOLUCIONARIO DEL SIMULACRO DE PRUEBA Nº 01:

02. R = 95 – 78 + 1 = 18 ; m = 6.8 = 7 ; C = 2.6 = 3 ; R* = 7x3 = 21 ;


Exceso = R* ─ R = 3 ; Límite Inf. 76.5 = 77 ; Límite Sup. 96.5 = 97.

[ $/semana ) 77---80 80—83 83—86 86—89 89---92 92---95 95 ---98


ni

03.
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 34

R = 6.1 – 0.8 = 15.3 ; m = 5.6 = 6 ; C = 0.88 = 0.9; R* = 6x0.9 = 5.4 ;


Exceso = R* ─ R = 0.1 ; Límite Inf. : 0.75 = 0.8 ; Límite Sup. : 6.15 = 6.2

[ Minutos ) 0.8---1.7 1.7—2.6 2.6—3..5 3..5—4.4 4.4---5..3 5.3---6.2 Total


ni 12 6 1 2 2 1 24

04. R = 45 – 22 +1 = 124 ; m = 6.6 = 7 ; C = 3.4 = 4 ; R* = 7x4 = 28 ;


Exceso = R* ─ R = 4 ; Límite Inf. = 20 ; Límite Sup. = 47

[ $/semana ) 20---24 24—28 28—32 32—36 36- -40 40---44 44--48 Total
ni 2 2 10 13 13 8 2 50
Ni 2 4 14 27 40 48 50

05.
i [ Xi : Notas ) Xi hi % ni Ni Hi %
1 - 5 3..5 10.7 6 10.7 100.0
2 5 a 8 6.5 17.9 10 28.6 89.3
3 8 a 11 9..5 32.1 18 60.7 71.4
4 11 a 14 12..5 21.4 12 82.1 39.3
5 14 a 17 15..5 12..5 7 94.6 17.9
6 17 a más 18.5 5.4 3 100.0 5.4

a) y b) se encuentran indicados en el cuadro


c).Notas : 8 a 14 equivale al 53.5 % ; 5 a 17 equivale al 83.9 % ; menores que 14
equivale el 82.1 % ; mayores o iguales a 8 equivale el 71.4 % ; X3 = 9.5 ;
X5 = 15.5 ; h3 = 32.1 ; n5 = 7 ; H4 ≤ equivale el 82.1 % ; H2 ≥ equivale el 89.3 %

06.
Minutos 5 6 7 8 9 10 > 10 Total
Vehículos 1 6 9 7 4 2 1 30

1.9.2. SIMULACRO DE PRUEBA Nº 02.


01. Se sabe que los gastos en dólares mensuales (1 decimal) de 500 alumnos de un centro
educativo oscila entre 72.3 dólares a 40.2 dólares. Según el método de Sturges definir los
intervalos semicerrados: [ ) del rango total. ( 2 pts.)

02. Los siguientes datos representan salarios de trabajadores de una empresa en dólares por
mes: ($):
94 89 96 77 80 112 87 107 98 86 80 89 73 86 116 100 79 104 97 88 67 105
105 92 96 91 87 87 107 66 79 103 87 77 87 77 69 97 78 86 74 90 83 98 95
86 93 82 93 94 65 68 73 75 85 91 95 93 90 97 98 105 107 110 115
ESTADISTICA DESCRIPTIVA.- UNP. 35

Según el método de Sturges presentar los datos en un cuadro de frecuencias:


[ $/mes) Vs Ni ( 3 ptos.)

03. Los siguientes datos representan el consumo de energía eléctrica Kwh por un conjunto de
familias de una urbanización: ( m = 10 ; C = 5 ; n = 100 )

[ Kwh ) <5 5 a 10 10 a 15 15 a 20 20 a 25 25 a 30 30 a 35 35 a 40 40 a 45 45 a +

Familias 2 5 8 12 24 18 13 10 7 1

a) Interpretar los resultados:

a.1) X5 ; n7 ; h9 ; N4 ; H3 ≤ ; H4 : ≥ (3 pts.)
a.2) 15 ≤ X < 20 ; 10 ≤ X < 30 ; X < 35 ; X ≥ 15 : (2 pts.)

b).Graficar: Histograma de frecuencias; polígono de frecuencias y ojivas. En cada caso


descríbalo su significado para 3 valores importantes:

04. Una empresa encuestadora de mercados pregunta a un conjunto de personas acerca de la


preferencia de un cierto candidato para las próximas elecciones. Los candidatos son: A, B ,
C , D , E. La pregunta fue: ¿ Si las elecciones fueran mañana por quien votaría Ud. ? . Los
resultados fueron:

E D A E A B A B A D A B A C A C A B A C A C A B A B
A B A B A B A B A C A C A D A B E B A A B D A E
a) Presentar los datos en un cuadro de frecuencias h i % : ( 2 pts.)
b) Graficar los datos del cuadro anterior a través de :
b.1) Sectores circulares ( círculo de radio = 5 cm.) ; b.2) Barras verticales : ( 2 pts.)

SOLUCIONARIO DEL SIMULACRO DE PRUEBA Nº 02:


01. R = 72.3 – 40.2 = 32.1 ; m = 9.9 = 10 ; C = 3.21 = 3.3 ; R* = 10x3.3 = 33 ;
Exceso = R* ─ R = 0.9 ; Límite Inf. 39.75 = 39.8 ; Límite Sup. 72.75 = 72.8

02. R = 116–65 + 1 = 52 ; m = 6.9 = 7 ; C = 7.4 = 8 ; R* = 56 ;


Exceso = R* ─ R = 4 ; Límite Inf. = 63 ; Límite Sup. = 118
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 36

01. 02.
[ $/mes ) [ $/mes ) ni Ni
39.8 a 43.1 63 a 71 5 5
43.1 a 46.4 71 a 79 8 13
46.4 a 49.7 79 a 87 11 24
49.7 a 53.0 87 a 95 18 42
53.0 a 56.3 95 a 103 11 53
56.3 a 59.6 103 a 111 9 62
59.6 a 62.9 111 a 119 3 65
62.9 a 66.2
66.2 a 69.5
69.5 a 72.8
m = 10 ; C = 3.3 ; n = 500 m = 7 ; C = 8 ; n = 65

03.
I [ Kwh ) Xi ni hi % Ni Hi %
1 - 5 2..5 2 2 2 2 100
2 5 a 10 7..5 5 5 7 7 98
3 10 a 15 12..5 8 18 15 15 93
4 15 a 20 17..5 12 12 27 27 85
5 20 a 25 22..5 24 24 51 51 73
6 25 a 30 27..5 18 18 69 69 49
7 30 a 35 32.5 13 13 82 82 31
8 35 a 40 37.5 10 10 92 92 18
9 40 a 45 42.5 7 7 99 99 8
10 45 a más 47.5 1 1 100 100 1
m = 10 ; C = 5 ; n = 100

a) X5 = 22.5 ; h9 = 7 %. ; n7 = 13 ; H3 ≤ 15 % ; N4 = 27 ; 15 ≤ X < 20 equivale al 12 % ;


10 ≤ X < 20 equivale al 62 % ; X< 35 equivale al 82 % ; X ≥ 15 equivale al 85 % ;
H4 ≥ 85 % ó 31 %

04.
Atributos A B C D E Total
ni 23 13 6 4 4 50
% 46 26 12 8 8 100
Gº 165.6 93.6 43.2 28.8 28.8 360

1.9.3. PRACTICA CALIFICADA Nº 03


01. Los siguientes datos representan gastos diarios en nuevos soles por diferentes conceptos
de un grupo de familias en una localidad:
26.3 28.8 27.8 26.5 28.3 30.0 28.9 27.7 278 28.5 26.1 28.1 24.7 29.3 25.7
29.1 25.3 27.8 27.0 26.2 25.7 24.5 24.9 28.7 29.2 29.2 24.0 28.6 29.2 26.6
25.1 28.8 29.1 26.8 28.8 25.9 25.9 24.8 25.8 30.3 27.9 25.7 27.5 27.2 30.0
25.9 28.9 30.1 24.5 26.9
Ordene los datos en un cuadro de distribución de frecuencias (intervalos Vs. Ni ) con 8
ESTADISTICA DESCRIPTIVA.- UNP. 37

intervalos y calcule e interprete las medidas : x ; Me ; Md ; P10 ; P75; P90 ; S ; As ; K

02. Los siguientes datos representan ―puntajes: X ‖ en un concurso de un conjunto de


trabajadores para ocupar vacantes en una empresa:

Puntajes : X % de trabajadores
Menos de 45 5.00
45 a 50 8.75
50 a 55 12.50
55 a 60 16.25
60 a 65 25.00
65 a 70 18.75
70 a 75 7.50
75 a 80 3.75
80 a + 2.50
100.00

2.1. Describir concretamente las gráficas:


a) Histograma y polígono de frecuencias (en una sola gráfica) :
b).Sectores circulares (torta): A ; B ; C ; D y E , donde :
A: X < 50 puntos ; B : 50 < X < 60 puntos ; C : 60 < X < 65 puntos;
D: 65 < X 70 puntos ; E : X > 70 puntos .
c) Ojiva : X > 55 puntos ; X < 65 puntos ; 65 < X < 75 puntos:

2.2. Calcular y describir las medidas estadísticas:


x ; Me; Md; P10 ; P75; P90 ; S ; As ; K :
2.3.. Describir el % de trabajadores cuyos puntajes oscilan dentro del intervalo : x  S :

2.4. Describir el puntaje mínimo del: 75 % de trabajadores; 50 % ( use percentiles)


03. Los siguientes datos representan:
a) Ganancias obtenidas por una empresa de construcción en cuatro proyectos:
3 % ; 2 % ; 4 % ; 6 % . Hallar y describir la ganancia promedio más adecuada:
b)Número de hijos en un conjunto de diez familias: 3 ; 5 ; 8 ; 6 ; 1 ; 7 ; 5 ; 6 ; 8 ; 2 .
Calcular y describir el promedio y el coeficiente de variación
c) Velocidades : v1 = 50 Km/h de la ciudad ―A‖ a la ciudad ―B‖; v2 = 40 Km/h, de la ciudad
―B‖ a la ciudad ―A‖. Si las distancias entre ambas ciudades es 200 Km. ¿ Cuál es la velocidad
promedio ?
Solucionario :
Respuestas : 2.1.c) 73 % ; 67 % ; 50 % ; 2.2 : x = 60.875 ; Me = 61.5 ; Md = 61.91 ;
P10 = 47.85 ; P75 = 67 ; P90 = 72.5 ; S = 9.18 ; As = - 0.204 ; K= 0.254;
2.3 : 51.7 a 70 comprende al 68. 25 % ; 2.4 : q1 = 54.5 ; q2 = 61.5 = Me
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 38

1.10. EJERCICIOS PROPUESTOS


1. Si la media aritmética de 37 números consecutivos es 60. Calcular la media aritmética de
los 13 siguientes Números consecutivos. R: 85

2 .Si la edad promedio del 25% de un grupo de personas es de 40 años ¿cuál es la edad
del resto, Si la edad promedio de todos es de 30 años? R: 262/3

3. Las medias aritméticas de las inversas de 3 números calculados tomando de dos en dos
son 4, 5 y 6. Hallar la media aritmética de los 3 números originales. R: 0,22

4. Hallar la media aritmética de: 1,1,1,...,1; 2, 2,2,...2,2; 3, 3,3,...,3;.....; 9, 9,9,...,9. Dar como
respuesta la suma de cifras de la media aritmética. ( En cada caso hay 10 dígitos iguales )
R: 5n
5. En un salón de clase de 20 alumnos la nota promedio en matemáticas es 14; en el mismo
curso la nota promedio para otra aula de 30 alumnos es de 11¿Cuál será la nota promedio si
se juntan a los 50 alumnos? R: 12,2

6. La edad promedio de 3 hombres es 54 años y ninguno de ellos es mayor de 56 años ¿cuál


es la mínima edad que puede tener uno de ellos? R:50

7. En la huerta, donde hay 80 animales entre conejos y pavos, se observa que el promedio de
las patas es 2,75. Si al cabo de una semana se han venido vendiendo cierto número de
pavos y han nacido ese mismo número de conejos, se tiene que el promedio ahora es 3,5.
Determinar cuántos animales nacieron ? R:30

8. Un artículo publicado presenta datos sobre el octanaje de varias mezclas de gasolinas :


88,5 94,7 84,3 90,1 89,0 89,8 91,6 90,3 90,0 87,7 91,1 86,7 93,4, 96,1 89,6
90,4 91,6 90,7 83,4 91,0 88,2 88,5 93,3 87,4 91,1 90,5, 86,7 94,2 90,8 90,1
91,8 88,4 92,6 93,7 87,5 87,8 88,3 89,2 92,3, 88,9 89,8 92,3 91,5 89,9 98,8
88,3 90,4 91,2 90,6 92,2 88,6 88,3, 94,2 85,3 90,1 89,3 91,1 92,2 100,3 87,6
92,7 87,9 93,0 94,4 90,4, 91,2 96,5 84,3 93,2 88,6 88,7 92,7 89,3 91,0 93,3
86,7 91,0 90,9, 89,9 91,8 89,7 92,2
a) Ordene los datos anteriores en un cuadro de distribución de frecuencias :
A,1) Para m = 8; a,2) Según el método de Sturges.
b) Determine todas las frecuencias: hi, Ni, Hi. Describa las más importantes
c) Determinar las medidas: X ; S ; CV ; Me ; Md ; cuantiles ; K ; As . Descríbalos en un
párrafo no mayor de 5 líneas.
d) Calcule los indicadores o medidas estadísticas al 80% de los datos (elimine 10% en ambos
extremos) y luego compare los obtenidos en el ítem anterior.
e) Describa la población de la cual se seleccionó la muestra de 82 datos.
f) Forme cuadros de distribución de frecuencias utilizando el método de la raíz cuadrada.
g) En cada cuadro o tabla de frecuencias describa los valores: n5 ; h4 ; N3 ; H2 (  y  )
ESTADISTICA DESCRIPTIVA.- UNP. 39

Elabore gráficos: Histogramas; polígonos ; ojivas; sectores circulares; barras; luego


describa un párrafo breve interpretando sus resultados
h) A partir de ojivas anteriores (%) determine y describa : Los valores máximos (mínimos)
de la variable al 50% ; al 75% ; al 95% de los datos
i) Determine e interprete las medidas de :
Tendencia central y cuantiles más importantes; variación y de deformación.

9. En una empresa se hace un estudio sobre el número de horas que el personal deja de laborar
durante la semana. Los resultados son: 10 hs, 3 obreros ; 3 hs, 7 obreros ; 9 hs, 1 obrero ; 4
hs, 2 obreros ; 8 hs, 5 obreros ; 5 hs, 8 obreros ; 6 hs, 6 obreros. Se pide identificar : a) La
población ; b) La variable y tipo ; c) El número de valores de la variable ; d) Los valores de :
X 3 , n 2 , H 6 , h4
10. En una gran empresa, los jornales de los obreros tienen una media de $225/mes y una
desviación estándar de $50. Como solución a un conflicto laboral se proponen dos
alternativas: a) Un aumento del 20% en los salarios ; b) Un aumento del 15% en los
salarios, más una bonificación mensual de $25 a cada obrero. ¿ Cuál de las dos
alternativas le conviene aceptar al sindicato si se quiere que la distribución de los salarios
sea lo mejor posible?

[Link] conjunto de 20 valores tienen una media aritmética igual a 50, otro conjunto de 20
valores tienen una media igual a 30, la desviación estándar de los 40 valores considerados
conjuntamente es igual a 10. Calcular valor de CV del conjunto de 40 valores.

12. Sean los datos: salarios en dólares/mes de un conjunto de trabajadores de una empresa:
548, 532, 535, 528, 553, 557, 558, 542, 540, 563, 552, 568, 535, 545,
547, 519, 556, 545, 564, 550, 538, 536, 549, 546, 565, 573, 576, 561,
550, 540, 538, 542, 544, 525, 544, 526, 547, 535, 554, 546
Ordenar los datos en un cuadro de distribución de frecuencias, con: a) Límite inferior =
518 y C = 5 ; b) Método de Sturges.

13. En una distribución de frecuencias de 6 intervalos de amplitud constante se sabe que:


n = 150 ; n3 = n5 = n1 + 5 ; n3 = n4 = 30 ; n1 = n6 ; x5 = 50 ; x  41 . Determinar
el CV. Correspondiente.
14. Los siguientes datos representan costos S./mes de dos conjuntos de estudiantes en las
facultades de Ciencias y Letras:
Gasto S/. : 80 a 100 100 a 120 120 a 140 140 a 160 160 a 180 180 a 200 200 a+
Ciencias: % 8 14 18 26 18 10 6
Letras: ni 5 18 15 12 10 8 2
a).Grafique: Histograma; polígono de frecuencias hi % ; ojiva Hi % ; sectores.
b).Determine: X ;h ; M e ; M d ; S ; CV ; q1; q3 ; P10; P90; As ; K ; q3 – q1. Interprete los resultados.
c).Se desea clasificar los alumnos en 3 categorías según el gasto ocasionado en cada Facultad
donde el 20% de los que menos gastan como categoría ―C‖ ; el 10% de los que mas
gastan como categoría ―A‖ y el resto de alumnos como categoría normal ―B ‖ ¿Cuáles
son los gastos límites de cada clasificación?
Dr. SEGUNDO PLÁCIDO CASTAÑEDA VIGO 40

a).Estimar el número de alumnos (proporción o %) que caerá:


Debajo de X  S; X  2S; arriba de : X  S; X  2S ; entre : X  S; X  2S ;
arriba de la mediana ( use ojiva ).
b).Describa el universo y población que origina los datos de las muestras .
15. Determine la población y las principales medidas estadísticas en cada una de las siguientes
muestras pequeñas:
a. Capacidad instalada de 4 máquinas (%) : 84,5 ; 84,5 ; 50,0 ; 45,0.

b. Notas en Arte : 05 ; 02; 08; 20 ; 15: Notas en Física : 10; 10 ; 06 ; 10 ; 08


c. Donaciones en millones de $ : 5 ; 2 ; 5 ; 8 ; 6.

d. Número de créditos desaprobados por alumno: 10; 2 ; 4 ; 14 ;12; 15 ; 12.

16. Genere un mínimo de 80 datos (reales o hipotéticos) según su especialidad correspondientes


a dos muestras de variable categórica (cuantitativa), luego preséntelos en cuadros y gráficas;
haciendo la descripción correspondiente

17. Presente los datos gráficamente. Utilice diagramas de barras; sectores circulares y gráficas
lineales. En cada caso determine y describa las medidas estadísticas más importantes :

17.1 Número de hijos que poseen:


2 3 5 4 2 0 6 3 4 2 3 5 7 6 1 0 9 5 4 3 2 1 6 5
3 7 3 2 1 5 4 6 7 5 4 3 2 12 11 2 4 5 6 9 0 2 8 6
5 4 2 3 4 5 7 6 5 4 3 2 2 1 5 4 7 5 4 3 2 4 5 6
10 3 2 5 6 4 3 7 5 1 6 5 4 2 3 3 4 2

17.2. Opinión de 28 personas acerca de la aceptación de un nuevo producto que se lanza al


mercado:
M NC NC NC NC B B B M M M R NC NC R B R B R R NC
M B R R NC NC NC . Donde M: malo; R: regular; B: bueno; NC: no contesta
17.3
(1) (2) (3) (4)
Procedencia % Preferencia Total Años Ventas Años Accidentes
Piura 56 Administración 300 1999 500 1994 21
Talara 10 Contabilidad 400 2000 519 1995 34
Sullana 23 Ingenierías 180 2001 519 1996 26
Sechura 9 Educación 250 2002 534 1997 42
Otros 2 Economía 100 2003 544 1998 37
Otras carreras 120 1999 37
2000 44
2001 45
2002 40
2003 30
ESTADISTICA DESCRIPTIVA.- UNP. 41

Donde:
(1): Procedencia de alumnos; (2) : Preferencia de postulantes a una universidad ; (3) :
Ventas de una Cía ( en miles de $ ). ; (4): accidentes de tránsito por consumo de alcohol.

1.11. BIBLIOGRAFÍA BASICA:


01. Calzada Benza, José. Estadística General con énfasis en muestreo. . Pgs. 45-56; 61-70
02. Jonson, Richard. Probabilidad y Estadística para ingenieros de Miller y Freund. 5ta.
Edición. Prentice-Hall. Hispano Americana S.A. México 1997. Pgs. 8-16 ; 22-28
03. Lun Chou, Ya. Análisis Estadístico. Segunda Edición. Pgs. 17-18; 44-68
04.. Merril William, Fox Karl. Introducción a la estadística económica. Amorrortu
Editores. Argentina. Pgs. 20-26 ; 28-42.
05. Mode, Elmer B. Elementos de probabilidad y Estadística. Edit. Reverté, S.A. México.
Pgs. 75-87 ; 97-99
06. Montgomery Douglas; Ranger George. Probabilidad y Estadística aplicada a la
ingeniería. Mc Grauhill. México. 1996. Pgs. 8-13 ; 16-29.
07. Walpole, Myres. Probabilidad y Estadística para ingenieros. Sexta edición. Prentice
may México. Pgs. 4-8
08. Wonnacott Thomas. Introducción a la Estadística. Edit. Limusa. México. Pgs. 32-41
.

También podría gustarte