P. 1
Aspectos Basicos de La Estadistica[1]

Aspectos Basicos de La Estadistica[1]

|Views: 20|Likes:
Publicado porLuis Espinoza Bravo

More info:

Published by: Luis Espinoza Bravo on May 02, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

12/17/2013

pdf

text

original

ASPECTOS BÁSICOS DE LA ESTADÍSTICA

– 1 –
ASPECTOS BÁSICOS DE LA ESTADÍSTICA
DEFINICIÓN
La estadística es parte del método científico y se
le "define" como un conjunto de técnicas usadas
para recolectar, organizar, presentar, analizar e
interpretar datos, con el fin de obtener conclusiones
y tomar decisiones sobre determinados hechos o
fenómenos en estudio.
TÉRMINOS EN LA ESTADÍSTICA
Población
Conjunto de personas, elementos o unidades que
presentan características comunes y observables,
a ser analizados o estudiados de la cual se desea
información.
Ejemplo: Todos los estudiantes matriculados en la
I.E. José Pardo y Barreda 2012
Muestra
Es un subconjunto de elementos seleccionados
convenientemente de la población, de tal manera
que pueda hacerse "deducciones" de ella respecto a
la población completa.
Ejemplo: Los estudiantes matriculados en la I.E.
José Pardo y Barreda en el 6to. grado de primaria.
CLASIFICACIÓN DE LA ESTADÍSTICA
La estadística se clasifica de acuerdo a la función
que realiza en una población o muestra.
Estadística descriptiva
Es aquella cuya finalidad es solamente la de
describir en forma general un conjunto de datos de
una población, para posteriormente interpretarlos
y sacar conclusiones válidas para dicha población.
Estadística inferencial
Llamada también inductiva o de pronóstico, cuyo
objetivo es inferir o deducir leyes de comportamiento
de una población, a partir del estudio de una
muestra, para posteriormente poder proyectarlos o
generalizarlos a la población.
Ejemplo: Cuatro estudiantes del 6to. grado de la
sede de Comas han obtenido las siguientes notas:
11; 18; 12 y 15 mientras 5 estudiantes del 6to. grado
de la sede de Colonial han obtenido como notas:
11 ; 13 ; 17 ; 11 y 13 llegándose a las siguientes
conclusiones:
a. La nota promedio de los estudiantes del 6to.
grado de la sede de Colonial es mayor que los
del 6to. grado de la sede de Comas.
b. La diferencia de la notas promedio es 1.
c. La diferencia de las notas promedio es
demasiada pequeña para llegar a la conclusión
de que los estudiantes de 6to. grado de la sede
de Colonial son mejores que los de 6to. grado de
la sede de Comas.
De las conclusiones, cuales corresponden a la
estadística descriptiva y cuales a la estadística
inferencial.
vARIABLES
Se define como variables: la que tiende a sufrir
modificaciones o cambio dentro de un dominio
determinado (escala, recorrido o intervalo)
generalmente. Las variables se designan con las
últimas letras mayúsculas X, Y, Z y los valores de
las variables con letras minúsculas x
1
, x
2
, x
3
, ...
Ejemplo: En la UNI se lleva a cabo un estudio para
determinar la situación ocupacional de 3 egresados
en la carrera de Arquitectura.
VARIABLE
Literal Simbólica
Valores de la variable
(Dominio de la variación)
Ingresos
mensuales
X
x
1
= S/.800
x
2
= S/. 750
x
3
= S/. 900
Años de
experiencias
Y
y
1
= 5 años
y
2
= 4 años
y
3
= 7 años
Nivel
jerárquico
Z
z
1
= jefe de personal
z
2
= director general
z
3
= jefe de operaciones
Ayacucho - Perú
ASPECTOS BÁSICO DE LA ESTADÍSTICA
– 2 –
Clasifcación de variables
A. Cualitativas
Son aquellas que están asociadas a una
característica cualitativa, cuyos valores son
cualidades, propiedades o atributos que
presentan la población y que son objeto de
clasifcación.
Variable Dominio de la Variación
Profesión
- Profesor
- Ingeniero
- Doctor, etc.





B. Ordinales
Son aquellas cuyo dominio de variación son
objeto de clasifcación y orden.
Variable Dominio de la Variación

Nivel socioeconómico
- Alto
- Medio
- Bajo





C. Cuantitativas
Son aquellas cuyos valores del dominio de
variación son contados y medidos y se subdivide
en:
Discreta. Cuando los valores del dominio
de variación son contados y por lo tanto sólo
pueden asumir valores enteros.
Variable Dominio de la Variación
Número de estudiantes
- 28 estudiantes
- 73 estudiantes



Continua. Cuando los valores del dominio de
variación con susceptibles de ser medidos. Por
lo tanto pueden asumir valores decimales.
Variable Dominio de la Variación
Peso
- 63,5 kg
- 56,8 kg
- 70 kg





Medición de las variables
Las variables no sólo se clasifican, sino que
también es necesario medirlas. La medición se hace
necesaria con el fin de diferenciar por comparación,
un elemento de otro. Esto se hace a través de niveles
o escalas, entre las cuales tenemos:
A. Escala nominal. Es el nivel más simple de
medición donde la variable establece categorías
sin orden. En este nivel, las categorías sólo se
nombran o se enumeran, pero no se comparan.
Variable Dominio de la Variación
Nivel educativo
- Primaria
- Secundaria
- Superior





B. Escala de intervalos. Cuando entre los
diversos valores que asume la variable, existe
una clasifcación, orden y grado de distancia
iguales entre las diferentes categorías.
Rendimiento académico. Un estudiante obtiene
15 en Lógico Matemático, pero esto no signifca
que para llegar a esta nota haya tenido que
obtener primero nota cero.
ETAPAS DE LA INvESTIgACIÓN ESTADÍSTICA
Los métodos estadísticos son un conjunto de
procedimientos que se aplican en una secuencia
lógica con el fin de recopilar, organizar, presentar,
analizar e interpretar datos de fenómenos sujetos
a variaciones. En este proceso se distinguen las
siguientes etapas:
Recopilación de datos
Entre los más frecuentes se tiene:
Registros. Cuando se anotan los datos en forma
regular permanente y obligatoria.
- Registro electoral
- Registro de contribuyentes
Encuestas. La recolección datos es en forma
temporal y pueden ser:
- Censal. Abarca a toda la población.
Censo de población y vivienda.
Censo económico
- Muestra. Cuando abarca una parte de la
población.
Organización de datos
Después de la recolección de datos se procede a su
organización, clasificación y tabulación de modo
que se facilite su presentación en tablas, cuadros o
gráficos. La clasificación tiene por objeto organizar
los datos en categorías, pero teniendo en cuenta la
escala de medición de las variables.
Datos medios a nivel nominal. Para elaborar
los datos, es necesario conocer como se clasifca la
variable y luego se procede a la tabulación.
Ejemplo: Se encuesta a 50 personas de una empresa
respecto a su nivel educativo y estado civil.
ASPECTOS BÁSICOS DE LA ESTADÍSTICA
– 3 –
Grado de
instrucción
Frecuencia
o cantidad
Estado
Civil
Frecuencia
o cantidad
Analfabeto
Primaria
Secundaria
Superior
3
5
35
7
Soltero
Casado
Viudo
Divorciado
28
10
3
9
Datos medios a nivel de intervalos. La
elaboración de datos cuyas variables pertenecen a
la escala de intervalo tienen otro tipo de trabajo,
ya que su organización y posterior análisis, es
necesario agruparlos en clase o intervalos. Esta
forma de organización se conoce con el nombre
de: Distribución de frecuencias. A continuación
se presenta las notas de 40 estudiantes de la
institución (elegidos al azar) luego del examen
parcial: (Número de datos: n=40).
13 21 9 25 12 35 7 22 5 18
24 12 21 9 23 8 16 17 23 11
7 27 15 17 14 26 12 19 10 29
20 12 19 10 20 12 23 8 22 7
Al observar los datos se puede apreciar su
variabilidad y también el desorden en que se
encuentran, lo cual hace difícil destacar los hechos
más importantes para obtener conclusiones
acertadas que ayuden en la toma de decisiones.
Es por ello que se hace necesario ordenar los datos
en una tabla de distribución de frecuencias. Para
elaborar esta tabla, debemos seguir los siguientes
pasos:
a. Rango o recorrido (R). Se defne como la
diferencia entre los datos de mayor y menor
valor. En el ejemplo: dato mayor : 35 y dato
menor : 5
Luego R = 35 – 5 = 30
b. Número de clases (K). Es el número de
categorías o intervalo en el que se va a dividir
la información. Este número se puede fjar
arbitrariamente dependiendo de los datos que
se tengan y por lo general varía entre 5 a 20.
Sin embargo, existe otra forma para determinar
el número de clases con bastante aproximación,
la cual se conoce con el nombre de Regla de
Sturges y cuyo cálculo se realiza mediante la
siguiente fórmula:
K = 1 + 3,3logn
Donde: n : número de datos
Para el ejemplo: K = 1 + 3,3log(40) ≅ 6,28
El valor de K puede ser 5, 6 ó 7.
c. Intervalos de clase (I
i
). Es una clasifcación
de los datos en subgrupos.
Para el ejemplo: [15 ; 20> es un posible intervalo
de clase, donde se considera a los estudiantes
con notas desde 15 hasta menos de 20. Esto es:
15 ; 16 ; 17 ; 18 ; 19
Denominándose a 15 : límite inferior
20 : límite superior
d. Amplitud o ancho de clase (w
i
). Es la
diferencia entre el límite superior e inferior de
cada intervalo.
Ejemplo: Para el intervalo: [15 ; 20> su ancho
de clase es w=20 – 15 = 5.
Si deseamos un ancho de clase común, se
determina de la siguiente manera:
w = =
rango
número de clases
R
K
Para el ejemplo: R = 20 y K = 5 ; 6 ó 7

w = =
30
5
6
ó
w = =
30
6
5
Formando los intervalos
i I
i
i I
i
1
2
3
4
5
[5 ; 11>
[11 ; 17>
[17 ; 23>
[23 ; 29>
[29 ; 35>
1
2
3
4
5
6
[5 ; 10>
[10 ; 15>
[15 ; 20>
[20 ; 25>
[25 ; 30>
[30 ; 35>
e. Marca de clase (x
i
). Es el punto medio de
cada intervalo de clase.

x
i
=
límite inferior + límite superior
2
Ejemplo: de [11 ; 17> ;
x
2
11 17
2
14 =
+
=
f. Frecuencia absoluta simple (f
i
). Es el
número de datos contenidos en un determinado
intervalo de clase, la suma de las frecuencias
absolutas debe corresponder al número de
datos (n).
ASPECTOS BÁSICO DE LA ESTADÍSTICA
– 4 –
i I
i
Tabulación
o conteno
f
i
1 [5 ; 11>

10 Donde:
2 [11 ; 17>

9 Σf
i
= n
3 [17 ; 23>

11
   
g. Frecuencia absoluta acumulada (F
i
). Es
la acumulación ordenada de cada una de las
frecuencias absolutas simples.
i I
i
f
i
I
i
1
2
3
[5 ; 11>
[11 ; 17>
[17 ; 23>
10
9
11
10
19
30
h. Frecuencia relativa simple (h
i
). Es el
cociente de cada frecuencia absoluta entre el
número total de datos (h). La sumatoria de
todas las frecuencias relativas es igual a 1.
h
i
=

1

h
f
i
i
n
=
además 0 ≤ h
i
≤ 1
De [9 ; 11> ; f
1
= 10 Luego h
1
= =
10
40
0 25 ,
De [11 ; 17> ; f
2
= 9 Luego h
2
= =
9
40
0 0225 ,
De [17 ; 23> ; f
3
= 11 Luego h
3
= =
11
40
0 275 ,
i. Frecuencia relativa acumulada (H
i
). Es la
acumulación de frecuencias relativa. Se obtiene
de forma análoga a la frecuencia absoluta
acumulada.
i I
i
x
i
f
i
F
i
h
i
H
i
1
2
3

[5 ; 11>
[11 ; 17>
[17 ; 23>

8
14
20

10
19
30

10
19
30

0,250
0,225
0,275

0,250
0,475
0,750

Observación. Por lo general a las frecuencias
relativas la expresamos como un tanto por
ciento.
Presentación de los datos
Luego de haber recoleccionado y organizado los
datos, ahora se hace necesario presentarlos en
forma comprensible y clara, dejándolos listos para
su posterior análisis e interprevtación.
La presentación se hace principalmente a través de
tablas o cuadros estadísticos y gráficos.
a. Tablas o cuadros estadísticos. Se ordenan
los datos en flas y columnas para facilitar su
análisis. Del ejemplo anterior, la tabla sería:
Clases I
i
x
i
f
i
F
i
h
i
% H
i
%
1
2
3
4
5
[5 ; 11>
[11 ; 17>
[17 ; 23>
[23 ; 29>
[29 ; 35>
8
14
20
26
32
10
9
11
7
3
10
19
30
37
40
0,250
0,225
0,275
0,175
0,075
25
22,5
27,5
17,5
7,5
0,250
0,475
0,750
0,925
1
25
47,5
75
92,5
100
∑=40 ∑=1 100
b. Gráfcos o diagramas. Constituye un
elemento del análisis descriptivo y en su
presentación pueden ir acompañados de la tabla
o cuadro que le dio origen, ya que esta presenta
detalles que no aparecen en el gráfco.
Siendo las principales:
Histograma. Son diagramas de barras o
rectángulos cuyas bases representan los
intervalos de clases y las alturas, las frecuencias
absolutas o relativas.
Diagrama escalonado. Son diagramas
similares al histograma con la diferencia de
que las alturas son frecuencias absolutas o
relativas, pero acumuladas.
+0,225
+0,275
+9
+11
ASPECTOS BÁSICOS DE LA ESTADÍSTICA
– 5 –
Gráfco circular. Se usa para representar
y comparar la dimensión de los pares de
un fenómeno con el fenómeno total. Para
su elaboración se utiliza la circunferencia,
siendo necesario que los valores absolutos y/o
porcentuales sean expresados en grados.
Del ejemplo anterior.
I
I
I
1
2
3
= → ° =
× °
= °
= → ° =
× °
= °
=
25
25 360
100
90
22 5
22 5 360
100
81
27
1
2
x
x ,
,
,55
27 5 360
100
99
3
→ ° =
× °
= ° x
,
MEDIDAS DE POSICIÓN
Una medida de posición es un valor que se
calcula para un grupo de datos que se utiliza para
describirlos de alguna manera. Generalmente se
desea que el valor sea representativo de todos los
valores incluidos en el grupo y, por ello, se desea
alguna clase de promedio, que se entiende como
una media de tendencia central.
Media aritmética (x)
Para n datos no clasificados:
x
d
n
i
i
n
=
=

1

Donde : d
i
: dato i
Para datos clasificados:
x h x
f x
n
i i
i i
i
n
i
n
= =
=
=


( )
1
1
Donde:
h
i
: frecuencia relativa de la clase i
f
i
: frecuencia absoluta de la clase i
x
i
: marca de clase de la clase i
n: número total de datos
Mediana (x
m
) :
Para n datos no clasificados; ordenados en forma
creciente (x
(1)
; x
(2)
; x
(3)
; ... x
(n)
)
x
x n
x x
n
m
n
n
·
-
¦
'
¦
¦
'
¦
¦
- ¸
¸

¸
,
(
¸
¸

¸
,
(
-
¸
¸

¸
,
(
1
2
2
1
2
;
;
impar
par
n
2
Para datos clasificados:
Se define la clase mediana como la primera cuya
frecuencia absoluta acumulada iguala o excede
a la mitad del total de datos luego el valor de la
mediana se da por:
x L W
n
F
f
m m m
m
m
= +












2
1
Donde:
L
m
: límite inferior de la clase mediana.
W
m
: ancho de clase de la clase mediana.
n : número total de datos.
F
m-1
: frecuencia absoluta acumulada de la clase
que precede a la clase mediana.
f
m
: frecuencia absoluta de la clase mediana.
Moda (M
0
)
Es el valor que se presenta con mayor frecuencia
en un grupo de datos. A una distribución que tiene
una sola moda se le denomina unimodal. Si hubiese
dos o más modas será polimodal.
Para datos clasificados con intervalos de igual ancho
de clase se tiene que la clase modal es aquella que
tiene la mayor cantidad de datos. Luego el valor de
la moda se da por:
M L W
d
d d
0 0 0
1
1 2
= =
+






Donde:
L
0
: límite inferior de la clase modal.
W
0
: ancho de la clase modal.
d
1
: diferencia entre la frecuencia de la clase modal
y la frencuencia de la clase precedente.
d
2
: diferencia entre la frecuencia de la clase modal
y la frencuencia de la clase siguiente.
ASPECTOS BÁSICO DE LA ESTADÍSTICA
– 6 –
1. La distribución de las edades de 100 personas
está dado por:
Intervalo
de clase
f
i
F
i
h
i
H
i
[15 – 18> 5
[18 – 21> 0,42
[21 – 24> 0,65
[24 – 27>
[27 – 30> 0,15
Halla la media aritmética de dichas edades.
2. Del siguiente gráfco, ¿cuántos alumnos
obtuvieron notas desde 48 hasta 140?
3. Se tiene cuatro cantidades cuya moda es 3, su
mediana es 5 y su media aritmética es 6. Calcula
el producto de las 2 cantidades mayores.
4. En una empresa en la que laboran personas
mayores de edad y hasta los 60 años, se hizo
una distribución de frecuencias de acuerdo a sus
edades, resultando una distribución simétrica
de 7 intervalos de clase, además:
- el 41% son menores de 36 años de edad.
- el 60% tiene entre 29 y 54 años de edad.
- el 26% son mayores de 47 años.
Si en total son 600 trabajadores. Cuántos de
ellos son mayores de 27 años pero menores de
46 años.
5. En el siguiente diagrama de pastel, se muestra
la proporción de gastos de una familia.
a: comida b: educación
c: servicios d: entretenimiento
si 2a = 50%b = 40%c = 20%d
¿Qué tanto por ciento se gastó en internet
si representa el 12.5% de los gastos en
entretenimiento.
6. Se tiene el siguiente histograma de frecuencias
relativas.
¿Cuántas observaciones estima que hay en el
intervalo ,
2 2
b c d e + +  
 
 
si la población es de
1000?
7. La tabla adjunta contiene datos sobre número
de profesores de secundaria de distintos colegios
de una provincia. El trabajo quedó inconcluso,
por lo que se pide completar y averiguar cuántos
colegios tienen menos de 22 profesores.
PROBLEMAS
ASPECTOS BÁSICOS DE LA ESTADÍSTICA
– 7 –
Clases x
i
f
i
4
8
20
10
2
Sabiendo también que los anchos de clase son
iguales, se observó 40 colegios y su x = 19,80.
8. En la siguiente tabla de distribución de
frecuencias se desea mostrar en intervalos, las
edades de los trabajadores de una empresa.
Completar la tabla e indicar qué porcentaje de
trabajadores tiene 50 años o más.
Intervalo
de clase
I
i
Marca
de clase
x
i
Frecuenc.
absoluta
f
i
Frecuencia
acumulada
F
i
Frecuencia
relativa
h
i
Frecuencia
relativa
acumulada
H
i
[10; > 0,05
[20; > 25
[ ; > 35 24 0,40
[ ; 50> 51
[ ; > 55
Total
Si se sabe que : f
3
– f
2
= 9
9. Una compañía tiene 100 trabajadores entre
nombrados, contratados y practicantes. Para
los nombrados el suelo máximo es de S/. 7000
y el mínimo es S/. 2000 mensuales. El 4% son
practicantes que reciben propinas de S/. 800 y
el 26% de los trabajadores son contratados que
perciben haberes mayores o igual que S/. 800 pero
menos que S/. 2000; 20 trabajadores nombrados
perciben haberes menores que S/. 3500 y el 80%
del total de trabajadores tiene haberes inferiores
a S/. 5000. Calcula:
i. ¿Qué porcentaje de trabajadores ganan
desde S/. 3500 hasta S/. 7000?
ii. ¿Qué cantidad de trabajadores ganan
sueldos menores de 3500?
10. Del siguiente pictograma, muestra las
preferencias de 5 productos A, B, C, D y E.
Si fueron encuestados 600 personas, ¿cuántos
preferen los productos A o B?
11. Se tomó una muestra entre los estudiantes
brechtianos para conocer el promedio de
horas dedicadas al estudio (sin contar horas
de clases), considerándose signifcativa una
variación de tres horas por intervalo. En base
a las siguientes conclusiones:
i. Todos estudian por lo menos 21 horas a la
semana y a lo más 42 horas.
ii. La distribución de frecuencias es simétrica.
iii. Cinco de cada 12 estudian más de 33 horas
por semana.
iv. 70 estudian menos de 33 horas por
semana.
v. Solo 10 estudiantes estudian menos de 24
horas por semana.
¿Cuántos estudian entre 24 y 33 horas por
semana?
12. Dado
calcular a + b + x
Nota: Considerar ancho de clase común.
ASPECTOS BÁSICO DE LA ESTADÍSTICA
– 8 –
14.
I
i
x
i
f
i
F
i
h
i
[ , > 4
[12 ; > 0,3
[ ; 24> 32
[ , ] 0,2
Si el ancho de clase es constante, calcular
R+f
2
+n + x
m
+ M
0
Donde R es el rango y n es el número de datos.
15. En un encuesta sobre los ingresos anuales de
un grupo de familias, se obtuvo la siguiente
información.
[I
i
, L
s
> x
i
f
i
20 – 40 10
40 – 60
60 – 80
80 – 100 10
Calcular el número de familiar con un ingreso
entre 45 y 75.
Además
x f
n
f
f
i i
i
= =
=

28
5
3
2
3
1
4
16. De la siguiente tabla, con ancho de clase común,
referente a la nota obtenida por un grupo de
alumnos, calcule la media de las notas.
I
i
X
i
f
i
F
i
h
i
[ ;  0,08
[4;  16
[ ;  0,36
[ ; ] 14 16
17. Dada la tabla de distribución de frecuencias
con ancho de clase común.
I
i
X
i
f
i
F
i
[ ;  9 3b
[ ;  a
[ ;  19 4a + 2b
[ ;  30b
[ ; ] 5b
además
f f
f f
1 3
2 4
7
8
+
+
=
, calcule la moda.
18. En la siguiente tabla de distribución de
frecuencias de ancho de clase común, calcule la
mediana.
I
i
f
i
h
i
H
i
[ ; 30 
[ ;  0,10 0,35
[ ;  3a
[ ; 60 4a 0,70
[ ; ]
19. En una encuesta sobre los sueldos de 200
personas se obtiene una tabla de distribución
simétrica con igual ancho y con un sueldo
mínimo de S/. 300. Además, se sabe que h
1
=
15%; h
2
= 20 %; x = 500; H
5
= 1. ¿Cuántos tienen
un sueldo menor a S/. 550?
Lic. Fernando Inga Mendizábal
fernandoinga@hotmail.com
rpc: 989-300228

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->