Está en la página 1de 23

qwertyuiopasdfghjklzxcvbnmqw

..
..
..
..
ertyuiopasdfghjklzxcvbnmqwert
.
yuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopa
sdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghj
klzxcvbnmqwertyuiopasdfghjklz
xcvbnmqwertyuiopasdfghjklzxcv
bnmqwertyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwer
tyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopa
sdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghj
klzxcvbnmqwertyuiopasdfghjklz
xcvbnmrtyuiopasdfghjklzxcvbnm
qwertyuiopasdfghjklzxcvbnmqw
ertyuiopasdfghjklzxcvbnmqwert
yuiopasdfghjklzxcvbnmqwertyui
APUNTES

PROBABILIDAD Y ESTADSTICA
ESIME ZACANTENCO

Francisco Muoz Apreza.

..
..
..
..
.

BIENVENIDA

El Sistema de Enseanza Aprendizaje de Alto


Rendimiento Acadmico SEAARA te da la bienvenida a
una forma de aprender
los elementos terico
prcticos de la probabilidad y la estadstica, con la
confianza de que en cada una de sus lneas podrs
encontrar una forma comprensible de entender y
asimilar los desarrollos lgicos operativos que
fundamentan sus postulados

..
..
..
..
.
Introduccin

Todas las disciplinas del saber humano que sistematizan su actuar est
influenciado por el azar, siendo como lo es la vida misma azarosa el
estudio y comprensin del pensamiento probabilstico es fundamental
para poder predecir con mayor certeza las consecuencias de los
diferentes actuares en la vida.
En este sentido desde que el humano encontr que en los juegos de azar
exista una relacin de los casos favorables entre los casos posibles, se
dio a la tarea de construir toda una teora que le permitiera predecir.
A partir de este momento el desarrollo de las teoras probabilsticas y de
las tcnicas estadsticas para asirse del comportamiento de las variables
empez a contar con mltiples tablas de frecuencia y con ello comprendi
la importancia de la informacin que arrojaba la media y la desviacin
estndar y la varianza.
As crece y se desarrollan las distribuciones probabilsticas ya sean de
variables aleatoria discretas y las variables aleatorias continuas.
Surgen entonces con fuerza acadmica
importante los estudios
empricos que dan origen a los muestreos paramtricos y no
paramtricos.
Ya partir de ellos, una vez que se comprendi la esencia misma de la
empria surgen La distribucin de probabilidad binomial, Poisson,
normal, exponencial y toda una constelacin con que podemos analizar
todos los comportamientos azarosos de la vida en todas sus
manifestaciones.
He aqu , un material que conjuga la teora con la practica esperando que
con ella se podr comprender mejor lo que es y para que sirve la
Estadstica y la probabilidad.

..
..
..
..
.

Objetivo general
El alumno resolver problemas terico prcticos que involucren
fenmenos probabilsticos.

Objetivos particulares

El alumno resolver ejercicios que involucren fenmenos probabilsticos.


El alumno ser capaz de realizar una investigacin de campo de
fenmenos empricos y extraer de sus resultados conclusiones con alto
grado de confiabilidad.
El alumno aplicar loa mtodos y tcnicas estadsticas para analizar
problemas reales.
El alumno utilizar los elementos que se desprendan de la investigacin
de campo para elaborar sus tablas de frecuencia, calcular las medidas de
tendencia central y de desviacin..
El alumno emplear las resultados de la investigacin de capo para
modelarlos en las diferentes distribuciones de probabilidad existentes.
El alumno ser eficiente para predecir los posibles comportamientos de
las variables que contenga la investigacin de campo.

..
..
..
.. DESCRIPTIVA Y MUESTREO
ESTADSTICA
.

ndice
1.1.-

Caractersticas del muestreo


a) Terminologa del muestreo ( estadsticos, parmetros )
b) Smbolos estadsticos
c) Error estndar
d) error muestral
E) Mtodo de seleccin de la muestra
f) Muestreo simple
g) Muestreo doble
h) Muestreo mltiple
i) Muestreo aleatorio simple, y sistemtico, estratificado y por
conglomerados.
1.1.1.- Levantamiento de la encuesta
1.1.2.- Uso del SPSS 17 para la elaboracin de las tablas de frecuencia

1. 2.-

11
11
11
11
11
11
11
12
12
14

Representacin grfica de las Tablas de Frecuencias


1. 3.1 Grfica de polgonos de frecuencia
1. 3.2 Grfica de pastel
1. 3.3 Grfica de cilindros
1. 3.4 Grfica de conos
1.3.5.- Ejercicios

1. 4.-

9
10
10

Tabla de Frecuencia
1.2.1 Definicin de tabla de frecuencia
1. 2.2 Frecuencias Acumuladas
1. 2.3 Frecuencias Relativas
1.2.4 .Escala ordinal
1. 2.5.- Escala nominal
1.2.5 Determinacin del tamao de la muestra
1.2.6.- Determinacin del nmero de intervalos
1.2.7.- Definicin de lmite superior e inferior
1.2.8.- Ejemplos
1. 2.9 Ejercicios

1. 3.-

7
7
7
7
8
8
8
9
9

15
16
16
17
17

Medidas de Tendencia Central


1. 4.1 Teora Elemental
1. 4.2 Moda
1. 4.3 Media
1. 4.4 Mediana
1. 4.5 Caractersticas de la media, moda y ,mediana
1.4.6.- Madia geomtrica
1.4.7.- Histograma

19
19
19
19
20
21
21

..
..
..
.. 1.4.8.- Cuartiles
. 1. 4.9 .- Porcentiles
1. 4.10.- Varianza
1.4.11.- Desviacin estndar
1.4.12.- Coeficiente de variacin
1.4.13.- Clculo de datos agrupados

2.-

21
21
21
22
22
22

Probabilidad clsica
2.1.. Teora de conjuntos
2.1.1.- Un poco de historia
2.1.2.- Nociones de conjuntos
2.1.3.- Igualdad de conjuntos
2.1.4.- Unin
2.1.5.- Interseccin
2.1.6.- Complemento
2.1.7.- Diferencia
2.1.8.- Conjunto vaco
2.1.9.- Conjunto universal
2.1.10- Ejemplos
2.1.11.- Producto cartesiano
2.1.12.- Conjunto potencia
2.1.13.- Ejemplos
2.1.14.- Simbologa

I.- .- Estadstica descriptiva


6

24
24
25
25
26
26
27
27
28
28
29
30
30
33

..
..
..
..
.

Introduccin
Esta Modulo I est diseado para que el alumno comprenda los fundamentos y
aplicaciones de la Estadstica descriptiva. Se abordarn los temas en dos
vertientes; la primera a partir de los fundamentos tericos y aplicaciones y la
segunda mediante un Muestreo por encuestas.

1.- Caractersticas del muestreo

Al tomar una cantidad de elementos de una poblacin para poder contar con
criterios de decisin, estamos tomando una muestra de ella.
Del tamao de la poblacin (N) se pueden extraer varias muestras. Un cierto
estadstico puede ser calculado para cada una de las muestras posibles
extradas de la poblacin. Una distribucin del estadstico obtenida de esta
manera es llamada la distribucin del estadstico.
En estadstica un muestreo es la tcnica para la seleccin de una muestra a
partir de una poblacin.
a).- Terminologa para el muestreo
Los trminos usados en inferencia estadstica son:
Estadstico: medida usada para describir alguna caracterstica de una muestra
(media aritmtica, mediana. desviacin estndar)
Parmetro: representacin del estadstico.

b).- Los smbolos usados para representar los estadsticos y los parmetros;

Medida

Smbolo para el
estadstico

Smbolo para el parmetro

Media

Desviacin estndar

Nmero de

..
..
..
..
.
elementos
Proporcin

Al elegir una muestra buscamos encontrar sus propiedades las que al ser
extrapolables a la poblacin nos permitan obtener resultados similares a los
que se obtendran de realizase un estudio de toda la poblacin.
En el muestreo el tamao de la muestra es ms pequeo que el tamao de la
poblacin por lo que se puede extraer dos o ms muestras de sta.. Al
conjunto de muestras que se pueden obtener de la poblacin se denomina
espacio muestral. La variable que asocia a cada muestra su probabilidad de
extraccin, sigue la llamada distribucin muestral
c).- Error Estndar: La desviacin estndar de una distribucin, en el
muestreo de un estadstico, es el error estndar del estadstico.
De esta forma, la desviacin estndar de las medias de todas la muestras
posibles del mismo tamao, extradas de una poblacin, es llamada el error
estndar de la media.
d).- Error muestral o error de muestreo: La diferencia entre el resultado
obtenido de una muestra y el resultado que deberamos de obtener de la
poblacin se llama el error muestral o error de muestreo. Un error de muestreo
ocurre cuando no se lleva a cabo la encuesta completa de la poblacin, sino
que se toma una muestra de ella para estimar sus caractersticas.
El error muestral es medido por el error estadstico, en trminos de
probabilidad, bajo la curva normal. El resultado de la media indica la precisin
de la estimacin de la poblacin basada en el estudio de la muestra. Mientras
ms pequeo sea el error muestral, mayor es la precisin de la estimacin.
e).- Mtodos de seleccin de muestras.
Una muestra debe ser representativa si va a ser usada para estimar las
caractersticas de la poblacin. Los mtodos para seleccionar una muestra
representativa son numerosos, dependiendo del tiempo, dinero y habilidad
disponibles para tomar una muestra y la naturaleza de los elementos
individuales de la poblacin.

Los mtodos de seleccin de muestras pueden ser clasificados de acuerdo a:


1. El nmero de muestras tomadas de una poblacin dada para un estudio
y
2. La manera usada en seleccionar los elementos incluidos en la muestra.
Los mtodos de muestreo basados en los dos tipos de clasificaciones
son expuestos en seguida.

..
..
..
.
Mtodos de.. muestreo clasificados
tomadas de una poblacin.

de acuerdo con el nmero de muestras

Bajo esta clasificacin, hay tres tipos comunes de mtodos de muestreo.


Estos son:
f).- Muestreo simple: Este tipo de muestreo toma solamente una muestra de
una poblacin dada para el propsito de inferencia estadstica. Puesto que
solamente una muestra es tomada, el tamao de muestra debe ser lo
suficientemente grandes para extraer una conclusin. Una muestra grande
muchas veces cuesta demasiado dinero y tiempo.
g).-Muestreo doble: Bajo este tipo de muestreo, cuando el resultado del
estudio de la primera muestra no es decisivo, una segunda muestra es extrada
de la misma poblacin. Las dos muestras son combinadas para analizar los
resultados. Este mtodo permite a una persona principiar con una muestra
relativamente pequea para ahorrar costos y tiempo. Si la primera muestra
arroja una resultado definitivo, la segunda muestra puede no necesitarse.
h).- Muestreo mltiple: El procedimiento bajo este mtodo es similar al
expuesto en el muestreo doble, excepto que el nmero de muestras sucesivas
requerido para llegar a una decisin es ms de dos muestras.
i).-Muestreo Aleatorio: Una muestra se dice que es extrada al azar cuando la
manera de seleccin es tal, que cada elemento de la poblacin tiene igual
oportunidad de ser seleccionado. Una muestra aleatoria es tambin llamada
una muestra probabilstica son generalmente preferidas por los estadsticos
porque la seleccin de las muestras es objetiva y el error muestral puede ser
medido en trminos de probabilidad bajo la curva normal. Los tipos comunes
de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemtico,
muestreo estratificado y muestreo de conglomerados.
A. Muestreo aleatorio simple. Una muestra aleatoria simple es seleccionada
de tal manera que cada muestra posible del mismo tamao tiene igual
probabilidad de ser seleccionada de la poblacin. Para obtener una muestra
aleatoria simple, cada elemento en la poblacin tenga la misma probabilidad de
ser seleccionado, el plan de muestreo puede no conducir a una muestra
aleatoria simple. Por conveniencia, este mtodo pude ser reemplazado por una
tabla de nmeros aleatorios. Cuando una poblacin es infinita, es obvio que la
tarea de numerar cada elemento de la poblacin es infinita, es obvio que la
tarea de numerar cada elemento de la poblacin es imposible. Por lo tanto,
ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos
ms comunes de muestreo aleatorio modificado son sistemtico, estratificado y
de conglomerados.
B. Muestreo sistemtico. Una muestra sistemtica es obtenida cuando los
elementos son seleccionados en una manera ordenada. La manera de la
seleccin depende del nmero de elementos incluidos en la poblacin y el

..
..
..
.
tamao de ..la muestra. El nmero de elementos en la poblacin es, primero,
dividido por el nmero deseado en la muestra. El cociente indicar si cada
dcimo, cada onceavo, o cada centsimo elemento en la poblacin va a ser
seleccionado.
El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una
muestra sistemtica puede dar la misma precisin de estimacin acerca de la
poblacin, que una muestra aleatoria simple cuando los elementos en la
poblacin estn ordenados al azar.
C. Muestreo Estratificado. Para obtener una muestra aleatoria estratificada,
primero se divide la poblacin en grupos, llamados estratos, que son ms
homogneos que la poblacin como un todo. Los elementos de la muestra son
entonces seleccionados al azar o por un mtodo sistemtico de cada estrato.
Las estimaciones de la poblacin, basadas en la muestra estratificada,
usualmente tienen mayor precisin (o menor error muestral) que si la poblacin
entera muestreada mediante muestreo aleatorio simple. El nmero de
elementos seleccionado de cada estrato puede ser proporcional o no
proporcional al tamao del estrato en relacin con la poblacin.
D. Muestreo de conglomerados. Para obtener una muestra de
conglomerados, primero dividir la poblacin en grupos que son convenientes
para el muestreo. En seguida, seleccionar una porcin de los grupos al azar o
por un mtodo sistemtico. Finalmente, tomar todos los elementos o parte de
ellos al azar o por un mtodo sistemtico de los grupos seleccionados para
obtener una muestra. Bajo este mtodo, aunque no todos los grupos son
muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por
lo tanto la muestra es aleatoria.
Una muestra de conglomerados, usualmente produce un mayor error muestral
(por lo tanto, da menor precisin de las estimaciones acerca de la poblacin)
que una muestra aleatoria simple del mismo tamao. Los elementos
individuales dentro de cada "conglomerado" tienden usualmente a ser iguales.

1.1.1.- Levantamiento de la muestra


Una vez que se ha diseado la poblacin de estudio, el cuestionario y
caractersticas de ste, el tamao de la muestra y el tipo de muestreo a aplicar,
se procede al levantamiento de la muestra la cual deber de ser aleatoria.
1.1.2.- El uso del programa SPSS
Para sistematizar la informacin recabada durante el levantamiento del
muestreo existen programas que simplifican los clculos de las medidas de
tendencia central y de desviacin as como la elaboracin de las tablas de
frecuencia que preceden a la elaboracin de las funciones de distribucin de
probabilidad ya sean de variables aleatorias discretas o continuas, de una
variable o multivariables.

10

..
..
..
..
.

1.2.- Tablas de frecuencia


1.2.1.- Definicin de tabla de Frecuencia:
Una tabla de frecuencia es el conjunto de datos organizados con base en la
informacin contenida en una muestra.

1.2.2.- Definicin de frecuencia relativa:


La frecuencia Relativa fi/n : es una frecuencia particular entre el nmero total
de observaciones.

1.2.3.- Definicin de escala ordinal.


Una escala Ordinal: es aquella escala representada por valores numricos
Ejemplo:
{1, 2. 3.....}; < 1, 5, >,.
1.2.4.- Definicin de escala nominal
Una escala Nomina: es aquella escala representada por valores no numricos
Ejemplo
< masculino, femenino >.
1.2.5.- Determinacin del tamao del intervalo:
La fijacin de este tamao depender de las necesidades del investigador,
puede ser todos del mismo tamao o de tamaos desiguales.

1.2.6.- Determinacin del nmero de intervalos de clase:

11

..
..
..
.. el nmero de intervalos de clase disminuye,
A medida que
.

la informacin es
menos precisa pero su tratamiento analtico es mayor. El nmero de intervalos
se sugiere que sea entre 5 y 15 dependiendo de las necesidades de
investigador.
1.2.7- Definicin Lmite superior e inferior: son los existentes en un intervalo de
clase
< lmite inferior, lmite superior >.

1.2.8.- Ejemplos
Para elaborar este tipo de tabla se van sumando las frecuencias de cada una
de los intervalos de clase. Su utilidad consiste en que podemos conocer el
comportamiento del proceso estadstico de los intervalos de clase con respecto
a la primera variable..
En los intervalos de clase, por ejemplo < 13 a 15 > Edad en que entr a
trabajar el 13 representa el lmite inferior y el 15 el lmite superior.
En este cuadro el investigador organiz su informacin en 7 intervalos de clase
sacrificando precisin en la informacin pero gan claridad analtica en ella.
Cuadro 1
Edad a que entr a Trabajar el
trabajador
Edad
Frecuencia
9 12
72
13 - 15
153
16 17
190
18 20
313
21 25
45
26 en adelante
9
No contest
30
Total
812

Al analizar los datos vemos que estn agrupados por intervalos de clase
ordinal, de conformidad con la necesidad que el investigador tiene de conocer
parmetros que le permitan inferir acerca del trabajo infantil < 9 a 12 >, de la
pubertad (13 a 15 ), de la adolescencia (18 a 20 ) y la juventud <21 a 25 >
teniendo un intervalo mixto <26 en adelante> y uno nominal <no contest>.
Tabla de frecuencia acumulada

12

..
..
..
.. una tabla de frecuencia acumulada del cuadro 1 se van
Para elaborar
.
sumando las frecuencias de cada uno de los intervalos. Ah la utilidad para el
investigador consiste en que puede conocer en cada uno de los intervalos el
comportamiento total. Detecta en particular que 225 trabajadores se iniciaron
en el trabajo asalariado entre los 9 y 15 aos de edad.
Cuadro 2
Edad de inicio laboral del asalariado
Clase
9 12
9 - 15
9 17
9 20
9 25
9 26 en adelante
No contest
Total

Frecuencia Acumulada
72
225
415
728
773
782
782

Tablas de frecuencia relativa


La utilidad para el investigador de representar sus datos mediante una tabla de
frecuencias relativas, consiste en que sta da claridad sobre el comportamiento
de cada intervalo de clase respecto al total.
De tal forma si se desea conocer el peso que tiene en la rama del vidrio en los
trabajadores que iniciaron una actividad remunerada en la poca de la
adolescencia vemos que representa el 38.54 %.
Cuadro 3
Tamao de la muestra 812
Inicio en labores asalariadas
Clase
Frecuencia
9 12
8.8
13 15
18.84
16 17
23.39
18 20
38.54
21 25
5.54
26 en adelante
1.1
No contest
3.7
Total
100.00

13

..
..
..
..
.
1.2.9.- Ejercicios
1.- Qu utilidad tendra utilizar la frecuencia acumulada en los cuadros 4,5 y 6
2.- Qu utilidad tendra utilizar la frecuencia relativa en los cuadros 4,5,y 6 ?.
3.- Qu ventajas tiene el utilizar frecuencias de amplitud total en los cuadros
4,5 y 6 ?
4.- Tiene sentido la frecuencia de amplitud total en los cuadros 4,5 y 6?

Cuadro

4
Tamao de la muestra 812
Edad
Edad
Frecuencia
0 17
12
18 20
60
21 25
143
26 30
171
31 - 35
148
36 40
137
41 45
61
46 - 50
52
51 - 55
21
55 o ms
5
No contest
2
Total
812

Cuadro 5
Tamao de la Muestra 812
Sexo
Frecuencia
Masculino
712
Femenino
67
No Contest
33
Total
812

14

..
..
..
..
.
Cuadro 6
Tamao de la Muestra 812
Estado Civil
Frecuencia
Soltero
206
Casado
544
Viudo
13
Divorciado
15
Unin Libre
28
No Contest
6
Total
812

1.3.- Representacin grfica de las tablas de frecuencia


El visualizar el comportamiento de los datos de las tablas de frecuencia
mediante diagramas de barras, grficas de lneas, diagramas circulares,
polgonos de frecuencia rinden beneficios analticos al investigador
1.3.1.- Grfica de polgonos de frecuencia

15

..
..
..
..
.

1.3.2.- Grfica de pastel

1.3.3.- Grfica de cilindro

16

..
..
..
.. de
1.3.4.- Grfica
.

conos

El utilizar una u otra representacin visual va a ser importante en la medida que


describa a la informacin con mayor claridad y facilite la interpretacin.
Se debe tener cuidado con la escala con las cuales elaboren las grficas; si se
usa una escala errnea el grfico arrojar una falsa idea en su
comportamiento.
1.3.5.- Ejercicios
1.- Elabore la grfica del cuadro 7 y 8.
2.- Qu tipo de escalas se utilizan en los cuadros 7 y 8?.
3.- Qu ventajas le ve usted en elaborar una tabla de frecuencias acumuladas
en los cuadros 7 y 8 ?.
4.- Qu anlisis se desprende de los grficos de los cuadros 7 y 8 ?.

17

..
..
..
.. 7
Cuadro
.

Salario Semanal
Clase
Frecuencia
Hasta $ 125
31
$126 $ 250
194
$251 $ 375
224
$376 $500
123
$510 ms
240
No contest
0
Total
812

Nota
La presentacin de los intervalos de clase en el salario semanal esta dada en
combinacin ordinal y nominal < hasta 125 >, < 501 ms >.
En el polgono de frecuencia podemos deducir que la mayor concentracin de
los trabajadores se localiza en los niveles salariales de 4 salarios mnimos
ms.
Adems de peso de los trabajadores que perciben hasta un salarios mnimo
prcticamente inexistente.

Cuadro 8
Antigedad
Aos
Frecuencia
0 1
143
2 5
290
6 10
183
11 15
86
16 20
56
21 25
35
26 29
12
300 ms
7
Total
812

18

..
..
..
.. de tendencia central
1.4.- Medidas
.
Las medidas de ubicacin proporcionan informacin sobre el lugar hacia donde
existe la tendencia central dentro de un grupo de nmeros. Las medidas de
ubicacin presentadas en esta unidad para datos no agrupados son la media,
la mediana, y la moda.
1.4.1.- Media: La media aritmtica, promedio o media, es calculada sumando
todos los nmeros de un conjunto de nmeros (xi) y despus dividindolos por
el nmero de observaciones (n) del conjunto.

= xi /n
La media es sensible a los valores extremos; es decir, los datos
extremadamente grandes o pequeos pueden causar que la media se ubique
ms cerca de uno de los datos extremos.
1.4.2.- Media Ponderada: en algunos casos, los datos de una muestra o
poblacin son ponderados de acuerdo a su importancia.
1.4.3.- Mediana: La mediana es el valor medio de una grupo ordenado de
observaciones. Si existe un nmero par de observaciones correspondientes al
grupo puede haber dos medianas
La mediana es normalmente utilizada para resumir los resultados de una
distribucin. Si la distribucin es sesgada , la mediana es un buen indicador de
medida para saber donde los datos observados se encuentran concentrados.
Generalmente, la mediana proporciona una mejor medida que la media cuando
las observaciones son extremadamente grandes o pequeas
La media tiene dos ventajas sobre la mediana. Es ms estable, y uno puede
calcular la media de dos o ms muestras.
1.4.4- Moda: La moda es el valor ms frecuente en un sistema de
observaciones.
Los datos pueden tener dos modas. En este caso, decimos que los datos son
bimodales, y los grupos de observaciones con ms de dos modos estn
referidos como multimodales.
Observe que la moda no es una medida til de ubicacin, porque puede haber
ms de una moda o quizs ninguna.

19

..
..
..
..
.
1.4.5.- Caractersticas de la Moda, Mediana y Media
Moda
Mediana
Media
Es el valor mas
frecuente en la
distribucin.

Es el valor del punto


medio de la seleccin

Es el valor de mayor
concentracin de la
muestra

Su valor es
establecido por la
frecuencia
predominante, no por
los valores en la
distribucin.

El valor de la media es
fijado por su posicin
en la seleccin, y no
refleja valores
individuales.

La suma de las
desviaciones en cualquier
lado de la media son
iguales.

Este es el valor ms
comn.

La distancia agregada
entre la mediana y
cualquier otro punto de Esta refleja la magnitud
la muestra es menor
de cada valor.
que en cualquier otro
punto.

Una distribucin
Cada seleccin tiene
puede tener ms de 2
solo una mediana.
modas.

Una muestra tiene solo


una media.

No puede ser
manipulada
algebraicamente.

Pueden ser manipuladas


algebraicamente.

No puede ser
manipulada
algebraicamente.

Es inestable, puede
Es estable , al agrupar
ser influenciada en el
los datos no se afecta
proceso de
su apreciacin.
agrupacin.

Es estable en cuanto a al
procedimiento para
agrupar ya que ste no
afecta la apreciacin.

La moda no refleja el No es aplicable para


grado de modalidad. datos cualitativos.

Podra ser calcula


igualmente cuando los
valores individuales son
desconocidos, si se
posee la suma de los
valores y el tamao de la
muestra.

No puede ser calculado


Puede ser calculada
Puede ser calculado
de una tabla de
cuando los extremos
cuando los valores
frecuencia cuando sus
de los valores de los
extremos son abiertos. valores extremos son
grupos son abiertos.
abiertos.

20

..
..
..
.. Geomtrica: La media geomtrica (G) de n valores no
1.4.6.- La Media
.
negativos es la ensima raz del producto de los n valores.
Si algunos valores son muy grandes en magnitud y otros muy pequeos, la
media geomtrica proporciona una mejor representacin de los datos que un
simple promedio.
1.4.7.-Histogramas: Analizando la Homogeneidad de la Poblacin
Un histograma es una representacin grfica de una estimacin para la
densidad (para variables aleatorias continuas) o la funcin de probabilidad total
(para variables aleatorias discretas) de la poblacin.
Las caractersticas geomtricas del histograma nos permiten descubrir
informacin til sobre los datos, por ejemplo:
1. La localizacin del centro de los datos.
2. El grado de dispersin.
3. La seccin a la cual se sesga, es decir, cuando no cae
simtricamente en ambos lados del pico.
4. El grado de agudeza del pico. Cmo se levanta y baja la
pendiente.
Las medidas de variacin ms comunes son: varianza, desviacin estndar,
y el coeficiente de variacin.
1.4.8.- Cuartiles: Cuando requerimos sean divididos en cuartos, Q1... Q4,
conocidos como cuartiles. El primer cuartl (Q1) es el valor donde estn 25% de
los valores mas pequeos y en el otro 75% los ms grandes. El segundo cuartl
(Q2) es el valor donde estn 50% de los valores mas pequeos y en el otro
50% los ms grandes. En el tercer cuartl (Q3) es el valor donde estn 75% de
los valores mas pequeos y en el otro 25% los ms grandes.
1.4.9.- Porcentajes: Los porcentajes tienen la ventaja que pueden ser
subdivididos en 100 porciones. Los porcentajes y los cuartiles son ms
convenientes de leer cuando son tomados de una funcin de distribucin
acumulativa.
1.4.10.- Varianza: Es una importante medida de variabilidad.
La varianza es el promedio de las desviaciones estndar elevadas al
cuadrado de cada una de las observaciones con respecto a la media.

Var(x) = (xi - ) 2 / (n - 1),

de donde n por lo menos es igual a 2.

La varianza es una medida de dispersin entre valores de los datos. Por lo


tanto, mientras ms grande sea la varianza, menor ser la calidad de los datos.

21

..
..
..
..
.
Desviacin Estndar:
Ambas, la varianza y la desviacin estndar proporcionan la misma
informacin; una siempre puede ser obtenida de la otra .
La desviacin estndar es la raz cuadrada de la varianza, esta siempre es
expresada en las mismas unidades que el conjunto de datos:

Desviacin estndar= = (Varianza)


1.4.12.- Coeficiente de Variacin: El coeficiente de variacin (CV) es la
desviacin relativa absoluta con respecto al tamao , siempre que sea cero,
expresado en porcentaje:

CV =100 |S/ | %
El CV es independiente de las unidades de medida. En la estimacin de un
parmetro, cuando su CV es menos del 10%, la estimacin se asume
aceptable. En el caso contrario, digamos, 1/CV se llama el Cociente de seal
de ruido.
El coeficiente de variacin se utiliza para representar la relacin de la
desviacin estndar hacia la media,.

1.4.13.- Clculo de Estadsticos Descriptivos para Datos Agrupados:


.
Los datos agrupados son derivados de informaciones ordinarias, y consisten en
frecuencias (clculo de valores ordinarios) tabulados con las clases en las
cuales ocurren.
Los lmites de las clases representan los valores ms pequeos (inferiores) y
ms grandes (superior) que la clase contendr.
Las frmulas para los estadsticos descriptivos son mucho ms simples para
los datos agrupados.

22

..
..
..
..
.

23