Está en la página 1de 73

Estadstica General 2011

1
Mg. Miguel Angel Macetas Hernndez


19 17
16
14
12
11
2 0
1 5
1 0
5
0

Estadstica General 2011

2
Mg. Miguel Angel Macetas Hernndez


I. TRATAMIENTO DE DATOS ESTADSTICOS UNIVARIABLES BIVARIABLES

1.1. Aspectos bsicos de la teora Estadstica. Conceptos preliminares

Aplicacin de los principios de la probabilidad y de la estadstica a problemas reales de la ingeniera. La
ms fcil y efectiva manera de aprender los principios de los modelos probabilsticos y la inferencia
estadstica es aplicando esos principios a una variedad de aplicaciones. Es por eso que la segunda
edicin de Conceptos de Probabilidad en Ingeniera explica conceptos y mtodos usando un amplio
rango de problemas relacionados con la ingeniera y las ciencias fsicas, particularmente, las ingenieras
civiles. Revisado extensivamente problemas ilustrativos que ayudar a desarrollar un profundo
entendimiento de la probabilidad y la estadstica y la habilidad para formular y resolver problemas de
ingeniera del mundo real.

Conceptos preliminares
La Estadstica Descriptivaproporciona un criterio para lograr mejoras, debido a que sus tcnicas
se pueden usar para describir y comprender la variabilidad. Por ejemplo, consideremos en una
caldera de vapor la presin del combustible alimentado y la eficiencia de la caldera, si utilizamos
instrumentos de medicin con la resolucin suficiente, encontraremos que existe variabilidad en
esos parmetros, y mediante el uso de tcnicas estadsticas podemos realizar mejoras para reducir
la variacin en rendimiento de la caldera.
Para poder obtener consecuencias y deducciones vlidas de los datos de un estadstico, es muy til
contar con informacin sobre los valores que se agrupan hacia el centro y sobre que tan
distanciados o dispersos estn unos respecto a otros.

La Estadstica Inferencialse refiere a la estimacin de parmetros y pruebas de hiptesis acerca
de las caractersticas de la poblacin en base a los datos obtenidos con una muestra.

Estadstica General 2011

3
Mg. Miguel Angel Macetas Hernndez


Poblacin o Universo. Est referido a un colectivo finito o infinito de elementos individuales.
Poblacin es un conjunto completo de individuos u objetos que poseen alguna caracterstica comn
observable. Poblacin es el nmero de elementos que definen la cobertura de un estudio. La
poblacin es el universo de estudio que est integrado por la totalidad de todas las unidades de
anlisis.
Alumnos de Ingeniera Civil matriculados en ciclo acadmico 2010 en la Universidad
Alumnos de IV ciclo de la Escuela Profesional de Ingeniera Civil de la UNC
Ingenieros Civiles Colegiados en el departamento de Cajamarca en el ao 2010.

Muestraes la parte o subconjunto de una poblacin. La muestra est constituida de elementos
seleccionados de una manera deliberada, con el objeto de investigar las propiedades de su
poblacin. La muestra slo da informacin de aquella poblacin de la que ha sido extrada.

Unidad de Anlisis o Unidad de Observacin Es el objeto o elemento indivisible que ser
estudiado en una poblacin sobre los cuales se va a obtener datos. La unidad de anlisis no es el
fenmeno investigado sino el que genera el fenmeno y proporciona datos concretos.

Dato. Es el valor o respuesta que adquiere variable la en cada unidad de anlisis. Dato es el
resultado de la observacin, entrevista o recopilacin en general. Los datos son. materia prima de la
Estadstica.

Parmetro. Es una medida usada para describir algunas caractersticas de una poblacin, y para
determinar su valor es necesario utilizar la informacin de la poblacin completa y por lo tanto, las
decisiones se tomaran con certidumbre total:
Media poblacional (), Varianza poblacional (
2
), Proporcin poblacional (p).

Estadgrafo. Es una medida usada para describir alguna caracterstica de la muestra y la toma de
decisiones contiene un grado de incertidumbre. Las ms usadas son:
Media muestral ( ), Varianza muestral (

), Proporcin muestral ()

Variable: Es una caracterstica que puede tomar diferentes valores. Las variables son
caractersticas observables, susceptibles de adoptar distintos valores (cuantificado) o ser
expresados en varias categoras
Peso
Nmero de ingresantes a la UNC
Estado civil
Sexo
Nacionalidad
Edad

Clasificacin de las Variables

Podemos considerar muchos criterios de clasificacin como:

A. Segn la Naturaleza de la Variable

a) Variables Cualitativas o Estadsticas de Atributos.
Cuando expresan una cualidad, caracterstica o atributo, tienen carcter cualitativo sus datos se
expresan mediante una palabra es no numrico. Por ejemplo: estado civil, los colores, lugar de
nacimiento, profesiones, actividad econmica, causas de accidentes, etc.

b) Variables Cuantitativas.
Cuando el valor de la variable se expresa por una cantidad, es de, carcter numrico. El dato o valor
puede resultar de la operacin de contar o de medir. Por ejemplo: edad nmero de hijos por familia,
Estadstica General 2011

4
Mg. Miguel Angel Macetas Hernndez


ingresos, viviendas por centro poblado, niveles de, desempleo, produccin, utilidades por empresas,
etc.,
Las variables cuantitativas pueden ser: discreta y continua.

b.1. Variable Discreta.
Cuando el valor de la variable resulta de la operacin de contar su valor est representado slo
por nmeros naturales (enteros positivos). Ejemplos: hijos por familia nmero de accidentes por
da, trabajadores por empresa; poblacin por distritos, habitaciones por vivienda. etc.

b.2. Variable Contina.
Cuando la variable es susceptible de medirse es toda variable cuyo valor se obtiene por
medicin o comparacin con una unidad o patrn de medida. Las variables continuas pueden
tener cualquier valor dentro de su rango o recorrido por tanto se expresa por cualquier nmero
real. Ejemplos: ingresos monetarios, produccin de maz, peso, estatura, tiempo de servicios,
horas trabajadas, niveles de empleo. etc.
B. Segn la Escala de Medicin

ESCALA
CARACTERSTICAS USOS/EJEMPLOS LIMITACIONES
Nominal
Se clasifican las
personas, eventos u
objetos en
categoras.

Denominaciones religiosas,
afiliacin poltico partidista,
codificaciones en la
clasificacin de objetos,
pinturas, movimientos
literarios.
No se pueden
precisar diferencias
cuantitativas entre las
categoras
Ordinal

Se clasifican u
ordenan las
personas, objetos y
eventos en
determinada posicin
Orden de llegada de atletas
en una carrera, puntuaciones
de una prueba, rangos
militares, nivel de
popularidad de estudiantes
en una escuela.
Restringida para
identificar diferencias
relativas, pero no
precisa diferencias
en cantidad absoluta
entre personas u
objetos.
Intervalo s
Escala que posee
unidades de igual
magnitud. El punto
cero de la escala es
arbitrario y no refleja
la ausencia del
atributo.
Temperaturas (Celsius y
Fahrenheit), fechas del
calendario, escala de
inteligencia,

Razones no tienen
sentido ya que el
punto cero es
establecido
convencionalmente.
Razones
Escala que posee un
punto cero absoluto e
intervalos de igual
magnitud.
Distancia, peso, estatura,
tiempo requerido para
realizar una tarea escolar.

Ninguna, excepto
que su uso se
supedita mayormente
a medir cualidades
fsicas ms que para
la medicin de
aspectos
psicolgicos.

C. Segn la Relacin Entre Variables

a) Variables Dependientes
Son aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales
hay que buscar su motivo, causas o razn de ser, Es la variable que traduce la consecuencia del
efecto de una varias razones o causas.

Estadstica General 2011

5
Mg. Miguel Angel Macetas Hernndez


b) Variables Independientes
Son las variables explicativas o predicativas, cuya asociacin, relacin o influencia en la variable
dependiente se pretende escribir en la investigacin. Las variables independientes son los que
traducen o explican las causas o razones de las variaciones en la variable dependiente.
Simplificando, en la relacin de variables, las causas o antecedentes seran las variables
independientes (VI) y la causa o consecuente es la variable dependiente (VD). Ejemplos: En el caso
ms simple, para la relacin d dos variables.
El presupuesto familiar (VD) depende de los ingresos (VI).
El volumen de ventas (VD) se explica por la inversin en propaganda (V).
El nmero de hijos por familia (VD) tiene relacin con el nivel educativo de los padres (VI).

c) Variables Intervinientes o interferentes
Son aquellas que coparticipan con la variable independiente condicionando el comportamiento de la
variable dependiente. En el caso de la relacin entre presupuesto familiar (VD) y los ingresos (VI),
algunas variables intervinientes serian la conducta de consumo, la edad de los miembros de la
familia, etc.

Elementos de una Variable
La identificacin y definicin de variables es la tarea ms delicada de toda investigacin y del trabajo
estadstico. En consecuencia, para tener xito en la seleccin de variables, es recomendable
distinguir las siguientes cinco caractersticas.
Un nombre o denominacin. de la variable.
Alguna definicin o conceptualizacin.
Un conjunto de categoras. que es definida por el investigador. Las categoras no son nicas.
Procedimientos para categoras las unidades de anlisis.
Algunas medidas de resumen o indicadores.

Ejemplo 1:
a) Nombre : Estado civil o conyugal.
b) Definicin : Es la situacin de la persona empadronada en relacin con las leyes y
costumbres del pas.
c) Categoras :
01) Sol tero (a).
02) Casado (a).
03) Conviviente.
04) Viudo (a).
05) Divorciado (a).
06) Separado (a).
d) Categorizacin: Cul es su estado civil o conyugal?
e) Medidas de Porcentajes
Resumen - Tasa de nupcialidad que indica la frecuencia de matrimonios, etc.
Ejemplo 2:
a) Nombre : Ingresos
b) Definicin Son los recursos monetarios netos incluyendo todas las
Bonificaciones que percibe una persona por su ocupacin principal y secundaria durante el perodo
de referencia de la encuesta.
c) Categoras : Puede proponerse en forma de niveles o simplemente intervalos.
Niveles de ingreso: alto, medio, bajo
Intervalos: Por ejemplo 8 intervalos
Menos de 4000; 4001 l 8000; 8001 a 12000; 1 2001 a 1 6000; 16001 a 20000: 20001 a 25000;
25001 a 30000; 30001 y ms soles.
d) Categorizacin: Cul fue su ingreso total en el ltimo mes?
e) Indicadores : Ingreso promedio.
Dispersin de los ingresos. etc.
Estadstica General 2011

6
Mg. Miguel Angel Macetas Hernndez


1.2. Fases del Proceso Estadstico en la Ingeniera
La figura 1 ilustra las Fases del Proceso Estadstico

1.3. Clasificacin y cmputo de datos uni. y bivariables: presentacin tabular y grfica.
1.3.1. Clasificacinde la informacin
A. Codificacin y tabulacin
La codificacin facilita la tabulacin y el conteo. (obtencin de una buena informacin)
La codificacin de las respuestas da lugar a categoras o modalidades.
Es recomendable que los cuestionarios tengan las alternativas de respuesta pre codificadas.
Si el cuestionario tiene preguntas abiertas (respuesta libre), estas previamente debe ser
clasificadas en categoras.

B. Presentacin tabular de los Datos: cuadros de distribucin de frecuencias
Es necesario agrupar los datos y presentarlos en cuadros y diagramas sencillos.
Uncuadro de frecuencias, son cuadros que indican la distribucin de un conjunto de datos en
clases o categoras y muestran el nmero de elementos y la proporcin de cada uno de los valores
de la variable.
Un cuadro de frecuencias, permite una buena ayuda para formularse interrogantes acerca de los
datos.
Uncuadro de frecuencias, es un punto de partida en la bsqueda de un modelo terico para
analizar la distribucin de los datos.
En la cuadro se observa la frecuencia o repeticin de cada uno de los valores de la variable.
Las observaciones o recopilaciones de datos denotaremos la variable por X y los datos originales:
X
1
, X
2
, X
3
,, X
n
, donde Xi representan la i sima observacin de la variable con (i = 1, 2, 3, 4,...,
n). Es decir que:

X
1
= dato de la primera observacin
X
2
= dato de la segunda observacin
X
3
= dato de la tercera observacin

.
X
n
= dato de la n sima observacin

C. Partes Principales de un Cuadro Estadstico
En general, un cuadro estadstico completo, tal como el Cuadro N 01, por ejemplo, puede tener ocho
partes:
1. Nmero del cuadro. 2. Ttulo. 3. Encabezamiento o conceptos.
4. Cuerpo. 5. Nota de pie o llamadas. 6. Fuente.
7. Nota de unidad de medida. 8. Elaboracin.

Estadstica General 2011

7
Mg. Miguel Angel Macetas Hernndez




















Ramas de Actividad
PEA de
15 aos
y ms
N i v e l d e Educacin
Sin
Nivel*
Primaria Secundaria
Sup. No
Univer.
Superior
Univer.
No
Especificado
TOTAL
100,0 5,89 42,11 35,87 5,67 8,66 1,80
1. Agricultura, Caza, Selvicultura y Pesca 100,0 14,97 64,05 15,59 0,70 1,30 3,40
2. Explotacin de Minas y Canteras. 100,0 0,75 41,13 39,59 5,79 12,63 0,11
3. Industrias Manufactureras. 100,0 3,60 43,57 41,60 2,94 6,70 1,59
4. Electricidad, Gas y Agua. 100,0 0,00 21,95 48,29 8,29 20,49
0,98
5. Construccin. 100,0 4,78 64,36 24,99 1,05 3,54 1,28
6. Comercio, Restaurantes y Hoteles. 100,0 6,95 45,04 39,66 2,06 4,39 1,91
7. Transportes, Almacenamiento y
Comunicaciones.
100,0 1,34 45,18 46,87 2,28 3,15 1,18
8.Establecimientos Financieros, Seguros,
Bienes Inmuebles y Servicios a las
Empresas
100,0 0,64 11,60 48,71 9,28 29,25 0,52
9. Servicios Comunales, Sociales y
Personales.
100,0 2,10 26,56 43,35 11,46 15,22 1,30
10. Actividades No bien especificadas. 100,0 9,35 44,70 34,99 3,55 4,97 2,43
11. Buscan trabajo por primera vez. 100,0 1,94 25,75 56,97 6,70 7,94 0,71
* Incluye PEA con educacin inicial o pre escolar
Fuente: INE Resultados definitivos de los Censos Nacionales IX de Poblacin y IV de Vivienda
Elaborado: StatisticMAH.

5)NOTA DE PIE O LLAMADAS, se usa para aclarar algunos trminos o siglas, y tambin para indicar qu elementos estn
o no incluidos en algunos de los conceptos del cuadro.
6) FUENTE, es la indicacin al pie el cuadro, que sirve para nombrar la publicacin, entidad, estudio o fuente de donde se
obtuvieron los datos utilizados para construir el cuadro. La identificacin de la fuente permite, si fuera el caso, comprobar
la informacin o para obtener informacin complementaria.
Hay dos tipos de fuentes: i) primaria, cuando se obtiene directamente de la unidad de anlisis o cuando se recurre a los
propios formularios de una encuesta: ii) secundaria, cuando se recurre a documentos boletines o cuadros estadsticos
publicados.
7) Nota Unida de Medidase escribe debajo del ttulo, se usa cuando se abrevia la escritura
8) ELABORACIN, es una indicacin que se coloca debajo de la fuente, y sirve para mencionar el responsable, que
utilizando datos originales o de la fuente elabor el cuadro estadstico final: indica la responsabilidad de la publicacin del
cuadro. A veces resulta til indicar la fecha de elaboracin.

QUE : Poblacin Total Econmicamente Activa De 15 Aos Y Ms
DONDE : Del Departamento Cajamarca
COMO :Por Nivel Educativo Segn Ramas de Actividad
CUANDO : Censo de Poblacin 2007.
CUADRO N 01
1
Es el cdigo o elemento de
identificacin que permite
ubicar el cuadro en el interior
de un documento
2
7
POBLACIN TOTAL ECONMICAMENTE ACTIVA DE 15 AOS Y MS, DEL DEPARTAMENTO DE
CAJAMARCA: POR NIVEL EDUCATIVO SEGN RAMAS DE ACTIVIDAD. CENSO DE POBLACIN 2007




Como
Que
Cuando Donde
Donde
Es la descripcin
resumida del contenido
del cuadro. La redaccin
del ttulo debe ser breve,
claro y completo, de
modo que se puedan
deducir sin ambigedad
qu tipo de informa.
Debe indicar
1. QUE
2. DONDE
3. COMO
4. CUANDO

Expresa en qu unidades
estn las variables
(Distribucin porcentual)
Descripcin de lasfilas y
columnas del cuadro
estadstico
3
Es el
contenido
numrico
del cuadro
4
Estadstica General 2011

8
Mg. Miguel Angel Macetas Hernndez


CUADRO 04

PACIENTES SEGN NMERO DE LEUCOCITOS /mm
3
.
HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA - 2007.
Nmero de Leucocitos
(miles)1/
Nmero de Pacientes
(n
i
)
Porcentaje de Pacientes
( h
i
% )
5.0 - 5.9
6.0 - 6.9
7.0 - 7.9
8.0 - 8.9
9.0 - 9.9
10.0 - 11.0
3
10
11
13
10
8
5.5
18.2
20.0
23.6
18.2
14.5
T o t a l a/ 55 100.0
- Nota de pie. a/. Muestra aleatoria sistemtica.
1/. Datos expresados en miles.
- Fuente. H.R.C

c) Caractersticas:

1. La cuadro estadstica debe ser lo ms simple posible.
2. Si se utilizan smbolos, abreviaturas, etc., deben explicarse detalladamente en notas de pie de
pgina.
3. Deben ser incluidas las unidades especficas de medida que corresponden a los datos.
4. Debern consignarse los totales.
5. Si los datos no son originales debe quedar explcita la fuente de donde se ha tomado.
6. Cuando se utilizan escalas cualitativas hay que tener cuidado si se desea comparar datos de
una cuadro con otra, ya que en los criterios de clasificacin de la variable puede que el
entendimiento nuestro de un concepto no coincida totalmente con el de otro investigador.
7. Una cuadro estadstica puede ser completada con las frecuencias acumuladas, frecuencias
relativas (porcentajes, promedios o razones), etc.

D. Tipos de cuadros.
En su forma ms general loscuadros pueden dividirse en simples y compuestas.
a)Cuadros Simples. Clasifican un fenmeno segn una nica variable. Ejemplo Cuadro 04.
b)Cuadros Compuestos. Son las que recogen los datos de dos o ms variables, cada una de ellas con
sus correspondientes criterios de clasificacin. Dentro de los cuadros compuestos las que se utilizan
con mayor frecuencia son: Las cuadros dobles y las Maestras.

1. Cuadros Dobles. Resumen informacin clasificadas segn 2 variables, y estas se denominan:
Cuadros de contingencia y cuadros de correlacin.

CUADRO DE CONTINGENCIA. Cuando ambas variables son cualitativas o mixtas.
Ejemplo. Elcuadro siguiente muestra una distribucin bidimensional (Cuadro de contingencia)



Estadstica General 2011

9
Mg. Miguel Angel Macetas Hernndez


CUADRO 05
REACCIN A LA VACUNACIN CONTRA EL SARAMPIN Y LA RUBOLA EN UNA MUESTRA DE 288
NIOS DE CAJAMARCA -1994.
VACUNADOS
CONTRA
SARAMPIN
VACUNADOS CONTRA RUBOLA T O T A L
Reaccin Positiva Reaccin Negativa

REACCIN
POSITIVA

REACCIN
NEGATIVA

76


120

72


20

148


140
T O T A L 196 92 288

La interpretacin a esta cuadro sera la siguiente: de una muestra de 288 individuos, 76 tuvieron
reacciones positivas a las dos vacunaciones, 20 individuos tuvieron reaccin negativa a ambas pruebas,
120 individuos tuvieron reaccin positiva ante la vacuna contra la rubola, pero negativamente ante la
vacuna contra el sarampin, y 72 nios tuvieron reaccin negativa a la vacuna contra la rubola y positiva
en la vacuna contra el sarampin.

CUADRO DE CORRELACIN. Cuando ambas variables son cuantitativas. Por ejemplo


CUADRO 06

MUJERES EN EDAD FRTIL SEGN GRUPO ETREO Y NMERO DE HIJOS NACIDOS VIVOS -
HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA 2007

GRUPO ETREO
(Aos Cumplidos)
Nmero de Hijos Nacidos Vivos
T O T A L
0 1 2 3 4 5 y +
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49


T o t a l


2. Cuadro Maestra. En este tipo de cuadros todos los criterios de clasificacin de cada una de las
variables son sometidos a una clasificacin cruzada. Esto da lugar a una perspectiva mucho ms
amplia, ya que nos permite obtener datos de una nica variable o de cualquier combinacin de
las variables que entran en juego en la cuadro.
Ejemplo. Elcuadro muestra la composicin por edad, sexo y trabajo de un grupo de personas con Tuberculosis
pulmonar en Cajamarca (Esquema) durante 2007.


Estadstica General 2011

10
Mg. Miguel Angel Macetas Hernndez


= =
n
n
h
i
i
CUADRO 07
PERSONAS CON TBC SEGN EDAD, CONDICIN LABORAL Y SEXO - DISTRITO DE CAJAMARCA -
2007

EDAD
TRABAJADORES NO TRABAJADORES T O T A L
Hombres Mujeres Total Hombres Mujeres Total Hombres Mujeres Total
15 19
20 24
25 29
.
.
.
50 54
55 59
60 +

TOTAL

NOTA: Con este tipo de cuadros podemos extraer datos de las personas que padecen Tuberculosis en un
determinado intervalo de edad (A), tambin del total de personas que no trabajan y han contrado
la TBC (B), y del total de mujeres, ya sean trabajadoras o no, que tienen tuberculosis (C).
E. Cuadros de Frecuencias de Variables Discretas
Para este tipo de variables cuyo valor slo se puede expresar por nmero enteros positivos, los datos
que caen dentro de cada clase.
Elementos de un cuadro de Frecuencia

Frecuencias Absolutas o Repetidas (f
i
o n
i
).- Es el nmero de veces que se repite un determinado
valor de la variable.

Frecuencia Relativa (h
i
).- Es el cociente de:

Frecuencia absoluta o Repeticiones
Nmero de Observaciones

CUADRO N 7.8
NUMERO DE NACIMIENTOS EN EL DEPARTAMENTO DE LAMBAYEQUE,
POR PROVINCIAS 2004
Provincias
Nmero de
Nacimientos
Porcentaje de Nacimientos
Lambayeque n
1
= 325
( )
43 34
944
100 x 325
n
n
h
1
1
, = = =
Chiclayo n
2
=330
( )
96 35
944
100 x 330
n
n
h
2
2
, = = =
Ferreafe n
3
= 289
( )
61 30
944
100 x 289
n
n
h
3
3
, = = =
Total n = 944 100,00


Ejemplo.El restaurante "Hay Que Rico" en la ciudad de Chiclayo, usa un cuestionario para conocer la opinin
de sus clientes sobre el servicio, la calidad de los alimentos, los ccteles, los precios y el ambiente del
restaurante en el mes de julio del 2005. Cada caracterstica se valora en una escala de notable (O), muy bueno
(V), bueno (G), mediano (A) y malo (P). Elabore un cuadro estadstico
Estadstica General 2011

11
Mg. Miguel Angel Macetas Hernndez


G O V G A O V G O V A G
V O P V O G A O O O G O
V V A G O V P V O O G O
O V O G A O V O O G V A
F. Cuadros de Frecuencias de Variables Continuas
Los sueldos mensuales en dlares de 60 empleados de la empresa Z.S.A., son los siguientes:
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 509 462 380 518 480 625 507 645 382
Construir uncuadro de Frecuencias se aplica el procedimiento siguiente:
Poblacin: Empleados de la empresa Z.S.A (n = 60)
Variable: X = sueldo mensual en dlares.
Datos: X
i
= sueldo mensual en dlares
X
i
(i =1, 2, 3,.....,60) n =60 trabajadores
Determinamos el mximo y mnimo de X
i
, el sueldo ms alto (X
max
) y el sueldo mnimo (X
min
).
X
38
= X
max
= 667 X
17
= X
min
= 321
1. Recorrido(R):X
max
X
min
= 667 321 =346
2. Elegimos el nmero de Intervalos (m).Se puede considerar 5 15 intervalos
Si aplicamos:
Para calcular el nmero de clases de uncuadro de frecuencias podemos usar las
siguientesexpresiones frmulas:
a) Raz cuadrada
b) Regla de Sturges m = 1 + 3.322 Log(n)
m = 1 + 3.322 Log(60)
m = 7 intervalos
c) Reglade Stockes



3. Determinar la amplitud de los intervalos (C)
....... ,
min max
4285 49
7
321 667
m
X X
c
i
=

=
Se puede redondear a 50
4. Construir los intervalos. ComoC
i
= 50, el recorrido se divide en 7 intervalos o segmentos, cuyo
extremos son:
I
1
I
2
I
3
I
4
I
5
I
6
I
7


320 370420 470 520 570620670

Estadstica General 2011

12
Mg. Miguel Angel Macetas Hernndez


Utilizaremos un concepto matemtico de intervalo abierto (parntesis) y de intervalo cerrado (corchete).
Donde (L
i-1
L
i
] significa que est abierto por la izquierda y cerrado por la derecha, es decir que en
cada intervalo no sta incluida el extremo inferior (L
i-1
) pero si lo est el extremo superior (L
i
).
Forma de expresar:
Intervalo de clase
(L
i-1
L
i
]
320 370
370 420
420 470
470 520
520 570
570 620
620 670
Punto medio de cada intervalo, es la MARCA DE CLASE se denota con y
i
donde
645
2
670 620
y
495
2
520 470
y
345
2
370 320
y
7
4
1
=
+
=
=
+
=
=
+
=



5. Elementos de una cuadro de frecuencia, en toda cuadro de frecuencia se identifica los siguientes
elementos:
a) Frecuencia absoluta (n
i
): Se denomina frecuencia absoluta del valor xi de la variable X, el nmero de
veces ni que se repite ese valor.
b) Frecuencia relativa (h
i
): Se denomina frecuencia relativa del valor xi de la variable X la relacin por
cociente entre el nmero de veces que aparece el valor xi y el nmero total de valores de la variable
(N).
n
n
h
i
i

c) Frecuencia absoluta acumulada (N
i
): Se denomina frecuencia absoluta acumulada del valor
i
n a la
suma de las frecuencias absolutas de los valores de la variable X anteriores o iguales a
i
n . Su valor es

=
i i
n N con j = 1......i
d) Frecuencia relativa acumulada (H
i
):Esla frecuencia absoluta acumulada dividida por el nmero total
de valores de la variable. Su valor es
i
H =
N
N
i
.
De todas estas definiciones se extraen las siguientes deducciones:
La suma de las frecuencias absolutas sin acumular es igual al nmero total de los (
i
n ,= N)
La ltima frecuencia relativa acumulada es el total de elementos (n).
La suma de todos las frecuencias relativas acumular es igual
La ltima frecuencia relativa acumulada es la unidad

La distribucin de frecuencias de una variable suele presentarse ordenadamente mediante la cuadro de
frecuencias siguiente:

Estadstica General 2011

13
Mg. Miguel Angel Macetas Hernndez


Intervalos
de clases
Marca
de
clase
Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
Frecuencias
Relativas
Frecuencias Relativas
Acumuladas
<L
i-1
L
i
] x
i
n
i
N
i
h
i
H
i

<L
1
L
2
] x
1
n
1
N
1
=n
1
h
1
=
N
n
1
H
1
=
N
N
1

<L
2
, L
3
] x
2
n
2
N
2
= n
1
+n
2

h
2
=
N
n
2
H
2
=
N
N
2

<L
3
, L
4
] x
3
n
3
N
3
=n
1
+n
2
+n
3

h
3
=
N
n
3
H
3
=
N
3
N

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
<L
k-1
, L
k
] x
k
n
K
N
k
= n
1
+...+n
K
=n h
k
=
N
n
k
H
k
=
N
N
k
=1.00
Total n En
i
=n Eh
i
=1









Lectura de la informacin debe considerar los Signos y Smbolos siguientes:
( ) No existe el fenmeno que trata
( 0 ) La cantidad no alcanza a la mitad de la unidad tomada como base
() Informe no disponible.
Los Intervalos pueden ser de la
siguiente manera:
<L
i-1
L
i
] <L
i-1
L
i
>
[L
i-1
L
i
> [L
i-1
L
i
]

Estadstica General 2011

14
Mg. Miguel Angel Macetas Hernndez


1.3.2. Grficos Estadsticos

Primero definir lo que es un grfico o diagrama en estadstica.

Un diagrama es una especie de esquemtico, formado por lneas, figuras, mapas, utilizado para
representar, bien datos estadsticos a escala o segn una cierta proporcin, o bien los elementos de un
sistema, las etapas de un proceso y las divisiones o subdivisiones de una clasificacin. Entre las
funciones que cumplen los diagramas se pueden sealar las siguientes:

Hacen ms visibles los datos, sistemas y procesos
Ponen de manifiesto sus variaciones y su evolucin histrica o espacial.
Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y
representar la correlacin entre dos o ms variables.
Sistematizan y sintetizan los datos, sistemas y procesos.
Aclaran y complementan las cuadros y las exposiciones tericas o cuantitativas.
El estudio de su disposicin y de las relaciones que muestran pueden sugerir hiptesis nuevas.

Algunos de los diagramas ms importantes son el diagrama en rbol, diagrama de reas o superficies,
diagrama de bandas, diagrama de barras, diagrama de bloques, diagrama circular, diagrama circular
polar, diagrama de puntos, diagrama de tallo y hoja diagrama, histogramas y grficos de caja y bigote o
boxplots.

1.3.2.1. CLASIFICACIN DE LOS GRFICOS
Los grficos podemos clasificarlos en la siguiente forma:
A. Grficos de coordenadas ortogonales.
Con divisiones equidistantes: Cronodiagrama, historiograma, histograma y polgono
acumulativo, grfico en Z, grfico en escalera, grfico de banderola, grfico mixto (La Banda
Flaman), curva de frecuencia, estereograma, grfico de Gantt, grfico de barras, etc
Con divisiones semi-equidistantes: Cuadriculado logartmico y semi-logartmico.
B. Grficos de coordenadas seudo-ortogonales.
C. Grficos de coordenadas no ortogonales.
Grficos de coordenadas polares, grfico en espiral, grfico triangular equiltero, etc.
D. Grficos sin coordenadas.
De superficies: Grficos de sectores, grficos geomtricos diversos.
De volmenes: Cubo, esfera, etc.
De figuras (pictrico).
Cartograma de sealizacin y densidad.
Estadstica General 2011

15
Mg. Miguel Angel Macetas Hernndez


Abscisas
O
r
d
e
n
a
d
a
s

E. GRFICOS DE LA DISTRIBUCIN DE FRECUENCIAS

Las frecuencias (n
i
, h
i
, N
i
, H
i
) siempre son cantidades no negativas (> 0), por lo tanto el grafico de las
frecuencias sean para variables discretascomo para variables continuas, se construye en el primer
cuadrante del plano cartesiano o rectangular. En eje de las abscisas (horizontal) se indican los valores de
la variable (sean puntos o intervalos), y en el eje de las ordenadas (vertical) se anota el valor de la
respectiva frecuencia.
i. Frecuencias de variable Discreta
La representacin grfica de las (n
i
h
i
) se hace mediante el Diagrama de Frecuencia. Par el efecto, en
el eje horizontal se representan los valores Y
i
, y en el eje verticales representa los valores de las
frecuencias (n
i
h
i
)


Opinin de
los
Clientes
Frecuencia
absoluta
n
i

Frecuencia
Relativa
h
i
%
A 6 12,5
G 10 20,8
O 18 37,5
P 2 4,2
V 12 25,0
Total 48 100,0






Al considerar las frecuencias absolutas acumuladas o relativas acumuladas, la representacin grfica se hace
mediante el GRFICO ACUMULATIVO DE FRECUENCIAS. En el eje horizontal se colocan los valores de la
Marca de Clase (X
i
), y en el eje vertical los valores Ni H
i
, a continuacin, a partir de cada extremo de los
segmentos se traza tramos horizontales formando una escalera como se aprecia en el siguiente grafico


Intervalos
de clases
(Li-1 L
i
]
Marca de
clase
Xi
Frecuencia
Absolutas
ni
Frecuencias
Absolutas
Acumuladas
Ni
16 27 21,5 3 3
27 38 32,5 5 8
38 49 43,5 10 18
49 60 54,5 3 21
60 71 65,5 8 29
71 82 76,5 7 36
82 93 87,5 4 40
Total 40


Opinin de los Clientes
F
r
e
c
u
e
n
c
i
a

A
b
s
o
l
u
t
a
s

A G O P V
0
5
10
15
20
6
10
18
2
12
n
i

0
5
10
15
20
25
30
35
40
45
0 20 40 60 80 100
Marca de Clase
F
r
e
c
u
e
n
c
i
a
s

A
b
s
o
l
u
t
a
s

A
c
u
m
u
l
a
d
a
s
Estadstica General 2011

16
Mg. Miguel Angel Macetas Hernndez




















ii. Frecuencias de variable Continua
En el caso ms general, las variables continuas se agrupan en cuadros de frecuencias con intervalos, por
lo tanto se trata de representar grficamente intervalos en el eje horizontal.
La representacin grfica de las frecuencias (absolutas o relativas) se hace mediante el Histograma de
Frecuencias, que est constituido por un conjunto de rectngulos, cuya base es igual a la amplitud de un
intervalo y la altura igual a la respectiva frecuencia. Para construir el histograma de frecuencias, se
indican en el eje horizontal













Otro grfico que se usa para representar las frecuencias es el Polgono de Frecuencias, que se construye como
sigue: en cada punto medio o marca de clase (Xi) de cada intervalo se levanta un segmento de altura igual a la
respectiva frecuencias Absolutas (n
i
h
i
), luego une los extremos con una lnea poligonal, resultando el
Polgono de Frecuencias. Para completar los extremos, se extiende el polgono en media amplitud de cada
extremo.
Intervalos
de clases
(Li-1 L
i
]
Marca de
clase
Xi
Frecuencia
Absolutas
ni
Opinin
de los
Clientes
Frecuencia
absoluta
ni
Frecuencia
Relativa
hi %
Convierten
hi %
A Grados
En
Grados
A 6 12,5
( )
100
5 , 12 x 360
45.0
G 10 20,8
( )
100
8 , 20 x 360
74.9
O 18 37,5 135.0
P 2 4,2 16.3
V 12 25,0 91.8
Total 48 100,0

Intervalos
de clases
(Li-1 L
i
]
Frecuencia
Absolutas
ni
16 27 3
27 38 5
38 49 10
49 60 3
60 71 8
71 82 7
82 93 4
Total 40
6
10
18
2
12
0
2
4
6
8
10
12
14
16
18
F
r
e
c
u
e
n
c
i
a

A
b
s
o
l
u
t
a
A G O P V
Opinin de los Clientes
En el caso de Grficos de
Barras, en el eje horizontal
representa los valores de Yi, y
en el eje vertical se presentan
los valores de las frecuencias
Absolutas (n
i
h
i
)
Para los Grficos de Sectores
Circulares Pastel, se
convierten los valores de
las frecuencias Absolutas
(n
i
h
i
) a grados mediante

( )
100
%
i
xh 360


12.5%
20.8%
37.5%
4.2%
25.0%
0
2
4
6
8
10
0 16 27 38 49 60 71 82 93
Lmite inferior
F
r
e
c
u
e
n
c
i
a

A
b
s
o
l
u
t
a
s


ni
6
8
10
12
F
r
e
c
u
e
n
c
i
a
A
b
s
o
l
u
t
a

Estadstica General 2011

17
Mg. Miguel Angel Macetas Hernndez


10.5 0
16 27 21,5 3
27 38 32,5 5
38 49 43,5 10
49 60 54,5 3
60 71 65,5 8
71 82 76,5 7
82 93 87,5 4
98.5 0
Total 40

Por su parte, las frecuencias acumuladas (Absolutas o Relativas) se grafican mediante los Polgonos
Acumulativos de Frecuencias (Ojiva). De igual manera, en el eje horizontal se ubican los extremos los intervalos y
en el eje vertical lo valores de N
i
, H
i
. En el extremo superior de cada intervalo se levanta un segmento de altura
igual a la respectiva frecuencia absoluta, luego partiendo del extremo inferior del primer intervalo se une, con
segmentos de recta, los extremo de los segmentos verticales, obteniendo una lnea poligonal que, a partir de la
ltima frecuencia acumulativa, se extiende paralelamente al eje horizontal, obtenindose la grfica del
Polgono Acumulativo de Frecuencias

Intervalos
de clases
<Li-1 Li]
Marca de
clase
Xi
Frecuencia
Absolutas
ni
Frecuencias
Absolutas
Acumuladas
Ni
16 27 21,5 3 3
27 38 32,5 5 8
38 49 43,5 10 18
49 60 54,5 3 21
60 71 65,5 8 29
71 82 76,5 7 36
82 93 87,5 4 40
Total 40


Aos Demanda de cobre en China
1990 505
1991 600
1992 850
1993 1000
1994 770
1995 1125
1996 1240
1997 1260
1998 1380
1999 1550
2000 1660
2001 1750
2002 1840
2003 1900

0
5
10
15
20
25
30
35
40
45
0 16 27 38 49 60
Intervalo de Clase
F
r
e
c
u
e
n
c
i
a
s

A
b
s
o
l
u
t
a
s

A
c
u
m
u
l
a
d
a
s


71 82 93
Grfico N 3.3: Diagrama de dispersin
Demanda de cobre refinado en China
(miles de toneladas mtricas)
0
200
400
600
800
1000
1200
1400
1600
1800
2000
1
9
9
0
1
9
9
1
1
9
9
2
1
9
9
3
1
9
9
4
1
9
9
5
1
9
9
6
1
9
9
7
1
9
9
8
1
9
9
9
2
0
0
0
2
0
0
1
2
0
0
2
2
0
0
3
Aos (variable independiente = X)
D
e
m
a
n
d
a

d
e

c
o
b
r
e

e
n

C
h
i
n
a
(
v
a
r
i
a
b
l
e

d
e
p
e
n
d
i
e
n
t
e

=

Y
)
Estadstica General 2011

18
Mg. Miguel Angel Macetas Hernndez


32,0 30,0 28,0 26,0 24,0 22,0 20,0 18,0 16,0
40
30
20
10
0
0
1
1 2 3 4
30 20 10 0
32
30
28
26
24
22
20
18
16
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9 10 11 12
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9
0
1
2
3
4
5
6
7
8
1 2 3 4
0
10
20
30
40
50
60
70
80
90
100
1 2 3 4
0
5
10
15
20
25
30
1 2 3 4
CLASIFICACIN DE LAS
VARIABLES
OBJETIVO DEL GRAFICO
MOSTRAR
TAMAO
DEL
RECORRIDO
ESCALA DE
MEDICIN
DISTRIBUCIN DE
FRECUENCIAS
(UNA VARIABLE)
ASOCIACIN ENTRE
VARIABLES (DOS O MAS)

D
I
S
C
R
E
T
A
S





T
O
D
A
S

BASTONES








BARRAS SIMPLES






SECTOR CIRCULAR







BARRAS AGRUPAS






BARRAS COMPUESTAS



C
O
N
T
I
N
U
A
S

I
N
T
E
R
V
A
L
O

O

R
A
Z
O
N
HISTOGRAMA











POLGONO DE
FRECUENCIAS

CORRELACIN












LINEAL


Estadstica General 2011

19
Mg. Miguel Angel Macetas Hernndez


F. VENTAJAS Y DESVENTAJAS DE LOS GRFICOS
Ventajas de los grficos.

a) Sntesis.- Un cuadro con cifras es difcil de estudiar requiriendo a menudo un penoso trabajo
analtico para poder descubrir las informaciones que contiene. Por el contrario, mediante un
grfico el investigador hace aparecer las principales caractersticas de una serie estadstica.
b) Descubrimiento.- El grfico permite descubrir hechos esenciales, que pasaran desapercibidos
al simple examen de los cuadros numricos.
c) Control.- Permite descubrir anomalas de clculo o tipogrficas, que no son fciles de hallar en
los cuadros.
d) Comparacin.- Si el anlisis de los datos de una serie en un cuadro, es una labor delicada, la
confrontacin de los datos de dos series lo es ms todava. En cambio, los grficos permiten un
conjunto de comparaciones a simple vista.
e) Bsqueda de las regularidades.- Los grficos permiten hallar fcilmente la regularidad de los
movimientos de las series cronolgicas. Tambin permite destacar la alternancia o repeticin de
ciertos fenmenos.

El Grfico es un instrumento de investigacin cientfica.

Desventajas de los grficos

a) Ocultamiento.- El grfico oculta una cierta cantidad de informacin. En este sentido es menos
preciso que un cuadro.
b) Deformaciones.- Por fallas deliberadas o no en la construccin, puede introducir importantes
deformaciones de los hechos. Un dibujante poco escrupuloso puede exagerar o reducir,
mediante un mal uso de las escalas y de los trazos, la importancia de un fenmeno. Tal cosa
puede ocurrir en grficos para fines polticos, econmicos o publicitarios.

1.4. Aplicaciones Resumen de datos: Medidas de tendencia central, variacin, asimetra y
apuntamiento.
A. Medidas de Posicin Centrales (Tendencia Central)
Se calcula una medida de tendencia central cuando se necesita un valor nico que resuma una serie de
datos; por ejemplo: si se presentara la informacin de las Nacimientos en 2004, se puede decir que la
edad mediana de las madres gestantes fue de 18 aos.

1. La Media Aritmtica
Es la medida de tendencia central con la cual probablemente est usted mas familiarizado es la media
aritmtica; se conoce tambin como media o promedio; se representa como
x
y se conoce como "x
barra"; la frmula para calcularla es:
1.1. Para Datos Sin Agrupar
media x
x
n
i
= =


Se lee as: la media es igual a la suma de las xs dividido por n.
Ejemplo Datos Sin Agrupar
En un brote de hepatitis A, 6 personas iniciaron sntomas 24 a 31 das despus de la exposicin. Calcule
el promedio del perodo de incubacin en ste brote; los perodos de incubacin para las personas
afectadas (Xi) fueron:

29, 31, 24, 29,3 0 y 25

Paso Uno Para calcular el numerador sume las observaciones individuales
Ex = 29+31+24+29+30+25= 168

Paso Dos para calcular el denominador cuente el nmero de las observaciones: n = 6

Paso Tres Para calcular la media divida el numerador sumatoria de las observaciones) entre el
denominador (numero de las observaciones).

Estadstica General 2011

20
Mg. Miguel Angel Macetas Hernndez


875 55
40
2235
40
350 535,5 524 163,5 435 162,5 64,5
x media , = =
+ + + + + +
= =

Entonces, el promedio del perodo de incubacin del brote es 28 das
1.2. Para Datos Agrupados



Intervalos
de clases
Marca de
clase
Frecuencia
Absolutas
x
i
n
i

(L
i-1
L
i
] x
i
n
i

16 27 21,5 3 64,5
27 38 32,5 5 162,5
38 49 43,5 10 435
49 60 54,5 3 163,5
60 71 65,5 8 524
71 82 76,5 7 535,5
82 93 87,5 4 350
Total 40 2235



El puntaje promedio en el rendimiento de la lnea de accin educativa de Lenguaje de una muestra
de 40 alumnos es 55,875.

1.3. Propiedades de la Media. Aritmtica.
Sean: x e y : variable
k : constante
M [ ] : Operador Media Aritmtica.
a) M [k] = k
b) M [x + k] = M[x] + k
c) M[kx] = kM[x]
d) M [x y] = M[x] M [y]
e) M[x - ] = 0
f) f) M ((X M)2) es mnimo si K = X
La media aritmtica es un indicador de posicin sensible a valores extremos.

2. La Mediana (Me)
Otra medida de tendencia central es la mediana; como se ver es especialmente til cuando los datos
estn sesgados.
Mediana significa a la mitad y la mediana es el valor a la mitad de una serie de datos que han sido
colocados en orden. Especficamente, la mediana es el valor que divide una serie de datos en dos
mitades con una mitad de las observaciones mayores que sta y la otra mitad menores a la mediana.
3. Para Datos Sin Agrupar

Ejemplo Al tener los siguientes datos de tensiones arteriales sistlicas: 110, 120, 122, 130, 180 Mm. de
Hg.
En este ejemplo, hay dos observaciones mayores y dos menores que 122, luego entonces, la mediana
es 122 Mm. de Hg., el valor de la 3 observacin. Al obtener la media (132) sta sera mayor que 4 de
los 5 valores.

media x = =
+ + + + +
= =
29 31 24 29 30 25
6
168
6
28 das
n
n x
x media
i i
= =
Estadstica General 2011

21
Mg. Miguel Angel Macetas Hernndez


Cmo Identificar la Mediana de Datos Individuales

Paso Uno Ordene los datos de menor a mayor o viceversa
Paso Dos Encuentre el rango medio con la siguiente frmula

Rango mediano =
a. Si el nmero de observaciones (n) es impar el rango medio cae en una observacin.
b. n es par el rango medio cae entre dos observaciones.

Paso Tres Identifique el valor de la mediana

a. Si el rango medio cae en una observacin especfica (n = impar) la mediana es igual al valor de
sta observacin.
b. Si el rango medio cae entre dos observaciones (n = par) la mediana es igual al promedio
(media aritmtica) del valor de estas observaciones.

Ejemplo con Nmero Impar de Observaciones:
n = 5 13, 7, 9, 15, 11

1. Ordenar de mayor a menor: 7, 9, 11, 13, 15 o viceversa: 15, 13, 11, 9, 7.
2. Encontrar el rango mediano

Rango mediano =

Entonces, el rango medio cae en el valor de la 3 observacin.
3. Identificar el valor de la mediana que es igual al valor de la tercera observacin n = 11

Ejemplo con nmero par de Observaciones:
n = 6: 15, 7, 13, 9, 10, 11

1. Ordenar los datos 7, 9, 10, 11, 13, 15
2. Encontrar el rango medio

Rango mediano =

Entonces, el rango medio cae entre el valor de la 3 y la 4 observacin.

3. Identificar el valor de la mediana que es igual al promedio de la 3 y 4 observacin

Mediana =

En contraste con la media, la mediana no est influenciada por valores extremos.


( )
2
1 n +
( ) ( )
3
2
1 5
2
1 n
=
+
=
+
( ) ( )
5 3
2
1 6
2
1 n
, =
+
=
+
5 10
2
10 11
, =
+
Estadstica General 2011

22
Mg. Miguel Angel Macetas Hernndez


j
N
2
n
1 j
N < <

n
j

3.1. Para Datos Agrupados
Para calcular la mediana (Me) a partir de una tabla de frecuencias debe determinarse las frecuencias
absolutas acumuladas N
i
, que permite conocer hasta que el valor de la variable o intervalo se tienen
acumulado el 50% de n;
Se Calcula con la Siguiente Frmula:


Donde
n = nmero total de datos u observaciones
N
j
= es una N
i
inmediata superior a
N
j-1
= es una N
i
inmediata inferior a
Lj-1 = extremo inferior del Intervalo Mediano
IMe = es el intervalo que corresponde a N
j
n
j
= es el n
j
que le corresponde al Intervalo Mediano
C
j
= amplitud del intervalo mediano

Ejemplo
Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de Lenguaje de una
muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aqu n = 40 luego se compara con los N
i
se obtiene que 20, observando en la
tabla este valor no coincide con algn N
i
, est entre 18 y 21, es decir: 18 <
20 < 21


Intervalos de
clases

Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
(L
i-1
L
i
] n
i
N
i

I
1
16 27 n
1
= 3 N
1
= 3
I
2
27 38 n
2
= 5 N
2
= 8
I
3
38 49 n
3
= 10 N
3
= 18
I
4

49 60 n
4
= 3
N
4
= 21
I
5
60 71 n
5
= 8 N
5
= 29
I
6
71 82 n
6
= 7 N
6
= 36
I
7
82 93 n
7
= 4 N
7
= 40
Total 40


20
2
40
2
n
= =
(
(
(

=
j
n
1 j
N
2
n
j
c
i j
L Me
2
n
IMe=
Nj-1
Nj
L
j-1

Estadstica General 2011

23
Mg. Miguel Angel Macetas Hernndez


(

+
+ =

2 1
1
i 1 j
d d
d
C L Mo
Reemplazar los valores obtenidos en la frmula de Me:








Interpretacin, significa que 20 alumnos tienen calificacin iguales o inferiores a 56,33 puntos, y los 20
alumnos restantes (el otro 50%) tienen una calificacin superior a 56,33 puntos

3.2. Moda (Mo) (Valor Modal o Promedio Tpico)
La moda es el valor que ocurre ms frecuentemente en una serie de datos
3.2.1. Para Datos Sin Agrupar
Ejemplo:
a) El conjunto: 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 4, 6 tiene la Mo = 1
b) El conjunto: 4, 8, 12, 15, 26, 35 no tiene moda
c) El conjunto: 1, 3, 5, 5, 5, 7, 7, 9, 9, 9, 11 tiene dos modas, 5 y 9 es una distribucin Bimodas.

3.2.2. Para Datos Agrupados
Cuando los datos se agrupan en una tabla de distribucin de frecuencias, el modo es el punto
medio o marca de clase que contiene la mayor frecuencia.
Se Calcula con la Siguiente Formula



Donde
Lj-1 = Lmite inferior del Intervalo Modal
C
j
= Amplitud del intervalo Modal
d
1
= n
j
n
j1

d
2
= n
j
n
j+1

Ejemplo
Calcular el puntaje de rendimiento ms frecuente en la lnea de accin educativa de Lenguaje de
una muestra de 40 alumnos de un determinado centro educativo
Intervalos de Clases Frecuencia Absolutas
(L
i-1
L
i
] n
i

I
1
16 27 n
1
= 3
I
2
27 38 n
2
= 5
I
3

38 49 n
3
= 10
I
4
49 60 n
4
= 3
I
5
60 71 n
5
= 8
I
6
71 82 n
6
= 7
I
7
82 93 n
7
= 4
Total 40
Reemplazando los valores obtenidos en la formula:


( )
33 56 Me
33 56
3
18
2
40
11 49 Me
,
,
=
=

+ =
(
(
(

IMo=
L
j-1

n
j-1

n
j+1

n
j

( )
( ) ( )
5833 , 42
3 10 5 10
5 10
11 38 Mo =
+

+ =
(

( )
( ) ( )
5833 , 42
3 10 5 10
5 10
11 38 Mo =
+

+ =
(

Estadstica General 2011



24
Mg. Miguel Angel Macetas Hernndez



Interpretacin La Moda indica que la calificacin ms frecuente en los 40 alumnos es 42,5833
puntos, o tambin la mayora de los alumnos tienen una calificacin aproximados a los 42,5833
puntos.

3.2.3. Caractersticas de las Medidas de Posicin Centrales
Media Aritmtica
1. Es una medida totalmente numrica o sea slo puede calcularse en datos de caractersticas
cuantitativas.
2. En su clculo se toman en cuenta todos los valores de la variable.
3. Es lgica desde el punto de vista algebraico.
4. La media aritmtica es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
6. La media aritmtica es nica, o sea, un conjunto de datos numricos tiene una y solo una media
aritmtica.
Mediana
1. En su clculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lgica desde el punto de vista algebraico.
Moda
1. En su clculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el mtodo de designacin de los
intervalos de clases.
3. No est definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
5. No es afectada por valores extremos.

3.3. MEDIA GEOMTRICA:
G X
,
G

La raz ensima del producto de los valores de las variables
3.3.1. CLCULO DE LA MEDIA GEOMTRICA:
a) Datos Originales:

n
n
i
n
n
G Xi x x x X
1
1
2 1
,... , |
.
|

\
|
= =
=
t

b) Datos agrupados

n
l
ni
m
i
n
n
m
n n
G Xi x x x X
m
|
.
|

\
|
= =
=
. ... ,
1
2 1
2 1
t

Aplicando logaritmos tenemos:
Log Xi Xi ni
n
X
m
i
G log log
1
1
= =

=

Entonces:

x
G X
log
10 =


La media geomtrica se utiliza los datos tienen crecimiento geomtrico: poblacin, montos de capital, produccin
Ejemplo. Calcular la tasa % crecimiento de la produccin de la empresa de cemento xxx
Ao
Produccin
(miles TM)
X = A% Prod.
2000 100 -
2001 150 50
Estadstica General 2011

25
Mg. Miguel Angel Macetas Hernndez


2002 350 133,3333
2003 1500 328,5714

% 50
100
100 150
2001 =


33 . 133
150
150 350
2002 =


57 . 328
350
350 1500
2003 =



3
57 . 328 33 . 133 50 = G X = 129.87

3.3.2. Propiedad:
G X
<
X


3.4. LA MEDIA ARMNICA:
H X
,
H

Se define como la inversa de la media aritmtica de los valores inversos de la variable.
Es utilizada para variables que resultan de una relacin de variables como por ejemplo: velocidad/distancia,
productividad/tiempo, etc.

3.4.1. CLCULO DE LA MEDIA ARMNICA:
a) Datos Originales:

=
=
n
i
H
Xi
n
X
1
1

Ejemplo:
Un automvil recorre los primeros una distancia de 140 Km: los primeros 70 Km los recorre a una velocidad de 80
Km/h y los 70 restantes a una velocidad de 120 Km/h. Calcular el promedio adecuado
Sol:
h Km X H / 96
120
1
80
1
2
=
+
=

X h Km X . / 100
2
120 80
=
+
=

El promedio adecuado es la media armnica:
b) Datos Agrupados:

=
=
n
i
H
Xi
ni
n
X
1

Propiedad:
H X <
G X
<
X

B. Estadgrafos de Tendencia No central

Estadstica General 2011

26
Mg. Miguel Angel Macetas Hernndez


(
(
(
(


+ =

j
1 J
j 1 i j
n
N
4
jn
C L Q
La medida de posicin no central son valores cuyas posiciones en las series ordenadas de los datos
permiten dividir a estos en grupos, cada grupo contiene igual nmero (porcentaje). A estas medidas se
conocen con el nombre genrico de cuantiles. Los cuantiles ms importantes son los cuartiles

1. Los Cuartiles

Los cuartiles son estadgrafos de posicin que dividen al total de las observaciones, debidamente
ordenados o tabulados, en cuatro partes de igual tamao.
Para calcular los cuartiles se utiliza la siguiente formula







Donde
L
j-1
= Limite inferior del Intervalo del Cuartil
C
j
= Amplitud del intervalo Cuartill
j = El nmero de Cuartil j = 1, 2 y 3
n = Nmero total de observaciones o datos.
N
j
= Es un inmediato superior a
4
jn

N
j-1
= Es una N
i
inmediata inferior a
4
jn

n
j
= Es el n
j
que le corresponde al Intervalo

a) Primer Cuartil (Q
1
)
Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de Lenguaje de una muestra
de 40 alumnos de un determinado centro educativo
Paso Uno
Aqu n = 40 y j =1 luego se compara con los N
i
se obtiene que 10, observando

en la tabla este valor no coincide con algn N
i
, est entre 8 y 10, es decir: 8 < 10 < 18



( )
10
4
40 x 1 jn
4
= =
Estadstica General 2011

27
Mg. Miguel Angel Macetas Hernndez


n
j

( ) 2 40
10
8 10
11 38 Q
1
, =
(


+ =
n
j


Intervalos de
clases

Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
(L
i-1
L
i
] n
i
N
i

I
1
16 27 n
1
= 3 N
1
= 3
I
2
27 38 n
2
= 5 N
2
= 8
I
3

38 49 n
3
= 10 N
3
= 18
I
4
49 60 n
4
= 3 N
4
= 21
I
5
60 71 n
5
= 8 N
5
= 29
I
6
71 82 n
6
= 7 N
6
= 36
I
7
82 93 n
7
= 4 N
7
= 40
Total 40

Reemplazando los valores obtenidos en la frmula:



Interpretacin Que el 25% del total de alumnos, es decir 10 de ellos tienen una puntuacin inferior o igual a
40,2 puntos, y los 30 restantes, o sea el 75% de trabajadores, tienen un puntaje superior a 40,2 puntos.

b) Segundo Cuartil (Q
2
)
Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de Lenguaje de una muestra
de 40 alumnos de un determinado centro educativo
Paso Uno
Aqu n = 40 y j =2 luego se compara con los N
i
se obtiene que 20, observando

en la tabla este valor no coincide con algn N
i
, est entre 18 y 21, es decir: 18 < 20 < 21

Intervalos de
clases

Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
(L
i-1
L
i
] n
i
N
i

I
1
16 27 n
1
= 3 N
1
= 3
I
2
27 38 n
2
= 5 N
2
= 8
I
3
38 49 n
3
= 10 N
3
= 18
I
4

49 60 n
4
= 3
N
4
= 21
I
5
60 71 n
5
= 8 N
5
= 29
I
6
71 82 n
6
= 7 N
6
= 36
I
7
82 93 n
7
= 4 N
7
= 40
Total 40


IQ
1
=
Nj-1
Nj
L
j-1

( )
20
4
40 x 2 jn
4
= =
IQ
2
=
Nj-1
Nj
L
j-1

Estadstica General 2011

28
Mg. Miguel Angel Macetas Hernndez


n
j

Reemplazando los valores obtenidos en la frmula:




Interpretacin Que el 50% del total de alumnos, es decir 20 de ellos tienen una puntuacin inferior o igual a
56,33 puntos, y los 20 restantes, o sea el 50% de trabajadores, tienen un puntaje superior a 56,33 puntos.

c) Tercer Cuartil (Q
3
)
Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de Lenguaje de una muestra
de 40 alumnos de un determinado centro educativo
Paso Uno
Aqu n = 40 y j =3 luego se compara con los N
i
se obtiene que

30, observando en la tabla este valor no coincide con algn N
i
, est entre 29 y 36, es decir:
29 < 30 < 36


Intervalos de
clases

Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
(L
i-1
L
i
] n
i
N
i

I
1
16 27 n
1
= 3 N
1
= 3
I
2
27 38 n
2
= 5 N
2
= 8
I
3
38 49 n
3
= 10 N
3
= 18
I
4
49 60 n
4
= 3 N
4
= 21
I
5
60 71 n
5
= 8
N
5
= 29
I
6

71 82 n
6
= 7
N
6
= 36
I
7
82 93 n
7
= 4 N
7
= 40
Total 40

Reemplazando los valores obtenidos en la frmula:



Interpretacin Que el 75% del total de alumnos, es decir 30 de ellos tienen una puntuacin inferior o igual a
39,57 puntos, y los 10 restantes, o sea el 25% de trabajadores, tienen un puntaje superior a 39,57 puntos.


( )
( )
33 56
3
18
40 x 2
11 49
2
Q
4
, =

+ =
(
(
(
(

( )
30
4
40 x 3 jn
4
= =
IQ
3
=
Nj-1
Nj
L
j-1

( )
( )
57 39
7
29
40 x 3
11 71
3
Q
4
, =

+ =
(
(
(
(

Estadstica General 2011



29
Mg. Miguel Angel Macetas Hernndez


2
Q Q
Q
1 3

=
( )
1 n
n x x
s
i
2
i 2

( )
1 n
n
n x
n x
s
2
i i
i
2
i
2

C. Medidas de dispersin
Las medidas de dispersin permiten calcularla representatividad de una medida de posicin, para lo cual
ser preciso cuantificar la distancia de los diferentes valores de la distribucin respecto a dicha medida. A
tal distancia es a lo que, en trminos estadsticos, denominaremos variabilidad o dispersin de la
distribucin. Las medidas de dispersin tienen como finalidad estudiar hasta que punto, para una
determinada distribucin de frecuencias, las medidas de tendencia central o de posicin son
representativas como sntesis de toda la informacin de la distribucin. Medir la representatividad de una
medida de posicin equivale a cuantificar la separacin de los valores de la distribucin respecto a dicha
medida. Entre los estadgrafos de Dispersin de mayor uso se tiene:
1. Recorrido o rango (R)
El recorrido do un conjunto de observaciones es simplemente la diferencia entre el mayor y menor
valor de la variable.
En datos no agrupados:
R = X
max
X
min

2. Recorrido Semi Cuartil (Q)
La desviacin cuartil de un conjunto de datos est definido por


Donde Q
1
y Q
3
son el primer y tercer cuartil de los datos. A veces se usa el "Recorrido Intercuartil Q
3

Q
1
". El recorrido semi-intercuartil o desviacin cuartil, da una idea de la dispersin del 50% de los
datos centrales.
3. Varianza (s
2
)
Es el estadgrafo de dispersin ms importante. y expresa el grado de dispersin de las
observaciones respecto a la media aritmtica. Se denota por s
2
; V(X); V(Y); o
2
; etc.
La varianza se define como:
"La varianza es la media o promedio del cuadrado de las desviaciones de la variable respecto a su
media".
La expresin de la definicin, tambin se escribe:





Propiedades de la varianza:
Sean:
X : variables
k : constante
V( ): Operador varianza
a) V (X) > 0
b) V (k) = 0
c) V (x + k) = V(x)
d) V (kx) = K
2
V(X)
Si tenemos una muestra tamao n la dividimos en r sub muestras determinando en cada una de ellas sus
respectivas medias, entonces la media total se determina por la formula siguiente:

n
ni X X
n
ni S
X
n
i
t
r
i
T

= =

+ =
1
1
1
2
) (

Intravarianza + Intervarianza

Estadstica General 2011

30
Mg. Miguel Angel Macetas Hernndez


( ) s X V =
( ) 100
x
S
CV =
( )
1769 157
1 40
40
1030
4 32652
s
2
2
,
,
=

=
( )( )
% ,
,
,
68746446 48
75 25
100 537 12
CV = =
[L
i-1
Li) X
i
n
i
x
i
n
i

i
2
i
n x
0,2 7,2 3,7 3 11,1 41,07
7,2 14,2 10,7 5 53,5 572,45
14,2 21,2 17,7 8 141,6 2506,32
21,2 28,2 24,7 5 123,5 3050,45
28,2 35,2 31,7 10 317 10048,9
35,2 42,2 38,7 4 154,8 5990,76
42,2 49,2 45,7 5 228,5 10442,45
Total 40 1030 32652,4





4. Desviacin Estndar o Tpica (s)
La desviacin estndar o tpica, se define como la raz cuadrada de la varianza


5370221 12 1769 157 , , =
Es uno de los estadgrafos de dispersin de mayor uso, en si cual las unidades de la variable ya no
estn elevadas al cuadrado. La desviacin estndar, al igual que la varianza, es no negativa (s 0),
puesto que es la raz cuadrada positiva de la varianza. A mayor dispersin le corresponder una
mayor desviacin estndar.

NOTA: En general, los estadgrafos de dispersin se usa para comparar dos o ms distribuciones o
poblaciones. A mayor dispersin o heterogeneidad entre los valores o elementos de una
poblacin, le corresponde un valor mayor para el estadgrafo de dispersin.
5. Coeficiente de Variacin (CV)
Est definido por la expresin:



El valor se expresa en trminos porcentuales. Una regla emprica, cuando el CV < 33% los datos
no presentan dispersin en los datos recolectados los datos son ms homogneos





Estadstica General 2011

31
Mg. Miguel Angel Macetas Hernndez


Mo
Me
X
Mo
Me
X
Datos presentan dispersin
0%<CV<5%, Altamente representativa.
5%<CV<10%, Representativa de su serie.
10%<CV<15%, moderadamente representativa
15%<CV<30%, Bajo grado de representatividad.
CV>30%, No tiene ningn grado de representatividad

D. Estadgrafos de Deformacin
1. Asimetra.-Es el grado de deformacin de la curva representativa de una distribucin de frecuencias con
respecto a la vertical que pasa por la abscisa de la media aritmtica; se mide a travs del Coeficiente de
Asimetra.
1.1. Relacin Entre La Media, Mediana y Moda
La distribucin de frecuencias de un conjunto de datos puede ser simtrica o asimtrica.
1.2. Distribucin Simtrica
Una distribucin es simtrica cuando su grafica semeja una de las tres curvas:





Curva hipottica Normal Curva hipottica en U Curva hipottica Rectangular
Curva Unimodal Curva Bimodal Curva sin moda
Me = X = Mo X = Me X = Me

1.1.1. Distribucin Positivamente Asimtrica
Es una distribucin donde los valores extremos son observaciones mayores. La grafica es
semejante a la siguiente curva hipottica.










1.1.2. Distribucin Negativa Asimtrica
Es una distribucin donde los valores extremos son observaciones menores. La grafica presenta
una prolongacin hacia la izquierda, como la siguiente curva hipottica.





1.1.3. Relacin Emperica Entre Media, Mediana y Moda
Curva Positivamente Asimtrica (o Curva
con Sesgo Positivo).
Curva Unimodal
Mo < Me < X
Curva Negativa Asimtrica (o Curva con
Sesgo Negativo).
Curva Unimodal
Mo > Me > X
Me = X = Mo X = Me X = Me
Mo Mo
Estadstica General 2011

32
Mg. Miguel Angel Macetas Hernndez


Mo = 3 Me 2 X
Cuando la distribucin es casi simtrica, se puede utilizar la frmula de la moda emprica dad por:
Moda = 3(Mediana) 2(Media)



1.3. Importanciade la Asimetra.- El conocimiento de la asimetra es importante por el hecho de que la
teora estadstica se basa a menudo en el supuesto de una distribucin normal. Por lo tanto una medida
de asimetra de una distribucin es necesario para preservarnos de las consecuencias de esta suposicin
(La condicin necesaria de una distribucin normal es que sea simtrica).

1.4. Coeficientede Asimetra.
Consideramos varias frmulas para el clculo de la medida de asimetra:
Coeficiente de Asimetra en base a Momentos.

s
n
n
) x -
x
(
=
A
3
i
3
i
m
1
S


Primero y segundo coeficiente de asimetra de PEARSON
A.
S
Mo X
AS
1

= ; Denominado primer coeficiente de Parson.


B.
S
) Me X ( 3
AS
2

= ; Denominado segundo coeficiente de Pearson.


Coeficiente de Asimetra cuartlico o de ARTHUR BOWLEY

1 3
1 2 3
Q Q
Q Q 2 Q
AS

+
=
Decisin:

A
s
=0, entonces la distribucin es simtrica.
A
s
<0, entonces la distribucin es asimtrica (-)
A
s
>0, entonces la distribucin es asimtrica (+)

1.5. Kurtosis o Apuntamiento.-Es la mayor o menor altura de la curva representativa de una distribucin de
frecuencias en el punto o abscisa correspondiente a la media aritmtica.







KURTOSIS EN FUNCIN DE MOMENTOS:
media : x ;
M
M
=
s
n
n
) x -
x
(
= K
2
2
4
4
i
4
i
m
1



Decisin:
K=3, Entonces la distribucin posee una curva mesocrtica (Normal).
K<3, Entonces la distribucin posee una curva platicrtica.
K>3, Entonces la distribucin posee una curva leptocrtica.

KURTOSIS EN FUNCIN DE CUARTILES Y PERCENTILES.


D. Leptocrtica
D. Mesocrtica (Normal )
D. Platicrtica
Estadstica General 2011

33
Mg. Miguel Angel Macetas Hernndez


(
(
(
(


+ =

j
1 J
j 1 i r
n
N
100
rn
C L P
( )
( )
10 90
1 3
2 P P
Q Q
K

=
Dnde:
Los percentil P
90
y P
10
se calcula con la siguiente frmula:







Decisin:
K=0.263, la distribucin es
mesocrtica.
K<0.263, la distribucin es platicrtica.
K>0.263, la distribucin es leptocrtica.

Ejemplo. Calcular el grado de asimetra y kurtosis de la distribucin del nivel de glucosa de los 60 varones
adultos evaluados.Los clculos son organizados en la tabla, de modo que reemplazando datos
en frmula se tiene:

Distribucin del Nivel de Glucosa de 60 varones adultos

(Li-1 Li] xi n X
i
n
i
X
2
n
i

i
3
i
n ) X X (
i
4
i
n ) X X (
35 45 40 5
200 8000
-158773.1481 5027816.358
45 55 50 7
350 17500
-71199.0741 1542646.605
55 65 60 11
660 39600
-17467.5926 203788.5802
65 75 70 14
980 68600
-64.8148 108.0246914
75 85 80 8
640 51200
4629.6296 38580.24691
85 95 90 7
630 56700
43134.2593 790794.7531
95 105 100 4
400 40000
90981.4815 2577808.642
105 115 110 4
440 48400
225314.8148 8637067.901
Total 60 4300 330000 116555.556 18818611.111
Coeficiente Asimetra =
3
8
1
3
) (
o

n
n x
i i

=
3
) 076 . 19 ( * 60
56 . 116555
= 0.2799,
CoeficienteKurtosis=
4
8
1
4
*
) (
o

n
n x
i i

=
4
) 076 . 19 ( * 60
1111 . 18818611
= 2.3686
Por tanto se puede afirmar que la distribucin emprica es:
Aprox. Simtrica, puesto que AS = 0.28 0
Platicrtica, puesto que K = 2.37 < 3.
Entonces se puede concluir que dicha distribucin difiere ligeramente de la normal.

Lj-1=Limite inferior del Intervalo del Percentil
Cj=Amplitud del intervalo Percentilico
r =El nmero de Percentill r = 1,2,3,,99
n=Nmero total de observaciones o datos.
Nj=Es un inmediato superior a
100
jn

Nj-1=Es una Ni inmediata inferior a
100
jn

nj= s el nj que le corresponde al Intervalo

Estadstica General 2011

34
Mg. Miguel Angel Macetas Hernndez


Diagramas de cajn

El diagrama de cajn o cajagrama es una representacin grfica basada en medidas resistentes, como la
mediana, los cuartiles y la desviacin intercuartil.
Se construye dibujando una lnea horizontal que con una escala que representa el rango de las observaciones. Se
representa la mediana mediante un pequeo trazo vertical. A los lados se dibujan dos trazos iguales, que
representan los cuartiles. Dos trazos horizontales cierran el rectngulo, denominado cajn, que tiene los cuartiles
por lados, y contiene la mediana en el interior.

Recordamos que para la muestra 1, ingresos de 45 empleados de una firma, en miles de pesos, el cuartil 1 es Q1
= 150 M$, la mediana es M = 185 M$ y el cuartil 3 es Q3 = 290 M$. El cajn se muestra a continuacin.

Luego se calcula la desviacin intercuartil DIC = Q3 Q1 = 290 150 = 140
Se dibujan dos trazos verticales, denominadas rejas, en forma provisoria, a distancias r1 = Q1 1.5*DIC = 150
1.5*140 = 150 210 = -60y r2 = Q3 + 1.5*DIC = 290 + 1.5*140 = 290 + 210 = 500
Las observaciones que quedan dentro de estos dos lmites, se denominan observaciones interiores. La menor y la
mayor de las observaciones interiores se denominan adyacentes. En nuestro ejemplo, son los valores 50 y 500.

Se dibujan dos lneas horizontales hacia ambos lados del cajn, hasta las respectivas observaciones adyacentes.
Estas lneas se denominan bigotes. La figura siguiente representa el cajn con sus bigotes.



Finalmente, las observaciones que quedan fuera de las rejas se denominas observaciones exteriores, o extremas
(outliers, en ingls). Estas se representan individualmente, mediante puntos o asteriscos. En el ejemplo, hay un
valor extremo, que es el 510. El diagrama de cajn queda como en la siguiente figura:

Se aprecia la forma asimtrica del conjunto de datos, con una cola hacia la derecha. Veamos cmo son los
cajagramas correspondientes a las otras dos muestras.
Pesos de bultos transportados por un correo:

La mediana es 17, los cuartiles 1 y 3 son 14 y 20, respectivamente. La desviacin intercuartil es

20-14=6, las rejas son 14 - 1.5*6 = 5 y 20 + 1.5*6 = 29. Por lo tanto los valores adyacentes son 8 y 27. No hay
valores. El cajagrama es el siguiente, que muestra la forma simtrica de este conjuntode datos:


Estadstica General 2011

35
Mg. Miguel Angel Macetas Hernndez







Escolaridad de los habitantes de un condominio:

En este caso la mediana es 11, los cuartiles 1 y 3 son 9 y 12, respectivamente. La desviacin intercuartil es 3, las
rejas son 4.5 y 12.5. Por lo tanto los valores adyacentes son 7 y 14. Hay tres valores extremos en el lado izquierdo,
2,4 y 4. El cajagrama, entonces, es










Se ve claramente la asimetra con una cola larga hacia los valores pequeos.


1.5. Aplicaciones de las medidas en datos univariados

Ejemplo 1.Los siguientes datos constituyen las vidas tiles en horas. de una muestra aleatoria de 60
bombillas de luz de 100 watts.
807 811 620 660 817 732 747 823 844 907
660 753 1050 918 857 867 675 880 878 890
881 872 869 841 847 833 829 827 822 811
766 787 923 792 803 933 947 717 817 753
1056 1076 958 970 776 828 831 781 1088 1082
832 863 852 788 980 889 1030 897 755 891

a) Clasifique convenientemente con Anchos de Clase iguales ytrace el Polgono de Frecuencias Absolutas.
b) Unavez clasificadas; determine el porcentaje de bombillascuyas vidas tiles oscilan entre 700 y 1000 horas.
c) Encuentre los lmites que sub-clasifiquen las bombillas en tres categoras conreferencia a su duracin.
El 15 % ms durables en la categora A
El 15 % menos .durables en la categora C.
El resto en la categora B

Solucin
Clculos previos para elaborar la tabla
Recorrido (R) =1088 620 = 468
Elegimos el nmero de Intervalos (m) =
Tomamos m = 6 intervalos
Determinar la amplitud de los intervalos (C)


a) Clasifique convenientemente con Anchos de Clase iguales



Estadstica General 2011

36
Mg. Miguel Angel Macetas Hernndez


CUADRO N 01
DISTRIBUCIN DE DATOS CONSTITUYEN LAS VIDAS TILES EN HORAS. DE UNA MUESTRA
ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS.

Vida til en horas

[L
i-1
L
i
>
Marca de
clase
Nmero
de
Bombillas
Frecuencia
Acumulada
Simple
Frecuencia
Relativa
Frecuencia
Relativa
Acumulada
x
i
ni Ni h
i
H
i

[620 698> 659 4 4 0,0667 0,0667
[698 776> 737 7 11 0,1167 0,1833
[776 854> 815 23 34 0,3833 0,5667
[854 932> 893 15 49 0,2500 0,8167
[932 1010> 971 5 54 0,0833 0,9000
[1010 1088> 1049 6 60 0,1000 1,0000
Total 60

1,0000


El Polgono de Frecuencias Absolutas.
Para graficar el polgono de frecuencias se realiza algunos clculos

Vida til en horas

[L
i-1
L
i
>
Marca de
clase
Nmero de
Bombillas
x
i
ni

581 0
[620 698> 659 4
[698 776> 737 7
[776 854> 815 23
[854 932> 893 15
[932 1010> 971 5
[1010 1088> 1049 6

1127 0
Total 60


GRAFICO N 01

POLGONO DE FRECUENCIA DE LA VIDA TIL EN HORAS DE UNA MUESTRA ALEATORIA DE 60
BOMBILLAS DE LUZ DE 100 WATTS


b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan entre 700 y 1000
horas.

0
4
7
23
15
5
6
0 0
5
10
15
20
25
581 681 781 881 981 1081
N

m
e
r
o

d
e

b
o
m
b
i
l
l
a
s

Vida promedio en horas de bombillas de luz de 100 watts.
Estadstica General 2011

37
Mg. Miguel Angel Macetas Hernndez


Vida til en horas

[L
i-1
L
i
>
Nmero de
Bombillas
Frecuencia
Relativa
Frecuencia
Relativa
ni h
i
h
i
%
[620 698> 4 0,0667 6,667
[698 776> 7 0,1167 11,667
[776 854> 23 0,3833 38,333
[854 932> 15 0,2500 25,000
[932 1010> 5 0,0833 8,333
[1010 1088> 6 0,1000 10,000
Total 60 1,0000 100,000

Calculamos el nmero de observaciones pedido:
698 a 776 11,66667 78 11,6667


698 a 700 x 2 x

Para encontrar el valor 698 a 700 = 11,6666667 0,2991453 = 11,3675214

932 a 1010 8,3333 78 8,333


932 a 1000 x 68 x

Para encontrar el valor 700 y 1000 horas. = 11,368 + 38,333 + 25,000 + 7,265 = 81,966%

El 15 % ms durables en la categora A
Basta calcular el percentil 15 y el percentil 85

)
Ejemplo 2.En la siguiente distribucin de frecuencias relativas calcular:
a) Las desviacin cuartillita
b) Discutir el sesgo y la kurtosis

Tiempo 0 3 3 6 6 9 9 12 12 15 15 18
h
i
0,04 0,06 0,40 0,38 0,10 0,02
Solucin
Tiempo Xi h
i
H
i
x
i
h
i
x
i
2
h
i

0 3 1,5 0,04 0,04 0,06 0,09
3 6 4,5 0,06 0,10 0,27 1,215
6 9 7,5 0,40 0,50 3,00 22,5
9 12 10,5 0,38 0,88 3,99 41,895
12 15 13,5 0,10 0,98 1,35 18,225
15 18 16,5 0,02 1,00 0,33 5,445
Total

1

9 89,37

Directamente de la tabla: media aritmtica

= = 9
i i
h x x
Varianza ( ) 37 , 8 9 37 , 89
2
2
2 2
= = =

X h x S
i i

Desviacin estndar S = 2,89309523

Estadstica General 2011

38
Mg. Miguel Angel Macetas Hernndez


Medio
40%
Bajo
45%
Alto
15%
a) Las desviacin cuartillita

)
b) Discutir el sesgo y la kurtosis
(

) (



No podemos concluir que la distribucin sea simtrica. En efecto, como la media est a la derecha de la moda
la distribucin es sesgada a la derecha y usando el primer Coeficiente de Pearson tenemos:


Como Sk> 0 la distribucin es ligeramente sesgada a la derecha



Como es K>0.263, puede considerarse la distribucin que es Leptocrtica
Ejemplo 3.Alinvestigar el nivel socioeconmico en los valores: Bajo (B), Medio (M), Alto (A),
20 familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.
Construir la distribucin de frecuencias y trazar su grfica.
Nivel
socioeconmico
Frecuencia
Absoluta
Frecuencia
Relativa
Medio 8 40,0
Bajo 9 45,0
Alto 3 15,0
Total 20 100




8
9
3
0
2
4
6
8
10
Medio Bajo Alto
N

m
e
r
o

d
e

F
a
m
i
l
i
a
s

Nivel Socioecnomico
Estadstica General 2011

39
Mg. Miguel Angel Macetas Hernndez


Las notas del examen parcial de matemtica dieron la siguiente distribucin de frecuencias
a) Completar la distribucin de frecuencias
b) Graficar la ojiva de porcentajes
c) Qu porcentaje de las notas se encuentran aproximadamente en el intervalo: [8 , 14]
Intervalo
Marca de
Clase
Frecuencia
Relativa
Frecuencia
Relativa
Acumulada
[ , [ 0,15
[6 , [ 0,45
[ , [ 0,70
[ , [ 13,5
[ , [ 0,10


Estadstica General 2011

40
Mg. Miguel Angel Macetas Hernndez


II. ASPECTOS BSICOS DE PROBABILIDADES
1. Caractersticas
El objetivo general de la teora de probabilidades consiste en proporcionar un modelo matemtico
adecuado a la descripcin e interpretacin de cierta clase de fenmenos.
Es la teora de probabilidades la que permite vincular la muestra con la poblacin siempre que la muestra
responda al requisito fundamental de ser aleatoria.
Podemos decir que existen dos tipos de experimentos:
Determinsticos: aquellos que repetidos bajo las mismas condiciones dan igual resultado que es posi-
ble predecir, nos referimos por ejemplo los fenmenos fsicos o qumicos.
Aleatorios: cuando no se puede predecir su resultado, los resultados de repeticiones sucesivas va-
riarn en forma aleatoria o impredecible.
No obstante, es posible extraer ciertas regularidades de la repeticin de un experimento aleatorio. Estos
experimentos son los de inters para la estadstica.
Por ejemplo:
# Sea el experimento de arrojar una moneda tres veces y observar su resultado, (para cada
lanzamiento ser cara o cruz, no pudiendo predecirse el mismo); siendo sus resultados posibles: CCC,
CCX, ...... ., XXX.
# Sea el experimento aleatorio el de observar en una lnea de produccin que cierto producto
cumpla con las especificaciones; puede tratarse de una medida como longitud o peso, la cual puede
presentar diversos resultados.

El modo de abordar la probabilidad depende del inters que cada persona tenga en esta materia. El
matemtico puro prefiere por lo general tratar la probabilidad desde un punto de vista axiomtico. El
estadstico prctico prefiere considerarla como la proporcin de veces que se presenta un determinado
suceso si el experimento correspondiente se repitiera un gran nmero de veces.

Espacio MuestraAl estudiar un experimento aleatorio, queda claro que las condiciones para su realiza-
cin deben estar claramente especificadas, as como el tipo de resultado que se observar. En algunos
casos el experimento es o se considera dicotmico (xito o fracaso).

Veamos ejemplos de experimentos y su correspondiente conjunto de resultados posibles:
1. # Se arrojan dos monedas.
En este caso el conjunto de resultados posibles es
{CC, CX , XC, XX }

2. # Se arroja una moneda hasta que aparezca cara.
Luego, el conjunto de resultados posibles es
{C, XC, XXC, XXXC, XXXXC, ..., X..XC, .... }

3. # Se extrae un artculo de un lote y se observa si es defectuoso o no.
El conjunto de los resultados posibles es
{Defectuoso, Bueno}

4. # Se extrae una carta de un mazo.
Si observamos el valor, el conjunto de resultados posibles es
{ As, 2 , 3 , 4 , 5 , 6 , 7 , Sota , Caballo, Rey }

5. # Se arroja un dado:
a) Si observamos su cara superior, el conjunto de resultados posibles es
{1, 2, 3, 4, 5, 6}

b) Si slo nos interesa que salga 5, estamos considerando dos resultados del experimento (sale 5 o
no). Definiendo los sucesos :
E = { 5 } xito
Estadstica General 2011

41
Mg. Miguel Angel Macetas Hernndez


F = { 1, 2, 3, 4, 6 } fracaso
El conjunto de los resultados posibles se convierte en { E, F }

En el primer caso el conjunto de resultados posibles es finito, en el segundo es infinito numerable, en el
tercero se trata de un experimento dicotmico ya que slo admite dos resultados posibles, en el cuarto
pueden considerarse cuatro resultados posibles (a) o bien diez resultados posibles (b), (como tambin
puede considerarse que cada carta es un resultado posible y en este caso son 40 resultados posibles), y el
ltimo caso se trata de un experimento que admite mltiples resultados en el inciso (a) y reducido a slo
dos resultados posibles en el inciso (b), o sea, a un experimento dicotmico.

Definiciones:

Espacio Muestra: Es el conjunto de todos los resultados posibles de un experimento aleatorio, y se lo
simboliza con O
Suceso Elemental: es cada uno de los resultados posibles del experimento aleatorio, es decir, es cada
elemento del espacio muestra, y se lo simboliza con e.
Suceso aleatorio: Es un subconjunto del Espacio Muestra O, o sea, es un conjunto de resultados
posibles del experimento.

Ejemplo: Sea el experimento arrojar dos dados; el conjunto de resultados posibles es:
O = {(x,y)/ x = 1, 2 .. 6, y = 1, 2 .. 6 }
Cada par ordenado e = (x,y) es un elemento del espacio muestra, por ejemplo:
e=(3,5) cO, luego e = (3,5) es un suceso elemental del experimento.
Cualquier conjunto de sucesos elementales es un suceso aleatorio. Por ejemplo, sea A el suceso de
obtener una suma de 5 puntos como resultado del experimento. Entonces
A = {(x,y) cO / x + y = 5 }
A = {(1,4), (2,3), (3,2), (4,1)}
A _O, por lo tanto A es un subconjunto de O.



Las aplicaciones de probabilidad conciernen a menudo no a un suceso aislado sino a combinaciones de los
mismos, que dan otro suceso, para ello utilizamos operaciones con conjuntos.

A B es el suceso que ocurre si y slo si A , B o ambos ocurren.
A B es el suceso que ocurre si y slo si A y B ocurren simultneamente.
A es el suceso que ocurre si y slo si no ocurre A .

Ejemplo: Sea el experimento de arrojar un dado y observar el resultado:
O = {1, 2, 3, 4, 5, 6}

Estadstica General 2011

42
Mg. Miguel Angel Macetas Hernndez


Sean los sucesos :
A : obtener un nmero par A = {2, 4, 6}
B : obtener un nmero impar B = {1, 3, 5}
C : obtener un nmero primo C = {2, 3, 5}
AB = O
AB = C
AC = {2}
A = {1, 3, 5} = B

Los espacios muestra que poseen un nmero finito o infinito numerable de elementos se denominan
espacios muestra discretos. Los espacios muestra que poseen un nmero infinito no numerable de
elementos, se denominan espacios muestra continuos ; ejemplo de stos son los intervalos en R
1
,R
2
,.,
R
n
.
El conjunto vaco C es un subconjunto de O, luego es un suceso, el suceso imposible
Como O es tambin un subconjunto de O, ser un suceso, el suceso seguro o cierto.

Siendo nuestro objetivo asignar una medida, que llamaremos probabilidad, a los subconjuntos de un
espacio muestra, debemos notar que en general no es posible hacerlo para todo subconjunto de O. Esta
asignacin debe hacerse mientras que verifique ciertas propiedades necesarias.
En este sentido habr que considerar ciertas familias de subconjuntos del espacio muestra.

2. Probabilidad de un evento, clculo de probabilidades. Axiomas y teoremas de probabilidades
2.1. Definicin clsica de probabilidad.

En todos los juegos de azar (dados, ruleta, cartas, etc.) el resultado obtenido es uno entre un nmero
posible de ellos. Dicho resultado es imposible de predecir, lo cual caracteriza el azar del juego.

Si el instrumento utilizado (sea ruleta, dado o baraja) es perfecto y el juego se realiza correctamente, los
distintos resultados posibles de obtener sern igualmente favorables, y el espacio muestra tendr la
caracterstica de ser equiprobable. En este caso, indicando con #O (cardinal de O) a la cantidad de
resultados posibles del experimento, cada resultado posible tiene una probabilidad de 1/#O de ocurrir.
Es decir, si eeO y O es un espacio equiprobable, entonces:
P( )
#
e =
1
O


Sea A un subconjunto de O , A _O , simbolizando con #A al cardinal de A que indica el nmero de
casos favorables al suceso A, calculamos la probabilidad de dicho suceso (siempre que O sea
equiprobable) como el cociente:

P A
A nmero de resultados f avorables
nmero de resultados posibles
( )
#
#
= =
O



Definicin:Dado un espacio muestra equiprobable y un suceso A, A _O , la probabilidad de ocurrencia
de ese suceso es igual al cociente entre el nmero de resultados favorables al suceso A y el nmero total
de resultados posibles del experimento

P A
A
( )
#
#
=
O

2.2. Axiomas de probabilidades:

Ax. 1: 0 P(A) 1
Estadstica General 2011

43
Mg. Miguel Angel Macetas Hernndez


Como 0 #A #O 1 ) ( 0
#
#
#
#
#
0
s s
O
O
s
O
s
O
A P
A


Ax. 2: P( ) C = 0
Como #C = 0
#
# #
( )
C
= C =
O O
0
0 P

Ax. 3: P(O ) = 1
Ya que P(O ) = 1
#
#
=
O
O


Ax. 4: P(AB) = P(A) + P(B), si AB =C
Si AB =C, entonces #(AB) = #A + #B. Luego :

P A B
A B A B A B
P A P B ( )
#( )
#
# #
#
#
#
#
#
( ) ( ) =

=
+
= + = +
O O O O


Ax. 5: P(AB) = P(A) + P(B) - P(AB), si AB =C
Si AB =C, entonces #(AB) = #A + #B - #(AB).

= =
+
= +

= +
P A B
AUB A B A B A B A B
P A B P A P B P A B
( )
#( )
#
# # #( )
#
#
#
#
#
#( )
#
( ) ( ) ( ) ( )
O O O O O


Ax. 6: ) ( 1 ) ( A P A P =
Como #( A ) = #O - #A, entonces :
P A
A A A
P A ( )
#( )
#
# #
#
#
#
#
#
( ) = =

= =
O
O
O
O
O O
1



Estadstica General 2011

44
Mg. Miguel Angel Macetas Hernndez


2.3. Probabilidad de La Unin de Sucesos
Decimos que dos sucesos son excluyentes cuando no tienen ningn elemento en comn, es decir, A y B
son excluyentes si AB =C. Si, por el contrario, AB =C entonces A y B son no excluyentes.
Ya vimos que para dos sucesos excluyentes (AB =C) la probabilidad de la unin (AB) es igual a la suma
de las probabilidades de los sucesos A y B.
P(AB) = P(A) + P(B)
Anlogamente, para tres sucesos excluyentes (AB = C y AC=C y BC = C) tenemos que
P(ABC) = P(A) + P(B) + P(C)
Tambin vimos que para dos sucesos no excluyentes:
P(AB) = P(A) + P(B) - P(AB) Regla de la Suma

2.4. ProbabilidadCondicional
Analizaremos a continuacin las probabilidades de sucesos cuando se dispone de alguna informacin.
Consideremos el segundo ejemplo analizado, en el cual el experimento consiste en arrojar un dado y
observar su resultado, y consideremos tambin los sucesos A y C definidos en el mismo. Supongamos que
nos informan que el resultado obtenido es un nmero primo (es decir, ocurri C ), y nos interesa el hecho
de obtener un nmero par ( o sea, queremos saber la probabilidad de ocurrencia de A ). Como sabemos
que ocurri C :"el resultado es un nmero primo", el espacio muestra se reduce a O
c
= {2, 3, 5}, es decir,
el nuevo espacio muestra consiste en tres resultados posibles de los cuales slo uno es favorable al su-
ceso A :"el resultado es un nmero par". Por lo tanto, teniendo en cuenta la informacin disponible, la
probabilidad de obtener un nmero par es uno entre tres resultados posibles. Es decir:
{ }
{ }
p = =
1
3
2
2 3 5
#
# , ,

Decimos que sta es la probabilidad del suceso A condicionada a la ocurrencia del suceso C, y la
simbolizamos P ( A / C ). Como es posible observar, el suceso "xito" result igual al suceso AC y el
espacio muestra se restringe al suceso C. Considerando un espacio muestra equiprobable:
=

P A C
A C
C
( / )
#( )
#

Dividiendo numerador y denominador por #O, resulta:
P A C
A C
C
P A C
P C
P A C
P A C
P C
( / )
#( )
#
#
#
( )
( )
( / )
( )
( )
=

=

=

O
O


Definicin:
Sean A y B dos sucesos ( A _O, B _O), tales que P(B) > 0 ( o sea, B=C). La probabilidad de A dada la
ocurrencia de B es :
P A B
P A B
P B
( / )
( )
( )
=


Dada esta definicin, se deduce que la probabilidad del suceso AB se calcula como el producto de la
probabilidad de uno de los sucesos por la probabilidad del otro suceso condicionada al primero.
Es decir
P A B P B P A B ( ) ( ) ( / ) = conocida como Regla del Producto
Anlogamente, P A B P A P B A ( ) ( ) ( / ) =
ya que P B A
P A B
P A
( / )
( )
( )
=



2.5. Sucesos Independientes
Si la ocurrencia de un suceso A no afecta a la probabilidad de ocurrencia de algn otro suceso B, decimos
que ambos sucesos son independientes, puesto que el suceso B "no depende" de la ocurrencia del suceso
Estadstica General 2011

45
Mg. Miguel Angel Macetas Hernndez


A. Por lo tanto en este caso, tener alguna informacin sobre la ocurrencia de A no sera de ninguna
utilidad ya que la probabilidad de B no vara. Esto es, si B no depende de A : P(B/A) = P(B)
Luego :
P( AB ) = P(A)P(B/A) = P(A)P(B)

Definicin:
Si A y B son dos sucesos independientes, entonces la probabilidad conjunta de ambos es igual al producto
de las probabilidades de esos dos sucesos, y viceversa.
A y B independientes P(AB) = P(A)P(B)

Ejemplo:
Sea el experimento extraer una carta de un mazo de naipes espaoles; y sean los eventos (o sucesos):
A : la carta obtenida es un naipe de "oro"
B : la carta obtenida es un "as"
Por lo tanto, el evento AB es "la carta obtenida es el as de oro".
Las respectivas probabilidades de estos sucesos son :
P A
P A B
P B
( )
( )
( )
= =
=
= =
10
40
1
4
1
40
4
40
1
10

Si nos informan que la carta obtenida es un "as", altera esto la probabilidad de que sea de "oro" ?
P A B
A B
B
P A ( / )
#( )
#
( ) =

= =
1
4

Podemos comprobar que P(A/B) = P(A), lo cual indica que A no depende de B.
Tambin podemos comprobar que el producto de las probabilidades de A y B, resulta igual a la probabilidad
conjunta AB, ya que:
P A P B P A B ( ) ( ) ( ) = = =
1
4
1
10
1
40

lo cual indica que A y B son sucesos independientes.
Probabilidad condicional, eventos independientes, regla de la multiplicacin, regla de la

2.6. Regla de Probabilidad Total
Sea B
1
, B
2
, ....., B
k
una particin de O, luego los B
i
son subconjuntos no vacos de O, adems son exhaustivos y
excluyentes. Esto significa que los sucesos B
1
,..., B
k
cumplen con:
1.- B
i
cO, B
i
=C i = 1,....,k
2.- B
i
B
j
= C, i = j
3.- B
i
i
k
=
=
O
1


Sea A cO, A=C. Obviamente, A tiene elementos en comn con alguno de los B
i.

Es decir que: - s s = C i i k tal que A B
i
, , 1
Podemos expresar este suceso A como la unin de las intersecciones que tiene con los sucesos B:
A = B
1
AB
2
A ... B
k
A = ( ) B A
i
i
k
=

1


Como los sucesos B
i
son excluyentes, entonces tambin lo sern los sucesos B
i
A, es decir:
Estadstica General 2011

46
Mg. Miguel Angel Macetas Hernndez


( )
( ) | | ( )
( )
) / ( ) ( ) (
) / ( ) ( ........ ) / ( ) ( / ( ) ) (
) ( ........ ) ( ) ( ........ ) ( ) (
, ) ( ,
1
2 2 1 1
2 1 2 1
i
k
i
i
k k
k k
j i j i
B A P B P A P
B A P B P B A P B P B A P B P A P
A B A B P A B P A B A B A B P A P
j i A B A B j i B B

=
=
+ + + =
+ + + = =
= C = = C =


2.7. TEOREMA DE BAYES
Sea B
1
, B
2
, ....., B
k
una particin de O, luego los B
i
son subconjuntos no vacos de O, adems son exhaustivos y
excluyentes. Esto significa que los sucesos B
1
,..., B
k
cumplen con :
1.- B
i
cO, B
i
=C i = 1,....,k
2.- B
i
B
j
= C, i = j
3.- B
i
i
k
=
=
O
1



Sea A cO, A=C. Obviamente, A tiene elementos en comn con alguno de los Bi.
Es decir que: - s s = C i i k tal que A B
i
, , 1
Supongamos que son conocidas las probabilidades de cada suceso B
i
, como tambin las probabilidades del
suceso A condicionado a la ocurrencia de cada suceso B
i
.
Por lo tanto son conocidas las probabilidades: P(B
i
)
P(A/B
i
) para todo i = 1 .. k

Como ya hemos visto, podemos expresar este suceso A como la unin de las intersecciones que tiene con los
sucesos B:
A = B
1
AB
2
A ... B
k
A = ( ) B A
i
i
k
=

1



y a su probabilidad : P A P B P A B
i i
i
k
( ) ( ). ( / ) =
=

1


Supongamos que, una vez ocurrido el suceso A , nos interesa saber la probabilidad de que su causa haya sido
alguno de los B
j
. Es decir, queremos averiguar P( B
j
/A) .

P B A
P B A
P A
P B P A B
P B P A B
j
j j j
i i
i
k
( / )
( )
( )
( ). ( / )
( ). ( / )
=

=
=

1


Frmula conocida con el nombre de FRMULA DE BAYES .
Las probabilidades conocidas P(B
i
) se llaman probabilidades a priori y las probabilidades calculadas P(B
i
/A)
se llaman probabilidades a posteriori .

Estadstica General 2011

47
Mg. Miguel Angel Macetas Hernndez


III. VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES DE PROBABILIDAD
1. Variables Aleatorias Unidimensionales
Introduccin
El objeto de la teora de probabilidad es proporcionar un modelo matemtico adecuado a la descripcin e
interpretacin de cierta clase de fenmenos aleatorios. Vemos como se idealiza el estudio experimental
de las distribuciones de frecuencia relativas para variables aleatorias discretas y continuas; y sus
distribuciones acumuladas a travs de un modelo terico.
Se busca definir una funcin analtica que d el comportamiento matemtico de esa variable aleatoria
real; sujeta a los axiomas de probabilidad.
Concepto de Aleatoriedad
La aleatoriedad la produce un proceso o experimento aleatorio en s mismo, por eso hablamos de
experimento aleatorio. Una muestra aleatoria es el resultado de un experimento aleatorio. Realizado el
experimento, definido el O, calculamos la probabilidad de los sucesos. En la teora de probabilidad no
interesa slo la probabilidad de un suceso determinado sino el comportamiento general de todos los
sucesos posibles que resultan del experimento y conforman el O. Es decir que interesa la distribucin de
la masa de probabilidad. Esto nos conduce a la definicin de variable aleatoria y al estudio de sus
funciones de probabilidad.

VARIABLE ALEATORIA
Al realizar un experimento aleatorio relacionado con cada punto muestra de O puede haber una serie de
caractersticas que interesan ms que la descripcin del punto muestra en s. A cada experimento le
asociamos un espacio muestra O cuyos elementos e pueden o no ser un nmero real. En una clase muy
general de problemas interesa asignar un nmero real x a cada elementos e pertenecientes aO.
Definicin
Sea un experimento aleatorio E; y O el espacio muestra asociado a l. Una funcin X que asigna a cada
uno de los elementos eeO un nmero real x = X(e), se llama variable aleatoria.
Observacin: en algunos casos e es ya la caracterstica numrica que queremos estudiar X(e) = e es la
funcin identidad.
En general tenemos:
O: espacio muestra del experimento E.
- R
x
: valores posibles de X, llamado recorrido o campo de variacin de la variable aleatoria.

Ejemplos de variables aleatorias:

a.- Sea el experimento E : arrojar dos dados
O = { (1,1) ; (1,2) ; (1,3) ;..................(6,6)}

X : suma de los puntos de los dos dados ;
R
x
= { 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12 }

Y : diferencia entre los puntos de los dados; tomada en valor
absoluto ;

R
y
= { 0, 1, 2, 3, 4, 5 }





O
C(e)
Y( ) e

R
x
R
y
Estadstica General 2011

48
Mg. Miguel Angel Macetas Hernndez


b.- Sea el experimento E : arrojar dos monedas
O = { (c,c) ; (c,x) ; (x,c) ; (x,x) }

Interesa la cantidad de caras;
R
x
= { 0, 1, 2 }
La variable aleatoria X determina una relacin de equivalencia entre O y R
x
, existe un suceso en O
equivalente a cada suceso definido en R
x
.
Dado un suceso B _R
x
, existe A _O , tal que A es equivalente con B, es decir :para todo x eR
x
, existe
eeO tal que X(e) = x .
Ejemplo:
Consideremos el experimento E de arrojar dos monedas
O = { (c,c) ; (c,x) ; (x,c); (x,x) }

Sea el suceso A = se obtiene una cara A = { (c,x) ; (x,c) }
P(A) = 1/4 + 1/4 = 1/2
R
x
= {0 , 1 , 2 } B = { 1 } P(B) = 1/2

Variable aleatoria discreta
Si el nmero de valores posibles de la variable X es finito o infinito numerable, sta ser una variable
discreta. Entonces R
x
= { x
1
, x
2
, x
3
,...,.x
n
} R
x
= { x
1
, x
2
, x
3
,....... }
Variable aleatoria continua
Si el recorrido de la variable X es un intervalo real cuyos extremos pueden ser - y + ; sta ser
una variable aleatoria continua. Entonces R
x
= ( a , b ) R
x
= (- , + ) R
x
= ( a , + ) R
x
= ( - , b )
Tanto para variables aleatorias discretas o continuas podemos asociar valores de probabilidad.
P( X = x
i
) = P( suceso : X toma el valor x
i
)
P( c < X < d ) = P( suceso : X toma cualquier valor en el intervalo)
P( X sx
o
) = P( suceso : X toma valores menores o iguales que x
o
)

Funcin de Probabilidad Discreta o de Cuanta
Si X es una variable aleatoria discreta , a cada valor posible x
i
le asociamos un nmero p(x) = P( X
= x
i
) llamado probabilidad de x
i
. Los p( x
i
) con i = 1, 2, 3, ....,n. deben satisfacer las siguientes condiciones:
a.- p(x
i
) > 0 i = 1..n
b.- Ep(x
i
) = 1

Definicin
Llamamos funcin de probabilidad discreta o funcin de cuanta o funcin de probabilidad puntual
correspondiente a la variable aleatoria X : p(x)] ; donde las probabilidades p(x)= P(X= x) verifican :
a.- p(x) > 0 x e R

b.- Ep(x) = 1

Esta distribucin se representa a travs de un grfico de bastones:

0 1 2 x
p(x)
n



R
x
Estadstica General 2011

49
Mg. Miguel Angel Macetas Hernndez


Interpretacin fsica:
Si consideramos al eje real como una barra; podemos suponer que por sobre cada punto de abscisa x hay
aplicada una masa puntual P[ X = x ] = p(x ). Adems la masa total de probabilidad es igual a uno.
Observaciones:
- Supngase que la variable discreta puede tomar un nmero finito de valores x
1
, x
2
, x
3
,...., x
n
; si cada
resultado es igualmente probable p(x
1
) = p(x
2
)=.....= p(x
n
)= 1/n .
- Si X toma un nmero infinito no numerable es imposible que todos los resultados seanequiprobables, pues
no satisface la condicin de cierre; E p(x) = 1

Ejemplo:
Sea E : un jugador arroja 3 monedas; gana $2 por cada cara que aparece y pierde $2 por cada cruz.
O = { (ccc); (ccx); (cxx); (xxx); (xcc); (xxc); (cxc); (xcx) }
Al jugador le interesa la ganancia o prdida que el punto muestra le representa.. La variable aleatoria se
define:
X : OR
x

X= ganancia del jugador. P(e)= 1/8
P(ganar 6) = P(x=6) = P(e = ccc) = 1/8
P(ganar 2) = P(x=2) = P ( ee { cxc , xcc , ccx }) = 3/8

Funcin De Probabilidad Contina - Funcin De Densidad
Definicin
Dada una variable aleatoria contina X; se llama funcin de densidad de probabilidad de X a f(x) si existe tal
que satisfagan las siguientes condiciones:
a.- f(x) > 0 para todo x

b.- f x dx
R
( ). } =1

Nota: f(x) no indica probabilidad. Slo indica cmo se distribuye la masa de probabilidad dentro del recorrido
de la variable. Geomtricamente, P(a < X < b) = 1 es el rea bajo la curva f(x).

a b x
f(x)
f(x) = 0 f(x) = 0

Distribucin De Probabilidad Acumulada
A las variables aleatorias discretas le asociamos una funcin de cuanta y a las continuas una funcin de
densidad. Ambas variables tienen asociadas una funcin de probabilidad acumulada. Para todo nmero real x
del recorrido R
x
quedan definidos los sucesos { X s x } para todo x perteneciente a R . Si calculamos P{ X s x }
obtenemos una distribucin de probabilidad acumulada. Esta distribucin se simboliza F(x).
Definicin
Sea X una variable aleatoria discreta, definimos F(x) como funcin de distribucin acumulada de la variable
aleatoria X a :F(x ) = P( X sx ). Si X es una variable aleatoria discreta la grfica es una funcin escalonada con
tramos continuos y un nmero finito o infinito numerable de saltos correspondiente a los valores de X = x
1
,x
2

,....x
n

P X x p x
k i
i
k
( ) ( ) s =
=

1

Estadstica General 2011

50
Mg. Miguel Angel Macetas Hernndez


0 1 2 n
1
F(x)
F(x) =1
F(x) = 0
x

Si X es una variable aleatoria continua su funcin de distribucin acumulada es el valor del rea bajo la curva
f(x) a la izquierda de x.
F x P X x f s ds
x
( ) ( ) ( ) = s =

}
X
F(x)

Propiedades de F(x)
1.- F(x) > 0 , x e R ( no negatividad )
2.- x
1
<x
2
F(x
1
) s F(x
2
) ( no decreciente )
3.- 0 s F(x) s 1
4.- Si F(x) es la funcin de distribucin de una variable aleatoria continua, entonces
c
c
F x
x
f x
( )
( ) =
x donde
F(x) es diferenciable, siendo f(x) la funcin de densidad de la variable.
5.- x1<x2 F(x2 ) - F(x1 ) = P( x1< x sx2 )

Esperanza Matemtica
Definicin
El valor esperado o esperanza matemtica de una variable aleatoria X es un promedio ponderado de los
valores que puede asumir X con probabilidades para los valores de X como pesos; es decir es un promedio
ponderado; es representado por E(X) o .
E X x p x
i i
i
n
( ) . ( ) =
=

1
caso discreto


}
= dx ). x ( f . x ) X ( E caso continuo
Propiedades de la esperanza matemtica:
1.- E( k )= k , siendo k una constante
2.- E( X + k ) = E( X) + k
3.- E( k. X ) = k E(X)
4.- E( XY ) = E(X) E(Y)
5.- E( X . Y ) = E(X) . E(Y) si las variables X e Y son independientes.

Variancia
Definicin
Sea X una variable aleatoria con media E(X)= ; la variancia de X representada por V(X) o o
2
, es la media de
los cuadrados de los desvos de X respecto a su esperanza. Simblicamente,
Estadstica General 2011

51
Mg. Miguel Angel Macetas Hernndez



V(X) = E[(X - )
2
]

V(X) =
}

x
R
dx x f x ) ( ) (
2
Caso continuo
V(X) =

e

x
R x
x p x ) ( ) (
2
Caso discreto

Propiedades de la variancia.

1.- V( X ) > 0
2.- V( k ) = 0 k constante
3.- V( k.X ) = k
2
.V(X)
4.- V( k + X ) = V(X)
5.- V( X Y ) = V(X) + V(Y) si las variables X e Y son independientes.
6.- V( X Y ) = V(X) + V(Y) 2.Cov (X,Y), si X e Y no son independientes,donde Cov(X,Y) = E |(X -
x
).(Y -
y
)|

TEOREMA DE TCHEBYCHEFF
Sin conocer la distribucin de la variable, pero conociendo su media = E(X) y su variancia o
2
= V(X), puede
obtenerse informacin sobre la probabilidad de que la variable tome valores dentro (o fuera) de un intervalo
centrado en la media.
Enunciado de la desigualdad de Tchebycheff:
Sea X una variable aleatoria con E(X) = y V(X) = o
2
conocidas, y sea k un nmero positivo arbitrario.
Entonces, la probabilidad de que la variable satisfaga la desigualdad X k > o . es menor que
1
2
k
, o
sea : ( ) P X k
k
> < o .
1
2

Este teorema da una cota de probabilidad. Tambin puede enunciarse como:
( ) P X k
k
< > o . 1
1
2

La verificacin es trivial para 0 sks 1. Por lo tanto, esta desigualdad tiene sentido para valores de k>1.

Demostracin (para variable continua)
}
+

= dx x f x X V ) ( . ) ( ) (
2
} } }
+
o +
o +
o
o

+ + =
k
k
k
k
dx x f x dx x f x dx x f x ) ( ) ( ) ( ) ( ) ( ) (
2 2 2

} }
+
o +
o

+ >
k
k
dx x f x dx x f x X V ) ( . ) ( ) ( . ) ( ) (
2 2


Como
2 2 2
) ( . o > o > k x k X , resulta que :

Estadstica General 2011

52
Mg. Miguel Angel Macetas Hernndez


} } }
o

o

o

o = o >
k k k
dx x f k dx x f k dx x f x ) ( ) ( . ) ( . ) (
2 2 2 2
-
2
} } }
+
o +
+
o +
+
o +
o = o >
k k k
dx x f k dx x f k dx x f x ) ( ) ( . ) ( . ) ( y
2 2 2 2 2


|
|
.
|

\
|
+ o > +
} } } }
+
o +
o

+
o +
o
k
k
k
k
dx x f dx x f k dx x f x dx x f x ) ( ) ( ) ( . ) ( ) ( . ) (
2 2 2 2

|
|
.
|

\
|
+ o >
} }
+
o +
o
k
k
dx x f dx x f k ) ( ) ( V(X)
2 2
= ( ) ) ( ) (
2 2
o + > + o s o k x P k x P k

( ) o > o = o > v o s o > o ) (
2 2 2 2 2
k x P k k x k x P k ( ) ) ( 1
2
o > > k x P k
2
1
) ( : donde de
k
k x P s o >

Estadstica General 2011

53
Mg. Miguel Angel Macetas Hernndez


MODELOS PROBABILSTICOS MS COMUNES
El modelo de probabilidad es una expresin matemtica que resulta de un cmulo de supuestos. el modelo describe el
comportamiento de una variable aleatoria si el experiment se repite bajo ciertas condiciones inciales, y por lo tanto
ayuda a predecir resultados de futuras repeticiones.
MODELOS DISCRETOS

1.- Modelo Bipuntual o de Bernoulli

Se aplica a una variable que slo puede asumir dos valores: 0 y 1 .
Consideremos un experimento que puede presentar slo dos resultados, que podramos llamar xito y Fracaso, y una
variable a la cual le asignaremos valores 0 y 1 segn resulte xito o Fracaso respectivamente.
Es decir O = { E , F }
Entonces, definimos la variable aleatoria X como presencia o ausencia de cierta caracterstica. Es decir :
e = F X(e) = X(F) = 0 ausencia de la caracterstica
e = E X(e) = X(E) = 1 presencia de la caracterstica
Sea p la probabilidad conocida de que se presente la caracterstica (es decir, la proporcin poblacional).
= = =
= = = = =
p P E P X p
q p P F P X q p
( ) ( )
( ) ( )
1
1 0 1



La distribucin de probabilidad bipuntual se expresa y grafica de la siguiente manera:

=
=

x otro
x para q p
x p
x x
0
1 , 0
) (
1


El nico parmetro de esta distribucin es p = P(E), simblicamente
escribimos X ~ B
i
(p) , y leemos X se distribuye Bernoulli con
parmetro "p" .

La funcin de distribucin acumulada F(x) = P( X sx) se expresa y grfica de la siguiente forma:

>
=
<
=
=

1 1
1 , 0
0 0
) (
0
1
x si
x si q p
x si
x F
x
k
k k


Las caractersticas de posicin y dispersin son su esperanza y variancia :

pq X V pq q p pq p q q p p p q p x p p x X V
p X E p p q x p x X E
x
x
= = + = + = + = =
= = + = =

=
=
) ( ) ( ) 1 ( ) 0 ( ) ( ) ( ) (
) ( . 1 . 0 ) ( ) (
2 2 2 2
1
0
2
1
0

2.-Modelo Binomial

Consideremos una serie de pruebas Bernoulli repetidas en forma independiente, donde slo interesa la cantidad de veces
que ocurre xito. Por lo tanto, el experimento debe cumplir con las siguientes tres condiciones:
1. Debe haber un nmero fijo de pruebas repetidas e independientes.
2. Cada prueba debe ser dicotmica, es decir, debe resultar en xito o fracaso .
3. La probabilidad de xito debe ser conocida y constante para todas las pruebas, P(E)=p.
Simbolizamos con n a la cantidad de veces que se repite el experimento. La variable la simbolizamos con X y se define
como X : cantidad de xitos ocurridos en las n repeticiones del experimento .
e X
i
p(x
i
)
F 0 q
E 1 p

Estadstica General 2011

54
Mg. Miguel Angel Macetas Hernndez


Simbolizando con R
x
al recorrido (o campo de variacin) de la variable, tenemos que:
R
x
= { 0 , 1 , 2 , ... , n }
Supongamos una serie de n repeticiones de pruebas Bernoulli, en la que los xitos y fracasosresultaron :
EE EEEFF FFFFF
k veces n k veces
.... ....
( )


La probabilidad de que el resultado de las n repeticiones sea esta secuencia es :



veces k n veces k
veces k n veces k
F P F P F P E P E P E P FFFFF FF EEE EE P
) (
) (
) ( )....... ( ) ( ) ( )...... ( ) ( ) .... .... (

=

donde P(E) = p y P(F) = q

Esta secuencia que hemos considerado es una de aquellas en las que aparece k veces xito. Pero no estamos interesados
en una secuencia particular de xitos y fracasos, sino en la cantidad de xitos, no importando el orden. La probabilidad de
cualquier secuencia de n repeticiones que contenga kxitos tiene la misma probabilidad de acontecer que la que hemos
presentado. La probabilidad de que ocurran exactamente k xitos (y el resto fracasos), es igual a la suma de las probabili-
dades de las distintas secuencias que son posibles de obtener permutando los n resultados de las pruebas Bernoulli
(siempre manteniendo fija la cantidad de xitos X=k).
La cantidad de secuencias diferentes est dado por el nmero de permutaciones de n elementos cuando entre ellos hay
k semejantes entre s, y los restantes n-k tambin son semejantes entre s. Luego, existen
|
|
.
|

\
|
k
n
secuencias diferentes
con k xitos, todas ellas con la misma probabilidad de ocurrir. Por lo tanto, la probabilidad de obtener k xitos (en
cualquier orden) es igual a la probabilidad de una secuencia en particular multiplicada por este nmero combinatorio.
As :
P X k
n
k
p q
k n k
( ) = =
|
\

|
.
|



La funcin de cuanta de la variable binomial se expresa y se grafica de la siguiente forma :


=
|
|
.
|

\
|
=

x otro
n x si q p
x
n
x p
x n x
0
, ..... , 1 , 0
) (



y la funcin de distribucin acumulada se expresa y se
grafica de la siguiente forma :


>
=
|
|
.
|

\
|
<
=

=

n x si
n x si q p
k
n
x si
x F
x
k
k n k
1
,....., 1 , 0
0 0
) (
0



Los parmetros de esta distribucin son n y p , y simblicamente escribimos
X ~ B(n,p) y leemos X se distribuye binomial con parmetros "n" y "p".



Estadstica General 2011

55
Mg. Miguel Angel Macetas Hernndez


La esperanza y la variancia son :
npq X V
np X E
=
=
) (
) (


Otra forma de demostrarlo es considerar la variable X = nmero de xitos en las n repeticiones como la suma de n
variables, o sea , X = X
1
+ X
2
+ ... + X
n
, donde X
i
es la variable que indica el nmero de xitos obtenidos en la i-sima
repeticin, y slo puede asumir valor 0 o 1 , con P( X
i
= 1 ) = p y P( X
i
= 0 ) = q , i =1 .. n . Luego todas ellas son
variables Bernoulli independientes entre s, con esperanza E( X
i
) = p y variancia V( X
i
) = p.q .
( )
|
.
|

\
|
=
|
.
|

\
|
= =

= = =
n
i
i
n
i
i
n
i
i
X V X V y X E X E X X
1 1 1
) ( : tanto lo por ,

por propiedad de la esperanza : ( )

= =
= = =
n
i
n
i
i
np p X E X E
1 1
) (
por propiedad de variancia para variables independientes: ( )

= =
= = =
n
i
n
i
i
npq pq X V X V
1 1
) (
3 . Modelo Hipergeomtrico
Consideremos una poblacin finita en la cual se distinguen dos clases de elementos. Supongamos que de
esta poblacin se extrae (sin reemplazo) una cantidad fija de elementos, e interesa el nmero de
elementos pertenecientes a una de esas clases. Por lo tanto, el experimento debe cumplir con las
siguientes dos condiciones:
a) Hay un nmero fijo de pruebas repetidas no independientes, (cada extraccin es una prueba).
b) Cada prueba debe resultar en un xito o un fracaso, (ya que cada elemento extrado pertenece a una
clase o a la otra).
Se convendr en denominar a las distintas clases como:
Categora I: constituida por los elementos que interesa contar, y
Categora II: constituida por los elementos restantes.
Simbolizamos con :
n : a la cantidad de extracciones (o pruebas repetidas)
N : a la cantidad de elementos de la poblacin
N1 : a la cantidad de elementos de la categora I
N2 = N - N1 : cantidad de elementos de la categora II
La variable hipergeomtrica se define como X : cantidad de elementos de la categora I que aparecen
entre los "n" elementos extrados . Considerando "xito" cuando el elemento extrado pertenece a la
categora I , entonces podemos definir X como el n de xitos en las n extracciones .

Es importante tener en cuenta el recorrido de la variable, que depende del tamao de la muestra ( n ) y
de los tamaos de ambas categoras ( N1 y N2 ) .

Si n <N1 y n <N2 entonces los valores posibles de la variable son x = 0 , 1 , 2 , .... , n.
Siendo que x indica el n de elementos que pertenecen a la categora I, es obvio que x sN1 , adems de
tener que ser x s n ;as mismo, n-x indica el n de elementos que pertenecen a la categora II, luego debe
verificarse que n-x sN2 , adems de ser n-x s n , de donde se deduce que x > n - N y x > 0 .

x smn { N1 , n } y x >mx { n-N2 , 0 }

Rx = { x e Z : mx { n-N2 , 0 } s x smn { N1 , n } }

Supongamos que estamos interesados en un valor especfico de la variable, digamos X = k . La
probabilidad de que la variable asuma dicho valor ( P(X=k) ) , se calcula mediante la definicin clsica de
probabilidad, es decir, mediante el cociente entre la cantidad de casos favorables y los posibles dentro de
un Espacio Muestra equiprobable.
Estadstica General 2011

56
Mg. Miguel Angel Macetas Hernndez


Luego, el n de casos posibles est dado por el nmero combinatorio
|
|
.
|

\
|
n
N
que representa la cantidad de
muestras posibles de extraer, todas con la misma probabilidad; y el n de casos favorables est dado por el
producto de dos nmeros combinatorios:

|
|
.
|

\
|

|
|
.
|

\
|
=
|
|
.
|

\
|

|
|
.
|

\
|
k n
N
k
N
k n
N N
k
N
2 1 1 1
que representa la cantidad de muestras de n elementos (extrada de un
total de N) que contienen k elementos de la categora I y el resto de la categora II.
x
R k para
n
N
k n
N N
k
N
k X P e
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= =
1 1
) (

Luego, expresamos su funcin de cuanta como :

e
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
x otro
R x para
n
N
x n
N N
x
N
x p
x
0
) (
1 1


y la funcin de distribucin acumulada es
F(x) = P(X s x) =
P X k
k
x
( ) =
=

0
:
{ }
} {

>
e
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
<
=

=
n N min x para
R x para
n
N
k n
N N
k
N
N n max x para
x F
x
x
m k
, 1
0 , 0
) (
1
1 1
2


donde m = mx { n-N2 , 0 } = mnimo valor de x .
Se verifica que p(x) es funcin de cuanta pues :
1. p(x) > 0 x
2.
p x
x
n
( ) =
=
1
0

ya que
|
|
.
|

\
|
=
|
|
.
|

\
|

|
|
.
|

\
|

e
n
N
k n
N N
k
N
x
R x
1 1
, puede demostrarse por induccin sobre n, para N y N1 fijos

Los parmetros de esta distribucin son N , N1 y n , simblicamente escribimos : X ~ H ( N , N1
, n ) y leemos X se distribuye en forma hipergeomtrica con parmetros "N", "N1 " y "n" . La esperanza
y la variancia de la variable hipergeomtrica estn dadas por las frmulas:
1
) ( ) (
2 1 1

= =
N
n N
N
N
N
N
n X V y
N
N
n X E


Obsrvese que si las extracciones se hacen con reposicin, entonces la probabilidad de que el elemento
pertenezca a la categora I se mantendra constante, ya que las n extracciones son n repeticiones
independientes . En este caso, la variable nmero de elementos en la muestra que pertenecen a la
Estadstica General 2011

57
Mg. Miguel Angel Macetas Hernndez


categora I ya no es una variable hipergeomtrica , sino que responde a las hiptesis de una variable
binomial , cuyo recorrido ser x = 0 , 1 , 2 , ... n .


4. Modelo Poisson

Hay ciertos acontecimientos que suceden continuamente en forma aleatoria con una cierta tasa de
ocurrencia, sobre un campo continuo (que puede ser el tiempo, una superficie, o un volumen). Un proceso
de Poisson satisface las siguientes tres hiptesis:
1. Tasa constante de ocurrencia.
2. La cantidad de acontecimientos ocurridos durante un intervalo es independiente al n de
acontecimientos ocurridos en otro intervalo (excluyente al primero).
3. La probabilidad de dos acontecimientos simultneos es nula.

Simbolizaremos con al nmero promedio de acontecimientos ocurridos en una determinada magnitud
del campo continuo sobre el cual se dan los acontecimientos.

La variable Poisson se define como X : nmero de acontecimientos ocurridos en un determinado intervalo,
( de tiempo, de superficie, de volumen, etc ) , y puede asumir cualquier nmero no negativo, es decir:
x = 0 , 1 , 2 , 3 , .............,

En base a las tres hiptesis consideradas se demuestra (mediante el Anlisis Matemtico Diferencial) que
la probabilidad de que ocurran k acontecimientos en un intervalo est dado por la siguiente expresin :
!
.
) (
k
e
k x P
k

= =



donde representa la cantidad media de ocurrencias de ese fenmeno en dicho intervalo. Obviamente, el
valor de depende de la magnitud del intervalo, siendo proporcional al mismo ya que la tasa de
ocurrencia es constante .
Por lo tanto , la variable Poisson tiene la siguiente funcin de cuanta :

=

x otro
x si
x
e
x p
x
0
........ , 1 , 0
!
.
) (


y la siguiente funcin de distribucin acumulada:

<
=

=

,...... 2 , 1 , 0
!
.
0 0
) (
0
x si
k
e
x si
x F
x
k
k


p(x) es funcin de cuanta pues verifica las dos condiciones:

1.
........ , 2 , 1 , 0 0
!
.
) ( = >

=

x para
x
e
x p
x


2.
1
!
.
!
.
0 0
= = =


e e
x
e
x
e
x
x
x
x


ya que

x
x
x!
=

0
es el desarrollo en serie de

e
.
Estadstica General 2011

58
Mg. Miguel Angel Macetas Hernndez



La esperanza y la variancia de la variable Poisson son:

= =

+ =

=


e e
x
e
x x
x e
x
e
x
x
e
X E
x
x
x
x
x
x
x
x
. .
)! 1 (
. .
)! 1 (
.
!
.
. 0
!
.
) (
0 1
1
1
1
1 0



( )


=

=


+ =

+ =

=
=
1 1
2
0
2 2
2 2
!
.
. ) 1 .(
!
.
. 0
!
.
) (
) ( ) ( ) (
x
x
x
x
x
x
x
e
x x x
x
e
x
x
e
x X E
X E X E X V


donde x2 es equivalente a x.(x-1) + x . Luego :



=

=


+

=
|
|
.
|

\
|
+

=
1 1 1
2
!
.
.
!
.
) 1 (
!
.
!
.
) 1 ( ) (
x
x
x
x
x
x x
x
e
x
x
e
x x
x
e
x
x
e
x x X E


donde el segundo trmino es E(X) , y el primer sumando de la primera sumatoria es nulo, por lo tanto
equivale a comenzar la sumatoria en x=2

+ = + = +

= +


=



2 2
0 2
2
2
2
2 2
2
. .
)! 2 (
) (
)! 2 )( 1 (
) 1 ( ) ( e e
x
e X E
x x x
x x e X E
x
x
x
x

Luego la variancia es:


= =
= + = =
) ( ) (
) ( ) ( ) (
2 2 2 2
X V X E tanto lo Por
X E X E X V



Aplicacin :

El modelo Poisson suele ser utilizado como caso limite de una variable binomial, para n muy grande y p
muy pequeo. Para la practica, basta tener n > 100 y p s 0.01 . En estos casos la variable X : n de
xitos se distribuye aproximadamente Poisson con parmetro =n.p .


5.- Modelo Geomtrico

Surge de realizar repetidas veces un experimento dicotmico hasta obtener el resultado deseado. Es decir,
el nuevo experimento consiste en repetir una prueba Bernoulli tantas veces como sea necesario hasta
obtener xito. Estas pruebas son independientes entre s, y cada una de ellas tiene la misma probabilidad
de resultar exitosa.
Simbolizamos con p a la probabilidad de obtener xito en cualquiera de las pruebas, o sea, p = P(E), y
por lo tanto la probabilidad de fracaso es P(F) = 1 p.
La variable se define como X: nmero necesario de repeticiones hasta la obtencin del xito. Obviamente,
como mnimo se necesita una prueba; por lo tanto, deber ser x > 1. Como no existe una cota superior para
el n de repeticiones necesarias, la variable puede tomar valores infinitamente grandes ( cada vez con
menor probabilidad ). Por lo tanto, el recorrido de la variable es:
X = 1, 2, 3, .
Estadstica General 2011

59
Mg. Miguel Angel Macetas Hernndez


La probabilidad de obtener cada uno de estos valores es fcilmente calculable. Para que la cantidad de
repeticiones sea un determinado nmero k ( k > 1 ), necesariamente debe resultar fracaso en las
primeras k 1 pruebas y xito en la k-sima repeticin. Luego, el suceso que nos interesa es :
E FFFFFFF
veces k

1

y la probabilidad de este suceso es:

|
|
.
|

\
|

E F FF P
veces k

1
....
=
) ( ) ( )....... ( ). (
1
E P F P F P F P
veces k

|
|
.
|

\
|

E F FF P
veces k

1
....
=

veces k
p p
1
) 1 ( ..... ) 1 (


. p = ( 1 p )k 1 . p

( )
1
) 1 (

= =
k
p p k X P


Luego, la funcin de cuanta de la variable geomtrica es:

=
=

x otro
x p p
x p
x
0
....... , 3 , 2 , 1 ) 1 (
) (
1


y la funcin de probabilidad acumulada est dada por:

( ) ( )
x
x
k
k
p p p x X P x F = = s =

=

1 1 ) 1 ( ) (
1
1


Otra forma de calcular F( x ) es considerando una variable auxiliar, de distribucin binomial.
Sea el suceso A = [ X s k ] . Definamos la variable binomial con parmetros k y p . O sea,
Y ~ B ( k, p ). Podemos calcular la probabilidad del suceso A utilizando la variable Y, mediante su
complemento :
| | | | = = = > = 0 Y k X A

veces k
F FF....

( ) ( ) ( ) ( )
k
p Y P k X P A P = = = > = 1 0


( ) ( ) ( ) ( ) ( ) ( )
k
p Y P k X P A P A P k X P = = = > = = = s 1 1 0 1 1 1

( ) ( ) ,....... 3 , 2 , 1 1 1 = = s k de valores para p k X P


k


Por lo tanto su expresin es la siguiente:

=
<
=
.... , 3 , 2 , 1 ) 1 ( 1
1 0
) (
x para p
x para
x F
x


Puede verificarse que p(x) es funcin de cuanta, ya que :

R x p p x p
x
e > =

0 ) 1 ( ) (
1

Estadstica General 2011

60
Mg. Miguel Angel Macetas Hernndez


1 / 1 . ) 1 ( ) (
1 1
1
= = =

=

x x
x
p p p p x p


El nico parmetro de esta distribucin es p , simblicamente escribimos X ~ G (p) y leemos X se distribuye
geomtricamente con parmetro p .
La esperanza y la variancia de la variable geomtrica son:


=

=
= = =
1 1
1 1
1
) 1 ( . . ) 1 ( . . ) ( ) (
x x
x x
x
p x p p p x x p x X E

donde
| |
x x
p
p
p x ) 1 ( ) 1 .(
1

c
c
=


2
1 1 1
1
1
1
1 1
). 1 ( ) 1 ( ) 1 ( ) 1 .(
p
p p p
p
p
p
p
p
p
p x
x
x
x x
x x
=
(


c
c
=
(


c
c
=
c
c
=
(


c
c
=


=



Luego,
p
p
p p x p p p x X E
x
x
x
x
1 1
. ) 1 .( . ) 1 .( . ) (
2
1
1
1
1
= = = =

=

=



2 2
) ( ) ( ) ( X E X E X V =


siendo
| |

+ = =
1
1
1
1 2 2
) 1 ( . . ) 1 ( ) 1 .( . ) (
x
x
x
x
p p x x x p p x X E


=

+ =
1 1
1 1 2
) 1 .( . ) 1 .( ). 1 ( ) (
x x
x x
p p x p p x x X E
=
+

=

1
1
) ( ) 1 ).( 1 ( .
x
x
X E p x x p


donde
1
2
2
1
) 1 ( ) 1 ).( 1 (
+

c
c
= +
x x
p
p
p x x


| |
(


c
c
=
c
c
=
(


c
c
= +

=
+

=
+

=

p
p
p
p
p
p
p
p x x
x
x
x
x
x
x
1
. ) 1 ( ) 1 ( ) 1 ( ) 1 ).( 1 (
2
2
2
1
1
2
2
1
1
2
2
1
1


| |
3 2
2
2
2
2
1
1
2
2
1 1
). 2 1 ( ) 1 ).( 1 (
p
p
p
p
p
p p
p
p x x
x
x
=
(

+
c
c
=
(

+
c
c
= +

=



p
p
p
p
p X E p x x p X E
x
x
1 2 1 2
. ) ( ) 1 ).( 1 ( . ) (
2 3
1
1 2
= = + =

=


2 2 2
2
2
2 2
1 1 1 1 1 2
) ( ) ( ) (
p
q
p
p
p
p
p p
p
X E X E X V =

= =
(

= =


Luego,
p
X E
1
) ( =

2
) (
p
q
X V =

6 Modelo Binomial Negativo o Pascal

Estadstica General 2011

61
Mg. Miguel Angel Macetas Hernndez


Surge de realizar repetidas veces un experimento dicotmico hasta obtener una determinada cantidad de
veces el resultado deseado. Es decir, este nuevo experimento consiste en realizar repetidas pruebas
Bernoulli independientes hasta obtener determinada cantidad de xitos .
Simbolizamos con p a la probabilidad de obtener xito en cualquiera de las pruebas, o sea, p = P(E), y por lo
tanto la probabilidad de fracaso es P(F) = 1 p ; y simbolizamos con r a la cantidad deseada de xitos ( r
constante )
La variable se define como X: nmero necesario de repeticiones hasta la obtencin del r- simo xito.
Obviamente, como mnimo se necesitan r pruebas; por lo tanto, deber ser
x > r . Como no existe una cota superior para el n de repeticiones necesarias, la variable puede tomar
valores infinitamente grandes ( cada vez con menor probabilidad ). Por lo tanto, el recorrido de la variable
es:
x = r , r + 1 , r + 2 , r + 3 ,

La probabilidad de obtener cada uno de estos valores es fcilmente calculable. Para que la cantidad de
repeticiones sea un determinado nmero k ( k > r ), necesariamente debe resultar xito en la k-sima
repeticin. Luego, el suceso que nos interesa, X = k , es la combinacin de dos otros sucesos A y B donde:
A : r 1 xitos y k r fracasos en k 1 pruebas
B : xito en la k-sima prueba
{ X = k } = A B : r-simo xito en la k-sima prueba


con
r k r
q p
r
k
A P

|
|
.
|

\
|

= . .
1
1
) (
y
p B P A B P = = ) ( ) / (


P ( A B ) = P( A ).P( B ) =
r k r
q p
r
k

|
|
.
|

\
|

. .
1
1

Luego,
( )
r k r
q p
r
k
k X P

|
|
.
|

\
|

= = . .
1
1


Por lo tanto, la funcin de cuanta de la variable binomial negativa o Pascal, se expresa de la siguiente
manera:

+ + =
|
|
.
|

\
|

=

x otro
r r r x si q p
r
x
x p
r x r
0
... , 2 , 1 , .
1
1
.
) (


y la funcin de distribucin acumulada est dada por:

+ + =
|
|
.
|

\
|

<
=

=

... , 2 , 1 , .
1
1
.
0
) (
r r r x si q p
r
k
r x si
x F
x
r k
r k r


p(x) es funcin de cuanta ya que verifica las siguientes dos propiedades:

1 )
...... , 2 , 1 , 0 . .
1
1
) ( + + = >
|
|
.
|

\
|

=

r r r x para q p
r
x
x p
r x r


2 )
( ) 1 .
1
1
. = |
.
|

\
|

=


=

= r x
r x r
r x
q p
r
x
x p
, ya que
Estadstica General 2011

62
Mg. Miguel Angel Macetas Hernndez




=

= = |
.
|

\
|

= |
.
|

\
|

r x r x
r r r x r r x r
p p q
r
x
p q p
r
x
1 . .
1
1
. .
1
1
.


Utilizando el desarrollo del binomio de Newton para exponente negativo, se demuestra que:

=

= |
.
|

\
|

r x
r r x
q q
r
x
) 1 ( .
1
1
, donde 1 q = p

Los parmetros de la distribucin binomial negativa son p y r ; simblicamente escribimos X ~BN ( p, r ) y
leemos X se distribuye en forma binomial negativa ( o Pascal ) con parmetros p y r .
Consideremos la variable X : nmero de repeticiones necesarias hasta la obtencin del
r simo xito , como la suma de r variables geomtricas, o sea : X = X1 + X2 + . + Xr , con Xy :
nmero de repeticiones necesarias hasta la obtencin del i- simo xito , dado que ya ocurrieron i 1
xitos . Es decir, cada una de ellas corresponde al nmero de repeticiones necesarias hasta la obtencin
del prximo xito . Luego, todas ellas son variables geomtricas independientes, con el mismo
parmetro P( xito ) = p , y por lo tanto tienen esperanza E ( Xi ) =
p
1
y la misma variancia V ( Xi ) =
2
p
q
.
Luego :

=
=
r
i
i
X X
1
, y por lo tanto :

(

=

=
r
i
i
X E X E
1
) (
y
(

=

=
r
i
i
X V X V
1
) (


por propiedad de la esperanza :

( )

= = =
= = =
(

=
r
i
r
i
i
r
i
i
p
r
p
X E X E X E
1 1 1
1
) (


y por propiedad de la variancia para variables independientes :

( )

= = =
= = =
(

=
r
i
r
i
i
r
i
i
p
q r
p
q
X V X V X V
1
2 2
1 1
.
) (



Luego, la esperanza y la variancia de una variable binomial negativa o Pascal, son:

p
r
X E = ) (

2
.
) (
p
q r
X V =


Nota:
Para r = 1 , obtenemos la distribucin geomtrica.


Estadstica General 2011

63
Mg. Miguel Angel Macetas Hernndez




DISTRIBUCIONES CONTINUAS
1. MODELO UNIFORME
Se aplica a una variable que puede asumir con igual probabilidad cualquier valor real dentro de un intervalo
acotado [ o , | ], con |>o. Luego, la masa total de probabilidad se distribuye en forma uniforme o constante
en todo el intervalo. Tambin se la conoce con el nombre de distribucin rectangular por la representacin
grfica de su funcin de densidad.
La funcin de densidad de la variable uniforme tiene la siguiente expresin y representacin grfica:

| s s o
o |
=
x
x si
x f
0
1
) (
o |
x
f(x)
1
| o

Por lo tanto, la probabilidad de que la variable tome valores dentro de un intervalo incluido en el recorrido, o
sea, (a , b) c [ o , | ], es proporcional a la longitud de dicho intervalo. Si o< a < b <| , con [o , | ] = R
x

entonces P( a < X < b )=
o |
a b
con lo cual se deduce que corresponden idnticas probabilidades a intervalos
de igual amplitud, siempre que dichos intervalos estn incluidos en R
x
=[ o , |].
Se verifican las condiciones de no negatividad y de cierre, requisitos para ser considerada funcin de
densidad::
1 ) (
1 1
) ( ) 2
0
1
) ( .) 1
=

=
> e >

=
} }


o |
o | o |
o |
o |
|
o
dx dx x f
pues R x x f
x

La funcin de probabilidad acumulada F(x) = P( Xs x )
o |
o
o | o |
o
o

=
}

=
x
s ds
x
x
1 1
para o< x <|

Luego:

>
s s

<
=
|
| o
o |
o
o
si
x si
x
x si
x F
1
0
) (


o |
x
F
(x)

1

Sus parmetros son o y | , y representan los lmites del recorrido de la variable X.
La notacin usada es X ~ U( o , | )
2 2 ). (
) )( (
2 ). ( 2
1 1
) (
2 2 2
o |
o |
o | o |
o |
o |
o | o |
|
o
|
o
+
=

+
=

=
}
x
dx x X E

| |
2 2
) ( ) ( ) ( X E X E X V =
Estadstica General 2011

64
Mg. Miguel Angel Macetas Hernndez


( )
( ) ( )
2 2 2 2 2 2 2 2
2 2 2 2 3 3 3
2 2
12 12
3 6 3 4 4 4
4 3
3 3 ). (
) )( (
3 ). ( 3
1 1
) (
o | o |o | o |o | o | o |o |
o |o |
o |
o |o | o |
o |
o |
o | o |
|
o
|
o

=
+ +
=
+

+ +
==
+ +
=

+ +
=

=
}
X V
x
dx x X E

Luego :

12
12
) (
) (
2
) (
) (
2
o |
o
o | o |
=

=
+
=
X
X V X E

2. MODELO EXPONENCIAL
Se aplica a una variable aleatoria continua que puede asumir cualquier valor positivo, pero la densidad de
probabilidad va disminuyendo conforme la variable asume valores mayores.
Su funcin de densidad y representacin grfica correspondiente es la siguiente:

<
>
|
=
|

0 0
0
1
) (
1
x si
x si e
x f
x

:
Veamos que verifica con las condiciones de no negatividad y de cierre, requisitos para ser considerada funcin
de densidad:
1 ) 1 0 (
1
) ( ) 2
0 , 0
1
) ( .) 1
0
0
1 1
1
= = =
|
=
> | e >
|
=

| |
|
} }
x x
x
e dx e dx x f
pues R x e x f

La funcin de probabilidad acumulada F(x) = P( X s x ), para los valores positivos de x , est dada por:
x x
x
x
x
s
e e e ds e x F
| | | |

=
|
.
|

\
|
= =
|
=
}
1 1 1 1
1 1
1
) (
0
0

Luego, la funcin de Distribucin y su grfico correspondiente es :

>
<
=

0 1
0 0
) (
1
x si e
x si
x F
x
|

0
0.02
0.04
0.06
0.08
0.1
0 10 20 30 40 50 60
f(x)
Axis Title
| = 12.5
Estadstica General 2011

65
Mg. Miguel Angel Macetas Hernndez


0
0.2
0.4
0.6
0.8
1
0 20 40 60X
F(x)
|
= 12.5

Estadstica General 2010

66
Mg. Miguel Angel Macetas Hernndez

Su nico parmetro es |, y su notacin es X ~ exp(|)
La esperanza y la variancia son :
} } }


| |
+ =
|
= =
0
0
1
0
1 1
. .
1
. ). ( . ) ( dx e x e x dx e x dx x f x X E
x x
( ) | | |
|
= = + =

) 1 0 ( . 0
0
1
x e
| |
2
0
1
2 2 2 2 2
2 ..........
1
. ). ( ) ( ) ( ) ( ) ( |
|
|
= = = = =
} }


dx e x dx x f x X E donde X E X E X V
x

| |
2 2 2 2 2
2 ) ( ) ( ) ( | | | = = = X E X E X V
Luego | = ) (X E
2
) ( | = X V y | o = ) (x
3. MODELO NORMAL

Es el ms utilizado en las experiencias cientficas, razn por la que se le da mayor importancia. La
ecuacin de esta curva fue originalmente publicada en 1733 por Moivre quien no supo aplicar sus
resultados a las observaciones (como lmite de la binomial). Al mismo resultado llegan dos astrnomos
matemticos Laplace y Gauss, independientemente uno del otro. Llegaron a ella estudiando la
distribucin de los errores de las observaciones, en particular los errores producidos en la medicin de
las rbitas de los astros. Existen importantes razones para afirmar que es la distribucin ms
significativa del anlisis estadstico.
- Una importante cantidad de poblaciones correspondientes a variables aleatorias continuas siguen la
ley normal. Ej: estatura de individuos adultos, resistencia a la traccin de un gran nmero de muestras
de acero, dimetro de arandelas, aumento de peso de animales sometidos a determinadas dietas.
- Esta distribucin sirve como buena aproximacin de muchas variables aleatorias discretas (binomial,
poisson)
En teora estadstica, la hiptesis de normalidad de las variables aleatorias, permite solucionar
problemas de tipo terico, justificando o rechazando la aplicacin del mtodo.

Definicin
Una variable aleatoria continua X tiene una distribucin Normal si su funcin de densidad tiene la
siguiente expresin:
f x e para x
x
( ) = < <

(
1
2
1
2
2
to

o

Estadstica General 2010

67
Mg. Miguel Angel Macetas Hernndez

siendo una constante cualquiera, eR y o una constante positiva, o> 0 .Es una curva simtrica
en forma de campana, asinttica al eje de las abcisas, que alcanza su valor mximo en x = , siendo
f()=
( ) 2
1
to

y tiene dos puntos de inflexin: en x = - o y en x = + o, y prcticamente f(x) es nula
para x < - 4. o y para x > + 4. o .
0
0.1
0.2
0.3
0.4
0 1 2 3 4 5 6 7 8 9 10
X
f(x)

= 5
o
= 1.2

Como o> 0, entonces 2to>0 , luego f(x) > 0, x eR.
o t =
}

2
2
2
1
dx e Como
x
,entonces 1 ). ( ; 1
2
1
2
2
1
= =
o t
} }

dx x f dx e
x

Luego
2
2
1
2
1
) (
(

=
o

o t
x
e x f es funcin de densidad.
Los parmetros son y o, que representan la media y el desvo standard de la variable X.
La notacin utilizada es X ~ N ( , o )
La esperanza y la variancia son:
E(X)= V(X)= o
2

Representacin grfica de distribuciones normales para distintos valores de los parmetros


Funcin de Distribucin ( o de probabilidad acumulada) :
} }

(


= =
x
s
x
ds e ds s f x F
2
2
1
2
1
) ( ) (
o

o t
para la cual no existe una expresin
matemtica.
0
0.1
0.2
0.3
0.4
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
f(x)
Axis Title
= 5
o = 1.2
= 7
o = 1.2
= 10
o = 2
Estadstica General 2010

68
Mg. Miguel Angel Macetas Hernndez

Su representacin grfica es la siguiente:

No contar con una expresin matemtica de F(x), hace impracticable el clculo inmediato de las
probabilidades.
Por esta razn, se han tabulado los resultados de la funcin de distribucin de una variable normal con
media nula ( E(X) = 0 ) y variancia igual a la unidad ( V(X) =1 ). Esta variable recibe el nombre de
variable normal standart; y cualquier variable normal puede ser transformada en una normal standart
mediante operaciones matemticas. Ese proceso de transformacin se denomina estandarizacin.


Variable Normal Standart
Sea X ~ N ( , o ) por lo tanto E(x)= y V(x)= o
2

La variable normal standard la simbolizamos con Z y se define:
Z
X
y tiene E Z y V Z =

= =

o
( ) ( ) 0 1
La funcin de densidad de esta variable Z est dada por :
< < =

z para e z f
z
2
2
1
2
1
) (
t

y su funcin de distribucin o de probabilidad acumulada se simboliza universalmente por u(z) =
P(Z s z).
Existen distintos tipos de tablas que nos brindan estas probabilidades. La ms completa contiene todos
los valores de u(z) para -4 s z s 4 (para valores de z con dos decimales), ya que se considera que
u(z) = 0 para z < -4 y u(z) = 1 para z > 4.
Otra de las tablas contiene los valores de u(z) slo para los valores positivos de z (0 s z s 4), ya que
por causa de la simetra de la funcin f(z) no es necesario disponer tambin para valores negativos.
Y un tercer tipo de tabla contiene, para los valores positivos de z, (0 s z s 4), las probablidades:
P(0 sZ s z ) = u(z) - 0.5.

0
0.2
0.4
0.6
0.8
1
1.2
0 1 2 3 4 5 6 7 8 9 10 11
F(x)
= 5
o = 1.2
Estadstica General 2010

69
Mg. Miguel Angel Macetas Hernndez

4. DISTRIBUCIN CHI CUADRADO
( _
2
)

Surge de la suma de los cuadrados de variables independientes normales estandarizadas.
Sean Z
1
, Z
2
, Z
3
, ...... , Z
n
iid (independiente e idnticamente distribuidas) N(0,1) y sea la variable
X Z
i
i
n
=
=

2
1
= + + + X Z Z Z y X
n n 1
2
2
2 2 2
..... ~ _
La funcin de densidad de esta variable aleatoria X est dada por la siguiente expresin :
f x
x e
n
para x
n
x
n
( )
( / )
= >


2
1
2
2
2 2
0
I

El nico parmetro de esta distribucin es n que representa el nmero de grados de libertad , y
equivale a la cantidad de variables independientes que intervienen en la suma .

Propiedades
1.- Si X ~ N(0,1) entonces X
2
~ _
1
2

2.- Si X
1
y X
2
son dos variables independientes con:

1 1
X y X entonces X X
n m n m
~ ~ ~ _ _ _
2
2
2
2
2
+
+
(propiedad aditiva)
3.- De las dos primeras propiedades se deduce que si X ~ N(0,1) y X
1
, X
2
, .... , X
n
son n
observaciones de la variable que constituyen una muestra al azar, entonces X
i
i
n
n
2
1
2
=
~ _ .
4.- De esta ultima propiedad (3), se deduce que si X ~ N(, o) y X
1
, X
2
, .... , X
n
son n observaciones
de la variable que constituyen una muestra al azar, entonces:
n i N
X
que ya
X
i
n
n
i
i
.. 1 ) 1 , 0 ( ~ ~
2
2
1
=
o

_
(

=


5.- Si X ~ _
n
2
, entonces E(X) = n y V(X) = 2.n la distribucin queda completamente definida por
sus grados de libertad, que constituyen su nico parmetro.

6.- Esta variable, por ser una suma de cuadrados, siempre toma valores positivos, vara de cero a
infinito.

Estadstica General 2010

70
Mg. Miguel Angel Macetas Hernndez

7.- La distribucin de la variable es positivamente asimtrica. Sin embargo, cuando n aumenta, se
aproxima a la distribucin Normal. Es decir:
_
_
n
D
n
D
N n n cuando n
si X entonces
X n
n
N cuando n
2
2
2
2
0 1



( , )
~ , ( , )

0
0.02
0.04
0.06
0.08
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32
_
2
f(x)
n = 5
n = 15


5.- DISTRIBUCIN t - STUDENT ( t )

Surge del cociente de una variable normal standart y la raz cuadrada de una variable chi cuadrado
dividido sus grados de libertad , siendo ambas variables independientes.

Sean Z e Y dos variables aleatorias independientes con Z ~ N(0,1) e Y ~ _
n
2
y sea la variable
X
Z
Y n
X t
n
=
/
~
La funcin de densidad de esta variable aleatoria X est dada por la siguiente expresin:
f x
n
n
n
x
n
x
n
( ) . . , =
+

(
+

(
(
< <

+
1
1
2
2
1
2
1
2
t
I
I

El nico parmetro de esta distribucin es n que representa el nmero de grados de libertad, y
coincide con el nmero de grados de libertad de la variable chi cuadrado.

Propiedades

1.- La variable t, (como la Normal), toma valores de - a + .
Estadstica General 2010

71
Mg. Miguel Angel Macetas Hernndez

2.- Si X X X X iid N entonces
X
n
X X X X
t
n
n
n 0 1 2
0
1
2
2
2
3
2 2
0 1
1
, , ,....... ( , ) , :
( .......
~
+ + + +

3.- La distribucin t-Student es simtrica con media y variancia
E(X) = 0 , n > 1
V(X) =
n
n 2
, n > 2
4.- La variable t-Student tiene mayor dispersin que la Normal standart V x
n
n
( ) =

>

(
2
1 ; pero su
variancia tiende a 1 a medida que aumenta n. la distribucin t-Student tiende a la distribucin
Normal Standard a medida que aumentan los grados de libertad. Es decir:
t N para n
n
D
( , ) 0 1
0
0.1
0.2
0.3
0.4
-5 -4 -3 -2 -1 0 1 2 3 4 5
t
f(x)
n = 5


6.- DISTRIBUCIN F-SNEDECOR ( F )

Surge del cociente de dos variables chi-cuadrado independientes, cada una dividida por sus
respectivos grados de libertad.
Sean Z e Y dos variables aleatorias independientes con:
Z y Y y sea la iable X
Z
m
Y
n
X F
m n m n
~ ~ var ~
,
_ _
2 2
=
La funcin de densidad de esta variable aleatoria X est dada por la siguiente expresin:
f x
n m
n m
m
n
x
mx
n
x
m
n
n m
( ) . , =
+

( +

( >


+
I
I I
2
2 2
1 0
2
2
1
2

Estadstica General 2010

72
Mg. Miguel Angel Macetas Hernndez

Esta distribucin tiene dos parmetros: m y n, que representan los grados de libertad, y estos
nmeros coinciden con los grados de libertad de las variables chi cuadrado del numerador y
denominador, respectivamente.

Propiedades
1.- La variable F toma valores de 0 a +, por ser cociente de dos variables que asumen valores
positivos.

2.- Si Y
1
, Y
2
, ...... , Y
m
iid N(0,1) y Z
1
, Z
2
, ...... , Z
n
iid N(0,1), entonces:
1
1
1
2
2
2
3
2 2
1
2
2
2
3
2 2
m
Y Y Y Y
n
Z Z Z Z
F
m
m
m n
( ........ )
( ........ )
~
,
+ + + +
+ + + +

3.- Si X ~ F
m n ,
, entonces su media y variancia son :
4 ,
) 4 ( ) 2 (
) 2 ( 2
) ( 2 ,
2
) (
2
2
>

+
= >

= n
n n m
n m n
X V n
n
n
X E
4.- De la segunda propiedad resulta que: si Y
1
,Y
2
, ...... , Y
m
iid N
y y
( , ) o y
Z
1
,Z
2
, ...... , Z
n
iid N
z z
( , ) o , entonces con Y
i
y Z
i
independientes i,j entonces:

2
1
2
2
1
2
,
1
2
1
2
~
~
~
1
1
n
n
i
z
z i
m
m
i
y
y i
n m
n
i
z
z i
m
i
y
y i
Z
y
Y
que ya
F
Z
n
Y
m
_
o

_
o

o

o

=
=
=
=
(


(
(


(
(



5.- La distribucin F-Snedecor es positivamente asimtrica, pero su asimetra se reduce a medida que
aumentan los grados de libertad n y m.
6.- Si X F entonces
X
F
m n n m
~ , ~
, ,
1

Representacin grfica
Estadstica General 2010

73
Mg. Miguel Angel Macetas Hernndez

0
0.05
0.1
0.15
0.2
0 1 2 3 4 5
F
f(x)
n= 6
m = 10
n= 65
m = 77

También podría gustarte