Está en la página 1de 9

Estadstica I: Clase 1

Prof: Roger Jess Tovar Faln


Universidad de Crdoba, Programa de Estadstica
e-mail: rjtovar@correo.unicordoba.edu.co
web site: http://sites.google.com/site/rjtovarf
Estadstica descriptiva
Iniciamos este captulo con la denicin de algunos conceptos el-
ementales y bsicos, y sin embargo pilares, para una comprensin in-
tuitiva y real de lo que es la Estadstica. Se pretende introducir al estu-
diante en los primeros pasos sobre el uso y manejos de datos numri-
cos: distinguir y clasicar las caractersticas en estudio, ensearle a
organizar y tabular las medidas obtenidas mediante la construccin
de tablas de frecuencia y por ltimo los mtodos para elaborar una
imagen que sea capaz de mostrar grcamente unos resultados.
Conceptos bsicos
Estadstica Es la disciplina que se ocupa de los mtodos y pro-
cedimientos para recoger, clasicar, resumir, hallar regularidades y
analizar los datos, siempre y cuando la variabilidad e incertidumbre
sea una causa intrnseca de los mismos; as como de realizar inferen-
cias a partir de ellos, con la nalidad de ayudar a la toma de deci-
siones y en su caso formular predicciones.
Estadstica descriptiva Comprende los procesos de consoli-
dacin, resumen y descripcin de los datos recopilados. Tablas, gr-
cos o ndices que permiten un anlisis referido exclusivamente a los
datos coleccionados. No se generaliza ni se extrapola a la totalidad
de los elementos.
Estadstica inferencial Incluye procedimientos que permiten la
extrapolacin y generalizacin sobre caractersticas que tipican a
todos los elementos de la poblacin. Puede decirse que es el pro-
ceso de hacer armaciones o predicciones sobre toda la poblacin,
tomando como base, slo a la informacin recolectada a travs de
una muestra.
Poblacin Conjunto de elementos que son de inters en un estudio
(poseen caractersticas comunes acerca de los cuales se desea tener
informacin). Usualmente a dichos elementos se les denomina indi-
viduos, observaciones o mediciones. La poblacin puede ser nita o
innita.
Muestra Es una parte de la poblacin. Para estudios estadsticos,
se requieren muestras que nos den informacin real de la poblacin.
Censo Informacin de toda la poblacin.
Muestreo Proceso mediante el cual se seleccionan los elementos
de una poblacin.
Variables estadsticas Son caractersticas de los elementos pobla-
cionales atribuidas al azar. Se clasican en:
Cualitativas: aquellas que describen cualidades de los elementos.
Ej: Tipo de sangre, cuyas modalidades o categoras son: O, A, B,
AB. Otros ejemplos son: Estado civil, documento de identicacin,
liacin poltica, tipo de religin.
Cuantitativas: aquellas que generalmente resultan de un proceso
de medicin. Pueden ser discretas o continuas.
Discretas: resultan de conteos y el resultado es un nmero en-
tero. Ej: Numero de hermanos, cuyas modalidades o categoras son:
0, 1, . . . , N. Otros ejemplos son: Nmero de pacientes que llegan a un
centro de salud un intervalo de tiempo dado, nmero de sillas en un
saln de clases, nmero de horas que un estudiante dedica semanal-
mente a sus asignaturas.
Continuas: el resultado es un subconjunto de los nmeros reales.
Ej: Tiempo de espera en una parada de bus, velocidad de un vehiculo
en una autopista, ingreso econmico del jefe de hogar en una famil-
ia.
Escalas de medicin
La medicin hace referencia a la asignacin de nmeros a las
caractersticas objeto de estudio.
Escala nominal: Es la ms baja de las escalas de medicin. Iden-
tica las categoras de la variable de inters y se pueden diferenciar
las categoras una de la otra haciendo uso de dgitos. Ej: Estado civil
(soltero - casado - viudo - unin libre - separado), cdula de ciu-
dadana, gnero musical, tipo de sangre, estado del paciente.
Escala ordinal: Identica las categoras de la variable y pueden ser
clasicadas por grados de acuerdo a algn criterio. La funcin de los
dgitos asignados a datos ordinales es la de ordenar. Ej: Grado de es-
colaridad (ninguno - primaria - secundaria - profesional - postgrado),
rangos militares, grados de desnutricin, tipo de quemadura.
Escala de intervalos: La escala de intervalos es una escala ms
especializada que la nominal y la ordinal, en el sentido de que no so-
lo es posible ordenar las mediciones, sino que tambin se conoce la
distancia entre las observaciones cualesquiera. Aqu no hay un pun-
to cero nico. Ej: la escala en la que se mide la temperatura; no es
posible decir que 30

es doble de frio que 60

, ya que depende de
la escala (grados celsius o Fahrenheit). Otros ejemplos son prdida
auditiva en decibeles y coeciente intelectual en puntaje.
Escala de razn: Es el nivel ms alto de las escalas de mediciones
y se caracterza por el hecho de que se puede determinar tanto la
igualdad de razones como la de intervalos. Existe un punto cero ni-
co. Por ejemplo: altura, peso, longitud, velocidad, rea, volmen.
1
Organizacin de la informacin
Existen dos formas bsicas para la representacin de la informa-
cin recolectada, a travs de tablas o cuadros estadsticos y a travs
de un grco.
Una tabla o cuadro estadstico es una representacin en forma or-
denada de la variacin de un fenmeno, clasicado bajo uno o ms
variables. Puede ser simple (clasicacin bajo una variable) o com-
puesto (clasicacin bajo dos o ms variables).
Trminos relacionados para tablas estadsticas
Frecuencia absoluta n
i
Sea X una variable estadstica cuyos valo-
res son X
1
, X
2
, . . . , X
k
; de una muestra de tamao n, (k n). La fre-
cuencia absoluta corresponde al nmero de veces que se repite cada
valor de la variable.
Propiedades
1. 0 n
i
n, para i = 1, . . . , k
2.
k
i=1
n
i
= n
1
+n
2
+ +n
k
= n
Frecuencia relativa h
i
Sea X una variable estadstica cuyos valores
son X
1
, X
2
, . . . , X
k
, de una muestra de tamao n, (k n), con frecuen-
cias absolutas n
1
, n
2
, . . . , n
k
respectivamente. La frecuencia relativa
es el cociente entre la frecuencia absoluta y el tamao de la muestra,
h
i
=
n
i
n
Propiedades
1. 0 h
i
1, para i = 1, . . . , k
2.
k
i=1
h
i
= h
1
+h
2
+ +h
k
= 1
Frecuencia absoluta acumulada N
i
Es la suma sucesiva de fre-
cuencias absolutas
Propiedades
1. N
i
= n
1
+n
2
+ +n
i
=
i
j=1
n
j
, para i = 1, . . . , k
2. N
1
= n
1
3. n
i
= N
i
N
i1
Frecuencia relativa acumulada H
i
Es la suma sucesiva de fre-
cuencias relativas
Propiedades
1. H
i
= h
1
+h
2
+ +h
i
=
i
j=1
h
j
, para i = 1, . . . , k
2. H
1
= h
1
3. h
i
= H
i
h
i1
Para algunos tipos de tablas, es necesario denir algunos trmi-
nos adicionales
Clases Intervalos de nmeros reales que tienen las siguientes ca-
ractersticas
Son disjuntos, es decir, no comparten elementos.
Son exahustivas, es decir, no dejan elementos por fuera.
El elementos de menor magnitud cae en la primera clase y el
de mayor magnitud cae en la ltima clase.
Observacin
Se recomienda construir entre 5 y 25 clases segn el nmero
de datos.
Las clases que se construyen deben ser reales, esto es, sea
[L
i
; L
i+1
] la clase i-sima (i = 1, . . . , k), donde L
i
es el lmite
inferior de la clase i, y L
i+1
es el lmite superior de la clase i.
De acuerdo con la informacin contenida en la muestra los
lmites reales de clase toman la siguiente forma
Informacin L
i
L
i+1
Enteros -0.5 +0.5
Dcimas -0.05 +0.05
Centcimas -0.005 +0.005
.
.
.
.
.
.
.
.
.
Marca de clase X
i
Es el punto medio de cada clase
X
i
=
L
i
+L
i+1
2
i = 1, 2, . . . , k
Comunmente representa a todos los elementos en la respectiva
clase.
Nmero de clases k Un indicador para obtener el nmero de clases
es la regla de Stugers
n = 1+3,3logn
n es el tamao de la muestra.
Otro indicador muy usado es k

n
Rango R Diferencia entre la observacin de mayor magnitud y la
de menor magnitud.
R = X
(m ax)
X
(mn)
Se dice que el rango es la longitud total de los datos.
Amplitud de Clase A
i
es la diferencia entre el lmite superior y el
lmite inferior de clase
A
i
= L
i+1
L
i
i = 1, 2, . . . , k
Para efectos de interpretacin se recomienda que todas las clases
tengan la misma amplitud. Esto se obtiene por medio de la siguiente
expresin
A
i
=
R
k
i = 1, 2, , . . . , k
2
Tablas de frecuencias
La forma general de una tabla de frecuencias se presenta en la
siguiente tabla
Modali. Frec. Frec. Frec. Abs. Frec. Rel.
Abs. Rel. Acumu. Acumu.
C n
i
h
i
N
i
H
i
c
1
n
1
h
1
=
n
1
n
N
1
H
1

c
j
n
j
h
j
=
n
j
n
N
j
H
j

c
k
n
k
h
k
=
n
k
n
N
k
H
k
Ejemplo 1. El nmero de vehculos que llegan a un taller automotor
en un da dado, es una variable de tipo estadstico que se observ
durante un perodo de 25 das y se obtivieron los siguientes datos:
8 6 7 9 8
7 8 10 4 10
8 7 9 8 7
6 5 10 7 8
5 6 8 10 11
Se puede denir la variable X como:
X : nmero de vehculos que llegan al taller,
Tipo: cuantitativa discreta,
Escala: razn
Valor de
X
i
Frec.
Abs.
n
i
Frec.
Relativa.
h
i
Frec. Abs.
Acum.
N
i
Frec.
Relativa
Acum.
H
i
4 1 0.04 1 0.04
5 2 0.08 3 0.12
6 3 0.12 6 0.24
7 5 0.12 11 0.44
8 7 0.28 18 0.72
9 2 0.08 20 0.80
10 4 0.16 24 0.96
11 1 0.04 25 1.00
Total 25 1 - -
Ejemplo 2. Una encuesta realizada a 30 fumadores para determinar
el nmero de cigarrillos que encienden (fuman) en un dia corriente
arroj los siguientes resultados:
3 7 5 10 8 4
5 8 10 8 8 4
5 3 10 5 7 10
8 5 5 12 8 4
4 3 5 8 12 10
Se puede denir la variable X como:
X : nmero de cigarrillos que encienden un fumador,
Tipo: cuantitativa discreta,
Escala: razn
Valor de
X
i
Frec.
Abs.
n
i
Frec.
Relativa.
h
i
Frec. Abs.
Acum.
N
i
Frec.
Relativa
Acum.
h
i
3 3 0.100 3 0.100
4 4 0.133 7 0.233
5 7 0.233 14 0.467
7 2 0.067 16 0.533
8 7 0.233 23 0.767
10 5 0.167 28 0.933
12 2 0.067 30 1.000
Total 25 1 - -
Ejemplo 3. A continuacin se presentan los datos sobre el octanaje
del combustible para motores de varias marcas de gasolina
88.5 89.8 89.9 90.6 93.4 90.7 90.1
94.7 91.6 98.8 92.2 96.1 88.6 89.3
84.3 90.3 88.3 87.7 89.6 88.3 91.1
90.1 90.0 90.4 91.1 90.4 94.2 83.4
89.0 91.5 91.2 86.7 91.6 85.3 93.2
Se puede denir la variable X como:
X : octanaje del combustible,
Tipo: cuantitativa continua,
Escala: razn
Nmero de clases k = 1+3,3log35 = 6,095 6
Rango R = X
(m ax)
X
(mn)
= 98,883,4 = 15,4
Amplitud A =
R
k
=
15,4
6
= 2,566 2,5
Clases (L
i
; L
i+1
] n
i h
i
N
i
h
i
X
i
83.4 - 85.9 83.35 - 85.95 3 0.086 3 0.086 84.65
86.0 - 88.5 85.95 - 88.55 5 0.143 8 0.229 87.25
88.6 - 91.1 88.55 - 91.15 16 0.457 24 0.686 89.85
91.2 - 93.7 91.15 - 93.75 7 0.200 31 0.886 92.45
93.8 - 96.3 93.75 - 96.35 3 0.086 34 0.972 95.05
96.4 - 98.9 96.35 - 98.95 1 0.029 35 1.000 97.65
- Total 35 1.000 - - -
Ejemplo 4. Los siguientes datos corresponden a los ingresos an-
uales de unos empleados en una empresa (en millones)
63.7 75.0 74.1 69.4 64.6 71.6
66.9 76.3 73.7 76.5 60.5 72.1
66.8 75.0 71.0 57.3 65.1 62.3
75.3 77.4 56.1 71.6 55.3 72.3
70.8 71.4 69.0 67.2 71.3 70.5
Se puede denir la variable X como:
X : ingreso en millones de pesos de los empleados
X : ruido ambiental del nivel de presin sonora,
Tipo: cuantitativa continua,
Escala: razn
Nmero de clases k = 1+3,3log30 = 5,8745 6
Rango R = X
(m ax)
X
(mn)
= 77,455,3 = 22,1
Amplitud A =
R
k
=
22,1
6
= 3,68 3,6
Clases (L
i
; L
i+1
] n
i h
i
N
i
h
i
X
i
55.3 - 58.9 55.25 - 58.95 3 0.100 3 0.100 57.1
59.0 - 62.6 58.95 - 62.65 2 0.067 5 0.167 60.8
62.7 - 66.3 62.65 - 66.35 3 0.100 8 0.267 64.5
66.4 - 70.0 66.35 - 70.05 5 0.167 13 0.433 68.2
70.1 - 73.7 70.05 - 73.75 10 0.333 23 0.767 71.9
73.8 - 77.4 73.75 - 77.45 7 0.233 30 1.000 75.6
- Total 30 1.000 - - -
Representacin grca
Medidas descriptivas
Son valores que caracterizan las observaciones de un conjunto de
datos. Estas medidas de resumen pueden ser de centralidad, disper-
sin o variabilidad, posicin, asimetra y apuntamiento
3
0.0.1. Medidas de centralidad
Son valores que representan un valor central hacia el cual tiene
tendencia a concentrarse el conjunto de datos.
Media aritmtica Es la medida ms utilizada en un conjunto de
datos, es un valor central que toma en cuenta todos los valores que
aparecen en el conjunto de datos y las distancias relativas a estos va-
lores. Los valores tienen la misma importancia en el grupo de datos.
Sean X
1
, X
2
, . . . , X
k
los valores de una variable X, de una muestra
de tamao n, (k n) con frecuencias absolutas n
1
, n
2
, . . . , n
k
respec-
tivamente. La media aritmtica x se dene como:
x =
1
n
(n
1
X
1
+n
2
X
2
+ +n
k
X
k
) =
1
n
k

i=1
n
i
X
i
Si la variable X tiene n valores diferentes, digamos X
1
, X
2
, . . . , X
n
,
entonces la media aritmtica se escribe como:
x =
1
n
(X
1
+X
2
+ +X
n
) =
1
n
n

i=1
X
i
Propiedades de la media
1. La suma de las desviaciones de los datos con respecto a la me-
dia es cero, esto es
n

i=1
(X
i
x) = 0
2. La suma de los cuadrados de las desviaciones a partir de la
media aritmtica es menor que la suma de los cuadrados de las
desviaciones a partir de cualquier otro valor, esto es
n

i=1
(X
i
x)
2
es mnima.
3. Si cada uno de los datos de la variable es constante, la media
ser igual al valor de la constante, es decir, si X
1
= k, X
2
=
k, . . . , X
n
= k, entonces
1
n
n

i=1
X
i
= k
4. Si cada uno de los datos de una variable es afectado aditi-
vamante (negativamente) por una constante k, la media de la
nueva variable es equivalente a sumar (restar) la constante a
la media de la variable original. Es decir, si Y
i
= X
i
k, para
i = 1, 2, . . . , n entonces y = x k
5. Si cada uno de los datos de una variable es afectado multiplica-
tivamente por una constante k, la media de la nueva variable es
equivalente a multiplicar la constante por la media de la vari-
able original. Es decir, si Y
i
= kX
i
, para i = 1, 2, . . . , n entonces
y = kx
6. Si se genera una variable como la combinacin lineal de dos
variables, la media de la nueva variable ser la combinacin
lineal de las medias de las variables originales, es decir, si
Z
i
= aX
i
+bY
i
, para todo i = 1, 2, . . . , n, entonces z = ax +by.
Mediana Es la segunda medida ms utilizada despus de la media
aritmtica, y es til para estimar el centro de un conjunto de datos. La
mediana es el elemento central del conjunto de datos, es una medida
de posicin y hay el mismo nmero de observaciones a la derecha y
a la izquierda del valor de la mediana.
Sean X
1
, X
2
, . . . , X
k
, los valores de una variable x con frecuencias
absolutas n
1
, n
2
, . . . , n
k
de una muestra de tamao n, (k n). Los va-
lores ordenados de X son X
(1)
, X
(2)
, . . . , X
(k)
. La mediana se calcula
como:
x = L
i
+
A
i
n
i
_
n
2
N
i1
_
donde:
L
i
es el lmite inferior de la clase mediana
A
i
es la amplitud de clase de la clase mediana
n
i
es la frecuencia absoluta de la clase mediana
N
i1
es la frecuencia absoluta acumulada de la clase anterior a
la clase mediana
n es el tamao de la muestra
Si la variable X tiene n valores diferentes, digamos X
1
, X
2
, . . . , X
n
,
entonces la mediana se escribe como:
x =
_

_
X
(
n+1
2
)
, si n es impar;
X
(
n
2
)
+X
(
n
2
+1
)
2
, si n es par.
Moda Representa el valor o valores que tienen la mayor frecuencia
dentro del conjunto de datos. La moda puede o no existir; en el even-
to en que exista, puede no ser nica, ya que una distribucin puede
eventualmente tener una o varias modas
Mo = L
i
+A
i

1
+
2
donde
L
i
es lmite inferior de la clase modal.
A
i
amplitud de clase de la clase modal

1
= n
i
n
i1
es la diferencia entre la frecuecia absoluta de la
clase modal y la frecuancia absoluta de la clase anterior a la
clase modal.

2
= n
i
n
i+1
es la diferencia entre la frecuecia absoluta de la
clase modal y la frecuancia absoluta de la clase posterior a la
clase modal.
4
Media geomtrica Es una medida de centralidad que se utiliza
generalmente cuando los valores dependen del tiempo; varan de
manera no lineal o cuando existe un alto grado de heterogeneidad
en el conjunto de datos.
Sean X
1
, X
2
, . . . , X
k
, los valores de una variable x con frecuencias
absolutas n
1
, n
2
, . . . , n
k
de una muestra de tamao n, (k n). La me-
dia geomtrica se calula como la raz n-sima del producto de todos
los datos, esto es:
x
g
=
n
_
X
n
1
1
X
n
2
2
X
n
k
k
Si la variable X tiene n valores diferentes, digamos X
1
, X
2
, . . . , X
n
,
entonces la media geomtrica se escribe como:
x
g
=
n

X
1
X
2
X
n
Para facilitar el clulo de la media geomtrica, se utilizan las si-
guientes expresiones
x
g
= 10
1
n

k
i=1
n
i
logX
i
y
x
g
= 10
1
n

n
i=1
logX
i
Media armnica Aunque su campo de aplicacin es muy restringi-
do, es til para promediar velocidades, volmenes de ventas y cuando
la variable crece en progresin armnica.
Sean X
1
, X
2
, . . . , X
k
, los valores de una variable x con frecuencias
absolutas n
1
, n
2
, . . . , n
k
de una muestra de tamao n, (k n). La me-
dia armnica se calula como:
x
h
=
1

k
i=1
n
i
X
i
n
=
n

k
i=1
n
i
X
i
Si la variable X tiene n valores diferentes, digamos X
1
, X
2
, . . . , X
n
,
entonces la media armnica se escribe como:
x
h
=
1

n
i=1
1
X
i
n
=
n

n
i=1
1
X
i
Observacin: La relacin entre la media aritmtica, geomtrica
y armnica se presenta een la siguiente desigualdad
x
h
x
g
x
Media cuadrtica Es otra medida de tendencia central que con-
siste en elevar al cuadrado los valores y generar la raz cuadrada de
la media aritmtica de estos nuevos valores.
Sean X
1
, X
2
, . . . , X
k
, los valores de una variable x con frecuencias
absolutas n
1
, n
2
, . . . , n
k
de una muestra de tamao n, (k n). La me-
dia cuadrtica se calula como:
x
2
=

_
1
n
k

i=1
n
i
X
2
i
Si la variable X tiene n valores diferentes, digamos X
1
, X
2
, . . . , X
n
,
entonces la media cuadrtica se escribe como:
x
2
=

1
n
n

i=1
X
2
i
Media ponderada Cuando se conoce la media de varios grupos de
datos y el nmero de datos en cada grupo, se puede calcular la media
global que se conoce como media ponderada
x
p
=
n
1
x
1
+n
2
x
2
+ +n
k
x
k
n
1
+n
2
+ +n
k
0.1. Medidas de dispersin
Permiten generar criterios sobre el grado de homogeneidad o het-
erogeneidad del conjunto de datos que se est analizando, en relacin
con una medida de centralidad, o con respecto a datos entre s.
Rango diferencia entre al valor mximo y el valor mnimo del con-
junto de datos y mide la longitud en la cual se encuentran los datos,
en general a mayor longitud mayor dispersin de los datos.
R = X
(n)
X
(1)
Desviacin media Es la media aritmtica de los valores absolutos
de las desviaciones de los datos, con respecto a la media. En el cl-
culo de esta medida, intervienen todos los valores en el conjunto de
datos, por lo tanto, permite una informacin relativa de todos ellos y
da un mejor conocimiento del grado de variabilidad de la distribucin
de los datos que el rango.
Sean X
1
, X
2
, . . . , X
k
, los valores de una variable x con frecuen-
cias absolutas n
1
, n
2
, . . . , n
k
de una muestra de tamao n, (k n). La
desviacin media:
dm =
1
n
k

i=1
n
i
|X
i
x|
Si la variable X tiene n valores diferentes, digamos X
1
, X
2
, . . . , X
n
,
entonces la desviacin media se escribe como:
dm =
1
n
n

i=1
|X
i
x|
Varianza La varianza mide las variaciones del conjunto de datos
con respecto a su media aritmtica y se dene comola media arit-
mtica de los cuadrados de las desviaciones de cada dato a la media
aritmtica.
Sean X
1
, X
2
, . . . , X
k
, los valores de una variable x con frecuencias
absolutas n
1
, n
2
, . . . , n
k
de una muestra de tamao n, (k n). La vari-
anza muestral se calcula como:
S
2
=
1
n
k

i=1
n
i
(X
i
x)
2
Si la variable X tiene n valores diferentes, digamos X
1
, X
2
, . . . , X
n
,
entonces la varianza se escribe como:
S
2
=
1
n
n

i=1
(X
i
x)
2
5
Las expresiones anteriores pueden ser alternativamente escritas
como:
S
2
=
1
n
_
k

i=1
n
i
X
2
i
nx
2
_
y
S
2
=
1
n
_
n

i=1
X
2
i
nx
2
_
respectivamente.
Propiedades de la varianza:
1. El valor de la varianza es siempre positivo o igual a cero, esto
es S
2
0, para cualquier conjunto de datos.
2. Si cada uno de los datos de la variable es constante, la varianza
igual a cero, es decir, si X
1
= k, X
2
= k, . . . , X
n
= k, entonces
1
n
n

i=1
(X
i
x)
2
= 0
3. Si cada uno de los datos de una variable es afectado aditiva-
mante (negativamente) por una constante k, la varianza de la
nueva variable es igual a la varianza de la variable original. Es
decir, si Y
i
= X
i
k, para i = 1, 2, . . . , n entonces S
2
y
= S
2
x
4. Si cada uno de los datos de una variable es afectado multiplica-
tivamente por una constante k, la varianza de la nueva variable
es igual al cuadrado de la constante por la varianza de la vari-
able original. Es decir, si Y
i
= kX
i
, para i = 1, 2, . . . , n entonces
y = kx.
Desviacin estndar Una de las limitaciones de la varianza son
sus unidades al cuadrado. Para superar esto se usa la raz cuadrada de
la varianza, dando origen al concepto de desviacin estndar.
S =

_
1
n
k

i=1
n
i
(X
i
x)
2
Coeciente de variacin Permite estimar la relacin porcentual
entre el valor de la media y la desviacin estndar. A medida que
se presenta mayor heterogeneidad en el conjunto de datos, el valor
del coeciente de variacin es mayor
CV =
S
x
100%
0.2. Medidas de Asimetra y Apuntamiento
Un conjunto de datos puede ser simtrico o asimtrico. Las medi-
das de asimetra permiten evaluar tal grado, (sesgo negativo, positivo
o cero). La curtsis es el grado de agudeza en la cima de la curva de
un conjunto de datos. Una distribucin puede ser achatada o platicr-
tica, normal o mesocrtica pauntada o leptocrtica.
Las caractersticas anteriores pueden ser cuanticadas mediante
las expresiones siguientes
Grado de asimetra
g
1
=
m
3
S
3
donde m
3
=
n
i=1
n
i
(X
i
x)
3
y S es la desviacin estndar del
conjunto de datos.
Si g
1
= 0 se dice que la distribucin del conjunto de datos es
simtrica. Si g
1
< 0 se dice que la distribucin es asimtrica negativa
y Si g
1
> 0 se dice que la distribucin es asimtrica positiva.
Grado de apuntamiento
g
2
=
m
4
S
4
donde m
4
=
n
i=1
n
i
(X
i
x)
4
y S es la desviacin estndar del
conjunto de datos.
Si g
2
= 3 se dice que la distribucin del conjunto de datos es nor-
mal o mesocrtica. Si g
2
< 3 se dice que la distribucin es achatada
o platicrtica y Si g
2
> 3 se dice que la distribucin es apuntada o
leptocrtica.
6
Elementos de Probabilidad
Un experimento , es cualquier accin o proceso cuyo resultado
est sujeto a la incertidumbre. Estos experimentos se llevan a cabo
bajo ciertas condiciones un nmero denido o indenido de veces.
Un experimento de dice que es determinstico, cuando adems
de conocer los posibles valores del experimento, tambin se conoce
un resultado particular de l.
Un experimento de dice que es aleatorio cuando, puede producir
resultados diferentes, an cuando se repita siempre de la misma ma-
nera.
Ejemplo 5.
Son ejemplos de experimentos aleatorios los siguientes:
1.
1
: el lanzamiento de un dado no cargado y observar el nmero
que aparece en la cara superior.
2.
2
: el lanzamiento de una moneda cuatro veces y contar el
nmero total de caras obtenidas.
3.
3
: la fabicacin de artculos en una lnea de produccin y
conar el nmero de artculos defectuosos producidos en un
perodo de 24 horas.
4.
4
: El ala de un aeroplano se arma con un gran nmero de
remaches. Contar el nmero de remaches defectuosos.
5.
5
: Fabricar una bombilla. Luego se prueba su duracin conec-
tndola a un portalmparas y se anota el tiempo transcurrido
(en horas) hasta que se quema.
6.
6
: Fabricar artculos hasta producir 10 no defectuosos. Contar
el nmero total de artculos manofacturados.
7.
7
: Medir la resistencia a la tensin de una barra de acero.
8.
8
: Un termgrafo marca la temperatura continuamente en un
perodo de 24 horas. En un sitio y una fecha sealados, leer
dicho termgrafo.
9.
9
: Tiempo empleado por una persona de su casa al trabajo.
10.
10
: Nmero de personas que llegan a una ocina bancaria en
un perodo de 10 horas.
Con cada experimento considerado en el ejemplo anterior,
denimos el espacio muestral como el conjunto de todos los re-
sultados posibles de . Usualmente designamos este conjunto como
.
Para cada experimento considerado anteriormente, se describe el
espacio muestral asociado como sigue
1.
1
={1, 2, 3, 4, 5, 6}
2.
2
={0, 1, 2, 3, 4}
3.
3
={0, 1, 2, . . . , N}, donde N es el nmero mximo de artcu-
los que se pudo construir en 24 horas.
4.
4
= {0, 1, 2, . . . , M}, donde M es el nmero de remaches in-
stalados.
5.
5
={t : t 0}
6.
6
={10, 11, . . . }
7.
7
={S : S 0}
8.
8
={t : mt M}, donde m es la temperatura mnima y M
es la temperatura mxima.
9.
9
={t : t 0}
10.
10
={0, 1, . . . , N}
Un evento A respecto a un espacio muestral particular , es
cualqier recopilacin (subconjunto) del espacio muestral . Esto sig-
nica que mismo es un evento y tambin lo es el conjunto / 0.
Los siguientes son ejemplos de eventos asociados a los exper-
imentos antes anotados: A
i
se referir a un evento asociado con el
experimento
i
1. A
1
: Un nmero par ocurre; esto es, A
1
={2, 4, 6}.
2. A
2
: Se obtienen dos o ms caras; A
2
={2, 3, 4}.
3. A
3
: Todos los artculos fueron no defectuosos; A
3
={0}.
4. A
4
: Se obtienen menos de cuatro remaches defectuosos; A
4
=
{0, 1, 2, 3}.
5. A
5
: La bombilla se quema en menos de 10 horas; A
5
={t : 0
t 10}.
6. A
6
: El nmero total de artculos manofacturados es inferior a
16; A
6
={10, 11, 12, 13, 14, 15}.
Dados los eventos A y B asociados a un experimento aleatorio
, tales que, AB = / 0, entonces A y B se denominan eventos ex-
cluyentes.
Sean A y B eventos asociados a , tales que A B = y
AB = / 0, entonces A y B se denominan eventos complementarios.
Note que el elemento complementario de A es B = A

.
Concepto de probabilidad
Probabilidad clsica
Sea un experimento y un espacio muestral asociado con .
Sea A un evento de . La probabilidad de ocurrencia del evento A,
denotada P(A), se dene como:
P(A) =
n(A)
n()
donde n(A) es el nmero de elementos de A (casos favorables a
A) y n() es el nmero de elemetos del espacio muestral (total de
casos posibles).
7
Probabilidad axiomtica
Sea un experimento y un espacio muestral, el objetivo de la
probabilidad es asignar a cada elemento de A, un nmero P(A), lla-
mado la probabilidad del evento A, el cual dar una medida precisa
de la oportunidad de que A ocurra. Todas las asignaciones debern
satisfacer lkos siguientes axiomas (propiedades bsicas) de probabil-
idad
1. Para cualquier evento A, P(A) 0
2. P() = 1
3. si A
1
, A
2
, , A
3
, . . . es un conjunto de eventos mutuamente ex-
cluyentes, entonces
P(A
1
A
2
A
3
) =

i=1
P(A
i
)
Propiedades
1. P(/ 0) = 0, donde / 0 es el evento nulo
2. Para cualquier evento A, P(A

) = 1P(A)
3. Para cualquier evento A, P(A) 1
4. Para dos eventos cualesquiera A y B,
P(AB) = P(A) +P(B) P(AB)
Si A y B son mutuamente excluyentes, entonces
P(AB) = P(A) +P(B)
5. Para dos eventos cualesquiera A y B,
P(AB) = P(AB

) = P(A) P(AB)
6. Para tres eventos A, B y C se tiene
P(ABC) = P(A) +P(B) +P(C)
P(AB) P(AC) P(bC)
+P(ABC)
Si A, B y C son mutuamente excluyentes, entonces
P(ABC) = P(A) +P(B) +P(C)
Tcnicas de enumeracin
Regla del producto
Supngase que un conjunto se compone de conjuntos ordenados
de k elementos, y que existen n
1
opciones para el primer elemento
por cada opcin del primer elementos; existen n
2
opciones del se-
gundo elemento por cada opcin del segundo elemento;...; existen n
k
opciones del elemento k-simo. Existen entonces n
1
n
2
n
k
posibles
opciones en total.
Permutaciones y combinaciones
Un subconjunto ordenado se llama permutacin. El nmero de
permutaciones de tamao k que se pueden formar con los n individ-
uos u objetos en un grupo ser denotado por P
k,n
. Un subconjunto
no ordenado se llama combinacin. El nmero de combinaciones de
tamao k que se pueden formar co los n individuos u objetos en un
grupo ser denotado por C
k,n
o
_
n
k
_
que se lee k tomados de n
Teorema 1. El nmero de permutaciones y combinaciones de n ob-
jetos tomando k a la vez es dado respectivamente por:
(1) P
k,n
=
n!
(nk!)
(2)
_
n
k
_
=
P
k,n
k!
=
n!
k!(nk!)
Probabilidad condicional
Para dos eventos cualesquiera A y B con P(B) > 0, la probabili-
dad condicional de A dado que B ha ocurrido est denida por
P(A|B)] =
P(AB)
P(B)
Regla multipicativa para P(AB)
De la denicin de probabilidad condicional se obtiene el
siguiente resultado, multiplicando ambos miembros de la ecuacin
anterior por P(B)
P(AB) = P(B)P(A|B)
Para tres eventos A, B y C se tiene
P(ABC) = P(A)P(B|A)P(C|AB)
Ley de la probabilidad total
Sean A
1
, A
2
, . . . , A
k
eventos mutuamente excluyentes y exhaus-
tivos. Entonces para cualquier otro evento B,
P(B) = P(A
1
)P(B|A
1
) +P(A
2
)P(B|A
2
) + +P(A
k
)P(B|A
k
)
=
k

i=1
P(A
i
)P(B|A
i
)
Ley de la probabilidad total
Sean A
1
, A
2
, . . . , A
k
eventos mutuamente excluyentes y exhaus-
tivos con probabilidades previas P(A
1
) (para i =1, 2, . . . , k). Entonces
para cualquier otro evento B para el cual P(B) > 0, la probabilidad
posterior de A
j
dado que B ha ocurrido es
P(A
j
|B) =
P(A
j
B)
P(B)
=
P(A
j
)P(B|A
j
)

k
i=1
P(A
i
)P(B|A
i
)
8
Independencia
Los eventos A y B son independientes si P(A|B) = P(A), de lo
contrario se dice que son dependientes.
De lo anterior se deduce que:
A y B son independientes si y solo si P(AB) = P(A)P(B)
Independencia de ms de dos eventos
Los eventos A
1
, a
2
, . . . , A
k
son mutuamente independientes si
para cada k (k =1, 2, . . . , n) y cada subconjunto de ndices i
1
, i
2
, . . . , i
k
P(A
i
1
A
i
2
A
i
k
) = P(A
i
1
)P(A
i
2
) P(A
i
k
)
9

También podría gustarte