Está en la página 1de 15

1.

ESTADISTICA DESCRIPTIVA Y FUNDAMENTOS


DE PROBABILIDAD
1.1. Notacin De Sumatoria
Consideremos las siguientes sumas:

Para

1.2. Datos No agrupados


1.2.1. Medidas de Tendencia Central y de posicin
Medidas de tendencia central: Son indicadores estadsticos que muestran
hacia que valor (o valores) se agrupan los datos.
Esta primera parte la dedicaremos a analizar tres medidas de tendencia central:
 La media aritmtica
 La moda
 La mediana
En el suplemento de este capitulo incluiremos otras medidas de tendencia central.

Media aritmtica ( o X ): Es el valor resultante que se obtiene al dividir la


sumatoria de un conjunto de datos sobre el nmero total de datos. Solo es
aplicable para el tratamiento de datos cuantitativos.

Hay que entender que existen dos formas distintas de trabajar con los datos
tanto poblacionales como mustrales: sin agruparlos o agrupndolos en tablas
de frecuencias. Esta apreciacin nos sugiere dos formas de representar la
media aritmtica.

Media aritmtica para datos no agrupados


Podemos diferenciar la frmula del promedio simple para datos poblaciones y
mustrales :
N

i=1

Poblacin

X=

X
i

i=1

Muestra

Observe que la variacin de ambas frmulas radica en el tamao de los


datos (N identifica el tamao de la poblacin, mientras que n el de la
muestra).

1.2.2.

Medidas de dispersin

La dispersin de un conjunto de observaciones se refiere a la variedad que


muestran stas. Mide la cantidad total de variabilidad presente en el conjunto
de datos.
Para valores iguales NO hay dispersin. Las ms frecuentes son: amplitud,
varianmcia o varianza y el coeficiente de variacin.
a.

Amplitud: (R): Es la diferencia entre el valor ms pequeo (xs) y el ms grande


(xl) en un conjunto de observaciones.

Las ventajas son:


ii.
iii.
b.

Simplicidad del clculo mm.


Pobre por solo tomar dos datos

La Varianza: Es una medida de la dispersin de los datos alrededor de una


media.

Clculo: se resta la media de cada uno de los valores individuales, las


diferencias se elevan al cuadrado y despus se suman entre s. Luego esta
suma se divide entre el tamao de la muestra menos 1, obtenindose as la
Varianza. En notacin compacta es:
c.

Varianza poblacional: se simboliza por

b.

Varianza de la muestra: se simboliza por

c.

Poblacional

La varianza representa unidades al cuadrado, por lo que no es una medida


adecuada de dispersin si se pretende expresar este concepto en trmino de las
unidades originales. Entonces la desviacin estndar es igual a la raz cuadrada
de la varianza.

Desventajas: No funciona bien cuando se quiere comparar la dispersin de dos


conjuntos de datos. Las dos variables involucradas tienen medidas en
diferentes unidades. Ejemplo:
2.
3.

Colesterol: Mgr/l00 ml suero V.S peso litros.


Nios diferentes edades: Kl libras

Una medida de la varianza relativa NO absoluta es el coeficiente dee variacin:

La desviacin estndar se presenta como un porcentaje de la media.


Ventajas: Es independiente de la unidad de medicin.

1.3. Datos Agrupados


1.3.1. Tabla de frecuencias
INTERVALO

FRECUENCIA

MEDIA
DE
CLASE

MIFI

FRECUENCIA
ACUMULADA

1019

14.5

72.5

2029

19

24.5

465.5

24

3039

10

34.5

345.0

34

4049

13

44.5

578.5

47

5059

54.5

218.0

5!

6069

64.5

258.0

55

7079

74.5

149.0

57

TOTAL

57

1.3.2.

2086.5

Medidas de tendencia Central

Muchas veces no se tiene acceso a los datos originales, pero s la


distribucin de frecuencia. Cuando los datos se agrupan, las
observaciones individuales pierden su identidad. Es posible
determinar el nmero de observaciones que caen dentro de varios
intervalos de clase, pero los valores reales no se pueden
determinar.
Hacer suposiciones respecto a los valores cuando se calcula una
medida descriptiva a partir de datos agrupados.
La Media: Suposicin, todos los valores que caen dentro (le mm
intervalo tic clase especfico se localizan en:

1.

Punto medio del intervalo:

2.
Se multiplica el punto medio por la frecuencia
correspondiente, se suman esos productos y se divide entre la suma de frecuencia.

INTERVALO

FRECUENCIA

MEDIA
DE
CLASE

MIFI

FRECUENCIA
ACUMULADA

1019

14.5

72.5

2029

19

24.5

465.5

24

3039

10

34.5

345.0

34

4049

13

44.5

578.5

47

5059

54.5

218.0

5!

6069

64.5

258.0

55

7079

74.5

149.0

57

TOTAL

57

2086.5

Mediana: Suposicin: los datos estn distribuidos uniformememite


a travs del intervalo.

Donde:
Li = lmite inferior real dcl intervalo que contiene la mediana
Vi = lmite superior real del intervalo que contiene a la mediana
,
N = nmero total de observaciones
j = nmero de observaciones que faltan para alcanzar a la
mediana, despus de que el lmite inferior del intervalo que
contiene a la mediana ha sitio alcanzado.
fi = frecuencia del intervalo que contiene a la mediana

1.3.3.

Medidas de dispersin

Clculo de la desviacin tpica para datos agrupados en clases y agrupados


por frecuencias
Mtodo largo: Se aplica la siguiente frmula

S=

fx

donde x = x m x y f es la frecuencia absoluta de cada intervalo.


Mtodo abreviado o corto: La frmula a utilizar es:

S=I

fd

fd

donde:
I: amplitud de la clase
D: distancia en clases desde cada una en concreto a la clase que contiene a la
media supuesta A.
La desviacin tpica se define como la raz cuadrada de la media de los
cuadrados de las desviaciones con respecto a la media de la distribucin. Es
decir,

(x x )

S=

Veamos ahora cmo se calcula la desviacin media en el caso de datos


agrupados en intervalos.

DM =

n x
i

RANGO, AMPLITUD TOTAL O RECORRIDO

El rango se suele definir como la diferencia entre los dos valores extremos que toma la
variable. Es la medida de dispersin ms sencilla y tambin, por tanto, la que
proporciona menos informacin. Adems, esta informacin puede ser errnea, pues el
hecho de que no influyan ms de dos valores del total de la serie puede provocar una
deformacin de la realidad.
Comparemos, por ejemplo, estas dos series:

Serie 1: 1 5 7 7

9 10 17

Serie 2: 2 4 6 8 10 12 14 16 18

Ambas series tienen rango 16, pero estn desigualmente agrupadas, pues mientras la
primera tiene una mayor concentracin en el centro, la segunda se distribuye
uniformemente a lo largo de todo el recorrido.

El uso de esta medida de dispersin, ser pues, bastante restringido.

1.4. Conjunto y tcnicas de conteo


El desarrollo de la teora de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadstica. Muchos conjuntos de datos se pueden
aproximar, con gran exactitud, utilizando determinadas distribuciones
probabilsticas; los resultados de stas se pueden utilizar para analizar datos
estadsticos. La probabilidad es til para comprobar la fiabilidad de las
inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios
en un determinado estudio estadstico.
TEORAS DE CONTEO

Permutaciones y combinaciones: Contar el nmero de eventos que cumplen


con algn conjunto de condiciones. Sirven para calcular la probabilidad de un
evento cuando el nmero de eventos posibles es muy grande.
Factoriales: Dado un nmero entero positivo n el producto de todos los
enteros desde n hasta 1 se llama factorial de n y se denota como n!. Ejemplo:
5! = 5 * 4 * 3 * 2 * 1
en notacin: n! = n * (n-1) * (n-2) * ... 1
por definicin 0! = 1
otra notacin: 5! = 5 * 4!
n! = n (n-l)
Los factoriales sc usan para saber el nmero de formas en que se pueden
organizar los objetos. Ejemplo:
cuatro envases con medio de cultivo y en cada uno de ellos se incuba un
organismo diferente. En cuantas formas se pueden acomodar en una
incubadora?
4! =4 3 * 2 * 1 = 24 maneras
Para saber cuales son las formas de colocarlos se realiza un diagrama de rbol

A continuacin se presentan alguna tcnicas que sern tiles.












Principio multiplicativo
Principio aditivo
Permutaciones
Permutaciones con repeticin
Pruebas ordenadas
Combinaciones
Particiones ordenadas
Diagrama de rbol
Problemas propuestos

1.5. Espacio muestral y eventos


EL ESPACIO MUESTRAL ES UN CONJUNTO FORMADO POR TODOS LOS
POSIBLES RESULTADOS DE UN EXPERIMENTO ALEATORIO.
A cada elemento del espacio muestral se conoce como punto muestral
(elemento o miembro del espacio muestral).
Notacin. El espacio muestral de un experimento se denota por medio de la
letra S. En algunas referencias se usa la letra griega mayscula omega, ,
para representar el espacio muestral.

1.6. Axiomas y Teoremas


Para el clculo de probabilidades hay que tomar en cuenta los Axiomas
Teoremas que a continuacin se enumeran.
1) a probabilidad de que ocurra un evento A cualquiera se encuentra entre
cero y uno.
0 p(A) 1
2) a probabilidad de que ocurra el espacio muestral debe de ser 1.
p ) = 1
3) i A y B son eventos mutuamente excluyentes, entonces la p(AB) = p(A) +
p(B) Generalizando:
Si se tienen n eventos mutuamente excluyentes o exclusivos A1, A2, A3,.....An,
entonces;
p(A1A2.........An) = p(A1) + p(A2) + .......+ p(An)
TEOREMAS
TEOREMA 1. Si es un evento nulo o vaco, entonces la probabilidad de que
ocurra debe ser cero.

p()=0
DEMOSTRACIN:
Si sumamos a un evento A cualquiera, como y A son dos eventos
mutuamente excluyentes, entonces p(A)=p(A) +p()=p(A). LQQD
TEOREMA 2.
La probabilidad del complemento de A, Ac debe ser, p(Ac)= 1 p(A)
DEMOSTRACIN:
Si el espacio muestral , se divide en dos eventos mutuamente exclusivos, A y
Ac luego =AAc, por tanto p()=p(A) + p(Ac) y como en el axioma dos se
afirma que p()=1, por tanto, p(Ac)= 1 - p(A) .LQQD
TEOREMA 3.
Si un evento A B, entonces la p(A) p(B).
DEMOSTRACIN:
Si separamos el evento B en dos eventos mutuamente excluyentes, A y B \ A
(B menos A), por tanto, B=A(B \ A) y p(B)=p(A) +p(B \ A), luego entonces si
p(B \ A)0 entonces se cumple que p(A)p(B). LQQD
TEOREMA 4. La p( A \ B )= p(A) p(AB)
DEMOSTRACIN: Si A y B son dos eventos cualquiera, entonces el evento A
se puede separar en dos eventos mutuamente excluyentes, (A \ B) y AB, por
tanto, A=(A \ B)(AB), luego p(A)=p(A \ B) + p(AB), entonces, p(A \ B) =
p(A) p(AB). LQQD
TEOREMA 5. Para dos eventos A y B, p(AB)=p(A) + p(B) p(AB).
DEMOSTRACIN: Si AB = (A \ B) B, donde (A \ B) y B son eventos
mutuamente excluyentes, por lo que p(A B) = p(A \ B) + p(B) y del teorema
anterior tomamos que p(A \ B) = p(A) p(AB), por tanto, p(AB) = p(A) + p(B)
p(AB). LQQD

1.7. Espacio infinito equiprobable


Sea un espacio muestral que contiene n elementos, = {a1, a2, a3,....,an}, si a
cada uno de los elementos de le asignamos una probabilidad igual de
ocurrencia, pi = 1/n por tener n elementos , entonces estamos transformando
este espacio muestral en un espacio finito equiprobable, el que debe cumplir
con las siguientes condiciones:
1.

Las probabilidades asociadas a cada uno de los elementos del espacio


muestral deben ser mayores o iguales a cero, pi 0.

2.

La sumatoria de las probabilidades asociadas a cada elemento del


espacio muestral debe de ser igual a 1.
pi = 1
En caso de que no se cumpla con las condiciones anteriores, entonces no se
trata de un espacio finito equiprobable.
Solo en el caso de espacios finitos equiprobables, si deseamos determinar la
probabilidad de que ocurra un evento A cualquiera, entonces;
p(A) = r*1/n = r/n
p(A) = maneras de ocurrir el evento A/ Nmero de elementos del espacio
muestral
r = maneras de que ocurra el evento A
1/n = probabilidad asociada a cada uno de los elementos del espacio muestral
n = nmero de elementos del espacio muestral
ESPACIOS FINITOS DE PROBABILIDAD.
Sea el espacio muestral, que contiene n elementos {a1, a2, a3,.....,an}, si a
cada uno de los elementos de le asignamos una probabilidad pi 0, entonces
estamos transformando este espacio muestral en un espacio finito de
probabilidad; el que debe cumplir con las siguientes caractersticas:
1) Las probabilidades asociadas a cada uno de los elementos de deben ser
mayores o iguales a cero, pi0.
2) La sumatoria de las probabilidades asociadas a cada uno de los elementos
de debe de ser igual a 1.
pi = 1
En caso de que no se cumpla con las caractersticas antes mencionadas,
entonces no se trata de un espacio finito de probabilidad.

1.8. Probabilidad condicional e independencia


Sea un espacio muestral en donde se ha definido un evento E, donde p(E)>0,
si deseamos determinar la probabilidad de que ocurra un evento A (el que
tambin es definido en el mismo espacio muestral), dado que E ya ocurri,
entonces deseamos determinar una probabilidad de tipo condicional, la que se
determina como se muestra;
p( A | E ) =

p( A E )
p( E )

Donde:
p(AE) = probabilidad de que ocurra A dado que E ya ocurri
p(AE) = probabilidad de que ocurra A y E a un mismo tiempo
p(E) = probabilidad de que ocurra E
Luego;
P( A E ) =

P( E ) =

A E

Por tanto:
P( A | E ) =

A E
E

Donde:
AE= nmero de elementos comunes a los eventos A y E
E= nmero de elementos del evento E

Luego entonces podemos usar cualquiera de las dos frmulas para calcular la
probabilidad condicional de A dado que E ya ocurri.
Sucesos independientes
INDEPENDENCIA
Dos sucesos son independientes si y slo si p(A P B) = p(A) p(B).
Si dos sucesos son independientes

y del mismo modo p(B|A) = p(B).


Esta propiedad coincide ms con la idea intuitiva de independencia y algunos
textos la dan como definicin. Hay que notar, sin embargo, que ambas
definiciones no son estrictamente equivalentes.

1.1. Teorema de bayes


Ya que nos hemos referido a l en diferentes apartados de nuestro libro,
veamos que el famoso teorema de Bayes, enunciado por Thomas Bayes, en la
teora de la probabilidad, es el resultado que da la distribucin de probabilidad
condicional de una variable aleatoria A dada B en trminos de la distribucin de
probabilidad condicional de la variable B dada A y la distribucin de
probabilidad marginal de slo A.
Sea {A1,A2,...,Ai,...,An} un conjunto de sucesos incompatibles cuya unin es el
conjunto total y tales que la probabilidad de cada uno de ellos es distinta de
cero. Sea B un suceso cualquiera del que se conocen las probabilidades
condicionales P(B|Ai). Entonces, la probabilidad P(Ai|B) viene dada por la
expresin:
donde:
P(Ai) son las probabilidades a priori.
P(B|Ai) es la probabilidad de B en la hiptesis Ai.
P(Ai|B) son las probabilidades a posteriori.
i = 1, ..., n.Esto se cumple
Una explicacin ms detallada del concepto sera la siguiente. Sean los
sucesos elementales y mutuamente excluyentes: A1, A2, ..., An tales que
constituyen un sistema completo de sucesos cuya unin es el espacio muestral
E, esto es, tales que:
An = E ... A2 A1
j si i Aj = Ai
Se suponen conocidas las probabilidades P(Ai) -que se acostumbran a
denominar probabilidades a priori- as como las probabilidades condicionadas
P(B/Ai), llamadas verosimilitudes, donde B es un suceso cualquiera que se
sabe realizado.
El problema que resuelve el teorema de Bayes o teorema sobre la probabilidad
de causas es obtener las probabilidades a posteriori, esto es, las P(Ai/B). Se
tiene, evidentemente:

B) = P(Ai) P(B/Ai) = P(B) P(Ai/B)P(Ai


de donde:
Pero, por otra parte:
An) (BXA2) (BA1) An) = (B ... A2 (A1 E = BB = B
y debido a la incompatibilidad, se cumplir que:
An) =A2) + ... + P(BA1) + P(BP(B) = P(B
= P(A1) P(B/A1) + P(A2) P(B/A2) + X + P(An) P(B/An)
Resultando, en definitiva, la expresin general:
Sea, como ejemplo de aplicacin, el siguiente ejercicio.
Una vez realizadas las pruebas pertinentes se observa que un sistema
psicolgico (individuo) afectado de dislalia posee un promedio diario de
expresin verbal del 50% por la maana (8h. 14h.), 30% por la tarde (14h.
20h.) y 20% por la noche (20h. 24h.). Los porcentajes de palabras
defectuosamente pronunciadas son, respectivamente, del 3%, 4% y 5%. Cul
es la probabilidad de producir una palabra defectuosa segn cada fase del da?
Solucin:
P(D/M) = 003P(M) = 050
P(D/T) = 004P(T) = 030
P(D/N) = 005P(N) = 020
As pues, la probabilidad de emitir una palabra defectuosa por la maana, ser:
Del mismo modo, por la tarde, se tendr:
Por ltimo, por la noche, se tendr:
que tambin podra haberse obtenido, lgicamente, por la aplicacin
individualizada de la frmula correspondiente.
Digamos, en definitiva, que el teorema de Bayes resulta vlido en todas las
aplicaciones de la teora de la probabilidad. Sin embargo, hay una controversia
sobre el tipo de probabilidades que emplea. En esencia, los seguidores de la
estadstica tradicional slo admiten probabilidades basadas en experimentos
repetibles y que tengan una confirmacin emprica mientras que los llamados
estadsticos bayesianos permiten probabilidades subjetivas. El teorema puede
servir entonces para indicar cmo debemos modificar nuestras probabilidades
subjetivas cuando recibimos informacin adicional de un experimento. La

estadstica bayesiana est demostrando su utilidad en ciertas estimaciones


basadas en el conocimiento subjetivo a priori y permite revisar esas
estimaciones en funcin de la evidencia, lo que est abriendo nuevas formas
de hacer conocimiento. Como observacin, se tiene que:
y su demostracin resulta trivial.

Bibliografa
Devore, J.L. (2000). Probabilidad y Estadstica para Ingeniera y Ciencias, Quinta
Edicin, Thomson Learning.
Mendenhall, W. (1998). Estadstica para Administradores, Segunda Edicin, Grupo
Editorial Iberoamrica.
Montgomery, D.C. y Runger G.C. (1996). Probabilidad y Estadstica Aplicadas a la
Ingeniera, Primera Edicin, Mc Graw Hill.
Sheaffer, R. L. y McClave, J.T. (1990). Probabilidad y Estadstica para Ingeniera,
Primera Edicin, Grupo Editorial Iberoamrica.
Spiegel, M.R. (1970). Estadstica, Primera Edicin, Serie Schaum, Mc Graw Hill.
Walpole, R. E., Myers, R.H., y Myers, S.L. (1998). Probabilidad y Estadstica para
Ingenieros, Sexta Edicin, Prentice Hall.
Weimer, R.C. (1996). Estadstica, Segunda Edicin, CECSA.

ACTIVIDADES COMPLEMENTARIAS.
1.-Para un hijo de una mujer portadora de Duchenne, el sexo y la enfermedad
son independientes?
Segn vimos en el el espacio muestral es = {xX, xY, XX, XY}
Definimos los sucesos A = {varn} = {xY, XY}; B = {enfermo} = {xY}
A

B
=
{xY}
por lo tanto p(A) = 0,5; p(B) = 0,25; p(A B) = 0,25 p(A) p(B)

2.- Se lanza al aire una moneda normal (una moneda perfectamente


equilibrada) tres veces, determine la probabilidad de que: a. Aparezcan
puros sellos, b. Aparezcan dos guilas, c. Aparezcan por lo menos dos
guilas.
3.- El profesor de la materia de estadstica desea conocer el promedio de las
notas finales de los 10 alumnos de la clase. Las notas de los alumnos son:
3,2
3,0

3,1
3,5

2,4
3,8

4,0
4,2

3,5
4,0

Cul es el promedio de notas de los alumnos de la clase?


4.- En una competencia de ciclismo participan A, B y C, A tiene el doble de
posibilidades de ganar que B y B el doble que C, a. Determine la
probabilidad de que gane B, b. Determine la probabilidad de que gane A o
B.

También podría gustarte