Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica 1
Estadistica 1
NCLEO ANZOTEGUI
ESCUELA DE INGENIERA Y CIENCIAS APLICADAS
DEPARTAMENTO DE ELECTRICIDAD
CTEDRA: ESTADSTICA
DISTRIBUCIONES DE
FRECUENCIAS Y
PROBABILIDADES
Entonces, una poblacin es el conjunto de todas las cosas que concuerdan con
una serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de
todos los elementos de una poblacin.
Las poblaciones pueden ser finitas e infinitas. Las dificultades son mayores si en
nmero de elementos de la poblacin es infinito, si los elementos se destruyen, si
sufren daos al ser medidos o estn muy dispersos, si el costo para realizar el trabajo
es muy costoso.
Las poblaciones suelen ser muy numerosas, por lo que es difcil estudiar a todos
sus miembros; adems de que esto no es posible, no es necesario. Es como si se
quisiera estudiar la composicin qumica del agua de un ro y para ello se intentar
analizar toda el agua que corre por su cauce, cuando solamente se puede tomar unas
muestras para realizar ese estudio y llegar a conclusiones generalizables con respecto a
la composicin qumica del agua a todo el ro.
Es bueno sealar que en un momento una poblacin puede ser muestra en una
investigacin y una muestra puede ser poblacin, esto esta dado por el objetivo del
investigacin, por ejemplo en el caso de determinar la estatura media de los
estudiantes universitarios en Venezuela una muestra poda ser escoger algunas
universidades del pas y realizar el trabajo, si por el contrario se quiere saber la
estatura promedio de los estudiantes de una universidad en especifico en Venezuela,
entonces el conjunto formado por todos los estudiantes de esta universidad sera la
poblacin y la muestra estara dada por los grupos, carreras o aos seleccionado para
realzar el experimento.
VARIANZA
o bien
VARIANZA MUESTRAL.
MEDIA
2.o Si los datos vienen en una tabla con sus frecuencias absolutas fi, se
multiplica cada dato xi por su frecuencia y se suman los resultados obtenidos. Este
resultado se divide por el nmero total de datos N.
x = x 1 f 1 + x 2 f 2 + x 3 f 3 + ... + x n f n N = i = 1 n ( x i f i ) N
MEDIANA
Existen 2 estrategias para calcular la mediana: Considerando los datos tal cual,
sin agruparlos, o bien cuando los tenemos agrupados en intervalos de clase. Veamos
cada una de ellas.
Datos agrupados:
HISTOGRAMA.
En los casos en los que los datos son cualitativos (no-numricos), como sexto
grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
TIPOS DE HISTOGRAMA.
En los grficos las barras se encuentran juntas y en la tabla los nmeros poseen
en el primer miembro un corchete y en el segundo un parntesis, por ejemplo: (10-20]
Se
representan
los intervalos
de clase en el
eje de
abscisas (eje
horizontal) y
las
frecuencias,
absolutas o
relativas, en
el de
ordenadas
(eje vertical).
A veces es
ms til
representar
las
frecuencias
acumuladas
.
O representar
simultneamen
te los
histogramas de
una variable en
dos situaciones
distintas.
Otra forma
muy
frecuente,
de
representar
dos
histograma
s de la
misma
variable en
dos
situaciones
distintas.
Otra ms
En las
variables
cuantitativa
s o en las
cualitativas
ordinales se
pueden
representar
polgonos
de
frecuencia
en lugar de
histogramas
, cuando se
representa
la
frecuencia
acumulativa
, se
denomina
ojiva.
CONSTRUCCIN DE UN HISTOGRAMA
Paso 1: Determinar el rango de los datos. Rango es igual al dato mayor menos
el dato menor.
Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma
amplitud, se hace un grfico de barras, las bases de las barras son los intervalos de
clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base
superior de los rectngulos se obtiene el polgono de frecuencias.
POLGONO DE FRECUENCIA
PROBABILIDAD
1) 0P(A)1
2) P(s)=1
3) Si A y B son eventos que se excluyen mutuamente, P( AB)= P(A) + P(B)
4) Si A1, A2,,An, son eventos que se excluyen mutuamente de par en par
entonces:
P( Ai)= P(A1)+P(A2)+.+ P(An)+...
I=1
n n
P ( Ai)= P(Ai)
i=1 i=1
Por el momento no sabemos como calcular P(A). Solo hemos anotado algunas
propiedades generales que posee P(A).
Segn Richard Jeffrey, "Antes de la mitad del siglo XVII, el trmino 'probable'
(en latn probable) significaba a probable, y se aplicaba en ese sentido, unvocamente,
a la opinin y a la accin. Una accin u opinin probable era una que las personas
sensatas emprenderan o mantendran, en las circunstancias."
Pierre-Simon Laplace (1774) hizo el primer intento para deducir una regla para
la combinacin de observaciones a partir de los principios de la teora de las
probabilidades. Represent la ley de la probabilidad de error con una curva y = (x),
siendo x cualquier error e y su probabilidad, y expuso tres propiedades de esta curva:
1. Es simtrica al eje y;
2. El eje x es una asntota, siendo la probabilidad del error igual a 0;
3. La superficie cerrada es 1, haciendo cierta la existencia de un error.
TEORA DE LA PROBABILIDAD
Aplicaciones
Dos aplicaciones principales de la teora de la probabilidad en el da a da son en
el anlisis de riesgo y en el comercio de los mercados de materias primas. Los
gobiernos normalmente aplican mtodos probabilsticos en regulacin ambiental
donde se les llama "anlisis de vas de dispersin", y a menudo miden el bienestar
usando mtodos que son estocsticos por naturaleza, y escogen qu proyectos
emprender basndose en anlisis estadsticos de su probable efecto en la poblacin
como un conjunto. No es correcto decir que la estadstica est incluida en el propio
modelado, ya que tpicamente los anlisis de riesgo son para una nica vez y por lo
tanto requieren ms modelos de probabilidad fundamentales, por ej. "la probabilidad
de otro 11-S". Una ley de nmeros pequeos tiende a aplicarse a todas aquellas
elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas
probabilsticas un tema poltico.
Se puede decir que no existe una cosa llamada probabilidad. Tambin se puede
decir que la probabilidad es la medida de nuestro grado de incertidumbre, o esto es, el
grado de nuestra ignorancia dada una situacin. Por consiguiente, puede haber una
probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de
diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la
probabilidad es o bien 100% o 0%, y la eleccin correcta puede ser hecha con precisin
por el que ve la carta. La fsica moderna proporciona ejemplos importantes de
situaciones determinanticas donde slo la descripcin probabilstica es factible debido
a informacin incompleta y la complejidad de un sistema as como ejemplos de
fenmenos realmente aleatorios.
En un universo determinista, basado en los conceptos newtonianos, no hay
probabilidad si se conocen todas las condiciones. En el caso de una ruleta, si la fuerza
de la mano y el periodo de esta fuerza es conocido, entonces el nmero donde la bola
parar ser seguro. Naturalmente, esto tambin supone el conocimiento de la inercia y
la friccin de la ruleta, el peso, lisura y redondez de la bola, las variaciones en la
velocidad de la mano durante el movimiento y as sucesivamente. Una descripcin
probabilstica puede entonces ser ms prctica que la mecnica newtoniana para
analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. Los fsicos se
encuentran con la misma situacin en la teora cintica de los gases, donde el sistema
determinantico en principio, es tan complejo (con el nmero de molculas tpicamente
del orden de magnitud de la constante de Avogadro ) que slo la descripcin
estadstica de sus propiedades es viable.
Clculo
Calcular la probabilidad es posible, utilizando un diagrama de rbol, o tablas y
grficas
Ejemplos:
Ejemplo N 1:
Luego, el 5,48% del lote (548 lmparas) no llegarn probablemente a durar 60 meses
Ejemplo N2
Ejemplo N3
1) Dos caras.
2) Dos cruces.
Ejemplo N4:
Hallar la probabilidad de que al levantar unas fichas de domin se obtenga un
nmero de puntos mayor que 9 o que sea mltiplo de 4.
Ejemplo N5:
Un dado est trucado, de forma que las probabilidades de obtener las distintas
caras son proporcionales a los nmeros de estas. Hallar:
Ejemplo N6:
Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide:
P(x)
Lo que haremos es sustituir la funcin p, definida solo para x1, x2,,por una
funcin f definida (en el contexto presente) para todos los valores de x, 0x1. Las
propiedades de la ecuacin:
p(xi) = 1
i=1
1
se sustituirn por f(x) 0 y f(x) dx =1. Se procede formalmente como sigue.
0
+
b) f(x) dx = 1.
-
b
c) Para calquier a,b, tal que -< a <b <+, tenemos P(a X b) = f(x) dx
a
Observaciones:
b) P(c < X < d) representa el rea bajo la grfica de la figura de la fdp f entre x = c
y z = d.
F(x)
x
x=c z=d
c) Una consecuencia de la descripcin probabilstica de X para cualquier valor
especfico de X, por ejemplo xo, es ue tenemos P(X=xo)= 0, puesto que
xo
P(X=xo) = f(x)dx = 0.
xo
Aunque quisiramos estar de acuerdo (para fines matemticos) con que cada
punto concebible del segmento pudiera ser el resultado de nuestro experimento, nos
sorprenderamos mucho si en realidad escogieramos el punto medio del segmento, o
cualquier otro punto especfico de ese elemento. Cuando indicamos esto en un
lenguaje matemtico preciso, decimos que el evento tiene probabilidad 0. En vista
de estas consideraciones, todas las siguientes probabilidades son iguales si X es una
variable aleatoria continua:
P(c < X < d), P(c < X < d), P(c < X < d), y P(c < X < d)
f*(x)
f(z)= para toda x
K
x+ x
P (x X x + x) = f(s)ds= x f( x x + x
x
i) En este caso contino, otra vez podemos considerar la siguiente analoga con
la mecnica: supngase que tenemos una masa total de una unidad, distribuida
continuamente en el intervalo a x b. Entonces , f(x) la densidad de la masa en el
punto x y
d
f(x) dx representa la masa total contenida en el intervalo c < x < d.
c
Ejemplos:
Ejemplo N 1:
Obviamente X toma todos los valores en (0,1), Cul es su fdp? Esto es, Podemos
encontrar una funcin f tal que:
b
P (a < X < b) = f(x) dx ?
a
Ntese que si a < b < 0 o 1 < a < b, P(a < X < b) =0 y,por tanto, f(x)=0.Si 0 < a < b < 1,
P(a< X < b)=b a y, por tanto, f(x)= 1. As encontramos:
1, 0< x < 1,
F(x) =
0, para cualquier otro valor.
F(x) F(x)
(1,2)
X
X=1500 X=2500
Ejemplo N 2:
evaluar la integral
(2x) dx=1/4
0
P(1/3 X 2/3)
1/2
2x dx
1/3 5/36 5
= = =
2/3 1/3 12
2x dx
1/3
Distribucin Normal
Distribucin normal
Funcin de densidad de probabilidad
Parmetros
>0
Dominio
Funcin de
densidad (pdf)
Funcin de
distribucin (cdf)
Media
Mediana
Moda
Varianza
Coeficiente de
0
simetra
Curtosis 0
Entropa
Funcin generadora
de momentos (mgf)
Funcin
caracterstica
Ejemplos:
Ejemplo N1:
Supngase que X tiene distribucin N(3,4). Deseamos encontrar un nmero c tal que:
Tambin,
Ejemplo N2:
Observacin:
Una objecin inmediata al uso de la distribucin normal puede encontrarse aqu. Es
obvio que X, la resistencia del genero de algodn , no puede tomar valores negativos ,
mientras que una variable aleatoria distribuida normalmente puede tomar todos los
valores positivos y negativos. Sin embargo el modelo anterior ( en apariencia
invalidado debido a las objeciones encontradas) asigna una probabilidad despreciable
al evento {X<0}. Esto es,
Esta situacin ocurrir con frecuencia: se supone que cierta variable aleatoria X, que
sabemos no puede tomar valores negativos, tiene una distribucin normal tomando
as (tericamente, al menos) valores tanto positivos como negativos. Mientras se
escojan los parmetros y de modo que P(X<0) sea esencialmente cero, tal
representancin es perfectamente valida.
Ejemplo N3:
La vida media de una lmpara, segn el fabricante, es de 68 meses, con una desviacin
tpica de 5. Se supone que se distribuye segn una distribucin normal En un lote de
10.000 lmparas. a) Cuntas lmparas superarn previsiblemente los 75 meses?. b)
Cuntos lmparas se estropearn antes de 60 meses?
a)
t = (75 -68)/5 = 1,4
b)
Luego, el 5,48% del lote (548 lmparas) no llegarn probablemente a durar 60 meses
Ejemplo N4:
Una empresa instala en una ciudad 20.000 bombillas para su iluminacin. La duracin
de una bombilla sigue una distribucin normal con media 302 das y desviacin tpica
40 das. Calcular. a) Cuntas bombillas es de esperar que se fundan antes de 365 das?
Cuntas durarn ms de 400 das? Explica razonadamente las respuestas.
a)
b)
Entonces el 0,71% de las lmparas, es decir 20.000 0.0071 = 142 bombillas durarn
ms de 400 das.
Distribucin Binomial
Definicin:
Consideremos un experimento sea A un evento asociado con Supongamos que
P(A)=p y, por lo tanto, P(A)= 1-p. Consideremos n repeticiones independientes de
Por lo tanto, el espacio muestral consiste en todas las sucesiones posibles
{a1,a2,,an}, donde cada ai es A o A, segn A o A ocurra en la i-sima repeticin de
(Hay 2 de tales sucesiones). An ms, supongamos que P(A)=p es el mismo para
todas las repeticiones. Definamos la variable aleatoria X como sigue:
X=nmero de veces que ocurri el evento A. Llamamos a X una variable binomial con
los parmetros n y p. Sus valores posibles obviamente son 0, 1, 2,,n. ( Dcimos en
forma equivalente que X tiene una distribucin binomial.) Las repeticiones
individuales de se llamarn ensayos de Bernoulli.
Caractersticas analticas
Su funcin de probabilidad est dada por:
donde
Todo experimento que tenga estas caractersticas diremos que sigue el modelo de la
distribucin Binomial. A la variable X que expresa el nmero de xitos obtenidos en
cada prueba del experimento, la llamaremos variable aleatoria binomial.
La variable binomial es una variable aleatoria discreta, slo puede tomar los valores 0,
1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas. Como hay que considerar
todas las maneras posibles de obtener k-xitos y (n-k) fracasos debemos calcular
stas por combinaciones (nmero combinatorio n sobre k).
Como el clculo de estas probabilidades puede resultar algo tedioso se han construido
tablas para algunos valores de n y p que nos facilitan el trabajo.
Esta funcin de distribucin proporciona, para cada nmero real xi, la probabilidad de
que la variable X tome valores menores o iguales que xi.
El clculo de las F(x) = p( X x) puede resultar laborioso, por ello se han construido
tablas para algunos valores de n y p que nos facilitan el trabajo.
Ejemplos:
Ejemplo N 1:
P(X=3)= 2/3 4/5 +1/2 1/3 4/5 +1/2 2/3 4/5 + 2/3 1/5
= 5/12
Ejemplo N 2:
Sea Y1 el nmero de operaciones correctas durante los primeros n1 intentos y sea Y2el
nmero de operaciones correctas durantes los segundos n2 intentos.
Las restricciones anteriores sobre r son equivalentes a 0< r < n1 y k-n2< r < k.
Combinndolas podemos escribir
a
Con la convencin frecuente de que b = 0 cada vez que b > a o b < 0, podemos
k n-k n1 n1 n2
P(X=k)= P1 (1-P1) r k-r
r=0
n
Para mostrar la suma anterior iguala k comprense simplemente los
coeficientes
k
de las potencias de las potencias d X en ambos lados de la identidad :
n1 n2 n1+n2
(1+X) (1+x) = ( 1+x)
Distribucin de Poisson
Definicin:
Sea X una variable aleatoria que toma los valores posibles: 0,1,n, Si
- k
P(X=k)= e , k= 0,1,,n,
k!
Observacin:
Ejemplo N 1:
10000 999
= 1- (0.9999) -1000 (0.0001) (0,9999)
-0.1 k
P(X=k) e (0.1)
k!
Por tanto,
-0,1
P(X2)1- e (1+0.1)= 0.0045.
Ejemplo N 2:
Supngase que un proceso de fabricacin produce artculos de tal manera que cierta
proporcin (constante) de artculos, digamos p, son defectuosos. Si se obtiene un lote
n de tales artculos, la probabilidad de obtener exactamente k defectuosos pude
calcularse de la distribucin binomial como
n k n-k
P(X=k)= k P (1-P)
-np k
P(X=k) e (np)
k!
supngase, por ejemplo, que un fabricante produce artculos de los cuales alrededor
de 1 en 1000 son defectuosos. Esto es, p= 0,001. Por tanto, usando la distribucin
binomial, encontramos que en un lote de 500 artculos la probabilidad de que ninguno
sea defectuoso es:
500
(0.999) = 0.609. si aplicamos la aproximacin de Poisson, esta probabilidad puede
escribirse como:
-0.5
e = 0.61.
Distribucin Chi-Cuadrada
Definicin:
Una variable aleatoria Z que tiene fdp dada por la ecuacin anterior se dice que tiene
una distribucin X- cuadrada con n grados de libertad ( se denota con:
2
Xn ). En la figura se muestra la fdp para n= 1,2 y n > 2. Una consecuencia inmediata de
la ecuacin:
2
E(X)= r/ , V(X9= r /
Tenemos:
E(Z)=n , V(Z)= 2n
z z z
(a) n=1 (b) n=2 (c)n>2
F(z)
1-
2 z
X
donde:
Esta integral no tiene una solucin conocida, y solo se conocen mtodos numricos
para calcular sus valores, hay distintos tipos de tablas y algoritmos para ordenador con
los que se pueden calcular sus soluciones, veamos una tabla distribucin chi-cuadrado
y su modo de utilizacin.
La Tabla
Esta tabla presenta la distribucin de probabilidad de chi-cuadrado para distintos
valores de k(de 1 a 10) y de x(de 0 a 20 de 0,2 de incremento), presentndolo con seis
cifras decimales, separadas de tres en tres por un espacio en blanco para facilitar la
lectura, en la fila superior estn los valores de k, y en la columna de la izquierda los de
x, donde se cruzan la columna de la k buscada y la fila de la x, se encuentra el valor de
la probabilidad acumulada desde 0 a la x buscada.
Ejemplo:
segn lo anterior:
operando tenemos:
siendo:
tenemos que:
Ejemplo
Cual es la probabilidad de que una variable chi-cuadrado de 8 grados de libertad este
comprendida entre 3,4 y 5,6.
Esto es:
operando:
Interpolacin lineal.
La funcin chi-cuadrado es continua para x mayor que cero, pero en la tabla solo se
recogen algunos de sus valores, si bien la tabla podra hacerse ms extensa el numero
de valores recogidos siempre seria finito, para calcular los valores no recogidos en la
tabla podemos emplear la nterpolacin lineal.
Ejemplo
Cual es la probabilidad de una distribucin chi-cuadrado de 5 grados de libertad, de
que x sea menor que 1,75.
Esto es:
el valor 1,75 no esta en la tabla, pero si tenemos que:
sustituyendo en la expresin:
tenemos que:
operando tenemos:
esto es:
que resulta:
Ejemplo
Cual es el valor de x, de una distribucin chi-cuadrado de 6 grados de libertad, que deja
a su izquierda una probabilidad del 80%
Ejemplo
Cul es la distribucin de probabilidad de chi-cuadrado de 4 grados de libertad de que
x < 1,2 ?
este es el mismo ejemplo que en la tabla directa, veamos como se hara en este caso:
la pregunta es:
operando:
esto es:
como se puede ver hay una diferencia del orden de la tercera cifra decimal, respecto a
la bsqueda directa en la tabla, esta diferencia se produce por la interpolacin lineal, al
sustituir la funcin por la recta que une dos puntos conocidos, y a la relativamente
gran diferencia entre x1 y x2, que es el 60% al valor de x1.
Otro Ejemplo:
2
Supngase que la velocidad V de un objeto tiene distribucin N(0,1). Sea K=mV 72 la
energa cintica del objeto. Para encontrar la fdp de K, busquemos primero la fdp de
2
S= V . Al aplicar directamente el teorema:
2
Sean X una variable aleatoria continua con fdp f y Y=X . Entonces, la variable aleatoria
Y tiene fdp dada por:
1
g(s)= [ s) + (- s)]
2s
-1/2 -s/2
=s 1 e
2
Ahora podemos obtener la fdp h de la energa cintica K. Puesto que K es una funcin
montona de 2
V,
Cuya fdp esta dada por la g anterior, tenemos directamente;
-1/2 -k/m
H(k)=2/m g(2/m k)= 2/m 1/2 (2/m k) e ,k>0
2 2
A fin de evaluar P(K5)=P ((m/2) V 5) = P(V 10/m)
E(Z)=n , V(Z)= 2n
Encontramos directamente:
2
E(K)=m/2 y V(K)= m /2
Distribucin de Weibull
Definicin:
Se dice que la variable aleatoria con fdp dada por la ecuacin anterior tiene una
distribucin de Weibull. La figura muestra la fdp para =1 y =1,2,3. La funcin
De confiabilidad R est dada por:
-t
R(t)= e que es una funcin decreciente.
f(t)
=1
=3
=2
Observacin:
-1
Z(t)= () t
=1 t >1 t 0<< 1 t
Z es constante Z es creciente Z es decreciente
Ejemplos:
Ejemplo N 1:
(2)
Densidad predictiva de :
(3)