Está en la página 1de 22

INVESTIGACIN

Probabilidad y Estadstica

ndice
Tabla de contenido
1.
2.
3.
4.
5.
6.
7.
8.

ndice
2
Distribucin de Weibull
3
Distribucin de Gamma
4
Distribucin Log Normal
5
Distribucin Exponencial
6
Teora Elemental de Muestreo
7
Teora de Estimacin Estadstica 9
Teora de la Decisin Estadstica,

Ensayo

Significacin
14
9. Teora de Correlacin (Correlacin y Regresin)
10.
Bibliografa
20

de

Hipotesis

18

1. Distribucin de Weibull
Fue establecida por el fsico suizo Weibull quien demostr que el esfuerzo al
que se someten los materiales puede modelarse de manera adecuada
mediante el empleo de esta distribucin. Tambin se ha usado para modelar

situaciones del tipo tiempo- falla, bien puede indicar la vida til de cierto
artculo, planta o animal, confiabilidad de un componente.
Se trata de un modelo continuo asociado a variables del tipo tiempo de vida,
tiempo hasta que un mecanismo falla, etc. La funcin de densidad de este
modelo viene dada por:

Como vemos, depende de dos parmetros: > 0 y > 0, donde es un


parmetro de escala y es un parmetro de forma (lo que proporciona una
gran flexibilidad a este modelo).
La funcin de distribucin se obtiene por la integracin de la funcin de
densidad y vale:

Propiedades de la distribucin Weibull


Si tomamos = 1 tenemos una distribucin Exponencial.
Su esperanza:

Su varianza:

(15Ju)

2. Distribucin de Gamma
Este modelo es una generalizacin del modelo Exponencial ya que, en
ocasiones, se utiliza para modelar variables que describen el tiempo hasta que
se produce p veces un determinado suceso.
Su funcin de densidad es de la forma:

Como vemos, este modelo depende de dos parmetros positivos: y p. La


funcin (p) es la denominada funcin Gamma de Euler que representa la
siguiente integral:

Verifica (p + 1) = p(p), con lo que, si p es un nmero entero positivo, (p +


1) = p!
Propiedades de la distribucin Gamma

Su

esperanza

Su

varianza

La distribucin Gamma (, p = 1) es una distribucin Exponencial de


parmetro . Es decir, el modelo Exponencial es un caso particular de la
Gamma
con
p
=
1.

Dadas dos variables aleatorias con distribucin Gamma y parmetro


comn

es

es

X ~ G(, p1) y Y ~ G(, p2)


4

p.

p2

se cumplir que la suma tambin sigue una distribucin Gamma


X + Y ~ G(, p1 + p2).
Una consecuencia inmediata de esta propiedad es que, si tenemos k variables
aleatorias con distribucin Exponencial de parmetro (comn) e
independientes, la suma de todas ellas seguir una distribucin G(, k). (15Ju)

3. Distribucin Log Normal


La variable T sigue una distribucin lognormal si lnT tiene una distribucin normal de
media y varianza . En consecuencia, la variable

es un variable normal reducida, es decir de media igual a 0 y desviacin tpica igual a 1.


Por lo tanto, la funcin de supervivencia se puede escribir

siendo
la funcin de distribucin acumulativa de la normal reducida. Por lo tanto un
modo grfico de verificar esta distribucin es comparar la funcin de supervivencia
dibujada en papel lognormal con una recta.
Ocurre en la prctica cada vez que existe una variable aleatoria X tal que su logaritmo
natural es una nueva variable aleatoria Y con distribucin normal, entonces X sigue el
modelo probabilstico llamado logaritmo normal.

(Universidad Nacional De Colombia )

4. Distribucin Exponencial

Antes de introducir la variable exponencial puede mirarse un origen natural de


sta a partir de una variable aleatoria Poisson, la cual indica el nmero de
veces que ocurre un evento en una unidad de tiempo. Si se escribe la funcin
de probabilidad Poisson de la siguiente manera:

la probabilidad de que no ocurra algn evento, en el periodo hasta el tiempo


est dada por:

De esta manera, puede definirse ahora una variable aleatoria continua


mide el tiempo que tarda en ocurrir el primer evento de Poisson. Es decir,

que

Lo que permite construir la funcin de distribucin acumulada as:

Al derivar, con respecto a


aleatoria exponencial

se tiene la funcin de densidad de la variable


.

Definicin: La variable aleatoria

que es igual a la distancia (o tiempo) entre

ocurrencias sucecesivas de un proceso Poisson con media

tiene una

distribucin exponencial con parmetro


Funcin de densidad de Probabilidad:

Valor esperado:

Varianza:

Observaciones:
En la definicin de la variable aleatoria exponencial, sta se plantea como
tiempo que tarda en ocurrir el primer evento Poisson. Sin embargo, esta
definicin puede hacerse extensiva a las dems unidades de medicin
consideradas en los eventos de Poisson, por ejemplo, cantidad de metros de
carretera que deben recorrerse hasta que aparezca el primer bache, cantidad
de
que deben inspeccionarse en una hacienda hasta que aparezca el primer
cafetal de broca, etc.
En el lenguaje de las aplicaciones tambin se utiliza la distribucin exponencial
para modelar tiempo entre eventos, distancia entre eventos, volumen entre
eventos. (Universidad Nacional De Colombia )

5. Teora Elemental de Muestreo


TEORIA DEL MUESTREO: Es el estudio de las relaciones existentes entre una
poblacin y muestras extradas de la misma. Permite estimar cantidades
desconocidas de la poblacin.
POBLACIN: Llamada tambin universo o colectivo, es el conjunto de
elementos de referencia sobre el que se realizan las observaciones.
Existen distintos tipos de poblaciones que son:

Poblacin base
Poblacin muestreada
Muestra estudiada
Poblacin diana
MUESTRA: Es un conjunto de casos o individuos de una poblacin estadstica.
Las muestras se obtienen con la intencin de inferir propiedades de la totalidad
de la poblacin.
TIPOS DE MUESTREO:
Muestreo Simple: Este tipo de muestreo toma solamente una muestra de una
poblacin dada para el propsito de inferencia estadstica. Puesto que
solamente una muestra es tomada, el tamao de muestra debe ser lo
suficiente grande para extraer una conclusin.
Muestreo Doble: Cuando el resultado del estudio de la primera muestra no es
decisivo, una segunda muestra es extrada de la misma poblacin. Las dos
muestras son combinadas para analizar los resultados.
Muestreo Mltiple: Es similar al expuesto en el muestreo doble, excepto que el
nmero de muestras sucesivas requerido para llegar a una decisin es ms de
dos muestras.
Muestreo de Juicio: Es llamada muestra de juicio cuando sus elementos son
seleccionados mediante juicio personal. La persona que selecciona los
elementos de la muestra, usualmente es un experto en la medida dada.
Muestreo Aleatorio(al azar): Se dice que es extrada al azar cuando la manera
de seleccin es tal, que cada elemento de la poblacin tiene igual oportunidad
de ser seleccionado.
Muestreo Aleatorio Simple: Para obtener una muestra aleatoria simple, cada
elemento en la poblacin tenga la misma probabilidad de ser seleccionado, el
plan de muestreo puede no conducir a una muestra aleatoria simple.
Muestreo Sistemtico: Es obtenida cuando los elementos son seleccionados
en una manera ordenada. La manera de seleccin depende del nmero de
elementos incluidos en la poblacin y el tamao de la muestra.
Muestreo Estratificado: Primero se divide la poblacin en grupos, llamados
estratos, que son ms homogneos que la poblacin como un todo.
Muestreo de Conglomerados: Primero se divide la poblacin en grupos que
son convenientes para el muestreo. En seguida, seleccionar una porcin de los
grupos al azar o por un mtodo sistemtico. Finalmente, tomar todos los
elementos o parte de ellos al azar por un mtodo sistemtico de los grupos
seleccionados para obtener una muestra. (Investiga y aprende )

6. Teora de Estimacin Estadstica


La teora de estimacin estadstica estudia cmo obtener informacin sobre
una poblacin, mediante muestras extradas de ella.
Un importante problema es la estimacin de parmetros de una poblacin a
partir de los correspondientes parmetros de las muestras, llamados
estadsticos mustrales.

ESTIMADOR Un estimador de un parmetro poblacional es una funcin de los


datos mustrales. En pocas palabras, es una frmula que depende de los
valores obtenidos de una muestra, para realizar estimaciones.
ESTIMACION PUNTUAL Consiste en la estimacin del valor del parmetro
mediante un slo valor, obtenido de una frmula determinada. Por ejemplo, si
se pretende estimar la talla media de un determinado grupo de individuos,
puede extraerse una muestra y ofrecer como estimacin puntual la talla media
de los individuos de la muestra.
ESTIMACION POR INTERVALO Consiste en la obtencin de un intervalo
dentro del cual estar el valor del parmetro estimado con una cierta
probabilidad.
La teora de estimacin estadstica estudia cmo obtener informacin sobre
una poblacin, mediante muestras extradas de ella. Un importante problema
es la estimacin de parmetros de una poblacin a partir de los
correspondientes parmetros de las muestras, llamados estadsticos
mustrales.
Estadstica
En inferencia estadstica se llama estimacin al conjunto de tcnicas que
permiten dar un valor aproximado de un parmetro de una poblacin a partir
de los datos proporcionados por una muestra. Por ejemplo, una estimacin de
la media de una determinada caracterstica de una poblacin de tamao N
podra ser la media de esa misma caracterstica para una muestra de tamao
n.
Sesgada
En el campo de la estadstica, el sesgo estadstico es un error que se detecta
en los resultados de un estudio y que se debe a factores en la recoleccin,
anlisis, interpretacin o revisin de los datos.
Insesgada
Un error sistemtico del mtodo de observacin, cuyo valor se desconoce en la
mayora de los casos. El insesgo puede introducirse debido al uso de
instrumentos de medicin que no estn correctamente calibrados, o si se
seleccionan elementos de una poblacin equivocada, o si se favorecen
determinados elementos de una poblacin, etc.
Consiste en la obtencin de un intervalo dentro del cual estar el valor del
parmetro estimado con una cierta probabilidad.

7. Teora de la decisin
hiptesis y significacin

estadstica,

ensayo

de

Decisiones estadsticas. Muy a menudo, en la prctica, se tienen que tomar


decisiones sobre poblaciones, partiendo de la informacin muestral de las
mismas. Tales decisiones se llaman decisiones estadsticas. Por ejemplo, se
puede querer decidir a partir de los datos del muestreo, si un suero nuevo es

realmente efectivo para la cura de una enfermedad, si un sistema educacional


es mejor que otro, si una moneda determinada est o no cargada. etc.
Hiptesis estadsticas. Hiptesis nula. Para llegar a tomar decisiones,
conviene hacer determinados supuestos o conjeturas acerca de las poblaciones
que se estudian. Tales supuestos que pueden ser o no ciertos se llaman
hiptesis estadsticas y, en general, lo son sobre las distribuciones de
probabilidad de las poblaciones. En muchos casos se formulan las hiptesis
estadsticas con el solo propsito de rechazarlas o invalidarlas. Por ejemplo, si
se quiere decidir si una moneda est cargada, se formula la hiptesis de que la
moneda est bien, s decir, p = 0.5; donde p es la probabilidad de cara.
Anlogamente, si se quiere decidir sobre si un procedimiento es mejor que
otro, se formula la hiptesis de que no hay diferencia entre los procedimientos
(es decir, cualquier diferencia observada se debe meramente a fluctuaciones
en el muestreo de la misma poblacin). Tales hiptesis se llaman tambin
hiptesis nulas y se denotan por Ho. Cualquier hiptesis que difiera de una
hiptesis dada se llama hiptesis alternativa. Por ejemplo, si una hiptesis es p
= 0.5, hiptesis alternativas son p = 0.7; p ? 0,5 o p > 0,5. Una hiptesis
alternativa de la hiptesis nula se denota por H 1.
Ensayos de hiptesis y significacin. Si en el supuesto de que una
hiptesis determinada es cierta, se encuentra que los resultados observados en
una muestra al azar difieren marcadamente de aquellos que caba esperar con
la hiptesis y con la variacin propia del muestreo, se dira que las diferencias
observadas son significativas y se estara en condiciones de rechazar la
hiptesis (o al menos no aceptarla de acuerdo con la evidencia obtenida). Por
ejemplo, si en 20 lanzamientos de una moneda se obtienen 16 caras, se estara
inclinado a rechazar la hiptesis de que la moneda est bien, aunque sera
posible que fuese un rechazamiento errneo.Los procedimientos que facilitan el
decidir si una hiptesis se acepta o se rechaza o el determinar si las muestras
observadas difieren significativamente de los resultados esperados se llaman
ensayos de hiptesis, ensayos de significacin o reglas de decisin.
ERRORES DE TIPO I Y TIPO II. Si se rechaza una hiptesis cuando debera
ser aceptada, se dice que se comete un error del Tipo I. Si, por el contrario, se
acepta una hiptesis que debera ser rechazada, se dice que se comete un
error del Tipo II. En cualquiera de los dos casos se comete un error al tomar
una decisin equivocada. Para que cualquier ensayo de hiptesis o reglas de
decisin sea bueno, debe disearse de forma que minimice los errores de
decisin. Esto no es tan sencillo como pueda parecer puesto que para un
tamao de muestra dado, un intento de disminuir un tipo de error, va
generalmente acompaado por un incremento en el otro tipo de error. En la
prctica, un tipo de error puede tener ms importancia que el otro, y as se
tiende a conseguir poner una limitacin al error de mayor importancia. La nica
forma de reducir al tiempo ambos tipos de error es incrementar el tamao de la
muestra, lo cual puede ser o no ser posible.
NIVEL DE SIGNIFICACION. La probabilidad mxima con la que en el ensayo
de una hiptesis se puede cometer un error del Tipo I se llama nivel de
10

significacin del ensayo. Esta probabilidad se denota frecuentemente por a;


generalmente se fija antes de la extraccin de las muestras, de modo que los
resultados obtenidos no influyen en la eleccin.
Ensayos referentes a la distribucin normal

Para aclarar las ideas anteriores, supngase que con una hiptesis dada, la
distribucin muestral de un estadstico S es una distribucin normal con media
s Y desviacin tpica uso Entonces la distribucin de la variable tipificada
(representada por z) dada por z = (S s) /ss, es una normal tipificada (media
0, varianza 1) y se muestra en la figura.
Como se indica en la figura, se puede estar con el 95 % de confianza de que, si
la hiptesis es cierta, el valor de z obtenido de una muestra real para el
estadstico S se encontrar entre -1.96 y 1.96 (puesto que el rea bajo la curva
normal entre estos valores es 0.95).
Sin embargo, si al elegir una muestra al azar se encuentra que z para ese
estadstico se halla fuera del rango -1.96 a 1.96, lo que quiere decir que es un
suceso con probabilidad de solamente 0.05 (rea sombreada de la figura) si la
hiptesis fuese verdadera. Entonces puede decirse que esta z difiere
significativamente de la que caba esperar bajo esta hiptesis y se estara
inclinado a rechazar la hiptesis.
El rea total sombreada 0.05 es el nivel de significacin del ensayo. Representa
la probabilidad de cometer error al rechazar la hiptesis es decir, la
probabilidad de cometer error del Tipo I. As, pues, se dice que la hiptesis se
rechaza al nivel de significacin del 0.05 o que la z obtenida del estadstico
muestral dado es significativa al nivel de significacin del 0.05.
El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen
lo que se llama regin crtica o regin de rechace de la hiptesis o regin de
significacin. El conjunto de las z que se encuentran dentro del rango -1,96 a
1,96 poda entonces llamarse regin de aceptacin de la hiptesis o regin de
no significacin.
De acuerdo con lo dicho hasta ahora; se puede formular la siguiente regla de
decisin o ensayo de hiptesis o significacin.
(a) Se rechaza la hiptesis al nivel de significacin del 0.05 si la z obtenida para
el estadstico S se encuentra fuera del rango -1.96 a 1.96 (es decir, z > 1,96 o
11

z < -1,96). Esto equivale a decir que el estadstico muestral observado es


significativo al nivel del 0,05.
(b) Se acepta la hiptesis (o si se desea no se toma decisin alguna) en caso
contrario.
A causa de su importante papel en los ensayos de hiptesis y significacin, z
recibe tambin el nombre de ensayo estadstico.

Ensayos de una y dos colas


En el ensayo anterior se atenda a los valores extremos del estadstico S o su
correspondiente z a ambos lados de la media, es decir, en las dos colas de la
distribucin. Por esta razn, tales ensayos se llaman ensayos de dos colas o
ensayos bilaterales.
Sin embargo, con frecuencia, se puede estar solamente interesado en los
valores extremos a un solo lado de la media, es decir, en una cola de la
distribucin, como, por ejemplo, cuando se estn ensayando la hiptesis de
que un proceso es mejor que otro (que es diferente a ensayar si un proceso es
mejor o peor que otro). Tales ensayos se llaman ensayos de una cola o ensayos
unilaterales. En tales casos, la regin crtica es una regin a un lado de la
distribucin, con rea igual al nivel de significacin.
La Tabla anterior, que da los valores crticos de z para ensayos de una y dos
colas a distintos niveles de significacin, ser de utilidad para propsitos de
referencia. Valores crticos de z para otros niveles de significacin, se pueden
encontrar utilizando la tabla que da las reas bajo la curva normal.
Ensayos especiales
Para muestras grandes, las distribuciones muestrales de muchos estadsticos
son distribuciones normales (o al menos casi normales) con media s y
desviacin tpica ss. En tales casos, se pueden utilizar los resultados anteriores
para formular reglas de decisin o ensayos de hiptesis y significacin. Los
siguientes casos especiales, son solamente unos pocos de los estadsticos de
inters prctico. En cada caso, los resultados son para poblaciones infinitas o
para muestreo con reemplazo. Para muestreo sin reemplazo de poblaciones
finitas los resultados debern modificarse.
Medias. Aqu S = x, la media muestral; s = x = , media poblacional; ss = sx
= s/vN, donde es la desviacin tpica poblacional y N es el tamao de la
muestra. El valor de z viene dado por
12

Donde se utiliza la desviacin muestral s o S para estimar s.


Proporciones. Aqu S = P, la proporcin de xitos en una muestra; s = p
= p, donde p es la proporcin de xitos en la poblacin y N es el tamao de la
muestra; ss = sp = vpq/N, donde q = 1 - p. El valor de z viene dado por

En el caso de que P = X/N, donde X es el nmero real de xitos en una


muestra, z se convierte en

Anlogamente pueden obtenerse los resultados para otros estadsticos.


Curvas caractersticas de operacin. Potencia de un ensayo
Se ha visto cmo el error del Tipo I puede limitarse eligiendo adecuadamente
un nivel de significacin. Es posible evitar el riesgo de error del Tipo II
totalmente, simplemente no aceptando nunca la hiptesis. Sin embargo, en
muchos casos prcticos esto no puede hacerse. En tales casos, se utilizan a
menudo curvas caractersticas de la operacin o curvas OC, que son grficos
que muestran las probabilidades de errores del Tipo II bajo diferentes hiptesis.
Estos suministran informacin de cmo en ensayos dados se logra minimizar
los errores del Tipo II, es decir, indican la potencia de un ensayo para evitar el
tomar decisiones equivocadas. Son tiles en diseo de experimentos por
mostrar, por ejemplo, qu tamaos de muestras deben emplearse.

GRAFICOS DE CONTROL
Es a menudo en la prctica importante conocer cundo un proceso ha
cambiado suficientemente, de modo que puedan darse los pasos necesarios
para remediar la situacin. Tales problemas aparecen, por ejemplo, en el
control de calidad, donde uno debe, a veces rpidamente, decidir si los
cambios observados se deben simplemente a fluctuaciones aleatorias o a
cambios reales en el proceso de fabricacin a causa de deterioro en las
13

mquinas, errores de los empleados, etc. Los grficos de control suministran


un mtodo til y sencillo para tratar tales problemas.
Ensayos de significacin en relacin con diferencias muestrales
Diferencias de medias
Sean X 1 Y X 2 las medias muestrales obtenidas en dos muestras grandes de
tamao N 1 Y N 2 extradas de poblaciones respectivas que tienen de media 1
y 2 Y desviaciones tpicas s1 Y s2. Considrese la hiptesis nula de que no
hay diferencia entre las medias poblacionales, es decir, 1 = 2 o que las
muestras son extradas de dos poblaciones que tienen la misma media.
Haciendo 1 = 2 se ve que la distribucin muestral de la diferencia de medias
se distribuye aproximadamente como una normal con media y desviacin
tpica dadas por

donde se puede, si es necesario, utilizar las desviaciones tpicas muestrales S1


y S2 como estimas de s1 y s2.
Con la variable tipificada z que viene dada por

se puede ensayar la hiptesis nula contra la hiptesis alternativa (o la


significacin de una diferencia observada) a un nivel de significacin
apropiado.
Diferencias de proporciones
Sean P1 y P2 las proporciones muestrales de dos grandes muestras de
tamaos N1 y N2 extradas de poblaciones respectivas que tienen proporciones
P1 y P2. Considrese la hiptesis nula de que no hay diferencia entre los
parmetros poblacionales, es decir, P1 = P2, Y as las muestras son realmente
ex- tradas de la misma poblacin.
Haciendo P1 = P2 = P, se ve que la distribucin muestral de la diferencia de
proporciones se distribuye aproximadamente como una normal con media y
desviacin tpica dadas por

14

se utiliza como una estima de la proporcin poblacional, y q = 1 - p.


Con la variable tipificada z dada por

se puede ensayar las diferencias observadas a un nivel de significacin


apropiado y de este modo ensayar la hiptesis nula.
Ensayos referentes a otros estadsticos pueden disearse anlogamente.
Ensayos referentes a la distribucin binomial
Ensayos que envuelven a la distribucin binomial as como otras distribuciones,
pueden disear- se de una manera anloga a los utilizados para la distribucin
normal, los principios bsicos son esencialmente los mismos.

8. Teora de Pequeas Muestras


Se podrn utilizar muestras pequeas siempre y cuando la distribucin de
donde proviene la muestra tenga un comportamiento normal. Esta es una
condicin para utilizar las tres distribuciones que se manejarn en esta unidad;
t de student, X2 ji-cuadrada y Fisher.
A la teora de pequeas muestras tambin se le llama teora exacta del
muestreo, ya que tambin la podemos utilizar con muestras aleatorias de
tamao grande.
En esta unidad se ver un nuevo concepto necesario para poder utilizar a las
tres distribuciones mencionadas. Este concepto es "grados de libertad".
Para definir grados de libertad se har referencia a la varianza muestral:

Esta frmula est basada en n-1 grados de libertad (degrees of freedom).


Esta terminologa resulta del hecho de que si bien s 2 est basada en n
cantidades
. . . ,
stas suman cero, as que especificar los
valores de cualquier n-1 de las cantidades determina el valor restante. Por
ejemplo, si n=4 y
15

entonces

automticamente

, as que slo tres de los cuatro valores de


determinamos 3 grados de libertad.

tenemos

estn libremente

Entonces, en esta unidad la frmula de grados de libertad ser n-1 y su


simbologa
DISTRIBUCION "t DE STUDENT"
Supngase que se toma una muestra de una poblacin normal con media
varianza

. Si

es el promedio de las n observaciones que contiene la

muestra aleatoria, entonces la distribucin

es una distribucin

2
normal estndar. Supngase que la varianza de la poblacin
es
desconocida. Qu sucede con la distribucin de esta estadstica si se

reemplaza

por s? La distribucin t proporciona la respuesta a esta pregunta.

La media y la varianza de la distribucin t son


respectivamente.

=0y

para

>2,

La siguiente figura presenta la grfica de varias distribuciones t. La apariencia


general de la distribucin t es similar a la de la distribucin normal estndar:
ambas son simtricas y unimodales, y el valor mximo de la ordenada se
alcanza en la media
= 0. Sin embargo, la distribucin t tiene colas ms
amplias que la normal; esto es, la probabilidad de las colas es mayor que en la
distribucin normal. A medida que el nmero de grados de libertad tiende a
infinito, la forma lmite de la distribucin t es la distribucin normal estndar.

16

Propiedades de las distribuciones t


1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, est ms dispersa que la curva normal estndar z.
3. A medida que
disminuye.

aumenta, la dispersin de la curva t correspondiente

4. A medida que
, la secuencia de curvas t se aproxima a la curva
normal estndar, por lo que la curva z recibe a veces el nombre de curva
t con gl =
La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con

grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas


normales con media

y desviacin estndar

tiene una distribucin t con

. Entonces la variable aleatoria

= n-1 grados de libertad.

La distribucin de probabilidad de t se public por primera vez en 1908 en un


artculo de W. S. Gosset. En esa poca, Gosset era empleado de una cervecera
irlandesa que desaprobaba la publicacin de investigaciones de sus
empleados. Para evadir esta prohibicin, public su trabajo en secreto bajo el
nombre de "Student". En consecuencia, la distribucin t normalmente se llama
distribucin t de Student, o simplemente distribucin t. Para derivar la ecuacin
de esta distribucin, Gosset supone que las muestras se seleccionan de una
poblacin normal. Aunque esto parecera una suposicin muy restrictiva, se
puede mostrar que las poblaciones no normales que poseen distribuciones en
forma casi de campana an proporcionan valores de t que se aproximan muy
de cerca a la distribucin t.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao
de la muestra y siempre es mayor a uno. Unicamente cuando el tamao de la
muestra tiende a infinito las dos distribuciones sern las mismas.

17

Se acostumbra representar con


el valor t por arriba del cual se encuentra
un rea igual a
. Como la distribucin t es simtrica alrededor de una media
de cero, tenemos
; es decir, el valor t que deja un rea de
a la derecha y por tanto un rea de
a la izquierda, es igual al valor t
negativo que deja un rea de
en la cola derecha de la distribucin. Esto es,
t0.95 = -t0.05, t0.99=-t0.01, etc.
Para encontrar los valores de t se utilizar la tabla de valores crticos de la
distribucin t del libro Probabilidad y Estadstica para Ingenieros de los autores
Walpole, Myers y Myers.

INTERVALO DE CONFIANZA PARA


Si

; CON

DESCONOCIDA

y s son la media y la desviacin estndar de una muestra aleatoria de una

poblacin normal con varianza


(

)100% para

Donde

/2

, desconocida, un intervalo de confianza de

es:

es el valor t con

= n-1 grados de libertad, que deja un rea de

/2 a la derecha.
Se hace una distincin entre los casos de
conocida y
desconocida al
calcular las estimaciones del intervalo de confianza. Se debe enfatizar que para
el primer caso se utiliza el teorema del lmite central, mientras que para
desconocida se hace uso de la distribucin muestral de la variable aleatoria t.
Sin embargo, el uso de la distribucin t se basa en la premisa de que el
muestreo se realiza de una distribucin normal. En tanto que la distribucin
tenga forma aproximada de campana, los intervalos de confianza se pueden
calcular cuando la varianza se desconoce mediante el uso de la distribucin t y
se puede esperar buenos resultados.
Con mucha frecuencia los estadsticos recomiendan que aun cuando la
normalidad no se pueda suponer, con
reemplazar a

desconocida y n 30, s puede

y se puede utilizar el intervalo de confianza:

18

Por lo general ste se denomina como un intervalo de confianza de muestra


grande. La justificacin yace slo en la presuncin de que con una muestra
grande como 30, s estar muy cerca de la
real y de esta manera el teorema
del lmite central sigue valiendo. Se debe hacer nfasis en que esto es solo una
aproximacin y que la calidad de este enfoque mejora a medida que el tamao
de la muestra crece ms.
PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION
NORMAL, VARIANZA DESCONOCIDA
Ciertamente sospechamos que las pruebas sobre una media poblacional

con

desconocida, debe incluir el uso de la distribucin t de Student. La


estructura de la prueba es idntica a la del caso de

conocida, con la

excepcin de que el valor


en la estadstica de prueba se reemplaza por la
estimacin de s calculada y la distribucin normal estndar se reemplaza con
una distribucin t. (Instituto Tecnolgico de Chihuahua)

9. Teora de Correlacin (Correlacin y Regresin)


DISTRIBUCIONES BIDIMENSIONALES
Cuando sobre una poblacin estudiamos simultneamente los valores de dos
variables estadsticas, el conjunto de los pares de valores correspondientes a
cada individuo se denomina distribucin bidimensional.
IDEA DE CORRELACIN
Es frecuente que estudiemos sobre una misma poblacin los valores de dos
variables estadsticas distintas, con el fin de ver si existe alguna relacin entre
ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra.
Si ocurre esto decimos que las variables estn correlacionadas o bien que hay
correlacin entre ellas.

19

NUBE DE PUNTOS O DIAGRAMA DE DISPERSIN


La primera forma de describir una distribucin bidimensional es representar los
pares de valores en el plano cartesiano. El grfico obtenido recibe el nombre de
nube de puntos o diagrama de dispersin.

CORRELACIN LINEAL Y RECTA DE REGRESIN.


Cuando observamos una nube de puntos podemos apreciar si los puntos se
agrupan cerca de alguna curva. Aqu nos limitaremos a ver si los puntos se
distribuyen alrededor de una recta. Si as ocurre diremos que hay correlacin
lineal. La recta se denomina recta de regresin.

20

Hablaremos de correlacin lineal fuerte cuando la nube se parezca mucho a


una recta y ser cada vez ms dbil (o menos fuerte) cuando la nube vaya
desparramndose con respecto a la recta.
En el grfico observamos que en nuestro ejemplo la correlacin es bastante
fuerte, ya que la recta que hemos dibujado est prxima a los puntos de la
nube.
Cuando la recta es creciente la correlacin es positiva o directa: al aumentar
una variable, la otra tiene tambin tendencia a aumentar, como en el ejemplo
anterior. Cuando la recta es decreciente la correlacin es negativa o inversa: al
aumentar una variable, la otra tiene tendencia a disminuir.
MEDIDA DE LA CORRELACIN
La apreciacin visual de la existencia de correlacin no es suficiente. Usaremos
un parmetro, llamado coeficiente de correlacin que denotaremos con la letra
r, que nos permite valorar si sta es fuerte o dbil, positiva o negativa.
El clculo es una tarea mecnica, que podemos realizar con una calculadora o
un programa informtico. Nuestro inters est en saber interpretarlo.
Antes de ponernos a trabajar destacaremos una de sus propiedades
-1 < r < 1
ESTIMACIN MEDIANTE LA RECTA DE REGRESIN
Es evidente que no todos dibujaramos exactamente la misma recta para una
nube de puntos, aunque la correlacin fuera bastante fuerte.
De todas las rectas posibles los matemticos han elegido como la mejor
aproximacin la llamada de los mnimos cuadrticos, Su clculo es tambin
algo mecnico que podemos hacer con calculadora o un ordenador. En el
siguiente apartado encontrars un ejercicio para estudiar sus propiedades.
La recta de regresin sirve para hacer estimaciones, teniendo en cuenta que:

Los valores obtenidos son aproximaciones en trminos de probabilidad:


es probable que el valor correspondiente a x0 sea y0.

La fiabilidad es mayor cuanto ms fuerte sea la correlacin.

La fiabilidad aumenta al aumentar el nmero de datos.

21

La estimacin es ms fiable para los valores de x prximos a la media.


(Snchez)

Bibliografa
(s.f.). Recuperado el 10 de Junio de 2015, de
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo4/B0C4
m1t9.htm
Instituto Tecnolgico de Chihuahua. (s.f.). Recuperado el 10 de Junio de 2015,
de http://www.itch.edu.mx/academic/industrial/estadistica1/cap03.html
Investiga y aprende . (s.f.). Recuperado el 10 de Junio de 2015, de
http://investigando-juntos.blogspot.mx/2009/04/teoria-elemental-delmuestreo.html
Snchez, C. B. (s.f.). Recuperado el 10 de Junio de 2015, de
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Correlacio
n_regresion_recta_regresion/correlacion_y_regresion.htm
Universidad Nacional De Colombia . (s.f.). Recuperado el 10 de Junio de 2015,
de
http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030011/lecciones/cap3
/cap_3_pag_15.html

22

También podría gustarte