Está en la página 1de 11

TALLER COMPUTACIONAL N2

ANALISIS ESTADISTICO PARA QUIMICOS


UNIVERSIDAD DE LA AMAZONIA

Cristian Leonardo Gonzales Gomez & Paula Andrea Salamanca

1. Si aplica a datos discretos o continuos


2. La frmula de la funcin de probabilidad y los parmetros de los que
depende
3. El significado de cada uno de los parmetros
4. Las aplicaciones en las que se puede emplear
5. Los comandos en R para calcular
1. La funcin de distribucin
2. La probabilidad
3. Los cuantiles
6. Realizar por lo menos dos grficas con empleando dos parmetros
diferentes en cada una.

DISTRIBUCION HIPERGEOMETRICA:

1. Aplica para datos discretos.


2. la funcin de probabilidad de una variable aleatoria con distribucin
hipergeometrica puede deducirse a travs de razonamientos combinados
y es igual a:

( ) ( )
( = ) =

( )

3. Parmetros: Donde N es el tamao de la poblacin, n es el tamao de la


muestra extrada, d es el nmero de elementos en la poblacin original
que pertenecen a la categora deseada y x es el nmero de elementos en

la muestra que pertenecen a dicha categora. La notacin ( ) hace

referencia al coeficiente binomial, es decir, el nmero de combinaciones
posibles al seleccionar x elementos de un total a.

4. Su principal aplicacin es en el muestreo de aceptacin y control de


calidad de donde de un lote de artculos se toma una muestra y se analiza
para decidir si se acepta o rechaza todo el lote.
5. La funcion de distribucin: phyper(q, m, n, k, lower.tail = T, log.p = F)
La probabilidad :prob: Probabilidad.
Los cuantiles : qhyper(p, m, n, k, lower.tail = T, log.p = F)

DISTRIBUCION DE POISSON:

1. Aplica para datos discretos


2. cuando en una distribucin binomial el nmero de intentos (n) es grandes
y la probabilidad de xito (p) es pequea, la distribucin binomial
converge a la distribucin de poisson.

3. Parmetros
Media E(X)=
Varianza 2 Var (X)=
Desviacin estndar

x es el nmero de ocurrencias del evento o fenmeno (la funcin nos da la


probabilidad de que el evento suceda precisamente x veces).
es un parmetro positivo que representa el nmero de veces que se espera
que ocurra el fenmeno durante un intervalo dado.
e es la base de los logaritmos naturales (e = 2,71828...).

4. Algunas aplicaciones de esta distribucin es para el control de calidad, el


aseguramiento de calidad y el muestreo de aceptacin, es decir para
obtener la probabilidad de ocurrencia de sucesos raros cuyo resultado lo
representa una variable discreta.

5. La funcion de distribucin: ppois(q, lambda, lower.tail = T, log.p = F)La


probabilidad : prob: Probabilidad de xito en cada ensayo.
Los cuantiles : qpois(p, lambda, lower.tail = T, log.p = F)
DISTRIBUCION LOG-NORMAL

1. Aplica para datos continuos


2. La distribucin log-normal tiende a la funcin densidad de probabilidad

1 2 /22
(; , ) = (ln())
2

para x>0

3. Donde es la media y la desviacion estandar del logaritmo de variable.


2 /2 2
El valor esperado es () = + y la varianza es () = (
2
1) 2+

4. Las aplicaciones de la distribucin lognormal se ajusta a ciertos tipos de


fallos (fatiga de componentes metlicos), vida de los aislamientos
elctricos, procesos continuos (procesos tcnicos) y datos de reparacin y
puede ser una buena representacin de la distribucin de los tiempos de
reparacin. Es tambin una distribucin importante en la valoracin de
sistemas con reparacin.
La distribucin lognormal es importante en la representacin de
fenmenos de efectos Proporcionales, tales como aquellos en los que un
cambio en la variable en cualquier punto de un proceso es una proporcin
aleatoria del valor previo de la variable. Algunos fallos en el programa de
mantenimiento entran en esta categora.

5. La funcion de distribucin: plnorm(q, meanlog, sdlog, lower.tail = T,


log.p = F)
La probabilidad : p: Vector de probabilidades.
Los cuantiles : qlnorm(p, meanlog, sdlog, lower.tail = T, log.p = F)

6. .

DISTRIBUCION X2 (CHI CUADRADO)


1. Aplica para datos continuos

1
2. Su funcin de densidad es: (; ) = { (2)1 /2 } Para x>0,

22 ( )
2

para x 0


( , )
Su funcin de distribucin acumulada es: ( ) = 22

( )
2

3. Para la funcin de densidad es la funcin gamma


Para la funcin de distribucin acumulada (k,z) es la funcin gamma
incompleta, el valor esperado y la varianza de una variable aleatoria X
con distribucin X2 son, respectivamente, k y 2k.

4. La distribucin tiene muchas aplicaciones en inferencia estadstica. La


ms conocida es la de la denominada prueba utilizada como prueba de
independencia y como prueba de bondad de ajuste y en la estimacin de
varianzas. Pero tambin est involucrada en el problema de estimar la
media de una poblacin normalmente distribuida y en el problema de
estimar la pendiente de una recta de regresin lineal, a travs de su papel
en la distribucin t de Student.
Aparece tambin en todos los problemas de anlisis de varianza por su
relacin con la distribucin F de Snedecor, que es la distribucin del
cociente de dos variables aleatorias independientes con distribucin .

5. La funcion de distribucin: pchisq(q, df, ncp=0, lower.tail = T, log.p = F)


La probabilidad : p: Vector de probabilidades.
Los cuantiles : qchisq(p, df, ncp=0, lower.tail = T, log.p = F)

6.

DISTRIBUCION F

1. Aplica para datos continuos


2. La distribucin F se construye de la siguiente manera:

1 12 / (1 1) 12 )
=
2 22 / (2 1) 22 )
3. Donde:
N1: N de datos de la muestra 1
N2: N de datos de la muestra 2
12 : Varianza muestral del grupo 1
22 : Varianza muestral del grupo 2
12 : Varianza del grupo 1
22 : Varianza del grupo 2

4. Su principal aplicacin se basa en la investigacin agrcola y biolgica,


con una terminologa tpica de (tratamiento, bloques y parcelas), pero su
aplicacin es universal.

5. La funcion de distribucin: pf(q, df1, df2, ncp, lower.tail = T, log.p = F)


La probabilidad : p: Vector de probabilidades.
Los cuantiles : qf(p, df1, df2, ncp, lower.tail = T, log.p = F)

6.

DISTRIBUCION T (ESTO ES UN EJEMPLO CRISTIAN DE LO QUE


HAY QUE HACER EN LOS ULTIMOS PUNTOS) LO ENCONTRE EN
INTERNET

1. Aplica para datos continuos


2. La funcin de densidad de T es:
+1
( ) 2 (+1)
( ) = 2 (1 + ) 2

(2)

3. Dnde: v es igual a n-1


El parmetro v representa el nmero de grados de libertad. La
distribucin depende de v, pero no de o , lo cual es muy importante
en la prctica.

4. Entre los usos ms frecuentes de las pruebas t se encuentran:

El test de locacin de muestra nica por el cual se comprueba si la


media de una poblacin distribuida normalmente tiene un valor
especificado en una hiptesis nula.
El test de locacin para dos muestras, por el cual se comprueba si
las medias de dos poblaciones distribuidas en forma normal son
iguales. Todos estos test son usualmente llamados test t de Student, a
pesar de que estrictamente hablando, tal nombre slo debera ser
utilizado si las varianzas de las dos poblaciones estudiadas pueden ser
asumidas como iguales; la forma de los ensayos que se utilizan cuando
esta asuncin se deja de lado suelen ser llamados a veces como Prueba
t de Welch. Estas pruebas suelen ser comnmente nombradas como
pruebas t desapareadas o de muestras independientes, debido a que
tienen su aplicacin ms tpica cuando las unidades estadsticas que
definen a ambas muestras que estn siendo comparadas no se
superponen.
El test de hiptesis nula por el cual se demuestra que la diferencia entre
dos respuestas medidas en las mismas unidades estadsticas es cero.
Por ejemplo, supngase que se mide el tamao del tumor de un
paciente con cncer. Si el tratamiento resulta efectivo, lo esperable
sera que el tumor de muchos pacientes disminuyera de tamao luego
de seguir el tratamiento. Esto con frecuencia es referido como
prueba t de mediciones apareadas o repetidas.
El test para comprobar si la pendiente de una regresin lineal difiere
estadsticamente de cero.

5. Comando en R
> x=seq(-3,3,0.1)
> y=dt(x,0.3)
> plot(x,y, type="l", col="blue", lwd="10")
>
> y=dt(x,0.4)
> lines(x,y, type="l", col="pink", lwd="10")
>
> y=dt(x,0.5)
> lines(x,y, type="l", col="red", lwd="10")
6. Grafica

SEGUNDA PARTE INTERVALOS DE CONFIANZA

Ejercicio N 15
Si los datos no son apareados.

a) Realice un boxplot para los datos de cada conjunto. Identifique si existen


valores atpicos.

Figura 1. Boxplot de los datos por el mtodo enzimtico.


Figura 2. Boxplot de los datos por el mtodo de permanganato.

b) Segn su criterio, decida si remueve o no algun valor atipico del


conjunto.

No se observan datos atpicos en ninguna de las dos pruebas.

c) Calcule la media y la desviacin estndar para cada conjunto.

DATOS MEDIA mean(x) DESVICIN ESTNDAR sd(x)

Mtodo enzimtico 30.32143 0.5437457


Mtodo del permanganato. 30.7 0.7348469

d) Calcule la proporcin entre las varianzas de los conjuntos.

DATOS VRIANZA var(x)


Mtodo enzimtico 0.2956593
Mtodo del permanganato. 0.54

e) Construya un intervalo de confianza al 95% para la proporcin entre las


varianzas.
f) Son significativas las diferencias entre las desviaciones estndar de los
conjuntos?

Si, si son significativas.

g) Construya un intervalo de confianza al 95% para la diferencia de las


medias, teniendo en cuenta si las desviaciones estndar son iguales o no.

h) Construya un intervalo de confianza al 99% para la diferencia de las


medias, teniendo en cuenta si las desviaciones estndar son iguales o no.

i) Es significativa las diferencias entre las medias de los conjuntos al 95%?


al 99%?

No, no son significativos; en ambos conjuntos de intervalos se encuentra


el nmero 0.

j) Realice una breve discusin sobre los resultados obtenidos.

Ejercicio N 7
Si los datos son apareados
a) Calcule las diferencias entre cada pareja de datos.

b) Realice un boxplot con los datos de las diferencias. Identifique si existen


valores atipicos.
Figura 3. Boxplot de la diferencia.

c) Segun su criterio, decida si remueve o no algun valor atipico del


conjunto.

No existen valores atpicos, por lo que no hay necesidad de remover


alguno.

d) Calcule la media y la desviacion estandar de las diferencias.

e) Construya un intervalo de confianza al 95% para la media de las


diferencias.

f) Construya un intervalo de confianza al 99% para la media de las


diferencias.
g) Es significativa las diferencia entre las medias de los conjuntos al 95%? al
99%?

Media 1 y media 2 estn entre (2.32 y 5.61) al 95% , 0 no est en el intervalo


Hay una diferencia significativa entre las medias de los grupos (sea
una media es mayor a la otra).
El grupo A (antes) obtiene sistemticamente mayores porcentajes que el
grupo de personas D (despus).

Media 1 y media 2 estn entre (1.69 y 6.23) al 99%


0 No est en el intervalo, sea que tambin hay una diferencia
significativa entre las medias de los grupos, una es mayor que
otra.

h) Realice una breve discusion sobre los resultados obtenidos

Se pudo demostrar que lo que el dueo del gimnasio afirma es verdadero, pues
al obtener mayor porcentaje el grupo de personas (antes) quiere decir que
efectivamente bajaron de talla, ya que el grupo (despus) obtiene menores
porcentajes (bajaron talla).

También podría gustarte