P. 1
ANALISIS DEL DATO ESTADISTICO II - Guia a Actualizada

ANALISIS DEL DATO ESTADISTICO II - Guia a Actualizada

|Views: 3.541|Likes:
Publicado porcanelonesc4654

More info:

Categories:Topics, Art & Design
Published by: canelonesc4654 on Dec 24, 2010
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

06/04/2013

pdf

text

original

Pasos para la contratación de una hipótesis:
11. Formulación de hipótesis
22. Especificación de un valor de probabilidad crítico o nivel de significación.
33. Elección de un estadístico de la muestra y de su distribución para someter a prueba
las hipótesis.
44. Establecimiento de una zona de rechazo para Ho.
55. Cómputos necesarios.
66. Decisión.

Tabla 1 Parámetros y estadísticos de prueba mas comunes

Tabla 2 Estadísticos de prueba para algunos parámetros poblacionales

Prueba de hipótesis acerca de la media poblacional cuando la muestra
proviene de una población distribuida normalmente y con varianza conocida.

Ejemplo. Un médico traumatólogo afirma que el contenido de calcio en
los huesos de mujeres que padecen osteoporosis después de aplicársele
cierto tratamiento es mayor al valor promedio observado para la
población femenina que padece está enfermedad, el cual se sabe es
igual a 270 mg/g con una desviación de 120 mg/g. Para probar su
premisa el investigador determinó el contenido de calcio en los huesos
de 36 individuos que fueron sometidos al tratamiento y pudo determinar
que dicha muestra arroja un valor promedio de calcio igual a 310 mg/g.
La concentración de calcio es una variable que se distribuye
normalmente.

Las hipótesis de investigación son las siguientes:

Ho : El tratamiento para la osteoporosis no tiene ningún efecto

H1 : El tratamiento para la osteoporosis aumenta los niveles de calcio en
los huesos.

Prueba de las hipótesis estadísticas

a. Formulación de hipótesis. Ho : μ = 270 frente a H1 : μ > 270
b. Especificación de un valor de probabilidad crítico o nivel de
significación. α = 0.05

c. Elección de un estadístico de la muestra y de su distribución para
someter a prueba las hipótesis.
Puesto que el parámetro involucrado en la docimasia es la media
poblacional μ, y la variable se distribuye normalmente con varianza
conocida lo más conveniente es usar como estadístico de prueba la
media muestral en su forma derivada Z.

d. Establecer una zona de aceptación para Ho.
Como H1: μ > μo se trata de una prueba de una cola hacia la derecha,
siendo la zona de aceptación la siguiente: ZA = {Z / Z < z (1−α)}
e. Cómputos (cálculos) necesarios:

f. Decisión:

Como z = 2 > z(0.95) = 1.65 el valor del estadístico de prueba se
encuentra dentro de la zona de rechazo. Por lo tanto se concluye que
los datos proporcionan suficiente evidencia para rechazar Ho.

La información obtenida de la muestra permite afirmar que se tiene
un 95% de confianza que el tratamiento aplicado a los pacientes
enfermos de osteoporosis aumenta el nivel de calcio en los tejidos
óseos.

La información obtenida de la muestra permite afirmar que se tiene un 95% de confianza

que el tratamiento aplicado a los pacientes enfermos de osteoporosis aumenta el nivel de

calcio en los tejidos óseos.

Prueba de hipótesis acerca de la media poblacional cuando la muestra
proviene de una población distribuida normalmente, con varianza desconocida
y tamaño de muestra grande (n > 30).

Ejemplo. Un entomólogo sospecha que en cierta zona endémica para el
dengue el valor de la tasa neta reproductiva (Ro) de una población del
mosquito Aedes aegypti vector de dicha enfermedad, ha cambiado en
relación con el valor determinado hace 5 años el cual era igual a 205
individuos. Con tal propósito determinó el valor de Ro a 40 hembras
criadas en el laboratorio y pertenecientes a una cepa desarrollada a
partir de mosquitos capturados en la zona estudiada. Los resultados
fueron los siguientes:

El investigador sabe que la variable se distribuye normalmente y quiere someter a prueba su
hipótesis no queriendo equivocarse en más del 5% de las veces.

Las hipótesis de investigación son las siguientes:

Ho : La tasa neta de reproducción no ha cambiado

H1 : La tasa neta de reproducción se modificó después de cinco años.

Prueba de las hipótesis estadísticas

a. Formulación de hipótesis
Ho : μ = 205
H1 : μ ≠ 205 (Analice porque la hipótesis alternativa es de diferencia)
b. Especificación de un valor de probabilidad crítico o nivel de significación.
El nivel de significación especificado es α = 0.05

c. Elección de un estadístico de la muestra y de su distribución para someter a prueba las

hipótesis.
Puesto que el parámetro involucrado en la docimasia es la media poblacional μ, y la
variable se distribuye normalmente con varianza desconocida y el tamaño de la muestra
grande lo más conveniente es usar como estadístico de prueba la media muestral en su
forma derivada Z. El valor de la desviación de la muestra se usa para estimar el
valor de σ.

d. Establecer una zona de aceptación para Ho.

Como H1: μ ≠ μo se trata de una prueba de dos colas, siendo la zona de aceptación la
siguiente:

ZR = {Z / -z(1−α/2) < Z < z (1−α/2)}

e. Cómputos necesarios.

e.1) Media: 202.9

e.2) Desviación estándar: s = 36.17
e.3) Estadístico de prueba:

e.4) Zona de aceptación:
ZA = {Z / -z(1−α/2) < Z < z (1−α/2)} = {Z / -z (0.975) < Z < z (0.975)} = {Z / -1.96 <
Z < + 1.96}

f. Decisión:

Como z = -0.35, el valor del estadístico de prueba se encuentra dentro de la zona de
aceptación de Ho. Por lo tanto se concluye que los datos no proporcionan suficiente
evidencia para rechazar Ho

La sospecha del investigador que la tasa de reproducción de la población de mosquito se

había modificado fue rechazada con un 95% de confianza a la luz de la información

proporcionada por la muestra.

Prueba de hipótesis acerca de la media poblacional cuando la muestra proviene de
una población distribuida normalmente, con varianza desconocida y tamaño de
muestra pequeño (n < 30).

Ejemplo. Un ecofisiólogo vegetal desea verificar si el contenido de nitrógeno en las hojas
jóvenes de la especie Rhizophora mangle, es menor en las plantas que viven en una zona
ambientalmente protegida con relación al de plantas que viven en una zona que está siendo
afectada por la contaminación con fertilizantes y cuyo valor promedio se cuantificó en 14.6
mg/g de nitrógeno. El análisis de 25 hojas jóvenes provenientes de la zona protegida
produjo los resultados siguientes:

Si la concentración de nitrógeno se distribuye normalmente, ¿apoya la evidencia
proporcionada por la muestra la presunción que las plantas de la zona protegida contienen
menos nitrógeno?. El error tipo I no debe ser mayor al 1%.

Las hipótesis de investigación son las siguientes:

Ho : La concentración de nitrógeno en las hojas jóvenes de Rhizophora mangle en ambas
regiones es la misma

H1 : La concentración de nitrógeno en las hojas jóvenes de Rhizophora mangle es menor en
la región protegida.

Prueba de las hipótesis estadísticas

a. Formulación de hipótesis
Ho : μ = 14.6
H1 : μ < 14.6
b. Especificación de un valor de probabilidad crítico o nivel de significación.
El nivel de significación especificado es α = 0.01
c. Elección de un estadístico de la muestra y de su distribución para someter a prueba las

hipótesis.

Puesto que el parámetro involucrado en la docimasia es la media poblacional μ, y la
variable se distribuye normalmente con varianza desconocida y el tamaño de la muestra
es pequeño lo más conveniente es usar como estadístico de prueba la media muestral en
su forma derivada T. El valor de la desviación de la muestra se usa para estimar el
valor de σ.

1
d. Establecer una zona de aceptación para Ho.
Como H1: μ < μo se trata de una prueba de una cola hacia la izquierda, siendo la zona
de aceptación la siguiente:

ZA = {T / T > - t ( 1−α; n-1) }

e. Cómputos necesarios.

e.1) Media: x= 10.48
e.2) Desviación estándar: s = 2.41
e.3) Estadístico de prueba:

e.4) Zona de aceptación:

ZA = {T / T > -t(1−α; n-1) } = {T / T > -t(0.99; 24)} = {T / T > -2.492}

1f. Decisión:

Como t = - 8.55 < -t(0.99; 24) = -2.492 el valor del estadístico de prueba se encuentra
dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos
proporcionan suficiente evidencia para rechazar Ho

De acuerdo a la información obtenida de la muestra se puede afirmar con un 99%
de confianza que la concentración de nitrógeno en las hojas jóvenes de
Rhizophora mangle en ambas regiones es la misma.

Regresión y Correlación Lineal Simple

Si sabemos que existe una relación entre una variable denominada dependiente y otras
denominadas independientes (como por ejemplo las existentes entre: la experiencia
profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de
personas, la producción agraria y la cantidad de fertilizantes utilizados, etc.), puede
darse el problema de que la dependiente asuma múltiples valores para una combinación
de valores de las independientes.

La dependencia a la que hacemos referencia es relacional matemática y no
necesariamente de causalidad. Así, para un mismo número de unidades producidas,
pueden existir niveles de costo, que varían empresa a empresa.

Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresión en los cuales
se obtiene una nueva relación pero de un tipo especial denominado función, en la cual la
variable independiente se asocia con un indicador de tendencia central de la variable
dependiente. Cabe recordar que en términos generales, una función es un tipo de
relación en la cual para cada valor de la variable independiente le corresponde uno y
sólo un valor de la variable dependiente.

Regresión Lineal Simple y Correlación

La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para
solucionar problemas comunes.

Muchos estudios se basan en la creencia de que es posible identificar y cuantificar
alguna Relación Funcional entre dos o más variables, donde una variable depende de la
otra variable.

Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un
modelo de Regresión Simple.

"Y es una función de X"

Y = f(X)

Como Y depende de X, Y es la variable dependiente, y X es la variable independiente.

En el Modelo de Regresión es muy importante identificar cuál es la variable
dependiente y cuál es la variable independiente.

En el Modelo de Regresión Simple se establece que Y es una función de sólo una
variable independiente, razón por la cual se le denomina también Regresión Bivariada
porque sólo hay dos variables, una dependiente y otra independiente y se representa así:

Y = f (X)

"Y depende de X"

La variable dependiente es la variable que se desea explicar, predecir. También se le
llama Variable Respuesta.

La variable Independiente X se le denomina Variable Explicativa y se le utiliza para
Explicar Y.

Análisis Estadístico: Regresión Lineal Simple

En el estudio de la relación funcional entre dos variables poblacionales, una variable X,
llamada independiente, explicativa o de predicción y una variable Y, llamada
dependiente o variable respuesta, presenta la siguiente notación:

Y = A + B X + E

Donde:

A es el valor de la ordenada donde la línea de regresión se intercepta con el eje
Y.

B es el coeficiente de regresión poblacional (pendiente de la línea recta)

E es el error.

Suposición de la regresión Lineal

1.Los valores de la variable independiente X son fijos, medidos sin error.
2.La variable Y es aleatoria

3.Para cada valor de X, existe una distribución normal de valores de Y
(subpoblaciones Y)
4.Las variancias de las subpoblaciones Y son todas iguales.
5.Todas las medias de las subpoblaciones de Y están sobre la recta.
6.Los valores de Y están normalmente distribuidos y son estadísticamente
independientes.

Estimación de la ecuación de regresión muestral

Consiste en determinar los valores de "a" y "b" a partir de la muestra, es decir, encontrar
los valores de a y b con los datos observados de la muestra. El método de estimación es
el de Mínimos Cuadrados, mediante el cual se obtiene:

Luego, la ecuación de regresión muestral estimada es:

Interpretación de:

a es el estimador de A. Es el valor estimado de la variable Y cuando la variable X = 0

b es el estimador de B , es el coeficiente de regresión. Está expresado en las mismas
unidades de Y por cada unidad de X. Indica el número de unidades en que varía Y
cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresión).

Un valor negativo de b sería interpretado como la magnitud del decremento en Y por
cada unidad de aumento en X.

Ejemplo

Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de
una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el
peso de una persona seleccionada de entre el grupo con dicha estatura, resultando:

X152155152155157152157165162178183178

Y5061.554.557.563.559617266728482

Con estos datos vamos a plantear una ecuación de regresión simple que nos permita
pronosticar los pesos conociendo las estaturas.

Desarrollo:

Representación matemática y gráfica de los datos:

Representación Matemática

estatura pesos

Regresión Lineal

I.C. para la
media I. C. individual

datos

x

y

x ^2

y ^2

xy y est. Residual L. I. L. S. L. I. L. S.

1

152

50

23104 2500 7600 56.43 -6.43 53.07 59.79 47.30 65.56

2

155

61.5

24025 3782.3 9532.5 59.03 2.47 56.09 61.97 50.05 68.02

3

152

54.5

23104 2970.3 8284 56.43 -1.93 53.07 59.79 47.30 65.56

4

155

57.5

24025 3306.3 8912.5 59.03 -1.53 56.09 61.97 50.05 68.02

5

157

63.5

24649 4032.3 9969.5 60.77 2.73 58.05 63.48 51.85 69.68

6

152

59

23104 3481 8968 56.43 2.57 53.07 59.79 47.30 65.56

7

157

61

24649 3721 9577 60.77 0.23 58.05 63.48 51.85 69.68

8

165

72

27225 5184 11880 67.71 4.29 65.17 70.24 58.85 76.57

9

162

66

26244 4356 10692 65.11 0.89 62.65 67.56 56.27 73.94

10

178

72

31684 5184 12816 78.99 -6.99 74.65 83.33 69.45 88.52

11

183

84

33489 7056 15372 83.32 0.68 78.01 88.64 73.31 93.34

12

178

82

31684 6724 14596 78.99 3.01 74.65 83.33 69.45 88.52

Representación Gráfica

De acuerdo al desarrollo matemático hemos obtenido los siguientes cálculos:

Lo que nos permite obtener los coeficientes a y b.
Luego,

b = 1223 / 1409.667 = 0.8676

a = 65.25 – (0.8676) (162.167) = -75.446

Interpretación:

La ecuación de regresión estimada es:

Coeficiente de correlación: R= 0.9379

Coeficiente de determinación: R²=0.8796

El valor de b = 0.8676 indica el incremento del peso en kilogramos, en promedio, por
cada centímetro de aumento en la estatura de los hombres adultos.

El valor de a, no tiene interpretación práctica en el ejemplo, se interpretaría como el
valor obtenido, en promedio, para el peso Y, cuando la estatura es 0.

Utilizando la ecuación de regresión para estimar o predecir valores de la variable Y:
Para una talla de 180 se obtiene un peso de 80.7 kg.

¿Cuánto se espera que pese (en promedio) una persona que mide 1.60 m?

Sustituyendo el valor de interés en la ecuación:

Se obtiene:

Conclusión:

De acuerdo a la gráfica de dispersión y la ecuación de Regresión Lineal estimada para
las variables estatura y peso muestran, que las variables peso y estatura están
correlacionadas.

Esta relación se ha estimado en un R = 93.7, que indica una fuerte relación positiva.

Además si consideramos el coeficiente de determinación R² = 87.9 podemos indicar que
el 87.9% de las variaciones que ocurren en el peso se explicarían por las variaciones en
la variable estatura.

FUENTES CONSULTADAS:

1

Armas, J. (1992) Estadística Sencilla. Probabilidades. Mérida:

FACES-ULA.
2

Newbold, P. (1998) Estadística para los Negocios y la
Economía
. Madrid: Prentice Hall.
3

Ya-Lun Chou. (1992) Análisis Estadístico. México: Editorial

Interamericana.
4

Walpole, R. y Myers, R. (1992) Probabilidad y Estadística.
México, D.F.: Editorial Interamericana.
5

Canavos, G. (1988) Probabilidad y Estadística. Aplicaciones y
Métodos
. España: McGraw-Hill / Interamericana.
6

Berenson, M., Levine, D. y Krehbiel, T. (2001) Estadística
para Administración
. México: Pearson Educación.
7

Mason, R., Lind, D. y Marchal, W. (2001) Estadística para
Administración y Economía
. México, D.F.: Alfaomega.
8

Stevenson,. W. (1981) Estadística para Administración y
Economía.
México, D.F.: Harla.
9

Montgomery, D. y Runger, G. (2000) Probabilidad y
Estadística: aplicadas a la Ingeniería
. México, D.F.: McGraw-Hill /
Interamericana.

10

amsey, F. y Schafer, D. (2002) The Statistical Sleuth. USA:

Duxbury.

11

Página WEB.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->