Está en la página 1de 8

UNIDAD 5 ESTADISTICA APLICADA

5.1 Inferencia estadstica: Concepto, Estimacin, Prueba de


hiptesis
La inferencia es la parte de la estadstica matemtica y esta se encarga del estudio de los mtodos
para la obtencin del modelo dela probabilidad de la forma racional y la de la forma en la que se
determinan los parmetros que determinan la funcin de distribucin, estas singuen una variable
aleatoria de una determinada poblacin, a travs de una muestra que es la poblacin que se
obtiene de la misma.
En estas hay dos problemas fundamentales que estudia la inferencia estadstica son el problema
de estimacin y el problema del contraste de hiptesis.
En todo estos problemas que estudia la inferencia estadstica juega un papel fundamental la
teora de la probabilidad son distintas formas funcionales de las distribuciones de probabilidad y
la teora de muestras procedimientos para tomar muestras de manera apropiada.
ESTIMACIN.
El material sobre teora de la probabilidad constituye la base de la inferencia estadstica, rama de
la estadstica que tiene que ver con el uso de los conceptos de la probabilidad para tratar con
la toma de decisiones en condiciones de incertidumbre. La inferencia estadstica est basada en la
estimacin y en la prueba de hiptesis.
Podemos hacer dos tipos de estimaciones concernientes a una poblacin:

Una estimacin puntual: es slo u nmero que se utiliza para estimar un parmetro de
poblacin desconocido. Una estimacin puntual a menudo resulta insuficiente, debido a
que slo tiene dos opciones: es correcta o est equivocada. Una estimacin puntual es
mucho ms til si viene acompaada por una estimacin del error que podra estar
implicado.

Una estimacin de intervalo: es un intervalo de valores que se utiliza para estimar un


parmetro de poblacin. Esta estimacin indica el error de dos maneras: por la extensin
del intervalo y por la probabilidad de obtener el verdadero parmetro de la poblacin que
se encuentra dentro del intervalo.

PRUEBAS DE HIPTESIS.
Una hiptesis es una afirmacin acerca de algo. En estadstica, puede ser una suposicin acerca
del valor de un parmetro desconocido.

Pasos en la prueba de hiptesis:


1.
2.
3.
4.
5.
6.

Definir la hiptesis nula: suponer una hiptesis acerca de una poblacin.


Formular una hiptesis alternativa: es una contra-hiptesis.
Definir un criterio de decisin para rechazar o no la hiptesis nula.
Recabar datos de la muestra.
Calcular una estadstica de muestra.
Utilizar la estadstica de muestra para evaluar la hiptesis.

Generalmente, se habla de "no rechazar" una hiptesis en lugar de "aceptar", ya que las pruebas
no son concluyentes.

5.2-ESTIMACIONES PUNTUALES Y POR INTERVALOS DE CONFIANZA


ESTIMACIN PUNTUAL
Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una
frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo
de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la talla media de
los individuos. Lo ms importante de un estimador, es que sea un estimador eficiente. Es decir,
que sea insesgado (ausencia de sesgos) y estable en el muestreo o eficiente (varianza mnima)

ESTIMACIN POR INTERVALOS DE CONFIANZA


En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales se estima que
estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos
nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor
desconocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa
con 1 - y se denomina nivel de confianza. En estas circunstancias, es el llamado error
aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin
mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo
ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza), mientras que para un
intervalo ms pequeo, que ofrece una estimacin ms precisa, aumentan sus posibilidades de
error.
Para la construccin de un determinado intervalo de confianza es necesario conocer
la distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro presente
una distribucin normal. Tambin pueden construirse intervalos de confianza con ladesigualdad
de Chebyshov.
En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un parmetro
poblacional que sigue una determinada distribucin de probabilidad, es una expresin del tipo
[1,2] tal que P[1 2] = 1 - , donde P es la funcin de distribucin de probabilidad de .

Intervalo de confianza para la media de una poblacin


De una poblacin de media y desviacin tpica se pueden tomar muestras de elementos.
Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de
todas las medias muestrales coincide con la media poblacional:
Pero adems, si el tamao de las muestras es lo suficientemente grande, la distribucin de medias
muestrales es, prcticamente, una distribucin normal (o gaussiana) con media y una desviacin
tpica

dada

por

sigue:

la

siguiente

expresin:

Esto

se

representa

como

. Si estandarizamos, se sigue que:

En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un
determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 z
z2] = 1 - , donde (1 - )100 es el porcentaje deseado.
Se desea obtener una expresin tal que
En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se
encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza
determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este
valor se le llamar
(debido a que es el error que se cometer, un trmino opuesto).
Para

ello

se

necesita

calcular

el

punto

o,

mejor

dicho,

su

versin

estandarizada
o valor crtico junto con su "opuesto en la distribucin"
. Estos
puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que:

As:

Haciendo operaciones es posible despejar

para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Obsrvese que el intervalo de confianza viene dado por la media muestral


del valor crtico
Si no se conoce

por el error estndar

y n es grande (habitualmente se toma n 30):

el producto

, donde s es la desviacin tpica de una muestra.


Aproximaciones para el valor
para

y 2,576 para

para los niveles de confianza estndar son 1,96


.

5.3 Regresin y correlacin.


Cuando se tiene una variable, llamada dependiente, cuyos resultados son un valor promedio de
una funcin de una o ms variables no aleatorias, llamadas independientes (el concepto de
independencia y dependencia se establece en trminos matemticos, no probabilstico), se tiene
que recurrir a un tipo de tcnicas que permitan modelar esta situacin.
Existen dos formas de obtener estos modelos: funciones determinsticas, y funciones
probabilsticas, nuestro inters es sobre estos ltimos. Aunque para fines prcticos, si el error es
despreciable se deben de usar los determinsticos, pero si se quiere estimar el error se deben usar
los probabilsticos, a pesar de que no representen exactamente a la realidad.
Si la funcin es de tipo lineal, en la cual el exponente de las variables independientes no es mayor
de uno, el modelo se denomina de regresin lineal, si no es el caso entra en lo que se denomina
superficies de respuesta.
Si solo existe una variable independiente se llama simple y si son dos o ms variables
independientes se les llama mltiple.
MODELO DE REGRESIN LINEAL SIMPLE
Cuando se busca un modelo en el cual se tiene una sola variable independiente, y esta es una
funcin lineal, el modelo se puede expresar de la forma:

Donde:
es el error aleatorio con media cero y la misma varianza de la poblacin, que representa todas
las variables que no entran en el modelo, por no poderse incluir a todas y afectar mnimamente a
Y, lo que hace que no sea una representacin exacta de la realidad.

La tcnica que se mostrar a continuacin, estima a los parmetros de este modelo usando la
tcnica que se conoce como mnimos cuadrados. Los supuestos en que se requieren para aplicar
esta tcnica son:

La variable dependiente es una variable aleatoria, cuyo valor promedio est determinado
por la variable independiente.

La relacin entre las variables dependiente e independiente es lineal.

Las varianzas de las distribuciones condicionales de la variable dependiente, para diversos


valores de la variable independiente, son iguales. Propiedad llamada Homoscedasticidad.
Si se desea realizar estimacin por intervalos, se debe cumplir adicionalmente con el supuesto de:

Las distribuciones condicionales de la variable dependiente, para diversos valores de la


variable independiente, son todas distribuciones normales para la poblacin de valores.
Tcnica:
1. Dibujar un diagrama de dispersin, el cual permite una primera aproximacin para averiguar si
se cumplen algunos de los supuestos del modelo.
2. Calcular los valores de los parmetros en base a las frmulas establecidas al ajustar el modelo
por mnimos cuadrados.
3. Realizar los clculos necesarios para efectuar las inferencias que se deseen (estimacin puntual,
estimacin por intervalos, prueba de hiptesis).
4. Evaluar lo adecuado del modelo para el problema analizado.
Al aplicarse esta tcnica se debe tener mucho cuidado al elegir las variables, ya que la aparente
dependencia que exista entre X y Y, se puede deber a que ambas son dependientes de una tercera
variable que no se encuentre contenida en el anlisis.
Al realizar la recoleccin de informacin al modificar intencionalmente a la variable independiente
y registrar el valor observado de la variable dependiente, se contar con n pares de valores
observados, que se graficarn en una diagrama simple X-Y. Esto permitir evaluar a simple vista si
la relacin es o no lineal. Las formas tpicas que se encontrarn son como se muestra en la
siguiente figura:

En la primera grfica se aprecia claramente una relacin lineal positiva (a mayores valores de X,
mayores valores de Y), en la segunda una relacin lineal negativa (a mayores valores de X,
menores valores de Y), y en la tercera se aprecia que la relacin no es lineal (se puede ajustar ms
de una lnea recta).
En este ltimo caso se tiene que buscar convertir la relacin no lineal a lineal mediante alguna
transformacin matemtica tal como el uso de algoritmos, o utilizar tcnicas de ajuste de curvas
que entran dentro del rea de superficies de respuesta.

Correlacin directa fuerte

Correlacin inversa - fuerte

Correlacin nula
Coeficiente de Determinacin.
Adicionalmente se puede utilizar el coeficiente de determinacin para medir el grado de ajuste del
modelo, despus de probar que s es adecuado. Pero este coeficiente debe ser usado con
precaucin ya que este tiende a 1, lo cual significa que el modelo es totalmente adecuado, con
solo agregar trminos al modelo, lo cual no siempre significa que sea adecuado, ya que se puede
haber incrementado el cuadrado medio del error. Este coeficiente se puede calcular mediante:

CORRELACIN.
Si tenemos un problema de regresin lineal, pero ambas variables tanto la dependiente como las
variables independientes son aleatorias, esto permite suponer que las observaciones de y y x son
variables aleatorias conjuntas de la distribucin f(x, y).
La forma de determinar los parmetros del modelo son las mismas que se plantearon
anteriormente usando el mtodo de mnimos cuadrados, considerando a y y x como variables
aleatorias normales independientes con media

y varianza constante

Adicionalmente a lo planteado en regresin lineal, es posible realizar inferencias sobre el


coeficiente de correlacin r, cuyo estimador es r:

Este coeficiente mide la asociacin lineal entre y y x, es decir, el cambio que y tiene por cambios
en x. As mismo, se puede establecer una prueba de hiptesis para probar si el modelo no es
adecuado, que equivale a probar si el coeficiente de correlacin es igual a cero.

También podría gustarte