Está en la página 1de 19

Estadstica inferencial

La estadstica inferencial es una parte de la estadstica que


comprende los mtodos y procedimientos que por medio de la
induccin determina propiedades de una poblacin
estadstica, a partir de una pequea parte de esta. Su objetivo
es obtener conclusiones tiles para hacer deducciones sobre
una totalidad, basndose en la informacin numrica.
Se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin teniendo
en cuenta la aleatoriedad de las observaciones. Se usa para
modelar patrones en los datos y extraer inferencias acerca de
la poblacin bajo estudio. Estas inferencias pueden tomar la
forma de respuestas a preguntas s/no (prueba de hiptesis),
estimaciones de unas caractersticas numricas (estimacin),
pronsticos de futuras observaciones, descripciones de
asociacin (correlacin) o modelamiento de relaciones entre
variables de Sam (anlisis de regresin). Otras tcnicas de
modelamiento incluyen anlisis de varianza, series de tiempo
y minera de datos.
Estudio de la estadstica inferencial

Toma de muestras o muestreo, que se refiere a la forma


adecuada de considerar una muestra que permita obtener
conclusiones estadsticamente vlidas y significativas.

Estimacin de parmetros o variables estadsticas, que


permite estimar valores poblacionales a partir de muestras
de mucho menor tamao.

Contraste de hiptesis, que permite decidir si dos


muestras son estadsticamente diferentes, si un
determinado procedimiento tiene un efecto estadstico
significativo, etc.

Diseo experimental.

Inferencia bayesiana.

Mtodos no paramtricos.

Mtodo

Planteamiento del problema: un problema de


inferencia estadstica suele iniciarse con una fijacin de
objetivos o algunas preguntas del tipo:
Cul ser la media de esta poblacin respecto a tal
caracterstica?
Se parecen estas dos poblaciones?
Hay alguna relacin entre...?
En el planteamiento se definen con precisin
la poblacin, la caracterstica a estudiar, las variables,
etc.
Elaboracin de un modelo: en caso de
establecer un modelo terico, se replantea el
procedimiento y se llega a una conclusin lgica.
Los posibles modelos son distribuciones de
probabilidad.
Extraccin de la muestra: se usa alguna tcnica
de muestreo o un diseo experimental para
obtener informacin de una pequea parte de la
poblacin.
Tratamiento de los datos: en esta fase se
eliminan posibles errores, se depura la muestra, se
tabulan los datos y se calculan los valores que
sern necesarios en pasos posteriores, como
la media muestral, la varianza muestral.
Los mtodos de esta etapa estn definidos por
la estadstica descriptiva.
Estimacin de los parmetros: con
determinadas tcnicas se realiza una prediccin

sobre cules podran ser los parmetros de la


poblacin.
Contraste de hiptesis: los contrastes de
hiptesis son tcnicas que permiten simplificar
el modelo matemtico bajo anlisis.
Frecuentemente el contraste de hiptesis recurre al
uso de estadsticos muestrales.
Artculo principal: Contraste de hiptesis
Conclusiones: se critica el modelo y se hace un
balance. Las conclusiones obtenidas en este punto
pueden servir para tomar decisiones o hacer
predicciones.
El estudio puede comenzar de nuevo a partir de este
momento, en un proceso cclico que permite conocer
cada vez mejor la poblacin y caractersticas de
estudio.

INFERENCIA ESTADSTICA
La inferencia estadstica es el conjunto de mtodos y tcnicas
que permiten inducir, a partir de la informacin emprica
proporcionada por una muestra, cual es el comportamiento de
una determinada poblacin con un riesgo de error medible en
trminos de probabilidad.
Los mtodos paramtricos de la inferencia estadstica se
pueden dividir, bsicamente, en dos: mtodos de estimacin
de parmetros y mtodos de contraste de hiptesis. Ambos
mtodos se basan en el conocimiento terico de la
distribucin de probabilidad del estadstico muestral que se
utiliza como estimador de un parmetro.

La estimacin de parmetros consiste en asignar un valor


concreto al parmetro o parmetros que caracterizan la
distribucin de probabilidad de la poblacin. Cuando se estima
un parmetro poblacional, aunque el estimador que se utiliza
posea todas las propiedades deseables, se comete un error de
estimacin que es la diferencia entre la estimacin y el
verdadero valor del parmetro. El error de estimacin es
desconocido por lo cual es imposible saber en cada caso cual
ha sido la magnitud o el signo del error; para valorar el grado
de precisin asociado con una estimacin puntual se parte de
dicha estimacin para construir un intervalo de confianza. En
sntesis, un intervalo de confianza est formado por un
conjunto de valores numricos tal que la probabilidad de que
ste contenga al verdadero valor del parmetro puede fijarse
tan grande como se quiera. Esta probabilidad se denomina
grado de confianza del intervalo, y la amplitud deste
constituye una medida del grado de precisin con el que se
estima el parmetro.
Los mtodos de contraste de hiptesis tienen como objetivo
comprobar si determinado supuesto referido a un parmetro
poblacional, o a parmetros anlogos de dos o ms
poblaciones, es compatible con la evidencia emprica
contenida en la muestra. Los supuestos que se establecen
respecto a los parmetros se llaman hiptesis paramtricas.
Para cualquier hiptesis paramtrica, el contraste se basa en
establecer un criterio de decisin, que depende en cada caso
de la naturaleza de la poblacin, de la distribucin de
probabilidad del estimador de dicho parmetro y del control
que se desea fijar a priori sobre la probabilidad de rechazar la
hiptesis contrastada en el caso de ser sta cierta.
En todo contraste intervienen dos hiptesis. La hiptesis nula
(Ho) es aquella que recoge el supuesto de que el parmetro
toma un valor determinado y es la que soporta la carga de la
prueba. La decisin de rechazar la hiptesis nula, que en
principio se considera cierta, est en funcin de que sea o no
compatible con la evidencia emprica contenida en la muestra.
El contraste clsico permite controlar a priori la probabilidad
de cometer el error de rechazar la hiptesis nula siendo sta

cierta; dicha probabilidad se llama nivel de significacin del


contraste ( ) y suele fijarse en el 1%, 5% o 10%.
La proposicin contraria a la hiptesis nula recibe el nombre
de hiptesis alternativa (H1) y suele presentar un cierto grado
de indefinicin: si la hiptesis alternativa se formula
simplemente como 'la hiptesis nula no es cierta', el contraste
es bilateral o a dos colas; por el contrario cuando se indica el
sentido de la diferencia, el contraste es unilateral o a una sola
cola.
Cuando se realiza un contraste con el SPSS no se fija el nivel
de significacin deseado, el programa calcula el valor-p o
significacin asinttica, que es la probabilidad de que el
estadstico de prueba tome un valor igual o superior al
muestral bajo el supuesto de que la hiptesis nula es cierta.
Por tanto, si el valor-p es menor o igual que el nivel de
significacin deseado se rechazar Ho.Un valor-p prximo a
cero indica que se rechazar la Ho para cualquier nivel de
significacin.
Conceptos de Muestreo Estadstico
En estadstica un muestreo es la tcnica para la seleccin de
una muestra a partir de una poblacin. En el muestreo, si el
tamao de la muestra es ms pequeo que el tamao de la
poblacin, se puede extraer dos o ms muestras de la misma
poblacin. Al conjunto de muestras que se pueden obtener de
la poblacin se denomina espacio muestral. La variable que
asocia a cada muestra su probabilidad de extraccin
El muestreo: es una herramienta de
la investigacin cientfica. Su funcin bsica es determinar
que parte de una realidad en estudio (poblacin o universo)
debe examinarse con la finalidad de hacer inferencias sobre
dicha poblacin
El Muestreo es ms que el procedimiento empleado para
obtener una o ms muestras de una poblacin; el muestreo es

una tcnica que sirve para obtener una o ms muestras de


poblacin.
Este se realiza una vez que se ha establecido un marco
muestral representativo de la poblacin, se procede a la
seleccin de los elementos de la muestra aunque hay muchos
diseos de la muestra.
Al tomar varias muestras de una poblacin,
las estadsticas que calculamos para cada muestra no
necesariamente seran iguales, y lo ms probable es que
variaran de una muestra a otra.
Muestreo Estadstico: son aquellos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que
todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamao n
tienen la misma probabilidad de ser elegidas.
Tcnicas de seleccin del muestreo a travs del muestreo
estadstico

Muestreo probabilstico: Forman parte de este tipo de


muestreo todos aquellos mtodos para los que puede
calcularse la probabilidad de extraccin de cualquiera de las
muestras posibles. Este conjunto de tcnicas de muestreo
es el ms aconsejable, aunque en ocasiones no es posible
optar por l.

Muestreo estratificado: Consiste en la divisin previa


de la poblacin de estudio en grupos o clases que se
suponen homogneos respecto a caracterstica a estudiar. A
cada uno de estos estratos se le asignara una cuota que
determinara el nmero de miembros del mismo que
compondrn la muestra.

Muestreo sistemtico: Es la eleccin de una muestra a


partir de los elementos de una lista segn un orden

determinado, o recorriendo la lista a partir de un nmero


aleatorio determinado.

Muestreo por conglomerados: Cuando la poblacin se


encuentra dividida, de manera natural, en grupos que se
suponen que contienen toda la variabilidad de la poblacin,
es decir, la representan fielmente respecto a la
caracterstica a elegir, pueden seleccionarse slo algunos
de estos grupos o conglomerados para la realizacin del
estudio.

Muestreo errtico: Tambin se llama sin norma. La


muestra se realiza de cualquier forma, valorando
nicamente la comodidad o la oportunidad en trminos de
costes, tiempo u otro factor no estadstico.

Al realizar un muestreo en una poblacin podemos hablar de


muestreos probabilsticas y no probabilsticas, entre
estas tcnicas o procedimientosestn:

Muestreo simple: Este tipo de muestreo toma


solamente una muestra de una poblacin dada para el
propsito de inferencia estadstica. Puesto que solamente
una muestra es tomada, el tamao de muestra debe ser los
suficientemente grandes para extraer una conclusin. Una
muestra grande muchas veces cuesta demasiado dinero y
tiempo.

Muestreo aleatorio simple: Es aquel en que cada


elemento de la poblacin tiene la misma probabilidad de ser
seleccionado para integrar la muestra. Una muestra simple
aleatoria es aquella en que sus elementos son
seleccionados mediante el muestreo aleatorio simple.

Ejemplo: De modo que una muestra simple


aleatoria

se puede interpretar como un conjunto

de valores de variables aleatorias


independientes, cada una de las cuales tiene la

misma distribucin que es llamada distribucin poblacin.


Existen dos formas de extraer una muestra de una poblacin:
con reposicin y sin reposicin.

Muestreo doble: cuando el resultado del estudio de la


primera muestra no es decisivo, una segunda muestra es
extrada de la misma poblacin. Las dos muestras son
combinadas para analizar los resultados.
Este mtodo permite a una persona principiar con una
muestra relativamente pequea para
ahorrar costos y tiempo. Si la primera muestra arroja una
resultado definitivo, la segunda muestra puede no
necesitarse.

Muestreo mltiple: El procedimiento bajo este mtodo


es similar al expuesto en el muestreo doble, excepto que el
nmero de muestras sucesivas requerido para llegar a una
decisin es ms de dos muestras. Mtodos de muestreo
clasificados de acuerdo con las maneras usadas en
seleccionar los elementos de una muestra. Los elementos
de una muestra pueden ser seleccionados de dos maneras
diferentes:

Basados en el juicio de una persona


Seleccin aleatoria (al azar).

Muestreo con reemplazo: Es aquel en que un


elemento puede ser seleccionado ms de una vez en la
muestra para ello se extrae un elemento de la poblacin se
observa y se devuelve a la poblacin, por lo que de esta
forma se pueden hacer infinitas extracciones de la
poblacin aun siendo esta finita.

Muestreo sin reemplazo: No se devuelve los


elementos extrados a la poblacin hasta que no se hallan
extrados todos los elementos de la poblacin que
conforman la muestra.

Niveles o Escalas de mediciones


Escala Nominal:
La escala de medida nominal, puede considerarse la escala de
nivel ms bajo, y consiste en la asignacin, puramente
arbitraria de nmeros o smbolos a cada una de las diferentes
categoras en las cuales podemos dividir el carcter que
observamos, sin que puedan establecerse relaciones entre
dichas categoras, a no ser el de que cada elemento pueda
pertenecer a una y solo una de estas categoras.
Se trata de agrupar objetos en clases, de modo que todos los
que pertenezcan a la misma sean equivalentes respecto del
atributo o propiedad en estudio, despus de lo cual se asignan
nombres a tales clases, y el hecho de que a veces, en lugar de
denominaciones, se le atribuyan nmeros, puede ser una de
las razones por las cuales se le conoce como "medidas
nominales".
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un
atributo o propiedad de un objeto, la medida ordinal es la
indicada, puesto que entonces puede recurrirse a la propiedad
de "orden" de los nmeros asignndolo a los objetos en
estudio de modo que, si la cifra asignada al objeto A es mayor
que la de B, puede inferirse que A posee un mayor grado de
atributo que B.
La asignacin de nmeros a las distintas categoras no puede
ser completamente arbitraria, debe hacerse atendiendo al
orden existente entre stas.

Escalas de intervalos iguales:

La escala de intervalos iguales, est caracterizada por una


unidad de medida comn y constante que asigna un nmero

igual al nmero de unidades equivalentes a la de la magnitud


que pose. Esta escala, adems de poseer las caractersticas
de la escala ordinal, encontramos que la asignacin de los
nmeros a los elemento es tan precisa que podemos
determinar la magnitud de los intervalos (distancia) entre
todos los elementos de la escala. a el elemento observado.
Podemos decir que la escala de intervalos es la primera escala
verdaderamente cuantitativa y a los caracteres que posean
esta escala de medida pueden calculrsele todas las
medidas estadsticas a excepcin del coeficiente de variacin.

Escala de coeficientes o Razones:

El nivel de medida ms elevado es el de cocientes o razones,


y se diferencia de las escalas de intervalos iguales
nicamente por poseer un punto cero propio como origen; es
decir que el valor cero de esta escala significa ausencia de la
magnitud que estamos midiendo. Si se observa una carencia
total de propiedad, se dispone de una unidad de medida para
el efecto.
Tipos fundamentales de un muestreo

Muestreo no probabilstico: En este tipo de muestreo,


puede haber clara influencia de la persona o personas que
seleccionan la muestra o simplemente se realiza atendiendo
a razones de comodidad.

Ejemplo: si hacemos una encuesta telefnica por la maana,


las personas que no tienen telfono o que estn trabajando,
no podrn formar parte de la muestra.

Muestreo probabilstico: En este tipo de muestreo,


todos los individuos de la poblacin pueden formar parte de
la muestra, tienen probabilidad positiva de formar parte de
la muestra. Por lo tanto es el tipo de muestreo que
deberemos utilizar en nuestras investigaciones, por ser el
riguroso y cientfico.

Muestreo en la Auditora
Generalidades: Las normas de auditoria relativas a la
ejecucin del trabajo establecen la obligacin del auditor de
obtener, mediante sus procedimientos de
auditoria, evidencias comprobatorias suficientes y
componentes para suministrar una base objetiva para su
opinin.
El auditor no est obligado a examinar todas y cada una de
las transacciones de la empresa o de las partidas que forman
los saldos finales, ya que mediante la aplicacin de sus
procedimientos de auditoria a una muestra representativa de
estas transacciones o partidas puede obtener la evidencia que
requiere.
El Muestreo en la Auditora: Es el proceso de seleccin de
una muestra entre un grupo ms grande de partidas (llamado
poblacin, campo, ouniverso), y que utiliza las caractersticas
de la muestra para llegar a deducciones acerca de las
caractersticas del campo completo de partidas.
Consiste en la aplicacin de un procedimiento de
cumplimiento sustantivo a menos de la totalidad en las
partidas que forman el saldo de una cuenta o clase de
transaccin (muestra), que permitan al auditor obtener y
evaluar evidencias de alguna caracterstica del saldo o la
transaccin y que permite llegar a una conclusin en relacin
con las caractersticas.
CONCLUSIN
El muestreo Estadstico resulta beneficioso para
implementarlo en la realizacin de un estudio, debido a que
mediante este se pueden obtener probabilidades bajas o altas
a travs de determinados beneficios que
estas tcnicas ofrecen. En los diferentes tipos de muestreo
existen no probabilstica en los cuales se deben establecer

diferencia en el momento de realizar nuestras investigaciones


por tanto que en el no probabilstica no toda la poblacin
forma parte de la muestra y en el probabilstica todos los
individuos tienen probabilidad positiva de formar parte de la
muestra.
El muestreo es sencillamente el procedimiento que se emplea
a extraer una pequilla parte de una poblacin dentro de un
universo a esta se le llama espacio muestral dentro de un
universo.
Es importante resaltar que el primer procedimiento al realizar
una auditoria, es iniciar las investigaciones de manera tal que
esta arrojen conclusiones provenientes de determinados
estudios como puede ser el estadstico a travs de una
muestra probabilstica.

Estimador
En estadstica, un estimador es un estadstico (esto es, una
funcin de la muestra) usado para estimar un parmetro
desconocido de la poblacin. Por ejemplo, si se desea conocer
el precio medio de un artculo (el parmetro desconocido) se
recogern observaciones del precio de dicho artculo en
diversos establecimientos (la muestra) y la media
aritmtica de las observaciones puede utilizarse como
estimador del precio medio.
Para cada parmetro pueden existir varios estimadores
diferentes. En general, escogeremos el estimador que posea
mejores propiedades que los restantes,

como insesgadez, eficiencia, convergencia y robustez (consist


encia).
El valor de un estimador proporciona lo que se denomina en
estadstica una estimacin puntual del valor del parmetro
en estudio. En general, se suele preferir realizar
una estimacin mediante un intervalo, esto es, obtener
un intervalo [a,b] dentro del cual se espera est el valor real
del parmetro con un cierto nivel de confianza. Utilizar un
intervalo resulta ms informativo, al proporcionar informacin
sobre el posible error de estimacin, asociado con la amplitud
de dicho intervalo. El nivel de confianza es
la probabilidad de que a priori el verdadero valor del
parmetro quede contenido en el intervalo.
En la prctica, los intervalos de estimadores con
distribuciones simtricas suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un
valor que debe sumarse y restarse para obtener el lmite
superior e inferior.

1) Sesgo. Se dice que un estimador es insesgado si la Media


de la distribucin del estimador es igual al parmetro.
Estimadores insesgados son la Media muestral (estimador de
la Media de la poblacin) y la Varianza (estimador de la
Varianza de la poblacin):

Ejemplo
En una poblacin de 500 puntuaciones cuya Media (m) es
igual a 5.09 han hecho un muestreo aleatorio (nmero de
muestras= 10000, tamao de las muestras= 100) y hallan

que la Media de las Medias muestrales es igual a 5.09, (la


media poblacional y la media de las medias muestrales
coinciden). En cambio, la Mediana de la poblacin es igual
a 5 y la Media de las Medianas es igual a 5.1 esto es, hay
diferencia ya que la Mediana es un estimador sesgado.
La Varianza es un estimador sesgado. Ejemplo: La Media de
las Varianzas obtenidas con la Varianza

en un muestreo de 1000 muestras (n=25) en que la Varianza


de la poblacin es igual a 9.56 ha resultado igual a 9.12, esto
es, no coinciden. En cambio, al utilizar la Cuasivarianza

la Media de las Varianzas muestrales es igual a 9.5, esto es,


coincide con la Varianza de la poblacin ya que la
Cuasivarianza es un estimador insesgado.

2) Consistencia. Un estimador es consistente si aproxima el


valor del parmetro cuanto mayor es n (tamao de la
muestra).
Algunos estimadores consistentes son:

Ejemplo

En una poblacin de 500 puntuaciones cuya Media (m) es


igual a 4.9 han hecho tres muestreos aleatorios (nmero de
muestras= 100) con los siguientes resultados:

vemos que el muestreo en que n=100 la Media de las Medias


muestrales toma el mismo valor que la Media de la poblacin.

3) Eficiencia. Diremos que un estimador es ms eficiente que


otro si la Varianza de la distribucin muestral del estimador es
menor a la del otro estimador. Cuanto menor es la eficiencia,
menor es la confianza de que el estadstico obtenido en la
muestra aproxime al parmetro poblacional.
Ejemplo
La Varianza de la distribucin muestral de la Media en un
muestreo aleatorio (nmero de muestras: 1000, n=25) ha
resultado igual a 0.4. La Varianza de la distribucin de
Medianas ha resultado, en el mismo muestreo, igual a 1.12,
(este resultado muestra que la Media es un estimador ms
eficiente que la Mediana).

Estimacin puntual
La estimacin de parmetros tiene por finalidad asignar
valores a los parmetros poblacionales a partir de los
estadsticos obtenidos en las muestras. Dicho de otra manera,
la finalidad de la estimacin de parmetros es caracterizar las

poblaciones a partir de la informacin de las muestras (por


ejemplo, inferir el valor de la Media de la poblacin a partir de
los datos de la muestra).

Estimacin por intervalos


La estimacin por intervalos consiste en establecer el intervalo
de valores donde es ms probable se encuentre el parmetro.
La obtencin del intervalo se basa en las siguientes
consideraciones:
a) Si conocemos la distribucin muestral del estimador podemos
obtener las probabilidades de ocurrencia de los estadsticos
muestrales.
b) Si conociramos el valor del parmetro
poblacional, podramos establecer la probabilidad de que el
estimador se halle dentro de los intervalos de la distribucin
muestral.
c) El problema es que el parmetro poblacional es desconocido,
y por ello el intervalo se establece alrededor del estimador. Si
repetimos el muestreo un gran nmero de veces y definimos un
intervalo alrededor de cada valor del estadstico muestral, el
parmetro se sita dentro de cada intervalo en un porcentaje
conocido de ocasiones. Este intervalo es denominado "intervalo
de confianza".

Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una
poblacin que sigue la distribucin Normal, y resulta:

La distribucin de las Medias muestrales aproxima al modelo


Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de


las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviacin Tpica


de la distribucin muestral son los valores cuya funcin de
distribucin es igual a 0.975 y 0.025 respectivamente y se
pueden obtener en las tablas de la distribucin Normal
estandarizada o de funciones en aplicaciones informticas como
Excel). Seguidamente generamos una muestra de la poblacin y
obtenemos su Media, que es igual a 4.5. Si establecemos el
intervalo alrededor de la Media muestral, el parmetro
poblacional (5.1) est incluido dentro de sus lmites:

Ahora bien, la distancia de un punto A a un punto B es la misma


que de B a A. Por esa razn, la distancia desde m a la Media
muestral es la misma que va de la Media muestral a m. En
consecuencia, si hacemos un muestreo con un nmero grande
de muestras observamos que el 95% de las veces
(aproximadamente) el valor de la Media de la poblacin (m) se
encuentra dentro del intervalo definido alrededor de cada
uno de los valores de la Media muestral. El porcentaje de veces
que el valor de m se halla dentro de alguno de los intervalos de
confianza es del 95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el %
de veces que m se halle dentro del intervalo sea igual al 99%, la
expresin anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviacin Tpica


de la distribucin muestral en las tablas de la distribucin
Normal estandarizada o de funciones en aplicaciones
informticas como Excel), y son los valores cuya funcin de
probabilidad es igual a 0.995 y 0.005 respectivamente).

Ejemplo
La siguiente imagen muestra la distribucin de las Medias
muestrales obtenidas de 100000 muestras aleatorias y los
intervalos alrededor de cada una de las Medias obtenidas de
diez de las muestras:

donde ls y le simbolizan los lmites superior e inferior del


intervalo de confianza al 95%.

Nueve de los diez intervalos (salvo el definido alrededor de la


Media muestral igual a 3.7) incluyen el valor del parmetro
dentro sus lmites.

También podría gustarte