Está en la página 1de 8

COMO DETERMINAR EL TAMAO DE MUESTRA DE UN GRUPO DE NMEROS

PSEUDOALEATORIOS, DE LAS VARIABLES ALEATORIAS Y DE LAS OBSERVACIONES


REALES DEL FENMENO.

INTRODUCCIN
La Estadstica Inferencial pretende obtener conclusiones sobre la poblacin a partir de los datos
obtenidos en la muestra y para su desarrollo necesitaremos de los modelos de probabilidad. En
particular, ser necesario modelizar las variables de inters, X, como variables aleatorias.

Una variable aleatoria es una funcin que asocia un nmero real con cada elemento del espacio
muestral. Suponiendo que tenemos un experimento con espacio muestral , X es una funcin que
asigna un valor X(e) para todo resultado e que pertenezca al espacio muestral . De esta forma X(e)
es la variable aleatoria.

Variables aleatorias discretas

Una variable aleatoria, X, decimos que es de tipo discreto cuando puede tomar los valores x 1, ..., xk
con probabilidades P(x1), ..., P(xk). Estas probabilidades reciben el nombre de funcin de masa o
funcin de probabilidad. Las probabilidades son la modelizacin terica de las frecuencias relativas.
Igual que las frecuencias relativas, las probabilidades son nmeros entre 0 y 1, y la suma de las
probabilidades es 1.

La media o esperanza de X se define como:


La varianza de X se define como:

Variable aleatoria continua

Una variable aleatoria, X, decimos que es de tipo continuo cuando puede tomar cualquier valor en
un intervalo de la recta real con una funcin de densidad f(x) que representa la modelizacin en la
poblacin del perfil suavizado obtenido a partir de los datos en un histograma de frecuencias
relativas.

La media o esperanza de X se define como:

La varianza de X se define como:

MUESTREO
El objetivo de la Inferencia Estadstica es obtener conclusiones sobre alguna caracterstica
cuantitativa de una poblacin a partir de los datos obtenidos en una muestra. Para poder hacer esto
de una forma objetiva y cientfica necesitamos modelizar, tanto la caracterstica que queremos
estudiar, como la muestra con los datos que nos suministrarn la informacin.

Ejemplo 1:

Estamos interesados en estudiar la proporcin, p, de personas en una poblacin que tienen el nivel
de colesterol por encima de 200 unidades. No se puede abordar el estudio en toda la poblacin
porque el nmero total de individuos es muy grande. En primer lugar, modelizamos la variable
aleatoria que nos va a resultar til en este estudio:
Destaquemos que el modelo de probabilidad que utilizamos para X es conocido (conocemos su
funcin de probabilidad), y slo nos falta por conocer el valor del parmetro p. Esta clase de
modelizacin ser la que utilicemos siempre que queramos estudiar una probabilidad, una
proporcin o un porcentaje. Para poder hacer afirmaciones objetivas y sensatas sobre el parmetro
p, necesitamos datos. Elegiremos n individuos independientes y representativos de la
poblacin, y anotaremos si su nivel de colesterol es superior o inferior a 200 unidades. Enseguida se
precisar que significa independientes y representativos. Una muestra con estos requisitos
recibir el nombre de muestra aleatoria.

Ejemplo 2:

Estamos interesados en estudiar el nivel medio de colesterol, , de las personas de una poblacin.
No se puede abordar el estudio en toda la poblacin porque el nmero total de individuos es muy
grande. En primer lugar, modelizamos la variable aleatoria que nos va a resultar til en este estudio.
Por ejemplo: X= Nivel de colesterol N(; ) Destaquemos que el modelo de probabilidad que
utilizamos para X es conocido (conocemos su funcin de densidad), y slo nos falta por conocer el
valor de los parmetros y . El parmetro que nos interesa especialmente en este caso es . Para
poder hacer afirmaciones objetivas y sensatas sobre el parmetro , necesitamos datos. Elegiremos
n individuos independientes y representativos de la poblacin, y anotaremos su nivel de
colesterol. Enseguida se precisar que significa independientes y representativos. Una muestra
con estos requisitos recibir el nombre de muestra aleatoria.

Modelizacin de la caracterstica

Consideraremos que la caracterstica X que se quiere estudiar en una poblacin es una variable
aleatoria (discreta o continua) que puede ser modelizada por una funcin de probabilidad P(x) (en
el caso discreto), o por una funcin de densidad f(x) (en el caso continuo), donde es el nombre
genrico que daremos al parmetro (con una o varias componentes) que identifican el modelo de
probabilidad con el que estamos trabajando. El modelo de probabilidad es conocido, pero nos falta
por conocer el valor del parmetro . Definicin (modelizacin de la muestra).- Una muestra
aleatoria (o muestra aleatoria simple) de tamao n de una caracterstica X de una poblacin
modelizada con una funcin de masa P(x) (en el caso discreto) o con una funcin de densidad f(x)
(en el caso continuo) es un conjunto de observaciones (X1, . . . , Xn) donde: 1. Cada observacin Xi es
representativa de la poblacin de procedencia (los valores ms frecuentes en la poblacin
aparecern con ms frecuencia en la muestra). Esto se formaliza diciendo que el modelo de
probabilidad de cada observacin Xi es el modelo de la caracterstica X que estamos estudiando en
la poblacin.

Las observaciones X1, . . ., Xn son independientes. Intuitivamente, esto significa una de las dos
siguientes cosas: (a) El muestreo se realiza con reemplazamiento. (b) El muestreo se realiza sin
reemplazamiento, pero el tamao muestral es pequeo en comparacin con el tamao de la
poblacin, de modo que, en la prctica, es como si fuera con reemplazamiento. Formalmente, todo
lo anterior se puede resumir de la siguiente forma: Funcin de probabilidad de la muestra (caso
discreto): P(x1, ..., xn) = P(x1)...P(xn) Funcin de densidad de la muestra (caso continuo): f(x1, ...,
xn) = f(x1)...f(xn).
Las tcnicas empleadas en la Inferencia Estadstica se agrupan en tres grandes bloques,
dependiendo de la naturaleza del problema que intentemos resolver y del tipo de solucin que
demos: estimacin puntual, intervalos de confianza y contraste de hiptesis.

Estimacin puntual

Cuando queremos realizar un estudio de una poblacin cualquiera de la que desconocemos sus
parmetros, por ejemplo, su media poblacional o la probabilidad de xito si la poblacin sigue una
distribucin binomial, debemos tomar una muestra aleatoria de dicha poblacin a travs de la cual
calcular una aproximacin a dichos parmetros que desconocemos y queremos estimar. Bien, pues
esa aproximacin se llama estimacin. Adems, junto a esa estimacin, y dado que muy
probablemente no coincida con el valor real del parmetro, acompaaremos el error aproximado
que se comete al realizarla.

Una estimacin puntual del valor de un parmetro poblacional desconocido, es un nmero que se
utiliza para aproximar el verdadero valor de dicho parmetro poblacional. A fin de realizar tal
estimacin, tomaremos una muestra de la poblacin y calcularemos el parmetro muestral asociado
( para la media, s para la desviacin estndar, etc.). El valor de este parmetro muestral ser la
estimacin puntual del parmetro poblacional.

Qu propiedades debe cumplir todo buen estimador?

Insesgado: Un estimador es insesgado cuando la media de su distribucin muestral asociada


coincide con la media de la poblacin. Esto ocurre, por ejemplo, con el estimador , ya que = y
con estimador p ya que = p.

De varianza mnima: La variabilidad de un estimador viene determinada por el cuadrado de su


desviacin estndar. En el caso del estimador , su desviacin estndar es = , tambin

llamada error estndar de .

(1)
En el caso del error estndar de p, =

Observar que cuanto mayor sea el tamao de la muestra n , menor ser la variabilidad del estimador
x y de p, por tanto, mejor sern nuestras estimaciones.

Intervalo de confianza

Dada una poblacin X, que sigue una distribucin cualquiera con media y desviacin estndar .

1. Sabemos por la Teora del Lmite Central que, para valores grandes de n , la media muestral
x sigue una distribucin aproximadamente normal con media x= y desviacin estndar
=

2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin normal,
aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos
desviaciones estndar de la media.
Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad de que la
media de la poblacin est contenida en l es de 0,95. Este tipo de intervalos se llaman
intervalos de confianza de un parmetro poblacional. El nivel de confianza (1 - ) del intervalo
es la probabilidad de que ste contenga al parmetro poblacional. En el ejemplo anterior, el
nivel de confianza era del 95% ( = 0,05).

TAMAO DE MUESTRA EN DISEO DE EXPERIMENTOS


En una prueba estadstica se ha de llevar a cabo una eleccin entre la llamada hiptesis nula (H0) y
la hiptesis alternativa (H1). Para ello se establece un procedimiento basado en una funcin de las
observaciones, por ejemplo, la diferencia de las medias estandarizadas de dos grupos. A esta funcin
se le denomina estadstico de la prueba y se llama regin crtica (RC) al conjunto de valores posibles
de dicho estadstico que nos llevan a rechazar la hiptesis nula. En este proceso se pueden cometer
dos errores posibles:

a) Error de Tipo I: rechazar H0 cuando es realmente cierta.


b) Error de Tipo II: aceptar H0 cuando es realmente falsa.

Sus probabilidades, frecuentemente denominadas riesgos, vienen dadas por: = PH0 (rechazar H0)
(error de Tipo I) = PH1(aceptar H0) (error de Tipo II). Habitualmente se fija el valor del riesgo y se
denomina nivel de significacin, mientras que 1- se conoce como potencia de la prueba (para el
fijado previamente), ambos cambian cuando se modifica la regin crtica.

Ampliando la RC aumentar y decrecer , mientras que incrementando el tamao de muestra n


decrecern ambos y por tanto aumentar la potencia de la prueba. Por tanto, tenemos las siguientes
posibilidades:

a) Si se fijan y se podra calcular el tamao de muestra n necesario.


b) Si se fijan y n se podra determinar la potencia de la prueba, 1-.
c) El valor de n necesario para conseguir una determinada potencia de la prueba podra
exceder las posibilidades de coste, disponibilidad de material o de personal, etc. Por este
motivo solamente si las consecuencias del error de Tipo II son graves, como suele ocurrir en
la investigacin mdica, estara justificada una muestra muy grande.

En este tipo de situaciones se utiliza la siguiente frmula:

( + ) + 2(1 )
= 2 2
N/ grupo: representa el tamao de la muestra en cada grupo; por tanto, 2N es el tamao total de la
muestra.
: corresponde al valor de p dentro de la curva normal de probabilidades; as, por ejemplo, 0.05
corresponde a un valor de Z igual a 1.645 en un solo extremo de la curva, y a 1.960 en los dos
extremos.

: corresponde al valor de p tambin dentro de la curva normal de probabilidades. En este caso, el


valor de 0.10 que corresponde a un valor de 1.282, da un poder a la prueba de 1-, o sea, 0.90.

1: proporcin del grupo de control

2: proporcin del grupo experimental

, corresponde a la diferencia entre 1 y 2

promedio de 1 y 2

Distribucin muestral de S2

Las distribuciones muestrales de estadsticos importantes nos permiten conocer informacin sobre
los parmetros. Si se extrae una muestra aleatoria de tamao n de una poblacin normal con media
y varianza 2 y se calcula la varianza muestral se obtiene el estadstico S2.

Si S2 es la varianza de una muestra aleatoria de tamao n que se toma de una poblacin normal
que tiene varianza 2, entonces el estadstico siguiente, tiene una distribucin chi cuadarda con v=n-
1 grados de libertad.

Los valores de la variable aleatoria chi cuadrada se calculan de cada muestra mediante la frmula:

La probabilidad de que una muestra aleatoria produzca un valor 2 mayor que algn valor especfico
es igual al rea bajo la curva a la derecha de este valor. El valor 2 por arriba del cual se encuentra
un rea de por lo general se representa con 2. Esto se ilustra por la regin sombreada de la figura:

Distribucin t
En muchos escenarios cuando el conocimiento de la desviacin estndar no es ciertamente ms
razonable que el conocimiento de la media de la poblacin, por lo que un estadstico natural para
tratar con las inferencias sobre la media es:


=
/
( 1) 2
=
2
Dado que S es el anlogo de la muestra para .

Sea Z una variable aleatoria normal estndar y V una variable aleatoria chi cuadrada con v grados
de libertad. Si Z y V son independientes, entonces la distribucin del a variable aleatoria T, donde

=
/

Es dada por la funcin de densidad conocida como distribucin t con v grados de libertad

BIBLIOGRAFA

Walpole R., Myers R. Probabilidad y Estadstica para Ingeniera y Ciencias. Editorial Pearson. Mxico
D.F. 2012

ngel J., Mximo S. Estimacin puntual y estimacin por intervalos de confianza. Secretara de
Estado de Educacin y Universidades. http://www.uoc.edu/in3/emath/docs/Estimacion_IC.pdf.
Rev. 13/11/15

De la Horra J. Modelos de probabilidad y muestreo. Departamento de Matemticas UAM. Mxico,


D.F. https://www.uam.es/personal_pdi/ciencias/horra/Estadistica-Apuntes/Probabilidad-
Muestreo.pdf . Rev. 13/11/15

Lpez Fidalgo J. Caso 2. Diseo de experimentos: tamao de muestra y potencia de una prueba,
asignaciones aleatorias. UCLM. http://simfit.usal.es/casos/curso2009/caso2.pdf. Rev. 13/11/15

Sales Carmona V. Clculo del tamao de muestra. Cap. 18.


http://www.facmed.unam.mx/deptos/salud/censenanza/spiii/spiii/para%20remplazar/sales2.pdf .
Rev. 13/11/15

Badii, M.H., J. Castillo & A. Guillen. Tamao ptimo de la muestra (Optimum sample size).
InnOvaciOnes de NegOciOs 5(1): 53 - 65, 2008 2008 UANL, Impreso en Mxico (ISSN 1665-9627)
http://www.web.facpya.uanl.mx/rev_in/Revistas/5.1/A5.pdf Rev. 13/11/15
http://www.uoc.edu/in3/emath/docs/Estimacion_IC.pdf

Ms info

http://catarina.udlap.mx/u_dl_a/tales/documentos/lii/moreno_g_j/apendiceI.pdf

http://www.oceandocs.org/bitstream/handle/1834/1509/Determinaci%C3%B3n%20tama%C3%
B1o%20muestra%20indicadores%20biologicos.pdf?sequence=1

http://www.med.unne.edu.ar/biblioteca/calculos/calculadora.htm

http://es.slideshare.net/guest8a3c19/tamao-de-la-muestra-4142151

http://www.eco.uva.es/estadmed/inferen/muestras/muestras2.htm

http://humanidades.cchs.csic.es/cchs/web_UAE/muestreo/muestreo.html

http://pendientedemigracion.ucm.es/info/genetica/Estadistica/estadistica_basica%201.htmhtt
p://pendientedemigracion.ucm.es/info/genetica/Estadistica/estadistica_basica%201.htm

https://www.uam.es/personal_pdi/ciencias/horra/Estadistica-Apuntes/Probabilidad-
Muestreo.pdf

http://www.cimat.mx/Eventos/vpec10/img/PresentacionElias.pdf

http://ocw.usal.es/ciencias-sociales-1/estadistica-
ii/contenidos/OCW%20EstadisticaII/Tema%207.pdf

http://www.fing.edu.uy/inco/cursos/simulacion/archivos/clases/clase05web.pdf

http://web.udl.es/usuaris/MatFDiE/OptiSim/MonteCarlo.pdf

https://books.google.com.mx/books?id=StjFM7-
jGfgC&pg=PA139&dq=tama%C3%B1o+de+muestra+para+variables+aleatorias&hl=es-
419&sa=X&ved=0CCcQ6AEwAmoVChMIoazF6ZGMyQIVSGImCh33kQNa#v=onepage&q=tama%C
3%B1o%20de%20muestra%20para%20variables%20aleatorias&f=false

http://www.netquest.com/blog/es/que-tamano-de-muestra-necesito/