Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISTRIBUCIÓN BINOMIAL
VARIABLE ALEATORIA DISCRETA
Por variable numérica, se entiende una variable que produce respuestas numéricas ante una medición o un conteo. Así,
podemos citar como ejemplos: identificar cuántos varones existen en un determinado curso de la universidad (conteo) o bien la
frecuencia de arribo de los colectivos interurbanos a determinado lugar (medición).
Podemos clasificar a las variables numéricas en discretas y continuas. Cuando se desea recabar datos de un evento y este
proceso implica una medición, estamos tratando con una variable numérica continua.
En cambio, si al recabar los datos, el proceso surge de un conteo entonces la variable es una variable numérica discreta.
VALOR ESPERADO DE UNA VARIABLE ALEATORIA. ESPERANZA MATEMÁTICA
Si consideramos que los parámetros de la distribución son n y p y la media de la distribución
μ = n.p,
Donde
• n = es el número de ensayos;
• p = probabilidad de aciertos;
Entonces definiremos la esperanza matemática o valor esperado de una variable aleatoria como la media de la distribución:
E(x) = n.p.
Es una media aritmética ponderada de los resultados esperados.
Para encontrar el valor esperado de una variable aleatoria discreta, realizamos el producto entre cada valor que la variable
puede tomar y la probabilidad de ocurrencia de ese valor y, posteriormente, sumamos dichos productos. El valor esperado le da
un valor a cada resultado posible según la frecuencia con que se manifiesta. Por lo tanto, los más frecuentes tienen asignado un
peso mayor.
DISTRIBUCIONES DE VARIABLE ALEATORIA DISCRETA
Para realizar un estudio de distribución de variable aleatoria, debemos considerar todos los casos posibles en los que se puede
presentar el evento; son mutuamente excluyentes y exhaustivos.
Tendremos que tener en cuenta también que, en muchos casos, el evento aleatorio puede tomar valores no numéricos.
En este caso, la distribución de probabilidad es una lista mutuamente excluyente de todos los resultados numéricos posibles; de
tal manera que cada probabilidad de ocurrencia se asocia con un resultado.
Hemos visto, en el punto anterior, la expresión de la media, μ:
𝑵
𝝁 = 𝑬(𝒙) = ∑ 𝑿𝒊 . 𝑷(𝒙𝒊) .
𝒊=𝟏
𝑋i =𝑖 −ésimo resultado de la variable aleatoria discreta 𝑋;
𝑃(xi) =probabilidad de ocurrencia del 𝑖−ésimo resultado de 𝑋.
Varianza de una variable aleatoria discreta
Se calcula como la sumatoria de los productos entre el cuadrado de la diferencia entre cada valor que adopta la variable y la
media de la distribución, y la probabilidad de que la variable adquiera ese valor.
𝑵
DISTRIBUCIÓN BINOMIAL
Parámetros
Condiciones que debe cumplir una distribución para responder al modelo binomial
Debe estar formada la distribución por n ensayos idénticos.
1) Cada resultado del ensayo puede lograr solo dos resultados, si a uno lo denominamos acierto o éxito, el otro se
denominará desacierto o fracaso.
2) Si a la probabilidad del éxito la llamamos P(acierto) = p, la probabilidad del fracaso P(desacierto) = q; por lo tanto, q = 1- p.
3) Los eventos son independientes entre sí. Esto indica que el resultado obtenido por cada ensayo es independiente del
resultado de ensayos anteriores.
4) La probabilidad del acierto se considera constante; esto significa que la población es muy grande o infinita, o que los
ensayos se realizan sin reposición.
Expresión general
En este tipo de distribución, las probabilidades del número posible de aciertos en n ensayos quedan determinadas por el
desarrollo de la potencia del binomio (q + p)n, donde el exponente n es el número de ensayos. El desarrollo de dicha potencia se
expresa como sigue: (𝒒 + 𝒑)𝒏 = 𝒂𝟎 . 𝒒𝒏 . 𝒑𝟎 + 𝒂𝟏 . 𝒒𝒏−𝟏 𝒑𝟏 + ⋯ + 𝒂𝒏 . 𝒒𝟎 . 𝒑𝒏 .
Downloaded by Magdalena Echavarria (maguiechavarria1999@gmail.com)
lOMoARcPSD|30535037
En los casos en que se cumplen estas condiciones, podemos sustituir la media de la distribución binomial (n.p) por la media de la
distribución de Poisson (λ).
(𝒏. 𝒑)𝒙 . 𝒆−𝒏.𝒑
𝑷(𝒙) = .
𝒙!
DISTRIBUCIÓN HIPERGEOMÉTRICA
Es la distribución correcta para calcular el riesgo del consumidor; a menudo, se aproxima a la distribución binomial. Si contamos
una población finita de tamaño N y, de estos N elementos de la población, solamente k de ellos cumplen con una característica
particular, deducimos que N - k es la cantidad de elementos de la población que no cumplen con esa condición.
Si de la población se extrae una muestra de n elementos de manera tal que se cumpla que: 𝒏/𝑵 >= 𝟎, 𝟎𝟓, entonces la
probabilidad de que, en la muestra de n elementos, se tengan x de los k está dada por la expresión:
(𝑵−𝒌)
𝑪(𝒏−𝒙) . 𝑪𝒌𝒙
𝑷(𝒙) = .
𝑪𝑵𝒏
Parámetros
Nos preguntamos: ¿por qué, si el evento presenta características similares a las de una distribución binomial, no se resuelve
mediante ese modelo, o bien buscamos esta alternativa? La respuesta es que existen motivos que hacen que se prefiera utilizar
este tipo de distribución por sobre la binomial.
• Que la población es finita, y el tamaño de la muestra es grande, significativo respecto del tamaño poblacional y, por lo tanto,
modifica la probabilidad de elegir;
• El muestreo se realiza sin reposición y, al ser significativa, el tamaño de la muestra con respecto al tamaño de la población
modifica la probabilidad de acierto.
Si recordamos, en la distribución binomial, la probabilidad de lo que consideramos acierto se mantiene constante, y esto se logra
únicamente si el muestreo se realiza con reposición o la población es infinita o muy grande.
Expresión general
Esta expresión se basa en la teoría combinatoria, donde:
N = tamaño de la población;
n = tamaño de la muestra;
k = número de éxitos en la población;
x = número de éxitos en la muestra;
(𝑵−𝒌)
𝑪(𝒏−𝒙) . 𝑪𝒌𝒙
𝑷(𝒙) = .
𝑪𝑵
𝒏
Para encontrar la expresión que dé la media de la distribución hipergeométrica, debemos recordar nuevamente que la media
corresponde con el valor esperado o esperanza matemática. Además, si el muestreo es representativo de la población, la media
de la muestra tenderá a ser igual que la media poblacional:
𝒌 𝑬(𝒙)
𝝁 = = .
𝑵. 𝟏𝟎𝟎 𝒏. 𝟏𝟎𝟎
Por lo tanto, despejando E(x), tendremos:
𝒏
𝑬(𝒙) = .
𝑵. 𝒌
DISTRIBUCIÓN DE VARIABLE CONTINUA
Como habíamos visto, las variables podían ser continuas o discretas; de esta manera, podemos entonces clasificar los modelos
de acuerdo con el tipo de variable.
• Variable discreta:
➢ binomial;
➢ de Poisson;
➢ hipergeométrica.
• Variable continua:
➢ normal;
➢ T (de Student);
➢ chi cuadrado.
En este concepto, se trata solamente la distribución continua normal.
DISTRIBUCIÓN NORMAL
Definiremos ahora, una distribución que analice las probabilidades de que la variable aleatoria adopte un valor dentro de un
intervalo. La distribución de variable continua, que responde en forma más general a más cantidad de casos y situaciones en las
que la variable se mide en un intervalo, es la distribución normal, también llamada distribución de Gauss.
La distribución normal es reconocida en Estadística por varias razones.
En el ámbito empresarial, existen muchas variables de medición, cuyas distribuciones se asimilan a la distribución normal.
• La distribución normal puede asimilarse a distribuciones de variables discretas como la distribución binomial y la
distribución de Poisson; lo que simplifica el trabajo.
• La distribución normal es una herramienta muy importante para la estadística inferencial a través del teorema de límite
central.
Downloaded by Magdalena Echavarria (maguiechavarria1999@gmail.com)
lOMoARcPSD|30535037
6) Se considera que la superficie encerrada por la función y el eje horizontal son iguales a 1. Esto significa que la integral de
la función F(x) entre los límites - ∞ 𝑦 + ∞ = 1 es ∫F(x).dx = 1.
7) La probabilidad de que la variable aleatoria tome un valor en un intervalo (a; b) está dada por la superficie encerrada por
la función y el eje horizontal en ese intervalo: P(a ≤ x ≤ b) = ∫F(x).dx
AREA BAJO UNA CURVA NORMAL
8) La probabilidad que la variable tome un valor puntual es igual a cero: P(x = a) = 0. Si el intervalo (a, b) disminuye, porque
el extremo b se acerca a a, la probabilidad disminuye. Y, en el límite, cuando b coincide con a, la probabilidad toma el
valor cero; ya que no se tiene superficie por no existir un intervalo.
9) Otra de las características de la curva normal es que el área debajo de la curva, entre el valor de la media aritmética y un
punto cualquiera sobre las abscisas está en función del número de desviaciones estándar.
DISTRIBUCIÓN NORMAL-CARACTERÍSTICAS
Significa que esa superficie es proporcional al número de desviaciones estándar de la distancia entre la media y X, siendo X un
punto genérico. En fórmulas, lo podemos expresar así: 𝒛. 𝝈 = 𝒙 – 𝝁, donde Z es el coeficiente de proporcionalidad que indica la
cantidad de desviaciones estándar correspondientes con la diferencia de abscisas entre X y la media. El valor de Z puede adoptar
valores entre cero y un poco más de 3; ya que, si recordamos la regla empírica que indicando que el 99,7 % de las observaciones
de una distribución normal ocurren en el intervalo comprendido entre la media menos 3σ y la media más 3σ. Con estas
características, se construye una distribución con los valores de z, y dicha distribución se llamará “distribución normal estándar”,
cuya media es: 𝝁(𝒛) = 𝟎, y su desviación estándar: 𝝈(𝒛) = 𝟏
Se construyeron tablas para distribución normal estándar (DNE), donde, para cada valor de Z, se obtuvo un porcentaje del área
total, y estas tablas se encuentran en los apéndices de la bibliografía. En esta tabla, verificamos que el área encerrada por la DNE,
para z = 1, es igual a 0,3413; para z = 2, a 0,4772; y para z = 3, a 0,4987, de acuerdo con lo expresado por la ley empírica. Como
ejercicio, prueba corroborar la ley empírica con estos resultados.
Resolución de una distribución binomial por aproximación con la normal
Downloaded by Magdalena Echavarria (maguiechavarria1999@gmail.com)
lOMoARcPSD|30535037
Cuando una distribución binomial presenta un número de ensayos elevados, n grande, y la probabilidad del éxito es próxima a
0,5, dicha distribución puede ser resuelta por aproximación con la distribución normal. Para lo cual, haremos algunas
consideraciones para tener en cuenta.
• Las medias de las distribuciones normal y binomial son iguales: 𝝁(𝒙) = 𝒏. 𝒑.
• Los desvíos estándar de las distribuciones normal y binomial son iguales: 𝜎(𝑥) = √𝑛. 𝑝. 𝑞.
• No olvides que la distribución normal responde a una variable del tipo continua (por medición); la binomial, en cambio, a una
variable del tipo discreta (por conteo).
Resolución de una Distribución de Poisson por aproximación con la normal
𝝀𝑿 × 𝒆−𝒏𝒑
𝑷(𝒙) =
𝒙!
Esta expresión corresponde a una Distribución de Poisson para el cálculo de probabilidades en variables aleatorias discretas.
Si bien sirve para el cálculo en forma manual, es muy engorroso utilizarla por lo que podemos utilizar las tablas para calcular las
probabilidades de Poisson.
Para poder asimilar este tipo de distribución a una distribución normal, siempre con las precauciones del caso, deberíamos
realizar los reemplazos que vemos a continuación.
(𝒏𝒑)𝑿 × 𝒆−𝒏𝒑
𝑷(𝒙) =
𝒙!
Podemos utilizar la Distribución de Poisson como una aproximación de la Distribución Binomial, sustituyendo a por n.p,
condicionado solamente a que n ≥ 20 y p ≤ 0,05
𝒙−𝝁
𝒛=
𝝈
Esta expresión permite que, calculando Z; se pueda utilizar una tabla de distribución normal estandar para calcular la
probabilidad que esté dentro de una distancia Z de la media artimética
TIPOS DE MUESTRAS
MUESTREO. CLASIFICACIÓN
Muestras
Algunas de las razones para extraer una muestra son:
• Requiere de menos tiempo que un censo.
• Es menos costosa que un censo, tanto para extraerla como para procesarla.
• Es menos molesta y más práctica de gestionar que un censo.
Para evitar tener que realizar un censo completo de la población, los procedimientos de muestreo estadístico se concentran en
seleccionar un pequeño grupo representativo de Ia población para que luego los resultados de la muestra se utilicen para
estimar las características de la población.
Se recordarán algunas definiciones:
• Población: son todos los elementos o personas que se quieren estudiar.
• Parámetro: es una característica de la población.
• Enumeración completa o censo: cada persona o elemento de la población que se desea describir.
• Muestra: una porción escogida de la población.
• Estadística: es una característica de una muestra.
Las dos maneras de clasificar los muestreos son:
• El muestreo no aleatorio o de juicio: Es cuando se utiliza la experiencia individual de una persona respecto al tema en
cuestión y sus apreciaciones particulares para reconocer a los componentes de la población que deben incorporarse en la
muestra.
• El muestreo aleatorio o de probabilidad: Es cuando cada uno de los integrantes de la población tiene idéntica
posibilidad de ser elegidos para la muestra.
Cuando todas las muestras que se pueden extraer de una población tienen la misma posibilidad de ser elegidas se llama
muestreo aleatorio simple. Teniendo cada muestra el mismo tamaño, cualesquiera de ellas tiene la misma probabilidad de ser
seleccionada.
Pueden elegirse las muestras con sustitución o sin sustitución.
Si fuera con sustitución el muestreo, esto significaria que cada componente seleccionado, luego de ser considerado se reintegra
a la población, donde puede ser elegido nuevamente.
En cambio, si el muestreo es sin sustitución, indica que si un componente es extraído, no será posible su eleccion nuevamente.
Aún cuando la elección de la muestra, sea con o sin sustitución, existen procedimientos de elección de las muestras faciles de
aplicar y con fundamentos prácticos y lógicos comprobados. Ejemplo de ellos son las tablas de números aleatorios.
Muestreo globalizado
Este tipo de procedimientos de muestreo se utiliza cuando hay grupos con gran homogeneidad dentro de una población
determinada. Cuando algún administrador debe encargar un estudio de mercado para insertar algún producto en el mismo,
tiende a recurrir a este tipo de muestreo.
Para la aplicación de este método, se debería dividir la población en clústers o agrupamientos lo más heterogéneos posibles
internamente y similares entre si, y se toma de cada grupo una muestra aleatoria simple. La precisión de este muestreo reside en
el diseño del mismo, ya que los resultados pueden ser mas precisos y más economicos que otro tipo de método.
Muestreo estratificado
La población, en este método, es dividida según componentes comunes, en estratos o grupos lo más homogéneos posibles. A
partir de esto, se extrae una muestra aleatoria simple de cada grupo y se realizan los cálculos con los resultados de cada grupo,
combinandolos y aplicandolos a la población total.
Al asegurarnos que los componentes de cada estrato de la población están representados, nos garantizamos una eficiencia
superior que el aleatorio simple y el sistemático, ya que gracias a la homogeneidad de los componentes de cada grupo
estimamos los parámetros de la población total con más precision. Es un método apropiado cuando naturalmente la población
en estudio se encuentra subdividida en estratos de diferentes tamaños y necesariamente se debe considerar esa contingencia.
Muestreo sistemático
Sus cualidades son similares a las vistas en el muestreo aleatorio simple. Se listan los elementos de la población. Posteriormente,
se obtiene el cociente entre el número de componentes de la población y el número de componentes de la muestra, cociente
que me indicará la cantidad de intervalos en que dividiremos a nuestra población.
Luego, se selecciona para el muestreo, cada componente de la lista a partir de un valor inicial que debe encontrarse dentro de
cada intervalo en la misma posición dentro del mismo. Como ejemplo podemos citar que si se tiene una población de 100
elementos y se quiere considerar una muestra de 10 elementos, se enumeran todos estos elementos, se dividen 10 intervalos y
se considera, a modo de ejemplo, el cuarto número de cada intervalo: el 4, 14, 24 y así en cada uno de esos intervalos.
Como se vió, es diferente del muestreo aleatorio simple, ya que en este cada componente debería tener la misma posibilidad de
ser elegido, en cambio en este método no es así. Ya que en este caso no se cumple, existe la dificultad al incluir un error en el
proceso de muestreo. Según lo que acabamos de ver, la posibilidad de que esa muestra no sea representativa es alta. Sin
embargo, también tiene algunas ventajas. Este tipo de muestreo soporta ciertos reparos cuando los componentes de los
intervalos entran en un patrón secuencial, aunque como ventajas podemos citar que puede requerir de menos tiempo y un costo
menor que el muestreo aleatorio simple.
Distribución de muestreo
En los anteriores apartados, se han analizado las diferentes formas de determinar las muestras de una población con el objetivo
de obtener los estadísticos para poder inferir sobre los parámetros de la población.
Los estadísticos calculados en cada muestra serán distintos entre sí y tampoco se puede esperar que sean iguales a los
parámetros poblacionales.
El trabajo de uno es inferir el desvío estándar de la población, según el desvío estándar de una muestra S y correlativamente la
media poblacional μ, según el valor de la media muestral 𝑥̅. Con el mismo razonamiento, se podría determinar la proporción p en
la población que se contará de la proporción p de la muestra. El desafío es inferir sobre los parámetros, reduciendo al mínimo lo
expresado sobre las diferencias entre esos parámetros y los estadísticos homólogos.
Supón que el parámetro que se va a inferir sea la media. Si de una población se toma un número determinado N de muestras y
se supone que es la media del parámetro de la población que se va a estimar, se espera que las medias de las distintas muestras
sean diferentes entre sí y distintas también a la media de la población. Estas diferencias surgen como lógicas si se tiene en cuenta
lo aleatorio del muestreo. Es esta la razón por la cual, para poder hacer alguna inferencia sobre la media de la población,
teniendo en cuenta los valores estadísticos, será necesario tener en cuenta la forma en que varían estos en el muestreo.
Esta variabilidad producida en los estadísticos de las distintas muestras están relacionadas con:
• Características de la población: si la población presenta una gran heterogeneidad, mayor será la amplitud de la
distribución de muestreo.
• Tamaño de la muestra: si se aumenta el tamaño de la muestra, habrá una menor dispersión en los valores y la inferencia
en los parámetros tendrá una mayor exactitud.
• Tipo de parámetro en estudio: según el parámetro que se va a estimar, tendrá características particulares la distribución
de muestreo que se va a analizar.
TEOREMA CENTRAL DEL LÍMITE
Downloaded by Magdalena Echavarria (maguiechavarria1999@gmail.com)
lOMoARcPSD|30535037
Habiendo realizado muchas distribuciones con diferentes formas, distintas de la distribución normal, y se demostró que se
deberían considerar con el Teorema del Límite Central, que nos permite inferir sobre la media poblacional, a partir de la
distribución de la media muestral, de manera independiente de la forma de su distribución.
Cuando el tamaño de la muestra es sustancialmente grande (>30), El teorema Central del Límite nos indica que la distribución
muestral de la media, tiene una forma aproximadamente normal, cada vez más normal cuanto mayor es el número de muestras
e independiente de la forma de la distribución de su población.
DISTRIBUCIÓN MUESTRAL DE IA MEDIA DE DISTINTAS POBLACIONES PARA MUESTRAS DE N = 2, 5 Y 30.
En esa caracteristica reside su importancia, es decir que permite inferir sobre parámetros poblacionales a través del análisis de
las estadísticas de las muestras con independencia de la forma de la distribución de frecuencia de la población.
Concepto de error muestral estándar
Al igual que la distribución de las proporciones muestrales, tienen un comportamiento similar a la distribución de las medias
muestrales. Para la estimación de la proporción poblacional, se seguirá un procedimiento similar al utilizado para la estimación
de la media. Extraída la muestra y calculada de la misma la proporción (p), se necesita definir el valor del error muestral estándar
de las proporciones.
FÓRMULA DE ERROR MUESTRAL ESTANDAR
𝒑. 𝒒
𝝈𝒑 = √
𝒏
Si no se contase con la proporción poblacional, se debe considerar la situación más desfavorable, es decir: p = 0,5
Es de práctica generalizada utilizar los valores de la proporción de la muestra en reemplazo de la proporción poblacional; en ese
caso:
ERROR MUESTRAL ESTANDAR EN FUNCIÓN DE P
𝒑. (𝟏 − 𝒑)
𝝈𝒑 = √
𝒏
Si se presentan poblaciones finitas y el tamaño de la muestra es tal que n/N ≥ 0,05, se hace necesario aplicar el factor de
corrección de poblaciones finitas para la determinación de p:
FACTOR DE CORRECCIÓN DE POBLACIONES FINITAS
(𝑵 − 𝒏)
𝒇𝒄 = √
(𝑵 − 𝟏)
Se tendría:
ERROR MUESTRAL ESTANDAR CORREGIDO PARA POBLACIONES FINITAS
𝒑. 𝒒 (𝑵 − 𝒏)
𝝈𝒑 = √ .√
𝒏 (𝑵 − 𝟏)
ESTIMACIÓN Y ERROR MUESTRAL
Downloaded by Magdalena Echavarria (maguiechavarria1999@gmail.com)
lOMoARcPSD|30535037
Estimación. Concepto
Es el proceso de utilizar un estadístico para inferir sobre el valor del parámetro poblacional desconocido. El objetivo final de la
estadística es el de inferir acerca de una población a partir de la información adquirida de una muestra, y justamente está basada
en la estimación. Suele ser la media el parámetro más estimado además de ser el de mayor exactitud.
Tipos de estimación:
• De punto: cuando al parámetro se le asigna un único valor.
• De intervalo: cuando al parámetro se le asigna un valor dentro de un intervalo.
Error muestral
Si se estima la media poblacional a través de la media de una muestra, se comete un error, el cual es igual a: E = x –m
El cual, expresado como una proporción del desvío estándar de esa distribución que se denomina como error muestral estándar,
es:
𝑬 = 𝒛. 𝝈(𝑿) = 𝑿 − 𝝁
Si se tiene en cuenta que:
𝝈
𝝈(𝑿̅) =
√𝒏
La expresión del error de estimación será:
𝝈
𝑬 = 𝒛.
√𝒏
El error de estimación es un valor que se puede estimar a priori como el máximo error permitido entre el valor de la media de
una muestra y el valor de la media poblacional, siendo este error función de z del desvío estándar poblacional y de n, tamaño de
la muestra:
z: que definirá el grado de bondad o nivel de confianza.
σ: desvío estándar poblacional.
n: tamaño de la muestra.
Estimación puntual
Es un número determinado a través de una fórmula que se utiliza para estimar un parámetro de población desconocido. El
ejemplo más simple lo constituye la media, ya que está dada por la expresión matemática:
∑(𝒙(𝒊) . 𝒇(𝒊) )
𝑿 =
𝒏
Una estimación puntual es mucho más útil si viene acompañada por una estimación del error que podría estar implicado.
La media de la muestra 𝑋̅ es el mejor estimador de la media de la población 𝜇. Es el estimador más eficiente, siempre y cuando la
muestra sea lo suficientemente grande. Así, su distribución muestral puede ser aproximada por medio de la distribución normal.
Estimación por intervalos
Describe un rango de valores dentro del cual es posible que esté un parámetro de la población. Sin embargo, se necesita, debido
a la variabilidad de muestreo, tener en cuenta que los estadísticos no coincidirán con los parámetros poblacionales, por lo cual es
conveniente acompañar al estimador puntual con una estimación de intervalo.
Estimaciones por intervalos de la media
Supón tener una población con media μ y desvío estándar s. De acuerdo con el teorema central del límite, si de ella se extraen
todas las muestras posibles del mismo tamaño,cada una de las muestras tendrá su media X y una desviación estándar muestral S.
Se sabe que con las medias de todas las muestras se genera la distribución muestral de medias, la que es normal, y su media x m
es igual a la media poblacional. Si se toma una muestra cualquiera, su media estará ubicada bajo la curva a una distancia máxima
E de la media poblacional, ya que, si se estima la media poblacional a través de la media de esa muestra, se comete un error, el
cual está dado por E.
GRÁFICO DE ERROR DE LA MEDIA POBLACIONAL RESPECTO DE LA MEDIA MUESTRAL
Si se considera una de las muestras, su media tendrá un valor x y se ubicará sobre el eje de las abscisas a una distancia E de la
media poblacional m. Por lo tanto, si se estima la media poblacional a través de la media de esa muestra, se comete un error, el
cual es igual a:
𝑬 = 𝒙 –𝒎
El cual,si es expresado como una proporción del desvío estándar de esa distribución, se denomina como error muestral estándar.
DETERMINACIÓN DEL TAMAÑO DE UNA MUESTRA
Downloaded by Magdalena Echavarria (maguiechavarria1999@gmail.com)
lOMoARcPSD|30535037
El problema es determinar cuál es el tamaño de la muestra necesaria para que el estadístico tenga la mayor exactitud y, por lo
tanto, el error cometido sea el menor posible o el que sea aceptable.
Determinación del tamaño de una muestra para estimar la media poblacional
Si se analiza la distribución muestral para una muestra de tamaño n y se ubica a la media de la muestra en el eje horizontal y a
una distancia E al que se ha denominado error en el que se ha incurrido cuando se ha estimado la media poblacional (coincidente
con la media de la distribución muestral) con la media de esa muestra.
Ese error responde a la expresión:
𝑬 = 𝒁. 𝝈(𝑿)
Si se tiene en cuenta que:
𝝈
𝝈(𝑿) =
√𝒏
Reemplazando en la primera expresión, se tiene:
𝝈
𝑬 = 𝒁.
√𝒏
Despejando el valor de n, se tiene:
𝒁. 𝝈 𝟐
𝒏 = ( )
𝑬
Teniendo en cuenta entonces que:
• E: es el máximo error que se propuso cometer. Se llama error permitido.
• s: desviación estándar poblacional (cuando no se conoce, se tienen dos opciones).
• Z: define el grado de seguridad con el que se efectúa la inferencia.
• n: tamaño de la muestra.
Determinación del tamaño de una muestra para proporciones
La determinación del tamaño de muestra para la determinación del porcentaje poblacional se realiza de la misma manera que en
la determinación de tamaño de muestra para la media; teniendo en cuenta que es este caso:
𝒑. 𝒒
𝝈(𝒑) = √
𝒏
Y:
𝑬 = 𝒁. 𝝈(𝒑)
Reemplazando y despejando n, se tiene:
𝒁
𝒏 = ( )𝟐 . 𝒑. 𝒒
𝑬
El error tendrá que estar en relación con p. Si p es la proporción poblacional, se la tiene expresada en porcentaje. Del mismo
modo, se tendrá a E.
Comúnmente, el porcentaje poblacional no se conoce, por lo que se puede tomar una de dos opciones:
1) Método subjetivo. Se adopta un valor de p de acuerdo con experiencias anteriores.
2) Si se determina que p toma el valor de 0,5, entonces q= (1-p) = 0,5. En este caso, el producto de p. q toma su máximo
valor.
TAMAÑO DE LA MUESTRA
DETERMINACIÓN DEL TAMAÑO DE UNA MUESTRA PARA ESTIMAR LA MEDIA POBLACIONAL
Para que se pueda inferir con la exactitud deseada un parámetro poblacional, se debe tratar con cuidado el tamaño de la
muestra que se va a extraer y de ello dependerá el error que se cometerá.
Para estimar la media poblacional
Cuando se estudió la distribución normal o gaussiana, se refería el cálculo a una curva estándar en que cada punto sobre el eje
de las abscisas respecto de la media es una proporción de los desvíos estándar. Siguiendo esta línea de acción, al considerar una
muestra cuyo tamaño genéricamente se llamaba n y su media al situarla en las abscisas difiere de la media poblacional en una
distancia que se denominará E (recuerda que la media poblacional debe ser coincidente con la media muestral), que se calcula
con la siguiente fórmula:
𝑬 = 𝒛. 𝝈𝒙
Y considerando que:
𝝈
𝝈𝒙 =
√𝒏
Sustituyendo en la anterior expresión, se obtendrá el error cometido en función del tamaño n de la muestra:
𝝈
𝑬 = 𝒛.
√𝒏
De la expresión que, si se despeja el tamaño de la muestra:
𝒛. 𝝈 𝟐
𝒏 =( )
𝐄
Donde:
• E: es el error máximo permitido que se pretende obtener.
• σ: es el desvío estándar poblacional.
Downloaded by Magdalena Echavarria (maguiechavarria1999@gmail.com)
lOMoARcPSD|30535037