Está en la página 1de 15

Media muestral = estadigrafo

parametro la media aritmetica Para tomar una muestra


Parametro porcentaje necesitamos determinar
el tamaño de muestra.
Estadística Inferencial
Despues surge como lo selecciono
Veamos el siguiente ejemplo.

Sea la variable X, Gasto diario en pasaje de un estudiante sanmarquino.

El total de estudiantes sanmarquinos matriculados el 2019 – 2 fue de N = 28368. Supongamos, que se


llevó a cabo un censo para conocer el gasto medio diario en pasajes, así como la variabilidad del gasto
diario.

Para obtener la información buscada, se obtuvo los datos de la variable gasto diario en pasajes, que
fueron 28368, a partir de estos se construyó el histograma o polígono de frecuencias, el cual nos
permitió conocer la forma de la distribución de los datos del gasto diario en pasajes, asimismo, el gasto
medio diario en pasaje y la variabilidad de los datos del gasto diario en pasaje.

Supongamos que la siguiente gráfica muestra la forma de la distribución de los datos del gasto diario
en pasajes.
su distribucion es una normal
Homogeneo = muestreo aleatorio
90

80 Muestreo estratificado = Ejemplo: Por año de ingreso


70

60
Frequency

50

40

30

20
si es casi simetrica se aproxima a una distribucion normal
10

0 5 10 15
docima de hipotesis : se puede rechaza o aceptar
C1

Y que el gasto diario medio es  X = 8 soles y la variabilidad del gasto diario,  X = 1.5 soles

Con la forma de la distribución de los datos y los valores de  X y  X se tiene toda la información
necesaria correspondiente a la variable X, gasto diario

Generalmente no se cuenta con el total de datos poblacionales de una cierta variable de interés, ya
sea porque la población de unidades de observación es muy grande o por el costo o por el tiempo o
porque la observación produce la destrucción del elemento a observarse, por lo que no es posible
conocer la forma de la distribución de los datos, ni el valor de  X y  X , para tener información
aproximada respecto a la forma de la distribución de todos los datos poblacionales y el valor que puede
tomar tanto  X y  X , necesitamos contar con la información de una muestra.

La información que se obtenga a partir de la muestra está en situación de incertidumbre, por lo que,
tendrá que usarse los métodos inferenciales para que dicha información sea generalizada para toda la
población.

Estos métodos inferenciales son:

➢ Respecto a la forma de la distribución de todos los datos poblacionales, tendrá que hacerse
una suposición o hipótesis, y para aceptar o rechazar la hipótesis, se usará la “Dócima de
hipótesis”
➢ Respecto al valor de los parámetros: Media poblacional  X y varianza poblacional 𝜎𝑋2 , se hará:
- La Estimación de parámetros

MARIA ANTONIETA ZACARÍAS DÍAZ 1


- Una suposición o hipótesis respecto al valor de cada parámetro, y para aceptar o rechazar la
suposición se aplicará una “Prueba de hipótesis”

ESTIMACIÓN DE UN PARAMETRO

Para estimar un parámetro se debe contar con un ESTIMADOR, previo a definir este concepto, se
definirá los conceptos básicos necesarios.

CONCEPTOS BÁSICOS

MUESTRA ALEATORIA
Antes de dar la definición de muestra aleatoria, consideraremos lo siguiente:

❖ X: Variable de interés, llamada variable poblacional.


❖ Población: Conjunto de individuos, pueden ser personas, objetos o animales, delimitados en el
tiempo y en el espacio, en cada uno de los cuales se mide u observa la variable de interés, X.
❖ N: Número de elementos de la población o tamaño de la población.
❖ Marco muestral: Relación de las UO
❖ Muestra: Parte de la población, que se selecciona usando un plan establecido.

Previo a la selección de los elementos integrantes de la muestra se debe:

➢ Determinar el número de individuos que se va a seleccionar, es decir n. Este número n se


determina a través de un método estadístico.
➢ Determinar la forma en que se va a seleccionar a cada uno de los elementos que serán
integrantes de la muestra, es decir se requiere de un plan de muestreo o método de selección
de muestra.

❖ Plan de muestreo o método de selección de muestra.

Existen métodos probabilísticos y no probabilísticos.

t est

est e e t i si p e est e t i

est e e t i siste est siste


est e e t i est est est

est e e t i p e est p e s

MARIA ANTONIETA ZACARÍAS DÍAZ 2


El tipo de muestra que se va a tomar depende de la estructura de la población

S SS S S

En el interior del grupo hay


4 homogeneidad
8
S
S
st t s
6
S S
En los grupos
3 grupos de 5 interiores no son
Poblacion homogenea
homogeneos

e e
e

MUESTREO ALEATORIO SIMPLE

Forma de seleccionar a los elementos integrantes de la Muestra.

Bajo el supuesto que ya se determinó el tamaño de muestra y que se utilizara el muestreo aleatorio
simple.

Se “ ” e t ñ e est

Forma 1.

1. Se enumeran a los individuos integrantes de la población, 1,2,... , N.

2. Se elaboran fichas del mismo tamaño y del mismo material y en estas se registran los números del
1 al N, y se depositan en una urna.

3. Se seleccionan n fichas, la selección puede ser:

a. Con reposición.

Se selecciona una ficha, se devuelve esta ficha a la urna de donde se está seleccionando y así
sucesivamente hasta obtener las n fichas.

Cada ficha representa a un individuo, esta forma de selección, hace que cada individuo tenga la
misma probabilidad de selección, es decir 1/N. A la muestra de individuos así obtenida se le
llama, Muestra Aleatoria.

Como, en cada elemento(UO) seleccionado para ser integrante de la muestra, se va observar o


medir la variable X, entonces, cada individuo puede ser representado por la variable:

X1: representa al individuo 1.

X2: representa al individuo 2.

MARIA ANTONIETA ZACARÍAS DÍAZ 3


. .

. .

. .

Xn: representa al individuo n

Entonces al conjunto de variables (X1, X2, … , Xn) se le llama muestra aleatoria de la variable X.

b. Sin reposición.
Cada ficha se selecciona una después de otra, hasta obtener n fichas, pero con esta forma de
selección cada individuo no tiene la misma probabilidad de ser seleccionado, por lo tanto la
muestra de n individuos así seleccionada, no constituye una muestra aleatoria, pero, si N es
muy grande en relación a n, si, n/N <= 0.05(fracción de muestreo), entonces la muestra de n
individuos obtenida sin reposición se considera Muestra Aleatoria.

Forma 2.

Se usa la aplicación EXCEL y la función ALEATORIO. ENTRE(inferior; superior). Si la población es finita,


entonces, el inferior es 1 y el s pe i es . Se p i est f ió t t s ve es se e v “ ”,
es decir el tamaño de muestra.

Ejemplo.

De los 42 estudiantes matriculados en el curso de Estadística II, seleccione una muestra de tamaño 8.
Esta muestra de individuos ¿es una muestra aleatoria?

Solución.

1. Los alumnos matriculados son 42.( según listado)


2. Aplicando la función, ALEATORIO.ENTRE(1, 42), los números que se obtienen son:
34, 42, 06, 13, 13, 39, 33, 08
➢ Si se selecciona con reposición: Esta muestra es una muestra aleatoria.
➢ Si se selecciona sin reposición: Esta muestra no es una muestra aleatoria porque la fracción de
muestreo n/N = 0.1904 > 0.05

Ejemplos de Casos reales donde están presente algunos conceptos básicos de ESTADÍSTICA
DESCRIPTIVA E INFERENCIAL

POBLACION – MUESTRA - PARAMETROS – ESTADÍGRAFOS (Estimación puntual)


USO DE LA ESTADÍSTICA DESCRIPTIVA – USO DE LA ESTADÍSTICA INFERENCIAL

Caso 1
Una directiva obliga a la policía a resguardar las calles con los serenazgos, pero las cifras del INEI
revelan que no se cumple.
Aunque existen 1.397 comisarías en el país, solo 594 delegan policías para el patrullaje integrado en
las calles junto con los serenos de los municipios donde aquellas se ubican, ha revelado el I Censo
Nacional de Comisarías 2012 del Instituto Nacional de Estadística e Informática (INEI). Es decir, solo el
43% de las dependencias policiales cumple con la resolución que emitió la Policía Nacional en el 2009.

Veremos en este caso la presencia del parámetro PROPORCIÓN POBLACIONAL, a través de las fases
siguientes:

MARIA ANTONIETA ZACARÍAS DÍAZ 4


a. Conceptos básicos Es parametro o estadigrafo si es poblacional o muestral

UO: comisaria del Perú


Población: las 1397 comisarías del Perú
Variable: cumplimiento de la resolución emitida por la PNP (X)
Tipo de variable: categórica
Conjunto de datos: poblacionales

{𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥1397 } , i = , , ….. , 97 donde:

1, 𝑐𝑢𝑚𝑝𝑙𝑒 𝑐𝑜𝑛 𝑙𝑎 𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖𝑜𝑛 𝑒𝑚𝑖𝑡𝑖𝑑𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑃𝑁𝑃


𝑥𝑖 = {
0, 𝑛𝑜 𝑐𝑢𝑚𝑝𝑙𝑒 𝑐𝑜𝑛 𝑙𝑎 𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖𝑜𝑛 𝑒𝑚𝑖𝑡𝑖𝑑𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑃𝑁𝑃

b. Procedimientos estadísticos usados

Xi fi
1 594
0 803

CUADRO 1
CLASIFICACIÓN DE LAS COMISARIAS EN PERU DE ACUERDO AL CUMPLIMIENTO
DE LA RESOLUCION EMITIDA POR LA PNP EN 2009

CUMPLIMIENTO DE PORCENTAJE DE COMISARIAS


RESOLUCION DE LA PNP
SI 43
NO 57

c. Información que proporciona el cuadro

En términos de medidas resumen, solo el 43% de las comisarias cumple con la resolución emitida por
la PNP, esta medida resumen es un parámetro, su nombre es PROPORCION POBLACIONAL y se denota
por P = 0.43

Caso 2

Un instituto británico independiente dedicado a la investigación social subrayó que la proporción de


ciudadanos de este país que confiesa albergar algún prejuicio de tinte racial se ha incrementado
desde comienzos del siglo XXI, regresando al nivel existente hace 30 años. Según una encuesta sobre
actitudes sociales británicas, un 30% de personas, de 2.000 ciudadanos sondeados, reconocieron
tener "muchos" o "unos pocos" prejuicios de este tipo.

a. Conceptos básicos
Individuo: ciudadano británico
Muestra: 2000 ciudadanos británicos
Variable x: pre juicio racial
Tipo de variable: categórica

MARIA ANTONIETA ZACARÍAS DÍAZ 5


b. Procedimientos estadísticos usados
Cuadro 1
Distribución de ciudadanos británicos según
su prejuicio racial

Prejuicio racial Ciudadanos (%)


SI 30
NO 70
TOTAL 100

c. Información que proporciona el cuadro.

El 30 % de los ciudadanos británicos de esta muestra del año 2012 tiene prejuicio racial. Esta
información está en situación de incertidumbre, pues se ha obtenido a partir de una muestra.
Esta medida resumen es un estadígrafo, su nombre es PROPORCIÓN MUESTRAL y se denota por 𝑝̅

Para generalizar esta información para toda la población se debió utilizar los métodos de la estadística
inferencial

Nota.
Esta proporción muestral de valor 30 %, lo está generalizando para toda la población, eso es posible
hacer, si:

➢ La muestra de ciudadanos británicos que seleccionó lo hizo a través de un método


probabilístico.
➢ La generalización debió hacerlo a través de un intervalo de confianza.
En consecuencia, no es confiable la generalización.

Caso 3

La edad media de los enfermos de cáncer, diagnosticados el año 2012 en el Hospital Neoplásicas fue
de 70 años.
a. Conceptos básicos
UO: Paciente del hospital Neoplásicas año 2012
Población: Todos los pacientes del hospital neoplásicas del año 2012
Variable, X: edad
Tipo de variable: cuantitativa discreta

b. Procedimiento estadístico usado

Medida resumen
𝜇𝑋 = 70 𝑎ñ𝑜𝑠 , edad media de los enfermos de cáncer

d. Información
De la mayoría de los pacientes del hospital neoplásicas del año 2012, su edad está en torno a los 70
años.
Esta medida resumen se ha obtenido a partir de todos pacientes entonces es un parámetro y su
nombre es media poblacional y se denota con 𝝁𝑿

MARIA ANTONIETA ZACARÍAS DÍAZ 6


Caso 4.

Muestra

ENDES: Encuesta Demográfica y de Salud Familiar

Estadígrafo

a. Conceptos básicos
UO: Mujer peruana en edad fértil
Muestra: 27843 mujeres peruanas en edad fértil.
Variable 1, X: talla de las mujeres en edad fertil (cm)
Tipo de variable: Cuantitativa continua
Variable 2, Y: peso de las mujeres en edad fértil (kilos)
Tipo de variable: Ambas cuantitativa continua
Conjunto de datos: Muestrales.
b. Procedimientos estadísticos usados
Medidas resumen
➢ Estatura promedio (media) = 151 cm
➢ Peso promedio (media) = 57 Kg

c.Información.

La mayoría de las mujeres en edad fértil de la muestra seleccionada tiene una estatura media de 151
cm. Esta medida resumen se ha obtenido a partir de una muestra de las mujeres en edad fértil del
Perú, del año 2000, entonces es un estadígrafo y su nombre es media muestral y se denota con 𝑥̅

La mayoría de las mujeres en edad fértil de la muestra seleccionada tiene un peso medio de57 kg. Esta
medida resumen se ha obtenido a partir de una muestra de las mujeres en edad fértil del Perú, del año
2000, entonces es un estadígrafo y su nombre es media muestral y se denota con 𝑦̅

MARIA ANTONIETA ZACARÍAS DÍAZ 7


El estadígrafo, media muestral, proporciona un valor aproximado de la media poblacional, siempre y
cuando se haya obtenido una muestra probabilística. En el contexto de Estadística Inferencial al
estadígrafo se le llama estimación puntual

Observación

De los dos párrafos siguientes al título “Nutrición de las Mujeres”, las siguientes expresiones: “El
promedio de estatura de la mujer peruana es de 151 cm” y “Por otro lado, el peso promedio de las
mujeres en el país es de 57 kilos” cabe hacer notar, que la estatura promedio y el peso promedio NO
CORRESPONDE A LA MUJER PERUANA sino a la MUJER PERUANA EN EDAD FÉRTIL, por otro lado, el
ENIE está generalizando el valor 151 cm y 57 kl para todas las mujeres peruanas en edad fértil, sin
embargo debe tenerse en cuenta lo siguiente:

ENDES, es una encuesta por muestreo que lleva a cabo el INEI, éste usa uno de los métodos del
MUESTREO PROBABILISTICO, eso da la garantía de que puedan generalizar una estimación puntual
para toda la población, sin embargo, lo correcto es que la generalización sea a través de un intervalo
de confianza

Lo que ha hecho el INEI es ESTIMAR la estatura media de todas las mujeres peruanas en edad fértil,
y el peso medio de todas las mujeres peruanas en edad fértil.

Fuente: http://www.inei.gob.pe/biblioineipub/bancopub/Est/Lib0413/Libro.pdf Pág.: 25 y 32

¿Se uso estadística descriptiva o inferencial?

En los casos 1 y 3 presentados se ha utilizado Estadística descriptiva ya que se recopila, procesa y


obtiene información, que permite tomar decisiones.

En los casos 2 y 4, vemos que se obtiene información a partir de una muestra, hacen uso de la
estimación puntual y la generalizan para toda la población, debieron haber usado estimación por
intervalos, ya que a ésta le acompaña un valor de probabilidad, que indica el nivel de confianza en la
estimación.

Estimador Debe tener su funcion cuantia o Fdp

Definición: es una variable aleatoria que está en función de n variables aleatorias, cuya función de
cuantía o función de densidad de probabilidad está en términos del parámetro a estimar.

Nota: a la función de cuantía o función de densidad de probabilidad del estimador se le llama


DISTRIBUCIÓN MUESTRAL del estimador correspondiente.

1. Estimador de la media poblacional 𝜇𝑋 (X es la notación de la variable poblacional)


̅ , es un buen estimador de la MEDIA POBLACIONAL
La variable aleatoria MEDIA MUESTRAL, 𝑿
X Raya , esta
en función de N ̅ cumple con la definición de estimador, pues su fdp está en función
Está variable aleatoria 𝑿
variables del parámetro 𝝁𝑿
aleatorias
1 1 𝑥̅ − 𝜇 2
𝑓(𝑥̅ ) = 𝑒𝑥𝑝 − ( ) , −∞ < 𝑥̅ < ∞
𝜎𝑋
̅√ 2∗𝜋 2 𝜎𝑋
̅
Esta será la fdp de 𝑋̅ siempre y cuando n sea mayor o igual a 30
A esta fdp se le llama distribución muestral de la media muestral o DISTRIBUCIÓN DE
PROBABILIDADES DE LA MEDIA MUESTRAL

MARIA ANTONIETA ZACARÍAS DÍAZ 8


2. Estimador de la proporción poblacional P. (X es la notación de la variable poblacional)
La variable aleatoria PROPORCIÓN MUESTRAL, 𝑷 ̅ , es un buen estimador de la PROPORCIÓN
POBLACIONAL
Está variable 𝑷̅ cumple con la definición de estimador, ya que su fdp está en función del
parámetro P
1 1 𝑝̅ − 𝑃 2
𝑓(𝑝̅) = 𝑒𝑥𝑝 − ( ) , −∞ < 𝑝̅ < ∞
𝜎𝑃
̅√ 2∗𝜋 2 𝜎𝑃
̅
Esta será la fdp de 𝑃̅ siempre y cuando n sea mayor o igual a 30
A esta fdp se le llama distribución muestral de la proporción muestral o DISTRIBUCIÓN
DE PROBABILIDADES DE LA PROPORCIÓN MUESTRAL

POBLACIÓN FINITA E INFINITA

Población finita: es aquella cuya cantidad de elementos es posible de determinar. Ejemplo: conjunto
de universidades públicas del Perú

Población infinita: es aquella cuya cantidad de elementos es imposible de determinar, por lo que no
se conoce el tamaño ni se puede elaborar el marco muestral. Ejemplo: conjunto de estrellas

Distribución muestral de la media muestral.

Ejemplo

Consideremos una población constituida por las secretarias, a, b, c y d a quienes se les pidió que digiten
una carta y se observó el número de palabras mal digitadas y los resultados fueron 2, 3, 3, 4
respectivamente.

Conceptos básicos:

Ind: La secretaria

Conjunto de individuos: las 4 secretarias, constituyen la población de individuos.

Variable (X): Número de palabras mal digitadas. (A esta se le considera la variable poblacional)

Cuyo recorrido es: R X : 2, 3, 4

La distribución de frecuencias relativas es:

xi h(xi)
2 0.25
3 0.5
4 0.25
El número medio de palabras mal digitadas y la varianza de palabras mal digitadas, es:  X = 12 4 = 3
palabras mal digitadas,  X2 = 38 4 − 9 = 0.5 palabras mal digitadas 2

Ya se tiene información poblacional respecto a la forma de la distribución de los datos, pues muestra
que el número de palabras mal digitadas está en torno al valor 3, también nos dice que el número
medio de palabras mal digitadas es 3, con una dispersión de 1.71 palabras mal digitadas.

Hasta aquí no hay nada de aleatorio.

MARIA ANTONIETA ZACARÍAS DÍAZ 9


Sin embargo, si llevamos a cabo el siguiente experimento aleatorio: seleccionar una de las cartas
digitadas y observar el número de palabras mal digitadas.

Exp. Aleatorio.

Acción: seleccionar una carta.

Interesa: Observar el número de palabras mal digitadas. (X) luego

Ω= X = { 1, 2, 3 }.

Y su distribución de probabilidades es:

xi p(xi)
2 0.25
3 0.5
4 0.25
Asimismo, su media y varianza son:

E(X) =12/4 = 3 palabras mal digitadas.

V(X) = 38/4 – 9 = 0.5 palabras mal digitadas2

A partir de esto, podemos hablar de la variable aleatoria poblacional, es decir, Número de palabras
mal digitadas (X), con su correspondiente función de cuantía cuya expresión matemática en este caso
no se conoce, pero se tiene la tabla que muestra la distribución de probabilidades y ésta es igual a la
distribución de frecuencias relativas de los datos poblacionales, la esperanza y la varianza son iguales
a la media y varianza poblacional obtenidas a partir de los datos poblacionales. En situaciones reales
la información poblacional no se conoce, es decir, 𝜇𝑋 , 𝜎𝑋2 ni la forma de la distribución de los datos
poblacionales, por lo que se tendrá que estimar esos parámetros y hacer una suposición respecto a la
forma de la distribución de los datos

Estimación de 𝝁𝑿 a partir de una muestra de tamaño 2.

Veamos que ocurre, en cuanto al valor de la media muestral, cuando se selecciona una muestra de
tamaño 2.

A partir de esta población de secretarias seleccionemos todas las posibles muestras de tamaño 2 de
secretarias. Todas esas posibles muestras se pueden obtener de las siguientes formas:

a. Con reposición.

El procedimiento a seguir es, en fichas iguales se registra el nombre de cada una de las secretarias, se
depositan las fichas en una caja, se mezclan las fichas y se selecciona una ficha, se repone la ficha a la
caja, se mezclan las fichas y se selecciona otra ficha.

Exp. Aleat.

Acción: seleccionar dos fichas con reposición. (se genera las posibles muestras de tamaño 2)

Interesa observar: que secretarias constituyen la muestra

Ω = { ( , ), ( ,b), …….., ( , )} t 6 est s, se se e i s se et i s, só e es s


puede salir.

Sea la variable aleatoria, X: número de palabras mal digitadas.


MARIA ANTONIETA ZACARÍAS DÍAZ 10
Está variable, se va observar en cada una de las secretarias integrantes de la muestra, entonces se
genera 16 pares de datos: {( , ), ( , ), ( , ),………..,(4,4)}

Sea la variable:

𝑋̅: Número medio de palabras mal digitadas en la muestra,

𝑋̅(𝑎, 𝑎) = 𝑋̅(2,2) = 2

𝑋̅(𝑎, 𝑏) = 𝑋̅(2,3) = 2.5

• .
• .
• .

Este procedimiento se resume en la siguiente tabla

Datos Media
Número de Elementos o individuos
muestrales (X) Muestral
posibles integrantes de la muestra
Muestras (espacio muestral Ω) X1 X2 𝑋̅

1 a a 2 2 2

2 a b 2 3 2,5

3 a c 2 3 2,5

4 a d 2 4 3

5 b a 3 2 2,5

6 b b 3 3 3

7 b c 3 3 3

8 b d 3 4 3,5

9 c a 3 2 2,5

10 c b 3 3 3

11 c c 3 3 3

12 c d 3 4 3,5

13 d a 4 2 3

14 d b 4 3 3,5

15 d c 4 3 3,5

16 d d 4 4 4

Finalmente tenemos que los posibles valores de 𝑋̅ son:


𝑅𝑋̅ : 2, 2.5, 3, 3.5, 4

MARIA ANTONIETA ZACARÍAS DÍAZ 11


𝑋̅ es una variable aleatoria porque ésta definida sobre el espacio muestral de un experimento
aleatorio, y su distribución de probabilidades es:

𝑥̅𝑖 𝑝(𝑥̅𝑖 ) Distribución de probabilidades de la media


2 "1/16 0.0625 muestral del número de palabras mal
digitadas
2.5 "4/16 0.25
0.4
3 "6/16 0.375

Probabilidad
0.3
3.5 "4/16 0.25
0.2
4 "1/16 0.0625
0.1
0
2 2.5 3 3.5 4
Media muestral

𝐸( 𝑋̅ ) = 3

𝑉(𝑋̅) = 0.25

Esta tabla muestra el comportamiento probabilístico del número medio de palabras mal digitadas, es decir,
está indicando que es poco probable que el número medio de palabras mal digitadas sea 2 o 4, es
más probable que el número medio de palabras mal digitadas este en torno a 3 o tome el valor 3.

Previo a estos cálculos, habíamos obtenido, que el número medio de palabras mal digitadas a partir
de los datos poblacionales era 3, ahora la distribución de probabilidades del número medio de
palabras mal digitadas 𝑋̅ , indica qué, cuando se seleccioné una sola muestra es más probable que el
valor medio de esa muestra de datos este cerca de 3, esa probabilidad nos da una garantía de que el
valor de la media muestral, estará muy cerca del valor del parámetro.

Estos resultados quedan expresados en la siguiente teoría.

Distribución muestral o Distribución de probabilidades de la Media Muestral en poblaciones


muy grandes o infinitas
Sea X una variable aleatoria con media  X y varianza  X , y sea X1, X2, … , Xn una muestra aleatoria
n

X i
de X. Sea la variable X = i =1
cuyas propiedades son:
n

a. ( )
E X =  X , (la esperanza de la media muestral es igual a la media poblacional).
 X2
b. V X = ( )n
, (la varianza de la media muestral es igual a la varianza poblacional dividida

entre el tamaño de la muestra)


c. Para n suficientemente grande, la Variable X  N (  X ,  X2 n )
Se considera una buena aproximación si n  30

MARIA ANTONIETA ZACARÍAS DÍAZ 12


Distribución muestral o distribución de probabilidades de la media muestral, en poblaciones
finitas
Sea X una variable aleatoria con media  X y varianza  X2 , y sea X1, X2, … , Xn una muestra de X,
obtenida de una población finita de tamaño N, sin reemplazamiento.
n

X i
 X2  N − n 
Sea la variable X = i =1
, cuya E ( X ) =  X y V(X )=  ,
n n  N −1 

 N −n
donde   es llamado factor de corrección por finitud, y puede o no ser considerado para
 N −1 
hallar V( X ), dependiendo de la relación entre el tamaño de la muestra, n, respecto al tamaño de la
población, N, para esto hallamos lo que se llama fracción de muestreo que está definido como n / N.

- Si n/N <= 0.05 el factor de corrección por finitud se acerca a 1 y la varianza se aproxima a

 X2
V( X ) =
n
- Sí (n / N)> 0.05 se considera el factor de corrección por finitud.

La función de densidad de probabilidad de X ,es:

➢ Si n < 30, no se conoce.


̅ ), 𝑉(𝑋
➢ Si n > = 30 por el teorema de Límite Central 𝑋̅ ≅ 𝑁(𝐸(𝑋 ̅ ))

Determinación del tamaño de muestra


Sea la variable poblacional, X, llamada también variable de interés o variable física, de la cual no se
conoce la forma de la distribución de sus datos, ni su media,  X , ni su varianza  X2 . Supongamos que
la forma de la distribución de sus datos es casi simétrica, en consecuencia, esta variable X será
representada por una variable aleatoria con distribución normal, es decir: 𝑋 ~ 𝑁(𝜇𝑋 , 𝜎𝑋2 ).

El estimador de 𝜇𝑋 es 𝑋̅, esta variable aleatoria tiene comportamiento normal, es decir:


2
𝜎𝑋
𝑋̅ ~ 𝑁(𝜇𝑋̅ , 𝜎𝑋2̅ ) , donde 𝜇𝑋̅ = 𝜇𝑋 y 𝜎𝑋2̅ = , cuyo comportamiento probabilístico es:
𝑛

MARIA ANTONIETA ZACARÍAS DÍAZ 13


Distribución de probabilidades de la Media muestral
𝛼 =1− 𝛾
0.35
0.3 𝛾
0.25
0.2
𝛼/2
0.15
0.1
0.05 E
E
0 𝑋̅
0 2 4 6 8 10 12 14 16 18
media muestral

𝜎𝑋
𝑥̅0 = 𝜇 + 𝑘
√𝑛
𝜎𝑋
E = 𝑥̅0 − 𝜇𝑋 = 𝑘
√𝑛

𝜎𝑋
Donde E = k ( ) (a)
√𝑛

- E: es la diferencia entre valor de la media muestral y el valor de la media poblacional, que el


investigador espera sea a lo más esa cantidad, se llama error de estimación
-  X2 : Es la varianza de los datos poblacionales.
Respecto al valor de la varianza, pueden darse dos situaciones:
1. Que el investigador o especialista tenga alguna idea de la dispersión de los datos
2. Que no sepa nada de la dispersión, en este caso, se selecciona una muestra de tamaño
entre 5 a 10 % de individuos de la población y en cada uno de ellos se mide la variable X, se
obtienen los datos y a partir de estos se calcula la varianza. A esta muestra se le llama muestra
piloto.
- 𝜸: Nivel de confianza
Veamos que es el nivel de confianza

Sea el evento A: la media muestral difiera de la media poblacional en menos de E unidades.


P(A) = 𝛾. (Esta probabilidad debe ser alta porque se desea que la diferencia sea pequeña, y se
le llama Nivel de confianza)

- K es un valor de la variable 𝑍̅, que se obtiene para el nivel de confianza dado.


Obtención de k
El evento A en términos de la variable aleatoria 𝑋̅, es:

𝑃(− 𝐸 < 𝑋̅ − 𝜇 < 𝐸) = 𝛾 Nivel de confianza


𝜎 𝜎
𝑃 (− k ( 𝑛𝑋 ) < 𝑋̅ − 𝜇 < k ( 𝑛𝑋 ) ) = 𝛾
√ √

𝑋̅ −𝜇
𝑃 (− k < 𝜎 <k )= 𝛾 𝛾 = 0.95
( 𝑋)
√𝑛

𝑃(− k < 𝑍̅ < k ) = 𝛾 0 𝑍̅

-k k

MARIA ANTONIETA ZACARÍAS DÍAZ 14


Entonces 𝑃( 𝑍̅ < − k ) = (1 − 𝛾)/2

Finalmente, reemplazando el valor de E, K y  X2 e “ ” se btie e e v e “ ” es e i e t ñ de


muestra.

𝜎𝑋 𝑁−𝑛
Para el caso de poblaciones Finitas, E = k √( ) (𝑁−1 )
√ 𝑛
2
𝑁𝑘 2 𝜎𝑋
Despejando n, se tiene: n = (𝑁−1)𝐸2 2
+𝑘 2 𝜎𝑋

Ejemplo
El gerente de control de calidad de una fábrica de focos necesita estimar la vida media de un gran
embarque para lo cual requiere utilizar una muestra de focos. Determine el tamaño de muestra,
sabiendo que la desviación estándar del tiempo de vida de los focos es de 100 horas, el error de
estimación es de 20 horas y el nivel de confianza es 95 %.

Solución

¿Qué información requiere el gerente de control de calidad?

Estimar la vida media de los focos de un gran embarque.

Sea la variable X: tiempo de vida de un foco y se supone que 𝑋 ~ 𝑁(𝜇𝑋 , 10000).

No se conoce 𝜇𝑋 , por lo que se desea estimar, para lo cual se determinará el tamaño de muestra.

Se sabe que: 𝜎𝑋 = 100, E = 20 𝛾 = 0.95 por lo que P(𝑍̅ < k) = 0.975 luego k = 1.96
2
𝑘 2 𝜎𝑋 10000∗1.962
n= = = 96.04 focos
𝐸2 400

Ejemplo
Considere el ejemplo anterior, pero el embarque contiene 2000 focos
2
𝑁𝑘 2 𝜎𝑋 2000∗10000∗1096∗1.96
n = (𝑁−1)𝐸2 2
+𝑘 2 𝜎𝑋
= 1999∗400+1.96∗1.96∗10000 = 91.68 focos

Tamaño de muestra para estimar la proporción poblacional


𝑃(1−𝑃)
X ~ 𝐵(1, 𝑃) , se selecciona una ma 𝑋1 , 𝑋2 , … , 𝑋𝑛 y sea la va 𝑃̅ ≅ 𝑁 (𝑃. 𝑛 )

𝑃(1−𝑃)
El tamaño de nuestra se obtiene a partir de la fórmula: E = 𝑘 √ 𝑛

𝑘 2 𝑃(1−𝑃)
n= 𝐸2

MARIA ANTONIETA ZACARÍAS DÍAZ 15

También podría gustarte