Está en la página 1de 16

UNIVERSIDAD NACIONAL DE TUMBES

FACULTAD DE CIENCIAS ECONOMICAS


ESCUELA PROFESIONAL DE ECONOMIA

GUIA PARA
ESTUDIANTES DE
ESTADÍSTICA APLICADA

INFERENCIAS SOBRE POBLACIONES A PARTIR DE


MUESTRAS
INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

UNIVERSIDAD NACIONAL DE TUMBES 2


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

CONTENIDOS

UNIDAD N°1: INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA - ANOVA ........... 5


MUESTREO Y TAMAÑO DE MUESTRA ...................................................................................... 5
1.1. CONSIDERACIONES IMPORTANTES .................................................................................. 5
1.2. ESTUDIO CON CARÁCTER CUALITATIVO ........................................................................... 6
1.2.1. CUANDO N ES INFINITO (MUY GRADE) O EL MUESTREO ES CON REEMPLAZO ....... 6
1.2.2. CUANDO N ES FINITO O EL MUESTREO ES SIN REEMPLAZO ..................................... 6
1.3. ESTUDIO CON CARÁCTER CUANTITATIVA ........................................................................ 6
1.3.1. CUANDO NO SE CONOCE N O ESTE ES INFINITO ....................................................... 6
1.3.2. CUANDO N ES FINITO ................................................................................................. 6
1.4. DIFERENCIA DE DOS MEDIAS ............................................................................................ 7
1.5. DIFERENCIA DE DOS PROPORCIONES ............................................................................... 7
1.6. TÉCNICAS DE MUESTREO .................................................................................................. 8
1.6.1. MUESTREO .................................................................................................................. 8
1.6.2. MUESTREO ALEATORIO .............................................................................................. 8
1.6.3. MUESTREO ALEATORIA SIMPLE ................................................................................. 8
1.6.4. MUESTREO ALEATORIA SISTEMÁTICA ....................................................................... 9
1.6.5. MUESTREO ESTRATIFICADO ....................................................................................... 9
1.6.6. MUESTREO ALEATORIA AGRUPADO.......................................................................... 9
INFERENCIAS CON MUESTRAS PAREADAS ............................................................................ 10
1.7. NOCIONES PRELIMINARES .............................................................................................. 10
1.8. INTERVALO DE CONFIANZA ............................................................................................. 10
1.9. PRUEBA DE HIPÓTESIS ..................................................................................................... 10
1.9.1. PROCEDIMIENTO ...................................................................................................... 11

z1
1.9.2.  ES CONOCIDA 
2
2 ................................................................................. 11

t n1,
1.9.3.  ES DESCONOCIDA 
2  
2 ...................................................................... 11

MÉTODOS NO PARAMÉTRICOS .............................................................................................. 11


1.10. INTRODUCCIÓN ............................................................................................................. 11
1.11. DEFINICIÓN .................................................................................................................... 12
1.12. PRUEBA DE BONDAD DE AJUSTE .................................................................................. 13
1.12.1. DEFINICIÓN ............................................................................................................. 13

1.12.2. USANDO x2 ........................................................................................................... 13

UNIVERSIDAD NACIONAL DE TUMBES 3


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

UNIVERSIDAD NACIONAL DE TUMBES 4


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

UNIDAD N°1: INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO


PARAMÉTRICA - ANOVA

MUESTREO Y TAMAÑO DE MUESTRA

1.1. CONSIDERACIONES IMPORTANTES

a) PARÁMETRO: Es una medida descriptiva que resuma una característica de la

población, tal como la media


(  ) o la varianza ( ) , o proporción ( p)
2

calculada a partir de los datos observados de toda la población.

b) ESTADÍSTICA O ESTADÍGRAFO: Es una medida descriptiva que resuma una


2
característica de la muestra, tal como la media
( x ) o la varianza ( s ) calculada
a partir de los datos observados de una muestra aleatoria.

c) ERROR MUESTRAL: Es el error que se comete debido al hecho de que se


obtienen conclusiones acerca del total (población) a partir de la observación de
sólo una parte de ella (muestra). Es la diferencia entre el verdadero valor de la
población (parámetro) y el obtenido en la muestra (estadígrafo o estadístico),
por lo tanto, expresa qué tanto se aleja nuestra estimación del verdadero valor
poblacional.

d) NIVEL DE CONFIANZA: Es el grado de certeza (o probabilidad), expresado en


porcentaje con el que queremos realizar la estimación de un parámetro a través
de un estadístico muestral.

e) VARIABLE CUALITATIVA: Es la característica cuyos valores se expresan en


escalas nominal u ordinal, por ejemplo, sexo, profesión, estado civil, orden de
méritos, etc. Con sus valores, que son cualidades, no se pueden realizar
operaciones aritméticas.

f) VARIABLE CUANTITATIVA: Es la característica cuyos valores se expresan en


escalas de intervalo o de razón, por ejemplo, temperatura, número de hijos,
ingresos mensuales, tiempo de vida útil, etc. Con sus valores, que son números,
se pueden realizar operaciones aritméticas.

g) VALORES DE p:

 Cuando se conoce, se toma el valor mencionado.


x
p
 Cuando no se conoce y te dan una proporción referencial: n.
 Cuando no se conoce y no te dan una proporción referencial:
p  0.5

UNIVERSIDAD NACIONAL DE TUMBES 5


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

1.2. ESTUDIO CON CARÁCTER CUALITATIVO

1.2.1. CUANDO N ES INFINITO (MUY GRADE) O EL MUESTREO ES CON REEMPLAZO

2
 
 1  . p.q
z
n   2 2
e
1.2.2. CUANDO N ES FINITO O EL MUESTREO ES SIN REEMPLAZO

2
 
N . z   . p.q
1
n  2 
2
 
( N  1)e 2   z   . p.q
 1 2 
Donde:

 N = Número de elementos de la población.


 n = Número de elementos de la muestra.
 𝑍1−𝛼⁄2 = Valor Z correspondiente.
 p = Proporción de éxitos.
 q = Proporción de fracasos.

1.3. ESTUDIO CON CARÁCTER CUANTITATIVA

1.3.1. CUANDO NO SE CONOCE N O ESTE ES INFINITO

2
  2
 1  .
z
n   2 2
e
1.3.2. CUANDO N ES FINITO

2
 
N . z   . 2
n  1 2 
2
  2
( N  1)e   z   .
2

 1 2 

UNIVERSIDAD NACIONAL DE TUMBES 6


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

1.4. DIFERENCIA DE DOS MEDIAS

A. MUESTRAS IGUALES

 n1  n2

 FORMULA:
2
 
 1   1   2 
2 2
z
n2   2  2
e
B. MUESTRAS DEFERENTES

POBLACIÓN 1 POBLACIÓN 2

n1  kn2
 FORMULA:
2
 
 z1   1  k 2 
2 2

n2   2 
ke2

1.5. DIFERENCIA DE DOS PROPORCIONES

A. MUESTRAS IGUALES

 n1  n2

 FORMULA:
2
 
 z1   p1.q1  p2 .q2 
n2   2 
e2
B. MUESTRAS DEFERENTES

UNIVERSIDAD NACIONAL DE TUMBES 7


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

POBLACIÓN 1 POBLACIÓN 2

n1  kn2
 FORMULA:
2
 
 z1   p1.q1  kp2 .q2 
n2   2 
ke2

1.6. TÉCNICAS DE MUESTREO

1.6.1. MUESTREO
Es el proceso de selección de una muestra de n elementos de la población.

1.6.2. MUESTREO ALEATORIO


Es una técnica para obtener muestras representativas de la población. Se
llama muestreo aleatorio a todo proceso que asegure en cualquier momento
del mismo igual probabilidad de ser incluidos en la muestra a todos los
elementos que pertenezcan a la población en dicho momento.
A las muestras aleatorias se les denomina también muestras probabilísticas
Las muestras aleatorias son de 4 tipos: Al azar simple, al azar sistemático,
estratificado y por grupos (o conglomerados).

1.6.3. MUESTREO ALEATORIA SIMPLE


Es aquella en la que los elementos se escogen del total de la población en
forma individual con una oportunidad igual e independiente. Si la población
es infinita el muestreo aleatorio ocurre cuando la extracción de los elementos
de la muestra se hace con o sin reemplazo.
Si la población es finita de tamaño N, el muestreo aleatorio ocurre también si
la extracción es con o sin reemplazo. Con reemplazo, la probabilidad de cada
elemento de ser extraído es 1/N. Si es, sin reemplazo, la probabilidad de cada
elemento de ser elegido es n/N en la primera extracción, es de (n – 1)/(N - 1)
en la segunda extracción, es (n – 2)/(N - 2) en la tercera extracción, y así
sucesivamente. Por lo tanto, la probabilidad de que se extraiga n unidades
especificas es:

1
CnN

UNIVERSIDAD NACIONAL DE TUMBES 8


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

Esta selección al azar es semejante a la extracción aleatoria de números en un


sorteo. Sin embargo, en el muestreo estadístico suele emplearse una tabla de
números aleatorios o un programa de cómputo generador de números
aleatorios para identificar los elementos numerados de la población que serán
seleccionados para la muestra.
Sí alguno de los números seleccionados se repitiera, lo incluiremos en la
muestra sólo una vez.

Ejemplo: Una empresa tiene 120 trabajadores y se quiere extraer una muestra
aleatoria simple de 30 trabajadores. Para ello se numeran los trabajadores del
1 al 120, se sortean 30 números de entre los 120. Entonces, la muestra estará
formada por los 30 trabajadores a los que les correspondan los números
obtenidos.

1.6.4. MUESTREO ALEATORIA SISTEMÁTICA


Una muestra aleatoria sistemática es aquella en que sus elementos se eligen
de la población a intervalos uniformes a partir de un listado ordenado. El k-
ésimo elemento de la muestra es k=N/n, donde n es el tamaño de la muestra
y N el tamaño de la población.
Por ejemplo, al elegir una muestra sistemática de 100 alumnos de una
universidad que tiene 3000 alumnos, k = 3000/100 = 30. El primero se elige
en forma aleatoria de los 30 primeros de la lista y los demás
sistemáticamente cada 30 alumnos de la lista.

1.6.5. MUESTREO ESTRATIFICADO


Primero se clasifican a los elementos de la población en subgrupos
separados de acuerdo con una o más características importantes (estratos).
Después se obtiene por separado una muestra aleatoria simple o sistemática
en cada estrato. El tamaño de cada submuestra debe ser proporcional al
tamaño del estrato para asegurar representatividad.
El muestreo estratificado tiene la ventaja, en algunos casos, de reflejar con
mayor precisión las características de la población. Pero su costo de
obtención es mayor que en una muestra aleatoria simple del mismo tamaño,
ya que la estratificación implica el trabajo adicional de clasificar a la
población en diversos estratos.

Por ejemplo, para obtener una muestra aleatoria de 600 electores de una
población de 600,000 electores de los cuales 300,0000 son de clase baja,
200,000 de clase media y 100,000 de clase alta. Se deben elegir al azar 300
de clase baja, 200 de clase media y 100 de clase alta.

1.6.6. MUESTREO ALEATORIA AGRUPADO


Denominado también por conglomerados. Los elementos de la población se
dividen en forma natural en subgrupos. Luego se eligen al azar los subgrupos
que forman la muestra.
Por ejemplo, al estudiar las pensiones que se pagan en los colegios
particulares donde no es posible tener una lista de todas las pensiones, pero

UNIVERSIDAD NACIONAL DE TUMBES 9


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

puede obtenerse una lista de los colegios particulares (grupos). Entonces,


con esta lista puede obtener una muestra aleatoria de colegios y así obtener
las pensiones que se pagan en estos colegios.

INFERENCIAS CON MUESTRAS PAREADAS

1.7. NOCIONES PRELIMINARES

Muestras  La variable 1 y 2
Pareada están relacionadas
s

Por lo general
hay un ¨antes¨ y ¨después¨

Llamamos ¨d¨ entre la variable 1 (x) y la variable 2 (y)

di  xi  yi
n

d i
d i 1
n
1.8. INTERVALO DE CONFIANZA

a)  2 ES CONOCIDA

 2 
u1  u2   d z  . 
1
 2 n

b)  2 ES DESCONOCIDA

 d   
n n

d
2 2
i d i
2
n d
 Sd  i 1
 Sd  i 1
n 1 n 1
 FORMULA:
 Sd 
u1  u2   d t   . 
  n 1, 
 2 n 
1.9. PRUEBA DE HIPÓTESIS

UNIVERSIDAD NACIONAL DE TUMBES 10


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

1.9.1. PROCEDIMIENTO

a) Formulación de las hipótesis:

H 0 :   0 H 0 :   0 H 0 :   0
H1 :   1 H1 :   0 H1 :   0
b) Se escoge un nivel de significación 𝛼.
c) Se establece el estadístico de prueba es:
d) La Regla de Decisión para 𝐻0 con un riesgo 𝛼.
e) Tomar la decisión y dar una respuesta: Si se rechaza o se acepta la
hipótesis nula y se da respuesta a la pregunta planteada.

z1
1.9.2.  ES CONOCIDA 
2
2

 ESTADÍSTICO DE PRUEBA:
d
z
2
n
t n1,
1.9.3.  ES DESCONOCIDA 
2  2 
 ESTADÍSTICO DE PRUEBA:
d d  d
t t
sd sd
n  n
MÉTODOS NO PARAMÉTRICOS
1.10. INTRODUCCIÓN
Las técnicas estadísticas de estimación de parámetros, intervalos de confianza y
prueba de hipótesis son, en conjunto, denominadas ESTADÍSTICA PARAMÉTRICA
y son aplicadas básicamente a variables continuas. Estas técnicas se basan en
especificar una forma de distribución de la variable aleatoria y de los estadísticos
derivados de los datos.
En ESTADÍSTICA PARAMÉTRICA se asume que la población de la cual la muestra
es extraída es NORMAL o aproximadamente normal. Esta propiedad es necesaria
para que la prueba de hipótesis sea válida.

Sin embargo, en un gran número de casos no se puede determinar la distribución


original ni la distribución de los estadísticos por lo que en realidad no tenemos
parámetros a estimar. Tenemos solo distribuciones que comparar. Esto se llama
ESTADÍSTICA NO PARAMÉTRICA.

UNIVERSIDAD NACIONAL DE TUMBES 11


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

1.11. DEFINICIÓN
Los métodos no paramétricos o métodos de distribución libre, no depende del
conocimiento de como se distribuye la población. Estos métodos son adecuados
cuando no se conoce la distribución de la población y los cálculos empleados son
mas simples. Sin embargo, si se conoce la distribución de los datos una prueba
paramétrica es mas eficiente que una no paramétrica.

Los métodos no paramétricos pueden ser usados para datos cualitativos, ya sea
ordinales (jerarquizados) o nominales; así como también para datos cuantitativos,
mientras que los métodos paramétricos solo pueden usar para datos cuantitativos
(discretos y continuos).

Una de las consideraciones para determinar si lo apropiado es un método paramétrico


o no paramétrico es la escala de medición empleada para generar los datos. Estas
escalas son: nominales, ordinales, de intervalos (continua) o de razon.

a) ESCALA NOMINAL
Una escala de medición es nominal si los datos son etiquetas o categorías que
se usan para definir un atributo de un elemento. Los datos nominales pueden
ser numéricos o no numéricos. Ejemplo: El sexo de una persona es un dato
nominal no numérico. El número de seguro social de una persona es un dato
nominal numérico.

b) ESCALA ORDINAL
Una escala de medición es ordinal si los datos pueden usarse para jerarquizar u
ordenar las observaciones. Los datos ordinales pueden ser numéricos o no
numéricos. Ejemplo: Las medidas pequeño, mediano y grande para dar el
tamaño de un objeto son datos ordinales no numéricos.

c) ESCALA DE INTERVALO
Una escala de medición es de intervalo si los datos tienen las propiedades de
los datos ordinales y los intervalos entre observaciones se expresan en
términos de una unidad de medición fija. Los datos de intervalo tienen que ser
numéricos. Ejemplo: Las mediciones de temperatura son datos de intervalo.
Suponga que la temperatura en un lugar es de 21°C y en otro es de 4°C. Estos
lugares se pueden jerarquizar de acuerdo con lo calurosos que son: el primero
es más caliente que el segundo. La unidad fija de medición, 1°C , permite decir
cuán más caliente es el primer lugar: 17°C.

d) ESCALA DE RAZÓN
Una escala de medición es de razón si los datos tienen las propiedades de los
datos de intervalo y el cociente (o razón) entre dos medidas tiene sentido. Los
datos de razón tienen que ser numéricos. Ejemplo: Variables como la distancia,
la altura, el peso y el tiempo se miden con una escala de razón.

En general, para que un método estadístico se clasifique como un método no


paramétrico, debe satisfacer, por lo menos, una de las condiciones siguientes:

UNIVERSIDAD NACIONAL DE TUMBES 12


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

1) Ser un método que pueda ser usado con datos ordinales.


2) Ser un método que pueda ser usado con datos de intervalos o de razón cuando
no sea posible hacer suspensiones acerca de la forma de la distribución de la
población.

1.12. PRUEBA DE BONDAD DE AJUSTE

1.12.1. DEFINICIÓN
Estas pruebas permiten verificar que la población de la cual proviene una
muestra tiene una distribución especificada o supuesta.

2
1.12.2. USANDO x
Esta prueba es aplicable para variables aleatorias discretas o continuas. Teniendo
un número k de clases en la cual se ha registrado un total de n observaciones,
llamaremos frecuencia observada (corresponde a los datos de la muestra),

denotadas por
Oi . Lo que se busca es comprobar las frecuencias observadas con

las frecuencias esperadas (corresponde al modelo propuesto), denotada por


Ei

FRECUENCIA FRECUENCIA
CLASE i OBSERVADA ESPERADA
(Oi ) ( Ei )
CLASE 1 O1 E1
CLASE 2 O2 E2
CLASE 3 O3 E3

CLASE K Ok Ek

 ESTADÍSTICO DE PRUEBA:

 Oi  Ei 
2
n
x 
2

i 1 Ei
Grados de
libertad : k 1 m
Donde:

k = Numero de clases.
m = Numero parámetros estándar a partir de los datos muestrales.

Frecuencias
esperadas :
p ( x ).n0

UNIVERSIDAD NACIONAL DE TUMBES 13


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

¡NOTA!
Si la frecuencia esperada de una celda es menor o igual a 5, se combina con
la celda anterior y se vuelven en una sola.

1.12.2. CASO 1: DISTRIBUCIÓN BINOMIAL


Se va a necesitar el parámetro  , por esta razón m toma el valor de 1. Así
mismo se recordará la función de probabilidad de la distribución binomial:
n!
p( X  x)  . p x .q n x
x! n  x !
, o el uso de la tabla de probabilidades
correspondiente.

Ejemplo: En una empresa de acuicultura se quiere hacer un estudio sobre


el nivel de parásitos en la producción de doradas. Para ello, se tomó una
muestra de 5 individuos cada día, repitiendo el experimento durante 550
días. De cada muestra se analizaron los peces determinando cuántos de
ellos contenían parásitos. ¿Se ajusta a un modelo de distribución Binomial?
Use   0.05 .

N° de
individuos
con parásitos 0 1 2 3 4 5
(Xi )
Frecuencia
Observada 17 81 152 180 104 16 n0  550
(Oi )
Solución

Primero debemos sacar unos datos importantes:

1) Hallamos la media  y los datos pertinentes:

 x (O )
i i
0(17)  1(81)  2(152)  3(180)  4(104)  5(16)
 i 1

n0 550
  2.58
   n. p
 2.58
p 
n 5
p  0.516  q  0.484

2) Hallamos la probabilidad y las frecuencias esperadas.

UNIVERSIDAD NACIONAL DE TUMBES 14


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

N° de
individuos
con 0 1 2 3 4 5
parásitos
(Xi )
Frecuencia
Observada 17 81 152 180 104 16 550
(Oi )
p ( x) 0.027 0.142 0.302 0.312 0.172 0.037
Frecuencia
Esperada 14.85 78.1 166.1 171.6 94.6 20.35
( Ei )
 Oi  Ei 
2

0.296 0.108 1.197 0.082 0.934 0.949 3.566


Ei

Ahora haremos una prueba de hipótesis:

1) 𝐻0 : 𝐿𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎𝑛 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑏𝑖𝑛𝑜𝑚𝑖𝑎𝑙


𝐻1 : 𝐿𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑛𝑜 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎𝑛 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑏𝑖𝑛𝑜𝑚𝑖𝑎𝑙

2)   0.05  1    0.95
g .l.  k  1  m
g .l.  6  1  1
g .l.  4
 x(4,0.95)
2
 9.488

3)

 Oi  Ei 
2
n
x2    3.566
i 1 Ei
4)

UNIVERSIDAD NACIONAL DE TUMBES 15


INFERENCIAS SOBRE POBLACIONES A PARTIR DE MUESTRAS

REFERENCIA BIBLIOGRÁFICA

Marques Dos Santos, María José. Estadística Básica un enfoque no paramétrico.


Universidad Nacional Autónoma de México. Facultad de Estudios Superiores
Zaragoza.
https://www.geogebra.org/m/Ps6ZVrVZ
http://www.iuma.ulpgc.es/~nunez/mastertecnologiastelecomunicacion/RecursosG
enerales/AnalisisEstadisticoClase9.pdf
https://sites.google.com/site/tallerdebioestadistica/estadistica-descriptiva/1-3-
escalas-de-medicion-escala-nominal-ordinal-de-intervalo-y-de-razon
https://www.uaeh.edu.mx/docencia/P_Presentaciones/Sahagun/industrial/2017/Pr
uebas_de_bondad_de_ajuste.pdf

UNIVERSIDAD NACIONAL DE TUMBES 16

También podría gustarte