MII MM Separata

Módulo II
NOCIONES DE MUESTREO E
INFERENCIA ESTADÍSTICA
ÍNDICE
MÓDULO II: NOCIONES DE MUESTREO E INFERENCIA

Pág.
ESTADÍSTICA
I. MUESTREO……………………………………………………… 3
II. INFERENCIA ESTADÍSTICA……………………………………….. 13
III. APLICACIONES DE LA PRUEBA DE HIPÓTESIS………………. 21

MÓDULO II
NOCIONES DE MUESTREO E INFERENCIA ESTADÍSTICA
I. MUESTREO
El muestreo es un proceso estadístico en el cual se estudia un fenómeno que afecta a un

colectivo extenso o población, a partir de una muestra escogida o aleatoria de la misma.
La población es el conjunto de todos los individuos que porten información sobre el

fenómeno que se estudia. Los individuos corresponden a personas, objetos u otros
elementos que pueden ser escuelas, cursos, familias y hasta unidades territoriales.
Los problemas más corrientes que se presentan en la práctica, cuando se procede a

investigar las características de una población estadística es la imposibilidad de estudiar a
cada uno de los individuos u objetos que la conforman; por ello debemos depender de un
subconjunto o parte de la población como base para llegar a hipótesis relacionadas a
varias características o parámetros de ella. Por lo tanto, en estos casos resulta más
conveniente por razones de economía, tiempo y eficiencia analizar una muestra que es un
número determinado de individuos u objetos de la población y suponer que se pueden ver
en ellos con cierto grado de confianza lo que se quiere conocer acerca del universo de
donde provienen.
El estudio de estos aspectos recae sobre la estadística inductiva o inferencial cuya

finalidad es obtener conocimientos sobre algún conjunto extenso de datos, a partir de
muestras de los mismos, que permitan la inferencia de los resultados estadísticos, los
cuales representan cálculos aritméticos realizados sobre los valores obtenidos de la
muestra de la población que ha sido seleccionada rigurosamente.
Para que estos datos estadísticos sean de utilidad tienen que presentar dos características
básicas:
3
1. Deben ser pertinentes; es decir, deben guardar una relación con el tema a investigar.
2. Deben ser in sesgado; es decir no deben tener deformaciones o errores provenientes
de los instrumentos empleados en la recolección de los datos.
1.1. Características de las muestras
Para que una muestra sea aceptable desde el punto de vista del análisis estadístico
deberá reunir las siguientes características:
1. Deberá seleccionarse de manera que sea representativa1 de la población de la cual se

obtuvo.
2. La muestra además de permitir obtener estimaciones de características de la
población (totales, promedios, porcentajes, entre otros) deberá proporcionar medidas
de la precisión de dichas estimaciones.
3. La muestra debe ser bastante reducida para evitar gastos innecesarios y lo bastante
amplia para que el error de muestreo sea admisible y además debe reunir las
exigencias de eficiencia, representatividad, seguridad y flexibilidad.
1.2. Ventajas y desventajas del muestreo
A grandes rasgos la aplicación del muestreo es aconsejable principalmente en los

siguientes casos:
1. Cuando la población sea infinita o tan grande que sea imposible la enumeración
completa de cada uno de los elementos o unidades.
2. Cuando la población tenga las mismas características tal que una muestra sea una
imagen aceptable de la misma población.
3. Con respecto a la parte técnica operacional y administrativa tenemos:
a. Economía de tiempo y dinero
b. Ampliación del alcance de una investigación.
c. Mejor formación y control del personal que interviene en la investigación.
d. Mayor control, calidad, rapidez y eficiencia en el procesamiento y publicación de los
datos.
e. Permite la verificación posterior a una investigación utilizando menor personal y
otros recursos.
4
f. Mayor confiabilidad y precisión de los datos obtenidos.
Por otra parte, la aplicación del muestreo presenta algunas limitaciones comunes entre las
cuales tenemos:
1. No permite hacer cálculos, proyecciones o tabulaciones con respecto a sectores
pequeños de una población o cuando se requiere información de cada elemento de la
población, ya que las dudas serían tan importantes que no es posible tener una
acertada predicción en base de la muestra.
2. El cálculo de los resultados está sujeto a los errores del muestreo en sí y de errores
ajenos al muestreo.
3. Las investigaciones completas ofrecen un margen más sólido y eficiente de exactitud
que los obtenidos en base a la muestra.
4. En base a una muestra se dificulta la tabulación cruzada de algunas características
investigadas.
5. Las probabilidades de error se multiplican en las diferentes operaciones y en las
complicaciones que surjan de su propio mecanismo.
6. La preparación estadístico-matemática del muestrista para el diseño eficiente de la
muestra en todas sus etapas.
1.3. Tipos de muestreo
Existen dos tipos generales para seleccionar muestras a partir de las poblaciones; el
primero es el muestreo probabilístico: son aquellos en donde la operación del muestreo
es controlada objetivamente, es decir, son muestras escogidas al azar. Después, tenemos
los muestreos no probabilísticas: son aquellos en donde la operación del muestreo es
realizado en forma subjetiva, al menos parcialmente, lo que significa que los resultados
obtenidos de la muestra pudiesen no ser representativos de la población.
1.3.1. Muestreos Probabilísticos
A. Muestras Aleatorias Simples: en este tipo de muestreo cada uno de los individuos de
la población tiene la misma posibilidad de ser elegido. El cual puede ser con reemplazo
y sin reemplazo. En este caso, para dar la seguridad de que la muestra aleatoria no
5
sea viciada, debe emplearse para su constitución una tabla aleatoria o procesos
electrónicos aleatorios.
Este tipo de muestreo resulta más económico que otros procedimientos aleatorios,
además asegura la equiprobabilidad de la elección, sin embargo, su limitante radica en
que no provee suficientes casos de grupos minoritarios.
Para su aplicación es necesario los siguientes pasos:

 Realizar un listado de todos los integrantes de la población y enumerar a cada uno
de ellos.
 Para la selección de los sujetos de la muestra utilizar una tabla de números
aleatorios o un procedimiento similar utilizando medios electrónicos.
 Administrar los instrumentos de recopilación de datos a los sujetos seleccionados.
Aquellos sujetos que por alguna razón no sean sometidos a observación integrarán
la categoría mortalidad experimental 1
Por ejemplo; en la UE “Guillermo Tell” ubicado en Barrancas, Municipio Cruz Paredes,

el profesor de Física quiere conocer la comprensión por parte de los alumnos de 9no
grado sección A, del tema de transformaciones y despejes desarrollado en clase, para
ello, necesita una muestra de 5 alumnos de un total de 36, los cuales se encuentran
enumerados en la carpeta de la asistencia.
El profesor procede a buscar números al azar usando la calculadora, de donde obtiene

los siguientes resultados: 15, 2, 3, 27 y 19.
B. Muestras por Conglomerados: consiste en sustituir las unidades físicas, elementales

o últimas a las cuales se refiere el estudio, por unidades de muestreo que comprendan
un grupo de aquellas. Por lo que es un tipo de muestreo más económico y rápido que
el aleatorio simple ya que facilita el trabajo de los investigadores de campo. Sin
embargo pueden tener cierta pérdida de aleatoriedad en el procedimiento y
1
Se refiere a los sujetos escogidos para someterse a observación en una muestra en
estudio y no se les ubica, o bien no es posible lograr que proporcionen la información
necesaria.
6
disminución de la precisión de sus resultados, en el caso que el número de
conglomerados sea menor de 30. Los pasos a seguir son los mismos que el grupo
anterior (muestreo aleatorio simple).
Por ejemplo, el Jefe de la Zona Educativa – Barinas, quiere analizar, el rendimiento en

el área de Física del 9no grado en el Municipio Barinas; para ello necesita seleccionar
50 Unidades Educativas de un total de 200.
Entonces, se realiza un listado de todas la Unidades Educativas, donde se imparta 9no

grado; luego se utiliza los pasos del ejemplo anterior.
C. Muestras Estratificadas: consiste en dividir la población en subpoblaciones, dentro de

cada una de las cuales se hace una selección aleatoria simple como en los casos
anteriores. Este tipo de muestreo permite una muestra más homogénea. En este caso,
encontramos la muestra estratificada proporcional la cual consiste en distribuir la
muestra proporcionalmente al número de elementos de cada estrato y la muestra
estratificada uniforme la cual reparte por igual la muestra entre todos los estratos.
D. Muestras Sistemáticas: Este tipo de muestreo consiste en escoger una unidad al azar
y luego selecciona cada unidad que se encuentre a m unidades de aquella. Esta
técnica suele ser más rápida y está menos expuesta a errores que la del muestreo
aleatorio simple. Generalmente, se emplea cuando se quiere seleccionar elementos de
un estrato, en un diseño estratificado. Por ejemplo, se desea escoger una muestra
probabilística de 16 hospitales, de una lista de 160 hospitales.
Una manera de obtener una muestra es: N/n = IM; 160/16=10
Procedemos a seleccionar un número entre 1 y 10, tomamos el 3, entonces a = 3

1. a = 3
2. a + 10 = 13
3. a + 2(10) = 23
4. a + 3(10) = 33
5. a + 4(10) = 43; Continuamos de la misma forma para obtener los demás resultados.
7
Se incluirán en la muestra los hospitales con los números: 3, 13, 23, 33, 43, 53, 63, 73,
83, 93, 103, 113, 123, 133, 143, 153.
1.3.2. Muestreos No Probabilísticos
A. Muestras a Conveniencia: Es aquella muestra seleccionada de acuerdo a la

comodidad del investigador; los elementos de este tipo de muestra son escogidos en
forma simple porque se tiene acceso a ellos. Carecen de validez externa y
confiabilidad, además presentan sesgos de muestreo por criterios arbitrarios de
selección de los sujetos (aunque el investigador no los advierta). Por ejemplo; se desea
estudiar la disciplina del Colegio “Padre José María Veláz”; para ello el profesor Carlos
toma como muestra a la sección de 8vo A, donde el cumple funciones como profesor
guía.
B. Muestras Intencionadas o Racionales: Es aquella muestra seleccionada a través del

juicio de un experto en la materia de estudio. Mediante este enfoque los especialistas
escogen lo que creen es la muestra representativa. Es rápida y de bajo costo. No
requiere entrenamiento de entrevistadores. Es muy útil para estudios exploratorios ya
que permiten la optimización de instrumentos de observación. Además, permiten la
formulación de hipótesis. Su limitación está en que carece de validez externa y
confiabilidad al intentar generalizar hacia grupos mayores. Por ejemplo; en la EB
“María Montessori” ubicada en San Cristóbal, Estado Táchira, la psicopedagoga desea
estudiar el bajo rendimiento académico, para ello toma como muestras aquellos
alumnos que presentan dificultades de aprendizaje.
C. Muestras por Cuotas: Entre los tipos de muestreo no probabilísticos es el más

empleado. Es similar al muestreo estratificado, ya que en ambos tipos el universo que
va a estudiarse se divide en grupos o estratos y se distribuye la muestra total entre los
grupos. Es rápido y eficiente, además puede servir para un ensayo preliminar de dicha
técnica, sin embargo, el sesgo del entrevistador para elegir los sujetos es su defecto
más evidente. Por ejemplo; en la Universidad de Los Andes – Táchira se quiere
estudiar las estudiantes solteras, con hijos o embarazadas, o estudiantes varones de
pelo largo y con aros. Entonces, cada entrevistador selecciona por su cuenta y
entrevista con ayuda de una lista (entrevista dirigida).
8
1.4. Tamaño De Muestra
Para determinar el tamaño de muestra se tiene en cuenta el tipo de población, es decir:
a. Si la población es homogénea se requiere pocos elementos en la muestra y si la

población es heterogénea se requiere un mayor número de elementos.
Para establecer una fórmula del tamaño de muestra se requiere saber el tipo de
parámetro que se desea estimar, es decir, si el interés es estimar una media aritmética
se requiere una fórmula específica y si se quiere estimar una proporción se considera
otra fórmula.
Fórmula de tamaño de muestra para estimar una media aritmética
n = Z² ² N
E²(N-1)+Z²²
Donde:
N: Tamaño de la población que es objeto de estudio.
Z: es una desviación normal cuyo valor corresponde al grado de confianza que se
establece.
Es decir:
N.C.: 90% 95% 99%
Z : 1.64 1.96 2.57
²: Varianza poblacional de la población que es objeto de estudio
En la práctica, el valor de la varianza se desconoce.
Para establecer el valor a la varianza, hay que tener en cuenta las siguientes
recomendaciones:
 Recurrir a estudios similares que se han realizado y obtener el valor de la varianza
respectiva.
9
 Realizar un estudio piloto para estimar ².
E: Error absoluto o precisión de la estimación deseada de la media.
Ejemplo
Interés: Conocer el colesterol promedio de los estudiantes de la Facultad de
Medicina USMP. (Suponemos que son 1800 alumnos)
El estudio queremos realizarlo mediante una muestra y necesitamos calcular el

tamaño de muestra n, considerando: un grado de confianza del 95%, y los resultados
de un estudio preliminar:
_
x=210 y s=30; error relativo del 6% (0.06)
Solución
Por definición de error relativo. Er = E/X * 100. Por consiguiente, E= Er* X /100.
Como grado de confianza 95%, nos indica que Z=1.96
E= 0.06*210 = 12.6; = 30.
Reemplazando valores en la formula se tiene: n = (1.96)²(30)²(1800)

(12.6)²(1799) + 1.96²(30²)
Por tanto, n=22 (Para realizar el estudio se requiere como mínimo 22 estudiantes)
Determinación del tamaño de muestra para estimar una proporción
n = Z² P (1 – P) N
E²(N-1) + Z²P(1-P)
N: Tamaño de la población
Z: Desviación normal
P: Proporción de unidades que poseen el atributo de interés en la población
10
E: Error absoluto o precisión de la estimación de la proporción. Por lo general el valor
que asume es de 0.05
En la práctica, el valor de la proporción P se desconoce. Para determinar dicho valor

se recurre a las siguientes recomendaciones:
 Recurrir a estudios similares que se hayan realizado y extraer el valor de P.
 En caso de no haber antecedentes, se recurre a un estudio piloto para conocer P.
En caso contrario se recurre a la máxima varianza cuando P=0.5
Ejemplo
Interés: Conocer la proporción de estudiantes que fuman cigarrillos en la Facultad de
Medicina de La USMP número de estudiantes N= 1700.
El estudio se realizará mediante una muestra. Calculamos el tamaño de muestra,

considerando: Grado de confianza del 99%, por consiguiente,
Solución
Z= 2.57. De un estudio preliminar se ha determinado que la proporción de alumnos
que fuman cigarrillos es de p=0.40. El error absoluto que se toma en cuenta es de
E=0.05
Reemplazando la información en fórmula, se tiene:
n= (2.57)²(0.4)(0.6)(1700) = 462
(0.05)²(1699) + (2.57)²(0.4)(0.6)
Por lo menos se requiere para ejecutar el estudio por lo menos 462 estudiantes, con
un grado de confianza del 99% y precisión del 5%.
En caso de que se desconocer el tamaño de la población N, las fórmulas quedaran

reducidas como:
 Para estimar una media aritmética,

n = Z² ²
E²
11
 Para estimar una proporción,
n = Z² P (1 – P)
E²
12
II. INFERENCIA ESTADÍSTICA
La inferencia estadística se refiere a los métodos y/o procesos para obtener conclusiones
acerca de poblaciones, basados en la información muestral.
13
2.1. Áreas de la inferencia estadística
2.1.1. Estimación de parámetros

Resuelve situaciones en las que se busca conocer un dato o medida descriptiva de
determinada población (parámetro) a partir de datos o medida descriptiva de una
muestra (estadístico) representativa.
2.1.2. Prueba de hipótesis

Sirve para decidir si se rechaza o no una hipótesis estadística establecida
basándose en la información de una muestra. Se realiza una contrastación de
información entre la hipótesis estadística existente y los resultados obtenidos de la
muestra, para una corroboración.
2.2. Estimación de parámetros
 Proceso en el cual se determinan las medidas descriptivas poblacionales

(parámetros) en base a resultados muestrales (estadísticos). Consiste en usar los
estadísticos para predecir el valor de uno o más parámetros por medio de fórmulas
matemáticas específicas denominadas estimadores.
 En otras palabras, el estimador produce una estimación del parámetro en función
de las medidas muestrales. Debido a que no siempre el valor obtenido de la
estimación representa al verdadero parámetro, se considera el nivel o grado de
confianza, que es la probabilidad de que una estimación por intervalo incluya el
parámetro.
 El nivel de confianza se refleja en el valor de z.
2.2.1. Tipo de estimación de parámetros
 Un estimador puntual del parámetro de una población es una regla que indica
como calcular un número con base muéstrales. Al número resultante se llama
estimación puntual.
14
Ejemplo 1:
Se desea estudiar el salario promedio anual de los profesionales de salud de una
compañía farmacéutica. Para ello se tomó una muestra de n=100 profesionales de
la compañía, se registra el salario anual de cada profesional de salud en la muestra
y se calculan la media y la desviación estándar muestral de los salarios
obteniéndose:
x= $7,750 y s= $900
Solución:
: Salario promedio anual
 = x = $7,750
Se estima que el salario promedio anual es de $7,750
 La estimación por intervalo

Consiste en determinar, mediante un estimador, 2 valores numéricos llamados
límite inferior (L1) y límite superior (L2). Con un cierto grado de confianza, se espera
que estos límites contengan el valor del parámetro que se quiere hallar. Es decir, el
valor del parámetro debería encontrarse entre el límite inferior y límite superior
obtenidos de la estimación.
Cabe mencionar que no todos los intervalos obtenidos de un estimador incluirán
realmente al parámetro. Es por ello que se aplica el concepto de nivel de confianza.
2.2.2. Intervalo de confianza para la media 
 Los valores de los límites, inferior (L1) y superior (L2), se encuentran aplicando la
fórmula general:
 Por consiguiente, los límites del intervalo se obtienen sumando o restando el error
estándar al valor de la media muestral. Específicamente, para hallar el límite inferior
15
(L1) se resta el error estándar y para hallar el límite superior (L2) se suma el error
estándar.
 Para explicar el uso de esta forma de estimación se resolverán los ejemplos

planteados anteriormente y otros.
Ejemplo 2:
Se tiene interés en estimar la altura media de los alumnos de la Facultad de

Medicina de la USMP. Se recurre a una muestra aleatoria de 36 alumnos y se
obtienen los siguientes resultados:
= 170 cm ; s = 20 cm
Solución
 Si no se especifica el grado de confianza, se utiliza por lo general 95%, lo cual
corresponde a z = 1.96. Conociendo los datos. Se puede aplicar la fórmula:
 =  Z x s_
 Li = 170 - 1.96 x 20/6_  163.47 cm
 Ls = 170 + 1.96 x 20/6  176.53 cm
 Por lo tanto, la estatura promedio de los estudiantes de la facultad de medicina de
la USMP está comprendida entre 163.5 y 176.5 cm, con un grado de confianza del
95%.
  I.C. 95% (163.5 ; 176.5 cm)
2.2.3. Intervalo de confianza para la proporción P
 Los valores de los límites, inferior (L1) y superior (L2), se encuentran aplicando la
fórmula general:
16
 Por consiguiente, los límites del intervalo se obtienen sumando o restando el error
estándar al valor de la proporción muestral (p). Específicamente, para hallar el
límite inferior (L1) se resta el error estándar y para hallar el límite superior (L2) se
suma el error estándar.
 Para explicar el uso de esta forma de estimación se resolverán los ejemplos

planteados anteriormente.
Ejemplo
Supóngase que en una muestra de 2000 personas se encontró que 250 son
alcohólicos. Es decir, el porcentaje de alcohólicos en la muestra es:
p=250/2000x100=12.5%.Calcular el intervalo de confianza al 95%.
Por lo tanto, con un nivel de confianza de 95%, se puede afirmar que el porcentaje de
alcoholismo en la población se encuentra entre 11.05% y 13.95%.
17
2.3. Prueba de hipótesis
Es una técnica estadística que se sigue para decidir si se rechaza o no una hipótesis
estadística en base a la información de una muestra. Es llamada también docimasia de
hipótesis o contraste de hipótesis.
2.3.1. Hipótesis estadística
Es una afirmación de lo que se cree sobre una población, es decir, es un supuesto.

Por lo general, esta hipótesis se refiere a los parámetros de la población o a una
situación existente en la población.
2.3.2. Tipos de hipótesis estadística
Existen 2 tipos de hipótesis estadística.
 Hipótesis nula (Ho): también llamada hipótesis de la no diferencia, pues plantea

que los grupos comparados no difieren en la característica (parámetro) en estudio.
Por lo tanto, la diferencia observada en la investigación es consecuencia del error
de muestreo. La hipótesis nula (Ho) se plantea para ser rechazada o desacreditada,
por lo general.
 Hipótesis alterna (H1): Son todas las alternativas o suposiciones para contrastar la
hipótesis nula (Ho), es decir, aquellas que plantean una diferencia entre los
parámetros involucrados y proponen que la diferencia observada es consecuencia
efectiva entre las poblaciones de origen. La hipótesis alterna puede ser uni o
bilateral.
Ejemplo
Un investigador pretende estudiar en forma comparativa la eficacia de 2 tratamientos,
tratamiento A y tratamiento B, para determinar cuál es mejor.
18
Ho: A - B= 0. La afirmación de esta hipótesis es que el tratamiento A no difiere del
tratamiento B.
Con respecto al ejemplo, se pueden plantear varias alternativas. Una de ellas es H1: A
- B 0. La interpretación es que el tratamiento A es mejor que el tratamiento B, siendo
por consiguiente H1 unilateral a la derecha.
2.3.3. Nivel de significación: 
Al hallar el valor , se puede tomar una decisión respecto a cuál de las 2 hipótesis
planteadas es verdadera y cual falsa. La toma de decisiones se resume en el siguiente
cuadro:
Ho verdadero Ho falso
Rechazar Error tipo I Decisión

Decisión Ho
estadística () correcta
(1 - )
No rechazar Decisión Error tipo II
Ho
correcta ()
(1 - )
 Cuando se toma una decisión estadística, se puede cometer el error tipo I o el error
tipo II.
 Para evitarlo, se considera el valor , que fue planteado anteriormente:

 = P (Rechazar Ho / Ho es verdadero)
 Representa la probabilidad de cometer un error tipo I. Es así que un valor mínimo

de  determina una menor probabilidad de cometer el error en el cual se estaría
rechazando una hipótesis nula (Ho) que es acertada.  puede ser manejada por el
investigador, por consiguiente es posible hallar su valor. Se ha establecido que un
valor de  menor al nivel de significancia, 5% o 1% dependiendo del caso, es un
indicador de que la hipótesis nula (Ho) debe ser desechada. De esta forma,  indica
19
el nivel de significación de la prueba, pues permite diferenciar la región de rechazo
y no rechazo de la prueba. Es así que 1-  indica el grado de confianza de la
prueba.
 Además existe un valor ß, el cual no se maneja directamente por el investigador.

ß = P (No rechazar Ho / Ho falso)
 y ß están relacionados y ambos disminuyen su valor si se incrementa el tamaño

de muestra o si se mejora el diseño del estudio.
1-ß= P (rechazar Ho /Ho es falso), también se denomina potencia de prueba. El

valor mínimo que puede tomar es de 80%.
Pasos para probar una hipótesis estadística
a) Paso 1.- Planteamiento de hipótesis.

H0: Hipótesis Nula
H1: Hipótesis Alternativa
b) Paso 2.- Niveles de significación. (teórico) ””
c) Paso 3.- Estadístico de prueba.
«Z» de la distribución normal ó
«T» de student con su respectivos grados de libertad.
d) Paso 4.- Formular la regla de decisión
Si el p-valor <  Se rechaza H0
Si el p-valor ≥  No se rechaza H0
e) Paso 5.- Conclusión:
En este caso se especifica la hipótesis estadística que no ha sido rechazada
indicando el nivel de significancia teórico considerado (α)
20
III. APLICACIONES DE LA PRUEBA DE HIPÓTESIS
Las más usuales:
3.1. Para una sola media poblacional.

Paso 1.- Planteamiento de hipótesis.
H0 : μ = μ0 H0 : μ = μ0 H0 : μ = μ0
H1 : μ  μ0 H1 : μ > μ0 H1 : μ < μ0
Paso 2.- Niveles de significación. (teórico) ””  α puede ser : 0.01, 0.05, 0.10,etc 
Paso 3.- Estadístico de prueba.
Caso 1: Caso 2:
Varianza poblacional conocida Varianza poblacional desconocida; n≤30
x -μ x -μ
Zcal = N(0,1) Tcal = t (n-1)
σ/ n S/ n P – VALOR
Caso 3: (tabla )
Varianza poblacional desconocida; n>30
x
Z
S/ n
Paso 4.- Formular la regla de decisión
Paso 5.- Conclusión:
3.2. Para una sola proporción poblacional.

H0 :    0 H0 :    0 H0 :    0
H1 :    0 H1 :    0 H1 :    0
Paso 2.- Niveles de significación. (teórico) ”” α puede ser : 0.01, 0.05, 0.10,etc 
p - π0 P – VALOR (tabla distr.normal)

Zcal =
π 0 (1- π 0 )
n

21
3.3. Diferencia de dos medias poblaciones independientes.

H 0 : 1   2 H 0 : 1   2 H 0 : 1   2
H 1 : 1   2 H 1 : 1   2 H 1 : 1   2
Paso 2.- Niveles de significación. (teórico) ””  α puede ser : 0.01, 0.05, 0.10,etc 

Caso1: Varianzas poblacionales son conocidas Caso2: Varianzas poblacionales desconocidas pero
homogéneas (σ21=σ22)
(x1 - x2 ) - μ0
( x1  x2 )  0
Zcal =
2 2 tcal 
σ1 σ 2 (n1  1) S  (n2  1) S22
2
1 1 
  
1
+
n1 n2 n1  n2  2  n1 n2 
Con (n1+n2 – 2) grados de libertad
El estadístico de prueba tiene distribución normal estándar. P–
Caso 3: Varianzas poblacionales
desconocidas pero no homogéneas t cal =
 x1 - x 2  - μ0 tg
VALOR
(tabla )
2 2
(σ12 distinta de σ22) S1 S2
+
n1 n2
2
 2
S1
2
S2 
 + 
g =
 n1 n2  - 2
2 2
 2
S1   S2
2

Paso 4.- Formular la regla de decisión    
Si el p-valor <  Se rechaza H0  n1
 +
 n2

Si el p-valor ≥  No se rechaza H0 n1 + 1 n2 + 1
En este caso se especifica la hipótesis estadística que no ha sido rechazada indicando el nivel de significancia
teórico considerado (α)
3.4. Diferencia de dos medias poblaciones relacionadas.

H 0 : 1   2 ó  D  0 H 0 : 1   2 ó  D  0 H 0 : 1   2 ó  D  0
H1 : 1   2 ó  D  0 H 1 : 1   2 ó  D  0 H 1 : 1   2 ó  D  0
d
T ~ t(n 1) P – VALOR (tabla distr.”t” student)
Sd / n
Donde:
d: promedio de las diferencia de los valores antes y después
Sd : desviación estándar de las diferencias de los valores antes y después

22
3.5. Diferencia de dos proporciones poblacionales independientes.
H 0 : P1  P2 H 0 : P1  P2 H 0 : P1  P2
H 1 : P1  P2 H 1 : P1  P2 H 1 : P1  P2
(p1 - p 2 )
Zcal = P – VALOR (tabla distr.normal)
 
ˆ
p(1- ˆ  1 + 1 
p)
 n1 n2 
Donde :
ˆ = x1 + x 2 = n1p1 + n2p 2
p
n1 + n2 n1 + n2

23
24

MII MM Separata

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

MII MM Separata

Cargado por

Copyright:

Formatos disponibles

Módulo II

MÓDULO II: NOCIONES DE MUESTREO E INFERENCIA

II. INFERENCIA ESTADÍSTICA……………………………………….. 13

III. APLICACIONES DE LA PRUEBA DE HIPÓTESIS………………. 21

NOCIONES DE MUESTREO E INFERENCIA ESTADÍSTICA

El muestreo es un proceso estadístico en el cual se estudia un fenómeno que afecta a un

La población es el conjunto de todos los individuos que porten información sobre el

Los problemas más corrientes que se presentan en la práctica, cuando se procede a

El estudio de estos aspectos recae sobre la estadística inductiva o inferencial cuya

1.1. Características de las muestras

1. Deberá seleccionarse de manera que sea representativa1 de la población de la cual se

1.2. Ventajas y desventajas del muestreo

A grandes rasgos la aplicación del muestreo es aconsejable principalmente en los

1.3. Tipos de muestreo

1.3.1. Muestreos Probabilísticos

Para su aplicación es necesario los siguientes pasos:

Por ejemplo; en la UE “Guillermo Tell” ubicado en Barrancas, Municipio Cruz Paredes,

El profesor procede a buscar números al azar usando la calculadora, de donde obtiene

B. Muestras por Conglomerados: consiste en sustituir las unidades físicas, elementales

Por ejemplo, el Jefe de la Zona Educativa – Barinas, quiere analizar, el rendimiento en

Entonces, se realiza un listado de todas la Unidades Educativas, donde se imparta 9no

C. Muestras Estratificadas: consiste en dividir la población en subpoblaciones, dentro de

Una manera de obtener una muestra es: N/n = IM; 160/16=10

Procedemos a seleccionar un número entre 1 y 10, tomamos el 3, entonces a = 3

1.3.2. Muestreos No Probabilísticos

A. Muestras a Conveniencia: Es aquella muestra seleccionada de acuerdo a la

B. Muestras Intencionadas o Racionales: Es aquella muestra seleccionada a través del

C. Muestras por Cuotas: Entre los tipos de muestreo no probabilísticos es el más

Para determinar el tamaño de muestra se tiene en cuenta el tipo de población, es decir:

a. Si la población es homogénea se requiere pocos elementos en la muestra y si la

Fórmula de tamaño de muestra para estimar una media aritmética

En la práctica, el valor de la varianza se desconoce.

E: Error absoluto o precisión de la estimación deseada de la media.

El estudio queremos realizarlo mediante una muestra y necesitamos calcular el

Reemplazando valores en la formula se tiene: n = (1.96)²(30)²(1800)

Determinación del tamaño de muestra para estimar una proporción

En la práctica, el valor de la proporción P se desconoce. Para determinar dicho valor

El estudio se realizará mediante una muestra. Calculamos el tamaño de muestra,

En caso de que se desconocer el tamaño de la población N, las fórmulas quedaran

 Para estimar una media aritmética,

2.1.1. Estimación de parámetros

2.1.2. Prueba de hipótesis

2.2. Estimación de parámetros

 Proceso en el cual se determinan las medidas descriptivas poblacionales

2.2.1. Tipo de estimación de parámetros

 La estimación por intervalo

2.2.2. Intervalo de confianza para la media 

 Para explicar el uso de esta forma de estimación se resolverán los ejemplos

Se tiene interés en estimar la altura media de los alumnos de la Facultad de

2.2.3. Intervalo de confianza para la proporción P

 Para explicar el uso de esta forma de estimación se resolverán los ejemplos

2.3.1. Hipótesis estadística

Es una afirmación de lo que se cree sobre una población, es decir, es un supuesto.

2.3.2. Tipos de hipótesis estadística

Existen 2 tipos de hipótesis estadística.

 Hipótesis nula (Ho): también llamada hipótesis de la no diferencia, pues plantea

2.3.3. Nivel de significación: 

Rechazar Error tipo I Decisión

 Para evitarlo, se considera el valor , que fue planteado anteriormente:

 Representa la probabilidad de cometer un error tipo I. Es así que un valor mínimo

 Además existe un valor ß, el cual no se maneja directamente por el investigador.

 y ß están relacionados y ambos disminuyen su valor si se incrementa el tamaño

1-ß= P (rechazar Ho /Ho es falso), también se denomina potencia de prueba. El