Está en la página 1de 18

USAC-CUNOC

DIVISION DE CIENCIAS ECONOMICAS


ADMINISTRACIÓN DE EMPRESAS
CURSO: MÉTODOS CUANTITATIVOS II.
LICDA. VILMA MAZARIEGOS

Documento de apoyo No. 1

MUESTREO, INFERENCIA ESTADÍSTICA Y


PRUEBA DE HIPÓTESIS.

1
TEORIA BASICA DEL MUESTREO
1. INTRODUCCIÓN.
Debido a que los sucesos o eventos que pueden ser objeto de estudio en una investigación,
generalmente implican el estudio de poblaciones numerosas, muy grandes o que tienden al infinito, y
por ello técnicamente resulta poco viable tomar información de todos y cada uno de los elementos o
valores de interés que las integran, o bien porque económicamente no sea rentable, es necesario
tomar información parcial, pero técnicamente consistente, es decir que llene los requisitos de
suficiencia para que con base en ella se pueda arribar a conclusiones válidas para toda la población
objeto de estudio.
Existen técnicas variadas para este propósito, y estas son las técnicas de muestreo. El uso
correcto y adecuado de éstas ayuda a diseñar muestras útiles para obtener la información que se
requiere en el estudio de determinado problema y someter a prueba las hipótesis formuladas.
1.1 DEFINICIONES BASICAS UTILIZADAS EN EL MUESTREO.
1.1.1 Población y/o Universo.

k
p

✓ Es el conjunto de individuos o elementos (personas, documentos, instituciones, objetos)


cualesquiera, los cuales poseen una o más características que se someten a estudio
estadístico. De la población/universo se obtiene la información fundamental para realizar
una investigación. Ésta puede contener varias unidades de análisis según la clase de
información que se necesite y los objetivos que se persiguen en estudio.
✓ Es el conjunto total o colección completa de individuos, objetos, cosas o valores que
integran la totalidad de observaciones posibles o valores de interés del evento o suceso
objeto de estudio, en un proceso de investigación.
Las poblaciones pueden ser: Finitas e Infinitas. Las poblaciones finitas, son los
conjuntos que permiten determinar además del número exacto de elementos o valores de
interés que las integran, el número de resultados muestrales o eventos compuestos que
pueden producir.
Son poblaciones infinitas las que no permiten determinar exactamente el número de
elementos o valores de interés que las integran, ni el número de resultados o eventos
compuestos que se pueden producir.

2
1.1.2 Muestra.

✓ Conjunto de individuos extraídos de una población con el fin de inferir,


mediante su estudio, características de toda la población.

Se dice que una muestra es representativa cuantitativa y cualitativamente cuando, por


la forma en que ha sido seleccionada, aporta garantías suficientes para realizar
inferencias fiables a partir de ella.
El tamaño de la muestra depende de la precisión que se quiera conseguir en la
estimación que se realice a partir de ella. Para su determinación se requieren técnicas
estadísticas, pero resulta sorprendente cómo, con muestras notablemente pequeñas,
se pueden conseguir resultados suficientemente precisos. Por ejemplo, con muestras
de unos pocos miles de personas se puede estimar con muchísima precisión los
resultados de unas votaciones en las que participarán decenas de millones de votantes.
1.1.3 Diseño de la Muestra.
Está en función de los siguientes aspectos:
▪ Los objetivos de la investigación
▪ La variabilidad del fenómeno que se estudia
▪ El nivel de confianza y la precisión con que se desea obtener la información
▪ El tipo de preguntas que se formulan y el tamaño del instrumento de recolección de
datos
▪ Los recursos y el tiempo disponible
▪ El tamaño de la población
1.1.4 Muestreo
▪ Proceso por el cual se seleccionan los individuos que conformarán una muestra. En el
muestreo se utiliza una selección estadística representativa de la población total.
▪ Es la actividad técnica y científica a través de la cual el investigador define los criterios y
procedimientos a seguir, para establecer tanto el número de muestras a tomar de una
población, como el número de elementos que integrarán la o las muestras, y la forma
cómo deben seleccionarse, tomando en consideración que la información que se obtenga
sea consistente y suficiente para inferir o arribar a conclusiones válidas para todos los
elementos o valores de interés de la población objeto de estudio.

3
1.1.5 Estadístico.
▪ Es una medida usada para describir alguna característica de una muestra, tal como
una media aritmética, mediana, desviación estándar, etc.
▪ Es un valor calculado, obtenido con los elementos incluidos en una muestra.
1.1.6 Parámetro.
▪ Es una medida usada para describir alguna característica de una población, tal
como una media aritmética, mediana, desviación estándar. El proceso de
estimación en inferencia estadística puede ser descrito como el proceso de estimar
un parámetro a partir de un estadístico correspondiente, tal como utilizar una media
muestral (un estadístico) para estimar la media de la población (un parámetro).
Los símbolos usados para representar los estadísticos y los parámetros, se
resumen en la siguiente tabla.

Medida Símbolo para el Símbolo p/ el


estadístico parámetro
(muestra) (población)
Media X 
Desviación estándar S 
Número elementos N N
Proporción P P

1.1.7 Censo.
▪ Es la actividad investigativa que implica obtener información de todos los elementos o
sucesos simples y compuestos que integran la totalidad de observaciones o valores de
interés de la población.
▪ Es una indagación completa sobre las variables que interesa investigar, de los elementos
que componen una población claramente definida. Asegura la posibilidad de obtener
datos fehacientes, siempre que no se cometan errores en la recopilación y el tratamiento
de la información. Es bastante difícil realizar un censo, especialmente cuando la
población es muy grande y diversa, su mayor desventaja es su costo elevado.
▪ Se deriva del latín censere, ‘recuento’, y es el recuento o estimación de una población
presente en un área de estudio determinada en un momento concreto. Su objetivo
principal es conocer el número de individuos que componen la población. Debido a las
dificultades metodológicas resulta imposible contar todos los elementos de una población
salvo casos puntuales. Las principales fuentes de datos demográficos son los censos
nacionales, el registro civil y, a partir de la década de 1960, los muestreos a nivel
nacional. Estas fuentes proporcionan el material de base para investigar las causas y las
consecuencias de los cambios en la población. La fuente más habitual es el censo de
población, que contabiliza en un cierto momento todas las personas de un área
determinada, con sus datos personales y características sociales y económicas
específicas. Un registro civil es la contabilización continua, por parte de las
administraciones locales, de los nacimientos, fallecimientos, migraciones, matrimonios y

4
divorcios. Su fiabilidad depende de lo veraces que sean los ciudadanos al proporcionar
los datos.
1.1.8 Encuesta.
Es la actividad mediante la cual se recopila información de un fenómeno específico de
manera parcial o total; también se denomina así al instrumento de recolección de datos.
Aún cuando en las encuestas se utilizan métodos de muestreo probabilístico, están sujetas a
errores potenciales, entre los que se pueden mencionar:
a) Error de cobertura o sesgo en la selección.
Ocurre si se excluyen ciertos grupos de sujetos de las listas de población en la muestra, de
manera que no tienen oportunidad de ser seleccionados.
b) Error de no respuesta
No todas las personas están dispuestas a responder una encuesta. Existen investigaciones
que indican que los individuos de las clases económicas alta y baja tienden a responder con
menos frecuencia que los individuos de clase media.
c) Error Muestral o de Muestreo.
La diferencia entre el valor obtenido de una muestra (un estadístico) y el resultado que
se debió de haber obtenido de la población se llama error muestral o error de muestreo.
Mientras más pequeño es el error muestral, mayor es la precisión de la estimación.
Cuando más grande sea el tamaño de la muestra, menor será el error de muestreo, de
tal modo que al analizar toda la población por medio de un censo, dicho error
desaparece.
Existen tres razones principales para extraer una muestra en lugar de realizar un censo
completo: es más rápida, menos costosa y más eficiente.
d) Error de medición
Cuando se quiere realizar una investigación, se diseña un cuestionario que permita reunir
información importante. Los datos deben ser válidos; es decir, las respuestas “correctas”
deben ser evaluadas y plantearse de manera que arrojen medidas significativas.
Los errores en la medición, son provocados por la redacción ambigua de las preguntas, el
efecto de halo, sucede cuando la persona que responde se siente obligada a complacer al
entrevistador; y errores en la persona que contesta, cuando ésta realiza un esfuerzo muy
grande o muy pequeño para dar sus respuestas.
d) Error Estándar.
Es la desviación estándar de una distribución, en el muestreo de un estadístico, es
frecuentemente llamada error estándar del estadístico. Ejemplo: la desviación estándar
de las medias de todas las muestras posibles del mismo tamaño, extraídas de una
población, es llamada error estándar de la media. Por otro lado, la desviación
estándar de las proporciones de todas las muestras posibles del mismo tamaño,
extraídas de la población, es llamada el error estándar de la proporción. La
diferencia entre los términos “desviación estándar” y “error estándar” es que la primera
se refiere a los valores originales, mientras que la última está relacionada con valores
calculados.

5
1.1.9 Inferencia

En estadística, proceso por el cual se deducen (infieren) propiedades o características


de una población a partir de una muestra significativa. Uno de los aspectos principales
de la inferencia es la estimación de parámetros estadísticos. Por ejemplo, para
averiguar la media de las estaturas de todos los soldados de un reemplazo, se extrae
una muestra y se obtiene su media. La media de la muestra (media muestral), X es un
estimador de la media poblacional, . Si el proceso de muestreo está bien realizado
(es decir, la muestra tiene el tamaño adecuado y ha sido seleccionada aleatoriamente),
entonces el valor de , desconocido, puede ser inferido a partir de X.
La inferencia siempre se realiza en términos aproximados y declarando un cierto nivel
de confianza. Por ejemplo, si en una muestra de n = 500 soldados se obtiene una
estatura media igual a 172 cm, se puede llegar a una conclusión del siguiente tipo: la
estatura media, de todos los soldados del reemplazo está comprendida entre 171 cm y
173 cm, y esta afirmación se realiza con un nivel de confianza de un 90%. (Esto quiere
decir que se acertará en el 90% de los estudios realizados en las mismas condiciones
que éste y en el 10% restante se cometerá error.)
Si se quiere mejorar el nivel de confianza, se deberá aumentar el tamaño de la
muestra. Recíprocamente, si se quiere aumentar la precisión en la estimación
disminuyendo el tamaño del intervalo, entonces hay que aumentar el tamaño de la
muestra o bien consentir un nivel de confianza menor. Finalmente, si se quiere mejorar
tanto la precisión como el nivel de confianza, hay que tomar una muestra
suficientemente grande.
Las Inferencias realizadas mediante muestras seleccionadas aleatoriamente están
sujetas a errores, llamados errores de muestreo, que están controlados. Si la muestra
está mal elegida —no es significativa— se producen errores sistemáticos no
controlados. Para que se puedan obtener conclusiones fiables para la población a
partir de la muestra, es importante tanto su tamaño como el modo en que han sido
seleccionados los individuos que la componen.

1.2. TÉCNICAS DE MUESTREO SEGÚN EL NÚMERO DE MUESTRAS TOMADAS DE LA


POBLACIÓN.
1.2.1 Muestreo Simple.
Consiste en tomar sólo una muestra y con base en los resultados obtenidos de ella, se
tomará la decisión, se emitirá una opinión o se elaborará un informe.
Como condición indispensable, es necesario observar que el tamaño de la muestra
debe ser muy grande o significativamente grande, en relación al tamaño de la población
y el evento simple o compuesto a investigar.
1.2.2 Muestreo Doble.
Significa que podrán tomarse como máximo dos muestras, en forma sucesiva es decir
una posterior a la otra, estableciéndose que si los resultados obtenidos en la primera
muestra orientan en forma consistente al investigador a tomar una decisión a favor o
en contra del proyecto estudiado, deberá hacerlo con la información que posea, si por
el contrario la información obtenida en la primera no le proporciona una base suficiente
y/o consistente, para rechazar o aprobar el proyecto, podrá tomar la segunda muestra.

6
En este tipo de muestreo técnicamente debe observarse que la muestra o muestras no
necesariamente deben ser muy grandes o significativamente grandes, es decir que con
el 30% de la población ya puede esperarse una base informativa consistente, siempre
tomando en cuenta la naturaleza del evento o sucesos a investigar.

1.2.3 Muestreo múltiple.


Con la utilización de este método se establece que para conformar la base de
información para tomar una decisión, el investigador deberá tomar más de dos
muestras ya sea en forma sucesiva o simultánea. El uso de este método implica que
dependiendo del suceso o evento simple o compuesto a investigar, así como la
naturaleza y necesidades de la actividad investigativa, el tamaño de la muestra puede
ser menor del 30% de los elementos de la población.

1.3 TÉCNICAS DE MUESTREO POR LA FORMA DE SELECCIONAR A LOS


ELEMENTOS DE LA MUESTRA.
Básicamente el muestreo se divide en:
▪ No Probabilístico, y
▪ Probabilístico.

1.3.1 MUESTREO NO PROBABILÍSTICO.


1.3.1.1 Muestreo de Juicio.
También se conoce como muestreo de opinión o “a juicio”, y consiste en que los
elementos de la muestra que se constituirán en fuente de información, son
seleccionados según el juicio de uno o más expertos conocedores de las
características de la población, de la naturaleza y necesidades de la investigación, así
como de la o las variables objeto de estudio.
Este es llamado “no probabilístico”, porque es una técnica basada en los puntos de
vista subjetivos de una persona y la teoría de la probabilidad no puede ser utilizada
para medir el error de muestreo. Su empleo lo justifica la comodidad y los bajos costos,
aunque tiene el inconveniente de que los resultados de la muestra no pueden
generalizarse para toda la población.

7
1.3.1.2 Muestreo de Cuotas.
Este tipo de muestreo implica:
▪ Dividir la población en subgrupos o cuotas, según determinadas características:
sexo, religión, edad, etc. Pueden haber combinaciones de cuotas, tales como
hombres mayores de 50 años, mujeres solteras.
▪ En la selección de los casos interviene el criterio del investigador. Con este tipo de
muestreo se intenta tener representatividad del universo estudiado, pero presenta la
limitante que la información obtenida sólo es válida para la muestra.
1.3.1.3 Muestreo Intencional o Selectivo.
En la muestra se tomará en cuenta únicamente a aquellas personas que posean un
conocimiento amplio y claro sobre el fenómeno que se investiga. Esta técnica a pesar
de no ser probabilística presenta la ventaja de obtener datos muy importantes para el
estudio.

1.4 MUESTREO ALEATORIO O PROBABILÍSTICO.


Es conocido también como muestreo aleatorio, lo cual significa que la selección de los
elementos de la muestra, debe hacerse sin que para ello intervenga la voluntad del
investigador.
Todos los elementos de la población tienen la misma probabilidad de ser escogidos.
Esto se obtiene definiendo las características de la población y el tamaño de la
muestra.
De acuerdo con el tamaño de la población o la naturaleza de la investigación el
muestreo aleatorio puede aplicarse en las formas siguientes:
1.4.1 Muestreo Aleatorio Simple.

Todos y cada uno de los elementos de la población tienen la misma probabilidad de ser
seleccionados en la muestra. Para su empleo es necesario contar con un listado de los
elementos de la población (personas, viviendas, empresas, etc) numeras del 1 al N*.
La mala utilización del término “azar o aleatorio”, supone muchas veces en forma
equivocada que toda técnica de selección como un volado de cara o cruz, lo cual dará
como resultado una muestra al azar. Estos malentendidos conducen a que la muestra
esté sesgada.

8
En el muestreo aleatorio simple se usa “n” para representar el tamaño de la muestra y
N para el tamaño de la población. Cada persona o elemento en el marco se numera de
1 a N.
Existen dos métodos básicos para seleccionar muestras: con reemplazo y sin
reemplazo.
El muestreo con reemplazo implica que una vez seleccionada una persona o
elemento, se regresa al marco, donde tiene la misma probabilidad de ser elegida de
nuevo. Se repite el procedimiento hasta alcanzar “n” muestras deseadas. Sin
embargo, suele considerarse más adecuado tener una muestra de personas o
elementos diferentes en lugar de permitir la repetición de mediciones de la misma
persona o elemento.
En el muestreo sin reemplazo no se regresa la persona o elemento al marco una vez
seleccionado y, por lo tanto, no puede elegirse otra vez.
Para seleccionar muestras al azar existen algunas técnicas, entre las que se pueden
mencionar:
▪ Escribir el nombre o asignar un código a cada elemento. Posteriormente, se
concentran en un recipiente del cual se extraerán al azar y en forma aleatoria, uno
por uno hasta completar la muestra. Luego debe elaborarse un listado de los
elementos seleccionados.
▪ Las tablas de números aleatorios. Estas son generadas en forma manual, con una
computadora y/o calculadora, también existen tablas ya elaboradas. Se le asigna a
cada elemento un número de identificación único. Si la muestra es grande se
requiere tener varias tablas con números aleatorios o ampliar el procedimiento
dividiendo cualquier número aleatorio entre el tamaño de la muestra, tomando el
cociente y el número elegido. Al finalizar la selección de los elementos de la
muestra, se elabora una lista con las personas que fueron elegidas.
El muestreo aleatorio simple debe utilizarse cuando los individuos de
la población son homogéneos respecto a las características a estudiar (es decir, a priori no
sabemos si los resultados van a ser muy diferentes por causa de otras variables). Es poco
recomendado cuando la población es muy grande y heterógenea (los individuos presentan
características dispares).

1.4.2 Muestreo Aleatorio Sistemático.


Consiste en obtener los elementos de la muestra de una manera ordenada. La forma
de selección depende del número de elementos incluidos en la población y el tamaño
de la muestra. El procedimiento de selección es el siguiente:
✓ Se debe conocer el tamaño de la población (puede ser aproximado) y de la
muestra,
✓ Se divide el tamaño de la población entre el tamaño de la muestra (N/n) para
obtener el intervalo de selección (i),
✓ Se sortean los números del 1 al tamaño de i para determinar el elemento muestral
a partir del cual se iniciará el conteo de i en i. Esto asegura que el número con que
se inicia la selección fue elegido al azar.

9
Ejemplo; en una población de 5,000 elementos se determinó el tamaño de la muestra y
ésta es de 200 elementos, entonces:

Paso del sistema: N 5000 = 25


n 200
Esto quiere decir, que se elegirá dentro de los primeros 25 números, un número al azar;
a partir de él se elegirán los elementos de la muestra de 25 en 25.
1.4.3 Muestreo por Racimos o Conglomerados.

En este se subdivide la población en grupos o conglomerados con características


plenamente identificables y comunes, tales como ubicación geográfica, idioma, etnia,
región, escolaridad, etc; y si resultan muy grandes, el investigador puede practicar una
estratificación en los conglomerados, y posteriormente en cada uno de ellos aplicar un
muestreo aleatorio simple o sistemático según sea el caso.
Esta forma de muestreo permite obtener representatividad de los distintos estratos que
componen la población y hacer comparaciones entre ellos. Aquí, cada estrato se
considera como una población independiente. Esta técnica es de gran utilidad cuando
los estudios son a gran escala y/o a nivel nacional.
Este tipo de muestreo se le llama también Multietápico, por llevarse a cabo en
diferentes etapas. Su ventaja consiste en el ahorro de tiempo y recursos.
1.4.4 Muestreo Estratificado.
Primero se dividen los individuos o elementos de la población en subpoblaciones
separadas, o estratos, de acuerdo con alguna característica en común. Se realiza un
muestreo aleatorio simple o sistemático en cada estrato y después se combinan los
resultados de las muestras aleatorias separadas.

10
INFERENCIA Y/O INDUCCIÓN ESTADÍSTICA

2. INTRODUCCIÓN

La inferencia estadística es el conjunto de métodos y técnicas que permiten inferir/inducir, a


partir de la información empírica proporcionada por una muestra, cuál es el comportamiento de una
determinada población con un riesgo de error medible en términos de probabilidad.

Los métodos paramétricos de la inferencia estadística se pueden dividir, básicamente, en dos:


estimación de parámetros y métodos de prueba de hipótesis. Ambos se basan en el conocimiento
teórico de la distribución de probabilidad del estadístico muestral que se utiliza como estimador de un
parámetro.

Todos los gerentes deben efectuar estimaciones rápidas. El resultado de ellas puede afectar
las decisiones tomadas en sus empresas. Los jefes del departamento universitario de control
académico realizan estimaciones sobre la matrícula del siguiente año. Los gerentes de crédito
estiman si un cliente pagará la factura en el plazo fijado. Los que desean comprar una casa hacen
estimaciones respecto al comportamiento de las tasas de interés en el mercado de las hipotecas.
Todas estas personas realizan estimaciones sin preocuparse si son científicas, con la única esperanza
de que sus proyecciones guarden una semejanza razonable con los resultados.

Los gerentes recurren a las estimaciones porque en todas sus decisiones menos las más
triviales, deben tomar decisiones racionales sin información completa y con mucha incertidumbre
respecto a lo que les depara el futuro.

La necesidad del uso de los métodos de inferencia estadística se deriva de la necesidad del
muestreo. A medida que una población crece, resulta demasiado costoso y tedioso obtener
información de toda la población. Las decisiones respecto a las características de la población
deben basarse en información que está contenida en una muestra.

2.1 DEFINICIÓN:

❑ Es el proceso de usar resultados muestrales para obtener conclusiones respecto a las


características de la población. Utiliza el razonamiento inductivo ya que deben tomarse los
resultados de una sola muestra y obtener conclusiones acerca de toda la población.

11
❑ Rama de la estadística que se ocupa del uso de los conceptos de la probabilidad para
afrontar la incertidumbre en la toma de decisiones.

❑ Son los métodos que hacen posible la estimación de una característica de la población
objeto de estudio, basada sólo en resultados muestrales.

❑ Es la actividad técnico-científica a través de la cual el investigador utilizando información de


una o más muestras, efectúa la estimación y significación o pruebas de hipótesis acerca de
los valores paramétricos que le son de interés.

2.2 CLASIFICACIÓN.

2.2.1. Estimación Puntual o de Punto:

Asigna características paramétricas a un estadístico, o sea que con base en los valores
de las medidas de tendencia central o de dispersión, correspondientes a una o varias
muestras, extraídas y analizadas en forma técnica y estadísticamente adecuada, el
investigador asume que su valor es igual al del parámetro de la población que según
sea el caso es objeto de estudio.

Consiste en un solo estadístico muestral que se usa para estimar el valor verdadero de
un parámetro de una población, la media muestral X, es una estimación puntual de la
media poblacional .

Un estadístico muestral como X varía de una muestra a otra porque depende de los
elementos seleccionados en la muestra, por lo que debe tomarse en cuenta al
proporcionar un estimador de las características de la población. Para lograrlo se
desarrolla un estimador de intervalo.

2.2.2. Estimación de Intervalo

Tendrá especificada la confianza, o probabilidad de que la estimación del valor


verdadero del parámetro de la población  sea correcta.
2.2.2.1 Estimación de Intervalo o por Intervalo para Medias Aritméticas y
Proporciones.

Es una gama de valores que sirven para estimar el parámetro de una población. Es la
definición de dos valores uno mínimo y uno máximo dentro de los cuales se estima que
se encuentra el verdadero valor del parámetro objeto de interés que está a cierta
distancia de la media poblacional.

Estos límites se hallan calculando primero la media muestral, X. Luego, se suma una
cierta cantidad a X para obtener el LS (límite superior) o L 2, y la misma cantidad se resta
de X para obtener el LI (límite inferior) o L1.

12
2.2.2.2 Ejemplos de estimaciones o estimados.

Parámetros
de la población Tipos de estimación de Estimación de intervalo
Punto
MEDIA
El guatemalteco medio consume El consumo medio mensual de
20 libras de carne al mes. Carne en Guatemala fluctúa
Entre 15 y 20 libras.

Un vehículo recorre en prome- Un vehículo recorre entre 30 y


dio 35 kilómetros por galón de 40 kilómetros por galón de
gasolina gasolina

PROPORCIÓN
El 22% de los residentes en Entre el 18 y 22% de los resi-
Salcajá utiliza transporte públi- dentes en Salcajá utiliza trans-
co para llegar a su trabajo. porte público para llegar a su
trabajo.

La proporción de estudiantes La proporción de estudiantes de


de diversificado que fuman es diversificado que fuman está
del 43% entre el 37 y 49%.

2.3 FACTORES QUE INFLUYEN EN LA AMPLITUD DEL INTERVALO.

a. Efecto de coeficiente Confianza z Amplitud intervalo


de confianza
68% 1.00 /_______/
95% 1.96 /__________/
99% 2.58 /_____________/

b. Efecto del tamaño de Tamaño de


la muestra la muestra Amplitud intervalo

8 /___________________/
16 /________________/
22 /_____________/
64 /__________/

c. Efecto de la dispersión 
De la población
5 /_______/
10 /___________/
15 /_______________/
20 /___________________/

13
En la tabla anterior se puede observar que:
a. Al aumentar el grado de confianza da como resultado una ampliación del intervalo.
b. Un aumento en el tamaño de la muestra provoca que se reduzca el intervalo.
c. La dispersión de la población puede alterar el intervalo: a mayor dispersión, mayor intervalo.

2.4 MÁXIMO ERROR DE ESTIMACIÓN.

Es la cantidad en unidades lineales de los valores individuales, medias aritméticas o de


proporción sobre y bajo el valor paramétrico objeto de interés, que el investigador está
dispuesto a aceptar dentro de los limites en que se hará la estimación de intervalo, se identifica
como “E”.

PRUEBA DE HIPÓTESIS

3. INTRODUCCIÓN

Para cualquier hipótesis, el contraste se basa en establecer un criterio de decisión, que


depende en cada caso de la naturaleza de la población, de la distribución de probabilidad, del
estimador de dicho parámetro y del control que se desea fijar a priori sobre la probabilidad de rechazar
la hipótesis contrastada en el caso de ser ésta cierta.

El análisis de prueba de hipótesis tiene como objetivo comprobar si determinado supuesto


referido a un parámetro poblacional, o a parámetros análogos de dos o más poblaciones, es
compatible con la evidencia empírica contenida en la muestra. Para cualquier prueba de hipótesis, el
contraste se basa en establecer un criterio de decisión, que depende en cada caso de la naturaleza de
la población de la distribución de probabilidad, del estimador de dicho parámetro y del control que se
desea fijar a priori sobre la probabilidad de rechazar la hipótesis contrastada en el caso de ser ésta
cierta.

Generalmente, una prueba de hipótesis inicia con alguna teoría, declaración o aseveración
relativa a cierto parámetro de una población. Por ejemplo: con propósitos de análisis estadístico, el
gerente de operaciones de la compañía de cereales elige como hipótesis inicial que el proceso opera
de manera adecuada; es decir, que el llenado promedio es 368 gramos y no se necesita acción
correctiva.

3.1 CLASIFICACION

La hipótesis de que el parámetro poblacional es igual a la especificación de la compañía recibe


el nombre de hipótesis nula. Una hipótesis nula siempre es la del estado actual o la que asegura que
no hay diferencia. Comúnmente se identifica con H o. El gerente de operaciones establece como su
hipótesis nula que la operación del proceso de llenado es adecuada, que el llenado medio por caja es
la especificación de 368 gramos. Esto se puede expresar como:

Ho:  = 368

Observe que aunque el gerente de operaciones cuenta sólo con la información de una
muestra, la hipótesis nula se escribe en términos del parámetro de población. Esto se debe a que
está interesado en todo el proceso de llenado, (la población de) todas las cajas de cereal que se

14
llenan. El estadístico muestral se utilizará para hacer inferencias sobre el proceso completo. Una
de estas inferencias puede ser que los resultados observados en los datos de la muestra indican que
la hipótesis nula es falsa. Al suceder ésto, algo más debe ser cierto. Para prever esta posibilidad,
siempre que se especifica una hipótesis nula debe establecerse una hipótesis alternativa, o una
que debe ser cierta si la hipótesis nula es falsa. La hipótesis alternativa H 1 es el opuesto de la
hipótesis nula Ho. La cual se expresa así:

Ha:   368

La hipótesis alternativa representa la conclusión de rechazar la hipótesis nula si existe


suficiente evidencia en la información de la muestra para decidir que no es probable que la hipótesis
nula sea cierta. Si los pesos de las cajas de la muestra son suficientemente menores o mayores que
el promedio esperado de 368 gramos especificado por la compañía, el gerente rechaza la hipótesis
nula a favor de la alternativa, que dice que la cantidad promedio de llenado es diferente a 368
gramos.

La metodología de la prueba de hipótesis está diseñada para que el rechazo de la hipótesis


nula se base en la evidencia de la muestra de que es mucho más probable que la hipótesis alternativa
sea cierta. No rechazar la hipótesis nula no es prueba de que sea cierta. Nunca se podrá probar que
la hipótesis nula es correcta, porque la decisión se basa sólo en la información de la muestra, no en
toda la población. Por lo tanto, si no se rechaza la hipótesis nula, sólo se puede concluir que existe
evidencia insuficiente para garantizar su rechazo.

3.2 CARACTERISTICAS

✓ La hipótesis nula Ho, siempre se refiere a un valor específico del parámetro de población (como ),
no al estadístico muestral (como X).
✓ La expresión de la hipótesis nula siempre contiene un signo igual respecto al valor especificado del
parámetro de población (Ho: =368 gramos).
✓ La expresión de la hipótesis alternativa nunca contiene un signo igual respecto al valor
especificado de parámetro de población (H1:  368)

3.3 VALOR CRÍTICO DEL ESTADÍSTICO DE PRUEBA

Se puede desarrollar una lógica que respalda la metodología de la prueba de hipótesis si se


examina cómo puede usarse sólo información muestral para determinar si la hipótesis nula es
admisible.

Aún cuando la hipótesis nula sea cierta en realidad, es probable que el estadístico difiera del
valor del parámetro real debido al azar o a un error de muestreo. En estas circunstancias se espera
que el estadístico muestral sea cercano al parámetro de población. En esta situación no habrá
suficiente evidencia para rechazar la hipótesis nula. Por otro lado, si existe gran discrepancia entre el
valor del estadístico y su parámetro hipotético correspondiente, sería instintivo concluir que es poco
probable que la hipótesis nula sea cierta. En cualquier caso, se llega a una decisión debido a la
creencia de que una muestra seleccionada al azar es en verdad representativa de la población de
donde se obtuvo.

15
El proceso de toma de decisiones no siempre es claro y directo y no se puede dejar al juicio
subjetivo de una persona el significado de “muy cercano” o “muy diferente”. Determinar qué es
cercano y qué es diferente es bastante arbitrario y no tiene una definición clara. La metodología de
prueba de hipótesis proporciona definiciones explícitas para evaluar esas diferencias y permite
cuantificar el proceso de toma de decisiones de modo que la probabilidad de obtener un resultado
dado de la muestra se puede encontrar si la hipótesis nula es cierta. Esto se logra al determinar
primero la distribución muestral para el estadístico muestral de interés (como la media muestral) y
después calcular el estadístico de prueba específico basado en el resultado de la muestra. Debido a
que la distribución muestral del estadístico de prueba con frecuencia sigue una distribución normal, ser
puede usar esta distribución para determinar la probabilidad de que una hipótesis nula sea cierta. |

3.4 PASOS PARA REALIZAR UN ANÁLISIS DE PRUEBA DE HIPÓTESIS.

✓ Establecer la hipótesis nula (Ho). Esta debe expresarse en términos estadísticos.

✓ Establecer la hipótesis alternativa (H1). También debe expresarse en términos estadísticos.

✓ Definir los criterios de prueba:


o Delimitación del área de aceptación y rechazo

✓ Determinar la técnica estadística de prueba y el estadístico de prueba correspondiente que se


utilizará.

✓ Determinar si el estadístico de prueba está en la región de rechazo o de no rechazo.

✓ Tomar una decisión estadística. Si el estadístico de prueba está en la región de no rechazo, la


hipótesis nula no se puede rechazar. Si está en la región de rechazo, la hipótesis nula se rechaza.

3.5 PLANTEAMIENTO DE HIPÓTESIS PARA MUESTRAS

Sea la edad promedio de los estudiantes del 7º. Semestre de la carrera de 25 años.

a) “La edad promedio de los estudiantes es de 25 años”


Ho: µ = 25 años
Ha: µ ≠ 25 años

b) “La edad promedio de los estudiantes es como mínimo de 25 años”


Ho: µ = 25 años ()
Ha: µ  25 años

c) “La edad promedio de los estudiantes es como máximo de 25 años”


Ho: µ = 25 años ()
Ha: µ  25 años

16
3.6 PLANTEAMIENTO DE HIPÓTESIS PARA PROPORCIONES

Sea el parámetro a investigar la edad promedio de los estudiantes inscritos en el 2009, igual a 25
años.

a) La proporción de estudiantes que tiene 25 años es del 75%.


Ho: P = 75 %
Ha: P ≠ 75 %
b) La proporción de estudiantes que tienen 25 años es como mínimo del 75%.
Ho: P = 75 % ()
Ha: P  75%

c) La proporción de estudiantes que tienen 25 años es como máximo del 75%.


Ho: P = 75 % ()
Ha: P  75%

17
18

También podría gustarte