Está en la página 1de 10

UNIVERSIDAD DE ORIENTE

NÚCLEO ANZOÁTEGUI
ESCUELA DE CIENCIAS ADMINISTRATIVAS
ESTADÍSTICA II SECCIÓN 01

UNIDAD I .

TEORIA DE MUESTREO Y ESTIMACIÓN

Tutor Bachiller:
Luisa, Guariguata. Guzmán, Daniela
C.I: 28.462.080

Puerto la Cruz, Mayo 2022

Muestreo
Selección de un conjunto de personas o cosas que se consideran
representativas del grupo al que pertenecen, con la finalidad de estudiar o
determinar las características del grupo.

El muestreo es el proceso mediante el cual se selecciona un grupo de


observaciones que pertenecen a una población. Esto, con el fin de realizar un
estudio estadístico.

Tipos de muestreo

Los tipos de muestreo pueden distinguirse en función de distintos criterios. Así,


según la técnica para seleccionar el subgrupo, se pueden diferenciar los siguientes:

Muestreo probabilístico

Las observaciones son seleccionadas en base a la aleatoriedad, es decir, al azar.


En esta categoría podemos encontrar:

Muestreo aleatorio simple:


Todos los individuos de la población tienen la misma probabilidad de ser elegidos como
parte de la muestra. Tiene ventajas, como el hecho de que es fácil de llevar a cabo a través
de sistemas informáticos. Sin embargo, se requiere el listado completo de toda la población
y, si la muestra es muy pequeña, la selección podría no ser representativa.

Sistemático:
Se elige una observación al azar y, para seleccionar el resto de la muestra, se utilizan
intervalos numéricos regulares. Es decir, supongamos que tengo una población de 10.000
y, aleatoriamente, selecciono la observación 600, después de lo cual puedo considerar
intervalos de 30 observaciones. En este caso, tomaría las observaciones 600, 630, 660,
690, 720, 750, 780, y así sucesivamente.

Aleatorio estratificado:
Se divide a la población en estratos, que son grupos que comparten características en
común y son más homogéneos, inclusive, que la población en su conjunto. Entonces, se
selecciona una muestra, ya sea de manera aleatoria o sistemática, dentro de cada estrato.
El objetivo es lograr una representatividad de cada estrato.
Por conglomerados o clústeres:
Consiste en crear grupos más pequeños que la población, los cuales reflejan o comparten
todas las características de esta. Luego, elegimos alguno de los conglomerados como
muestra y lo analizamos de forma detallada.

Muestreo no probabilístico

La selección de la muestra no depende de la probabilidad, sino de la decisión de los


investigadores. Podemos distinguir algunas subcategorías:

● Por conveniencia:
Consiste en que el investigador captará a los sujetos que estén a su disponibilidad.
Por ejemplo, por su proximidad o facilidad de acceso.

● Método opinático o intencional:


El investigador utiliza su juicio o criterio para elegir a quienes van a participar como
parte de la muestra.

● Casual o accidental:
El investigador selecciona sin juicio previo a los individuos que van a formar parte de
la muestra. Por ejemplo, esto suele suceder cuando se hacen encuestas en la calle.

● Bola de nieve:
Consiste en que, después de encontrar al primer sujeto (o primeros sujetos) de la
muestra, el investigador le pide ayuda a él (o ellos) para identificar a otros individuos
con esas mismas características. Se trata de una técnica utilizada cuando es difícil
localizar a un grupo específico por el manejo de datos sensibles, por ejemplo,
migrantes en situación de ilegalidad.

● Por cuotas:
El investigador, tomando en cuenta la composición de la población, y dividiendo por
grupos o estratos, hará una selección proporcional de la muestra. Por ejemplo,
imaginemos que en la población hay un 40% de personas menores de 25 años, 35%
de personas de entre 25 y 50 años, y 25% de individuos con más de 50 años.
Entonces, una muestra de 4.000 personas tendría 1.600 sujetos menores de 25
años, 1.400 de entre 25 y 50 años, y 1.000 adultos mayores de 50 años o más.
Cabe señalar que los individuos que cubrirán cada cuota serán seleccionados por
algún método no probabilístico, es decir, cualquiera de las técnicas explicadas líneas
arriba
Técnicas para seleccionar muestras.
Los métodos de selección de muestras son los métodos específicos que se utilizan
para seleccionar los registros contenidos en una muestra.

Para el muestreo por registros y el muestreo por unidad monetaria, Analytics admite
tres métodos de selección:

● Intervalo fijo:
Con el método de selección del intervalo fijo, se selecciona una unidad
monetaria inicial o un registro, y todas las selecciones posteriores se
encuentran a una distancia o un intervalo fijo; por ejemplo, cada 20ª unidad
monetaria o cada 20º registro, después de la selección inicial.

● Celda:
Con el método de selección por celda, los datos establecidos se dividen en
múltiples celdas o grupos de igual tamaño, y se selecciona una unidad
monetaria, o un registro, de forma aleatoria de cada celda.

● Aleatorio:
Con el método de selección aleatoria, todas las unidades monetarias o
registros se seleccionan aleatoriamente del conjunto de datos completo o de
cada estrato, si es que está utilizando el muestreo de variables clásicas.

Para el muestreo de variables clásicas, la única posibilidad es usar el método de


selección aleatorio.

Teorema del Límite Central.

El teorema central del límite (TCL) es una teoría estadística que establece que,
dada una muestra aleatoria suficientemente grande de la población, la distribución
de las medias muestrales seguirá una distribución normal.
Además, el TCL afirma que a medida que el tamaño de la muestra se incrementa, la
media muestral se acercará a la media de la población. Por tanto, mediante el TCL
podemos definir la distribución de la media muestral de una determinada población
con una varianza conocida. De manera que la distribución seguirá una distribución
normal si el tamaño de la muestra es lo suficientemente grande.

Principales propiedades del teorema central del límite

El teorema central del límite tiene una serie de propiedades de gran utilidad en el
ámbito estadístico y probabilístico. Las principales son:

❖ Si el tamaño de la muestra es suficientemente grande, la distribución de las


medias muestrales seguirá aproximadamente una distribución normal. El TCL
considera una muestra como grande cuando el tamaño de la misma es
superior a 30. Por tanto, si la muestra es superior a 30, la media muestral
tendrá una función de distribución próxima a una normal. Y esto se cumple
independientemente de la forma de distribución con la que estamos
trabajando.

❖ La media poblacional y la media muestral serán iguales. Es decir, la media de


la distribución de todas las medias muestrales será igual a la media del total
de la población.

❖ La varianza de la distribución de las medias muestrales será σ 2/n. Que es la


varianza de la población dividido entre el tamaño de la muestra.

Que la distribución de las medias muestrales se parezca a una normal es


tremendamente útil. Porque la distribución normal es muy fácil de aplicar para
realizar contrastes de hipótesis y construcción de intervalos de confianza. En
estadística que una distribución sea normal es bastante importante, dado que
muchos estadísticos requieren este tipo de distribución. Además, el TCL nos
permitirá hacer inferencia sobre la media poblacional a través de la media muestral.
Y esto es de gran utilidad cuando por falta de medios no podemos recolectar datos
de toda una población.
Ejemplo del teorema central del límite

Imaginemos que queremos analizar las rentabilidades medias históricas del índice S
& P 500, que como sabemos, tiene unas 500 compañías dentro del mismo. Pero no
tenemos suficiente información como para analizar la totalidad de las 500
compañías del índice. En este caso la rentabilidad media del S & P 500 sería la
media poblacional.

Ahora bien, siguiendo al TCL podemos coger una muestra de estas 500 empresas
para realizar el análisis. La única limitación que tenemos es que en la muestra tiene
que haber más de 30 compañías para que se cumpla el teorema. Entonces
imaginemos que cogemos 50 compañías del índice de manera aleatoria y repetimos
el proceso varias veces. Los pasos a seguir del ejemplo serían los siguientes:

● Elegimos la muestra de unas 50 compañías y obtenemos la rentabilidad


media de la totalidad de la muestra.

● De manera continuada seguimos escogiendo 50 compañías y obtenemos la


rentabilidad media.

● La distribución de todas las rentabilidades medias de todas las muestras


escogidas se aproximó a una distribución normal.

● Las rentabilidades medias de todas las muestras seleccionadas se aproximó


a la rentabilidad media del total del índice. Tal y como demuestra el teorema
Central del Límite.

Por tanto mediante inferencia de la rentabilidad media de la muestra podemos


acercarnos a la rentabilidad media del índice.

Estimación

La estimación es la determinación de un elemento o factor. Esto, usualmente


tomando como referencia una base o conjunto de datos.
En otras palabras, la estimación es un cálculo que se realiza a partir de la
evaluación estadística. Dicho estudio suele efectuarse sobre una muestra y no
sobre toda la población objetivo

Para llevar a cabo una estimación, entonces, es necesario primero contar con una
serie de datos. Además, es común que los investigadores se sustenten en un marco
teórico.

Por ejemplo, podemos estimar la inflación definiéndose como la diferencia entre los
precios (de la economía) del periodo A y los precios del periodo B. Entonces, se
calcula una variación porcentual entre los datos registrados en ambos puntos del
tiempo.

Vale aclarar también que la estimación puede efectuarse sin rigurosidad


matemática. Esto suele suceder, por ejemplo, cuando se consulta a algunos
expertos sobre cuánto va a crecer la economía en el presente año. Entonces, sin
haber trabajado un cálculo econométrico, el analista lanza una cifra (o un rango),
posiblemente con base en los indicadores que se vienen observando, como el
consumo de cemento.

Usos de la estimación

La estimación puede ser utilizada para diversos fines como los siguientes:

● Calcular indicadores estadísticos como la media, la mediana y la moda. Esto,


respecto a cualquier variable económica.

● Calcular el valor de una variable determinada con base en otras. Por ejemplo,
estimar la balanza comercial si contamos con los datos de las exportaciones
e importaciones de un país.

● Realizar proyecciones de una variable. Esto puede ser posible a partir de


datos históricos. Por ejemplo, tomando el modelo de las expectativas
adaptativas puede estimarse la inflación esperada por los consumidores en
función a los incrementos de precios en el pasado.
● Calcular el valor contable o valorar un activo, tomando en cuenta que tiene un
periodo de vida útil. Por ejemplo, imaginemos que una maquinaria costó
5.000 euros y se estima que durará cinco años. Entonces, transcurridos
cuatro años solo valdrá una quinta parte, 1.000 euros, debido al desgaste.
Todo, suponiendo que su valor residual sea de 0 euros.

● La estimación, en España, también está muy relacionada al cálculo del


Impuesto sobre la renta de las personas físicas (IRPF)

Tipos de Estimación

a) La estimación puntual

Una estimación es puntual cuando se usa un solo valor extraído de la muestra para
estimar el parámetro desconocido de la población. Al valor usado se le llama
estimador.

b) Estimación por intervalo

Una estimación por intervalo de un parámetro θ es algún par de funciones de la muestra


que satisfacen L(x) ≤ U(x) para todo x ∈ X . El intervalo aleatorio [L(X), U(X)] es
llamado un estimador por intervalo.

c) Estimación bayesiana
El enfoque bayesiano se basa en la interpretación subjetiva de la probabilidad, el
cual considera a ésta como un grado de creencia con respecto a la incertidumbre.

Error Estándar de Estimación.

La desviación estándar de una estimación se denomina error estándar. El error


estándar del coeficiente mide la precisión con la que el modelo estima el valor
desconocido del coeficiente. El error estándar del coeficiente siempre es positivo.

Utilice el error estándar del coeficiente para medir la precisión de la estimación del
coeficiente. Cuanto menor sea el error estándar, más precisa será la estimación. Al
dividir el coeficiente entre su error estándar, se calcula un valor t. Si el valor p
asociado con este estadístico t es menor que el nivel de significancia, usted
concluye que el coeficiente es significativamente diferente de cero.

Por ejemplo, un ingeniero de materiales que trabaja para una fábrica de muebles
desea evaluar la resistencia de los tableros de partículas que utilizan. El ingeniero
recoge datos de rigidez de pedazos de tableros de partículas con diferentes
densidades a diferentes temperaturas y produce la siguiente salida de regresión
lineal. Los errores estándar de los coeficientes están en la tercera columna.

Estimación para: Medias y Proporciones.

INTERVALO DE CONFIANZA PARA LA MEDIA

De una población desconocemos la media m y deseamos estimarla a partir de la


media x obtenida en una muestra de tamaño n

Sabemos que si la población es normal N(m,s) y extraemos de ella muestras de


tamaño n, o sin ser la población normal es n>30,

La distribución muestral de medias es,

por tanto si fijamos una probabilidad 1-a, sabemos que la

es decir, el (1-a)% de las x está a una distancia de m inferior a

Entonces para un nivel de confianza 1-a, m pertenece al intervalo:


Donde za/2 es el llamado valor crítico, valor tal que P(-za/2 £ z £za/2 )=1-a, y x la
media de la muestra.

Si la desviación típica de la población es desconocida, lo que suele ocurrir en la


práctica, la aproximamos por la de la muestra siempre que n>100
7 Tamaño de la Muestra

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

Si deseamos estimar la proporción p con que una determinada característica se da


en una población, a partir de la proporción p' observada en una muestra de tamaño
n, sabemos que

● la distribución muestral de proporciones sigue una distribución normal

con q=1-p. Como la proporción p de la población es desconocida,


se aproxima por la de la muestra siempre que n>100.

● Entonces para un nivel de confianza 1-a, p pertenece al intervalo:

También podría gustarte