Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Trabajo IV Unidad
Trabajo IV Unidad
Administración
Estadistica II
Distribu
ción en
el
muestr
Profesor: Participantes:
eo
MSc. Alays Díaz Astrid Ortiz C.I: 17.959.999
Tipos de muestreo..............................................................................................6
Muestreo no probabilístico:............................................................................6
- Muestreo discrecional:..............................................................................6
- Muestreo sistemático:................................................................................8
- Muestreo estratificado:.............................................................................8
Errores en el muestreo...................................................................................9
Distribución X2.................................................................................................10
Error estándar.................................................................................................17
Introducción.
Cuando hablamos de muestreo nos referimos al proceso por el que generamos las
muestras. Una muestra es una parte (un subconjunto) de la población, y se desea que la
muestra sea lo más representativa posible de la población de la que procede. Sin embargo,
por muy cuidadosa que sea la selección de la muestra difícilmente será una representación
exacta de la población. Esto significa que su tendencia central, variabilidad, etc.,
aproximarán las de la población, pero habrá cierta diferencia, que interesa sea lo menor
posible.
Las muestras singulares generadas para investigación con sujetos suelen utilizarse
para obtener algunos estadísticos (Media, proporción, varianza, etc.) con los que se realiza el
proceso de inferencia. En cambio, las muestras simuladas por ordenador suelen ser utilizadas
para obtener distribuciones muestrales y realizar inferencia. Esto es de interés cuando se dan
circunstancias especiales que no aconsejan utilizar los procedimientos habituales.
En lo que se refiere al uso de las encuestas como complemento del censo, se tienen la
experiencia de los Estados Unidos en el año de 1940 en que, en una muestra de un 5%, se
incluyeron preguntas sobre ocupación, tamaño de la familia, fertilidad, entre otras variables.
En el año de 1950 se repitió el ejercicio. pero con una muestra que contemplaba al
20% de la población; y de esta muestra, se seleccionó una submuestra del 3.3% para
investigar cuestiones relacionadas con el matrimonio y la fertilidad.
Este procedimiento se repitió en los censos de 1960 y 1970, Y salvo excepciones para
ciertas variables en que se requería información por persona, el censo se realiza en base a
muestreo. Otros campos en donde el muestreo de encuestas ha tenido gran aceptación son: la
investigación de mercados, estimación de audiencia en programas de radio y televisión,
reacción del público sobre la aceptación de nuevos productos, preferencias electorales,
control de calidad, etc.
Hay muchas maneras de elegir una muestra de una población, Pero antes de pasar a
analizar dichas formas de extracción de muestras, lo que si hemos de dejar claro es que
todas las muestras han de cumplir varias condiciones indispensables.
Es evidente que para que el estudio a realizar sea fiable, hay que cuidar mucho la
elección de la muestra, para que represente en la medida de lo posible a la población de la
que se extrae. Si la muestra está mal elegida, diremos que no es representativa. En este caso,
se pueden producir errores imprevistos e incontrolados. Dichos errores se denominan sesgos
y diremos que la muestra está sesgada.
Una de las condiciones para que una muestra sea representativa es que el sistema que
se utilice para elegirla sea aleatorio, es decir, que todos los individuos de la población tengan
las mismas posibilidades de ser elegidos, mientras que, si la elección de la muestra es
subjetiva, es probable que resulte sesgada.
5
Tipos de muestreo
Las distintas maneras de elegir una muestra de una población se denominan
muestreos y básicamente hay dos tipos de muestreos:
6
Este tipo de muestreo se caracteriza por su simplicidad y fácil comprensión, aunque
también posee algunas limitaciones, ya que no siempre es posible disponer de una lista de
todos los individuos que componen la población, generalmente cuando son poblaciones
grandes. Si se seleccionan muestras pequeñas mediante este método pueden aparecer errores
aleatorios, no representando la muestra adecuadamente a la población. Un ejemplo de
muestreo aleatorio simple sería la elección de los individuos a través de la elección realizada
totalmente al azar de un cierto número de DNI.
Hay dos tipos de muestreo aleatorio simple: el muestreo con reemplazo y sin
reemplazo. En el muestreo con reemplazo, después de que un elemento ha sido seleccionado
de entre el marco de la muestra se devuelve y es elegible para ser seleccionado de nuevo.
7
- Muestreo sistemático: En el que se elige un individuo al azar y a partir de ´el, a
intervalos constantes, se eligen los demás hasta completar la muestra.
El muestreo sistemático es muy similar al muestreo aleatorio simple. La diferencia se
obtiene en que en este tipo de muestreo se divide el total de la población de estudio
entre el tamaño de la muestra, obteniendo una constante de muestreo (k). La primera
unidad que formará parte de la muestra debe estar entre 1 y k y se elige al azar; a
partir de esta unidad se van seleccionando sistemáticamente uno de los k individuos
siguiendo un orden determinado. Por ejemplo, si obtenemos un valor de k=10 y
seleccionamos al azar el número 6, deberíamos elegir todas las historias clínicas que
finalizaran en «6»: «006», «016», «026» .... Es un método de muestreo muy sencillo
de realizar y que cuando la población esta ordenada siguiendo una tendencia
conocida, asegura una cobertura de unidades de todos los tipos. La principal
limitación es que si la constante se asocia al fenómeno de interés puede cometerse un
sesgo.
8
Errores en el muestreo
Además, debemos asumir que un error en el muestreo ocasionaría que los
resultados que proporcione la muestra no coincidan o estén alejados de los valores
reales de la población. Pueden darse dos tipos de errores:
Error aleatorio muestral: Para reducir este error hay que aumentar el tamaño de la
muestra.
Error sistemático o Sesgo. Va asociado al proceso de selección de la muestra y se
reduce mejorando esta selección.
9
Supongamos que se desea hacer inferencia sobre un valor de la población como puede
ser una proporción (por ejemplo: la prevalencia de diabetes en la población) o una media
(ejemplo: la media de colesterol en la población).
Para estimar una proporción Para estimar una proporción debemos tener una idea
aproximada del parámetro que queremos medir. Se puede obtener a partir de estudios pilotos
o una revisión de la literatura. Generalmente, ante la imposibilidad de disponer de
información de referencia se utiliza el valor de 0,5 (50%), proporción con la que se obtiene el
tamaño muestral máximo necesario (llamado el criterio de la máxima indeterminación).
Cuando queremos estimar una proporción, debemos elegir la precisión (e) que se quiere
obtener para determinar el parámetro que queremos medir, de manera que ésta sea la
oscilación mínima del valor a estimar, o lo que es lo mismo, decir su intervalo de confianza.
El tamaño muestral necesario para la estimación de una proporción se obtendría como:
2
Distribución X
En realidad, la distribución ji-cuadrada es la distribución muestral de s2. O sea, que si
se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula
su varianza, se obtendrá la distribución muestral de varianzas.
10
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el
estadístico X2. Si se elige una muestra de tamaño n de una población normal con
varianza , el estadístico:
11
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor
(n-3) = (gl-2).
12
inferior a 30 elementos, es decir, n < 30, y, a partir de 30 observaciones, la distribución t se
parece mucho a la distribución normal y, por tanto, utilizaremos la distribución normal.
13
Distribución “F” de Fisher
La distribución F o distribución de Fisher-Snedecor es la que se usa para comparar
las varianzas de dos poblaciones diferentes o independientes, cada una de las cuales sigue
una distribución normal.
Dicha variable auxiliar puede ser directamente el cociente de las varianzas muestrales
de cada población, en cuyo caso, si dicho cociente es cercano a la unidad, se tiene evidencia
que ambas poblaciones tienen varianzas semejantes.
Se sabe que la distribución ji-cuadrada con (n-1) grados de libertad es la que sigue la
variable auxiliar (o estadístico) que se define a continuación:
14
Por lo tanto, el estadístico F sigue una distribución teórica dada por la siguiente
fórmula:
El cociente definido de esta forma es una nueva distribución de probabilidad, conocida como
distribución F con d1 grados de libertad en el numerador y d2 grados de libertad en el
denominador.
15
Dada una población constituida por un número n de elementos, cuya media
aritmética es m y donde la desviación típica viene dada s, pueden formarse n2 muestras con
reemplazamiento distintas, formadas por dos elementos de la población.
Para cada una de estas muestras es posible una media muestral, que denotaremos con
el símbolo . Un ejemplo de la tabla de muestras de tamaño 2, tomada de la población {1, 3,
5}, con sus medias aritméticas reflejadas, sería:
desviación estándar 1 , y la segunda con media 2 y desviación estándar 2. Más aún, se
elige una muestra aleatoria de tamaño n1 de la primera población y una muestra
independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral
para cada muestra y la diferencia entre dichas medias. La colección de todas esas diferencias
se llama distribución muestral de las diferencias entre medias o la distribución muestral del
estadístico
16
Diferencia de proporciones
Educación: ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que
las de los que aprueban inglés?
Medicina: ¿Es menor el porcentaje de los usuarios del medicamento A que presentan
una reacción adversa que el de los usuarios del fármaco B que también presentan una
reacción de ese tipo?
Administración: ¿Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales?
Ingeniería: ¿Existe diferencia entre la proporción de artículos defectuosos que genera
la máquina A a los que genera la máquina B?
17
Error estándar
El Error estándar es el término utilizado para referirse a una estimación de la
desviación estándar, derivado de una muestra especial utilizada para calcular la estimación en
las estadísticas. En la más común, error estándar es un proceso de estimación de la
desviación estándar de la distribución de muestreo asociada con el método de estimación
18
En aplicaciones prácticas, el verdadero valor de la desviación estándar (o del error) es
generalmente desconocido. Como resultado, el término "error estándar" se usa a veces para
referirse a una estimación de esta cantidad desconocida. En tales casos es importante tener
claro de dónde proviene, ya que el error estándar es sólo una estimación.
Desafortunadamente, esto no es siempre posible y puede ser mejor usar una aproximación
que evite usar el error estándar, por ejemplo, usando la estimación de máxima verosimilitud o
una aproximación más formal derivada de los intervalos de confianza. Un caso bien conocido
donde se pueda usar de forma apropiada puede ser en la distribución t de Student, para
proporcionar un intervalo de confianza para una media estimada o diferencia de medias. En
otros casos, el error estándar puede ser usado para proveer una indicación del tamaño de la
incertidumbre, pero su uso formal o semi-formal para proporcionar intervalos de confianza o
test debe ser evitado a menos que el tamaño de la muestra sea al menos moderadamente
grande. Aquí el concepto "grande" dependerá de las cantidades particulares que vayan a ser
analizadas.
Donde:
σ es la desviación estándar de la población
n es el tamaño (número de observaciones) de la muestra.
El error estándar de la regresión es el valor que muestra la diferencia entre los valores
reales y los estimados de una regresión. Es utilizado para valorar si existe una correlación
entre la regresión y los valores medidos. Muchos autores prefieren este dato a otros como el
coeficiente de correlación lineal, ya que el error estándar se mide en las mismas unidades que
los valores que se estudian. La fórmula sería:
19
20
Conclusión
El uso de estos métodos de muestreo, como su propio nombre indica, nos ayuda a
obtener información fiable de la población a partir de una muestra de la que extraer
inferencias estadísticas con un margen de error medido en términos de probabilidades.
Sin embargo, todavía hoy sigue siendo una de las áreas más débiles dentro de la
Estadística, dado que son pocas las personas que están especializadas en esta materia.
El muestro es una herramienta útil y veraz, hay diferentes tipos de muestreo, cada
una adaptable para cada vez que sea necesaria su utilidad. En algunos casos no es posible
conocer qué margen de error vamos a tener en un estudio, cuando empleamos muestreo no
probabilístico.
Question pro. Editores del sitio web. Muestreo aleatorio simple. (enero de 2020)
Recuperado en: https://www.questionpro.com/blog/es/muestreo-aleatorio-simple/
Link fang. Editores de la web. Error estándar. (marzo de 2020). Recuperado en:
https://es.linkfang.org/wiki/Error_est%C3%A1ndar