Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA INFERENCIAL
1
Estadística inferencial
ACTIVIDAD 2
ELABORADO POR:
JULIAN ANDRES LABRADOR GARCIA ID: 621597
ANGIE LORENA ORTIZ ID 622672
PRESENTADO A:
LUIS ARIEL NINCO NINCO
NRC: 9190
2
Estadística inferencial
TABLA DE CONTENIDO
Pag
1. Introducción…………… ………………………………………………..…………….….4
2. Objetivos………………………………………………………………………...……..….5
2.1. Objetivo general………………………………………………………………….….…5
2.2. Objetivos específicos…………………………………………………………….….…5
3. Marco teórico……………………………………………………………………...………6
4. Completar el cuadro con las definiciones y un ejemplo de cada uno………………8
4.1. TIPOS DE MUESTREO NO PROBABILISTICO
a Juicio ……………………………………………………………………………….8
por conveniencia …………………………………………………………………. 10
voluntario ………………………………………………………………………… 13
4.2. TIPOS DE MUESTREO PROBABILISTICO
Aleatorio Simple ………………………………………………………………… 17
Sistemático …………………………………………………………………………20
Estratificado ……………………………………………………………………….,23
Por Conglomerados…………………………………………………………….….27
5. Conclusiones…………………………………………………………………………….31
6. Bibliografía……………………………………………………………..………..…….. 32
3
Estadística inferencial
1. INTRODUCCION
En este trabajo podremos encontrar definiciones de los tipos del muestreo, para
poder comprender ¿cómo funcionan?, ¿para qué nos sirven? y ¿por qué son tan
importantes para nuestra sociedad?, además es una gran oportunidad de adquirir y
entender conceptos.
4
Estadística inferencial
2. OBJETIVOS
5
Estadística inferencial
3. MARCO TEÓRICO
Uno de los problemas que se enfrenta cuando se hace estadística es la obtención
de datos. Los datos no ocurren, es necesario recolectarlos. Es importante obtener
datos con veracidad, puesto que estos nos darán los resultados y conclusiones
esperadas.
Partiendo de lo anterior es importante rescatar dentro de los tipos de muestra
conceptos como:
Una población es el conjunto de todos los elementos que interesan en un estudio.
El tamaño de la población, N, puede ser muy grande o incluso infinito.
Una muestra es un subconjunto observado de valores poblacionales que tiene un
tamaño muestral que viene dado por n.
Muestreo sesgado: Es el muestreo que produce valores que difieren
sistemáticamente de la población que está siendo muestreada. Este muestreo se
clasifica en dos tipos, muestra por conveniencia y ocurre cuando es posible acceder
fácilmente a los elementos de una población de la que se elige la muestra. Muestra
de voluntarios, consta de resultados colectados a partir de los elementos de la
población que contribuyen por su propia iniciativa.
Marco muestral: Es una lista de los elementos que pertenecen a la población de la
cual se obtendrá la muestra.
Muestra de juicio: Las muestras son elegidas con base en el hecho de que son
típicas. –
Muestra probabilística: Es la muestra en la que los elementos a seleccionar se
obtienen con base en la probabilidad. Cada elemento de una población tiene cierta
probabilidad de ser elegido como parte de la muestra.
Muestra aleatoria simple: Una muestra es seleccionada de modo que todos los
elementos de la población tienen la misma probabilidad de ser elegidos. Las
muestras aleatorias simples se obtienen por muestreo con reemplazo en una
población finita o por muestreo sin reemplazo en una población infinita.
Muestra sistemática: Muestra en la cual se selecciona todo k – èsimo elemento del
marco muestral, empezando con un primer elemento que se elige de manera
aleatoria. Para seleccionar una muestra sistemática al x%, primero se selecciona 1
elemento de los primeros x 100 elementos, y luego a partir de ahí se procede a
seleccionar todo x 100 - ésimo elemento hasta que se cuenta con el número de
datos que se desea tener en la muestra.
Muestra aleatoria estratificada: Muestra que se obtiene al estratificar el marco
muestral y luego seleccionar un número fijo de elementos de cada uno de los
estratos por promedio de una técnica de muestreo aleatorio simple.
6
Estadística inferencial
7
Estadística inferencial
Este tipo de muestreo es más efectivo en situaciones en las que sólo hay un número
restringido de personas que poseen cualidades que un investigador espera de la
población objetivo. Los investigadores prefieren implementar el muestreo
deliberado, crítico o por juicio cuando sienten que otras técnicas de muestreo
consumirán más tiempo y confían en su conocimiento para seleccionar una muestra
para llevar a cabo la investigación.
Por ejemplo, en situaciones en las que un investigador lleva a cabo un muestreo por
conveniencia para recolectar retroalimentación de los profesores sobre su
universidad, pero el hecho de que hay altas probabilidades de que los resultados
sean sesgados, los investigadores prefieren un muestreo deliberado, crítico o por
juicio para seleccionar a aquellos profesores que proporcionarán 100% de
retroalimentación sobre la universidad.
Considere un escenario en el que se desean entender los factores que llevan a una
persona a seleccionar el hacking ético como profesión. El hacking ético es una
habilidad que ha atraído recientemente a la juventud. Cada vez más gente lo
selecciona como profesión. Los investigadores que entiendan lo que es el hacking
ético podrán decidir quién debe formar la muestra para reconocerla como profesión.
9
Estadística inferencial
Hay muchas tribus en el mundo que tienen sus propias creencias religiosas. Para
los investigadores que planean estudiar la cultura un país en particular, se aconseja
que seleccionen estratos utilizando un muestreo deliberado, crítico o por juicio, ya
que las creencias religiosas se consideran altamente sensibles. Debido a la
sensibilidad del tema, si se crean muestras de aquellos que tienen el conocimiento
apropiado y se lleva a cabo la investigación con esas muestras, los resultados serán
altamente precisos. Las técnicas de muestreo probabilístico a menudo producen
resultados alterados en tales casos.
Resultados casi en tiempo real: Se puede realizar una encuesta o sondeo rápido
con la muestra utilizando un muestreo deliberado, crítico o por juicio, ya que los
miembros de la muestra poseerán el conocimiento y la comprensión acorde al tema.
POR CONVENIENCIA
10
Estadística inferencial
Esta técnica se utiliza cuando no existen criterios que deban considerarse para que
una persona pueda ser parte de la muestra. Cada elemento de la población puede
ser un participante y es elegible para ser parte de la muestra. Estos participantes
comúnmente dependen de la proximidad al investigador.
Por ejemplo, en una escuela a veces hay situaciones en las que un docente
selecciona las primeras dos filas para participar en la competencia, este es un tipo
de ejemplo en cuanto a la proximidad. O también otro ejemplo podría ser cuando
una ONG selecciona las 20 mejores ciudades para que presten sus servicios en
función de la proximidad de su base.
Durante las etapas iniciales de una investigación, los investigadores suelen preferir
utilizar el muestreo por conveniencia ya que con este método es más rápido y fácil
obtener resultados.
11
Estadística inferencial
Método rápido para recopilar datos: Las reglas para reunir elementos o
participantes para la muestra son menos complicados en comparación con otros
métodos de investigación, como por ejemplo el muestreo aleatorio simple,
el muestreo estratificado o el muestreo sistemático. Debido a la simplicidad de este
tipo de muestreo, la recopilación de datos suele tomar un tiempo mínimo.
Un ejemplo de uso de muestreo por conveniencia puede ser este: Imagina que los
voluntarios de la ONG necesitan realizar encuestas a mujeres pero no tienen acceso
a muchas, pero necesitan obtener los resultados lo más rápido posible, lo que los
voluntarios pueden hacer es ir a escuelas, universidades, oficinas, etc., y hablar con
las mujeres que estén presentes sin tener una lista en la mano.
El sesgo puede hacer que toda una muestra sea inútil y definitivamente eso es lo
último que un investigador necesita, es por eso que te recomiendo hacer uso de
ambas técnicas de muestreo para obtener los resultados que estás buscando.
12
Estadística inferencial
VOLUNTARIADO
El muestreo voluntario es un tipo de muestreo no probabilístico, formado por
participantes seleccionados por el investigador. Sin embargo, este método produce
un sesgo de respuesta, ya que los miembros son auto-seleccionados.
¿Cuáles son sus principales características y cómo saber si está entre los tipos de
muestreo que necesitas?
A menudo, nos encontramos con encuestas en las redes sociales sobre asuntos
relacionados con el aborto, políticas de inmigración, igualdad de derechos, etc. No
se contacta directamente a los encuestados, ni se les insta a responder. Depende
de la voluntad del individuo y de su conocimiento sobre el tema para participar en el
estudio.
Los factores que animan a una persona a responder una encuesta son, en su
mayoría, la facilidad de dar su respuesta, una opinión firme sobre el tema, razones
éticas, etc.
13
Estadística inferencial
Es posible que las personas que tengan una opinión diferente o neutral sobre el
tema no puedan participar en el estudio, ya que no siguen los programas de radio y
televisión.
Este método, sin embargo, puede ser utilizado por presentadores de programas de
televisión o de radio que deseen afirmar su opinión sobre temas específicos en los
que los voluntarios también tienden a inclinarse hacia la misma opinión que el
presentador.
14
Estadística inferencial
Las organizaciones utilizan este método como una herramienta de marketing para
anunciar sus productos. El muestreo voluntario puede aumentar potencialmente el
conocimiento de tu marca y convertir a tus clientes existentes tus defensores.
Mantén tus preguntas cortas y claras: La mitad de la batalla para evitar el sesgo
de respuesta se gana haciendo las preguntas correctas. Una pregunta claramente
entendida es más probable que sea contestada correctamente en comparación con
una pregunta larga y complicada.
Para la pregunta, “¿estás contento con el producto o servicio? en lugar de dar una
opción de sí/no, dales una variedad de opciones para capturar los datos con mayor
precisión. Los ejemplos de respuestas pueden ser: “Me gusta usar este
producto/servicio”, “Este producto/servicio satisface mis necesidades”, “Ojalá
pudiera sacar más provecho del producto/servicio”, “El producto/servicio está por
debajo de mis expectativas”.
Ofrece opciones de respuesta simples y claras: Al igual que con las preguntas
simples y directas, mantén las opciones de respuesta simples también. Los
encuestados tenderán a responder mejor a las preguntas si tienen ante sí opciones
fáciles de contestar.
15
Estadística inferencial
VENTAJAS DESVENTAJAS
Es una manera sencilla de realizar No hay control sobre la muestra
un estudio Los datos son inexactos
Es barato Las respuestas son sesgadas
Los datos son fáciles de recopilar No es aconsejable hacer
Es de fácil acceso inferencias
Requiere poco esfuerzo por parte Favorece un cierto resultado
del investigador Puede provocar crear una
Tiene la posibilidad de encuesta imparcial
proporcionar información rica y El resultado es influenciado
cualitativa por el investigador, lo cual afecta
Mínimo esfuerzo requerido la fiabilidad del estudio
Una manera de asegurar que el muestreo voluntario tenga una oportunidad justa de
reflejar la población es aplicar la aleatoriedad. El método aleatorio más básico es el
muestreo aleatorio simple. Significa que cada miembro de la población tiene las
mismas oportunidades de ser elegido.
16
Estadística inferencial
ALEATORIO SIMPLE
El muestreo aleatorio simple es una técnica de muestreo en la que todos los
elementos que forman el universo - y que por lo tanto están incluidos en el marco
muestral - tienen idéntica probabilidad de ser seleccionados para la muestra. El
proceso de muestreo que emplea esta técnica es equivalente a hacer un sorteo
entre los individuos del universo: asignamos a cada persona un boleto, introducimos
los boletos en una urna y empezamos a extraer boletos al azar. Todos los individuos
que tengan un boleto extraído de la urna formarían la muestra. Obviamente, en la
17
Estadística inferencial
La pregunta obvia que puedes plantearte es, ¿qué es mejor, usar reposición o no
usala? Responderemos esta pregunta un poco más abajo, pero antes, revisemos
qué precisión logra el muestreo aleatorio simple con reposición para un tamaño de
muestra dado y, alternativamente, qué tamaño de muestra necesito para garantizar
cierta precisión.
Una muestra seleccionada de esta forma tiene una propiedad muy útil: la media de
cualquier variable que midamos en la muestra se parecerá a la media calculada en
el total de la población. Y se parecerá de una forma muy concreta: la media en la
muestra seguirá una distribución normal centrada en la media poblacional y con
varianza igual a la varianza poblacional dividida por el tamaño de la muestra n. Esta
relación entre muestra y población se conoce como teorema central del límite.
Tienes una explicación detallada en este otro post, pero te lo resumimos aquí:
gracias a esta propiedad (es decir, a que sabemos cómo se relaciona la media de la
muestra con la de la población) podemos calcular la probabilidad de que la media de
18
Estadística inferencial
la muestra esté dentro de un intervalo de valores. Y esto nos permite saber qué
error máximo vamos a tener cuando usamos la media de la muestra como
estimación de la media de la población. En concreto, se cumple que
e ≤ZNC
σ√ n
donde:
- e es el error máximo que vamos a tener (máxima diferencia entre la media de la
muestra y la media de la población).
- ZNC es el valor crítico de corte de una distribución de probabilidad normal para
un nivel de confianza NC.
- σ es la desviación típica (=raiz de la varianza) de la variable que nos interesa en la
población.
- n es el tamaño de muestra.
Si invertimos esta expresión, podemos calcular qué tamaño de muestra n necesito
para garantizar que el error de estimación no supera el margen de error e con
un nivel de confianza NC.
n ≥ZNC2
σ2 e2
¿Y si no reponemos?
n =
ninfN ninf + (N-1)
donde ninf es el tamaño de muestra necesario para un universo infinito y N es el
tamaño del universo finito.
19
Estadística inferencial
SISTEMÁTICO
20
Estadística inferencial
✔ Ventajas
- Obtiene buenas propiedades de representatividad, similares a la de un muestreo
aleatorio simple o incluso superiores, pero de forma más rápida y simple, al evitar la
necesidad de generar tantos números aleatorios como individuos en la muestra.
✘ Desventajas
- Sólo existe la ya mencionada posibilidad de que el orden en que se han listado los
candidatos a la muestra tenga algún tipo de periodicidad oculta que coincida con el
intervalo escogido para generar la muestra sistemática. En este caso, podríamos
generar una muestra sesgada.
El muestreo sistemático se ideó para mejorar las propiedades del muestreo aleatorio
simple, pero el grado de mejora es variable dependiendo de las propiedades del
universo estudiado.
22
Estadística inferencial
Para entender las propiedades de este muestreo, hay que tener en cuenta una
cosa: si fijamos el intervalo o coeficiente de elevación según el tamaño de la
muestra que necesitamos, sólo hay un elemento aleatorio dentro del proceso de
muestreo: la unidad inicial que seleccionamos del primer bloque de individuos. El
resto queda fijado de antemano. Esto equivale a decir que sólo tenemos k posibles
muestras diferentes a obtener y que el muestreo es simplemente escoger una de las
k muestras disponibles.
Es posible demostrar que cuanto más supera la varianza dentro de las k posibles
muestras que podemos generar a la varianza poblacional, más precisión ganamos
usando el muestreo sistemático respecto al aleatorio simple. Lo anterior puede
interpretarse diciendo que el muestreo sistemático es más preciso que el aleatorio
simple cuando la variabilidad dentro de las posibles muestras es superior a
la variabilidad dentro de las unidades de la población. La precisión del muestreo
sistemático coincide con la del aleatorio simple cuando ambas variabilidades
coinciden, y esto se da cuando la disposición de los elementos en la población es
totalmente aleatoria.
ESTRATIFICADO
23
Estadística inferencial
24
Estadística inferencial
2. Muestreo estratificado uniforme
Hablaremos de una afijación uniforme cuando asignamos el mismo tamaño de
muestra a todos los estratos definidos, sin importar el peso que tienen esos estratos
en la población. Siguiendo con el ejemplo anterior, un muestreo estratificado
uniforme definiría la siguiente muestra por estrato:
Muestra
Estrato Población Proporción
uniforme
Como puedes ver, el tamaño de la muestra es igual en todos los estratos (salvo
pequeñas diferencias debidas al redondeo necesario fruto de dividir 1,000 entre 3),
en lugar de seguir las proporciones de la población.
Esta técnica favorece los estratos que tienen menos peso en la población,
equiparándolos en importancia a los estratos más relevantes. Globalmente, reduce
la eficiencia de nuestra muestra (menor precisión en los resultados globales), pero,
como contrapartida, permite estudiar características particulares de todos los
estratos con una precisión mínima mayor. En nuestro ejemplo, si queremos emitir
alguna afirmación específica sobre la población del estrato 3 (mayores de 44 años),
podremos hacerlo con menos error muestral si empleamos una muestra de 333
unidades que si lo hacemos con una muestra de 227 (como ocurriría en el muestreo
estratificado proporcional).
25
Estadística inferencial
26
Estadística inferencial
- Z es el valor crítico de corte de una distribución normal para lograr un nivel de
confianza deseado. Tienes más información sobre el significado de Z aquí. Los
valores más frecuentes son:
Nivel de confianza 90% -> Z=1,645
Es posible demostrar a partir de las fórmulas anteriores que los diferentes métodos
de estratificación sólo reducen el tamaño de la muestra necesaria si los valores
de p y σ varían entre estratos. De lo contrario, todas las expresiones son
equivalentes. Veamos un ejemplo: si tomamos la expresión de tamaño de muestra
requerido para estimar una media mediante un muestreo estratificado óptimo,
tenemos
n = Z2
(L∑h=1 wh σh )2 e2
Si consideramos que todas las varianzas de los estratos son iguales (σ h=σ) y que el
tamaño de los estratos es idéntico (Wh=1/L), el resultado que obtenemos es
n = Z2
(L∑h=1 wh σh )2 e2
= Z2
(L∑h=1 (1/L)σ )2 e2
= Z2
((L/L)σ)2 e2
= Z2
σ2 e2
que coincide con el tamaño de muestra necesario para tener un error máximo e en
un muestreo aleatorio simple.
27
Estadística inferencial
POR CONGLOMERADOS
Con este post dedicado al muestreo por conglomerados cerramos el primer gran
bloque de posts dedicados al muestreo probabilístico. A partir de la próxima
publicación abordaremos técnicas de muestreo no probabilístico, las más habituales
cuando hablamos de investigación online.
Podemos ver esta técnica desde otro punto de vista. Mientras que en todas las
técnicas vistas hasta ahora las unidades de muestreo coinciden con las unidades a
estudiar (individuos), en el muestreo por conglomerados las unidades de muestreo
son grupos de unidades a estudiar (grupos de individuos), algo que puede resultar
muy beneficioso en términos de coste. A cambio, es habitual obtener una menor
precisión al usar esta técnica, causada por falta de heterogeneidad dentro de los
conglomerados.
El proceso de muestreo
El primer paso para aplicar esta técnica es definir los conglomerados. Se trata de
identificar una característica que permita dividir la población en grupos disjuntos (sin
solapamiento) y de forma exhaustiva (todos los individuos deben estar en un grupo),
de tal manera que los grupos no difieran entre sí en relación a aquello que
queremos medir. Una vez hemos definido estos conglomerados, seleccionaremos al
azar algunos de ellos para estudiarlos.
28
Estadística inferencial
Es por ello que pese a que ambas técnicas dividen la población en estratos o
conglomerados, el proceso de selección de individuos es radicalmente diferente.
29
Estadística inferencial
¿Cómo podemos comparar esta técnica con otras vistas con anterioridad? Lo bien o
mal que va a funcionar esta técnica va a depender, de forma similar a como ocurría
en el muestreo estratificado, de la relación entre la varianza dentro y fuera de los
conglomerados.
nc = na (1 + (M-1) δ)
Ejemplo
30
Estadística inferencial
CONLUSIONES
Con base a esta información se llega a la conclusión que el método que mayor
beneficio aporta es el de muestreo probabilístico puesto que sus resultados suelen
ser más representativos y los del muestreo no probabilístico se esfuerza en obtener
datos que efectivamente sea representativos.
Existen varios criterios para poder establecer el tamaño de una muestra, en principio
pueden ser criterios probabilísticos o no probabilísticos de acuerdo al nivel de
posibilidades que cada uno de los elementos tiene, de participar en la muestra,
dentro de un universo de trabajo dado.
31
Estadística inferencial
El muestreo es útil para la empresa, el gobierno, las industrias, etc. Ya que gracias a
esta técnica pueden conocer a las poblaciones de personas y así utilizar la
información obtenida para sus distintos fines.
Parece ser muy exagerado que la técnica de muestreo tenga tantos conceptos pero
hay que recordar que gracias a ellos podemos interpretar con mayor precisión los
resultados y cuando emitimos uno del mismo, podemos afirmar que nuestro margen
de error sea muy pequeño y nuestras predicciones sean correctas
BIBLIOGRAFIA
https://prezi.com/ndgog6s0ra_g/muestreo-no-probabilistico-por-juicio/
https://www.questionpro.com/blog/es/muestreo-por-conveniencia/
https://explorable.com/es/muestreo-por-conveniencia
https://www.questionpro.com/blog/es/muestreo-voluntario/
https://www.netquest.com/blog/es/blog/es/muestreo-probabilistico-muestreo-
aleatorio-simple
https://www.netquest.com/blog/es/blog/es/muestreo-sistematico
https://www.gestiopolis.com/muestreo-probabilistico-no-probabilistico-resumen/
32
Estadística inferencial
33