Está en la página 1de 12

Muestras definitivas

En estadística, una muestra es un subconjunto de casos o individuos de


una población. En diversas aplicaciones interesa que una muestra
sea, representativa y para ello debe escogerse una técnica de muestra adecuada,
que produzca una muestra aleatoria adecuada.
Para ser representativa debe estar constituida por:
• Un número suficiente de elementos elegidos
• Agrupar en sus elementos los distintos tipos de categorías que existan
• debe tener las mismas características de la población.
Si se obtiene una muestra sesgada su interés y utilidad es más limitado,
dependiendo del grado de sesgos que presente.

Como un subgrupo o subconjunto representativo de la población, extraída


seleccionada por algún método de muestreo. La muestra siempre es una parte de
la población. Si se tienen varias poblaciones, entonces se tendrán varias muestras.
La muestra debe poseer toda la información deseada para tener la posibilidad de
extraerla, esto solo se puede lograr con una buena selección de la muestra y un
trabajo muy cuidadoso y de alta calidad en la recogida de datos.
Tipos de muestras
• No probabilísticas: cuadno no hay selección al azar entonces se hace por
conveniencia. Generalmente son generadas con base en juicios de expertos
o Muestra(juicio) cuando el investigador es muy posible que emita un
juicio de selección basado en hechos concretos.
o Muestra (conveniencia) las unidades del muestreo son incluidos en
la metra por conveniencia
• Probabilísticas: son aquellas cuando se utilizan criterios probabilísticos para
la obtención de muestras aleatorias
o Muestra simple aleatoria: cada individuo entre la población tiene la
misma probabilidad de ser escogido (al azar)
o Muestreo sistemático: cada k ítem es seleccionado aleatoriamente,
una vez se identifique un origen de inicio. El k ítem = N/n se define
por la relación entre los tamaños de la población N y la muestra n.
o Muestreo estratificado: se divide la población en estratos
homogéneos y se toma una fracción del total de la muestra de cada
grupo o estrato.
o Muestreo(clúster): la población es dividida en grupos muestras, se
selecciona de cada uno de los clústeres de un grupo seleccionando
aleatoriamente. El proceso de selección dentro de los clústeres puede
ser simple o sistemático.
Plan de muestreo
Las muestras se obtienen aplicando un plan de muestreo, que consta de los
siguientes pasos:
a) Definir la población de interés
b) Colección de datos
c) Definir el marco del muestro
d) Métodos de muestreo
• Probabilísticos
• No probabilísticos
e) Determinación del tamaño de la muestra
f) Ejecución del plan

A- Definir la población de interés.


El problema fundamental es especificar las características de los individuos,
empresas u objetos, de los cuales se requiere información para satisfacer los
objetivos de la investigación.
La población puede ser:
• Infinita: si no puede ser cuantificada (>) Mayor o igual a 100,000 elementos
• Finita: si su número total puede ser cuantificado (<) Menor de 100,000
elementos
La población dependerá del criterio del investigador, apoyándose en los requisitos
que desee tenga esa población.
Una guía para establecer los criterios de la población es definir:
• Elementos: A quién quiero investigar
• Requisitos: Características para ser investigados.
• Alcance: Lugar donde se va a llevar a cabo el muestreo.
• Tiempo: Información para efectuar el muestreo.

B - Colección de los datos


Registros internos:
• reportes de ventas, costos, resultados,
• proveedores o distribuidores,
• estudios anteriores
Fuentes externas:
• Datos secundarios
• Fuentes secundarias
• Fuentes primarias

C - Elección del marco de muestreo


Lista de elementos de la población de la cual se seleccionan las unidades que se
van a muestrear.
• Directorio Telefónico
• Padrón Electoral
• Listado de alumnos en una escuela
• Miembros de cámaras y asociaciones
D - Seleccionar el método de muestreo
Es la forma en la cual vamos a seleccionar a los elementos del universo.
Su elección depende de:
• Objetivos del estudio
• Recursos financieros disponibles
• Limitaciones del tiempo
• La naturaleza del problema a investigar.

Métodos de Muestreo
PROBABILÍSTICO: Subconjuntos de una población que aseguran un corte
transversal (al azar) representativo al dar a cada elemento de la población una
posibilidad diferente de cero de ser seleccionado.
NO PROBABILÍSTICO: Subconjuntos de una población en los cuales se efectúa
poco o ningún intento por lograr un corte transversal representativo

E - Determinar el tamaño de la muestra


PARA PROPORCIONES
Los factores que determinan el tamaño de la muestra para una proporción son:
1. El nivel de confianza deseado (Z).
2. El máximo error permisible (E).
3. La estimación de la proporción de la población. Si no se cuenta con una
estimación, entonces se utiliza 0.50.
Estadísticas descriptivas
La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y
caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de los
estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de
describir apropiadamente las diversas características de ese conjunto.
La estadística descriptiva tiene que ver con la mención de los hechos observados o
la descripción de características de un conjunto de datos
El nacimiento de la estadística descriptiva inicia con la necesidad de los países de
obtener información acerca de sus ciudadanos. Un ejemplo de este hecho se
puede observar en el nuevo testamento de la Sagrada Escritura, cuando María y
José tienen que ir a Belén para el censo que había ordenado el emperador de ese
tiempo.
Por un lado, se define la estadística descriptiva como el conjunto de
métodos estadísticos necesarios para la recopilación, presentación y
caracterización apropiada de un conjunto de datos. Por otro lado, se define la
inferencia estadística como el proceso de caracterizar una población de datos a
partir de la caracterización de una muestra de esa población de datos mediante
metodología estadística conocida como métodos de muestreo.
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo
se llama variable estadística. Existen básicamente dos tipos de variables aleatorias
que producen dos categorías de datos: datos cualitativos y datos cuantitativos. Se
define una variable aleatoria como una variable en la cual no se puede predecir con
exactitud el valor que tomará esta variable antes de que ocurra
Las variables pueden ser de dos tipos:
• Variables cualitativas o categóricas: producen respuestas categóricas, no
se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel,
sexo).
• Variables cuantitativas: producen respuestas numéricas, tienen valor
numérico (edad, precio de un producto, ingresos anuales) las variables
cuantitativas se pueden clasificar en discretas y continuas:
• Discretas: surgen de procesos de conteo, sólo pueden tomar valores
enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede
ser 1, 2, 3…, etc., pero, por ejemplo, nunca podrá ser 3.45).
• Continuas: surges de procesos de medición, pueden tomar cualquier
valor real dentro de un intervalo. Por ejemplo, la velocidad de un
vehículo puede ser 90.4 km/h, 94.57 km/h... etc.
Las variables también se pueden clasificar en:
• Variables unidimensionales: sólo recogen información sobre una
característica (por ejemplo: edad de los alumnos de una clase).
• Variables bidimensionales: recogen información sobre dos características
de la población (por ejemplo: edad y altura de los alumnos de una clase).
• Variables pluridimensionales: recogen información sobre tres o más
características (por ejemplo: edad, altura y peso de los alumnos de una
clase).

• Variables unidimensionales: sólo recogen información sobre una


característica (por ejemplo: edad de los alumnos de una clase).
• Variables bidimensionales: recogen información sobre dos características
de la población (por ejemplo: edad y altura de los alumnos de una clase).
• Variables pluridimensionales: recogen información sobre tres o más
características (por ejemplo: edad, altura y peso de los alumnos de una
clase).
Kolmogórov-Smirnov
Desarrollada en la década de los treinta del siglo XX, esta prueba permite — al igual que la prueba
Chi-cuadrada— determinar la distribución de probabilidad de una serie de datos. Una limitante de
la prueba de Kolmogórov-Smirnov estriba en que solamente se puede aplicar al análisis de variables
continuas. El procedimiento general de la prueba es:

Objetivo
El objetivo de esta prueba de bondad y ajuste es señalar y determinar si los datos
estudiados o mediciones muestrales provienen de una población que tienen una
distribución teórica determinada.
1. Obtener al menos 30 datos de la variable aleatoria a analizar.
2. Calcular la media y la varianza de los datos.
3. Crear un histograma de m = v n intervalos, y obtener la frecuencia observada en cada
intervalo 0 ¡.
4. Calcular la probabilidad observada en cada intervalo PO¡= 0¡/ n, esto es, dividir la frecuencia
observada O. entre el número total de datos, n.
5. Acumular las probabilidades PO. para obtener la probabilidad observada hasta el i-ésimo
intervalo, POAr
6. Establecer de manera explícita la hipótesis nula, para esto se propone una distribución de
probabilidad que se ajuste a la forma del histograma.
7. Calcular la probabilidad esperada acumulada para cada intervalo, PEA¡, a partir de la función
de probabilidad propuesta.
8. Calcular el estadístico de prueba
9. 9. Definir el nivel de significancia de la prueba a, y determinar el valor crítico de la prueba,
Da n (consulte la tabla de valores críticos de la prueba de Kolmogórov-Smirnov en la sección
de apéndices).
10. 10. Comparar el estadístico de prueba con el valor crítico. Si el estadístico de prueba es
menor que el valor crítico no se puede rechazar la hipótesis nula.

H0: Los datos analizados siguen una misma distribución.


H1: Los datos analizados no siguen una misma distribución.
En la prueba las frecuencias a comparar serán las frecuencias relativas acumuladas
F(xi) de las dos distribuciones; observada y teórica. De ahí su utilidad para aquellas
ocasiones en las que los datos se encuentren en forma de escala ordinal.
El procedimiento consiste en establecer las frecuencias relativas acumuladas
referentes a la información muestral. Fo (Xi). Establecer, también, en base a la
distribución de probabilidad hipotética las frecuencias relativas acumuladas Ft(xi).
Es decir, el valor máximo de entre todas las diferencias entre frecuencias relativas
cumuladas teóricas y observadas para los mismos valores o intervalos de la
variable.

• El operador “máx.”. Nos interesa encontrar la diferencia mayor o máxima


para ver cómo de diferentes pueden llegar a ser ambas distribuciones.
• El valor absoluto. Empleamos el valor absoluto para que el orden de los
operadores no altere el resultado.
Ejemplo de Kolmogórov-Smirnov

Una empresa cafetera desea determinar el llenado de sus bolsas de café de


75mgs. para ello creara 100 números pseudoaleatorios siguiendo una distribución
normal. genera un conjunto de números pseudoaleatorios definidos para la
simulación, y determina si cumplen con la propiedad de uniformidad con un nivel
de significancia de 0.05 siguiendo la prueba de uniformidad de Kolmogórov-
Smirnov.

Números aleatorios
75.75 76.34 75.39 75.93 74.97 75.13 75.46 75.84 75.03 74.86
98708 72026 67343 79795 86257 00557 19025 96482 92330 20742
9 7 8 1 4 5 2 5 4 8
75.87 74.88 74.48 74.53 74.02 74.22 74.86 76.55 75.88 75.76
15920 37265 59817 05148 75512 00150 05565 49426 59524 21747
7 3 6 1 7 6 3 3 5
74.82 74.63 75.15 74.94 75.98 74.49 74.27 75.75 74.22 75.22
76058 71184 82273 08720 35946 06875 37764 26216 37496 48134
4 4 5 4 5 1 4 5 8 5
75.24 74.09 76.21 74.51 75.71 74.30 73.80 74.39 75.17 75.91
37303 22333 56556 61903 89214 39074 39826 36677 20999 23198
6 4 3 1 6 3 3 4 9 2
76.04 76.31 74.73 74.19 75.50 76.42 75.62 74.34 74.16 75.64
65203 69301 06594 19799 91675 22018 53804 55560 00890 48431
1 4 3 8 9 3 3 1
75.09 75.22 74.43 75.87 74.25 75.15 75.24 75.35 75.20 75.94
11902 55339 47672 19297 18274 08425 80891 73444 71720 36496
0 4 3 3 9 4 2 5 9 4
75.23 75.51 76.48 75.18 74.18 74.01 75.18 74.66 74.65 75.04
92590 06136 23785 87548 91047 51843 52035 60710 58409 48068
6 3 9 3 6 6 3 6 5 2
75.12 74.82 74.40 76.03 76.26 73.94 75.89 74.45 75.98 74.26
78431 87833 58401 25743 63917 38259 44243 57364 68568 27874
2 6 9 5 9 7 7 9 9 7
75.01 75.22 76.12 74.32 75.26 74.76 74.41 75.92 76.60 75.00
17904 51135 46606 60235 15226 90576 45935 66750 78956 83483
6 8 8 4 9 6 8 1
73.66 75.85 74.54 74.45 75.05 75.36 75.79 75.18 75.53 75.43
66716 33641 03842 63341 93001 63680 58254 68005 19435 89517
7 9 9 9 6 9 5 6

Parámetros de la distribución normal


Media 75.14461691
Desviación 0.724663567
Mínimo 73.66667167
Máximo 76.60789568
Rango 2.941224011
Número de datos 100
Número de intervalos sturges 7.6
Número de intervalos de raíz de n 10
tamaño del intervalo 0.294122401
Fuentes de información
https://manuelalejandrogarciasantiz.blogspot.com/
https://es.scribd.com/book/510864718/Estadistica-descriptiva-regresion-y-
probabilidad-con-aplicaciones
file:///C:/Users/HP/Downloads/pdfcoffee.com_unidad-4-simulaciondocx-5-pdf-
free.pdf
https://www.youtube.com/watch?v=3IFEJ30a3k0
https://es.scribd.com/document/414434389/Muestreo
Prueba Kolmogorov Smirnov Excel - YouTube

También podría gustarte