Documentos de Académico
Documentos de Profesional
Documentos de Cultura
descriptiva
UG
Los mejores métodos del muestreo implican el muestreo aleatorio. Hay muchos
métodos diferentes del muestreo aleatorio, el básico es el muestreo aleatorio simple.
MUESTREO
SLIDE 5
Muestreo Aleatorio Simple
Debido a que una muestra aleatoria simple es similar a una lotería, con frecuencia se
puede tomar la muestra con el mismo método que el que se usa en muchas loterías:
Con un generador de números aleatorios de una computadora.
Suponga que hay N elementos en la población y que se le asigna a cada elemento de la población un
entero entre 1 y N. Después se genera una lista de enteros aleatorios entre 1 y N y se eligen los
elementos correspondientes de la población para que formen la muestra aleatoria simple, precisamente
como en la lotería.
Una muestra aleatoria simple puede consistir de valores obtenidos en un proceso en condiciones
experimentales idénticas. En este caso, la muestra proviene de una población que consta de todos
los valores posibles que se han observado. A este tipo de población se le denomina
población conceptual.
Tipos de muestreo aleatorio simple
Muestreo reemplazo: y Muestreo sin reemplazo SLIDE 6
Cada combinación posible de muestreo tiene igual No se aprovecha del conocimiento que el investigador
probabilidad de ser seleccionado. podría tener de la población.
Los procedimientos estadísticos necesarios para analizar Si la población está muy dispersa, los costos por
errores de datos y de software de estadísticas son más recolección de datos pueden ser más altos que los de
fáciles. otros diseños de la muestra de probabilidad.
Por ejemplo, imagine que un ingeniero civil acaba de recibir una remesa de mil bloques de hormigón,
que pesan aproximadamente 50 libras cada uno. Los bloques se han entregado en una gran pila.
El ingeniero quiere investigar la fuerza de compresión de los bloques midiendo las fuerzas en una muestra
de diez bloques. Para tomar una muestra aleatoria simple se requeriría sacar bloques del centro y de la
parte inferior de la pila, lo que puede ser muy difícil. Por esta razón, el ingeniero puede tomar una muestra
simplemente tomando diez bloques de la parte superior de la pila. Una muestra así se llama muestra de
conveniencia.
Con una población finita y tangible, los elementos en una muestra aleatoria simple no son
Población pequeña estrictamente independientes, ya que cuando se extrae cada elemento, la población cambia.
Este cambio puede ser importante cuando la población es pequeña.
Sin embargo, cuando la población es muy grande, este cambio resulta insignificante y
Población grande los elementos se pueden tratar como si fueran independientes. (
OTROS TIPOS DE MUESTREO
SLIDE 14
1 2 3 4
En un experimento de muestras-múltiples, hay dos o más poblaciones de interés y se toma una muestra
de cada población. Por ejemplo, si están compitiendo algunos procesos para ser considerados en la
fabricación de polietileno y se miden las fuerzas de tensión en una muestra de los elementos de cada
proceso, se entiende que éste es un experimento de muestras-múltiples.
MUESTREO
SLIDE 16
Tipos de datos
Numérico o cuantitativo
Cuando se asigna una cantidad numérica a cada elemento de una muestra,
al conjunto de valores resultante se le llama numérico o cuantitativo.
Categórico o cualitativo
En algunos casos, los elementos de la muestra son puestos en categorías.
Entonces, los datos son categóricos o cualitativos.
TIPOS DE MUESTRAS
SLIDE 17
Muestra aleatoria simple: Muestra aleatoria estratificada: Muestra aleatoria por Muestra aleatoria sistemática:
Cada miembro y conjunto de Primero se divide la población en conglomerados: se pone en cierto orden a los miembros
miembros tienen una grupos. La muestra general se primero se divide la población en de la población. Se selecciona al azar
probabilidad igual de ser compone de algunos miembros de grupos. La muestra global consta de un punto de partida y se elige a
incluidos en la muestra. Se cada grupo. Los miembros de cada todos los miembros de algunos de cada miembro como parte de la
necesita usar la tecnología, grupo se eligen al azar. los grupos. Los grupos se muestra.
generadores de números seleccionan aleatoriamente.
aleatorios, o algún otro tipo de Ejemplo: un consejo estudiantil Ejemplo: un director toma una lista
proceso de azar para obtener encuesta a 100 estudiantes para Ejemplo: un día, una compañía alfabética de nombres de estudiantes y
una muestra aleatoria simple. obtener muestras aleatorias aérea quiere encuestar a sus escoge un punto de partida al azar.
de 25 estudiantes de primer clientes, así que ese día Cada 20 estudiante es seleccionado
Ejemplo: un profesor pone los año, 25 de segundo, 25 de tercero seleccionan 5 vuelos aleatoriamente para participar en una encuesta.
y 25 de cuarto. y encuestan a cada pasajero en esos
nombres de los estudiantes en
Por qué es bueno: una muestra vuelos.
un sombrero y elige sin mirar
estratificada garantiza que todos los Por qué es bueno: un ejemplo de
para obtener una muestra de
miembros de cada grupo estarán muestra por conglomerados toma
estudiantes. representados en la muestra, por lo cada miembro de algunos grupos,
Por qué es bueno: las muestras que este método es útil cuando así que es bueno cuando cada grupo
aleatorias suelen ser bastante queremos algunos miembros de refleja a la población en su
representativas ya que no cada grupo. conjunto.
favorecen a ciertos miembros.
23,24,39,39,58
81,23,24,39,84
81, 23, 24, 39, 39
23,24,39,58,32
Willy dirige una pequeña empresa con 10 empleados. Decide seleccionar una muestra aleatoria simple de 3 empleados para ir
en viaje de negocios. Los numera del 0 al 9 y utiliza la tabla de dígitos aleatorios impresa abajo para seleccionar la muestra.
¿Cuáles empleados están en la muestra?
69290 , 03600 ,05376
The Power of PowerPoint | http://thepopp.com
Ejercicios
Responder a que tipo de muestra corresponde y Realizar 2 ejemplos de ingeniería o técnicos SLIDE 20
Cada sucursal de una empresa en un estado Los empleados de un sitio web quieren
registra su número de teléfono en el sistema seleccionar una muestra de sus usuarios para
de cortes estatal. Un empleado de dicho solicitar una donación. Seleccionan
sistema usa una computadora para aleatoriamente a uno de los
seleccionar aleatoriamente 500 números de primeros 25 usuarios cada día y le muestran
teléfono registrados, y las sucursales con un mensaje pidiendo una donación. También
números en esa lista serán seleccionados muestran el mensaje a cada 25, usuarios de
para una auditoría. ahí en adelante.
Muestra aleatoria simple Muestra aleatoria simple
Muestra aleatoria estratificada Muestra aleatoria estratificada
Muestra por conglomerados Muestra por conglomerados
Muestra aleatoria sistemática Muestra aleatoria sistemática
Ninguna de las opciones anteriores Ninguna de las opciones anteriores
Poner los números en un orden aleatorio y examinar cada 10 página hasta que se hayan
examinado 1000 páginas
Examinar 20 páginas seleccionadas al azar de cada uno de los 50 números Examinar las
primeras 50 páginas en los últimos 20 números
Las dos cantidades más usadas en el resumen estadístico son la media de la muestra y la
desviación estándar de la muestra.
La primera indica el centro de los datos y la segunda señala cómo están distribuidos los datos.
DESARROLLO DE UN PROYECTO ESTADÍSTICO
En forma resumida, se describen los pasos para resolver un problema usando las técnicas estadísticas
RESULTADOS
Los resultados obtenidos deben usarse para producir información útil en la toma de
decisiones.
La metodología de diseño en otros ámbitos de la ciencia e ingeniería usa la
retroalimentación para corregir las especificaciones con las que se ejecutan las actividades,
hasta que los resultados obtenidos concuerden con las especificaciones y requerimientos
iniciales.
Sin embargo, el uso de retroalimentación en la resolución de un problema estadístico podría
interpretarse como un artificio para modificar los datos o la aplicación de las técnicas
estadísticas para que los resultados obtenidos concuerden con los requerimientos e
hipótesis formuladas inicialmente. En este sentido, usar retroalimentación no sería un
procedimiento aceptable.
The Power of PowerPoint | http://thepopp.com
MEDIDAS DE TENDENCIA CENTRAL
SLIDE 26
Una muestra aleatoria simple de cinco hombres se elige de entre una gran
población de hombres y se mide su estatura. Las cinco cifras de estatura
(en pulgadas) son 65.51, 72.30, 68.31,67.05 y 70.68. Encuentre la media muestral.
Solución:
Usamos la ecuación (1.1). La media muestral es
MEDIA MUESTRAL
SLIDE 29
Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5
Entonces X= (2+6+11+8+11+4+7+5)/8 = 6.75
MODA RANGO
La moda muestral es el valor que tiene más El rango es la diferencia entre los valores
frecuencia en una muestra o que mas veces se más grandes y más pequeños en una
repite. Si algunos valores tienen una frecuencia muestra. Es una medida de la dispersión,
igual, cada uno representa una moda.
pero rara vez se usa, porque depende
solamente de los dos valores extremos y
Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5 no proporciona ninguna información
Entonces Mo = 11 acerca del resto de la muestra.
MEDIDAS DE DISPERSIÓN
SLIDE 35
Son números que proveen información adicional acerca del comportamiento de los datos, describiendo
numéricamente su dispersión.
• La idea básica detrás de la desviación estándar es que cuando la dispersión es grande, los valores
de la muestra tenderán a alejarse de su media, pero cuando la dispersión es pequeña, los valores
tenderán a acercarse a su media. En este contexto, el primer paso en el cálculo de la desviación
estándar es calcular las distancias (también llamadas desviaciones) de cada valor de la muestra a
la media de la muestra.
MEDIDAS DE DISPERSIÓN
SLIDE 38
DESVIACIÓN ESTÁNDAR MUESTRAL
Entonces la varianza es
CUARTILES DECILES
Primer Cuartil (Q1) Segundo Cuartil (Q2) Tercer Cuartil (Q3) cuartil
A la izquierda de Q1 están Igual que la mediana divide al A la izquierda de Q3 están Son números que dividen a los
incluidos 25% de los datos grupo de datos en dos partes, incluidos 75% de los datos datos de la muestra en grupos
(aproximadamente) (aproximadamente)
cada una con el 50% de los de tamaño aproximado de 25%.
A la derecha de Q1 están el 75% datos (aproximadamente) A la derecha de Q3 están el 25%
de los datos (aproximadamente) de los datos (aproximadamente)
Q3: 75% de 40 = 30
Q3 = (X(30) + X(31))/2
EJERCICIO
Vamos a suponer que el gerente de una empresa de alimentos
desea saber que tanto varían los pesos de los empaques (en
gramos), de uno de sus productos; por lo que opta por seleccionar
al azar cinco unidades de ellos para pesarlos. Los productos tienen
los siguientes pesos (490, 500, 510, 515 y 520) gramos
respectivamente
• Una gráfica que constituye una manera simple de resumir un conjunto de datos.
• Cada elemento de la muestra se divide en dos partes: un tallo, que consta de uno o dos
dígitos que están en el extremo izquierdo, y la hoja, que consta del siguiente dígito
significativo.
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
Características: SLIDE 52
PASOS DE
ELABORACIÓN
1 2 UTILIDAD
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
EJEMPLO:
SLIDE 53
los datos de la tabla 1.3 tratan del géiser Old Faithful en el parque nacional Yellowstone. Este
géiser alterna periodos de erupción, que duran normalmente de 1.5 a cuatro minutos, con
espacios de tiempo de inactividad, que son considerablemente más grandes. La tabla 1.3
presenta la duración, en minutos, de 60 periodos de inactividad. La lista se presenta en orden
numérico.
Cuando hay un gran número de elementos en la muestra con el mismo tallo, con frecuencia
se necesita asignar más de un renglón a ese tallo
Por ejemplo, la figura 1.6 presenta una gráfica de tallos y hojas generada por computadora, con el
software MINITAB de un conjunto de datos.
DIAGRAMA DE PUNTOS
• Un diagrama de puntos es un gráfico que se puede usar para tener una impresión
aproximada de la forma de una muestra.
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
Características: SLIDE 58
PASOS DE
ELABORACIÓN
1 2 UTILIDAD
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
EJEMPLOS:
SLIDE 59
Gráfico 1.7
• La figura 1.7 presenta un diagrama de puntos para los datos del géiser de la tabla 1.3 (tabla usada
en el ejercicio anterior).
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
RESÚMENES GRÁFICOS
SLIDE 60
HISTOGRAMAS
• Un histograma es una gráfica que da una idea de la “forma” de una muestra, indicando las
regiones donde los puntos de la muestra están concentrados y las regiones donde son
escasos.
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
EJEMPLO:
SLIDE 61
Pasos y ejercicio
Construiremos un histograma
para las emisiones EP de 62
vehículos conducidos en una gran
altitud. El rango de la muestra va
desde un mínimo 1.11 a un
máximo de 23.38, en unidades de
gramos de emisiones por galón
de combustible.
• El primer paso es construir la
tabla de frecuencias, que se
muestra en la tabla 1.4.
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
EJEMPLO:
SLIDE 62
Pasos y ejercicio
• Los intervalos en la columna de la izquierda se llaman intervalos de clase. Dividen la muestra
en grupos. La notación 1-< 3, 3-< 5 y así sucesivamente, indica que un punto que está en el
límite entrará en la clase de su derecha.
Por ejemplo, un valor de la muestra igual a 3 entrará en la clase 3-< 5, y no en la 1-< 3.
• En la columna “Frecuencia”, en la tabla 1.4, se presentan los números de puntos de datos que
están en cada uno de los intervalos de clase.
• En la columna “Frecuencia relativa” se presentan las frecuencias divididas entre el número
total de puntos de datos, que para estos datos es de 62.
• Las frecuencias relativas deben sumar 1.
• En la columna “Densidad” se presenta la frecuencia relativa dividida entre el ancho de clase
ajustando la frecuencia relativa con el ancho de la clase.
• El área de cada rectángulo es, por tanto, la frecuencia relativa del intervalo de clase.
• Debido a que las frecuencias relativas suman 1, el área bajo todo el histograma debe ser igual a 1.
• Tanto la media como la varianza de la muestra tienen interpretaciones físicas con respecto al
histograma.
• El hecho de que la media y la varianza de la muestra correspondan a propiedades físicas del
histograma es muy útil.
• Un histograma con una cola larga a la derecha se • Un histograma largo con una cola larga a la
dice que está sesgado a la derecha o izquierda se dice que está sesgado a la izquierda
positivamente sesgado. o negativamente sesgado.
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
RESÚMENES GRÁFICOS
SLIDE 73
DIAGRAMAS DE CAJA
TERMINOLOGÍA
3er cuartil
1er cuartil
1 2 3
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
EJEMPLO:
SLIDE 76
Pasos y ejercicio
La figura presenta un diagrama de caja para los datos del
géiser que se presentó en la tabla 1.5.
Primero observe que no hay ningún dato atípico en estos
datos.
El “bigote” más bajo es un poco más largo que el superior, lo
que indica que los datos tienen la cola inferior ligeramente
más larga que la cola superior.
Como consecuencia de que la distancia entre la mediana y el
primer cuartil es más grande que la que existe entre la
mediana y el tercer cuartil y debido a que la cuarta parte
inferior de los datos produce un “bigote” más largo que la
cuarta parte superior, este diagrama de caja indica que los
datos están sesgados a la izquierda.
La tabla 1.5 se presenta en la siguiente diapositiva
METODOLOGIA DE LA INVESTIGACION 1
TONY COLOMA
EJEMPLO:
SLIDE 81
Pasos y ejercicio
• Si los datos constan de pares arreglados (x1, y1), . . . , (xn, yn), entonces un diagrama de
dispersión se construye sólo al trazar cada punto en un sistema coordenado bidimensional.
• Los diagramas de dispersión también se pueden usar para resumir los datos multivariados
cuando cada elemento consta de más de dos valores. Simplemente se construirían
diagramas de dispersión distintos para cada par de valores.
EJERCICIOS PROPUESTOS
EJERCICIOS PROPUESTOS
EJERCICIOS PROPUESTOS
EJERCICIOS PROPUESTOS
EJERCICIOS PROPUESTOS
SLIDE 88
GRACIAS