Disfruta de millones de libros electrónicos, audiolibros, revistas y más

A solo $11.99/mes después de la prueba. Puedes cancelar cuando quieras.

Estadística aplicada a la ingeniería y los negocios

Estadística aplicada a la ingeniería y los negocios


Estadística aplicada a la ingeniería y los negocios

valoraciones:
3.5/5 (8 valoraciones)
Longitud:
825 páginas
7 horas
Publicado:
24 oct 2017
ISBN:
9789972453564
Formato:
Libro

Descripción

Aborda temas como la estadística inferencial, la regresión lineal simple y múltiple, y el diseño de experimentos que brindan un soporte significativo en la toma de decisiones. Incluye más de 300 ejercicios planteados y desarrollados, que facilitan el enlace entre los conceptos teóricos y la práctica, los cuales guiarán al lector para una mejor comprensión de los contenidos y sus aplicaciones.
Publicado:
24 oct 2017
ISBN:
9789972453564
Formato:
Libro

Sobre el autor


Vista previa del libro

Estadística aplicada a la ingeniería y los negocios - Rosa Millones

Colección Textos Universitarios

Estadística aplicada a la ingeniería y los negocios

Primera edición digital, noviembre de 2016

©Rosa Millones, Emma Barreno, Félix Vásquez, Carlos Castillo

©Universidad de Lima

Fondo Editorial

Av. Javier Prado Este N.o 4600,

Urb. Fundo Monterrico Chico, Lima 33, Perú

Apartado postal 852, Lima 100, Perú

Teléfono: 437-6767, anexo 30131

fondoeditorial@ulima.edu.pe

www.ulima.edu.pe

Diseño, edición y carátula: Fondo Editorial de la Universidad de Lima

Versión ebook 2017

Digitalizado y distribuido por Saxo.com Peru S.A.C.

https://yopublico.saxo.com/

Teléfono: 51-1-221-9998

Avenida Dos de Mayo 534, Of. 304, Miraflores

Lima - Perú

Se prohíbe la reproducción total o parcial de este libro sin permiso expreso del Fondo Editorial.

ISBN versión electrónica: 978-9972-45-356-4

Índice

Presentación

Capítulo 1. Distribuciones muestrales

1. Conceptos básicos

2. Muestra aleatoria

3. Tipos de muestreo

3.1 Muestreo probabilístico

3.1.1 Muestreo aleatorio simple

3.1.2 Muestreo sistemático

3.1.3 Muestreo estratificado

3.1.4 Muestreo por conglomerados

3.2 Muestreo no probabilístico

3.2.1 Muestreo por cuotas

3.2.2 Muestreo por conveniencia

3.2.3 Muestreo de juicio

4. Principales estadísticos

5. Distribución de la media muestral

6. Teorema central del límite

6.1 Aplicación del teorema central del límite a diferentes distribuciones

6.1.1 Distribución de Poisson

6.1.2 Distribución uniforme

7. Distribuciones de muestras pequeñas

7.1 Distribución Ji cuadrado

7.2 Distribución t de Student

7.3 Distribución F de Fisher

8. Distribuciones muestrales de un estadígrafo

8.1 Distribución de la media muestral con varianza poblacional conocida

8.2 Distribución de la media muestral con varianza poblacional desconocida

8.3 Distribución de una proporción muestral

8.4 Distribución de la varianza muestral

9. Distribuciones muestrales de dos muestras

9.1 Diferencia de medias muestrales con varianzas poblacionales conocidas

9.2 Diferencia de medias muestrales con varianzas poblacionales desconocidas

9.2.1 Varianzas poblacionales homogéneas

9.2.2 Varianzas poblacionales heterogéneas

9.3 Cociente de varianzas muestrales

9.4 Diferencia de proporciones muestrales

Problemas resueltos

Problemas propuestos

Capítulo 2. Estimación de parámetros

1. Definición

2. Propiedades de un buen estimador puntual

2.1 Insesgabilidad

2.2 Consistencia

2.3 Suficiencia

2.4 Eficiencia

3. Métodos de obtención de estimadores puntuales

3.1 Método de momentos

3.2 Método de máxima verosimilitud

4. Estimación por intervalos

4.1 Intervalo de confianza para la media poblacional

4.1.1 Caso 1: la varianza poblacional (σ ² ) es conocida

4.1.2 Caso 2: la varianza poblacional (σ ² ) es desconocida

4.2 Intervalo de confianza para π

4.3 Intervalo de confianza para la varianza poblacional μ

4.4 Intervalo de confianza para la diferencia de proporciones (σ ² )

4.5 Intervalo de confianza para una razón de varianzas

4.6 Intervalo de confianza para la diferencia de medias (μ 1 – μ 2 )

4.6.1 Varianzas poblacionales conocidas

4.6.2 Varianzas poblacionales desconocidas

Problemas resueltos

Problemas propuestos

Capítulo 3. Prueba de hipótesis

1. Definición

2. Clases de hipótesis

2.1 Hipótesis nula (H 0 )

2.2 Hipótesis alternativa (H 1 )

2.3 Prueba estadística de una hipótesis

3. Tipos de prueba

3.1 Prueba de cola izquierda o inferior

3.2 Prueba de cola derecha o superior

3.3 Prueba de dos colas o bilateral

4. Tipos de errores

4.1 Nivel de significación

4.2 Región crítica

4.3 Región de aceptación

4.4 Procedimiento para realizar una prueba de hipótesis referente a un parámetro θ

5. Prueba de hipótesis para los parámetros

5.1 Prueba de hipótesis para la media de una población (μ)

5.1.1 Cuando la varianza poblacional es conocida

5.1.2 Cuando la varianza poblacional es desconocida

5.2 Prueba de hipótesis para una proporción poblacional (π)

5.3 Prueba de hipótesis para la varianza de la población (σ ² )

5.4 Prueba de hipótesis para una razón de varianzas

5.5 Prueba de hipótesis para la diferencia de dos medias (μ 1 – μ 2 )

5.5.1 Varianzas conocidas y muestras independientes

5.5.2 Varianzas desconocidas y muestras independientes

5.5.3 Muestras pareadas o dependientes

5.6 Prueba de hipótesis para la diferencia de dos proporciones

6. Funciones potencia y característica de operación

7. Prueba de bondad de ajuste

8. Prueba de independencia

Problemas resueltos

Problemas propuestos

Capítulo 4. Análisis de regresión

1. Definición

2. Tipos de relaciones

3. Tipos de modelo de regresión

3.1 Por la forma de influencia

3.2 Por el número de variables independientes que influyen en la variable respuesta

4. Análisis de regresión lineal simple

4.1 Metodología para la formulación de un modelo de regresión simple

4.2 Especificación del modelo de regresión lineal simple

4.2.1 Supuestos básicos del modelo de regresión lineal simple

4.3 Estimación de parámetros en un modelo de regresión lineal simple

4.3.1 Varianza de los estimadores y

4.3.2 Intervalos de confianza para los parámetros

4.4 Tabla de análisis de varianza (ANOVA)

4.5 Verificación del modelo

4.5.1 Coeficiente de determinación (R 2 )

4.5.2 Coeficiente de correlación lineal simple (r)

4.5.3 Pruebas de significación de las variables. Prueba T

4.5.4 Prueba de significación del modelo. Prueba F

5. Análisis de regresión lineal múltiple

5.1 Especificación del modelo de regresión lineal múltiple

5.1.1 Supuestos básicos del modelo de regresión lineal múltiple

5.2 Tabla de análisis de varianza (ANOVA)

5.3 Obtención de estimadores en un modelo de regresión lineal múltiple

5.3.1 Propiedades de los estimadores

5.3.2 Intervalos de confianza de los estimadores – RLM

5.4 Pruebas de verificación

5.4.1 Coeficiente de determinación múltiple (R2)

5.4.2 Prueba de significación del modelo – Prueba F

5.4.3 Prueba individual de las variables – Prueba T

5.5 Prueba de los supuestos del modelo de regresión lineal múltiple

Problemas resueltos

Problemas propuestos

Capítulo 5. Diseño y análisis de experimentos

1. Definición

2. Tipos de variabilidad

3. Etapas de un diseño de experimento

4. Conceptos básicos

4.1 Unidad experimental

4.2 Factor

4.3 Niveles de un factor

4.4 Tratamientos

5. Principios básicos de un diseño experimental

5.1 Repetición del experimento

5.2 Aleatoriedad

5.3 Formación de bloques

6. Tipos de diseños experimentales

6.1 Diseño completamente aleatorio

6.2 Diseño en bloques

6.3 Diseño cuadrado latino

7. Diseño completamente aleatorio

7.1 Modelo de efectos fijos

7.2 Estimación de los parámetros del modelo

7.3 Intervalo de confianza para los parámetros del modelo

7.4 Procedimiento para los supuestos del modelo

8. Diseños de bloques completamente aleatorizados

8.1 Características

8.2 Representación simbólica de los datos con una observación por unidad experimental

8.3 Estimación de los parámetros del modelo

8.4 Intervalo de confianza para los parámetros del modelo

Problemas resueltos

Problemas propuestos

Capítulo 6. Casos resueltos y propuestos

1. Casos resueltos: capítulos 1 y 2

2. Casos propuestos: capítulos 1 y 2

3. Casos resueltos: capítulos 3, 4 y 5

4. Casos propuestos: capítulos 3, 4 y 5

Respuestas a los problemas propuestos

Anexos

Anexo 1. Valores de la función distribución normal estándar

Anexo 2. Valores críticos para la distribución Ji cuadrado

Anexo 3. Valores críticos para la distribución t de Student

Anexo 4. Resumen de fórmulas de distribuciones muestrales

Anexo 5. Resumen de fórmulas de intervalos de confianza

Anexo 6. Resumen de fórmulas de pruebas de hipótesis

Anexo 7. Resumen de fórmulas de regresión lineal simple

Anexo 8. Resumen de fórmulas de regresión lineal múltiple

Anexo 9. Resumen de diseño completamente aleatorizado

Bibliografía

Presentación

En la actualidad, los ingenieros y los profesionales en diversas áreas deben estar en condiciones de aplicar métodos estadísticos avanzados, que les permitan analizar la información cuantitativa y cualitativa, originada en la gestión empresarial y en el desarrollo de los planes de negocios, para una adecuada toma de decisiones. Por ejemplo, en muchas situaciones prácticas se hace uso de muestras representativas, debido a que no siempre se tiene información completa de una población, o su obtención resulta muy costosa, por lo que los métodos de selección y análisis de muestras estadísticas son de vital importancia; además, en las diversas actividades empresariales se hace necesaria la obtención de pronósticos asociados a diversas variables, como la demanda de un producto, para lo cual se requiere la aplicación de modelos de pronóstico mediante las técnicas de regresión.

Precisamente, el presente libro, producto de la experiencia docente de los autores en la asignatura de Estadística y Probabilidad en las escuelas de Ingeniería y de Negocios de la Universidad de Lima, busca dotar a los estudiantes de los conocimientos teóricos necesarios de esta disciplina para un óptimo desempeño en su futuro profesional.

El texto está constituido por cinco capítulos, y en cada uno de ellos se hace una exposición de los fundamentos teóricos seguidos de un conjunto de problemas resueltos y propuestos; además, se expone el uso del software Minitab, versión 17, como herramienta de apoyo para el desarrollo de los casos prácticos; cuyos respectivos archivos se podrán encontrar en <http://downloads.ulima.edu.pe/fondoeditorial/libros/estadaplic/datos>.

En el capítulo 1 se explican las distintas técnicas de selección de muestras aleatorias, así como las distribuciones de probabilidad de los estadísticos muestrales, con especial énfasis en el teorema del límite central como fundamento del análisis estadístico inferencial.

La estimación de parámetros, estudiada en el capítulo 2, comprende los métodos de obtención, a partir de una muestra, de estimadores puntuales; además, se detalla la construcción de intervalos de confianza para los parámetros de la población.

En el capítulo 3 se realiza un estudio de las pruebas de hipótesis tanto para los parámetros como para las pruebas de bondad de ajuste e independencia; en cada caso se explica la formulación de las hipótesis de evaluación, y el procedimiento de comprobación de las hipótesis expuestas.

En el capítulo 4 se desarrolla el análisis de la regresión lineal simple y la regresión lineal múltiple, mediante una explicación de los supuestos del modelo, y la interpretación de los resultados obtenidos.

El diseño completamente al azar y el diseño de bloques son los temas tratados en el capítulo 5, en los que se resalta las situaciones en las que se deben aplicar cada uno de ellos.

Expresamos nuestro agradecimiento a quienes brindaron su apoyo para que esta obra esté a disposición del público interesado, así como a nuestros alumnos por sus consultas y sugerencias, esperando que responda a las expectativas de nuestros lectores.

Los autores

Capítulo

1 Distribuciones muestrales

Por lo general, el análisis estadístico de datos se realiza con el propósito de obtener conclusiones válidas para una población con base en la información proporcionada por la muestra. De ahí que el conocimiento de las diferentes técnicas de muestreo y cómo se distribuyen los estadísticos muestrales resulta fundamental para obtener los resultados deseados.

Conocimientos previos

Estadística descriptiva, cálculo de probabilidades, distribuciones de probabilidad

Secciones

1. Conceptos básicos

2. Muestra aleatoria

3. Tipos de muestreo

4. Principales estadígrafos

5. Distribución de la media muestral

6. Teorema central del límite

7. Distribuciones de muestras pequeñas

8. Distribuciones muestrales de un estadígrafo

9. Distribuciones muestrales de dos muestras

Sabes

Capacidades adquiridas

Identificar y diferenciar los estadígrafos de posición y de dispersión

Construir la distribución de probabilidad de una variable aleatoria

Calcular e interpretar el valor esperado y la varianza de una variable aleatoria

Hacer uso de la distribución normal con el software Minitab

Piensas

Competencias por lograr

Seleccionar muestras aleatorias con el software Minitab

Reconocer la importancia del teorema central del límite en el análisis estadístico

Haces

Habilidades por desarrollar

Determinar la técnica muestral adecuada para un caso real

Hacer uso apropiado de las distintas distribuciones muestrales

Las poblaciones suelen ser demasiado grandes para estudiarlas en su totalidad; se puede estar interesado, por ejemplo, en determinar el consumo promedio per cápita en una región del país o la proporción de consumidores que prefieren un determinado producto. En estos casos, es preferible elegir una muestra representativa que tenga un tamaño manejable y que permita obtener conclusiones válidas sobre la población objetivo que interesa estudiar. Para el primero de los ejemplos citados, se puede calcular la media aritmética de la muestra de consumidores y utilizarla como una estimación de la media aritmética poblacional μ. Cuando se desea usar una muestra para obtener conclusiones sobre la población, se deben aplicar las técnicas de la estadística inferencial.

En la estadística inferencial se desarrollan dos puntos importantes: el problema de estimación de los parámetros y el de la dócima o prueba de hipótesis, que serán desarrollados en los capítulos posteriores.

1. C ONCEPTOS BÁSICOS

a. Unidad de análisis .- Se define como el elemento que se observa en una población y del que se busca información de características o variables de interés.

b. Población .- Se entiende por población o universo a la totalidad de elementos o unidades de análisis, ya sean empresas, personas, objetos, etcétera, que presentan una o más características observables.

c. Población objetivo .- Es la población completamente caracterizada; por ejemplo, en una encuesta sobre la aceptación de un nuevo producto de belleza de una empresa que produce cosméticos, la población objetivo estará conformada por todas las mujeres que son usuarias de los productos de la empresa, con edades entre 20 y 39 años, pertenecientes al nivel socioeconómico medio alto; a partir de esta población se selecciona una muestra de mujeres para la investigación.

d. Marco muestral .- Se define como el listado de elementos, unidades de análisis, a partir del cual se seleccionará la muestra.

e. Unidad de muestreo .- Son aquellas que contienen las unidades de análisis de la población y que se utilizarán para seleccionar la muestra. En general, la unidad de muestreo se encuentra asociada a la selección de los conjuntos de unidades de análisis que serán tomados en cuenta para conformar la muestra final en la investigación.

f. Error muestral .- Es la diferencia entre el resultado obtenido a partir de una muestra y el que se obtendría de la población; por ejemplo, la diferencia existente entre la media muestral y la media poblacional. También se le denomina error de estimación, y en resumen es el error que se origina debido a que se trabaja sobre una muestra en lugar de la población completa.

2. M UESTRA ALEATORIA

La estimación de parámetros y las pruebas de hipótesis se basan en la información proporcionada por las unidades de análisis, sobre una característica de estudio X, mediante sus valores x1, x2,…, xn. Estas unidades de análisis se eligen de manera independiente y deben tener la misma probabilidad de ser seleccionadas. El conjunto de estas unidades seleccionadas recibe el nombre de muestra aleatoria.

Cuando se trata de poblaciones finitas de N elementos se seleccionarán muestras diferentes sin reemplazamiento, donde ; si el muestreo es con reemplazamiento se seleccionarán k = Nn muestras diferentes.

Definición. Se dice que los valores x1, x2,…, xn de la variable de interés X con función de probabilidad f (x) constituyen una muestra aleatoria de tamaño n, si son variables aleatorias independientes e idénticamente distribuidas.

Es decir, si se sabe que la ley de probabilidad es la misma para cada una de las observaciones, esto es:

f (x1) = f (x2) = … = f (xn)

La función de probabilidad de las observaciones muestrales está dada por:

La expresión (1) se conoce como función de probabilidad conjunta.

3. T IPOS DE MUESTREO

Se dispone de dos métodos para seleccionar las muestras de poblaciones: muestreo probabilístico y muestreo no probabilístico.

3.1 Muestreo probabilístico

En este tipo de muestreo se tiene información de las probabilidades de las unidades de análisis seleccionadas en la muestra. El muestreo probabilístico permite calcular el grado hasta el cual el valor obtenido de la muestra puede diferir del valor correspondiente a la población de interés, esta diferencia recibe el nombre de error muestral. Existen varios tipos de muestreo probabilístico, los cuales se detallan a continuación:

3.1.1 Muestreo aleatorio simple

En este tipo de muestreo cada unidad de la población tiene igual probabilidad de ser seleccionada, se recomienda cuando la variable en estudio es homogénea.

Ejemplo 1

Suponga que se desea seleccionar una muestra aleatoria simple de 20 asistentes, de entre los 100 asistentes de una charla sobre marketing digital. A cada asistente se le asignó un número del 1 al 100.

Con Minitab. Para la obtención de la muestra aleatoria mediante el uso del software Minitab se realiza el siguiente procedimiento:

•Se disponen en una columna los 100 números, un número asignado a cada asistente, tal como se muestra en la figura 1 .

•Con el comando Calc / Random Data / Sample From Columns…

•Colocar el tamaño de la muestra que se desea extraer: 20.

•Seleccionar el marco muestral: Columnas C1 (‘N.° Asistente’).

•Indicar la columna donde se almacenarán los resultados del muestreo: C3. Lo anteriormente expuesto se aprecia en la figura 2 .

Los resultados se almacenarán en la columna C3, tal como se indicó, entonces se procede a etiquetar la columna, por ejemplo: M. Aleatorio Simple. De acuerdo con el resultado (figura 3), la muestra estará conformada por los asistentes cuyos números asignados sean: 27, 25, 75…

Nota: Cada vez que se realice el muestreo se obtendrán resultados diferentes, ya que son resultados aleatorios.

Si se desea los resultados del muestreo se pueden ordenar, para una mejor visualización, mediante el siguiente procedimiento:

•Data / Sort …

•Sort column(s): ‘M. Aleatorio Simple’.

•Señalar el criterio de ordenamiento. By column: ‘M. Aleatorio Simple’.

•Seleccionar la opción ‘Original column(s)’.

Lo anteriormente expuesto se aprecia en la figura 4.

Luego, la muestra aparecerá ordenada en forma ascendente.

3.1.2 Muestreo sistemático

Es un tipo de muestreo que simplifica el proceso de selección de las unidades de análisis, las cuales se seleccionan en un intervalo constante, denominado salto sistemático, que se mide en el tiempo, en el orden o en el espacio. El método requiere la determinación del valor del salto sistemático (k) y elegir un valor de arranque aleatorio (A).

Determinación del salto sistemático: , donde N es el tamaño de la población y n es el tamaño de la muestra.

Elección del arranque aleatorio: se elige un número aleatorio A entre 1 y k, es decir, el valor A se encuentra acotado de la siguiente forma: 1 ≤ A k.

Ejemplo 2

De acuerdo con el ejemplo anterior, relacionado con la charla sobre marketing digital:

Sean: N = 100 y n = 20, entonces se calcula el salto sistemático .

Por lo tanto, el arranque aleatorio se selecciona entre los cinco primeros asistentes registrados (1 ≤ A ≤ 5). Por ejemplo, si A = 2, los demás asistentes serán seleccionados mediante un salto sistemático de k = 5, obteniéndose: 2, 7, 12, 17, 22, …, 97; números relacionados a la numeración asignada a los asistentes.

Software Minitab. Para la obtención de la muestra sistemática mediante el uso del software Minitab se debe proceder como sigue:

•Calc / Make Patterned Data / Simple Set of Numbers…

•Store patterned data in: C5.

•Arranque aleatorio: 2. Último valor de la numeración asignada en el marco muestral: 100. Tamaño del salto sistemático: 5.

Lo anteriormente expuesto se aprecia en la figura 5.

Los resultados se almacenan en la columna C5, luego se procede a etiquetar la columna; por ejemplo: ‘M. Sistemático’. La figura 6 presenta el resultado obtenido.

3.1.3 Muestreo estratificado

En este tipo de muestreo la población se divide en grupos o estratos. El principio básico radica en que los estratos tengan una gran homogeneidad o similitud interna, y heterogeneidad de estrato a estrato. Una vez determinado el número de estratos L y las unidades pertenecientes a cada uno de ellos, el siguiente paso es definir el número de las unidades muestrales por seleccionarse dentro de cada estrato. Este proceso es conocido como Asignación o Afijación de la muestra.

Asignación proporcional de la muestra.- Es un tipo de asignación que consiste en la distribución de la muestra entre los L estratos, de tal manera que el tamaño de cada muestra sea proporcional al tamaño de cada estrato que la origina. Sea N el tamaño de la población y n el tamaño de la muestra, entonces Nh es el tamaño del estrato h, y nh es el tamaño de la muestra en dicho estrato. Se sabe que:

Por consiguiente, nh = (n)Wh, donde , llamado también ponderación del estrato h.

Ejemplo 3

Inka Móvil es una empresa de transporte interprovincial, cuyo gerente desea realizar un estudio de satisfacción de los clientes que residen en las nueve provincias del departamento de Lima, sin considerar Lima provincia, en relación con el servicio de encomiendas. Para la investigación se seleccionará una muestra de hogares de las mencionadas provincias.

a. Indicar, en forma detallada, la población objetivo del estudio.

b. Para el estudio descrito proponga, y justifique, el uso de un tipo de muestreo probabilístico.

c. Si se utiliza un muestreo estratificado, indique cómo se distribuiría el tamaño de muestra entre los estratos, explique.

Solución

a. La población objetivo está constituida por todos los hogares de las nueve provincias del departamento de Lima.

b. Sería adecuado utilizar el muestreo estratificado debido a que la selección se realizará de acuerdo al número de viviendas que tiene cada provincia, los cuales son agrupados en estratos homogéneos (cada provincia).

c. La distribución del tamaño de muestra se realizará mediante la asignación proporcional según el número de viviendas de cada una de las nueve provincias consideradas. Por ejemplo,

–El tamaño de la población lo constituyen todas las viviendas de las nueve provincias.

–Al dividir el número de viviendas de cada una de las provincias entre el total, se obtiene la proporción de viviendas para cada provincia.

–De acuerdo a la proporción de viviendas por cada provincia se distribuirá proporcionalmente la muestra en cada estrato (provincia).

3.1.4 Muestreo por conglomerados

A diferencia de las otras técnicas donde se seleccionan unidades de muestreo, el muestreo por conglomerados divide a la población en grupos o conglomerados, y luego se selecciona una muestra aleatoria de ellos. Por ejemplo, si la unidad de muestreo es la vivienda, el conglomerado puede ser la manzana constituida por viviendas.

La característica del muestreo por conglomerados es que estos son internamente heterogéneos, y homogéneos de conglomerado a conglomerado. Por ejemplo, si se desea muestrear a los empleados de una gran empresa con el propósito de averiguar su percepción con respecto al clima laboral, un primer paso consiste en seleccionar una muestra de las diversas áreas de la empresa, posteriormente se realizaría una selección aleatoria de los empleados dentro de cada una de las áreas que resulten seleccionadas.

3.2 Muestreo no probabilístico

Los métodos de muestreo no probabilísticos, a diferencia de los probabilísticos, no permiten determinar el error de muestreo, no es posible determinar el nivel de confianza sobre la representatividad de la muestra, y no permiten realizar inferencias sobre la población. Existen varios tipos de muestreo no probabilístico, de los cuales los más usados son los siguientes:

3.2.1 Muestreo por cuotas

Es una técnica de uso frecuente en la investigación de mercados, sobre todo en encuestas de opinión. Se basa en el conocimiento de los estratos de una población y de los individuos más representativos de esta; en este tipo de muestreo se seleccionan cuotas de individuos que reúnen ciertas condiciones; por ejemplo, cincuenta clientes de un banco que reciben su estado de cuenta vía un servicio de mensajería. Una vez especificada la cuota, se eligen los primeros clientes que cumplan con estas características.

3.2.2 Muestreo por conveniencia

En este caso, como su nombre lo indica, las unidades que conformarán la muestra se seleccionan de acuerdo a la conveniencia del investigador. Por ejemplo, se puede solicitar a algunos asistentes a un centro comercial que colaboren voluntariamente para probar ciertos productos, y después realizar un proceso de monitoreo con las mismas unidades. También se puede solicitar la opinión de personas que transitan en un punto de alta afluencia peatonal. En cada caso, la unidad de muestreo se selecciona sobre la base de su fácil disponibilidad.

3.2.3 Muestreo de juicio

Este tipo de muestreo consiste en seleccionar las unidades muestrales a juicio del investigador, quien determina a los que representan a la población. Una importante diferencia radica en que la muestra no es típica, sino que el investigador la considera como tal. Como se observa, entonces, la eficacia del muestreo de juicio depende de la opinión del investigador o experto que selecciona las unidades por entrevistar.

4. P RINCIPALES ESTADÍSTICOS

La media y la varianza muestral son los principales estadísticos y se caracterizan porque sus valores varían de muestra a muestra, mientras que la media y la varianza poblacional son valores fijos y en general desconocidos. La media muestral y la varianza muestral están dadas por:

Si se tiene una población conformada por N unidades con parámetros μ y σ², la representación esquemática de la obtención de k muestras de tamaño n con su propia media y varianza, como se presenta en la figura 7:

5. D ISTRIBUCIÓN DE LA MEDIA MUESTRAL

La distribución de la media muestral se determina a partir de sus valores característicos: esperanza y varianza de la media muestral, es decir, si la distribución de la variable X es X ~ (μ; σ²), entonces se sabe que la esperanza de la media muestral es igual a la media poblacional, y que la varianza de la media muestral es igual a la varianza poblacional dividida entre el tamaño de la muestra, es decir:

Se observa que mientras mayor sea el tamaño de la muestra menor será la variabilidad de la media. Por consiguiente,

6. T EOREMA CENTRAL DEL LÍMITE

Sea X una variable aleatoria con cualquier tipo de distribución, con media μ y varianza σ². Si se toma una muestra aleatoria de tamaño n, entonces

Lo que implica que cuando el tamaño de la muestra aumenta, la media muestral estandarizada converge a una distribución normal estándar con media μ = 0 y varianza σ² = 1

Ejemplo 4

El gasto anual, en soles, en el que incurre una empresa para el mantenimiento de cada equipo de cómputo presenta una distribución normal con una media y desviación estándar de S/. 120 y S/. 15, respectivamente. La empresa seleccionó 36 equipos de cómputo para realizarles un seguimiento de sus costos de mantenimiento. Con la media muestral que se obtenga se emitirá una opinión sobre los gastos incurridos, de acuerdo a los siguientes criterios:

•Reducido: si la media muestral es como máximo S/. 117.

•Moderado: si la media muestral es mayor a S/. 117 y menor de S/. 124.

•Excesivo: si la media muestral es por lo menos S/. 124.

a. Luego del seguimiento realizado, ¿cuál es la probabilidad de que se concluya que se ha incurrido en un gasto reducido en relación al mantenimiento de los equipos de cómputo?

b. Luego del seguimiento realizado, ¿cuál es la probabilidad de que se concluya que se ha incurrido en un gasto excesivo en relación al mantenimiento de los equipos de cómputo?

c. Calcule la probabilidad de que luego del seguimiento se señale que la empresa presentó gastos moderados para el mantenimiento de los equipos de cómputo.

d. ¿Cuántos equipos de cómputo se deberían seleccionar para un próximo seguimiento, de tal forma que se tenga una probabilidad de 0.96 de que se concluya que en promedio se han presentado gastos entre S/. 115 y S/. 125?

Solución

a. Se define X : gasto anual, en soles (S/.), de mantenimiento del equipo de cómputo.

X N (120;15²), n = 36

Como S/. 2.5, entonces ∼ N (120;2.5²)

Luego, la probabilidad solicitada es: P(Gasto reducido) = P( ≤ 117)

Al hacer uso del software Minitab se tiene:

•Graph / Probability Distribution Plot …

•Seleccionar View Probability.

•Distribution: Normal. Mean: 120. Standard deviation: 2.5

•Shaded Area: Seleccionar X value y Left Tail. X value: 117

Lo anteriormente expuesto se aprecia en la figura 8.

La probabilidad resultante se aprecia en la figura 9.

Luego: P(Gasto reducido) = P( ≤ 117) = 0.1151

Interpretación: la probabilidad de que se incurra en un gasto reducido es de 0.1151.

b. Del ítem anterior: ~ N (120;2.5 ² )

Luego, la probabilidad solicitada es: P(Gasto excesivo) = P( ≥ 124)

Haciendo uso del software Minitab:

•Graph / Probability Distribution Plot …, seleccionar View Probability.

•Distribution: Normal. Mean: 120. Standard deviation: 2.5

•Shaded Area: Seleccionar X value y Right Tail. X value: 124

Lo anteriormente expuesto se aprecia en la figura 10.

La probabilidad resultante se aprecia en la figura 11.

Luego: P(Gasto excesivo) = P( ≥ 124) = 0.0548

Interpretación: la probabilidad de que se incurra en un gasto excesivo es de 0.0548.

c. Del ítem (a): ∼ N (120;2.5 ² )

Luego, la probabilidad solicitada es: P(Gasto moderado) = P(117 ≤ ≤ 124)

Al usar el software Minitab:

•Graph / Probability Distribution Plot …, seleccionar View Probability.

•Distribution: Normal. Mean: 120. Standard deviation: 2.5

•Shaded Area: Seleccionar X value y Middle. X value 1: 117, X value 2 = 124

Lo anteriormente expuesto se aprecia en la figura 12.

La probabilidad resultante se aprecia en la figura 13.

Luego: P(Gasto moderado) = P(117 ≤ ≤ 124) = 0.8301

Interpretación: existe una probabilidad de 0.8301 de que la empresa presente gastos moderados.

d. Hallar el valor del tamaño de muestra n , tal que P (115 < < 125) = 0.96

Como la distribución normal estándar es simétrica respecto del origen de coordenadas, se tiene que las probabilidades idénticas de ambos extremos de la gráfica (colas) deben sumar 0.04, es decir, la diferencia con respecto a la unidad.

Al hacer uso del software Minitab:

•Graph / Probability Distribution Plot …, seleccionar View Probability.

•Distribution: Normal. Mean: 120. Standard deviation: 2.5

•Shaded Area: Seleccionar Probability y Both Tails. Probability: 0.04

Lo anteriormente expuesto se aprecia en la figura 14.

El valor de la abscisa resultante se aprecia en la figura 15.

Se debe igualar el valor de la abscisa correspondiente:

Entonces:

Interpretación: se deberían seleccionar 38 equipos de cómputo.

6.1 Aplicación del teorema central del límite a diferentes distribuciones

El teorema central del límite es útil para aproximar la distribución de la media muestral ( ) a una distribución normal, cuando la muestra aleatoria es obtenida de diferentes distribuciones de probabilidad para valores grandes del tamaño n de la muestra.

6.1.1 Distribución de Poisson

Sea la variable aleatoria X ~ P(λ), con E(X) = λ, y V(X = λ

Si se seleccionan muestras de tamaño n, con n suficientemente grande, la distribución de la media muestral es:

. Es decir:

y por el teorema central del límite se tiene

Ejemplo 5

M-Design es una empresa que brinda el servicio de pintura personalizada de motos y cuatrimotores. Luego del estudio se determinó que el número de personas interesadas en el servicio ofrecido, clientes que se apersonan o realizan llamadas para consultar por dicho servicio, presenta una distribución de Poisson con una media de 16 personas por día. Suponga que se seleccionan al azar 64 días y se registra el número diario de personas interesadas, ¿cuál es la probabilidad de que la media muestral de personas interesadas difiera de la media poblacional en a lo más 1 persona?

Solución

Se define:

X: Número diario de personas interesadas en el servicio ofrecido.

X ~ Poisson(λ = 16)

Como , por el teorema central del límite: ~ N(16;0.5²)

Luego, la probabilidad solicitada es:

Interpretación: la probabilidad de que la media muestral difiera de la media poblacional, en a lo más 1 persona es de 0.9545.

6.1.2 Distribución uniforme

Sea X una variable aleatoria con distribución uniforme U(α; β), entonces

Si se toma una muestra de tamaño n la distribución de la media muestral es

, es decir

y por el teorema central del límite, resulta

Ejemplo 6

Se sabe que el espesor de unas placas de acero es una variable aleatoria con distribución uniforme entre 12.52 y 12.88 milímetros.

a. Si se seleccionan 48 placas de acero, ¿cuál es

Has llegado al final de esta vista previa. ¡ para leer más!
Página 1 de 1

Reseñas

Lo que piensa la gente sobre Estadística aplicada a la ingeniería y los negocios

3.5
8 valoraciones / 1 Reseñas
¿Qué te pareció?
Calificación: 0 de 5 estrellas

Reseñas de lectores

  • (1/5)
    FATAL NO HAY LIBROS DE ESTADISTICA INFERENCIAL 2 SOLO LA 1 Y NO M SIRVE