Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica I PDF
Estadistica I PDF
MATERIAL DE APOYO
ESTADÍSTICA I
ADMINISTRACIÓN DE EMPRESAS
ECONOMÍA APLICADA
FINANZAS
MARKETING
Recopilado por
Clara Pastora Téllez
Mayo, 2015
Índice de contenido
Objetivos / Introducción………………………………………………………………………………………………………… 3 2
1. Unidad I: Estadística Descriptiva ……………….………………………………………………….. 3
Ramas de la estadística………………………………………………………………….. 5
Conceptos …………………………………………………………………………………. 5
Escalas de medición …………………………………………………………………… 8
Actividad de Autoaprendizaje N° 1 ………………………………………. 9
Organización de datos …………………………………………………………………… 12
Gráficas estadísticas ………………………………………………………………….. 16
Actividad de Autoaprendizaje N° 2 ……………………………………… 17
Medidas de tendencia central …………………………………………………….. 21
Media ………………………………………………………………………………… 21
Mediana……………………………………………………………………………….. 23
Moda …………………………………………………………………………………. 24
Medidas de tendencia no central…………………………………………………. 24
Cuartiles y Percentiles …………………………………………………….. 24
Medidas de variación o dispersión ……………..…………………………….. 26
Varianza, Desviación estándar …………………………………….. 26
Coeficiente de variación………………………………………………….. 27
Actividad de Autoaprendizaje N° 3 ……………………………………… 29
2. Unidad II: Introducción a las Probabilidades y Modelos de Probabilidad 31
Enfoques de probabilidad y Conceptos ………………………………………. 31
Reglas de Probabilidad …………………………………………………….. 33
Actividad de Autoaprendizaje N° 4 ………………………………………. 37
Teorema de Bayes …………………………………………………………………… 41
Actividad de Auto aprendizaje N° 5 ……………………………………… 42
Distribución de probabilidad ……………………………………………………. 44
Actividad de Autoaprendizaje N° 6 …………………………………….. 46
Distribución Binomial ………………………………………………………………….. 47
Actividad de Autoaprendizaje N° 7 ……………………………………… 49
Distribución de Poisson…………………………………………………………………. 49
Actividad de Autoaprendizaje N° 8 ……………………………………… 52
Distribución Normal ………………………………………………………………….. 53
Actividad de Autoaprendizaje N° 9 ……………………………………… 58
3. Unidad III: Inferencia Estadística …………………………………………………………………… 59
Distribución muestral para la media ……………………………………… 59
Teorema de Limite Central …………………………………………………… 62
Actividad de Autoaprendizaje N° 10 …………………………………….. 63
Estimación por intervalo y tamaño de muestra …………… …………. 64
Actividad de Autoaprendizaje N° 11 …………………………………….. 69
Prueba de Hipótesis …………………………………………………………………. 71
Actividad de Autoaprendizaje N° 12 …………………………………….. 80
Prueba de independencia…..……………………………………………. 82
Actividad de Autoaprendizaje N° 13 ……….……………………………. 84
4. Guías de Laboratorio ………………………………………………………………………………………………. 85
Referencias ……………………………………………………………………………………………………………. 102
Objetivos
1. Apropiarse de la terminología usada en el área estadística, con el fin de impulsar la
3
adquisición de cultura estadística por parte de los estudiantes.
2. Identificar maneras adecuadas para la presentación de información y adquirir las
destrezas para construir tablas y gráficos estadísticos.
3. Se pretende lograr un aprendizaje significativo con la construcción de objetos de
aprendizaje en cada una de las unidades, además, del apoyo de herramientas de software
estadístico.
4. Se espera que el curso sea ameno y provechoso para todos (as), logrando potenciar al
estudiante en la aplicación de la estadística y fortaleciendo además, otros valores como: la
honestidad, solidaridad y trabajo en grupo.
Introducción
El presente material de estudio no pretende sustituir a ningún texto de Estadística, por el
contrario es un esfuerzo que trata de resumir los temas que se requieren para cursar la
asignatura; los estudiante que deseen profundizar en el contenido del programa, deben realizar
las consultas necesarias para completar el conocimiento de esta disciplina.
El material cuenta con tres unidades donde se presenta una introducción, el desarrollo
teórico, ejercicios resueltos paso a paso, ejercicios propuestos y un formulario creado para
cada unidad. La temática se resume en: Estadística descriptiva, Introducción a las
Probabilidades y Modelos de Probabilidad e Inferencia Estadística.
UNIDAD I
ESTADÍSTICA DESCRIPTIVA
En esta Unidad se hará un pequeño recorrido por la historia de la estadística, mencionando
algunos de los personajes que la impulsaron, recalcando sus progresos y aportes a través del
tiempo.
El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en
épocas remotas. Se tiene información de hace más 3000 años antes de Cristo, donde las
antiguas civilizaciones, como la Egipcia, aplicaron continuamente censos que ayudaban a la
organización del estado y la construcción de las pirámides.
El antiguo testamento nos sugiere que Moisés ordenó un “Censo” a la población Israelita
para identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano,
era común la aplicación de censos para la planificación de impuestos y la prestación del
servicio militar.
La primera persona que introdujo el término estadística en Inglaterra fue Sir John
Sinclair (1754-1835) con su trabajo “Statistical Account of Scotland” (1791-1799)
trabajo compilado en 21 volúmenes. El autor explica en su libro, que la palabra
estadística la adoptó gracias al estudio de investigaciones realizadas en Alemania, como
una palabra novedosa que llamaría la atención de los ingleses.
A comienzos del siglo XIX, la palabra estadística adopta un significado más generalizado
hacia la recolección y clasificación de cualquier tipo de datos cuantitativos.
Herman Hollerith (1860-1929) fue un estadístico estadounidense quien desarrolló
la primera máquina tabuladora basada en tarjetas perforadas y mecanismos eléctrico-
mecánicos para el tratamiento rápido de millones de datos. Su máquina fue usada en el
censo de 1890 en Estados Unidos que redujo la tabulación de los datos de 7 años (censo 4
de 1880) a 2.5 años. Creó la firma “Computing Tabulating Recording Corporation (CTR)”,
que bajo la presidencia de Thomas J. Watson fue renombrada a “International Business
Machines (IBM)” en 1924.
1. Definición
1.1 Estadística es una disciplina que apoya el proceso de toma de decisiones en diversas
áreas del conocimiento, además, de entregar pautas para la presentación adecuada de
información.
1.2 Estadística es la ciencia que utilizando las matemáticas y de modo particular el c á lc ul o
pa ra estud i a r l a s l eye s d e c om po rta m iento d e a quel l os fenóm e nos qu e no
esta nd o sometidos a leyes rígidas dependen del azar y basándose en ella, se predicen resultados.
1.3 El famoso diccionario Inglés Word Reference define la estadística como un área de la
matemática aplicada orientada a la recolección e interpretación de datos cuantitativos
y al uso de la teoría de la probabilidad para calcular los parámetros de una población.
2. Estudio de la Estadística
Existen dos razones por las cuales el campo de acción de la estadística y la necesidad de un
estudio han crecido enormemente en las últimas décadas. Una razón es que el enfoque cada
vez más cuantitativo que se emplea en todas las ciencias, así como en las empresas y en
otras actividades que afectan nuestras vidas. Esto incluye el uso de técnicas matemáticas
para la evaluación de controles contra la contaminación, la planeación de inventarios, el
estudio de la nutrición, la longevidad, la evaluación de técnicas de enseñanza, etc.
La otra razón es que la cantidad de información estadística que se recolecta, procesa y
disemina al público, por un motivo o por otro ha crecido casi más allá de nuestro
entendimiento, y algo que todo mundo se pregunta es qué parte de ella es estadística
“pura” y qué parte es “impura”.
3. Aplicaciones
3.1 Una compañía que fabrica equipos electrónicos complejos produce algunos equipos que
funcionan adecuadamente, pero también algunos que, por razones desconocidas, no
funcionan adecuadamente. ¿a que se debe que algunos sean buenos y otros no?
3.2 El departamento de control de calidad de una compañía se encarga de vigilar la
producción en forma continua, aplicando muestreo y otras técnicas estadísticas
comunes.
3.3 El contralor y el departamento de contabilidad de una empresa se encargan de la
exactitud en los cálculos financieros. Ya que resulta físicamente imposible verificar cada
documento y determinar su exactitud, se realiza un muestreo de las facturas y se toman
decisiones en base a los resultados de la muestra.
3.4 El departamento de mercadotecnia de una empresa realizará pruebas con los
consumidores y proyectan las ganancias con base en los resultados de la muestra.
3.5 Los analistas de investigación evalúan muchos aspectos de una acción o valor antes de
hacer una recomendación de compra o venta. Recopilan los datos de ventas anteriores de
la empresa y estiman las ganancias futuras.
3.6 El gobierno realiza un gran número de encuestas para determinar la condición actual de
la economía y la predicción de las tendencias económicas futuras. Se elaboran índices,
como el índice de precios al consumidor con el objeto de evaluar la tendencia
inflacionaria.
5
3.7 Los consumidores utilizan los precios unitarios para decidir la cantidad o calidad del
producto a comprar.
3.8 Los resultados de sondeos de opinión pública se presentan en los medios de comunicación.
Estos abarcan muchos temas, como evaluación del desempeño de las alcaldías, ministerios,
asamblea nacional, incluso al presidente, el impacto de las medidas económicas, etc.
3.9 Dificultades que encuentran los estudiantes al momento de realizar lectura de textos, su
nivel de comprensión, etc.
4. Ramas de la estadística
Una de las ramas de la Estadística más accesible a la mayoría de la población es la
Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento de
la información para su presentación por medio de tablas y de representaciones gráficas,
así como de la obtención de algunos parámetros útiles para la explicación de la información
(la media y la desviación estándar). Es un primer acercamiento a la información.
Estadística Descriptiva
La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo,
4.1 edad de una población, altura de los estudiantes de una escuela, temperatura en
los meses de verano, etc.) y trata de extraer conclusiones sobre el
comportamiento de estas variables.
Estadística Inferencial
4.2
Basándose en los resultados obtenidos de una muestra induce o estima las leyes
reales del comportamiento de la población de la que proviene dicha muestra.
5. Conceptos básicos
Población
Ej. 1
Son Población
todos (se simboliza
y cada uno por N) que se quieren analizar. Puede ser finita o infinita (en
de los elementos
1.1 lasEstudiantes
realidad poblacionesde Ingeniería
infinitas en Sistema
no existen, perode Nicaragua.
cuando se trata de un número grande se supone
como si lo fuera).
1.2 Trabajadores de una compañía industrial.
1.3 Producción textil en una zona franca.
6
1.4 Clientes de un banco.
Muestra
Es un subconjunto de la población o parte de la población que se observa.
(Característica de una población es la propiedad que se estudia.)
Parámetro
Característica numérica de una población.
Estadístico
Característica numérica de una muestra.
Variable
Es una forma de expresar una característica de un grupo de elementos de estudio, como
el peso de una persona, su estatura, el color de sus ojos,…una población o de una muestra
Categórica
Variable
Continua
Numérica
Discreta
Ej. 4 Clasifique cada una de las siguientes variables en categórica o numéricas (discreta o
continua).
Variable Tipo de variable
1 Nacionalidad
Tipo de accidente que
2
ocurren en una Empresa
3 Salario mensual (C$)
4 N° de artículos defectuosos
5 Temperatura (°C)
Cuando se estudia el comportamiento de una variable hay que distinguir el siguiente concepto:
Individuo
Cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si
estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos
el precio de la vivienda, cada vivienda es un individuo.
ACTIVIDAD DE AUTOAPRENDIZAJE N° 1
1. Origen y Evolución de la Estadística.
Escriba un ensayo que trate del origen y evolución de la estadística.
2. Describa con sus palabras cada uno de los siguientes términos, proporcionando además tres
ejemplos diferentes a los vistos en clase.
a. Población b. Muestra c. Dato
d. Variable e. Atributo f. Parámetro
g. Estadístico
3. Ilustración
Un estudiante de estadística desea tener una idea acerca del valor (en unidades
monetarias) del automóvil típico que poseen los profesores de su universidad. Para esto se
aplica cada uno de los términos básicos que se han definido.
3.1 La población es el conjunto de todos los vehículos de los profesores de la
universidad.
3.2 Una muestra es una porción o parte de una población. Por ejemplo el número de
automóviles cuyos propietarios son los profesores del departamento de matemáticas, 10
es una muestra.
3.3 La variable es el valor real de cada automóvil.
3.4 Un dato es el valor de un vehículo en particular. Por ejemplo, el auto del profesor
Miranda esta valuado en 12 mil dólares.
3.5 Los datos son el conjunto de valores que corresponden a la muestra obtenida (8, 10,
12 miles de $, …)
3.6 El parámetro acerca del cual se busca información es el valor “promedio” en la
población.
3.7 El estadístico que se encontrará es el valor “promedio de la muestra”
6.1 ¿Se consideran las 112 acciones una muestra o una población? Explique.
6.2 ¿Cuál es el nivel de medición? Explique.
6.3 ¿Son las categorías mutuamente excluyentes? Explique.
11. Suponga que el gerente de la división de servicios al cliente de Xenith está interesado
principalmente en determinar si los clientes que han comprado una computadora durante
los últimos 12 meses quedaron satisfechos con el producto. Usando las tarjetas de garantía
entregadas después de la compra, el gerente planea encuestar a 1425 de estos clientes.
11.1 Describa tanto la población como la muestra de interés para el gerente.
11.2 Describa el tipo de dato que el gerente desea recolectar principalmente.
11.3 Desarrolle un primer borrador del cuestionario escribiendo una serie de siete
preguntas categóricas y cinco numéricas que piensa serian apropiadas para esta
encuesta.
Distribución de frecuencia
Es la representación estructurada, en forma de tabla, de toda la información que se ha
recogido sobre la variable que se estudia.
…
Tabla de frecuencias
Una distribución de frecuencias es una tabla en la que se organizan los datos en clases, es
14
decir, en grupos de valores que describen una característica de los datos y muestra el
número de observaciones del conjunto de datos que caen en cada una de las clases.
En todos los casos debe comprobarse que la diferencia entre el límite superior e
inferior de cada clase sea igual al ancho de la clase menos una unidad de variación.
Clasificación ordenada
70 72 73 76 76 77 78 78 79 79
79 81 83 84 85 86 86 87 87 88
88 91 92 93 94 96 97 97 98 98
Cálculo del ancho de clase
15
( Máx. valor observado Mín. valor observado)
c
1 3.322 log n
(98 70)
c 4,7014138 5
1 3,322 log 30
Distribución de frecuencias
Calificación N° de % de solicitantes Marca Limites reales
solicitantes (f) (fa) (fr) (fra) de clase
70 - 74 3 3 0,1000 0,1000 72 69,5 - 74,5
75 - 79 8 11 0,2666 0,3666 77 74,5 - 79,5
80 - 84 3 14 0,1000 0,4666 82 79,5 - 84,5
85 - 89 7 21 0,2333 0,7000 87 84,5 - 89,5
90 - 94 4 25 0,1333 0,8333 92 89,5 - 94,5
95 - 99 5 30 0,1666 1,0000 97 94,5 - 99,5
Ej. 8
Planes de estudio superior. N° de estudiantes del último año de
secundaria
Planea ir a la universidad. 240
Quizá vaya a la universidad. 146
Planea ir o quizá vaya a una escuela técnica. 57
No irá a ninguna universidad. 105
Total 548
9. Representación gráfica
Una gráfica es la representación de datos, generalmente numéricos, mediante líneas,
16
superficies o símbolos, para ver la relación que esos datos guardan entre sí. Sirven para
analizar el comportamiento de un proceso, o un conjunto de elementos o signos que
permiten la interpretación de un fenómeno.
9.1 Histograma
Los histogramas no muestran frecuencias acumuladas, son preferibles para el tratamiento
de datos cuantitativos y la barra con mayor altura representa la mayor frecuencia. La
sumatoria de las alturas de las columnas equivale al 100% de los datos.
9.3 Ojiva
La diferencia fundamental entre las ojivas y los polígonos de frecuencias es que en el eje
horizontal (x) en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor y para la ojiva menor que, la
mayor.
Una gráfica similar al polígono de
frecuencias es la ojiva, pero ésta se obtiene
al aplicar parcialmente la misma técnica a
una distribución acumulativa y de igual
manera que éstas, existen las ojivas
mayores que y las ojivas menores que.
ACTIVIDAD DE AUTOAPRENDIZAJE N° 2
1. Los siguientes datos muestran el resultado de un estudio de la cantidad de dinero (en C$)
que gastan por visita 50 clientes a un supermercado.
482,5 639,3 1 602,0 1 580,0 1 140,1 1 200,7 1 000,2 854,8 650,9 1 050,3
1 100,0 525,6 998,3 1 230,4 980,9 1 251,0 850,9 340,0 876,6 1 225,1
1 600,7 1 504,8 1 432,5 1 300,9 1 432,8 1 504,2 1 600,0 1 225,2 876,4 1 142,5
8 25,5 1 003,4 636,7 1 110,1 624,6 1 004,0 1 302,6 1 590,0 1 120,4 1 400,8
589,8 960,5 845,7 1 234,5 854,8 636,9 235,1 1 548,0 1 320,3 1 380,0
240 260 275 278 246 250 290 230 248 240
235 292 235 238 290 220 287 249 295 262
265 292 235 238 290 220 287 249 295 262
238 226 248 237 298 243 235 250 254 245
2.1 Clasifique la variable involucrada y desarrolle la clasificación ordenada.
2.2 Organice los datos en una tabla de distribución de frecuencia.
2.3 Presente estos datos mediante un: Histograma, Polígono de frecuencia,
Ojiva y Ojiva porcentual.
3. Los siguientes datos representan el precio (en $) al menudeo de una muestra de 30
diferentes marcas de jabón para baño.
18
1,5 1,8 1,7 2,0 2,1 2,3 1,9 1,8 1,4 1,3
1,6 2,4 3,1 1,6 1,2 1,3 1,2 1,0 1,1 1,6
0,9 0,8 0,7 1,4 1,9 0,5 1,9 1,7 1,4 1,5
90 48 40 70 87 75 35 73 78 82
71 82 73 89 80 64 60 74 76 60
57 65 81 63 50 63 85 78 47 68
73 55 64 69 74 75 78 67 78 45
Distancia N° de
(en km.) empleados
5 - 9 9
10 - 14 15
15 - 19 20
20 - 24 18
25 - 29 10
30 - 34 8
Total 80
7. Los siguientes datos representan las acciones de mercado (en porcentaje) propiedad de un
fabricante de software de aplicaciones de negocios de Windows durante el año 2012.
Fuente %
Papel 20
Basura de jardín 10
Desechos sólidos 26
Vidrio 6
Metales 9
Plástico 10
Madera 5
Otros 14
10. Los siguientes datos representan el crédito de la banca privada a empresas y particulares
(en millones de $) en los meses de abril a agosto de 2013. Presente estos datos mediante
una Gráfica de barras y una Gráfica de líneas. Comente estas gráficas.
Mes Crédito
Abril 22,8 20
Mayo 20,5
Junio 34,0
Julio 38,6
Agosto 40,0
11. Los datos de la tabla siguiente fueron tomados de los indicadores económicos del BCN,
publicados en noviembre de 2014 y muestran las fuentes de los ingresos del gobierno en
noviembre de 2013. Presente y comente esta información mediante un diagrama circular.
12. El análisis y el pago de los reclamos a un seguro es un complejo proceso que puede llevar a
tramitar incorrectamente algunos de estos. Estos errores provocan un aumento del tiempo
que dedica el personal a obtener información correcta y posiblemente pagar
indemnizaciones indebidas. El beneficiario normalmente detecta los errores cuando cobra
una indemnización menor de la debida. Estos errores pueden incrementar
considerablemente los costos, además de afectar negativamente las relaciones con los
clientes. La siguiente tabla muestra con que frecuencia ocurre este tipo de error en la
tramitación de reclamos al seguro medico. Presente la información en un Diagrama de
barras.
Tipo de error Frecuencia
Código de procedimientos y diagnóstico 40
Información del proveedor 9
Información del paciente 6
Tablas de precios 17
Solicitudes de contratos 37
Ajustes de los proveedores 7
Otros 4
13. La tabla siguiente muestra los datos publicados en los indicadores económicos del BCN y
son datos preliminares correspondientes a agosto de 2012. Construya una gráfica de
pastel de las exportaciones de acuerdo a su tipo.
Categoría Cantidad
(millones de $)
Agropecuaria 48,5
Manufacturera 32,0
Artesanías 24,5
Otros 15,0
Total
14. Los siguientes datos ilustran la participación de los diversos valores operados en el
mercado de dinero de la bolsa de valores de Nicaragua al 31 de enero de 2013. Presente
21
estos datos mediante un Diagrama circular.
Ej: 9 La gerente de una tienda de ropa para damas, desea estudiar el “tránsito” en su tienda,
descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas entraron a
la tienda durante los pasados diez días. Determine el número medio de personas que
entraron a la tienda durante esos días.
x
x i
295 300 ... 520 700
478
n 10
En conjunto, el número de personas que entraron a la tienda durante los pasados
10 días es 478, éste es el número medio (o promedio) de personas que visitaron la
tienda por día.
Es decir el incremento porcentual promedio del costo del algodón fue de 9,59%
aproximadamente, durante ese periodo.
Según el tipo de dato que se analice será más apropiado usar la media aritmética o la media
geométrica, esta se suele utilizar en series de datos como tipos de interés anual, inflación,
etc., donde el valor de cada año tiene un efecto multiplicativo sobre los años anteriores.
En todo caso, la media aritmética es la medida de posición central más utilizada y lo más
positivo es que en su cálculo se utilizan todos los valores, por lo que no se pierde ninguna
información. Sin embargo, presenta el problema de que su valor (tanto en el caso de la media
aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten
en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el
valor de la media, perdiendo ésta representatividad.
xw
w xi i
w i
xw
w x
i i
60(12) 100(14) 40(16) 2760
13,8 cientos de $
w i 60 100 40 200
El precio promedio de venta de los 200 pasajes es de $1 380
n
H
1
x
i
Ej: 13 Calcular el rendimiento promedio para el caso de tres automóviles que recorrieron
500 kilómetros y cada auto tuvo el rendimiento siguiente:
Auto A B C
Rendimiento (km/litro) 50 62,4 77,6
n 3 3
H 61,33434215
1 1 1 1
x
50 62,4 77,6
0,048912238
i
Ej: 14 La gerente de una tienda de ropa para damas, desea estudiar el “tránsito” en su
tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez días. Determine el número mediano de
personas que entraron a la tienda durante esos días.
Ordenar datos,
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
295 300 350 400 495 520 520 520 680 700
n = 10 (par)
Posición: M X
24
e 101 X 5, 5
2
495 520
Se ubica entre la posición 5 y 6 M e X 5, 5 507,5 508
2
En este ejemplo, la mediana se sitúa exactamente entre el quinto y sexto dato de este grupo,
ya que entre estos dos valores se encuentra la división entre el 50% inferior y el 50% superior.
Ej: 15 Los tiempos en minutos que necesitan varias empresas de seguro para revisar
solicitudes de servicios de cobertura médica son: 230 50 180 63 120 Determine
el tiempo mediano de servicio de cobertura de las empresas de seguro.
Ordenar datos,
X1 X2 X3 X4 X5
50 63 120 180 230
n = 5 (impar)
Posición: M e X 51 X 3 [Se ubica en la posición 3]
2
M e X 3 120 mi n.
El tiempo mediano de servicio para revisar las solicitudes de seguro médico es de 120
min.
295 300 520 350 400 520 495 680 520 700
Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los
resultados. Los deciles y percentiles se calculan de igual manera,
Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma
creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra
el 1% de los resultados. La posición para determinar los percentiles es:
Pp : X p
( n 1)
100
Ej: 17 Los siguientes datos se refieren a las ganancias por acción de 10 compañías de la
industria textil.
4,62 1,34 1,62 2,11 1,29 6,04 9,56 4,90 0,84 7,25
17.1 ¿Cuál es la ganancia máxima por acción del 25% de las compañías?
n = 10
Q : X n 1 Q1 : X 101 X 2,75
Posición: 1 4
4
Es decir el 25% de las compañías tienen como ganancia máxima 1,33 por acción.
17.2 ¿Cuál es la ganancia máxima por acción del 60% de las compañías?
Lo que nos muestra es, el 60% de las compañías tienen como ganancia máxima 4,79
por acción.
17.3 ¿Cuál es la ganancia máxima por acción del 75% de las compañías?
…
17.4 ¿Cuál es la ganancia máxima por acción del 90% de las compañías?
…
12. Medidas de variación o dispersión
Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o
26
menos concentrados, o más o menos dispersos. Existen diversas medidas de dispersión,
entre las más utilizadas podemos destacar las siguientes:
Rango: Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el
valor más elevado y el valor más bajo.
Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula
como la sumatoria de las diferencias al cuadrado entre cada valor y la media, dividida
por el tamaño de la muestra menos uno.
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, más dispersos están.
s2
(x i x) 2
n 1
s
(x i x) 2
n 1
Interpretación
La desviación estándar es una medida del grado de dispersión de los datos con respecto
al valor promedio. Dicho de otra manera, la desviación estándar es simplemente el
"promedio" o variación esperada con respecto a la media aritmética.
Por ejemplo, las tres muestras
Muestras
0 0 6
0 6 6
14 8 8
14 14 8
Cada una tiene una media de 7. Sus desviaciones estándar muestrales son 8,0829,
5,7735 y 1,1547 respectivamente. La tercera muestra tiene una desviación mucho
27
menor que las otras dos porque sus valores están más cerca de 7.
s
CV (100%)
x
Coeficiente de asimetría: Karl Pearson desarrollo una medida para calcular el sesgo de
una distribución, llamado Coeficiente de Asimetría. El concepto de asimetría se refiere,
si la curva que forman los valores de la serie presenta la misma forma a izquierda y
derecha de un valor central (media aritmética).
Para medir el nivel de asimetría se utiliza la fórmula que viene definida por:
3( x M e )
CA
Características. s
Varía de – 3.0 a + 3.0
Un valor cero indica una distribución simétrica.
Si el extremo largo de la distribución esta a la derecha, se dice que tiene sesgo
positivo.
Si el extremo largo de la distribución esta a la izquierda, el sesgo es negativo.
Sustituimos en la fórmula:
s
(x x) i
2
183310
20367,77778 142,7157237 143
n 1 10 1
La cantidad promedio de personas que visitan la tienda es de 478, con una dispersión de
143 personas aproximadamente, con respecto a la media.
4. Suponga que la población de una ciudad en 2004 fue de 2 millones de personas y el número
estimado para el año 2014 fue de 5,3 millones. ¿Cuál fue el incremento porcentual
promedio estimado?
5. Una compañía maneja 4 productos y los márgenes de utilidad son. Determine el margen de
utilidad promedio.
Producto Margen de utilidad Ventas
A 4,2 300 000
B 5,5 200 000
C 7,4 500 000
D 10,1 300 000
6. Suponga que los precios de cinco acciones de alta tecnología se incrementaron desde 2010
en 37,1 39,3 40,5 45,9 48,2 % respectivamente. ¿Cuál es el incremento
porcentual promedio en el precio de las cinco acciones?
7. La sucursal de una gran fábrica de aparatos eléctricos está haciendo los pronósticos de sus
ventas regionales para el siguiente año. La sucursal del norte, cuyas ventas anuales
30
ascendieron en este momento a $193,8 millones, deberá alcanzar un crecimiento de ventas
de 7,25 %, la sucursal del oeste cuyas ventas son actualmente de $79,3 millones, deben
crecer 8,20% y la sucursal del sur, con ventas de $57,5 millones, deberá crecer en 7,15%
¿Cuál es la tasa promedio del crecimiento de ventas que se pronostican para el siguiente
año?
12. Un analista estudió el consumo de agua potable de una muestra de 6 familias y obtuvo los
resultados siguientes, en metros cúbicos (m3)
45 38 47 41 35 43
Calcule:
12.1 La varianza y la desviación estándar muestral.
12.2 Reste 35 a cada una de las mediciones originales y calcule s y s. Compare los
2
para el nuevo conjunto de datos. ¿Qué relación existe entre esta s y la de los datos
2
originales? Explique.
13. Considere el siguiente par de muestras:
Muestra 1 10 9 8 7 8 6 10 6
Muestra 2 10 6 10 6 8 10 8 6
13.1 Calcule el rango de ambas muestras. ¿Es posible concluir que las dos muestras exhiben
la misma variabilidad?
13.2 Calcule la desviación estándar de cada una de las muestras. ¿Estas cantidades indican
que las dos muestras tienen la misma variabilidad?
13.3 Calcule el coeficiente de variación de cada una de las muestra y diga cuál de las
muestras presenta menor variabilidad relativa.
14. Una investigación realizada por un grupo de estudiantes de Administración de Empresas en el
año 2013, que incluía la variable cantidad de dinero gastado semanalmente en material
31
didáctico, algunos de los resultados son,
C$ 123 210 235 126 208 160 110 107 123 120
UNIDAD II
INTRODUCCIÓN A LAS PROBABILIDADES Y MODELOS DE PROBABILIDAD
Introducción
Para la mayoría de las personas, “probabilidad” es un término vago utilizado en el lenguaje
cotidiano para indicar la posibilidad de la ocurrencia de un evento futuro. Esta interpretación
práctica del término puede considerarse aceptable, pero se pretende lograr una comprensión
más precisa del contexto de su aplicación, como se mide y de que manera se utiliza la para
hacer inferencias. El concepto de probabilidad es necesario cuando se opera con procesos
físicos, biológicos y sociales que generan observaciones que no es factible predecir con
exactitud. Además, la probabilidad y la estadística se relacionan en una forma muy curiosa. En
esencia la probabilidad es el vehículo que le permite al estadístico usar la información
contenida en una muestra para hacer inferencias o para describir la población de la cual se ha
obtenido la muestra.
1. Enfoques de Probabilidad
Probabilidad clásica a priori.
En este caso la probabilidad de éxito se basa en el conocimiento anterior al
involucrado.
N de resultados favorables
Pr obabilidad de éxito
N total de resultados
Ej: 1. La probabilidad de sacar una carta con figura negra de una baraja.
2. La probabilidad que la suma de las caras de dos dados sea siete.
Probabilidad subjetiva
Se refiere a la probabilidad de ocurrencia asignada a un evento por un individuo
particular.
Ej: 1. La probabilidad que tenga éxito un nuevo producto en el mercado.
2. La probabilidad que un conservador gane la próxima elección presidencial. 32
Ej: 2.2 Con referencia a E1 : Suponga que la capacidad productiva del obrero se
encuentra entre 50 y 60 unidades diarias inclusive. Entonces S 50, 51, ....,60
Evento (o Suceso).
Un evento simple es el que se puede describir con una característica.
Se simboliza por A, B, C...
Ej: 2.3 Para E 2 existen 3 eventos simples.
A : Votante simpatizante PLC. B : Votante simpatizante FSLN.
C : Votante simpatizante PLI.
El complemento de un evento A , incluye todos los eventos que no son parte del
evento A . Su símbolo es A .
Un evento conjunto es un evento que tiene dos o más características.
Ej: 2.4 Para E3 podemos determinar eventos conjuntos como,
F y S : Estudiante mujer y con alta puntuación.
M y B : Estudiante varón y con baja calificación.
3. Axiomas de Probabilidad
Suponga que un espacio muestral S , está asociado a un experimento. A cada evento A
definido en S A S , se le asigna un número P(A) , llamado probabilidad de A , de tal
manera que cumpla lo siguiente.
3.1 P( A) 0 3.4 P( S ) 1
3.2 0 P( A) 1 3.5 P( ) 0
3.3 P( A) 1 P( A)
4. Probabilidad Simple o Marginal
Significa la probabilidad de ocurrencia de un evento simple P(A).
33
Ej: 4.1 La probabilidad que un estudiante obtenga una puntuación alta en la asignatura de
Estadística.
4.2 La probabilidad que un votante sea simpatizante liberal.
4.3 Suponga que una encuesta a 200 trabajadores de una industria, se desarrolla usando
un paquete de computación para hacer una clasificación cruzada de los eventos de
interés: la satisfacción en el trabajo y el progreso en la organización, de los cuales
166 trabajadores están satisfechos en el trabajo, 116 han avanzado en la
organización y 96 trabajadores participan en ambos eventos, los resultados son,
Satisfacción Avance en la organización
en el trabajo Si No Total
Si 96 70 166
No 20 14 34
Total 116 84 200
B
A 70 96
20
5.1.1 Calcule la probabilidad que un empleado escogido al azar este satisfecho con su
trabajo y no haya avanzado en la organización.
N de empleados satisfecho s y no han avanzado en la organización
P( A y B )
N total de empleados
70
P( A y B) 0,35
200
…
5.1.2 Calcule la probabilidad que un empleado escogido al azar no este satisfecho con su
trabajo, ni haya progresado en la organización.
N de empleados no satifechos y no han avanzado en la organización
P( A y B )
N total deempleado s
14
P( A y B) 0,07
200
…
6. Regla de la Adición.
Ya se ha desarrollado una forma para encontrar la probabilidad del evento “A” y la
probabilidad del evento “A y B” ( A B) . Ahora examinaremos una regla para encontrar
la probabilidad del evento “A o B” (A B) . Esta regla se llama unión, se refiere a la
ocurrencia, ya sea, del evento A, del evento B o de A y B. Se expresa,
P( A B) P( A o B) P( A) P( B) P( A B)
P( A B) P( A o B) P( A) P( B)
Ej: 6.2 Un estudio de 200 tiendas de abarrotes reveló los siguientes ingresos, después
del pago de impuestos.
Ingresos después de los impuestos Sucesos N° de empresas
Menos de 10 millones de C$ A 102
C$10 millones - C$20 millones B 61
Más de C$20 millones C 37
Total
7. Probabilidad Condicional
La probabilidad condicional de un evento es la
probabilidad del evento, dado el hecho de que ya P( A / B)
P( A B) , P( B) 0
P( B)
ocurrieron uno o más eventos. Se denota de la
siguiente manera:
96
P( A B) 200 0,8276
P( A / B)
P( B) 116
200
…
7.1.2 Si un empleado está satisfecho con su trabajo. ¿Cuál es la probabilidad que haya
avanzado en la organización?
96
P( B A) 200 96 0,5783
P( B / A)
P( A) 166 166
200
…
8. Independencia estadística
El conocimiento previo de un evento no afecta la probabilidad de
P( A / B) P( A) 36
otro evento. Esta característica se llama independencia
estadística.
166
P( A) 0,83
200
Puesto que 0,8276 0,83, indica que estar satisfecho en el trabajo y haber
progresado en la organización no son estadísticamente independiente.
9. Regla de la Multiplicación
La fórmula para la probabilidad condicional se puede manejar algebraicamente, con lo que
la probabilidad conjunta (A y B) se puede determinar la probabilidad condicional de un
evento.
P( A B) P( A) P( B / A)
4. Una empresa adquiere una nueva máquina que debe instalarse y probarse antes de que
esté lista para su uso. La empresa está segura de que no tardara más de 7 días en
instalarla y probarla. Sea A el suceso “se necesitaran más de 4 días para que la máquina
esté lista” y B el suceso “se necesitarían menos de 6 días para que la máquina esté lista”.
Describa lo siguiente:
4.1 El suceso que es el complemento del suceso A.
4.2 El suceso que es la intersección de los sucesos A y B.
4.3 El suceso que es la unión de los sucesos A y B.
4.4 ¿Son los sucesos A y B mutuamente excluyentes?
5.1 A 5.4 ( B C )
5.2 A B 5.5 ( A B) C
C
5.3 ( A B) C 5.6 ( A B)
6. Durante un período determinado, aumentó el valor de mercado de las acciones comunes en
circulación en una industria, que incluye solamente 12 acciones. Si un inversionista escoge dos
de esas acciones al azar. ¿Cuál es la probabilidad de que ambos hayan experimentado un
aumento en su valor de mercado durante ese período, si se sabe que 8 aumentaron su valor?
38
7. De 600 empleados, 300 participan en un plan de reparto de utilidades de la compañía, 400
tienen una cobertura gastos médicos y 200 empleados participan en ambos programas.
7.1 Describa cada uno de los sucesos involucrados.
7.2 Presente estos datos en una tabla de contingencia.
7.3 De un ejemplo de un evento simple y de un evento conjunto.
7.4 ¿Cuál es el complemento del suceso “Empleado participa en cobertura de gastos
médicos”?
7.5 ¿Cuál es la probabilidad de que un empleado elegido al azar:
7.5.1 Participe por lo menos en uno de los programas?
7.5.2 No participe en ninguno de los programas?
7.5.3 Participe en el plan de reparto de utilidades considerando que tiene
seguro de gastos médicos?
7.5.4 Determine si los eventos empleado participa en el programa de
reparto de utilidades es independiente a tener cobertura de gastos
médicos.
8. De 100 personas que solicitan empleo de operador de computadoras en una firma, 40 tenían
experiencia profesional, 30 maestría y 20 tenían experiencia y maestría.
8.1 Describa cada uno de los sucesos involucrados.
8.2 Presente estos datos en una tabla de contingencia.
8.3 ¿Cuál es la probabilidad que un solicitante escogido aleatoriamente tenga experiencia o
maestría?
8.4 Tenga maestría dado que tiene alguna experiencia profesional.
8.5 Determine si la experiencia y poseer maestría son sucesos independientes.
9. A los 500 clientes de crédito de Credicom. S.A. están categorizados según el número de años
que han tenido cuenta de crédito y por su promedio de saldo. De estos clientes 210 han tenido
saldos menores a $100, otros 260 han tenido cuenta de crédito cuando menos 5 años, 80 han
tenido saldos mayores de $100 y cuentas de crédito por menos de 5 años.
9.1 Presente estos datos en una tabla de contingencia.
9.2 Si se selecciona un cliente al azar,
9.2.1 ¿Cuál es la probabilidad que tenga un saldo de crédito mayor de $100?
9.2.2 ¿Cuál es la probabilidad que tenga un saldo de crédito menor de $100 o ha tenido
cuenta de crédito cuando menos 5 años?
9.2.3 ¿Cuál es la probabilidad que tenga un saldo de crédito menor de $100 y ha tenido
cuentas de crédito por menos de 5 años?
9.3 Suponga que un cliente ha tenido cuentas de crédito cuando menos 5 años. ¿Cuál es la
probabilidad de que tenga un saldo inferior a $100?
9.4 Muestre si tener un saldo de crédito superior a $100 y poseer cuenta de crédito
cuando menos 5 años, son estadísticamente independiente.
11.1 Construya una tabla de probabilidad conjunta en base a estos datos muestrales.
11.2 Determine las siguientes probabilidades:
P(A y S) P(I) P(C/I) P(S) P(D)
P(I/S) P(B/S) P(B o I) P(D y S)
12. Si P( A / B) 0,4 ; P( A) 0,6 y P( B) 0,8 ¿Los eventos A y B son
independientes?
13. Durante una semana determinada se estima que la probabilidad de que el precio de una acción
específica aumente (A), permanezca sin cambio (C) o se reduzca (R) es de 0,35, 0,20 y 0,45
respectivamente.
13.1 ¿Cómo son los sucesos A, C y R?
13.2 ¿Cuál es la probabilidad de que el precio de la acción aumente o permanezca sin
cambio?
13.3 ¿Cuál es la probabilidad de que el precio de la acción cambie durante la semana?
14. Se estima que la probabilidad de que aumenten las ventas de automóviles en el siguiente mes
es de 0,40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de
0,50. Se estima que la probabilidad de que ambas industrias experimenten un aumento en
ventas es de 0,10. ¿Cuál es la probabilidad de que:
14.1 Hayan aumentado las ventas de automóviles durante el mes, dado que existe
información de que han aumentado las ventas de refacciones.
14.2 Hayan aumentado las ventas de refacciones, dado que existe información de que
aumentaron las ventas de automóviles durante ese mes.
17. Un estudiante está tomando dos cursos, Historia y Matemáticas. La probabilidad de que
apruebe el curso de historia es 0,60 y matemáticas es 0,70. La probabilidad que apruebe
ambas es 0,50. ¿Cuál es la probabilidad que pase por lo menos una? ¿Qué regla de
probabilidad aplicó?
18. Las probabilidades de dos eventos A y B son 0,20 y 0,30, respectivamente. Los sucesos no
son mutuamente excluyentes. La probabilidad de que ambos A y B ocurran es 0,15 ¿Cuál es
la probabilidad de que sucedan A o bien B?
19. Un estudio de las opiniones de los diseñadores en lo referente al color primario más
conveniente para aplicar en oficinas ejecutivas indicó:
20. Cada vendedor de una empresa se califica por debajo del promedio, en el promedio o
arriba del promedio, con respecto a su habilidad para las ventas. Además, cada vendedor
también se califica con respecto a su posibilidad de promoción en: regular, buena o
excelente. En la tabla que sigue se presentan las clasificaciones de estos rasgos para 500
vendedores.
Posibilidades de promoción
Habilidades en ventas Regular Buena Excelente Total
Por debajo del promedio 16 12 22
Promedio 45 60 45
Arriba del promedio 93 72 135
Total
20.1 ¿Cómo se llama esta tabla?
20.2 ¿Cuál es la probabilidad que un vendedor seleccionado al azar tenga habilidad de
ventas por encima del promedio y excelente posibilidad de promoción?
21. Suponga que P(A) = 0,40, P(B/A) = 0,30 ¿Cuál es la probabilidad conjunta de A y B?
22. Una encuesta a ejecutivos de alto nivel reveló que 45% leen con regularidad el diario La
Prensa, 35% El Nuevo Diario y 25% ambos diarios.
22.1 ¿Qué porcentaje de ejecutivos no lee ninguno de los diarios?
22.2 ¿Cómo se le llama a la probabilidad 0,25?
22.3 ¿Los eventos son mutuamente excluyentes? Explique su respuesta.
41
Es decir,
S B1 B2 .... Bk con Bi B j , i j luego cualquier subconjunto A de S se
puede escribir como,
P ( Bi ) P ( A / Bi )
P( Bi / A)
La probabilidad condicional se puede calcular con, k
P( B ) P( A / B )
i 1
i i
P( B1 ) P( A / B1 )
P( B1 / A)
P( B1 ) P( A / B1 ) P( B2 ) P( A / B2 )
ACTIVIDAD DE AUTOAPRENDIZAJE N° 5
1. Los clientes acostumbran evaluar en forma preliminar el diseño de los productos. En el
pasado, 95% de los productos de gran éxito recibieron críticas favorables, 60% de los
productos con éxito moderado recibieron críticas favorables y 10% de los productos sin
mucho éxito también recibieron críticas favorables. Además 40% de los productos han sido
de gran éxito, 35% de éxito moderado y 25% han sido productos sin mucho éxito.
1.1 Describa cada uno de los sucesos involucrados.
1.2 Presente esta información en un diagrama de árbol.
1.3 Si un diseño nuevo obtiene una crítica favorable. ¿Cuál es la probabilidad que sea un
producto con éxito moderado?
1.4 ¿Cuál es la probabilidad que sea un producto de gran éxito, si no consigue una crítica
favorable?
2. El dueño de una tienda de discos divide a los clientes que entran a su tienda en clientes
en edad escolar, clientes en edad universitaria y clientes mayores y observa que el 30,
50 y 20 por ciento de todos los clientes, respectivamente, pertenecen a estas
categorías. También observa que compran discos el 20 por ciento de los clientes en
edad escolar, el 60 por ciento de los clientes en edad universitaria y el 80 por ciento
de los clientes mayores.
2.1 Describa cada uno de los sucesos involucrados.
2.2 Presente esta información en un diagrama de árbol.
2.3 Si un cliente seleccionado aleatoriamente compra un disco. ¿Cuál es la probabilidad
que esté en edad escolar?
3. El software para detectar fraudes con tarjetas telefónicas personales rastrea el número de
áreas donde se originan las llamadas cada día. Se ha encontrado que 1% de los usuarios
legítimos hacen llamadas de dos o más áreas en un solo días. Sin embargo, 30% de los
usuarios fraudulentos hacen llamadas de dos o más áreas en un solo día. La proporción de
43
usuarios fraudulentos es 0,01%.
3.1 Describa cada uno de los sucesos involucrados.
3.2 Presente esta información en un diagrama de árbol.
3.3 Si el mismo usuario hace llamadas de dos o más áreas en un solo día. ¿Cuál es la
probabilidad de que el usuario sea fraudulento?
4. En una fábrica de zapatos, se sabe por experiencia que la probabilidad es 0.82 de que un
trabajador que ha asistido a un programa de capacitación de la fábrica cumplirá con la cuota
de producción y que la probabilidad correspondiente es 0.53 para un trabajador que no
asistió al programa de capacitación. Si el 60% de los trabajadores asisten al programa de
capacitación de la fábrica.
4.1 Describa cada uno de los sucesos involucrados.
4.2 Presente esta información en un diagrama de árbol.
4.3 Suponga que el trabajador cumplió con la cuota de producción. ¿Cuál es la
probabilidad de que haya asistido al curso?
5. Suponga que 2% de los rollos de tela de algodón y 3% de los rollos de tela de nylon
contienen defectos. De los rollos usados por un fabricante, 70% son de algodón y 30% son de
nylon.
5.1 Describa cada uno de los sucesos involucrados.
5.2 Presente estos datos en un diagrama de árbol.
5.3 ¿Cuál es la probabilidad que uno de los rollos de tela de nylon usados por el
fabricante seleccionado al azar contenga defectos?
6. El departamento de crédito de una casa comercial, informó que 30% de sus ventas son en
efectivo, 30% se pagan con cheque en el momento de la adquisición y 40% se pagan con
tarjetas de crédito. Se tiene que 29% de las compras en efectivo, 90% en cheques y 60% de
las compras con tarjeta de crédito son por más de $100.
6.1 Describa cada uno de los sucesos involucrados.
6.2 Presente esta información en un diagrama de árbol.
6.3 Alba Marín acaba de comprar un vestido nuevo que cuesta $150. ¿Cuál es la
probabilidad de que haya pagado en efectivo?
7. Tres máquinas M1, M2, M3 producen respectivamente 50%, 30%, 20% del total de artículos
de una fábrica. Las máquinas producen artículos defectuosos en un porcentaje de 7%, 6%,
4% respectivamente. Al colocar la producción de las tres máquinas en fila y escoger un
artículo.
7.1 Describa cada uno de los sucesos involucrados.
7.2 Presente esta información en un diagrama de árbol.
7.3 Si el artículo escogido es defectuoso. ¿Cuál es la probabilidad que haya sido
producido en cualesquiera de las tres máquinas? Tome como decisión el elemento
mayor probabilidad de producir artículos defectuosos.
E ( x) xP( x)
Ej: 11.2 Un contratista está interesado en saber cuál es el costo total de un proyecto
para el que pretende presentar una oferta. Estima que los materiales costarán
$25000 y su trabajo $900 al día. Si el proyecto tarda en realizarse X días, el costo
laboral total será 900X $ y el costo total del proyecto (en $) será
C ( x) 25000 900 x El contratista estima unas probabilidades subjetivas de la
duración probable del proyecto.
Duración X (días) 10 11 12 13 14
Probabilidad 0,1 0,3 0,3 0,2 0,1
ACTIVIDAD DE AUTOAPRENDIZAJE N° 6
1. El número de computadoras vendidas al día en una tienda viene definida por la
siguiente distribución de probabilidad:
X 0 1 2 3 4 5 6
P(X) 0,05 0,10 0,20 0,20 0,20 0,15 0,10
2. Una pastelería ofrece bocadillos con decoración especial para cumpleaños, bodas y otras
ocasiones. En la tabla que sigue se proporciona el número total de bocadillos vendidos al día y
las probabilidades correspondientes. Calcule la media, la varianza y la desviación estándar para
el número de bocadillos vendidos por día.
N° de bocadillos vendidos 12 13 14 15
Probabilidad 0,25 0,40 0,25 0,10
3. Una compañía inmobiliaria tiene un gran número de apartamentos disponibles cada mes para
rentar. El interés de la administración es el número de apartamentos vacantes mensualmente.
Un estudio reciente reveló el porcentaje del tiempo que está vacante un número dado de
apartamentos. Calcule la media y la desviación estándar del número de unidades desocupadas.
N° de vacantes 0 1 2 3 4
Probabilidad 0,40 0,30 0,20 0,08 0,02
Ej: 12.2 Consideremos un examen con tres preguntas de opción múltiple, con cuatro
alternativas, y es contestada al azar.
Al examinar los registros de facturación mensual de una editora con ventas por internet, el
auditor tomó una muestra de 8 de las facturas no pagadas. La cantidad adeudada a la compañía
es,
C$260 340 300 320 300 240 220 280
La mediana es:
a. 280 b. 290 c. 320 d. 240
La varianza es:
a. 1 650 b. 1 560 c. 1 565 d. 1 625
P( X x ) n C x p x q n x para x = 0, 1,2,…, n.
E( x) np , npq
Nota:
La elección de éxito o fracaso es subjetiva y queda a opción de la persona que resuelve el
problema, pero teniendo cuidado de plantear correctamente lo que se pide.
12.3.3 Halle la probabilidad de que venda entre dos y cuatro seguros (inclusive).
…
1. Las observaciones durante un largo período muestran que un vendedor determinado puede 49
concluir una venta en una sola entrevista con una probabilidad de 0,30 Suponga que el
vendedor entrevista a 6 prospectos (o compradores prospectivos).
1.1 ¿Cuál es la probabilidad que exactamente dos prospectos compren el producto?
1.2 ¿Cuál es la probabilidad de que todos los prospectos compren el producto?
1.3 ¿Cuál es la probabilidad que al menos dos prospectos compren el producto?
3. Una máquina de cierta marca está produciendo 10% de piezas defectuosas. El ingeniero de
control de calidad ha estado verificando la producción por medio de muestreo casi continuo
desde que empezó la condición anormal. ¿Cuál es la probabilidad que en una muestra de 10
piezas:
3.1 Exactamente 5 estén defectuosas?
3.2 5 o más estén defectuosas?
3.3 A lo sumo una esta defectuosa?
4. Un inspector encargado del control de calidad de los camiones de juguete producidos por una
fábrica, ha observado que cierto defecto en las llantas se presenta en el 5% de los vehículos.
En cada uno se colocan seis llantas. ¿Cuál es la probabilidad de que en un conjunto de seis
llantas seleccionadas aleatoriamente no se presente el defecto?
Características:
En este tipo de experimentos los éxitos buscados son expresados por unidad de área o
tiempo.
Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo o área, la
fórmula a utilizar sería:
e ( ) x
P( X x) x 0, 1, ... E( X ) 2
x!
Además np
Donde,
P( X x) Es la probabilidad de que ocurran x éxitos, cuando el número promedio
de ocurrencia de ellos es .
Media o promedio de éxitos por unidad de tiempo o área.
e = 2,718…(Base de logaritmo neperiano o natural)
X Variable que nos denota el número de éxitos que se desea que ocurran.
Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad de
tiempo o área es totalmente al azar y que cada intervalo de tiempo es independiente de otro,
así como cada área es independiente de otra área. Para que una variable siga una distribución
de Poisson deben cumplirse varias condiciones:
En un intervalo muy pequeño (por ej. un milisegundo) la probabilidad de que ocurra un
evento es proporcional al tamaño del intervalo.
La probabilidad de que ocurran dos o más eventos en un intervalo muy pequeño es tan
reducida que, a efectos prácticos, se puede considerar nula.
El número de ocurrencias en un intervalo pequeño no depende de lo que ocurra en
cualquier otro intervalo pequeño que no se solape con aquél.
El parámetro de la distribución, es, (lambda), representa el número promedio de
eventos esperados por unidad de tiempo o de espacio, por lo que también se suele hablar
de lambda como “la tasa de ocurrencia” del fenómeno que se observa.
La distribución de Poisson tiene iguales la media y la varianza. Si la variación de los
casos observados en una población excede a la variación esperada por la Poisson, se está
51
ante la presencia de un problema conocido como sobredispersión y, en tal caso, la
distribución binomial negativa es más adecuada.
Ej: 13.2 El número de fallas de un instrumento de prueba debido a las partículas contaminantes
de un producto, tiene una media de 0,2 fallas por hora.
13.2.2 ¿Cuál es la probabilidad que se presente al menos una falla en un periodo de una
horas?
Es decir P(X ≥ 1), donde 0,2
P( X 1) 1 P( X 1) 1 P( X 0)
e ( ) x
Sustituimos en la fórmula: P( X x)
x!
e 0, 2 (0,2) 0
P( X 1) 1 1 0,818730753 0,181269246 0,1813
0!
Por consiguiente la probabilidad que se presente al menos una falla en un periodo de 1
hora es de 0,1813 ≈.
1. Un estudio de las filas en las cajas registradoras de salida en un supermercado reveló que 52
durante un cierto periodo en la hora más concurrida, el número de clientes en espera era en
promedio cuatro. ¿Cuál es la probabilidad que durante ese periodo:
1.1 No haya cliente esperando?
1.2 Cuatro o menos clientes estén en espera?
1.3 A lo sumo un cliente este en espera?
1.4 Por lo menos un cliente este en espera?
2. Se supone que el número de defectos en los rollos de tela de cierta industria textil es una
variable aleatoria de Poisson con una media de 0,10 defectos por metro cuadrado. ¿Cuál es la
probabilidad de encontrar en un metro cuadrado de tela,
2.1 dos defectos?
2.2 un defecto?
2.3 a lo sumo un defecto?
2.4 por lo menos dos defectos?
3. Un profesor recibe, por término medio 4,2 llamadas telefónicas de los estudiantes el día
antes de realizarse alguna prueba sistemática. Sí las llamadas siguen una distribución de
Poisson. ¿Cuál es la probabilidad que,
3.1 reciba al menos tres llamadas ese día?
3.2 el profesor no reciba llamadas ese día?
3.3 reciba a lo sumo tres llamadas ese día?
3.4 reciba entre tres y seis llamadas?
4. Un banco en promedio recibe 6 cheques sin fondos por día. ¿Cuál es la probabilidad de que
reciba cuatro cheques sin fondo en un día dado?
5. El número de accidentes que se producen en una fábrica tiene una distribución de Poisson con
una media de 2,6 al mes.
5.1 ¿Cuál es la probabilidad que haya menos de dos accidentes en un mes dado?
5.2 ¿Cuál es la probabilidad que haya más de tres accidentes en un mes dado?
6. Los datos indican que a la hora punta de la mañana se producen, por término medio, 3,2
colisiones al día en una vía urbana.
6.1 Halle la probabilidad de que en un día dado se produzcan menos de dos colisiones
en esta vía durante la hora punta de la mañana.
6.2 Determine la probabilidad de que en un día dado se produzcan más de cuatro
colisiones en esta vía durante la hora punta de la mañana
Un 50% de los valores están a la derecha de este valor central y otro 50% a la izquierda.
si la varianza es baja los valores están próximos a la media; si es alta, entonces los
valores están muy dispersos.
Cuando la media de la distribución es 0 y la varianza es 1 se denomina "normal tipificada o
estandarizada", y su ventaja reside en que hay tablas donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribución. Además, para transformarla en
una normal tipificada se crea una nueva variable (Z) que será igual a la anterior (X) menos su
media y dividida por su desviación típica (que es la raíz cuadrada de la varianza)
x
Z , x z
Toda distribución normal se puede transformar en una normal tipificada: La distribución
normal tipificada tiene la ventaja, como ya hemos indicado, que las probabilidades para cada
valor de la curva se encuentran recogidas en una tabla.
1 . P ( a ≤ Z ≤ b ) =Z ( b ) - Z (a )
2. P ( Z ≤ a ) =Z ( a )
Ej. 14.1 Un cliente tiene una cartera de inversión cuyo valor medio es de 78 mil dólares y
desviación estándar de 36 mil dólares. Se le ha pedido que calcule,
x
Fórmula para estandarizar: Z
132 78
P( X 132) P Z PZ 1,50 Z (1,50) 0,9332
36
x
Fórmula para estandarizar: Z
96 78
P(X 96) P Z PZ 0,50
36
1 P( Z 0,50) 1 Z (0,50) 1 0,6915 0,3085
Este resultado muestra que el 30,85% del valor de la cartera de inversión es por
lo menos de $ 96000.
14.1.3 La probabilidad que el valor de la cartera de inversión sea cuando mucho 25000
dólares.
X: Valor de la cartera de inversión (en miles de $)
78 mil $ y 36 mil $
x
Fórmula para estandarizar: Z
25 78
P(X 25) P Z PZ -1,47
36
Z (1,47) 0,0708
Lo que indica que el 7,08% del valor de la cartera de inversión es cuanto mucho
de 25 mil dólares.
x
Fórmula para estandarizar: Z
72 78
P( X 72) P Z PZ 0,17 1 P( Z 0,17)
36
1 Z (0,17) 1 0,4335 0,5675
El 56,75% del valor de la cartera de inversión es superior a $72000.
14.1.5 La probabilidad que el valor de la cartera de inversión este entre 80 y 90 mil
dólares.
X: Valor de la cartera de inversión (en miles de $)
78 mil $ y 36 mil $
x
Fórmula para estandarizar: Z 56
80 78 90 78
P(80 X 92) P Z P0,06 Z 0,33
36 36
Z (0,33) Z (0,06) 0,6293 0,5239 0,1054
Lo que indica que esta probabilidad de ocurrencia es apenas de un 0,1054, que la
cartera de inversión se ubique entre esos valores.
14.1.6 La probabilidad que el valor de la cartera de inversión este entre 20 mil y 29 mil
dólares.
X: Valor de la cartera de inversión (en miles de $)
78 mil $ y 36 mil $
x
Fórmula para estandarizar: Z
20 78 29 78
P(20 X 29) P Z
36 36
P 1,61 Z - 1,36
Z (1,36) Z (1,61) 0,0537 0,0869 0,0332
El resultado muestra que la probabilidad de ocurrencia es de un 3,32% de que la cartera
de inversión se encuentre entre esos valores.
14.1.7 La probabilidad que el valor de la cartera se encuentre entre 65 mil y 172 mil dolares.
X: Valor de la cartera de inversión (en miles de $)
78 mil $ y 36 mil $
x
Fórmula para estandarizar: Z
65 78 172 78
P(65 X 172) P Z P 0,36 Z 2,61
36 36
Z (2,61) Z (0,36) 0,9955 0,3594 0,6361
Este resultado nos muestra que 0,6361 es la probabilidad que la cartera de inversión se
encuentre entre 65 y 172 mil dólares.
Nos encontramos con el caso inverso a los anteriores, conocemos el valor de la probabilidad y
se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la tabla el valor que más
se aproxime a éste.
Ej: 14.2 Suponga que la cantidad de tiempo que lleva a la superintendencia de contribuciones
enviar reembolsos se distribuye normal con una media de 12 semanas y una varianza de 9.
14.2.1 ¿Cuántas semanas tendrá que esperar el 95% de los contribuyentes distribuidos
simétricamente para obtener el reembolso?
μ = 12 , σ2 = 9 σ = 3
P( z1 Z z 2 ) Por la simetría 95% divida en dos partes iguales.
P(Z z2 ) 0,975 z2 1,96 z1 1,96
Sustituyendo en x z 57
x1 12 (1,96)(3) 7,12 semanas x1 7 semanas.
x2 12 (1,96)(3) 17,88 semanas x1 18 semanas.
El contribuyente que solicite reembolso tendrá que esperar entre 7 y 18 semanas, con
estas características.
Ej.14.3 Se aplica un test de cultura general y se observa que las puntuaciones obtenidas
siguen una distribución normal con media 65 y desviación estándar 18. Se desea
clasificar a los examinados en tres grupos (de baja cultura general, de cultura general
aceptable y de excelente cultura general) de modo que hay en el primero un 20% de la
población, un 65% en el segundo y un 15% en el tercero. ¿Cuál ha de ser la puntuación
que marca el paso de un grupo a otro?
2. Una cartera de inversión contiene acciones de un gran número de empresas. El año pasado, las
tasas de rendimiento de estas acciones siguieron una distribución normal con media de 12,2%
y una desviación estándar de 7,2%.
3.1 ¿Qué proporción de estas empresas tuvieron tasa de rendimiento superior al 20%?
3.2 ¿Qué proporción de estas empresas tuvieron tasa de rendimiento entre el 5 y el
15%?
3.3 ¿Qué proporción de estas empresas tuvieron tasa de rendimiento inferior al 4,46%?
3.4 ¿Qué proporción de estas empresas tuvieron tasa de rendimiento negativo?
4. Una compañía de transporte premia con un bono especial a aquellos empleados que venden
300 o más boletos durante una jornada de 8 horas. El número de boletos vendidos por
empleado en dicha jornada está distribuido de manera aproximadamente normal, con μ = 270
y σ = 16. ¿Cuál es la probabilidad que un vendedor seleccionado aleatoriamente no reciba el
premio?
7. El tiempo de espera en cierto banco está distribuido en forma normal, aproximadamente, con
media y desviación estándar iguales a 3,7 y 1,4 minutos, respectivamente. Encuentre la
probabilidad de que un cliente seleccionado aleatoriamente tenga que esperar:
7.1 Menos de 2 minutos.
7.2 Entre 3 y 3,5 minutos.
59
7.3 Por lo menos 2,3 minutos.
7.4 ¿Cuánto tiempo tiene que esperar el 90 % de los clientes? y ¿el 10 % de los clientes?
8. Se sabe que la cantidad de dinero que gastan los estudiantes en libros de texto en un año
en una universidad sigue una distribución normal que tiene una media de $380 y una
desviación estándar de $50. ¿Cuál es la probabilidad que un estudiante elegido al azar:
8.1 gaste menos de $360 en libros de texto en un año?
8.2 gaste más de $400 en libros de texto en un año?
8.3 gaste entre $300 y $400 en libros de texto en un año?
8.4 gaste entre $250 y $280 en libros de texto en un año?
8.5 Quiero hallar un intervalo de gastos en libros de texto que incluya el 80% de todos
los estudiantes de esa universidad.
UNIDAD III
INFERENCIA ESTADÍSTICA
1. Distribución muestral de la media
1.1 Distribución muestral para la media de tamaño “n”, con reemplazo
Una población constituida por un número “N” de elementos, cuya media aritmética es μ
y donde la desviación típica viene dada σ, pueden formarse N2 muestras posibles. Para
cada una de estas muestras es posible una MEDIA MUESTRAL, que denotaremos con
el símbolo xEn una distribución muestral de las medias, la VARIABLE ALEATORIA
i
MEDIA MUESTRAL sigue una ley normal descrita como N (μ, σ/√n).
Extracción
Con reemplazo Sin reemplazo
x x
Infinita x x
Población n n
x x
Finita (N) N n
x x
n N 1
n
Ej: 1 Dado los elementos de la población {1, 3, 5}, encuentre todas las medias muestrales
posibles de tamaño 2, con reemplazo. Las medias aritméticas reflejadas, serían:
Medias muestrales de todas las muestras posibles de tamaño 2, con reemplazo.
0.33
probabilidad
0.22
0.11
1 2 3 4 5
Siendo
la media aritmética de la población, la media aritmética de cada muestra i , la x
media aritmética de todas las medias x , E (x) la esperanza matemática de la variable
aleatoria X (para la población) y E (x ) la esperanza matemática de la variable aleatoria (para
la distribución muestral de las medias).
Por su parte, los valores de la varianza y la desviación típica de esta distribución muestral de
tamaño 2 son:
V ( x) 2 , V (x) x , x
2
donde es la desviación típica de la población, x la desviación típica de la distribución
muestral, V (x) la varianza de la variable x (población) y V (x ) la varianza de la variable x
(distribución muestral de las medias)
Basado en el ejemplo 1, obtenemos:
Ej: 2 Auxiliándonos del ejemplo 1. Dado los elementos de la población {1, 3, 5}, encuentre
todas las medias muestrales posibles de tamaño 2, sin reemplazo.
N = 3 ; n = 2, entonces, 3C2 = 3, se refiere al número total de muestras posibles,
3. Estimaciones
3.1 Estimación puntual
Estimar un parámetro es proponer un valor para el mismo a partir de la muestra; un
estimador del porcentaje poblacional sería la proporción de dispositivos electrónicos
que presentan falla a este tipo de estimación se le llama «estimación puntual». Es
bastante probable que el valor que se obtiene no sea realmente el valor del parámetro
en la población.
Parámetro Estimador
Media (μ) x
Desviación Estándar (σ) S
Proporción (P) p
El error estándar mide la variabilidad entre las diferentes medias de las muestras; es
decir, mide la dispersión imaginaria que presentarían las distintas medias obtenidas en las
muestras estudiadas.
Se utilizarán fórmulas diferentes según se pretenda calcular el «error estándar de una
media» o el «error estándar de una proporción».
En una distribución Z ~ N (0, 1) puede calcularse fácilmente un intervalo dentro del cual caiga
un determinado porcentaje de las observaciones, esto es sencillo hallar z1 y z2 tales que P[z1 ≤
z ≤ z2] = 1 - α, donde (1 - α)100% es el porcentaje deseado.
Se desea obtener una expresión tal que
En esta distribución normal de medias se puede calcular el intervalo de confianza donde se
encontrará la media poblacional si sólo se conoce una media muestral ( ), con una confianza
x 65
determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A
este valor se le llamará 1 − α (debido a que α es el error que se cometerá, un término opuesto).
Para ello se necesita calcular el punto X 2 o, mejor dicho, su versión estandarizada Z 2 o,
<<valor crítico>> junto con su "opuesto en la distribución" X 2 Estos puntos delimitan la
probabilidad para el intervalo, como se muestra en la siguiente imagen:
Obsérvese que el intervalo de confianza viene dado por la media muestral ( ) ± el producto
x
del valor crítico z 2 por el error estándar n .
N n n
x si 0.05 se omite e l FCF .
nN
1 N
FCF
NOTA: Para un nivel de confianza del 90%, el valor se ubica en el cuerpo de la tabla y se
encuentra un valor aproximado o exacto del percentil de la distribución Normal. Luego,
Z = 1,645.
2
s s
Si no se conoce σ y n es grande (n ≥ 30) x z , x z donde s es la
2 n 2 n 66
desviación típica de una muestra.
Ej: 4 Se encuentra que la concentración promedio de zinc que se extrae del agua a partir de
una muestra aleatoria en 36 sitios diferentes es de 2,6 g por mililitro. Encuentre e
interprete un intervalo de confianza de 95% para la concentración media de zinc.
Suponga que la desviación estándar es 0,3.
x 2,6 g 0,3
Uso de la 1 95% 0,05 0,025
2
~ Normal z 2 1,96
Obtenemos:
2,6 1,96
0,3 2,6 0,098
36
2,502 μ 2,698 g
Es decir si se extraen muestras repetidas de tamaño 36 del agua, se espera que
aproximadamente el 95% de las veces la media estaría contenida entre
2,502 μ 2,698 g y el 5% restante fuera de dicho intervalo.
s N n
( x t sx ) donde sx con n 1 gl
2
, n 1
n N 1
Encuentre e interprete un intervalo de confianza del 95% para la media de todos los
envases, si se supone una distribución aproximadamente normal.
x 11 litros
Usar calculadora s 0,282842712
1 95% 0,05 0,025
2
Buscar en la ~ t de Student. gl n 1 7 1 6
t 0, 025, 6 2,45
Sustituimos en la fórmula,
( x t s )
, n 1 x
2
n
e
Procedimiento para calcular n.
z
2
1. n0 2
e
0.05 n n0
n0
2. Si Nn0
N 0.05 n N n
0
Ej: 6 ¿Qué tan grande se requiere una muestra del Ejemplo 12, si queremos tener 95%
de confianza que nuestra estimación de μ difiere por más o menos 0.05.
Uso de la 1 95% 0,05 0,025
~ Normal
2
z 2 1,96
e 0,05 0,3
Como no se conoce N, sustituimos en la fórmula,
1,960,3 138,2976
z 2
2 2
n n = 139
e 0,05
= 139
pˆ (1 pˆ ) x
P ( pˆ z pˆ ) donde p̂ y pˆ
2 n n
pˆ (1 pˆ ) x
Sustituimos en la fórmula: P ( pˆ z pˆ ) donde p̂ y pˆ
2 n n
0,97(0,03)
P 0,97 1,645 P 0,97 1,645(0,007628892)
500
p(1 p)
de modo que, z e . Al resolver esta ecuación para n, obtenemos,
2
n
z22 p(1 p)
n0
e2
Procedimiento para calcular n,
z2 p (1 p)
1. n0 2
e2
0.05 n n0
n0
2. Si Nn0
N 0.05 n N (n 1)
0
Ej: 8 Se lleva a cabo un estudio para estimar el porcentaje de ciudadanos de una comunidad
que están a favor de tener agua fluorada. ¿Qué tan grande se requiere que sea la
muestra, si se desea tener una confianza de 95% y que nuestra estimación este dentro
del 1% del porcentaje real?
69
n 9604
ACTIVIDAD DE AUTOAPRENDIZAJE N° 11
1. Una tienda de ropa tiene interés en saber cuánto gastan los estudiantes universitarios en
ropa durante el primer mes del año escolar. El gasto medio de una muestra de 32
estudiantes es de $157,82, con una desviación estándar de $38,89. Suponiendo que la
población sigue una distribución normal, determine e interprete un intervalo de confianza
de 95% para el gasto medio en ropa de los estudiantes. ¿Cuál es el margen de error con
esta confiabilidad?
2. Una empresa de alquiler de autos tiene interés en saber cuánto tiempo permanecen sus
vehículos en el taller de reparación. Calcule e interprete un intervalo con 90% de confianza
para el número promedio de días que los vehículos de la flota de la empresa permanecen en
el taller de reparaciones, si una muestra aleatoria de 9 vehículos mostró el siguiente
número de días que había permanecido cada uno en el taller de reparación.
16 10 21 22 8 17 19 14 19
4. Los precios de la gasolina experimentaron una vertiginosa subida en los primeros años de
este siglo. Suponga que se ha realizado recientemente un estudio con camiones que tenían
más o menos el mismo número de años de experiencia para comprobar el comportamiento
de 12 camiones de un determinado modelo en la misma carretera, Determine e interprete
un intervalo con 99% de confianza para este conjunto de datos. Suponga que el consumo de
combustible, en Km por litros, de estos camiones es,
5. Los ingresos del impuesto sobre ventas en una comunidad particular se recaudan cada
trimestre. Los siguientes datos representan los ingresos (en miles de dólares) cobrados
durante el primer trimestre de una muestra de diez establecimientos de menudeo de la
comunidad:
16 18 11 17 13 10 22 15 16 15
5.1 Establezca e interprete una estimación por intervalo con un 95% de confianza, de los
ingresos trimestrales del impuesto sobre ventas en los establecimientos de menudeo.
5.2 Si hay un total de 180 establecimientos de menudeo en esa comunidad, estime e
interprete un intervalo con un 95% de confianza de los ingresos trimestrales del
impuesto sobre ventas en los establecimientos de menudeo.
6. Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución
aproximadamente normal, con una desviación estándar de 25 horas. Se toma una muestra
70
aleatoria de 40 focos, la cual resulta tener una duración promedio de 1014 horas.
Construya e interprete un intervalo de confianza del 99% para la duración promedio.
7. En el ejercicio # 6, Suponga que se desea una confianza del 95% en que el error en la
estimación de la duración sea de 5 horas. ¿Qué tamaño de muestra se necesita?
8. En los resultados del censo de población y vivienda 2005, acerca de la cantidad total de
viviendas que conforman el distrito IV en Managua es de 29 920 y haciendo un supuesto
de que el 60% de las familias de ese distrito tiene casa propia con un margen de error del
4% y nivel de confianza del 90%. ¿Cuál es el tamaño de muestra para la proporción de
personas que tienen casa propia?
10. Se va a vender un nuevo cereal para desayuno y se pone a prueba de mercado durante un mes
en las tiendas de una cadena de autoservicio, se desea estimar la suma promedio de venta
con aproximación de ± $100 con un 95% de confianza y se supone que la desviación estándar
es de $200. ¿Qué tamaño de muestra se necesita?
11. Un grupo de estudio quería estimar la facturación mensual promedio por luz eléctrica en el
mes de julio en casas unifamiliares en una ciudad. Con base en estudios efectuados en otras
ciudades, se supone que la desviación estándar es de $20. El grupo quiere estimar la
facturación promedio de julio con aproximación de ± $5 del promedio real con un 95% de
confianza. ¿Qué tamaño de muestra se necesita?
12. El gerente de una sucursal bancaria en una ciudad quiere determinar la proporción de su
cuenta habiente a los cuales se les paga el sueldo por semana, por experiencia previa en otras
áreas se sabe que sólo el 30% prefieren este sistema, si el gerente quiere tener 95% de
confianza de que esta en lo correcto con aproximación de ± 0,05 de la proporción de sus
clientes a quienes se les paga por semana. ¿Qué tamaño de muestra se necesita?
13. Se desea hacer una encuesta para determinar la proporción de familias que carecen de
medios económicos para atender los problemas de salud. Existe la impresión de que esta
proporción está próxima a 0,35. Se requiere de una confianza del 95% con un error de
estimación de 0,05. ¿De qué tamaño debe tomarse la muestra?
14. Determine el tamaño de muestra que se requiere para estimar la proporción verdadera de
los estudiantes de una universidad que tienen ojos azules, si se desea que la estimación
tenga un error máximo de 0,02 y una confianza del 95%. Suponga que la población
estudiantil es de 4 350.
15. Se desea realizar una encuesta entre la población juvenil de una determinada localidad
para determinar la proporción de jóvenes que estarían a favor de una nueva zona de ocio. El
número de jóvenes de dicha población es N = 2 000. Determinar el tamaño de muestra
necesario para estimar la proporción de estudiantes que están a favor con un error de
estimación de 0,05 y un nivel de confianza del 95%.
71
16. Una línea de autobuses piensa establecer una ruta desde un suburbio hasta el centro de la
ciudad. Se selecciona una muestra aleatoria de 50 posibles usuarios y 18 indicaron que
utilizarían esa ruta de autobuses. Establezca e interprete una estimación del intervalo con
95% de confianza de la proporción real de usuarios para esta nueva ruta de autobuses.
17. Se realizó una investigación de mercadotecnia para estimar la proporción de amas de casa que
pueden reconocer la marca de un producto de limpieza con base en la forma y color del
recipiente. De las 1 400 amas de casa consultadas, 420 fueron capaces de identificar la marca
del producto. Use un grado de confianza del 95% para determinar e interpretar en que
intervalo se encuentra la proporción poblacional.
18. Un estudio muestral de 256 compañías industriales, determinó que el 23% habían señalado a
sus empleados como la decaída económica a principios de 2008 afectaría la organización.
Determine un intervalo de confianza de 95% para la proporción de todas las compañías que
explicarían a sus empleados los efectos de la decaída. Suponiendo que hay un total de 2000
compañías.
19. El número de autos vendidos en “Casa Pellas” durante el primer semestre del 2012 fue de
800 automóviles de diversas marcas, en una muestra de 400 automóviles se observó que de
estos 47 eran de color rojo.
19.1 Estime la proporción de compradores que prefirieron automóvil color rojo.
6. Prueba de hipótesis
La estadística inferencial es el proceso de usar la información de una muestra para
describir el estado de una población. Sin embargo es frecuente que usemos la información
de una muestra para probar un reclamo o conjetura sobre la población. El reclamo o
conjetura se refiere a una hipótesis. El proceso que corrobora si la información de una
muestra sostiene o refuta el reclamo se llama prueba de hipótesis.
Ej: 10
H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
x
t con n 1 grados de libertad
s
n
Las pruebas de hipótesis a partir de proporciones se realizan casi en la misma forma utilizada
cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada
caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situación
particular. En tal caso el estadístico de prueba es.
x npo
z
npo (1 po )
Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la
región en la que No se rechaza.
Dado que ya se tiene la distribución normal, los valores críticos se pueden expresar en
unidades de desviación. Una región de rechazo de 0.025 en cada cola de la distribución
normal, da por resultado un área de .475 entre la media hipotética y el valor crítico. Si se
busca está área en la distribución normal, se encuentra que los valores críticos que dividen
las regiones de rechazo y no rechazo son + 1,96 y – 1,96
Si el Valor p ≤ α Ho se Rechaza
H 0 : 15 km
H 1 : 15 km
11.2 El consumo promedio de un nuevo modelo de auto es de 52Km/litro.
…
11.3 Más del 65% de los empleados de un colegio aportan a Fondos Sociales.
H 0 : p 0,65
H 1 : p 0,65
11.4 Al menos un 60% de la población adulta de una comunidad votará en las próximas
elecciones municipales.
…
11.5 Se reclama que al menos el 40% de las compras realizadas en cierta tienda por
departamentos son artículos especiales.
…
11.6 Una nueva marca de computadora dura en promedio más de 3 años.
…
11.7 Se observa que el 20% de los graduados de cierto colegio privado solicitan admisión a
escuelas de medicina.
…
11.8 El balance promedio de una cuenta de cheques en el First State Bank es de al menos
$150
…
Ej. 12 Determine si la prueba es de cola derecha, izquierda o ambas, con el nivel de
significancia α = 0,05 encuentre el valor critico y dibuje la región de rechazo.
77
H 0 : 11 0,05
12.1 Uso de la ~ Normal
H 1 : 11 z 1,645
z 1,645
12.2 H 0 : 5,8
H 1 : 5,8
…
12.3 H 0 : 110
H 1 : 110
…
12.4 H 0 : p 0,3
H 1 : p 0,3
…
Si = 0,01 z z = 2,33
13.2
Para = 0,05 y n = 16
/2 /2
…
13.3
Para = 0,01 y n = 10
…
13.4
Para = 0,05 y n = 36
… /2 /2
/2 /2
Ej: 14 Un fabricante de cierta marca de cereal de arroz afirma que el contenido
promedio de grasa saturada no excede de 1,5 gramos, con una desviación estándar de
78
0,3 gramos. Se toma una muestra de 40 bolsas de cereal y se encuentra que el
contenido medio de grasa saturada es de 1,6 gramos. Pruebe la afirmación del
fabricante con un nivel de significación de 0,05. Determine el Valor p.
μo = 1,5 gramos. σ = 0,3 gramos
n = 40 bolsas x = 1,6 gramos α = 0,05
H 1 : 1,5 g (El contenido promedio de grasa saturada es superior a 1,5 gramos en la marca de cereal)
2. Nivel de Significación
α = 0,05 z 1,645
4. Regla de Decisión
Observe que este valor z Cal 2,11 se ubica en la Región de Rechazo, es decir, z Cal z
Por lo tanto Ho se Rechaza.
5. Toma de Decisión
Existe suficiente evidencia a un nivel de significación de 0,05 que el contenido
promedio de grasa saturada en la marca de cereal de arroz es superior a 1,5 gramos.
Valor p
p P( z 2,11) 1 P( z 2,11)
p 1 - z(2,11) 1 - 0,9826 0,0174 z Cal 2,11
Como p 0,0174 0,05 Ho se Rechaza
2. Nivel de Significación
α = 0,01
2 0,005
gl = n - 1 = 10 – 1 = 9 t ( 2 , 9) 3,25
t ( 2 , 9) 3,25 t ( 2 , 9) 3,25
3. Calcular el Estadístico de Prueba
x 261,4 320
t 1,335038601
s 138,8045789
n 10
t Cal 1,34
4. Regla de decisión
Observe que este valor t Cal 1,34 se ubica en la Región de No Rechazo, es decir,
3,25 t Cal 1,34 3,25 . Por lo tanto Ho No se Rechaza.
5. Toma de decisión
No Existe suficiente evidencia a un nivel de significación de 0,01 que el gasto promedio
durante el año pasado en odontología sea diferente a $320.
Valor p
t Cal 1,34
El valor calculado de la estadística de prueba es t Cal 1,34 . En la tabla de la distribución t de
Student observamos que debido a la simetría, sólo se muestran los valores críticos del
extremo superior. Pero si omitimos el signo con el propósito de usar la tabla, notamos que el
V.C. para un área de extremo superior de 0,25 y 9 gl. es 0,7029 y para un área de extremo
superior de 0,10 es 1,380; comot Cal 1,34 se ubica entre estos dos valores y podemos
establecer que el Valor p para esta prueba está entre 0,25 y 0,10 cada uno de estos valores
son mayores ( > ) que 0,01 el nivel escogido de significación. Por lo tanto, la hipótesis nula,
Ho, No se Rechaza.
2. Nivel de Significación
α = 0,01 z 2,33
4. Regla de Decisión
Observe que este valor z Cal 1,41 se ubica en la Región de No Rechazo, es decir,
z 2,33 zCal 1,41 Por lo tanto Ho No se Rechaza.
5. Toma de Decisión
No existe suficiente evidencia a un nivel de significación de 0,01que la proporción de
oficinistas encargados del procesamiento de datos y que ya no trabajan para la
compañía sea inferior al 25%.
Valor p
p P( z 1,41) z(-1,41) 0,0793
p 0,0793
Como p 0,0793 0,01 Ho No se Re chaza
zCal 1,41
ACTIVIDAD DE AUTOAPRENDIZAJE N° 12
2. Se pide a una muestra aleatoria de 172 estudiantes de administración que valoren en una
escala de 1 (nada importante) a 5 (muy importante) las prestaciones sanitarias
complementarias como características del empleo, La media resultó ser 3,31 y la desviación
estándar de 0,70. Contraste al nivel de significación de 0,01 la hipótesis nula que la media
poblacional de las valoraciones es como máximo de 3,0 frente a la hipótesis alternativa que
es superior a 3,0. Determine el valor p.
81
3. El Gerente de producción de una Compañía manufacturera estima que la edad media de sus
empleados es 22,8 años. El tesorero de la firma necesita una cifra de la edad media de los
empleados más exacta, a fin de estimar el costo de una prestación por antigüedad que se
considera para los empleados. El tesorero toma una muestra aleatoria de 70 trabajadores y
observa que la edad media de los empleados muestreados es de 26,2 años con una desviación
estándar de 4,6 años. Con un nivel de significación del 1%. ¿Qué puede concluir acerca de la
exactitud de la estimación del Gerente de producción?
4. Un profesor de estadística tiene interés en conocer la capacidad de los estudiantes para
evaluar la dificultad de un examen. Este examen se ha aplicado y la calificación media ha
sido de 78,5. Se pide a una muestra aleatoria de ocho estudiantes y las predicciones son.
73 83 78 65 69 77 81 71
Suponiendo que la distribución es normal, contraste la hipótesis nula que la media
poblacional de las predicciones es de 78,5. Utilice la hipótesis alternativa bilateral y un
nivel de significación de 0,10.
5. Una muestra aleatoria de 6 observaciones de una población normal, generó los siguientes
datos,
3,7 6,4 8,1 8,8 4,9 5,0
Proporcionan los datos suficiente evidencia que señale que < 7, a un nivel de significación
de 0,05.
10 08 12 09 05 15 12 10 08 06
7. La producción diaria de una planta industrial química registrada durante 50 días, tiene una
media muestral de 871 mil kilogramos y una desviación estándar de 21 mil kilogramos. Pruebe
la hipótesis de que el promedio de la producción diaria del producto químico es de 880 mil
kilogramos por día, contra la alternativa de que es mayor o menor que 880 mil kilogramos por
día, usando una significación de 0,01.
8. Tina Dennis es la jefa de contabilidad de Meck Industries (MI). Ella cree que los
problemas de flujo de efectivo en MI se deben a la cobranza lenta de cuentas pendientes.
Estima que más de 60% de las cuentas están en atraso más de tres meses. Una muestra de
200 cuentas señaló que 140 tenían más de tres meses de antigüedad. Al nivel de
significación de 0.01. ¿se puede concluir que más de 60% de las cuentas están en atraso
por más de tres meses?
9. Experiencias en la Wills Travel Agency indica que 44% de las personas desean que esa
agencia planee unas vacaciones para viajar a Europa. Durante la temporada más reciente,
una muestra de 1000 fue seleccionada al azar de los archivos y se encontró que 480
querían ir a Europa de vacaciones. ¿Ha sido un cambio significativo hacia arriba en el
porcentaje de personas que desean ir a Europa? Pruebe a un nivel del 5%.
82
10. Una empresa de estudios de mercado quiere saber si los compradores son sensibles a los
precios de los artículos que se venden en un supermercado. Obtiene una muestra de 802
compradores y observa que 378 son capaces de decir el precio correcto de un artículo
inmediatamente después de colocarlo en el carro. Realice la prueba a un nivel de
significación de 0,05 de que al menos la mitad de todos los compradores son capaces de
decir el precio correcto. Determine el valor p.
11. Una muestra aleatoria de 199 auditores, 104 se mostraron en alguna medida de acuerdo
con la siguiente afirmación «El flujo de cajas es un importante indicador de la
rentabilidad». Contraste al nivel de significación de 0,05 la hipótesis nula que la mitad de
los miembros de esa población estarían de acuerdo con esta afirmación frente a la
alternativa bilateral. Halle el valor p.
7. Prueba de Independencia
La estadística desempeña una función importante en muchos problemas en los que se
2
fe
( filas)( columnas )
fe
n
2. Nivel de Significación
0,01
gl (2 1)(3 1) 2
02, 01, 2 9,21
3. Calcular el Estadístico de Prueba
(87)(69) (87)(61) (87)(50)
f e1 1 33,35 f e1 2 29,48 f e13 24,17
180 180 180
5. Toma de decisión
Existe suficiente evidencia al nivel de significación de 0,01 que nos muestre que hay
relación entre la presencia o ausencia de hipertensión y los hábitos de fumar.
Valor p
P( 2 14,59) con 2 gl.
3. La directiva de una compañía está interesada en determinar si existe una asociación entre
el tiempo de cambio de turno de sus empleados y el nivel de estrés relacionado con
problemas observados en el trabajo. En un estudio de 116 trabajadores de línea de
ensamblaje se reveló lo siguiente.
Estrés
Tiempo de cambio
Alto Moderado Bajo Total
Menos de 15 min. 9 5 18
15 a 45 min. 17 8 28
Más de 15 min. 18 6 7
Total
A un nivel de significancia de 0,01 ¿Existe evidencia de que haya alguna relación entre el
tiempo de cambio de turno y el estrés?
4. Se efectúa un estudio sobre las fallas de un componente electrónico. Existen cuatro tipos
de fallas posibles y dos posiciones de montaje para el dispositivo. Se toman los datos
siguientes:
Posición de Tipo de falla
montaje A B C D Total
1 22 46 18 9
2 4 17 6 12
Total
¿Existe alguna relación entre las calificaciones de los cursos de estadística y Cálculo?
0,05 Determine el valor p.
GUÍA DE LABORATORIO
El software PASW Statistics 18 es un programa que posee las herramientas necesarias para
realizar los análisis estadísticos más frecuentes, tanto en un salón de clase como en el ámbito
profesional. A través de este programa es posible la descripción y tabulación de datos, la
realización de pruebas de hipótesis, el análisis de correlación y regresión entre otros. Para
realizar la práctica de laboratorio supongamos que se aplicaron las siguientes encuestas a una
muestra aleatoria simple de 16 trabajadores de una pequeña empresa.
ENCUESTAS
I EDAD: 37
SEXO: 1. M 2. F
SALARIO EN C$ 3 250
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISTAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
II EDAD: 30
SEXO: 1. M 2. F
SALARIO EN C$ 4 600
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
III EDAD: 27
SEXO: 1. M 2. F
SALARIO EN C$ 5 205
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
IV EDAD: 21 86
SEXO: 1. M 2. F
SALARIO EN C$ 3 000
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
V EDAD: 25
SEXO: 1. M 2. F
SALARIO EN C$ 4 650
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
VI EDAD: 42
SEXO: 1. M 2. F
SALARIO EN C$ 6 800
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
VII EDAD: 31
SEXO: 1. M 2. F
SALARIO EN C$ 4 350
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
VIII EDAD: 26
SEXO: 1. M 2. F
SALARIO EN C$ 3 250
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
IX EDAD: 30
SEXO: 1. M 2. F
SALARIO EN C$ 5 100
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
87
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
X EDAD: 22
SEXO: 1. M 2. F
SALARIO EN C$ 3 650
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
XI EDAD: 37
SEXO: 1. M 2. F
SALARIO EN C$ 6 300
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
XII EDAD: 51
SEXO: 1. M 2. F
SALARIO EN C$ 4 850
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
XIII EDAD: 47
SEXO: 1. M 2. F
SALARIO EN C$ 3 250
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
XIV EDAD: 23
SEXO: 1. M 2. F
SALARIO EN C$ 2 500
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
XV EDAD: 31
SEXO: 1. M 2. F
88
SALARIO EN C$ 5 400
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
XVI EDAD: 29
SEXO: 1. M 2. F
SALARIO EN C$ 4 600
ÁREA DE TRABAJO: 1. Producción 2. Recursos Humanos
3. Finanzas 4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines 2. Restaurantes 3. Bares
4. Parques 5. Centros Comerciales
Al entrar en la opción Tipo aparece en la parte derecha un cuadrito gris con tres puntos ,
Para introducir la segunda variable Sexo usamos las mismas opciones, obtenemos lo siguiente:
La pregunta ¿Qué lugares visitas los fines de semana? tiene múltiples opciones de
selección. En este caso en la base de datos se introduce tantas variables cuantas opciones hay:
Cines
Restaurantes
Bares
Parques
Centros Comerciales.
En valores 0 representa No y 1 representa Si Al final obtenemos.
91
Para procesar la variable Área de trabajo, realice los siguientes pasos, solo que en opción
Gráficos seleccione Gráfico de sectores con Porcentajes.
La modificación de este gráfico es similar al anterior.
Antes de modificar Después de modificar
Porcentaje
a. Existen varias modas. Se mostrará el
6
0
21 22 23 25 26 27 29 30 31 37 42 47 51
Edades
Para esto primero diseñamos los intervalos de clase manualmente en una hoja de papel.
Realizamos los siguientes cálculos,
20 - 24
R= 30 (vea la tabla Estadísticos)
El ancho calculado nos dio 6, pero podemos variar un poco, dejemos el ancho 5 y 25 - 29
empezamos con el dato 20 (dato mínimo es 21) para que los intervalos de clase 30 - 34
quede bonitos. 35 - 39
40 - 44
Vamos a recodificar los datos de las edades con estos intervalos de clase. Realice 45 - 49
los siguientes pasos: 50 - 54
Transformar, Recodificar en distintas variables…
Seleccione la variable que se desea recodificar y pase a la derecha, en
el cuadro de Nombre escribe el nuevo nombre de la variable por
ejemplo edad_ag (edades agrupadas), en Etiqueta escriba Edad de
los trabajadores, pulse Cambiar.
Posteriormente entre en opción Valores antiguos y nuevos…
Obtiene nuevo cuadro de diálogo. En la parte izquierda active
94
la posición Rango ubique en estos espacios los límites del
primer intervalo 20 -24 y en la parte derecha en opción Valor
ubique 1 (es el primer intervalo de clase), después de Añadir.
Así sucesivamente se van introduciendo todos los intervalos
de clase. Continuar y Aceptar.
En la base de datos se agregará una nueva variable, tiene que
dar etiquetas a los valores para esta variable. Al final la base de datos quedará así:
Después de esto puede, crear la tabla de frecuencia y el gráfico de los datos agrupados de la
edad.
Cumulativ e
Frequency Percent Valid Percent Percent
Valid 20-24 3 18.8 18.8 18.8
25-29 4 25.0 25.0 43.8
30-34 4 25.0 25.0 68.8
35-39 2 12.5 12.5 81.3
40-44 1 6.3 6.3 87.5
45-49 1 6.3 6.3 93.8
50-54 1 6.3 6.3 100.0
Total 16 100.0 100.0
TABLAS DE CONTINGENCIA
Para ver las opciones de este procedimiento seleccione del
menú: Analizar, Estadísticos, Descriptivos, Tablas
de Contingencia. Cuando se lleva a cabo tal acción, se
abre una ventana como la de la figura y aparece el cuadro
de diálogo. Como se ve, a la izquierda aparece la típica caja
con el conjunto de variables presentes en el fichero activo. De
entre ellas se elegirán las que irán por filas (se colocarán en la
caja Filas), las que irán por columnas (se colocarán en la caja
Columnas), El procedimiento obtendrá una tabla de contingencia
para cada combinación de dos variables, una de filas y otra de
columnas. Si escogemos las variables sexo (fila) y lugar de
trabajo (columna).
Matriz de Datos.
Casos V1 V2 V3 V4 V5 V6 V7
1 21 2 3 1 12 000 1 2
2 50 2 2 999 15 500 20 2
3 22 1 1 2 13 500 1 1
4 40 1 1 1 18 000 15 2
5 28 999 3 6 15 000 4 1
6 29 1 3 3 20 000 999 2
7 25 2 3 5 17 000 2 2
8 20 1 3 6 22 000 1 2
9 31 2 1 5 32 000 2 1
10 25 2 999 4 28 500 1 2
11 999 2 1 6 999 10 1
12 42 1 4 1 27 500 20 2
13 51 2 4 999 10 500 27 2
14 26 2 1 2 36 000 4 2
15 38 1 2 6 34 500 8 2
16 36 2 1 2 35 000 10 2
17 43 2 1 3 23 800 24 2
18 48 1 2 6 44 200 19 999
19 33 2 999 1 36 200 7 1
20 38 2 4 5 27 000 15 1
21 53 2 4 4 41 500 30 2
99
22 44 1 1 3 32 500 15 2
23 49 2 2 5 43 000 999 1
24 30 1 4 6 25 000 8 2
25 29 1 1 1 15 700 5 2
26 37 2 1 2 18 000 12 2
27 999 2 2 3 16 800 10 1
28 43 2 4 4 15 000 12 999
29 50 2 4 3 30 000 18 1
30 23 1 3 6 32 000 6 2
INFERENCIA ESTADÍSTICA
Crear base de datos con la siguiente matriz
Defina las variables
Sexo 1: Masculino Tiene teléfono 1: Si Tiene casa propia 1: Si
2: Femenino 2: No 2: No
Caso Sexo Edad Energía Agua Teléfono Casa propia
(V1) (V2) (V3) (V4) (V5) (V6)
1 2 28 1250 450 1 2
2 2 21 920 320 2 2
3 1 40 680 350 1 1
4 1 22 450 999 1 1
5 1 24 360 350 2 1
6 1 41 589 430 1 999
7 2 25 1270 500 2 1
8 2 30 1590 290 2 1
9 1 19 1260 550 1 1
10 2 30 490 360 2 2
11 1 21 999 130 2 2
12 2 25 950 220 2 2
13 2 26 620 351 1 2
14 1 28 700 456 1 1
15 2 21 552 452 1 2
16 2 22 468 999 1 2
17 1 20 1220 554 1 1
18 1 30 580 350 2 2
19 1 35 450 260 999 2
20 2 25 1256 999 1 2
21 2 20 1128 620 1 1
22 2 24 999 260 2 1
23 2 22 830 230 1 1
24 2 30 999 190 2 1
25 1 22 525 520 2 1
Con el uso de PASW Statistics 18 podemos obtener Intervalos de Confianza que por
defecto establece una confiabilidad del 95%, puede ser modificado por el usuario.
100
Aplique el siguiente procedimiento
Analizar, Estadísticos descriptivos, Explorar…, Dar clic.
Arrastre la variable cuantitativa de interés a Lista de
Dependientes... Por ejemplo: Pago de Energía.
Pinche Estadísticos… Descriptivos, Continuar, Aceptar. Espere resultados.
…
Error típ. de la
N Media Desviación típ. media
Energía (en C$) 22 824.45 359.062 76.552
Prueba de independencia
Procedimiento
Analizar, Estadísticos descriptivos,
Tablas de contingencia…, Dar clic.
Pruebas de chi-cuadrado
Sig. asintótica Sig. exacta Sig. exacta
Valor gl (bilateral) (bilateral) (unilateral)
a
Chi-cuadrado de Pearson .235 1 .628
b
Corrección por continuidad .005 1 .945
Razón de verosimilitudes .236 1 .627
Estadístico exacto de Fisher .697 .473
Asociación lineal por lineal .225 1 .635
N de casos válidos 24
a. 1 casillas (25.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 4.58.
b. Calculado sólo para una tabla de 2x2.
…
Referencias
Johnson, R. (1988). Estadística Elemental. (4ª. ed.). México: Iberoamérica.