Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La media aritmtica se define como la suma de los valores observados dividida entre el nmero
de observaciones.
Por lo que se vio la mayor densidad de frecuencia est en la parte central de las grficas, de
ah el nombre de medidas de tendencia central que se da a la media aritmtica, la mediana y a
la moda.
Las medidas de posicin son aquellos valores numricos que nos permiten o bien dar alguna
medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la
cantidad de datos en partes iguales.
La media
Donde
n: es el nmero de observaciones
x: el valor de cada observacin
x : es la media aritmtica, media o x barra
La media es la nica de las medidas de tendencia central que puede intervenir en operaciones
algebraicas.
Ese valor tiene varias propiedades importantes:
1) Si x es una de las variables, su desviacin respecto a x es la diferencia x x . La
suma de estas diferencias es cero. ( )
=
=
n
i
i
x x
1
0
En toda distribucin, la suma de las desviaciones de cada uno de los valores de la
variable respecto a la media es cero.
2) Si se toman una cantidad cualquiera de conjuntos de valores, cada uno con su
respectiva media, la media del conjunto general es igual a la suma de cada una de las
medias de los diferentes conjuntos.
3) Es posible hallar la media de un conjunto de valores de una variable a partir de tomar la
distancia de las observaciones a un valor cualquiera (pertenezca o no al recorrido de la
variable)
4) Si a un conjunto de observaciones de una variable se le realiza una operacin
matemtica usando un valor constante, entonces la media del nuevo grupo de valores
as obtenidos es igual a la aplicacin de la misma operacin matemtica usando ese
valor constante sobre la media original.
Media para datos sin agrupar
Dado un conjunto de observaciones
n
x x x ,...., ,
2 1
la media se representa mediante x y se
obtiene dividiendo la suma de todos los datos por el nmero de ellos, es decir:
Problema
Hallar la media aritmtica de los siguientes valores: 5, 7, 8, 10, 15.
Problema
Cantidad de cigarrillos consumidos por un fumador en una semana.
Lunes: 18 Martes: 21 Mircoles: 22 Jueves: 21 Viernes: 20 Sbado: 19 Domingo: 19
Entonces la media aritmtica es.
n
x
n
x x x
x
n
i
i
n
=
=
+ + +
=
1 2 1
20
7
19 19 20 21 22 21 18
7
1
=
+ + + + + +
=
= i
i
x
El fumador consume en promedio 20 cigarrillos diarios.
Ejercicios
1. Si las notas de un alumno en las distintas asignaturas de un curso durante una evaluacin
fueron: 7; 5; 6,5; 3,7; 5, 6,2. Hallar la nota media de la evaluacin. (Resp. 5,5666...)
2. La media de 6 elementos se sabe que es 10. Sabiendo que cinco de ellos son: 8, 12, 13, 5
y 9, hallar el elemento que falta. (Resp. 13)
Mediana y Moda
La mediana y la moda son medidas de tendencia central que por sus propiedades destacan los
valores individuales de un colectivo.
A. Mediana
La mediana se define como el valor que divide un conjunto de datos previamente
ordenados de menos a mayor y es el punto intermedio entre ellos dos.
Si el nmero N de datos es impar, entonces hay un nmero intermedio; por ejemplo, si se
tienen los datos 3, 5, 7, 9, 11 el nmero 7 es el nmero intermedio.
Si el nmero N de datos es par, entonces hay dos datos intermedios; por ejemplo, la media
de los valores 8, 10, 16, 19, 23, 25, hay dos valores centrales que son 16 y 19, el valor
equidistante entre ellos es la mediana:
5 . 17
2
35
2
19 16
= =
+
es la mediana
B. Moda
En un conjunto de datos de una distribucin de frecuencias, la moda es el valor que ocurre
con mayor frecuencia; por ejemplo, en los valores 1, 2, 5, 5, 6, 6, 6, 6, 7, 8, 9, 9, 9, la moda
es 6.
Media Ponderada
Por lo general, en Estadstica, los datos se nos presentan agrupados mediante una distribucin
de frecuencias que hace que no todos los elementos de la serie tengan el mismo peso
especfico, y eso influye a la hora de calcular la media, por eso se llama media ponderada.
Se define como la suma de los productos de cada elemento de la serie por su frecuencia
respectiva, dividida por el nmero de elementos de la serie.
Si
n
x x x ,...., ,
2 1
son las cantidades
n
c c c ,...., ,
2 1
las respectivas ponderaciones, entonces la
media ponderada x es:
=
=
=
+ + +
+ + +
=
n
i
i
n
i
n
n n
c
x c
c c c
x c x c x c
x
1
1
1 1
2 1
2 2 1 1
donde
i
c es la frecuencia o nmero de veces que se repite un valor. Tambin
i
c puede ser la
ponderacin de cada valor x
i
.
Para calcular la media aritmtica de una distribucin de frecuencias agrupadas consideramos
que a todos los valores que hay dentro de un intervalo de clase se les considera de un mismo
valor igual al de la marca de clase y las frecuencias son las ponderadas de los valores en
correspondencia con las marcas de clase y la suma de las frecuencias es el total de veces que
se tiene registro.
Problema
1. Durante el mes de octubre de 1981 los salarios recibidos por un obrero fueron:
Salario en
pesos
Frecuencia en
das
200.000 5
220.000 15
300.000 4
Hallar el salario medio durante ese mes.
24
4 000 . 300 15 000 . 220 5 000 . 200 x x x
x
+ +
=
Problema
El nmero de das necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de
iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media,
mediana, moda, varianza y desviacin tpica.
La media: suma de todos los valores de una variable dividida entre el nmero total de datos de
los que se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra
mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones sea par (10 individuos), los dos
valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de
estos dos valores nos dar a su vez 60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60
1.6 Medidas de Dispersin
La media aritmtica, mediana y la moda describen el comportamiento de los datos en una
distribucin de frecuencias.
Estas medidas no proporcionan informacin sobre la forma en que estn distribuidos o
dispersos los valores con relacin a la tendencia central, y poco informan sobre un dato
especfico con relacin a los otros en la distribucin de frecuencias.
Estudiaremos la desviacin media, la varianza y la desviacin estndar, que miden la
dispersin.
Rango
En toda distribucin hay valores extremos, uno menor y otro mayor, la diferencia entre estos
valores se llama rango y en el estn distribuidos todos los dems valores. Es una medida de
dispersin y es la ms fcil de obtener.
Desviacin media
La desviacin media y la varianza son medidas de dispersin que tienen relacin con la media
aritmtica, ya que las tres tienen propiedades algebraicas que les permiten su uso en
relaciones matemticas que son la base estructural de los anlisis estadsticos; por sus
propiedades algebraicos son las medidas de dispersin de ms frecuente aplicacin y de
mayor importancia.
La media aritmtica de los valores absolutos de las desviaciones de cada uno de los valores de
la variable, respecto a la media aritmtica, es la desviacin media.
Para datos no agrupados, se tiene
|
Y para datos agrupados
Probl ema
Calcular la desviacin media de la distribucin:
9, 3, 8, 8, 9, 8, 9, 18
| | | | | | | | | | | | | | | |
Varianza
La varianza (
Para datos agrupados
La varianza mide la mayor o menor dispersin de los valores de la variable con
respecto a la media aritmtica.
Cuando mayor sea la varianza mayor dispersin existir y por lo tanto menor
representatividad tendr la media aritmtica.
La varianza siempre es mayor o igual que cero y menor que infinito.
Problema
Calcula la desviacin media DM y la varianza de la serie de nmeros 9,10,2,7,12,6,5,8,12,10
| | | | | | | | | | | | | | | | | | | |
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
Desviacin estndar o tpica
La desviacin estndar o desviacin tpica, es la raz cuadrada de la varianza.
Desviacin estndar
La desviacin estndar es la ms importante de todas las medidas de dispersin ya que incluye
ms o menos el 68% de los trminos de una distribucin normal; adems, por sus propiedades
algebraicas se utiliza con facilidad en el anlisis estadstico.
1.7 Distribuciones de frecuencias (Tablas), relativas y porcentuales
Una distribucin de frecuencias es un resumen tabular de datos que muestran la frecuencia (o
la cantidad) de datos en cada una de las varias clases que no se traslapan.
Una vez reunidos los datos de un colectivo para obtener a partir de ellos conclusiones, es
necesario organizarlos en una tabla de distribuciones de frecuencia.
La cual nos representa una funcin, se clasifican en tres tipos, segn el nmero de
observaciones y al nmero de valores distintos que toma la variable.
Distribucin de tipo uno.
Son aquellas que constan de un reducido nmero de observaciones y en consecuencia de un
reducido nmero de valores distintos que toma la variable.
Distribuciones de tipo dos.
Son las que el nmero de observaciones es grande, pero el nmero de valores distintos que
toma la variable son pequeo; en este tipo, se distribuyen o agrupan los resultados disponibles
en dos columnas, una para los valores distintos que toma la variable y otra para la frecuencia
de cada uno de ellos.
Problema.
Para determinar el grado de nutricin de 20 alumnos de secundaria se toma la altura en cm de
cada uno de ellos y son:
128 146 136 136 152
140 124 134 142 138
136 120 130 136 132
136 134 142 132 144
Para facilitar su interpretacin se ordenan de forma ascendente o descendente, a este proceso
se le llama orden de rango.
120 132 136 142
124 134 136 142
128 134 136 144
130 136 138 146
132 136 140 152
Para proceder a organizar los datos se usa la tabla de frecuencia que expresa el nmero de
casos de cada categora.
Distribucin de tipo tres
Si el nmero de observaciones y el nmero de valores que toma la variable son grandes para
su manejo se agrupan las observaciones en intervalos
i i
L L
1
, eligiendo entre ellos una
amplitud fija o variable, mismos que se anotarn en una primera columna; en la segunda, se
tabularn os valores para facilitar su conteo; y en la tercera, se pondr el nmero de frecuencia
f correspondiente a cada intervalo.
Los grupos o categoras que incluye
i i
L L
1
se llaman intervalos de clase; los valores
1 i
L
son los lmites inferiores y
i
L los lmites superiores de estos intervalos.
Clases
i i
L L
1
Tabulaciones Frecuencias
(f)
i
f
1 0
L L
2 1
L L
k k
L L
1
k
f
f
f
2
1
La frecuencia absoluta o simplemente frecuencia, es el nmero de veces que se repite la
variable
i
x ; as
1
f , es el nmero de veces que se repite la observacin
1
x ,
2
f el nmero
de veces que se repite la observacin
2
x , etc.
Problema
En un examen departamental de fsica se examinaron 50 alumnos con los siguientes
resultados;
87 66 73 68 48
37 76 85 74 65
93 77 66 83 68
49 57 38 69 78
89 96 78 97 74
76 68 63 70 81
64 83 67 61 90
77 88 74 75 80
71 73 61 57 72
80 77 85 80 89
Expresamos la tabla de frecuencia, con los datos en forma ascendente.
37 65 72 77 85
38 66 73 77 85
48 66 73 78 87
49 67 74 78 88
57 68 74 80 89
57 68 74 80 89
61 68 75 80 90
61 69 76 81 93
63 70 76 83 96
64 71 77 83 97
Tabla de frecuencias
Clases
i i
L L
1
Tabulaciones Frecuencias (f)
i
f
35-39 II 2
40-44 0
45-49 II 2
50-54 0
55-59 II 2
60-64 IIII 4
65-69 IIIII II 8
70-74 IIIII III 8
75-79 IIIII III 8
80-84 IIIII I 6
85-89 IIIII II 6
90-94 II 2
95-100 II 2
Marca de clase.
Una vez hecho todo lo anterior y antes de aplicar a la informacin los mtodos estadsticos, es
necesario sustituir cada intervalo por un nmero, a este nmero se le llama marca de clase y
es el valor central de cada intervalo, es decir la media aritmtica de los lmites inferior y
superior, se obtiene as:
Marca de clase =
2
1 i i
i
L L
x
+
=
Tabla de frecuencias
Clases
i i
L L
1
Tabulaciones Marca de clase
Mc
i
x
Frecuencias (f)
i
f
1 0
L L
2 1
L L
k k
L L
1
k
x
x
x
2
1
k
f
f
f
2
1
Los datos obtenidos los anotamos en la tabla de frecuencias
Clases
i i
L L
1
Tabulaciones Marca de clase
mc
i
x
Frecuencias (f)
i
f
35-39 II 37 2
40-44 0 42 0
45-49 II 47 2
50-54 0 52 0
55-59 II 57 2
60-64 IIII 62 4
65-69 IIIII II 67 7
70-74 IIIII III 72 8
75-79 IIIII III 77 8
80-84 IIIII I 82 6
85-89 IIIII II 87 7
90-94 II 92 2
95-97 II 97 2
Frecuencia acumulada: Ojivas
El cuadro siguiente expresa la distribucin de frecuencias agrupadas no acumulativas que se
elaboro
Clase Frecuencias
123.5-128.5
128.5-133.5
133.5-138.5
138.5-143.5
143.5-148.5
148.5-153.5
153.5-158.5
158.5-163.5
163.5-168.5
4
4
8
21
6
25
21
10
1
Total 100
La frecuencia acumulada, se obtiene acumulando la frecuencia absoluta.
Problema
Con base en el cuadro anterior de distribucin de frecuencias agrupadas, obtener dos
cuadros; el de frecuencias acumuladas hacia abajo y otro de frecuencias acumuladas hacia
arriba, y trazar las ojivas correspondientes.
Cuadro A
Frecuencia acumulada de estaturas que expresa el nmero de alumnos que miden menos
de la estatura indicada.
Estatura Nm. De
alumnos
123.5
128.5
133.5
138.5
143.5
148.5
0
4
8
16
37
43
153.5
158.5
163.5
168.5
68
89
99
100
Cuadro B
Frecuencia acumulada de estaturas que expresa el nmero de alumnos que miden ms de la
estatura indicada.
Estatura Nm. De alumnos
123.5
128.5
133.5
138.5
143.5
148.5
153.5
158.5
163.5
168.5
100
96
92
84
63
57
32
11
1
0
Distribucin de frecuencias relativas
La frecuencia relativa de una clase es la proporcin de la cantidad del total de datos que
pertenecen a esa clase.
Poder organizar la informacin en una tabla de frecuencias, presentarla en cuadros, marcar los
intervalos de clase y hacer las grficas de frecuencias absolutas, permiten relacionar y
comprender los valores de un mismo colectivo.
Frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por el tamao de
la muestra.
La frecuencia relativa de una clase se obtiene en tanto por ciento, que es la nueva base, si
dividimos la frecuencia de la clase entre el nmero total de frecuencias y el resultado lo
multiplicamos por 100.
100
N
L
relativa Frecuencia =
Para facilitar el clculo de las frecuencias relativas de cada clase, se usa un factor de
correccin que resulta de dividir 100 por el nmero total de frecuencias.
N
Factor
100
=
Problema
Las autoridades de la secretaria de educacin pblica deciden que en otra escuela tambin se
tomen las estaturas en cm. De todos los alumnos, pero ahora, de los menores de 17 aos, para
fines nutricionales.
Elabora un cuadro de frecuencias agrupadas que incluya las frecuencias absolutas y las
relativas, estas ltimas en tanto por ciento.
Clase Frecuencias Relativas en %
123.5-128.5
128.5-133.5
133.5-138.5
138.5-143.5
143.5-148.5
148.5-153.5
153.5-158.5
158.5-163.5
163.5-168.5
168.5-173.5
2
3
8
20
9
8
30
23
15
4
1.638
2.457
6.552
16.380
7.371
6.552
24.570
18.837
12.285
3.276
Total 122 100.00
Factor de correccin
( ) ( ) 457 . 2 819 . 0 3 638 . 1 819 . 0 2 819 . 0
122
100
= = = = factor
Distribuciones porcentuales acumuladas (Porcentuales)
Los cuadros de frecuencia acumulada porcentuales se obtienen convirtiendo las frecuencias
acumuladas en frecuencias relativas o proporcionales de base 100.
Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamao
de la muestra.
Problema
En el cuadro siguiente la distribucin acumulativa de estaturas de un grupo de alumnos, que
expresa el nmero de ellos que midieron, menos de la estatura indicada, agrega la columna
correspondiente a las frecuencias relativas y traza la ojiva porcentual.
Estatura Frecuencia acumulada
Nm. De Alumnos Relativas en %
128.5
133.5
138.5
143.5
148.5
153.5
158.5
163.5
168.5
173.5
0
2
5
14
38
45
65
89
103
106
0.000
1.886
4.715
13.202
35.834
42.435
61.295
83.927
97.129
100.000
Factor de conversin 943 . 0
106
100
= = f actor
Se obtienen las frecuencias relativas:
( ) ( ) ( ) 715 . 4 943 . 0 5 886 . 1 943 . 0 2 00 . 0 943 . 0 0 = = =
Media para datos agrupados
Problema
Calcular la media aritmtica de la distribucin de frecuencias agrupadas de la tabla de
frecuencias.
Clases
i i
L L
1
Tabulaciones Marca de clase
mc
i
x
Frecuencias (f)
i
f
35-39 II 37 2
40-44 0 42 0
45-49 II 47 2
50-54 0 52 0
55-59 II 57 2
60-64 IIII 62 4
65-69 IIIII II 67 7
70-74 IIIII III 72 8
75-79 IIIII III 77 8
80-84 IIIII I 82 6
85-89 IIIII II 87 7
90-94 II 92 2
95-100 II 97.5 2
Se procede de la siguiente manera
Intervalos Marca x
Frecuencias (
i
f )
i i
x f
35-39 37 2 74
40-44 42 0 0
45-49 47 2 94
50-54 52 0 0
55-59 57 2 114
60-64 62 4 248
65-69 67 7 469
70-74 72 8 576
75-79 77 8 616
80-84 82 6 492
85-89 87 7 609
90-94 92 2 184
95-100 97.5 2 194
50 2 2 7 6 8 8 7 4 2 0 2 0 2
1
= + + + + + + + + + + + + =
=
n
i
i
f
3671 194 184 609 492 616 576 469 248 114 0 94 0 74
1
= + + + + + + + + + + + + =
=
n
i
i i
x f
4 . 73
50
3671
1
1
= = =
=
=
n
i
i
n
i
i i
f
x f
x
..\..\..\..\semestre enero 2012\1 media.xlsx
Calcular la desviacin media de la distribucin de frecuencias agrupadas de la tabla de
frecuencias.
Calcular la desviacin media de la distribucin de frecuencias agrupadas de la tabla de
frecuencias.
1.8 Cuantiles (cuartiles de datos simples y acumulados)
Los cuantiles son medidas de posicin que se determinan mediante un mtodo que determina
la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales.
Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en
intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un
nmero alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella,
se puede dividir la distribucin en cuatro, en diez o en cien partes.
Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles,
cuando dividen la distribucin en diez partes y los centiles o percentiles, cuando dividen la
distribucin en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma
una extensin de la mediana.
Para algunos valores u, se dan nombres particulares a los cuantiles, Q (u):
u Q(u)
0.5 Mediana
0.25, 0,75 Cuartiles
0.1,,0.99 Deciles
0.01,,0.99 Centiles
Cuartiles
A fin de conocer los intervalos dentro de los cuales quedan representados proporcionalmente
los trminos de una distribucin, se divide la distribucin de frecuencia en 4 partes iguales,
cada una contiene igual nmero de observaciones (el 25% del total).
Los puntos de separacin de los valores de X se llaman cuartiles.
El primer cuartil corresponde al 25% y se designa con
.
El segundo cuartil es
Problema
Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias, calcular sus cuartiles.
x
i
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
Primer cuartil
Primera
Segundo cuartil
Primera
Tercer cuartil
Primera
Clculo de los cuartiles para datos agrupados
En primer lugar buscamos la clase donde se encuentra
, en l a t abl a de
l as f r ecuenci as acumul adas.
El lmite inferior de la clase donde se encuentra el cuartil, es
.
La suma de las frecuencias absolutas, es N.
La frecuencia acumulada anterior a la clase del cuartil, es
La amplitud de la clase, es
.
Problema
Calcular los cuartiles en el cuadro de frecuencias agrupadas, en donde se han registrado las
alturas de un grupo de alumnos.
Clase
50-60
60-70
70-80
80-90
90-100
100-110
110-120
8
10
16
14
10
5
2
8
18
34
48
58
63
65
65
Clculo del primer cuartil
()
()
Clculo del segundo cuartil
()
()
Clculo del tercer cuartil
()
()
Clase Frecuencias
121.5-126.5
126.5-131.5
131.5-136.5
136.5-141.5
141.5-146.5
146.5-151.5
151.5-156.5
156.5-161.5
161.5-166.5
2
3
8
23
27
20
16
3
2
Total
Dividimos el total N de las frecuencias acumuladas entre 4 y obtenemos el nmero de
observaciones que hay en el primer cuartil.
El primer cuartil cae en la clase , las tres primeras clases contienen 13 alumnos
(sumamos 2+3+8=13) para las 13 que faltan los calculamos por interpolacin lineal, as;
1.9 Grafica de barras, diagrama de segmentos, diagrama de rbol, diagrama de cajas,
diagrama de tallo y hojas, diagrama de dispersin, grfico de puntos, histograma,
polgono de frecuencias, ojiva y tabulacin cruzada
Diagrama de frecuencia de puntos
Diagrama de barras
El diagrama de barras es la representacin grfica que se usa cuando se dispone de muchas
observaciones pero pocos valores de la variable (distribucin de tipo dos).
Se elabora sealando en el eje de las x (abscisas) de un sistema de ejes coordenados, los
valores de la variable, poniendo sobre ellas unas columnas a escala de las alturas igual a la
frecuencia de cada uno de los valores, medidos en el sentido del eje de las y (ordenadas).
Diagrama de rbol
El diagrama de rbol es una representacin grfica de los posibles resultados del experimento,
el cual consta una serie de pasos, donde cada uno de los pasos tiene un nmero finito de
maneras de ser llevado a cabo. Se utiliza en los problemas de conteo y probabilidad.
Ayudado de un diagrama de rbol, determinamos el espacio muestral del experimento aleatorio
de lanzar tres monedas al aire.
Diagramas de caja
3
5
8
12
6
5
4
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7
Series1
Los diagramas de Caja-Bigotes son una presentacin visual que describe varias
caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra.
Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los
datos, sobre un rectngulo, alineado horizontal o verticalmente.
Es un grfico que suministra informacin sobre los valores mnimo y mximo, los cuartiles Q1,
Q2 o mediana y Q3, y sobre la existencia de valores atpicos y la simetra de la distribucin.
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran
el recorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica
donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero
(recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y
mximo de la variable. Las lneas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen un lmite de prolongacin, de modo que cualquier dato o caso que no se encuentre
dentro de este rango es marcado e identificado individualmente.
Problema
Distribucin de edades
Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad
de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Ordenar los datos
Para calcular los parmetros estadstico, lo primero es ordenar la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Calculo de Cuartiles
Q
1
, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N =
20 resulta que
Q
2
, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la
variable que ocupa el lugar central en un conjunto de datos ordenados. Como
; la
mediana es la media aritmtica de dicho valor y el siguiente:
Q
3
, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En
nuestro caso, como
, resulta
Dibujar la Caja y los Bigotes
El bigote de la izquierda representa al colectivo de edades (
)
La primera parte de la caja a (Q
1
, Q
2
),
La segunda parte de la caja a (Q
2
, Q
3
)
El bigote de la derecha viene dado por (
)
Informacin del diagrama
Podemos obtener abundante informacin de una distribucin a partir de estas
representaciones. Veamos alguna:
- La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que
las edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa
que entre el 50% y el 75%.
- El bigote de la izquierda (
y
el primer cuartil
, es decir:
El rango intercuartil se usa para construir Diagramas de caja que sirven para visualizar la
variabilidad de una variable y comparar distribuciones de la misma variable, adems de ubicar
valores extremos.
Varianza
Definimos varianza a la media de los cuadrados de las desviaciones respecto a la media.
()
Coeficiente de Variacin
El coeficiente de variacin permite comparar la dispersin entre dos poblaciones distintas e
incluso, comparar la variacin producto de dos variables diferentes (que pueden provenir de
una misma poblacin).
Estas variables podran tener unidades diferentes, por ejemplo, podremos determinar si los
datos tomados al medir el volumen de llenado de un envase de cierto lquido varan ms que
los datos tomados al medir la temperatura del lquido contenido en el envase al salir al
consumidor. El volumen los mediremos en
El numerador es la suma de los valores de las observaciones. Es decir,
Dados los datos 46, 54, 42, 46, 32 que representan el tamao de cinco grupos de una
universidad.
Calculamos la media muestral,
Teorema de Chebyshev
Para cualquier distribucin estadstica de datos de una variable (muestra o poblacin), la
proporcin () mnima de los valores que se encuentran dentro de k desviaciones estndares
desde la media es al menos
por lo
tanto en la escala estandarizada (Z) ese intervalo se convierte en ,-. Luego todo valor de x
cuyo valor estandarizado este fuera del anterior intervalo se pude considerar atpico.
1.12 Diagrama de Pareto
El nombre de Pareto fue dado por el Dr. Joseph Juran en honor
del economista italiano Wilfredo Pareto.
Wilfredo Pareto (Paris 1848 Turn 1923) economista italiano,
realiz un estudio sobre la riqueza y la pobreza. Descubri que el
20% de las personas controlaba el 80% de la riqueza en Italia.
Pareto observ muchas otras distribuciones similares en su
estudio.
A principios de los aos 50, el Dr. Joseph Juran descubri la
evidencia para la regla de "80-20" en una gran variedad de
situaciones. En particular, el fenmeno pareca existir sin
excepcin en problemas relacionados con la calidad. Una expresin comn de la regla 80/20
es que "el 80% de nuestro negocio proviene del 20% de nuestros clientes."
Por lo tanto, el Anlisis de Pareto es una tcnica que separa los "pocos vitales" de los "muchos
triviales". Una Grfica Pareto es utilizada para separar grficamente los aspectos significativos
de un problema desde los triviales de manera que un equipo sepa dnde dirigir sus esfuerzos
para mejorar.
Definicin
El Diagrama de Pareto consiste en un grfico de barras similar al histograma que se conjuga
con una ojiva o curva de tipo creciente y que representa en forma decreciente el grado de
importancia o peso que tienen los diferentes factores que afectan a un proceso, operacin o
resultado.
..\..\..\..\semestre enero 2012\diagrama de pareto.xlsx
Al identificar y analizar un producto o servicio para mejorar la calidad.
Cuando existe la necesidad de llamar la atencin a los problemas o causas de una forma
sistemtica.
Al analizar las diferentes agrupaciones de datos (ejemplo: por producto, por segmento del
mercado, rea geogrfica, etc.)
Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones
Al evaluar los resultados de los cambios efectuados a un proceso (antes y despus).
Cuando los datos puedan agruparse en categoras.
En casos tpicos, los pocos vitales (pasos, servicios, tems, problemas, causas) son
responsables por la mayor parte en el impacto negativo sobre la calidad.
Un equipo puede utilizar la Grfica de Pareto para varios propsitos durante un proyecto para
lograr mejoras.
- Para identificar oportunidades para mejorar
- Para identificar un producto o servicio para el anlisis de mejora de la calidad
- Cuando existe la necesidad de llamar la atencin a los problemas o causas de una forma
sistemtica
- Para analizar las diferentes agrupaciones de datos
- Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones
- Para evaluar los resultados de los cambios efectuados a un proceso comparando sucesivos
diagramas obtenidos en momentos diferentes, (antes y despus)
- Cuando los datos puedan clasificarse en categoras
- Cuando el rango de cada categora es importante
Los propsitos generales del diagrama de Pareto
- Analizar las causas
- Estudiar los resultados
- Planear una mejora continua
- Como fotos de "antes y despus" para demostrar que progreso se ha logrado
Unidad II - Probabilidad
2.1 Probabilidad de eventos
Experimento Aleatorio
Definicin
Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se repita
siempre de la misma manera
2.2 Espacio muestral
Definicin
El conjunto de todos los posibles resultados de un experimento aleatorio recibe el nombre de
espacio muestral del experimento. El espacio muestral se denomina con la letra S.
Espacio Muestral discreto
Definicin
Un espacio muestral es discreto si est formado por un conjunto finito (o infinito contable) de
resultados.
Suceso
Definicin
Un suceso es un subconjunto del espacio muestral de un experimento aleatorio.
()
Por ejemplo en el espacio muestral S = {1, 2, 3, 4, 5, 6} del lanzamiento de un dado, los
siguientes son eventos:
1. Obtener un nmero primo
A = {1,2, 3, 5}
2. Obtener un nmero primo y par
B = {2}
3. Obtener un nmero mayor o igual a 5
4. C = {5, 6}
Problema
Describa el espacio muestral que sea apropiado para un experimento en el que tiramos un par
de dados, uno rojo y uno verde.
El espacio muestral que proporciona la mayor informacin consiste en los 36 puntos dados por,
*( ) +
Donde
x representa el nmero en que cay el dado rojo
y representa el nmero en que cay el dado verde
Problema
Con respecto al ejercicio anterior describa el suceso A en que el nmero de puntos obtenidos
sea divisible entre 3.
Entre 1, 2, 3, 4, 5, 6, slo 3 y 6 son divisibles entre 3
*+
Problema
Describa un suceso B en que el nmero de puntos obtenidos con el par de dados sea 7.
Entre los posibles resultados, slo () () () () () () dan un total de 7.
Por lo que el conjunto solucin es *() () () () () () +
2.3 Ocurrencia de eventos
En funcin de la relacin de probabilidad que se pueda establecer entre los sucesos, estos se
clasifican en:
Mutuamente excluyentes o disjuntos.
Son aquellos sucesos en los que en un mismo experimento aleatorio no es posible que ocurran
simultneamente. La interseccin de los conjuntos que los representan es el conjunto vaco.
| = B A
No mutuamente excluyentes entre s.
Son aquellos sucesos en los que en un mismo experimento aleatorio, en los que la posibilidad
de que ocurra uno de ellos no importa que el otro suceso ocurra; es decir pueden ocurrir
conjuntamente. La interseccin de los conjuntos que los representan, es el conjunto diferente
del vaco. | = B A
Problema
Al lanzar una moneda solo puede ocurrir que salga cara o sello pero no los dos a la vez, esto
quiere decir que estos eventos son excluyentes.
Problema
Experimento aleatorio: se analiza en un momento dado el estado de salud de los habitantes de
una comunidad.
Consideremos los sucesos siguientes:
A: La persona es diabtica
B: La persona est sana
C: La persona tiene un problema de salud permanente, tiene una enfermedad crnica
D: La persona tiene gripa
E: La persona es hipertensa
Diga que sucede para los sucesos anteriores si se pide;
B A
D B
C B
D A
Problema
Experimento aleatorio: se observa la escolaridad de las personas de 20 a 60 aos de edad de
una comunidad.
Consideremos los siguientes sucesos.
A. Una persona tiene menos de 40 aos
B. La persona es ingeniero
C. La persona es analfabeta
D. La persona tiene 40 aos o ms
Que pasa con los sucesos si se pide;
D A C B D B B A
2.4 Permutaciones y combinaciones
( )( )( ) ()()
Permutacin y combinacin Qu diferencia hay?
Normalmente usamos la palabra "combinacin" descuidadamente, sin pensar en si el
orden de las cosas es importante. En otras palabras:
"Mi ensalada de frutas es una combinacin de manzanas, uvas y bananas": no
importa en qu orden pusimos las frutas, podra ser "bananas, uvas y manzanas" o
"uvas, manzanas y bananas", es la misma ensalada.
"La combinacin de la cerradura es 472": ahora s importa el orden. "724" no
funcionara, ni "247". Tiene que ser exactamente 4-7-2.
As que en matemticas usamos un lenguaje ms preciso:
- Si el orden no importa, es una combinacin
- Si el orden s importa es una permutacin
Permutaciones
Un arreglo de cosas en un orden dado; constituye una permutacin. En una
permutacin el orden es importante.
Problema
Se tienen 6 mquinas de escribir y 6 personas para operar las mquinas, de cuntas
maneras se pueden asignar las personas a las mquinas?
6 P6 = 6 ! = 6 5 4 3 2 1 = 720
Problema
De cuntas maneras se pueden ordenar las letras A, B, C tomndolas todas a la
vez?
Solucin: 3 P3 = 3 2 1 = 6 [ABC, BCA, CAB, BAC, CBA, ACB]
Problema
Cinco ciudades se comunican entre s, segn el diagrama
De cuntas formas es posible:
a) Viajar desde A hasta E
b) Hacer el viaje redondo desde A hasta E
c) Hacer el viaje redondo desde A hasta E sin usar el mismo camino
2.5 Diagramas de rbol
Un diagrama de rbol es una herramienta que se utiliza para determinar todos los
posibles resultados de un experimento aleatorio. En el clculo de la probabilidad se
requiere conocer el nmero de elementos que forman parte del espacio muestral,
estos se pueden determinar con la construccin del diagrama de rbol.
El diagrama de rbol es una representacin grfica de los posibles resultados del
experimento, el cual consta una serie de pasos, donde cada uno de los pasos tiene un
nmero finito de maneras de ser llevado a cabo. Se utiliza en los problemas de conteo
y probabilidad.
Para la construccin de un diagrama en rbol se partir poniendo una rama para cada
una de las posibilidades, acompaada de su probabilidad. Cada una de estas ramas
se conoce como rama de primera generacin.
En el final de cada rama de primera generacin se constituye a su vez, un nudo del
cual parten nuevas ramas conocidas como ramas de segunda generacin, segn las
posibilidades del siguiente paso, salvo si el nudo representa un posible final del
experimento (nudo final).
Hay que tener en cuenta que la construccin de un rbol no depende de tener el
mismo nmero de ramas de segunda generacin que salen de cada rama de primera
generacin y que la suma de probabilidades de las ramas de cada nudo ha de dar 1.
Existe un principio sencillo de los diagramas de rbol que hace que stos sean mucho
ms tiles para los clculos rpidos de probabilidad: multiplicamos las probabilidades
si se trata de ramas adyacentes (contiguas), o bien las sumamos si se trata de ramas
separadas que emergen de un mismo punto.
A continuacin ejemplificaremos cada uno de estos conceptos.
Experimento aleatorio
Lanzar dos monedas al aire. Para conocer el dominio utiliza un diagrama de rbol.
Entonces el dominio es: {(AA), (AS), (SA), (SS)}.
Este conjunto se llama espacio muestral y se designa con S, que es, adems, el
dominio de la funcin aleatoria; a cada uno de sus resultados se les llama eventos.
Ahora determinaremos el espacio muestral de cada uno de los siguientes
experimentos aleatorios:
1. Lanzar tres monedas al aire.
2. Lanzar un dado y dos monedas.
3. Las respuestas de un examen, si las preguntas son las siguientes:
( ) Descubrimiento de Amrica. 1. 1810
( ) Conquista de Mxico. 2. 1492
( ) Declaracin de Independencia. 3. 1521
4. Los hijos varones y mujeres de una familia de tres hijos.
5. Los lugares que ocupan tres personas en una fila de supermercado.
Ayudados por un diagrama de rbol, los resultados de las preguntas anteriores seran:
1. Lanzar tres monedas al aire son:
2. Dos monedas y un dado con seis nmeros
3. Resultados de un examen.
4. Hijos varones y mujeres de una familia de tres hijos: varones H, mujeres M.
5. Lugares que ocupan tres personas en una fila de supermercado. Llamaremos
P1 = primera persona, P2 = segunda persona y P3 = tercera persona.
2.6 Axiomas de probabilidad
Probabilidades: Definiciones y Conceptos
Las Probabilidades pertenecen a la rama de la matemtica que estudia ciertos
experimentos llamados aleatorios, o sea regidos por el azar, en que se conocen todos
los resultados posibles, pero no es posible tener certeza de cul ser en particular el
resultado del experimento. Por ejemplo, experimentos aleatorios cotidianos son el
lanzamiento de una moneda, el lanzamiento de un dado, extraccin de una carta de un
mazo de naipes. Ms adelante se ver que debemos distinguir entre los conceptos de
probabilidades matemticas o clsicas de las probabilidades experimentales o
estadsticas.
Postulado 1
La probabilidad de un suceso es un nmero real no negativo; esto es () para
cualquier subconjunto A de S.
- Las probabilidades son los valores de una funcin de conjunto, tambin
conocida como medida de probabilidad, esta funcin asigna nmeros reales a
los diferentes subconjuntos de un espacio muestral S
Postulado 2
()
Postulado 3
Si
\
|
|
.
|
\
|
= =
B A P
B P A P B A P
Probl ema
De un grupo escolar se van a elegir por sorteo a 3 alumnos que se hagan cargo de
una ceremonia escolar: en el grupo hay 24 hombres y 12 mujeres, Cul es la
probabilidad de que el grupo de representantes est conformado de las maneras
siguientes?
A. Sean tres hombres
B. Sean dos hombres y una mujer
C. Sean dos mujeres y un hombre
D. Sean tres mujeres
a) Sean tres hombres
( ) A P Se tienen que dar los siguientes sucesos
1
A : El primer alumno seleccionado sea hombre
( )
36
24
1
= A P
2
A : El segundo alumno seleccionado sea hombre
( )
35
23
2
= A P
Los sucesos
2 1
A y A son dependientes
3
A : El tercer alumno seleccionado sea hombre
( )
34
22
3
= A P
( ) ( ) ( ) ( ) ( )
% 34 . 28 ) (
2834 . 0
42840
12144
34
22
35
23
36
24
) (
3 2 1 3 2 1
=
= =
|
.
|
\
|
|
.
|
\
|
|
.
|
\
|
=
= =
A P
A P
A P A P A P A A A P A P
b) Sean dos hombres y una mujer
1
B : Sale el primer hombre
36
24
) (
1
= B P
2
B : Sale el segundo hombre
35
23
) (
2
= B P
3
B : Sale la mujer
34
12
) (
3
= B P
% 46 . 15 ) (
1546 . 0
42840
6624
34
12
35
25
36
24
) ( ) ( ) ( ) (
3 2 1
=
= =
|
.
|
\
|
|
.
|
\
|
|
.
|
\
|
= =
B P
B P B P B P B P
Probl ema
Cerca de cierta salida de una carretera, las probabilidades son 0.23 y 0.24, de que un
camin parado en un retn tendr frenos defectuosos, neumticos muy gastados
respectivamente. Tambin, la probabilidad es 0.38 de que un camin parado en el
retn tendr frenos defectuosos o neumticos muy gastados. Cul es la probabilidad
de que un camin parado en este retn tendr los frenos defectuosos as como los
neumticos muy gastados?
B: Suceso que un camin parado tendr frenos defectuosos
T: Suceso que tendr neumticos muy gastados
38 . 0 ) ( 24 . 0 ) ( 23 . 0 ) ( = = = T B P T P B P
% 9
09 0 38 . 0 24 . 0 23 . 0
) ( ) ( ) ( ) (
) ( ) ( ) ( ) (
) ( ) ( ) ( ) (
=
= + =
+ =
+ = +
+ =
T B P T P B P T B P
T P B P T B P T B P
T B P T P B P T B P
Probl ema
Una organizacin de los consumidores ha estudiado los servicios con garanta
proporcionados por las 50 agencias de automviles nuevos en una cierta ciudad en la
tabla siguiente se resumen sus hallazgos.
Buen servicio de garanta Mal servicio de garanta
En operacin por
10 aos o ms
16
4
20
En operacin
Menos de 10 aos
10
20
30
Total 26 24 50
a) Si una persona selecciona aleatoriamente una de estas agencias de
automviles nuevos, Cul es la probabilidad de que seleccione una que
proporciona buen servicio de garanta?
b) Si una persona selecciona una de las agencias que han operado 10 aos o
ms, Cul es la probabilidad de que seleccione una agencia que proporcione
buen servicio de garanta?
G: Denota la seleccin de la agencia que proporciona buen servicio de garanta.
S: Denota el nmero de elementos en el espacio muestral completo.
a)
% 52 ) (
52 . 0
50
26
50
10 16
) (
=
= =
+
= =
G P
N
n
G P
b) Para la segunda pregunta, buscamos el espacio muestral reducido que consta
de la primera lnea de la tabla, esto es, 16+4 =20 agencias. De estas, 16
proporcionan buen servicio de garanta y se tiene
% 52 ) (
80 . 0
20
16
) / (
=
= =
G P
T G P
2.7 Independencia y probabilidad condicional
Probabilidad condicional
La probabilidad condicional se aplica en el clculo de un evento cuando se sabe que
ha ocurrido otro con el cual se relacionan; es decir, los sucesos son dependientes.
Sean A y B dos sucesos dependientes tales que ()
Para expresar la probabilidad de B dado que A ha ocurrido, se expresa ( )
De la misma manera si ()
Para sealar la probabilidad de A dado que B ha ocurrido, se expresa ()
Vamos a considerar ( )
La probabilidad de ( ) se realiza en un mismo espacio muestral, que es un
subconjunto del espacio muestral original S. Es decir, el espacio muestral original S se
ve modificado por que ya ocurri el suceso A.
La probabilidad condicional satisface las propiedades de la frecuencia relativa en la
forma siguiente:
Para los sucesos
( )
( ) Si y slo si ocurre en las n repeticiones
( ) Si y slo si nunca ocurre en las repeticiones
Definicin
Si A y B son dos sucesos cualquiera en un espacio muestral S y 0 ) ( > A P , la
probabilidad condicional de B dado A es
) (
) (
) / (
A P
B A P
A B P
=
Problema
En una escuela de enseanza media superior, el 20% de los alumnos reprobaron
matemticas, el 25% fsica y el 5% ambas materias. Si se selecciona un alumno al
azar:
a) Si reprob fsica. Cul es la probabilidad de que haya reprobado
matemticas?
b) Si reprob matemticas. Cul es la probabilidad de que haya reprobado
fsica?
c) Cul es la probabilidad de que haya reprobado fsica o matemticas?
()
()
( )
()
( )
()
()
( )
()
( ) () () ( )
( )
Problema
El espacio muestral S de la poblacin de adultos en un pequeo pueblo que han
satisfecho los requisitos para graduarse en la escuela. Se deben clasificar de acuerdo
con el sexo y si trabajan o no actualmente.
Empleado Desempleado Total
Hombre 460 40 500
Mujer 140 260 400
Total 600 300 900
Basados en el espacio muestral anterior definir:
a. La probabilidad de que sea empleado
b. La probabilidad de que sea desempleado
c. La probabilidad de que sea hombre y al mismo tiempo sea desempleado
d. Encuentre la probabilidad de que se escoge un hombre dado que el elegido
tiene empleo
Esto es () . Ahora considrese otro en el cual se
sacan dos cartas en sucesin, con remplazo, de un paquete normal, los eventos se
definen como:
A: la primera carta es un as,
B: la segunda carta es de espadas.
Puesto que se remplaza la primera carta, el espacio muestral para ambas cartas
consisten de 52, en el que hay 4 ases y 13 espadas. Por lo tanto
()
Y
()
Esto es, () ()cuando esto es cierto, se dice que los eventos A y B son
independientes.
La nocin de probabilidad condicional permite revaluar la idea de probabilidad de un
evento de mayor informacin; es decir cuando se sabe que otro evento ha ocurrido. La
probabilidad () es una actualizacin de la ()con la base en la certeza de que
se ha presentado el evento B. en el problema del avin fue importante conocer la
probabilidad de que el vuelo llegara a tiempo. Supngase que sabe que se vuelo no
parti a tiempo, con estos datos adicionales, lo ms pertinente es calcular (
) esto es, la probabilidad de que llegue a tiempo, dado que no llego a tiempo. En
munchas situaciones las conclusiones que se sacan de las observaciones de la
probabilidad condicional ms importantes cambian totalmente la situacin. En este
ejemplo, el clculo de P()lo da
P()
()
()
2.8 Teorema de Bayes
Proyecto
1. Cuntas palabras con cdigo de 3 letras se pueden formar usando las 8
primeras letras del alfabeto (26 letras).
a) Si ninguna letra puede repetirse
b) Si se pueden repetir las letras
2. Las 5 finalistas del concurso Seorita Universo son los representantes de
Argentina, Blgica, Estados Unidos, Japn y Noruega. De cuantas maneras
pueden elegir los jueces;
a) La ganadora y la primera suplente
b) La ganadora, la primera y la segunda suplente?
3. Cuntas permutaciones diferentes hay de la palabra statistics?
4. La seorita Jones tiene cuatro faldas, siete blusas y tres suteres. En cuntas
formas puede escoger dos de las faldas, tres de las blusas y uno de los
suteres para llevar en un viaje?
5. Cuntos grupos de 5 o ms personas pueden formarse con 10 personas?
6. Una placa consiste en dos letras seguidas por cuatro dgitos, cuntas placas
pueden elaborar s;
a) Se pueden repetir las letras y los dgitos
b) Si no se pueden repetir?
Calcula la permutacin o combinacin correspondiente a cada una de las
situaciones que se dan a continuacin.
7. Se elige un comit de 5 personas en el que debe haber 2 arquitectos de 7 que
hay en la compaa y 3 ingenieros de los 10 que trabajan ah. De cuntas
formas diferentes han de escoger el comit?
8. De cuantas maneras diferentes se puede formar un comit con un presidente,
un secretario y un tesorero, en un club que consta de 15 socios?
9. Experimento aleatorio: se observa la escolaridad de las personas de 20 a 60
aos de edad de una comunidad.
Consideremos los siguientes sucesos.
E. Una persona tiene menos de 40 aos
F. La persona es ingeniero
G. La persona es analfabeta
H. La persona tiene 40 aos o ms
Que sucede con los sucesos si se pide;
D A C B D B B A
10. En un grupo de 200 estudiantes (80 mujeres y 60 hombres), 140 en total son
alumnos de tiempo completo y otro de 60, (40 son mujeres y 20 hombres) son
de tiempo parcial.
Experimento: un estudiante es seleccionado al azar, para esto se definen tres
sucesos.
A. Estudiante seleccionado de tiempo completo
B. Estudiante seleccionado de tiempo parcial
C. Estudiante seleccionado sea hombre
a) Defina si los sucesos A y B son mutuamente excluyentes o no.
b) Defina si los sucesos A y C son mutuamente excluyentes o no.
11. Se analiza en un momento dedo el estado de salud de los habitantes de la
ciudad.
Consideremos los casos siguientes:
A: La persona es diabtica
B: La persona est sana
C: La persona tiene un problema de salud permanente, tiene una
enfermedad crnica.
D: La persona tiene gripa
E: La persona es hipertensa
a) Los sucesos A y B son mutuamente excluyentes o no?
b) Si | = E C son mutuamente excluyentes o no?
c) Qu sucede con los sucesos B y C?
d) Cmo son los sucesos C y D?
12. Una organizacin de los consumidores ha estudiado los servicios con garanta
proporcionados por las 50 agencias de automviles nuevos en una cierta
ciudad en la tabla siguiente se resumen sus hallazgos.
Buen servicio
de garanta
Mal servicio de
garanta
En operacin por 10
aos o ms
16
4
20
En operacin
Menos de 10 aos
10
20
30
Total 26 24 50
c) Si una persona selecciona aleatoriamente una de estas agencias de
automviles nuevos, Cul es la probabilidad de que seleccione una que
proporciona buen servicio de garanta?
d) Si una persona selecciona una de las agencias que han operado 10 aos o
ms, Cul es la probabilidad de que seleccione una agencia que proporcione
buen servicio de garanta?
G: Denota la seleccin de la agencia que proporciona buen servicio de
garanta.
S: Denota el nmero de elementos en el espacio muestral completo.
13. Una urna contiene 75 bolas blancas marcadas, 25 bolas sin marcar, 175 bolas
negras marcadas y 125 bolas negras sin marcar.
a) Se saca una bola al azar. Calcular la probabilidad que sea blanca.
b) Se extrae una bola y est marcada. Calcular la probabilidad que sea
blanca.
14. En un grupo de 200 estudiantes universitarios 138 estn inscritos en un curso
de Ingls 115 en uno de mecnica y 91 en ambos, Cuntos de estos
estudiantes no estn inscritos en uno u otro curso?
- Trace un diagrama de Venn apropiado y anote los nmeros asociados con
las diversas regiones.
15. Un taller sabe que por trmino medio acuden, por la maana 3 automviles con
problemas elctricos, 8 con problemas mecnicos y 3 con problemas de
chapas y por la tarde 2 con problemas elctricos, 3 con problemas mecnicos y
1 con problemas de chapa.
Elctricos Mecnicos Chapa Total
Maana 3 8 3 14
Tarde 2 3 1 6
Total 5 11 4 20
Calcular, P(A), P(B), P(C) , as como la probabilidad de que acuda por la
maana dado que tiene problemas elctricos
Aplique el concepto de probabilidad para resolver el siguiente problema.
16. En una caja hay 100 canicas azules y 300 rojas. Cul es la probabilidad de
sacar al azar una canica azul? Exprese el resultado en tanto por ciento.
17. En la oficina del subdirector de la escuela hay 12 calculadoras, algunas son
manuales (M), otras elctricas (E); adems algunas de ellas son nuevas (N) y
otras usadas (U), como se expresa en el cuadro siguiente:
M E
N 2 3 5
U 2 5 7
4 8 12
a) Una persona entra a la oficina y escoge aleatoriamente una calculadora y
observa que es manual. Cul es la probabilidad de que sea nueva?
b) Si la persona escoge una al azar una elctrica, Cul es la probabilidad de que
sea usada?
18. Empleando diagramas de Venn y con la definicin de conjuntos encontrar el
conjunto solucin para cada uno de los casos que se dan a continuacin.
{ } { } { } { } 7 , 6 , 5 , 2 , 7 , 5 , 3 , 1 , 5 , 4 , 3 , 2 , 1 , 7 , 6 , 5 , 4 , 3 , 2 , 1 = = = = c B A U .
A C d B C c B C b A B a ) ) ) )
19. Una orquesta de 30 msicos deciden formar dos grupos musicales, uno de
clsica y otro de msica de saln, el primero con 12 personas y el segundo con
16; si tres de los msicos pertenecen a los dos grupos Cuntos miembros de
la orquesta original decidieron no pertenecer a ningn grupo?
20. De un lote de 15 camisas, 4 son defectuosas, si se toman al azar 3 artculos
del lote, uno tras otro; calcular la probabilidad de que los tres se encuentren en
buen estado.
21. En una escuela de enseanza media superior, el 20% de los alumnos
reprobaron matemticas, el 25% fsica y el 5% ambas materias. Si se
selecciona un alumno al azar:
a) Si reprob fsica. Cul es la probabilidad que haya reprobado
matemticas?
b) Si reprob matemticas. Cules la probabilidad de que haya reprobado
fsica?
c) Cul es la probabilidad de que haya reprobado fsica o matemticas?
d) Cul es la probabilidad de que haya reprobado fsica o matemticas?
22. En una escuela de enseanza media superior de la poblacin de alumnos el
40% mide ms de 1.50 m, el 25% pesa ms de 52 kilos y el 15% mide ms de
1.50 m y ms de 52 kilos. Si se escoge al azar un alumno:
a) Si mide ms de 1.50 m, calcular la probabilidad de que tambin pese ms
de 52 kg.
Proyecto
1. De cuntas maneras diferentes se puede formar un comit con un presidente,
un secretario y un tesorero, en un club que consta de 15 socios?
2. Cinco ciudades se comunican entre s, segn el diagrama
De cuntas formas es posible:
d) Viajar desde A hasta E
e) Hacer el viaje redondo desde A hasta E
3. Use el principio multiplicativo para solucionar el problema siguiente.
De una ciudad A hasta B hay 4 caminos; a su vez, la ciudad B a la C hay 6
caminos, si todos los caminos son diferentes, de cuantas formas es posible:
De cuntas formas es posible:
f) Viajar de A hasta C pasando por B
g) Hacer el viaje redondo desde A hasta C pasando por B
h) Hacer el viaje redondo desde A hasta C pasando por B pero si utilizar el
mismo camino ms de una vez
4. Cuntos nmeros de 3 dgitos se pueden formar con 1, 2, 3 ,4,5 si;
a) No se permiten repeticiones
b) Se permiten repeticiones
5. Con los dgitos del 0 al 9 se quieren formar nmeros de cuatro cifras, sin repetir
cifras en ninguno de los nmeros formados.
a) Cuntos se pueden formar?
b) Cuntos nmeros son impares?
c) Cuntos nmeros son divisibles entre 2?
d) Cuntos nmeros son mayores o iguales que 3000?
6. Calcular cuntos nmeros enteros de tres cifras se pueden obtener con los
dgitos 2, 3, 5, 7 en los casos siguientes.
a) No se permite la repeticin de las cifras en ninguno de los nmeros
b) Se permite la repeticin de las cifras en los nmeros
7. Cuntas diferentes quintas de baloncesto pueden formarse con 7 jugadores
disponibles para jugar cualquier posicin?
8. Un alumno de preparatoria tiene 7 libros de fsica y 5 de matemticas. Calcular
de cuantas maneras posibles se pueden ordenar 3 libros de fsica y 2 de
matemticas en un librero.
9. De cuntas maneras diferentes se puede formar un comit con un presidente,
un secretario y un tesorero, en un club que consta de 20 socios?
10. Cuntas representaciones diferentes sern posibles formar, si se desea que
consten de Presidente, Secretario, Tesorero, Primer Vocal y Segundo Vocal?,
s esta representacin puede ser formada de entre 25 miembros del sindicato
de una pequea empresa.
11. Obtenga todas las seales posibles que se pueden disear con seis
banderines, dos de los cuales son rojos, tres son verdes y uno morado.
12. De cuntas maneras es posible plantar en una lnea divisoria de un terreno
dos nogales, cuatro manzanos y tres ciruelos?
13. Si un equipo de ftbol soccer femenil participa en 12 juegos en una temporada,
cuntas maneras hay de que entre esos doce juegos en que participa,
obtenga 7 victorias, 3 empates y 2 juegos perdidos?
14. Si se cuenta con 14 alumnos que desean colaborar en una campaa pro
limpieza del Tec, cuantos grupos de limpieza podrn formarse si se desea que
consten de;
a) 5 alumnos cada uno de ellos
b) Si entre los 14 alumnos hay 8 mujeres, cuntos de los grupos de limpieza
tendrn a 3 mujeres?
c) Cuntos de los grupos de limpieza contarn con 4 hombres por lo menos?
15. En una escuela de enseanza media superior los alumnos de matemticas
presentan un examen que incluye 16 problemas para resolver 8 de ellos.
Cuntos exmenes diferentes de 8 problemas se pueden escoger de esos
16?
16. Un inspector de control de calidad desea seleccionar una parte para la
inspeccin de cada una de cuatro recipientes diferentes que contienen 4, 3, 5 y
4 partes, respectivamente. De cuntas maneras diferentes se pueden escoger
las cuatro partes?
17. De cuntas maneras diferentes se pueden contestar todas las preguntas de
una prueba de falso o verdadero que consta de 20 preguntas?
18. De cuntas maneras diferentes se pueden presentar al pblico los cinco
jugadores titulares de un equipo de baloncesto?
19. El nmero de permutaciones de las cuatro letras a, b, c y d es 24, pero cul
es el nmero de permutaciones si slo tomamos dos de las cuatro letras o,
como usualmente se expresa, si tomamos las cuatro letras dos a la vez?
20. De cuntas maneras puede una seccin local de la sociedad Americana de
Qumica programar a tres oradores para tres reuniones diferentes, si todos
ellos estn disponibles en cualquiera de cinco fechas posibles?
21. De cuntas maneras se pueden colgar, una junto a las otras, dos pinturas de
Monet, tres pinturas de Renoir y dos pinturas de Degas en la pared de un
museo sin hacer distincin entre las pinturas de los mismos artistas?
22. De cuntas maneras diferentes puede una persona, que rene datos para
una organizacin de investigacin de mercados, seleccionar tres de 20 familias
que viven en un complejo departamental dado?
23. En cuntas formas diferentes pueden seis lanzamientos de una moneda,
producir dos caras y cuatro cruces?
24. Cuntos comits diferentes, de dos qumicos y un fsico, se pueden formar
con los cuatro qumicos y los tres fsicos del profesorado de una pequea
universidad?
Unidad III - Funciones de distribucin de probabilidades
3.1 Variables aleatorias y su clasificacin
3.2 Distribuciones de probabilidad discretas
3.3 Distribucin Hipergeomtrica.
3.4 Distribucin de Poisson
3.5 Distribuciones de probabilidad continuas
3.6 Distribucin t
En el uso de la distribucin z su uso era para muestras 30 > n . En muestras pequeas
30 < n siempre y cuando la distribucin de donde proviene la muestra tenga un
comportamiento normal.
Es una condicin importante para utilizar las distribuciones
. , ,
2
Fisher F x Student t
Donde se har uso y manejo del concepto de grados de libertad, esto con base en la
varianza muestral
( )
1
2
2
n
x x
s
i
Supngase que se toma una muestra de una poblacin normal con media y
varianza
2
o . Si X es el promedio de las observaciones que contiene la muestra
aleatoria, entonces la distribucin
n
x
z
o
= es una distribucin normal estndar.
Supngase que la varianza de la poblacin
2
o es desconocida.
Propiedades de las distribuciones t
1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, est ms dispersa que la curva normal estndar z.
3. A medida que v aumenta, la dispersin de la curva t correspondiente
disminuye.
A medida que ( ) v , la secuencia de curvas t se aproxima a la curva normal
estndar, por lo que la curva z recibe a veces el nombre de curva t con = gl
Def.
Sean
tiene una
distribucin t con 1 = n v grados de libertad.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la
muestra y siempre es mayor a uno. nicamente cuando el tamao de la muestra
tiende a infinito las dos distribuciones sern las mismas.
Problema
El valor de t con 10 gl y un rea de 0.025 a la derecha es:
Problema
El valor de t con 14 gl tiene un rea de 0.025 a la izquierda y por lo tanto un rea de
0.0975 a la derecha es,
975 . 0 1 = o
Problema
Encontrar ( )
Problema
Encontrar ( )
Problema
Un fabricante de focos afirma que us producto durar un promedio de 500 horas de
trabajo. Para conservar este promedio esta persona verifica 25 focos cada mes. Si el
valor y calculado cae entre t 0.05 y t 0.05, l se encuentra satisfecho con esta
afirmacin. Qu conclusin deber l sacar de una muestra de 25 focos cuya
duracin fue?:
Grados de libertad
Est se define como el nmero de valores que podemos elegir libremente, sea, el
nmero de observaciones menos uno
3.7 Distribucin Chi-cuadrada
En realidad la distribucin ji-cuadrada es la distribucin muestral de
2
S . O sea que si
se extraen todas las muestras posibles de una poblacin normal y a cada muestra se
le calcula su varianza, se obtendr la distribucin muestral de varianzas.
Definicin
Si
2
S y X son la media y la varianza de una muestra aleatoria de tamao n de una
poblacin normal con la media y la desviacin estndar o , entonces
-
2
S y X son independientes
- La variable aleatoria
( )
2
2
1
o
S n
tiene la distribucin ji-cuadrada con n-1 grados
de libertad.
El estadstico ji-cuadrada esta dado por:
( ) o o = > v x x P ,
2 2
donde
( )
2
2
2
1
o
S n
X
=
donde n es el tamao de la muestra, s
2
la varianza muestral y
2
o la varianza de la
poblacin de donde se extrajo la muestra. El estadstico ji-cuadrada tambin se puede
dar con la siguiente expresin:
( )
2
1
2
o
=
=
n
i
i
x x
X
Propiedades de las distribuciones ji-cuadrada
1. Los valores de
2
X son mayores o iguales que 0.
2. La forma de una distribucin
2
X depende del 1 = n gl . En consecuencia,
hay un nmero infinito de distribuciones
2
X .
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones
2
X no son simtricas. Tienen colas estrechas que se
extienden a la derecha; esto es, estn sesgadas a la derecha.
5. Cuando 2 > n , la media de una distribucin
2
X es n-1 y la varianza es 2
(n-1).
6. El valor modal de una distribucin
2
X se da en el valor (n-3).
Para denotar el valor crtico de una distribucin
2
X con gl grados de libertad se
usa el smbolo v X ,
2
o ; este valor crtico determina a su derecha un rea de o
bajo la curva
2
X y sobre el eje horizontal. Por ejemplo para encontrar 6 , 05 . 0
2
X
en la tabla se localiza 6 gl en el lado izquierdo y 05 . 0 = o a o largo del lado
superior de la misma tabla.
Clculo de Probabilidad
El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para
saber como se va a comportar la varianza o desviacin estndar en una muestra que
proviene de una distribucin normal.
Problema
Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus
destinos en una ciudad grande forman una distribucin normal con una desviacin
estndar 1 = o minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la
probabilidad de que la varianza muestral sea mayor que 2.
Primero se encontrar el valor de ji-cuadrada correspondiente a 2
2
= s como sigue:
El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de libertad y se
encuentra que a este valor le corresponde un rea a la derecha de 0.01. En
consecuencia, el valor de la probabilidad es ( ) 2
2
> s P .
Problema
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una
poblacin normal con varianza 6
2
= o , tenga una varianza muestral:
a. Mayor que 9.1
b. Entre 3.462 y 10.745
a. Primero se proceder a calcular el valor de la ji-cuadrada:
Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea a la
derecha de 0.05. Por lo que la ( ) 05 . 0 1 . 9
2
= s P
Se calcularn dos valores de ji-cuadrada:
( ) ( )( )
847 . 13
6
462 . 3 1 25 1
2
2
2
=
=
o
s n
x y
( )( )
98 . 42
6
745 . 10 1 25
2
=
= x
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al
buscar el valor de 13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98
da un rea a la derecha de 0.01. Como se est pidiendo la probabilidad entre dos
valores se resta el rea de 0.95 menos 0.01 quedando 0.94.
Por lo tanto la ( ) 94 . 0 745 . 10 462 . 3
2
= s s s P
Problema
Una compaa ptica compra cristales para fabricar lentes y experiencias anteriores
han demostrado que la varianza del ndice de refraccin de esta clase de cristal es
4
10 26 . 1
. Para convertir el cristal en lentes de una longitud focal dada, es importante
que las distintas piezas de cristal de esta clase se rechaza si la varianza muestral de
18 piezas seleccionadas al azar excede a
4
10 2
. Suponiendo, adems, que los
valores de las muestras se pueden tratar como si provinieran de una poblacin normal.
Problema
Encuentre la probabilidad de que una muestra aleatoria de 23 observaciones de una
poblacin normal con varianza igual a 2.4495, tenga una varianza 1 . 9
2
> s
3.8 Distribucin F
3.9 Esperanza matemtica.
Proyecto
1. Determine si las funciones
5 , 4 , 3 , 2 , 1
5
2
) ( =
+
= x para
x
x f ,
5 , 4 , 3 , 2 , 1
15
) ( = = x para
x
x f ,
4 , 3 , 2 , 1 , 0
30
) (
2
= = x para
x
x f
,
()
y
4 , 3 , 2 , 1 , 0
5
) (
2
= = x para
x
x f
pueden servir como una distribucin de probabilidad.
2. Construya un histograma de probabilidad para la funcin
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
=
3
6
3
4 2
) (
x x
x f ,
determine la funcin de distribucin y trace su grfica, encuentre la media y
varianza para esta funcin.
3. Obtenga el valor esperado y la varianza de la VAD X que tiene la distribucin
de probabilidad 3 , 1 , 0 , 1
7
2
) ( =
= x para
x
x f
4. Dada la frmula de distribucin de probabilidad,
4 , 3 , 2 , 1 , 0
16
4
) ( =
|
|
.
|
\
|
= x para
x
x f
Obtenga:
a. Construya el histograma correspondiente.
b. La funcin de distribucin.
5. Encuentre la media
x
y varianza
x
o de la variable aleatoria discreta x. Una
grabadora de cinta contiene seis transistores, de los cuales dos estn
defectuosos. Si se seleccionan al azar dos de estos transistores extrados de la
grabadora e inspeccionados y si x es el nmero de unidades defectuosas
observadas, obtenga
a) La distribucin de probabilidad de x
b) La funcin de distribucin de x
c) Trace un histograma de la distribucin de probabilidad y una grfica de la
funcin de distribucin.
6. Si en general fallece el 30 % de los pacientes que padecen cierta enfermedad
Cul es la probabilidad de que en un grupo de 5 mueran exactamente 2?
7. Un ingeniero en seguridad de automviles afirma que uno de 10 accidentes
automovilsticos se debe a la fatiga del conductor. Utilizando la frmula de la
distribucin binomial Cul es la probabilidad de que cuando menos de tres de
cinco accidentes de automvil se debe a la fatiga del conductor?
8. Un psiclogo asevera que slo el 50% de todos los alumnos del ltimo ao de
preparatoria, capaces de desempear trabajos a nivel universitario, asisten en
realidad a la universidad. Suponiendo verdadera esta afirmacin obtenga las
probabilidades de:
a) Exactamente 10 asistan a la universidad
b) Cuando menos 15 vayan a la universidad
c) Cuando mucho cuatro vayan a la universidad
9. Si el 2% de los libros encuadernados en cierto taller tiene encuadernacin
defectuosa, use la dist. de Poisson para determinar la probabilidad de que 5 de
400 libros encuadernados en este taller tendrn encuadernacin defectuosa.
10. Si la probabilidad de que una persona sufra una reaccin daina al ingerir un
determinado antibitico es de 0.001. Calcula la prob. De que de un total de
3000 pacientes sufran el malestar.
11. La probabilidad de que una muestra de aire contenga una molcula rara es
0.01. Si se supone que las muestras son independientes con respecto a la
presencia de la molcula rara, Cul es la probabilidad de que sea necesario
analizar exactamente 125 muestras antes de detectar una molcula rara?
12. En la fabricacin de las puertas de automviles, se ha observado que la
probabilidad de que una puerta resulte defectuosa es de 5%, Cul es la
probabilidad de que un automvil elegido al azar tenga a lo ms tres puertas
defectuosas?
Se supone que el modelo del automvil tiene 5 puertas.
13. El 30% de las piezas de televisin que fabrica una maquinaria recientemente
reparada son defectuosas, calcula la probabilidad de que en 8 piezas elegidas
al azar se obtenga:
a) Una pieza defectuosa.
b) Ninguna defectuosa.
14. Si la probabilidad es 0.75 de que el solicitante de una licencia de manejo
pasar la prueba de manejo en un ensayo dado, Cul es la probabilidad de
que un solicitante finalmente pase la prueba en el cuarto ensayo?
15. En una fbrica de ropa, el 10% de las prendas producidas resultan con algn
defecto. Calcula la probabilidad en base a la distribucin de Poisson de que en
un lote de 9 prendas elegidas al azar salgan exactamente dos defectuosas.
16. Encuentre la probabilidad de que 7 de 10 personas se recuperaran de una
enfermedad tropical si podemos suponer independencia y la probabilidad de
que cualquiera de ellos se recuperara de la enfermedad es de 0.8.
17. El nmero de camiones que llegan en un da cualquiera en un depsito de
camiones en cierta ciudad es segn se sabe 12. Cul es la probabilidad de
que en un da lleguen menos de 9 camiones a este depsito?
18. La probabilidad de que un trabajador tcnico en computacin tenga un sueldo
mayor a 10000 pesos mensuales es de 0.001. Calcula la probabilidad en un
total de 2000 tcnicos que 4 personas reciban exactamente este sueldo.
19. Los registros muestran que la probabilidad es de 0.00005 de que un automvil
se le reviente un neumtico mientras cruza cierto puente. Use la distribucin de
Poisson para aproximar las probabilidades binomiales que, de 10000 autos que
cruzan este puente,
a. Exactamente dos tendrn un neumtico reventado
b. Cuando mucho dos tendrn un neumtico reventado
1. Sea X una variable aleatoria continua que tiene la siguiente funcin de densidad:
( )
s s +
=
dof
x para
x
c
x f
0
2 0
8
3
2
- El valor de c para que f(x) sea una funcin de densidad.
- Calcular: ) 5 . 1 1 ( s sx P
- Calcular: P(x > 1).
2. Sea X una variable aleatoria continua que mide el avance entre dos automviles
consecutivos elegidos al azar en segundos, su funcin de distribucin del tiempo
de avance presenta la forma:
( )
s
s s
=
1 0
2 0
4
x para
x para
x
k
x f
- Determinar el valor de k para que f(x) sea una funcin de densidad legtima.
- Obtener la funcin de distribucin acumulada.
- Calcular: P(X > 2) y P(2 <. X <. 3).
- Obtener el valor medio y la desviacin estndar del avance.
3. Determinar el valor de la constante c tal que f(x) defina una funcin densidad en
el intervalo dado y determinar la regla de correspondencia de la funcin de
distribucin acumulada correspondiente.
a. ,
b. ,
4. Determine
2
o y
para una variable aleatoria continua que tiene la densidad de
probabilidad;
( )
s s
=
dof
x para
x
x f
0
2 0
2
5. Demuestre que ( ) < < =
x para e x f
x
0
Representa una funcin de densidad de probabilidad
Bosqueje una grfica de esta funcin e indique el rea asociada con la
probabilidad que 1 > x
Calcule la probabilidad de que 1 > x
6. Para la siguiente funcin,
( )
s s
=
dof
x para x
x f
0
3 0
9
1
2
- Diga si esta funcin nos define una distribucin de probabilidad.
- Si la funcin define una distribucin de probabilidad, entonces, determine
su media y desviacin estndar.
- Determine la probabilidad de que 3 2 < s x .
7. Suponga que el error en la temperatura de reaccin, en
o
C, para un experimento
controlado de laboratorio es una variable aleatoria continua x, que tiene la funcin
de densidad de probabilidad:
( )
< <
=
dof
x para
x
x f
0
2 1
3
3
Verifique si esta funcin nos define una distribucin de probabilidad.
Determine la media o valor esperado de la distribucin de probabilidad.
Encuentre la probabilidad de que 1 0 < s x .
8. El salario medio de los empleados de una empresa se distribuye segn una
distribucin normal, con media 5 millones de ptas. y desviacin tpica 1 milln de
ptas. Calcular el porcentaje de empleados con un sueldo inferior a 7 millones de
ptas.
9. La renta media de los habitantes de un pas es de 4 millones de ptas/ao, con una
varianza de 1,5. Se supone que se distribuye segn una distribucin normal.
Calcular:
a) Porcentaje de la poblacin con una renta inferior a 3 millones de
ptas.
b) Renta a partir de la cual se sita el 10% de la poblacin con mayores
ingresos.
c) Ingresos mnimo y mximo que engloba al 60% de la poblacin con
renta media.
10. La vida media de los habitantes de un pas es de 68 aos, con una varianza de 25.
Se hace un estudio en una pequea ciudad de 10.000 habitantes:
a) Cuntas personas superarn previsiblemente los 75 aos?
b) Cuntos vivirn menos de 60 aos?
11. El consumo medio anual de cerveza de los habitantes de una pas es de 59 litros,
con una varianza de 36. Se supone que se distribuye segn una distribucin
normal.
a) Si usted presume de buen bebedor, cuntos litros de cerveza
tendra que beber al ao para pertenecer al 5% de la poblacin que
ms bebe?
b) Si usted bebe 45 litros de cerveza al ao y su mujer le califica de
borracho qu podra argumentar en su defensa?
12. Si Z es una VA con una distribucin normal estndar, determine las probabilidades
de que esta variable tenga un valor.
a) Mayor que 1.14
b) Menor que -0.36
c) Entre -0.46 y -0.09
d) Entre -0.58 y 1.12
e) Entre 0 y 1.28
f) Entre -3.20 y 0
g) A la izquierda de -1.35
h) El rea entre -1.5 y 2.1
i) Entre 0.7 y 2.1
13. En un proceso fotogrfico, el tiempo de revelado de impresiones se
puede considerar como una VA que tiene distribucin normal con media
15.40 seg. y Desviacin estndar de 0.48 seg. Encuentre las
probabilidades de que el tiempo que toma revelar una de las
impresiones ser
a) Al menos 16 seg
b) Cuando mucho 14.20 seg
c) Cualquier valor entre 15 y 15.80 seg
14. Supongamos que la cantidad de caf instantneo que una mquina sirve
en un frasco de 6 onzas es una VA que tiene distribucin normal con
desviacin estndar 0. 05 onzas. Si slo el 3% de los frascos deben
contener menos de 6 onzas de caf, Cul debe ser la media del llenado
de estos frascos.?
1. El espacio muestral S de la poblacin de adultos en un pequeo pueblo que
han satisfecho los requisitos para graduarse en la escuela. Se deben clasificar
de acuerdo con el sexo y si trabajan o no actualmente.
Empleado Desempleado Total
Hombre 460 40 500
Mujer 140 260 400
Total 600 300 900
Basados en el espacio muestral anterior definir:
e. La probabilidad de que sea empleado
f. La probabilidad de que sea empleado
g. La probabilidad de que sea hombre y al mismo tiempo sea desempleado
h. Encuentre la probabilidad de que se escoge un hombre dado que el elegido
tiene empleo
2. Lanzamos un dado. Decir los sucesos contrarios de:
{ }
{ }
{ } ) .
.
.
primo numero sacar C c
tres que igual o menos sacar B b
par puntuacin sacar A a
=
=
=
3. Supngase que se tiene una caja de fusible que contienen 20 piezas, de las
cuales 5 estn defectuosas. Si se seleccionan 2 al azar y se sacan de la caja
en sucesin sin reemplazo del primero, Cul es la probabilidad de que ambos
fusibles resulten defectuosos?
4. Si se lanza una moneda tres veces y se supone que los resultados posibles
son igualmente probables. Si A es el evento de que una cara ocurra en cada
uno de los dos primeros lanzamientos, B es el evento que una cruz ocurra en el
tercer lanzamiento y C es el evento que exactamente dos cruces ocurren en los
tres lanzamientos, demuestre que;
a. Los eventos A y B son independientes
b. Los eventos B y C son dependientes
5. La siguiente figura es un diagrama de Venn, con probabilidades asignadas a
sus diversas regiones. Verifique que A y B son independientes, que B y C son
independientes pero que A, B, y C no son independientes.
6. Hay 90 aspirantes para un trabajo en el departamento de noticias de una
estacin de tv. Algunos son egresados de la universidad y algunos no, algunos
de ellos tienen al menos tres aos de experiencia y algunos no la tienen, el
anlisis exacto es;
Egresados No
egresados
Al menos tres aos de experiencia 18 9
Menos de tres aos de experiencia 36 27
El orden en que el gerente de la estacin entrevista a los aspirantes es
aleatorio, G es el evento que el primer aspirante entrevistado sea un
egresado de la universidad y T es el evento de que el primer aspirante
entrevistado tenga al menos aos de experiencia, determine cada una de
las siguientes probabilidades.
( ) ( ) ( ) T G P c G T P b G P a / . / . .
7. Experimento aleatorio: se observa la escolaridad de las personas de 20 a 60
aos de edad de una comunidad.
Consideremos los siguientes sucesos.
I. Una persona tiene menos de 40 aos
J. La persona es ingeniero
K. La persona es analfabeta
L. La persona tiene 40 aos o ms
Son los sucesos mutuamente excluyentes o no?
D A C B D B C A ; ; ;
8. En un grupo de 200 estudiantes (80 mujeres y 60 hombres), 140 en total son
alumnos de tiempo completo y otro de 60, (40 son mujeres y 20 hombres) son
de tiempo parcial.
Experimento: un estudiante es seleccionado al azar, para esto se definen tres
sucesos.
D. Estudiante seleccionado de tiempo completo
E. Estudiante seleccionado de tiempo parcial
F. Estudiante seleccionado sea hombre
c) Defina si los sucesos A y B son mutuamente excluyentes o no.
d) Defina si los sucesos A y C son mutuamente excluyentes o no.
e) Defina si los sucesos B y C son mutuamente excluyentes o no
9. Se analiza en un momento dedo el estado de salud de los habitantes de la
ciudad.
Consideremos los casos siguientes:
A: La persona es diabtica
B: La persona est sana
C: La persona tiene un problema de salud permanente, tiene una
enfermedad crnica.
D: La persona tiene gripa
E: La persona es hipertensa
e) Los sucesos A y B son mutuamente excluyentes o no?
f) Si | = E C son mutuamente excluyentes o no?
g) Qu sucede con los sucesos B y C?
h) Cmo son los sucesos C y D?
10. Una organizacin de los consumidores ha estudiado los servicios con garanta
proporcionados por las 50 agencias de automviles nuevos en una cierta
ciudad en la tabla siguiente se resumen sus hallazgos.
Buen servicio de
garanta
Mal servicio de
garanta
En operacin
por
10 aos o ms
16
4
20
En operacin
Menos de 10
aos
10
20
30
Total 26 24 50
e) Si una persona selecciona aleatoriamente una de estas agencias de
automviles nuevos, Cul es la probabilidad de que seleccione una que
proporciona buen servicio de garanta?
f) Si una persona selecciona una de las agencias que han operado 10 aos o
ms, Cul es la probabilidad de que seleccione una agencia que proporcione
buen servicio de garanta?
G: Denota la seleccin de la agencia que proporciona buen servicio de
garanta.
S: Denota el nmero de elementos en el espacio muestral completo.
11. Una urna contiene 75 bolas blancas marcadas, 25 bolas sin marcar, 175 bolas
negras marcadas y 125 bolas negras sin marcar.
c) Se saca una bola al azar. Calcular la probabilidad que sea blanca.
d) Se extrae una bola y est marcada. Calcular la probabilidad que sea
blanca.
12. En un grupo de 200 estudiantes universitarios 138 estn inscritos en un curso
de Ingles 115 en uno de mecnica y 91 en ambos, Cuntos de estos
estudiantes no estn inscritos en uno u otro curso?
- Trace un diagrama de Venn apropiado y anote los nmeros asociados con
las diversas regiones.
13. Un taller sabe que por trmino medio acuden, por la maana 3 automviles con
problemas elctricos, 8 con problemas mecnicos y 3 con problemas de
chapas y por la tarde 2 con problemas elctricos, 3 con problemas mecnicos y
1 con problemas de chapa.
Elctricos Mecnicos Chapa Total
Maana 3 8 3 14
Tarde 2 3 1 6
Total 5 11 4 20
Calcular, P(A), P(B), P(C) , as como la probabilidad de que acuda por la
maana dado que tiene problemas elctricos
14. En una caja hay 100 canicas azules y 300 rojas. Cul es la probabilidad de
sacar al azar una canica azul? Exprese el resultado en tanto por ciento.
15. En la oficina del subdirector de la escuela hay 12 calculadoras, algunas son
manuales (M), otras elctricas (E); adems algunas de ellas son nuevas (N) y
otras usadas (U), como se expresa en el cuadro siguiente:
M E
N 2 3 5
U 2 5 7
4 8 12
c) Una persona entra a la oficina y escoge aleatoriamente una calculadora y
observa que es manual. Cul es la probabilidad de que sea nueva?
d) Si la persona escoge una al azar una elctrica, Cul es la probabilidad de que
sea usada?
16. Empleando diagramas de Venn y con la definicin de conjuntos encontrar el
conjunto solucin para cada uno de los casos que se dan a continuacin.
{ } { } { } { } 7 , 6 , 5 , 2 , 7 , 5 , 3 , 1 , 5 , 4 , 3 , 2 , 1 , 7 , 6 , 5 , 4 , 3 , 2 , 1 = = = = c B A U .
c
A e A B d C B c B C b A B a ) ) ) ) )
17. Una orquesta de 30 msicos deciden formar dos grupos musicales, uno de
clsica y otro de msica de saln, el primero con 12 personas y el segundo con
16; si tres de los msicos pertenecen a los dos grupos Cuntos miembros de
la orquesta original decidieron no pertenecer a ningn grupo?
18. De un lote de 15 camisas, 4 son defectuosas, si se toman al azar 3 artculos
del lote, uno tras otro; calcular la probabilidad de que los tres se encuentren en
buen estado.
19. En una escuela de enseanza media superior, el 20% de los alumnos
reprobaron matemticas, el 25% fsica y el 5% ambas materias. Si se
selecciona un alumno al azar:
e) Si reprob fsica. Cul es la probabilidad que haya reprobado
matemticas?
f) Si reprob matemticas. Cules la probabilidad de que haya reprobado
fsica?
g) Cul es la probabilidad de que haya reprobado fsica o matemticas?
20. En una escuela de enseanza media superior de la poblacin de alumnos el
40% mide ms de 1.50 m, el 25% pesa ms de 52 kilos y el 15% mide ms de
1.50 m y ms de 52 kilos. Si se escoge al azar un alumno:
b) Si mide ms de 1.50 m, calcular la probabilidad de que tambin pese ms
de 52 kg.
21. En una zona de una ciudad grande, las probabilidades son 0.86, 0.35, y 0.29
de que una familia tenga un aparato de tv a color, un aparato de tv en blanco y
negro, o ambas clases de aparatos respectivamente. Cul es la probabilidad
de que una familia posea cualquiera de los dos o ambas clases?
22. Cerca de cierta salida de la carretera, las probabilidades son 0.23 y 0.24, de
que un camin parado en un retn tendr frenos defectuosos o neumticos
muy gastados. Tambin, la probabilidad es 0.38 de que un camin parado en
un retn tendr frenos defectuosos y neumticos muy gastados. Cul es la
probabilidad de que un camin parado en este retn tendr los frenos
defectuosos as como los neumticos muy gastados?
1. El tiempo que un cajero de un banco atiende a un cliente es una variable
aleatoria con media 4.2 y una varianza de 2.56. Si se observa una MA de 74
clientes, encuentre la probabilidad de que el tiempo promedio de los mismos
con el cajero sea
a) Cuando mucho 3.7 min
b) A lo menos 4.5 min
c) Menos de 4.5 pero ms de 3.4 min
2. Los parvulitos de un jardn de nios tienen estaturas que estn distribuidas de
manera normal con respecto a una media de 39 pulgadas y una desviacin
estndar de 2 pulgadas. Se toma una muestra aleatoria de 30 y se calcula la
media muestral x . Cul es la probabilidad de que este valor medio est entre
38.5 y 40 pulgadas?
3. Una compaa fabrica focos cuya duracin es normalmente distribuida con una
media igual a 800 hrs. y una desviacin estndar de 40 hrs. Encuentre la
probabilidad de que una muestra aleatoria de 40 focos se fundan entre 778 y
834 hrs. de uso.
4. Una MA de tamao 81 se toma de una poblacin infinita con la media 128 y la
desviacin estndar 6.3, con que probabilidad podemos afirmar que el valor
que obtenemos para x no caer entre 126.6 y 129.4?
5. Una compaa ptica compra cristales para fabricar lentes y experiencias
anteriores han demostrado que la varianza del ndice de refraccin de esta
clase de cristal es
4
10 26 . 1
. Para convertir el cristal en lentes de una longitud
focal dada, es importante que las distintas piezas de cristal de esta clase se
rechaza si la varianza muestral de 18 piezas seleccionadas al azar excede a
4
10 2
. Suponiendo, adems, que los valores de las muestras se pueden
tratar como si provinieran de una poblacin normal.
6. Una muestra aleatoria de tamao 25 de una poblacin normal que tiene la
media 47 = x y la desviacin estndar 7 = s . Si basamos nuestra decisin en
la estadstica del teorema visto podemos decir que la afirmacin dada
sustenta la conjetura de que la media de la poblacin es 42 = ?
7. Supongamos que el espesor de una parte usada en un semiconductor es su
dimensin crtica y el proceso de fabricar estas partes se considera que esta
bajo control si la varianza real entre espesor de las partes esta dada por una
desviacin estndar no mayor que 0.60 milsimas de pulgada. Para mantener
un control sobre el proceso, peridicamente se toman MA de tamao 20 y se
considera que esta bajo control si la probabilidad de
2
s asume un valor que, o
igual, al observado de la MA es 0.01 (an cuando 60 . 0 = o ), Qu se puede
concluir sobre el proceso si la desviacin estndar de una MA peridica tal es
84 . 0 = s milsimas de pulgadas?
8. Un fabricante de bateras para automvil garantiza que sus bateras durarn en
promedio, 3 aos, con una desviacin estndar de 1 ao. Si 5 de estas
bateras tienen duraciones de 1.9, 2.4, 3.5, y 4.2 aos.
Est el fabricante convencido an de que sus bateras tienen una desviacin
estndar de 1 ao?
9. Encuentre los valores crticos de
2
x que determinan regiones crticas que
contienen un rea de 0.025 en cada cola. Suponga que el tamao de la
muestra es 10.
10. Una muestra aleatoria de tamao 25 de una poblacin normal que tiene la
media 47 = x y la desviacin estndar 7 = s . Si basamos nuestra decisin en
la estadstica del teorema visto podemos decir que la afirmacin dada
sustenta la conjetura de que la media de la poblacin es 42 = ?
11. Dada una muestra de 30 encontrar la probabilidad de que
2
x caiga entre
14.953 y 50.892.
12. Se toma una muestra de 27 observaciones de una poblacin normal con
varianza de 16.8, hallar la probabilidad aproximada de obtener una desviacin
estndar de la muestra entre 3 y 5.2.
13. Encontrar ( ) 7 365 . 2 = < v cuando t P
14. Encontrar ( ) 24 318 . 1 = > v cuando t P
15. Un fabricante de alambre de acero asegura que la fuerza media requerida para
romper una clase de alambre dada es de 500 lbs. Para probar esto, se toma
una muestra de 25 partes de este tipo de alambre y se somete a traccin, la
media y desviacin estndar de las fuerzas para romper estas muestras son
respectivamente, lbs s y x 55 465 = = Suponiendo que los esfuerzos de rotura
se puedan considerar como una MA de una poblacin normal con 500 =
16. Un fabricante de focos afirma que su producto durar un promedio de 500 hrs.
de trabajo. Para conservar este promedio esta persona verifica 25 focos cada
mes. Si el valor de t calculado cae entre ,
05 . 0 05 . 0
t y t el se encuentra
satisfecho con esta afirmacin. Qu conclusin deber el sacar de una
muestra que tiene una media hrs x 518 = y una desviacin estndar de 40 hrs.
Asuma que la distribucin de los tiempos de vida es aproximadamente normal.
17. Una MA de tamao 16 proveniente de una poblacin normal tiene una media
de 48 y desviacin estndar de 5.2. Basndose en la decisin del estadstico t,
decir si es razonable indicar que esta informacin justifica la afirmacin de que
la media de la poblacin es como mnimo 52.
Unidad IV
4.1 Inferencia estadstica
La estadstica inferencial se define como la rama de la estadstica que proporciona
tcnicas o procedimientos para analizar, interpretar y tomar decisiones sobre una
poblacin, con base en la informacin que se obtiene de una muestra.
Esta generalizacin de tipo inductivo, se basa en la probabilidad. Tambin se le llama
estadstica matemtica, por su complejidad matemtica en relacin a la estadstica
descriptiva.
Tiene como objetivo generalizar las propiedades de la poblacin bajo estudio, basado
en los resultados de una muestra representativa de la poblacin.
El estudio de una poblacin tomando como base las muestras se llama estadstica
inferencial o inductiva, Teora de muestras.
La Inferencia estadstica persigue la obtencin de conclusiones sobre la poblacin
mediante los datos obtenidos de una muestra, e incluye;
- Teora de la muestra
- Estimacin de parmetros
4.2 Muestreo estadstico
Uno de los propsitos de la estadstica inferencial es estimar las caractersticas
poblacionales desconocidas, examinando la informacin obtenida de una muestra, de
una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la
poblacin objeto de estudio.
Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras
reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden
hacer observaciones probabilsticas sobre una poblacin cuando se usan muestras
representativas de la misma.
El tamao de la muestra debe calcularse utilizando tcnicas estadsticas.
La seleccin de la muestra debe hacerse en forma aleatoria.
La estimacin de las caractersticas de la poblacin debe hacerse de acuerdo a las
leyes de la estadstica.
Una aplicacin de muestreo que no cumpla con alguno de estos tres requisitos se
considera muestreo no estadstico. El muestreo estadstico posee algunas ventajas
con respecto al muestreo no estadstico, entre ellas las siguientes:
- Permite seleccionar de antemano el nivel de confianza de la prueba, es decir la
probabilidad de que las conclusiones obtenidas del muestreo sean correctas.
- La seleccin aleatoria impide que los prejuicios o preferencias del auditor
favorezcan la seleccin de algunos elementos de la poblacin en desmedro de
otros.
- Permite limitar el tamao de la muestra al mnimo necesario, evitando
realizar pruebas de auditora sobre una cantidad mayor de elementos.
- Los resultados de la prueba se expresan matemticamente en trminos
precisos, permitiendo elaborar recomendaciones sobre una base ms objetiva.
- Permite hacer ms defendibles las conclusiones de la prueba.
Una poblacin est formada por la totalidad de las observaciones en las cuales se
tiene una cierta observacin.
Una muestra es un subconjunto de observaciones seleccionadas de una poblacin.
Muestras Aleatorias
Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan
muestras por muchas razones; una enumeracin completa de la poblacin, llamada
censo, puede ser econmicamente imposible, o no se cuenta con el tiempo suficiente.
A continuacin se ver algunos usos del muestreo en diversos campos:
1. Poltica. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinin pblica y el apoyo en las elecciones.
2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes
se usan para determinar la eficiencia de una tcnica o programa de enseanza.
3. Industria. Muestras de los productos de una lnea de ensamble sirve para
controlar la calidad.
4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos
prueban la eficacia de una tcnica o de un frmaco nuevo.
5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la
produccin los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar
los criterios del pblico sobre cuestiones relacionadas con el bienestar y la
seguridad nacional.
Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadsticos para estimar valores
poblacionales, o parmetros, pueden ocurrir dos tipos generales de errores: el error
muestral y el error no muestral.
El error muestral se refiere a la variacin natural existente entre muestras tomadas de
la misma poblacin.
Cuando una muestra no es una copia exacta de la poblacin; an si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamao sean representativas de
una cierta poblacin, no esperaramos que las dos sean idnticas en todos sus
detalles. El error muestral es un concepto importante que ayudar a entender mejor la
naturaleza de la estadstica inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere
a una tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones
de un parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo
positivo) que el parmetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin.
La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la
poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida
con procedimientos aleatorios se llama muestra aleatoria.
Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemtico.
Muestreo Aleatorio Simple
Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
El objetivo principal de un diseo muestral es hacer uso eficiente del presupuesto
asignado para un estudio obteniendo un estimativo tan preciso como sea posible de
una cantidad de la poblacin. El muestreo aleatorio simple es la tcnica de muestreo
ms bsica que no slo asegura una muestra representativa sino que tambin produce
una estimacin de la cantidad de una poblacin y una especificacin de la precisin.
Muchas ramificaciones han evolucionado a partir de este concepto central del
muestreo aleatorio simple que permite alcanzar inferencias ms precisas para
diferentes tipos de poblaciones.
Ejemplo 1.1
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo
de estadstica de 20 alumnos.
20
C
5
da el nmero total de formas de elegir una muestra
no ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si
listamos las 15,504 en trozos separados de papel, una tarea tremenda, luego los
colocamos en un recipiente y despus los revolvemos, entonces podremos tener una
muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco nombres. Un
procedimiento ms simple para elegir una muestra aleatoria sera escribir cada uno de
los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y despus extraer cinco papeles al mismo tiempo.
Otro mtodo parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20
utiliza una tabla de nmeros aleatorios. Se puede construir la tabla usando una
calculadora o una computadora. Tambin se puede prescindir de estas y hacer la tabla
escribiendo diez dgitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y
los revolvemos, de ah, la primera tira seleccionada determina el primer nmero de la
tabla, se regresa al recipiente y despus de revolver otra vez se selecciona la seguida
tira que determina el segundo nmero de la tabla; el proceso contina hasta obtener
una tabla de dgitos aleatorios con tantos nmeros como se desee.
Muestreo Simple
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para
las encuestas nacionales de opinin sobre productos o sobre elecciones
presidenciales, sera muy costoso o tardado.
Error Muestral
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la
media poblacional , entonces la media muestral, como medida, conlleva algn error.
Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de
una poblacin con media : si la media de la muestra es , entonces a la
diferencia observada se le denomina el error muestral. Una media
muestral puede pensarse como la suma de dos cantidades, la media poblacional y
el error muestral; si e denota el error muestral, entonces:
Ejemplo 1.5
Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y
6, para simular una poblacin "grande" de manera que el muestreo pueda realizarse
un gran nmero de veces, supondremos que ste se hace con remplazo, es decir, el
nmero elegido se remplaza antes de seleccionar el siguiente, adems, se
seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se
seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es
distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccion primero 4 y
despus 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de
tamao 2 que es posible seleccionar con remplazo y tambin contiene las medias
muestrales y los correspondientes errores muestrales. La media poblacional es igual a
= (2+4+6)/3 = 4. Ver la tabla en la siguiente pgina.
4.3 Estimadores
El objetivo principal de la estadstica inferencial es la estimacin, esto es que
mediante el estudio de una muestra de una poblacin se quiere generalizar las
conclusiones al total de la misma. En los problemas de estimacin debemos
determinar el valor de un parmetro de un continuo posible de alternativas.
Los estadsticos varan mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de otros sus
valores.
4.4 Estimacin puntual
Una estimacin es puntual cuando se usa un solo valor extrado de la muestra para
estimar el parmetro desconocido de la poblacin. Al valor usado se le llama
estimador.
- La media de la poblacin se puede estimar puntualmente mediante la media de
la muestra:
- La proporcin de la poblacin se puede estimar puntualmente mediante la
proporcin de la muestra:
- La desviacin estndar (tpica) de la poblacin se puede estimar puntualmente
mediante la desviacin tpica de la muestra, aunque hay mejores estimadores:
Todo nuestro estudio se basa en la normalidad de las distribuciones que empleamos.
4.5 Estimacin por intervalo
En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten
dar un valor aproximado de un parmetro de una poblacin a partir de los datos
proporcionados por una muestra. Por ejemplo, una estimacin de la media de una
determinada caracterstica de una poblacin de tamao N podra ser la media de esa
misma caracterstica para una muestra de tamao n.
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos
mtodos que se usan en funcin de las caractersticas y propsitos del estudio:
- Estimacin puntual:
o Mtodo de los momentos;
o Mtodo de la mxima verosimilitud;
o Mtodo de los mnimos cuadrados;
- Estimacin por intervalos.
Intervalo de confianza
En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales
se estima que estar cierto valor desconocido con una determinada probabilidad de
acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir
de datos de una muestra, y el valor desconocido es un parmetro poblacional. La
probabilidad de xito en la estimacin se representa con 1 - y se denomina nivel de
confianza. En estas circunstancias, es el llamado error aleatorio o nivel de
significacin, esto es, una medida de las posibilidades de fallar en la estimacin
mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un
intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza),
mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa,
aumentan sus posibilidades de error.
Estimacin para la Media (Normal)
Sabemos que en base a la distribucin muestral de medias que se gener en el tema
anterior, la formula para el clculo de probabilidad es la siguiente
. Como en
este caso no conocemos el parmetro y lo queremos estimar por medio de la media de
la muestra, slo se despejar de la formula anterior, quedando de la siguiente
manera.
De esta formula se puede observar que tanto el tamao de la muestra como el valor
de z se conocern. Z se puede obtener de la tabla de la distribucin normal a partir del
nivel de confianza establecido. Pero en ocasiones se desconoce por lo que en esos
casos lo correcto es utilizar otra distribucin llamada "t" de student si la poblacin de
donde provienen los datos es normal.
Estimacin t-Student
Definicin
Si es el valor de la media de una muestra aleatoria de tamao n de una poblacin
normal con la varianza conocida
, entonces
Es un intervalo de confianza de ( ) para la media de la poblacin.
Problema
1. Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6
gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para
la concentracin media de zinc en el ro. Suponga que la desviacin estndar
de la poblacin es 0.3.
Solucin:
La estimacin puntual de es . El valor de z para un nivel de confianza
del 95% es 1.96, por lo tanto:
()
()
Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el
intervalo ser ms amplio:
()
()
El intervalo de confianza proporciona una estimacin de la precisin de nuestra
estimacin puntual. Si es realmente el valor central de intervalo, entonces estima
sin error. La mayor parte de las veces, sin embargo, no ser exactamente igual a y
la estimacin puntual es errnea. La magnitud de este error ser el valor absoluto de
la diferencia entre y , y podemos tener el nivel de confianza de que esta diferencia
no exceder
.
Como se puede observar en los resultados del ejercicio se tiene un error de estimacin
mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un
nivel de confianza del 95%.
Definicin
Si y son los valores de la media y la desviacin estndar de una muestra aleatoria
de tamao de una poblacin normal, entonces
n
s
t x
n
s
t x
n a n a
- + < < -
1 , 2 / 1 , 2 /
Es un intervalo con ( ) de confianza para la media de la poblacin.
Se realizo un estudio sobre la utilizacin del agua en una pequea ciudad. Para ello se
considero una muestra de 25 casa. El nmero de galones de agua que utilizan por da
(1 galn 0.0037854 m3) fue el siguiente:
Con base en esta informacin:
a) Hallar un intervalo de confianza del 90%
n
s
t x
n
s
t x
n a n a
- + < < -
1 , 2 / 1 , 2 /
() (
) () (
)
Problema
A partir de 860 cuentas, un analista financiero toma una muestra aleatoria de 16
cuentas. Los saldos observados en la muestra son los siguientes: 165, 150, 300, 240,
250, 150, 300, 200, 140, 240, 260, 180, 190, 230, 350,360.
Determinar un i ntervalo de confianza del 90% para estimar el saldo medio
de todas las cuentas.
() (
) () (
)
Ejercicio
Se selecciono una muestra aleatoria de 25 cuentas por cobrar de un registro que
contena 96 cuentas. La muestra dio una media de x = 2435colones y una desviacin
tpica de S = 335 colones. Obtngase un intervalo de confianza del 99% para estimar
la media de las 96 cuentas del registro.
Ejercicio
El auditor de una empresa al examinar los registros de facturacin mensual, mediante
el anlisis de una muestra aleatoria irrestricta de 10 facturas no pagadas encontr que
la media aritmtica fue de x = $9500 con una desviacin tpica de s = $327. Construir
un intervalo de confianza del 95%para estimar el parmetro poblacional.
Ejercicio
Una muestra aleatoria del proceso de produccin de 17 bombillos, dio una media de x
= 128 horas, con una desviacin tpica s = 15 horas. Construir un intervalo de
confianza del 99% para estimar el promedio de vida til de todos los bombillos del
proceso.
Definicin
Si
,
entonces
2
2
2
1
2
1
2 /
2 1
2 1
2
2
2
1
2
1
2 /
2 1 ) ( ) (
n n
z x x
n n
z x x
a a
o o o o
+ - + < < + -
Es un intervalo de confianza del ( ) para la diferencia entre las dos medias
de las poblaciones.
Definicin
Si
1
x , 2 x
,
1
s
y
2
s
son los valores de las medias y desviaciones estndar de variables
aleatorias independientes de tamao n
1
y n
2
de poblaciones normales con varianzas
iguales, entonces
2 1
2 , 2 /
2 1
2 1
2 1
2 , 2 /
2 1
1 1
) (
1 1
) (
2 1 2 1
n n
s t x x
n n
s t x x
p n n a p n n a
+ - + < < + -
+ +
Es un intervalo de confianza del ( ) % 100 1 o
para la diferencia entre las dos medias
de las poblaciones.
Definicin
Si X es una variable aleatoria binomial con los parmetros n
y n , u
es grande y
.
u
y
n
x
, entonces
n
z
n
z
a a
) 1 ( ) 1 (
2 / 2 /
. . . .
.
- + < <
-
u u
u u
u u
u
Es un intervalo de confianza aproximado del ( ) % 100 1 o
para u
Definicin
Si
- < <
-
u u u u
u u u u
u u u u
u u
o o
Es un intervalo de confianza aproximado de
( ) % 100 1 o
para
2 1
u u
.
Definicin
Si
n
x
=
.
u se usa como un estimador de u
,
podemos afirmar con ( ) % 100 1 o de
confianza que el error es menor que
n
z
) 1 (
2 /
. .
-
u u
o
La estimacin de varianzas
Si
2
s es el valor de la varianza de una muestra aleatoria de tamaou
de una
poblacin normal, entonces
x x n n
s n s n
2
1 , 2 /
2
2
2
1 , 2 /
2
) 1 ( ) 1 (
< <
o o
o
Es un intervalo de confianza del ( ) % 100 1 o
para
2
o .
TEOREMA 11.9 Si es el valor de la varianza de una muestra aleatoria de tamao
de una
poblacin normal, entonces
4.6 Errores tipo I y II
El error tipo I se define como el rechazo de la hiptesis nula H
o
cuando sta es
verdadera. Tambin es conocido como nivel de significancia.
El error tipo II error se define como la aceptacin de la hiptesis nula cuando
sta es falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones
diferentes que determinan si la decisin final es correcta o errnea.
Decisin H
o
es verdadera H
o
es falsa
Aceptar H
o
No hay error Error tipo II
Rechazar H
o
Error tipo I No hay error
Ya se ha mostrado cmo puede estimarse un parmetro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador
puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo,
muchos problemas de ingeniera, ciencia, y administracin, requieren que se tome una
decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta
proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de
la inferencia estadstica, puesto que muchos tipos de problemas de toma de
decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse
como problemas de prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de
una o ms poblaciones.
4.7 Contraste de hiptesis unilateral y bilateral
Se pueden presentar tres tipos de ensayo de hiptesis que son:
- Unilateral Derecho
- Unilateral Izquierdo
- Bilateral
Dependiendo de la evaluacin que se quiera hacer se seleccionar el tipo de ensayo.
- Unilateral Derecho. El investigador desea comprobar la hiptesis de un
aumento en el parmetro, en este caso el nivel de significancia se carga todo
hacia el lado derecho, para definir las regiones de aceptacin y de rechazo.
Ensayo de hiptesis:
- Unilateral Izquierdo: El investigador desea comprobar la hiptesis de una
disminucin en el parmetro, en este caso el nivel de significancia se carga
todo hacia el lado izquierdo, para definir las regiones de aceptacin y de
rechazo.
Ensayo de hiptesis:
- Bilateral: El investigador desea comprobar la hiptesis de un cambio en el
parmetro. El nivel de significancia se divide en dos y existen dos regiones de
rechazo.
Ensayo de hiptesis:
La hiptesis nula, representada por H
o
, es la afirmacin sobre una o ms
caractersticas de poblaciones que al inicio se supone cierta (es decir, la "creencia a
priori").
La hiptesis alternativa, representada por H
1
, es la afirmacin contradictoria a H
o
, y
sta es la hiptesis del investigador.
Problema
1. Una muestra aleatoria de 100 muertes registradas en Monclova el ao pasado
muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar
poblacional de 8.9 aos, esto parece indicar que la vida media hoy en da es
mayor que 70 aos? Utilice un nivel de significancia de 0.05.
Solucin:
a. Se trata de una distribucin muestral de medias con desviacin estndar
conocida.
b. Datos:
c. Ensayo de hiptesis
d. Regla de decisin:
e. Clculos:
f. Justificacin y decisin.
Como 2.02 >1.645 se rechaza H
o
y se concluye con un nivel de significancia del
0.05 que la vida media hoy en da es mayor que 70 aos.
Problema
2. Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
de forma aproximadamente normal con una media de 800 horas y una
desviacin estndar de 40 horas. Si una muestra aleatoria de 30 focos tiene
una duracin promedio de 788 horas, muestran los datos suficiente evidencia
para decir que la duracin media ha cambiado? Utilice un nivel de significancia
del 0.04.
Solucin:
a) Se trata de una distribucin muestral de medias con desviacin estndar
conocida.
b) Datos:
c) Ensayo de hiptesis
d) Regla de Decisin:
e) Clculos:
f) Justificacin y decisin:
Como por lo tanto, no se rechaza H
o
y se concluye
con un nivel de significancia del 0.04 que la duracin media de los focos no ha
cambiado.
Proyecto
1. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una
muestra de 30 focos tiene una duracin promedio de 780 horas, encuentre un
intervalo de confianza de 96% para la media de la poblacin de todos los focos
que produce esta empresa.
2. Se registraron las siguientes mediciones de tiempo de secado en horas de una
marca de pintura ltex, 3.4, 2.8, 4.4, 2.5, 3.3, 4.0, 4.8, 5.6, 5.2, 2.9, 3.7, 3.0,
3.6, 2.8, 4.8, suponiendo que las distribuciones representan una muestra
aleatoria de una poblacin normal. Encuentre los lmites de tolerancia para un I
de C del 95%.
3. Una muestra de 12 latas de sopa producida por cierta compaa produjo los
siguientes pesos netos, medidos en onzas:
11.9 12.2 11.6 12.1 12.1 11.8
11.9 11.8 12.0 12.3 11.8 12.0
Si se supone normalidad en los pesos, construya un intervalo de confianza del
95% para el peso promedio de todas las latas de sopa producidas por la
compaa.
4. Un experimentador quiere verificar la variablidad de un equipo diseado para
medir el volumen de una fuente de audio frecuencia, tres mediciones
independientes registradas con este equipo fueron 4.1, 5.2, 10.2, estime
2
o .
5. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao
pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin
estndar poblacional de 8.9 aos, esto parece indicar que la vida media hoy
en da es mayor que 70 aos? Utilice un nivel de significancia de 0.05
6. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas
de la variabilidad de los resultados que producen muestras estndar. En un
estudio de la cantidad de calcio en el agua potable, el cual se efecta como
parte del control de calidad, se analiz seis veces la misma muestra en el
laboratorio en intervalos aleatorios. Los seis resultados en partes por milln
fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados
de la poblacin para este estndar, usando un nivel de confianza del 90%.
7. Para tratar de estimar la media de consumo por cliente, en un gran restaurante,
se reunieron datos de una muestra de 49 clientes durante un periodo de tres
semanas. Si la media de la muestra es de $ 22.60 dlares, Cul es el
intervalo de confianza de 95% para la media de la poblacin?
8. Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de un muestra de mediciones de zinc en 36 sitios diferentes es de 2.6
gramos por mililitro. Encuentre los intervalos de confianza de 96% y 98% para
la concentracin media de zinc en el ro. Suponga que la desviacin estndar
de la poblacin es 0.3.
9. Los salarios diarios en una industria particular presentan una distribucin
normal con una media de $13.20 y una desviacin estndar de $2.50. Si en
esta industria una compaa que emplea a 40 trabajadores les paga en
promedio $12.20, puede acusarse a esta compaa de pagar salarios
inferiores?, utilice un 05 . 0 = o
20 . 13 :
20 . 13 :
0
<
=
A
H
H
10. Cinco mediciones del contenido de alquitrn de cierta clase de cigarrillos dieron
cigarrillo
mg
y 6 . 14 3 . 14 , 4 . 14 , 2 . 14 , 5 . 14
. Suponga que los datos son una
muestra aleatoria de una poblacin normal, demuestre que para un 0.05 de
significancia se debe rechazar la hiptesis nula 0 . 14 = en favor de la
alternativa 0 . 14 =
11. El Instituto Elctrico Edison publica cifras del nmero anual de Kilowatt-hora
que gastan varios aparatos electrodomsticos. Se afirma que una aspiradora
gasta un promedio de 46 kilowatt-hora al ao. Si una muestra aleatoria de 12
hogares que se incluye en un estudio planeado indica que las aspiradoras
gastan un promedio de 42 kilowatt-hora al ao con una desviacin estndar
de11.9 kilowatt-hora, esto sugiere con un nivel de significancia de 0.05 que
las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente?
Suponga que la poblacin de kilowatt-hora es normal.
12. El departamento de seguridad de una fbrica quiere saber si el verdadero
tiempo promedio que el guardin nocturno tarda en hacer su ronda es 30 min.
Si, en una muestra aleatoria de 32 rondas, el guardin nocturno promedi 30.8
minutos con una desviacin estndar de 1.5 minutos, determine si sta es
evidencia suficiente para rechazar la hiptesis nula min 30 = a favor de la
hiptesis alternativa min 30 = . Use un nivel de significancia del 0.01.
13. Una muestra aleatoria de 64 bolsas de palomitas de maz pesan, en pomedio
5.23 onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de
que = 5.5 onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de
significamcia de 0.05.
14. Se sabe que los voltajes de una marca de pilas tamao C se distribuyen
normalmente, se prob una muestra aleatoria de 15 y se encontr que la media
es de 1.4 volts con una desviacin estndar de 0.21 volts. En el nivel de
significancia de 0.01:
a. Indica esto que la media de los voltajes es menor que 1.5 volts?
b. Calcular la probabilidad de cometer el error tipo II si el voltaje promedio real de
las pilas es de 1.3 volts.
15. Una compaa que produce una parte maquinada para un motor, afirma que
tiene una varianza de dimetro no mayor a 0.0002 pulgadas. Una muestra
aleatoria de 10 de dichas partes dio una varianza de muestra 0.0003. Si se
supone que las medidas del dimetro se distribuyen en forma normal, hay
evidencia para refutar lo que afirma el proveedor? Use 01 . 0 = o .
16. Una compaa que produce una parte maquinada para un motor, afirma que
tiene una varianza de dimetro no mayor a 0.0002 pulgadas. Una muestra
aleatoria de 10 de dichas partes dio una varianza de muestra s
2
= 0.0003. Si se
supone que las medidas del dimetro se distribuyen en forma normal, hay
evidencia para refutar lo que afirma el proveedor? Use = 0.05.
Unidad V
Regresin y correlacin
5.1 Control de calidad
5.2 Diagrama de dispersin
5.3 Regresin lineal simple
5.4 Correlacin
5.5 Determinacin y anlisis de los coeficientes de correlacin y de
determinacin.
5.6 Distribucin normal bidimensional
5.7 Intervalos de confianza y pruebas para el coeficiente de
correlacin.
5.8 Errores de medicin.
Proyecto V
7. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 7 , 9 , 8 , 8 , 6 , 7 , 8 , 6 , 4 , 5 , 5 , 4 , 2 , 3 , 1 , 2 , 3 , 1
8. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 7 , 9 , 8 , 8 , 6 , 7 , 8 , 6 , 4 , 5 , 5 , 4 , 2 , 3 , 1 , 2 , 4 , 1
9. En una investigacin sobre costos los pares de valores de ( ) Y X, son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 8 . 6 , 12 , 6 , 11 , 5 , 9 , 6 , 8 , 4 , 7 , 3 , 6 , 4 , 5 , 2 , 3 . Traza el diagrama de
dispersin, la recta de regresin de Y sobre X que consideres por aproximacin
como la ms adecuada.
10. Se dieron diversas dosis de una sustancia venenosa a grupos de 25 ratones y
se observaron los siguientes resultados.
Dosis mg
x
Nmero de muertes
Y
4 1
6 3
8 6
10 8
12 14
14 16
16 20
a) Encuentre la ecuacin de mnimos cuadrados ajustada a estos datos
b) Estime el nmero de muertes en un grupo de 25 ratones que recibieron una
dosis de 7 mg de este veneno
11. stas son las puntuaciones que obtuvieron 12 estudiantes en el examen
semestral y examen final en un curso de estadstica.
Examen semestral
x
Examen final
Y
71 83
49 62
80 76
73 77
93 89
85 74
58 48
82 78
64 76
32 51
87 73
80 89
a) Encuentre la ecuacin de mnimos cuadrados que nos permitir predecir la
puntuacin del estudiante en el examen final en este curso sobre la base de
su puntuacin en el examen final
b) Prediga la puntuacin del examen final de un estudiante que recibi 84 en
el examen semestral
12. La materia prima que se usa en la produccin de una fibra sinttica se
almacena en un lugar que no tiene control de humedad. Las medidas de la
humedad relativa y del contenido de humedad de muestras de al materia prima
en 12 das dieron los siguientes resultados.
Humedad
x
Contenido de humedad
y
46 12
53 14
37 11
42 13
34 10
29 8
60 17
44 12
41 10
48 15
33 9
40 13
a) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
contenido de humedad en trminos de humedad relativa
b) Use los resultados del inciso (a) para estimar el contenido de humedad
cuando la humedad relativa es del 38%
13. Los siguientes datos corresponden al cloro residual en una alberca en diversos
momentos despus de haberse tratado con qumicos.
Nmero de Horas
x
Cloro residual
(partes por milln)
y
2 1.8
4 1.5
6 1.4
8 1.1
10 1.1
12 0.9
a) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
contenido de humedad en trminos de humedad relativa
14. La tabla siguiente muestra valores de evaluacin y el precio de venta de ocho
casas, que constituyen una muestra aleatoria de todas las casas vendidas
recientemente en cierta rea de la ciudad.
Valores de valuacin
x
Precio de venta
Y
70.3 114.4
102 169.3
62.5 106.2
74.8 125
57.9 99.8
81.6 132.1
110.4 174.2
88 143.5
a) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el precio
de venta en trminos de su evaluacin
15. La tabla siguiente muestra el alargamiento de varillas de acero de de la misma
composicin y dimetro cuando se sujetan a varias fuerzas de tensin.
Fuerza
X
Alargamiento
Y
1.2 15.6
5.3 80.3
3.1 39
2.2 34.3
4.1 58.2
2.6 36.7
6.5 88.9
8.3 111.5
7.6 99.8
4.9 65.7
a) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
alargamiento de las varillas de acuerdo a la fuerza establecida
16. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 3 . 7 , 6 , 3 . 5 , 6 , 2 . 5 , 5 , 2 . 4 , 5 . 4 , 3 . 4 , 4 , 3 , 4 , 3 , 3 , 5 . 1 , 5 . 2 , 3 . 2 , 2 , 1 , 5 . 1
(23.3 puntos)
17. Los trabajadores de a las proveedoras de la maquiladora a que nos referimos,
piden a los dueos de una maquiladora que para tener mejores condiciones de
salud de sus familias necesitan cotizar en el Seguro Social y es necesario
cambiar las condiciones de pago. Se conviene en pagar un sueldo base
equivalente q un salario mnimo, que por la zona donde estn es de 45 pesos,
y sobre esta cantidad continuar recibiendo 5 pesos por pieza entregada. El
cuadro de percepciones queda as:
Piezas 10 15 20 25 32 35 38 45
Pago 95 120 145 170 205 220 235 270
Traza el diagrama de dispersin, la grfica y expresa la ecuacin de la curva
correspondiente.
http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml
De Wikipedia, la enciclopedia libre
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o
clasificacin de las personas cuando atienden caractersticas tales como peso,
estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos
primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante
la frmula:
k= 1,2,3,... 99
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
- Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
- El 60 percentil, es aquel valor de la variable que supera al 60% de las
observaciones y es superado por el 40% de las observaciones.
- El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.
Frmulas Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
frmulas:
Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo A, el nmero del percentil.
Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el
percentil 50 y el tercer cuartil con el percentil 75.
3. EJEMPLO
Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:
Salarios No. De fa
(I. De Clases) Empleados (f1)
200-299 85 85
300-299 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463
Como son datos agrupados, se utiliza la frmula
Siendo,
La posicin del primer cuartil.
La posicin del 7 decil.
La posicin del percentil 30.
Entonces,
El primer cuartil:
115.5 85 = 30.75
Li = 300, Ic = 100 , fi = 90
El 7 decil:
Posicin:
324.1 295 = 29.1
Li = 500, fi = 70
El percentil 30
Posicin:
138.9 85 = 53.9
fi = 90
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo
de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el
70% de los empleados.
Hay 99 percentiles que se denotan: P
1
, P
2
, P
3
,......., P98, P
99
. As P
90
, por ejemplo, deja
por debajo de l el 90% de los elementos.
La frmula para realizar el clculo del percentil 45, por ejemplo sera:
)
100
45
(
45 i
f
N
f
I
l P + =
Ejercicio: De la siguiente serie hallar el primero y el tercer cuartil, el segundo y el
sptimo decil y los percentiles 8 y 73.
Resp: Q
1
= 34,82; Q
3
= 47,36; D
2
= 32,85; D
7
= 45,83; P
8
= 26,94; P
73
= 46,75.
Obsrvese que entre los 6 cuantiles calculados, aparecen valores muy parecidos. En
particular se dan las siguientes coincidencias:
El segundo cuartil equivale a la mediana
El quinto decil y el quincuagsimo percentil se corresponden tambin con la
mediana.
Los percentiles P
25
y P
75
se corresponden con el primer y tercer cuartil,
respectivamente.
Los percentiles son valores que resultan de dividir la poblacin (el N de las
observaciones) en cien partes iguales (1% en cada una).
Clculo para datos sin agrupar
El percentil se obtiene identificando el valor que para la variable en cuestin tiene el
individuo que ocupa la posicin j%
Clculo para datos agrupados
Clculo a partir de la frecuencia relativa
Se debe tener en cuenta que cuando j es un valor entre 1 y 9 inclusive se debe escribir
0,0j en el numerador en lugar de 0,j
Percentiles y datos percentiles
La expresin percentil se usa para indicar en una distribucin de observaciones, el
valor por debajo del cual est situado cierto porcentaje de distribuciones de valores,
por ejemplo, al decir que en una distribucin de estaturas el 15.28% de los alumnos
mide 144.5 o menos, se expresa:
5 . 144
28 . 15
= P Estamos afirmando que el 15.28% de los alumnos est por debajo de
144.5 cm. de estatura.
Se presentan dos problemas relacionados al uso de percentiles:
- Obtener el valor de la abscisa x que corresponde a un valor percentil, y
- Obtener el rango percentil correspondiente a un valor de la abscisa
Solucin
1. Si conocemos el valor de x obtenemos el rango percentil
En la grfica de la ojiva se traza, por el punto x conocido, una paralela al eje de
las ordenadas hasta intersectar la ojiva y desde el punto de interseccin se
traza una paralela al eje de las abscisas y obtenemos el rango percentil .
y
P
2. Si conocemos el percentil (valor de y) obtenemos el valor de la abscisa x.
Se traza por el punto que corresponde al percentil y ( )
y
P , una paralela al eje de
las abscisas hasta intersectar la ojiva; desde el punto de interseccin se baja
una perpendicular al eje de las x.