A Punt Es Dee Stadi Stica

Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos
Curso de Estadística
Dirigido a:
Estudiantes de Carreras Técnicas e Ingenierías
De Institutos Profesionales
Edición revisada
Marzo del 2006
Autor:
Profesor Edgardo Ojeda Barcos
Licenciado en Organización de la Producción,

Universidad Argentina de la Empresa.
Postítulo en Ingeniería de Calidad,

Universidad de Santiago de Chile.
Derechos de autor en trámite
Derechos de autor en trámite Página 1 de 155
Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

ÍNDICE
Capítulo 1
1.1 Introducción al concepto de Estadística
1.2 Gráficos
Capítulo 2
2.1 Distribuciones de frecuencias, Histogramas
2.2 Distribución de frecuencias acumuladas y ojivas.
2.3 Ejercicios de aplicación
Capítulo 3
3 Promedios
3.1 Media Aritmética
3.2 Media Aritmética Ponderada
3.3 Propiedades de la Media Aritmética
3.4 Cálculo de la Media Aritmética para datos agrupados
3.5 Ejercicios de aplicación.
3.6 La Mediana
3.7 La Moda
3.8 Relación empírica entre la media aritmética, la mediana y la
moda
Capítulo 4
4 Medidas de la dispersión de una distribución de datos
4.1 Dispersión o variación
4.2 Rango o Intervalo
4.3 La Desviación Típica
4.4 Desarrollo de tres fórmula para el cálculo de la Desviación
Típica
4.5 Propiedades de la desviación Típica
4.6 Varianza
4.7 Desviación Media
4.8 Ejercicios en clase.
4.9 Ejercicios de Aplicación
Capítulo 5
5 CuantilosCuantilos
5.1 Definición
5.2 Medidores de Tendencia Central
5.3 Medidores de la Dispersión
5.4 Procedimiento de Cálculo
5.5 Procedimiento de Calculo para datos Agrupados
5.6 Obtención de los valores correspondientes cuando el
número de datos es distinto de 100
Capítulo 6
6 Teoría elemental de Probabilidades

6.1 Definición de Probabilidad

6.1.1 Definición Clásica
6.1.2 Definición como Frecuencia Relativa
6.2 Concepto de Probabilidad
6.3 Regla de la adición de Probabilidades
6.4 Regla del producto de las probabilidades
6.5 Aplicación de ambas reglas
6.6 Probabilidades con y sin reposición
6.7 Probabilidad de las causas. Formula de Bayes – Laplace
Capítulo 7
7 Análisis Combinatorio y Probabilidades
7.1 Principio fundamental del análisis combinatorio
7.2 Factorial de n
7.3 Permutaciones
7.4 Combinaciones
7.5 Probabilidades y Análisis Combinatorio
7.6 Generalización del número combinatorio y probabilidades
7.7 Ejercicios de aplicación
Capítulo 8
8 Las Distribuciones Binomial, Poisson y Normal
8.1 La Distribución Binomial
8.2 Distribución de Poisson
8.3 Relación entre la Distribución Binomial y la Distribución de
Poisson
8.4 La Distribución Normal, Curva Normal o Distribución
Gaussiana.
8.5 Relación entre la Distribución Binomial y la Normal
8.6 Ejercicios de comprensión sobre la Distribución Normal
8.7 Distribución Hipergeométrica.
8.8 Aproximación Normal a Binomial
Capítulo 9
9 Correlación y Regresión
9.1 Introducción
9.2 Análisis de Correlación
9.3 Análisis de Regresión
Capítulo 10
10 Teoría del muestreo.
10.1 Muestreo aleatorio.
10.2 Distribución de muestreo.
10.3 Muestreo de poblaciones pequeñas.

Capítulo 11
11 Estimación
11.1 Estimación por punto y por intervalo
11.2 Intervalo de confianza
11.3 Estimación de la media aritmética.
11.4 Margen de error y coeficiente de confianza.
11.5 No siempre se conoce el valor de la desviación típica
poblacional.
11.6 Distribución t, o Distribución de Student.
11.7 Intervalos de confianza para las proporciones o porcentajes
de defectuosos.
Capítulo 12
12 Números Índices.
12.1 Relaciones de precios.
12.2 Relaciones de Cantidad o de Volumen
12.3 Relaciones de valor
12.4 Relaciones de Enlace y en Cadena.
12.5 El método de agregación simple.
12.6 El método de agregación Simple de relaciones.
12.7 El método de agregación ponderada.
12.7.1 Indice de Laspeyres.
12.7.2 Indice de Paasche.
12.8 Deflación de series en el tiempo.
Capitulo 13
13 Series de Tiempo
13.1 Análisis de series en el tiempo
13.2 Estimación de las variaciones estacionales. El Índice
Estacional
Capitulo 14
14 Pruebas de Hipótesis
14.1 Hipótesis Estadísticas.
14.2 Contrastes de Hipótesis y significación, o reglas de
decisión.
14.3 Errores de Tipo I y de Tipo II .
14.4 Nivel de significación.
14.5 Contrastes mediante la distribución normal.
14.6 Tres distintos niveles de significancia.
14.7 Selección de un nivel de significancia.
14.8 Uso de la distribución t para la toma de decisiones.
14.9 Ejercicios de aplicación desarrollados.
14.10 Ejercicios de Aplicación.

Capitulo 15
15 Análisis de Varianza
15.1 Distribución F
15.2 Análisis de Varianza y Cálculo de F, con una variable de
clasificación.
Bibliografía

Prólogo a la edición de Marzo de 2006.

A mis queridos alumnos.
El presente trabajo, tiene una finalidad claramente establecida, facilitar el estudio y

la comprensión de la materia Estadística, a los estudiantes de Ingeniería y de
carreras técnicas.
El libro no tiene pretensiones de originalidad, por ello, y sin querer amenguar el

mérito que tienen las variadas partes, que sí, son originales, el libro es una
compilación de diversos autores y libros de estudio que actualmente están vigentes.
Todas las fuentes que han sido consultadas, están catalogadas, al final del estudio.
Por otra parte, en el contenido del libro, se han volcado todas las dudas y consultas
frecuentes y que han sido recolectadas a lo largo de innumerables cursos realizados
por el autor.
Este libro, no pretende reemplazar la asistencia a clase, lo cual ha sido debidamente
contemplado, es decir, la asistencia a clase sigue siendo indispensable para la
correcta aprehensión de la materia. Tampoco se desea limitar a los alumnos a la
exclusiva lectura de éste estudio, ya que un alumno de nivel terciario, tiene
necesariamente que aprender a consultar distintas fuentes de información.
A lo largo de sucesivas revisiones se han ido incorporando temas de interés para las
distintas carreras , como Ingeniería Química, Alimentos, Prevención de Riesgos, de
la Madera, etc, por lo cual, el libro se transforma en una herramienta de consulta para
las distintas carreras de Institutos profesionales.
Por último, una recomendación muy útil, si bien este consejo es válido para cualquier
disciplina, en el estudio de la estadística, es particularmente importante. Para ser
exitosos en el aprendizaje de la estadística se requiere ser persistente, tanto en la
asistencia a clase como en la continuidad del estudio. La estadística es una cadena
interminable que se va construyendo con un conocimiento arriba de otro; una clase
que se pierde, un concepto que no se entiende, crea grandes lagunas difíciles de
superar. Por esto recomiendo: a) asistir a todas las clases, b) llegar a cada clase con
una comprensión suficiente de los conceptos vistos anteriormente para poder
entender y participar en el desarrollo siguiente.
El objetivo de todo futuro profesional es: APRENDER.
Edgardo Ojeda Barcos

Profesor de Estadística y Control de Calidad
Santiago de Chile.
Marzo de 2006.

Capítulo 1
1.1 Introducción al concepto de la Estadística
La palabra estadística es un concepto muy conocido y por cierto muy amplio.

Podríamos decir que la estadística tiene que ver con la recopilación y comprensión de
datos numéricos.
Sin embargo, para comprender mejor el campo de la Estadística nos referiremos a un
ejemplo y dejaremos al estudiante la generalización de dicho ejemplo.
Supongamos que por necesidades académicas necesitamos conocer la edad

promedio de todos los alumnos del Inacap en todo el país. La forma perfecta de
hacerlo sería consultar a los miles de alumnos a lo largo del país, y luego de una
larga, tediosa y cara tarea, sumaríamos todas las edades, las dividiríamos por el total
de alumnos y obtendríamos el dato buscado.
Sin embargo, la Estadística nos ofrece un camino, más corto, más rápido y
conveniente para obtener la información, suficientemente válida y muy cercana al
dato anterior.
Imaginemos que tenemos un gran recipiente donde colocáramos tantas fichas como
alumnos y cada ficha tuviera el dato de la edad de cada alumno. Ese gran recipiente
sería nuestro Universo o Población.
Alguien con sentido común propondría tomar algunas fichas al azar y calcular el
promedio de dicho pequeño grupo de unidades. Intuitivamente podremos aceptar
que el dato obtenido no necesariamente será el valor verdadero del total de las
fichas, pero sin duda guardará cierta relación y además será la mejor información
disponible.
DEFINICION DE ESTADISTICA
Generalizando, podremos decir que la Estadística es la metodología científica

que se encarga de INFERIR los valores de los parámetros de la Población o
Universo mediante la extracción sistemática de MUESTRAS.
Estas técnicas pueden además, darnos información acerca de la confiabilidad,

(certeza) con que los datos son obtenidos.
En los trabajos estadísticos podemos distinguir dos áreas de trabajo, la primera se

llama Estadística descriptiva, y es la que se encarga de la recopilación, el
ordenamiento e interpretación de la información o datos.
La segunda área, es la llamada Estadística Inductiva o Inferencia Estadística, es

decir la que por elaboración de los datos anteriores, nos ofrecen respuestas a los
interrogantes planteados unidos a información probabilística acerca de la
confiabilidad de dicha información.

1.2 Gráficos
La estadística encuentra en los gráficos, una herramienta indispensable para

ayudar a entender, interpretar y comunicar sus conclusiones.
En éste estudio, solo veremos algunos de ellos. El primero será las llamadas Series
de Tiempo.
Crecimiento Demográfico en EE.UU. ( en millones de personas)
Año 1860 70 80 90 1900 10 20 30 40 50 60 70 80

Población 31 40 50 63 76 92 106 123 132 151 179 203 227
La misma información puede representarse como un gráfico o diagrama de barras.

Otros Gráficos
Datos de producción de una región hipotética:
Año Tn trigo Tn maíz Total Porcentual

trigo
75 200 75 275 73 %
76 185 90 275 67 %
77 225 100 325 69 %
78 250 85 335 75 %
79 240 80 320 75 %
80 195 100 295 66 %
81 210 110 320 66 %
82 225 105 330 68 %
Gráfico de trazos

Gráfico de Barras
Gráfico de Barras Acumuladas

Gráfico de Barras Porcentuales
Gráfico de barras horizontales

Gráfico circular abierto.
El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,

el alumno deberá resolverlos como parte de su desarrollo académico.
1.3, 1.4, 1.5, 1.6, 1.8, 1.9, 1.10, 1.16, 1.17, 1.18, 1.19, 1.20, 1.21, 1.22, 1.23, 1.24,
1.23, 1.27, 1.29, 1.30, 1.48, 1.52, 1.59, 1.71, 1.76.

Capítulo 2
2.1 Distribuciones de frecuencias, Histogramas
Cuando se realiza una recolección de datos muy extensa, por ejemplo, 50 o más
datos, resulta muy difícil interpretar la información recibida.
Una primera investigación que podríamos realizar, sería la de encontrar el mayor
valor y el menor de ellos lo cual nos informaría acerca del INTERVALO el cual se
encuentran todos los datos.
Lo segundo podría ser ordenarlos de menor a mayor, pero aun seguiría siendo una
larga lista de números.
El siguiente procedimiento, nos permitirá ordenarlos e interpretar valiosa información
estadística.
Este ordenamiento consiste en crear CLASES, dentro de las cuales clasificaremos
los datos. El procedimiento es dividir la distancia del INTERVALO en intervalos más
cortos que llamaremos clases. La pregunta que nos haremos es: ¿en cuantas clases
dividiremos el INTERVALO?
Existe una regla empírica, (práctica) que dice lo siguiente:
Si el total de datos es n, el número de clases que buscamos será n
Para entenderlo mejor, haremos un ejemplo.
Supongamos que se han tomado 84 datos de una medida de diámetros de ejes para
un instrumento de precisión.
Los datos tal como se obtuvieron son:
881 880 905 933 872 861 882 877 890 898 863 896 878 906
886 875 890 928 911 955 893 867 920 879 899 897 870 883
885 883 889 874 878 904 939 901 894 859 886 865 902 867
889 874 891 925 866 869 868 894 891 901 912 892 921 895
910 915 846 892 885 866 910 885 916 915 923 857 891 889
912 907 881 893 905 924 876 903 887 901 888 907 880 882
En total son 84 mediciones, por lo tanto n = 84
El mayor valor es 955

El valor mínimo es 846
El INTERVALO es 109

De acuerdo con la regla empírica, descrita anteriormente, el número de CLASES que

deberemos hacer será 84  9.17 , este número debe aproximarse al valor entero,
es decir 9.
El paso siguiente será, dividir el INTERVALO, 109, por el dato hallado,
109 / 9 = 12.1
Nuevamente deberemos tomar el número entero, es decir 12.
El número 12 es par, existen razones que veremos mas adelante para preferir que
este número sea impar, por lo tanto elegiremos 11, ¿podría servir 13? La respuesta
es sí, pues éste es un procedimiento aproximado.
Este valor es denominado: ANCHO DE CLASE.
Bien, este ANCHO DE CLASE: 11, nos servirá para construir nuestras CLASES.
¿Por cual número comenzaremos?
Es costumbre comenzar exactamente por el menor de los datos encontrados, es

decir 846, pero podríamos empezar por algún otro número, algo menor por ejemplo
840 y el resultado obtenido sería igualmente válido.
Para nuestro ejemplo comenzaremos con el mínimo leído, esto es 846 y lo
utilizaremos como LÍMITE INFERIOR DE LA CLASE 1.
Para hallar el LÍMITE DE LA CLASE 2, sumaremos 11 a 846, es decir que el límite
de la clase 2 es: 857, y el de la clase 3 será 868.
Nos queda ahora, determinar el LÍMITE SUPERIOR DE LA CLASE 1 y
subsiguientes.
El LÍMITE SUPERIOR DE LA CLASE 1 será una unidad significativa menor que el
límite inferior de la clase 2, es decir: 856 y el límite superior de la clase 2 será: 867.
De esta forma las clases serán:
CLASES LIMITE INFERIOR LIMITE SUPERIOR
1 846 856
2 857 867
3 868 878
4 879 889
5 890 900
6 901 911
7 912 922
8 923 933
9 934 944
10 945 955
En este paso debemos preguntarnos, ¿porqué son 10 las clases, si habíamos

calculado 9?. Porque descartamos el 12 y preferimos el número impar (11),
Ahora tenemos que determinar con qué FRECUENCIA caen los datos dentro de
estas celdas llamadas CLASES.

Para ello procederemos a marcar con un pequeño trazo vertical, cada dato dentro de
su clase, Por ejemplo, los números 881 y 880, pertenecen a la clase 4 y el número
905 a la clase 6. De esta forma se registran los 84 datos.
Así se construye la siguiente tabla:
CLASES LÍMITE LÍMITE DIAGRAMA FRECUENCIA

INFERIOR SUPERIOR DE TILDES DE CLASE
1 846 856 / 1
2 857 867 //// //// 9
3 868 878 //// //// / 11
4 879 889 //// //// //// //// 19
5 890 900 //// //// //// / 16
6 901 911 //// //// //// 14
7 912 922 //// // 7
8 923 933 //// 5
9 934 944 / 1
10 945 955 / 1
TOTAL 84 84
Este perfil obtenido con el diagrama de frecuencias ya nos está dando valiosa
información estadística, vemos que los datos están concentrados con preferencia
alrededor de la CLASE 4 y que un valor representativo del grupo debería estar
dentro de esa clase.
Para terminar con el estudio de los diagramas de frecuencia, veremos algunas

características más que serán necesarias en cálculos futuros:
ANCHO DE CLASE, en nuestro ejemplo es 11, y se obtiene como diferencia entre el

límite inferior de una clase y el límite inferior de la clase inmediatamente anterior.
MARCA DE CLASE, es el promedio entre los límites superior e inferior de una clase
determinada. Por ejemplo, para la clase 1 de nuestro ejemplo, tenemos:
Limite inferior de la clase: 846

Limite superior de la clase: 856
Promedio: (846+856)/2 = 851
Por lo tanto, la MARCA DE CLASE del grupo 1 será 851.En éste punto recordaremos
que al principio de éstos cálculos mencionamos que era conveniente utilizar un
número impar. Ahora explicaremos el porqué de esa recomendación.

Si el numero no hubiera sido impar, la MARCA DE CLASE, no hubiera sido un

número exacto, hubiera tenido un valor decimal que habría que mantener,
necesariamente, y esto trae aparejado, un aumento de las posibilidades de error en
los cálculos.
Sin embargo, si pese a la recomendación de usar impar, prefirió un número par, no
habrá error si mantiene durante todos los cálculos, el valor decimal que se genera
por dicha causa.
En nuestro caso, no hay decimales, la marca de clase de la clase uno dio 851
exacto. Luego sumamos el ancho de clase, 11, para hallar las marcas de
clases sucesivas.
CLASES LÍMITE LÍMITE MARCA DE FRECUENCIA
CLASE
INFERIOR SUPERIOR DE CLASE
1 846 856 851 1
2 857 867 862 9
3 868 878 873 11
4 879 889 884 19
5 890 900 895 16
6 901 911 906 14
7 912 922 917 7
8 923 933 928 5
9 934 944 939 1
10 945 955 950 1
TOTAL 84
Es recomendable, calcular primero la frecuencia y después la marca de clase para

que esta columna no interfiera durante la clasificación de los datos.
DISTRIBUCIÓN DE FRECUENCIA:
Se denomina Distribución de Frecuencia, al resultado de la marca de clase, que

posteriormente será la variable X y la frecuencia que corresponde para cada valor de
la marca de clase.

Distribución de Frecuencia:
MARCA DE FRECUENCIA
CLASE (X)
DE CLASE
851 1
862 9
873 11
884 19
895 16
906 14
917 7
928 5
939 1
950 1
84
HISTOGRAMA
Con los datos de la distribución de frecuencias se procede a construir el histograma.
FRONTERA DE CLASE:

La FRONTERA DE CLASE , es un punto en la Clasificación de clases intercalado

entre las marcas de manera que no caiga en ninguna de las dos clases contiguas.
Esto se logra promediando el Límite Superior de una clase con el Límite Inferior de la
siguiente, y tomando un decimal más que la última cifra significativa, según los datos
que se estudian.
En nuestro ejemplo, la FRONTERA DE CLASE entre la 1º y 2º clase será: 856,5

Luego entre la 3º y 4º será : 878.5
La siguiente tabla resumen figuran todos los datos estudiados:
CLASES L. I. L. S. MARCA FRONTERAS FRECUENCIA

1 846 856 851 845.5 1
2 857 867 862 856.5 9
3 868 878 873 867.5 11
4 879 889 884 878.5 19
5 890 900 895 889.5 16
6 901 911 906 900.5 14
7 912 922 917 911.5 7
8 923 933 928 922.5 5
9 934 944 939 933.5 1
10 945 955 950 944.5 1
Total 84
Para terminar de interpretar los HISTOGRAMAS, el alumno puede imaginar que los
valores de las fronteras de clases, están exactamente en las líneas que separan
cada uno de los bloques del HISTOGRAMA.
2.2 Distribuciones de Frecuencias Acumuladas y Ojivas
La frecuencia total de todos los valores menores que la frontera de clase superior de
un intervalo de clase dado se llama FRECUENCIA ACUMULADA hasta ese intervalo
de clase inclusive.
Una tabla que presente tales frecuencias acumuladas se denomina una
DISTRIBUCIÓN ACUMULADA.

Un gráfico que represente las frecuencias acumuladas por debajo de cualquiera de

las fronteras de clase superiores respecto de dicha frontera se llama un POLÍGONO
DE FRECUENCIAS ACUMULADAS U OJIVA
A continuación, desarrollaremos un ejemplo, la altura de 100 estudiantes de una

universidad XYZ, este ejemplo fue tomado del libro “Estadística” de Murray R,
Spiegel y lo utilizaremos para varios desarrollos como el que sigue:
Altura en metros. Marca Frecuencias F. Acumulada F. relativa

1.51 - 1.59 1.55 5 5 5
1.60 - 1.68 1.64 18 23 18
1.69 - 1.77 1.73 42 65 42
1.78 - 1.86 1.82 27 92 27
1.87 - 1.95 1.91 8 100 8
Total 100 100
Nota: la frecuencia relativa coincide con las frecuencias, simplemente por n=100, si n
es cualquier otro valor, ambas columnas, no coincidirán.
Otros detalles son
Limite inferior Limite Superior Frontera Ancho de Clase

...... ...... 1.505
1.51 1.59 1.595 .09
1.60 1.68 1.685 .09
1.69 1.77 1.775 .09
1.78 1.86 1.865 .09
1.87 1.95 1.955 .09
El siguiente gráfico explica lo anterior:


Capítulo 2:
Para resolver estos problemas, el alumno deberá usar los métodos y criterios
vistos en clase, los cuales difieren de los usados en el libro.
Distribución de frecuencias: 2.2, 2.3, 2.6, 2.7, 2.20, 2.21, 2.23, 2.26, 2.27, 2.28,
2.29.

Capítulo 3
3 Promedios
La palabra PROMEDIO, es una palabra genérica, es decir, existen varios tipos de

PROMEDIOS.
Los PROMEDIOS que estudiaremos son : MEDIA, MEDIANA, MODA, MEDIA
GEOMÉTRICA Y MEDIA ARMÓNICA.
Los promedios tienen en común que buscan el valor central de los datos estudiados.
Por esta razón se los denomina: MEDIDORES DE LA TENDENCIA CENTRAL.
3.1 Media Aritmética
Para definir la Media Aritmética, primero describiremos algunos conceptos básicos:
NOTACIÓN DE ÍNDICES: Si tenemos un universo de N datos, Xj será cualquiera

de los N datos.
valores., esto es: X1, X 2 ,..., XN
N
NOTACIÓN DE SUMA: X
J 1
J  X1  X 2  ... XN
UNIVERSO o POBLACIÓN: Son todos los valores o datos que existen.

MUESTRA: Es un parte tomada al azar de la POBLACIÓN, y que son
representativos de la POBLACIÓN.
DEFINICIÓN DE LA MEDIA ARITMÉTICA: Es la suma de todos los valores de la
POBLACIÓN o de la MUESTRA, dividido por el numero total de los datos
considerados.
MEDIA ARITMÉTICA =
Muy frecuentemente, uno o varios datos de los registrados se repiten, es dicho caso
la fórmula anterior de interpreta de la siguiente manera:
Si los datos : X1 , X 2 ,..., XN se repiten con frecuencia f1 , f2 ,..., fk veces,
entonces la MEDIA ARITMÉTICA se define de la siguiente forma:
k
f . X  f . X  ... fk . Xk
fX
j 1
j j
X 1 1 2 2  k
f1  f2  ... fk
f
j1
j
El siguiente ejemplo aclarará el concepto:

Si los datos: 5, 8, 6, y 2 ocurren con frecuencias 3, 2, 4, y 1

3 * 5  2 * 8  4 * 6  1* 2
X  5.7
3 2 41
Con respecto a los índices utilizados en las fórmulas de las medias, el estudiante
habrá notado que en la primera fórmula, el subíndice utilizado, es N, esto es el total
de unidades consideradas y en el segundo caso, cuando hay repetición de algunos
datos, el subíndice utilizado es k.
En éste último caso k es el numero de datos distintos, sin repetición, de ésta manera,
la sumatoria de las frecuencias será igual a N
El siguiente ejemplo, aclara lo que hemos dicho:
Datos Frecuencia
3 2
4 1
5 3
8 5
9 3
Es decir, tenemos 2 datos 3, 1 dato 4, 3 datos 5, etc.
El total de datos es 3*2+4*1+5*3+8*5+9*3 = 92, N = 92 , pero los datos diferentes

entre si son solo 5, por ello es k = 5
3.2 Media Aritmética Ponderada: esta variante de la media aritmética, se usa

cuando se hace necesario dar distinto “peso” a cada dato. Esto significa, asociar con
los datos en estudio, con factores o “pesos” : W1, W2 ,..., WK
De esta forma, la MEDIA ARITMÉTICA PONDERADA es:
Un ejemplo típico de esto es la ponderación de las notas de los parciales y los

exámenes finales en INACAP. El reglamento indica que la nota final (PROMEDIO
PONDERADO), estará formado por el 7560% del promedio de notas de los parciales
y el 2540% de la nota final. Si un alumno tiene promedio 6.5 en los parciales y 4,9 en
el final la nota será:
MEDIA ARITMÉTICA PONDERADA =

Nótese que la MEDIA ARITMÉTICA (no ponderada) es 5,7
3.3 Propiedades de la Media Aritmética.
Propiedad Nº 1
La suma algebraica de las desviaciones de un conjunto de números respecto de su

media aritmética es cero.
Ejemplo:
Las desviaciones de los números: 8, 4, 3, 11, 7 y 6 respecto de su MEDIA

ARITMÉTICA cuyo valor es : 6.5 son:
Datos menos Media igual Desviación

Aritmética
8 - 6.5 = +1.5
4 - 6.5 = -2.5
3 - 6.5 = -3.5
11 - 6.5 = +4.5
7 - 6.5 = +0.5
6 - 6.5 = -0.5
total: +0.00
Probar genéricamente que la suma de las desviaciones de X1, X2, ... Xn respecto de
su MEDIA ARITMÉTICA es cero
Las desviaciones con respecto a la media se denotan de la siguiente manera:

d1  X1  X
d2  X2  X
... ... ... ...
dN  XN  X
Entonces:
n n
 dj 
j 1
 X
j 1
J 
X   X  X    X   X 
 X  NX   X  
N X
 X X  0
N

Con esto queda demostrada la propiedad.
Propiedad nº 2
La suma de los cuadrados de las desviaciones de un conjunto de números Xj

respecto de un cierto número a es mínima, si y solo si, a = Media Aritmética.
 (X
j1
j  a)2 minimo
si y solo si a= X
Esta propiedad la podemos comprobar usando los datos que se dieron en el ejemplo
de la propiedad nº 1
Si a es 6,5 o sea la media aritmética el resultado de la sumatoria de los cuadrados es

: 41.50
Si a fuera 6 el resultado de dicha suma es 43,00
Se sugiere al alumno calcular el resultado para a = 8
Esta propiedad es conceptualmente importante para futuros desarrollos.
Propiedad nº 3
Si n1 números tienen media m1, y n2 números tienen media m2, y ..., nk números
tienen media mk , entonces la media de todos los números es:
n1m1  n2m2  ... nkmk

X
n1  n2  ... nk
Veamos un ejemplo:
Los 90 empleados de la sucursal A de una Empresa ganan en promedio $ 230.000, y

los 75 empleados de la sucursal B ganan en promedio $ 325.000. ¿Cual es el
promedio de sueldos de las dos sucursales?
X
 nm  90 * 230.000  75 * 325000  273.182
n 90  75
Propiedad nº 4

Esta propiedad parte de la suposición de que empezamos los cálculos suponiendo o

estimando cual podría ser el valor de la MEDIA ARITMÉTICA, técnicamente esto
significa que estamos conjeturando la media.
La propiedad se enuncia de la siguiente manera:
Si A es una MEDIA SUPUESTA O CONJETURADA y si dj = xj - A son las

desviaciones de xj respecto de A, tenemos que:
Para datos sin repetición:
X A+
d
N
Para datos con repetición:
X A+
 fd
N
Donde: N = f
Esta última ecuación es importante y debemos insistir en el concepto de que el

número total de datos, N , es igual a la sumatoria de todas las frecuencias, f
El siguiente ejercicio demuestra y generaliza la propiedad º 4.
a) Para N datos sin repetición,
Si N números, X1, X2, ...,XN, tienen desviaciones respecto de un número A, dadas por:
d1 = X1 - A
d 2 = X2 - A
... ... ...
dN = XN - A
Probar que :
X A+
 fd
N
Solución:
Como dj = Xj - A
es X j = A + di
Multiplicando ambos miembros de la ecuación por el operador sumatoria y dividiendo

por N nos queda:

Nótese que el signo  se anula con N pues la sumatoria de A es N veces A.
b) Para el caso en que X1, X2, ...,XN tengan frecuencias f1, f2, ..., fN y
d1 = X1 - A
d2 = X2 - A
... ... ...
dk = Xk - A
Probar que:
Pues f = N
3.4 Cálculo de la media aritmética para datos agrupados
Para el cálculo de la media aritmética, utilizaremos tres tipos de fórmulas. Estas se

denominan fórmulas larga, corta y de compilación respectivamente.
La fórmula larga es la aplicación de la definición de la MEDIA ARITMÉTICA es decir

la fórmula “madre”:
X
 fX
N
La fórmula corta es la aplicación del método de la MEDIA CONJETURADA, es

decir, donde desde el principio del cálculo, conjeturamos el valor de la MEDIA
ARITMÉTICA como un valor A y determinamos el valor de las diferencias entre dicho
valor A y cada una de las X,

X A+
 fd
N
El método por compilación requiere una transformación de la última fórmula.

Si todos los intervalos de clase tienen idéntico ancho de clase c, las desviaciones
pueden expresarse como:
dj = c * uj
donde, uj pueden ser 0, 1, 2, etc. y la fórmula de la media aritmética se convierte
en:
  fu 
X  A + c  
 N 
llamada Fórmula del Método de Compilación para calcular la Media Aritmética.
3.5 Ejercicio de aplicación
El siguiente ejercicio, basado en la distribución de frecuencias vista en el capítulo nº

2, se utilizará las tres fórmulas vistas en los párrafos anteriores.
Recordemos la distribución, se trata de la altura de 100 estudiantes y el diagrama de
frecuencias es el siguiente:
Altura = X frecuencia
1.55 05
1.64 18
1.73 42
1.82 27
1.91 08
f=N=100
Desarrollo fórmula nª 1, Método Largo
Altura = X frecuencia fX
1.55 05 07.55
1.64 18 29.52
1.73 42 72.66
1.82 27 49.14
1.91 08 15.28
f=N=100 fX=174.35

Desarrollo fórmula nº 2, Método Corto
Debemos partir haciendo una conjetura de cual puede ser la media del conjunto de
datos, observando la distribución es fácil concluir que la media aritmética se
encontrará cerca de 1,73 metros.
De ésta forma diremos que A es igual a 1,73.
Altura = X frecuencia = f desviación d=X-A fd

1.55 05 -0.18 -0.90
1.64 18 -0.09 -1.62
A: ===> 1.73 42 +0.00 +0.00
1.82 27 +0.09 +2.43
1.91 08 +0.18 +1.44
f=N=100 fd=+1.35
X A
 fd  1.73  1.35  1.74
N 100
Desarrollo fórmula nº 3, Método de Compilación.
En éste cálculo deberemos aplicar el concepto: d = cu, siendo u una variable que
puede ser: 0, ±1, ±2, ±3, etc.
Seguimos conjeturando que A = 1.73, pero ahora, vamos a observar que en la

columna d del calculo anterior, los números -0.18, -0.09, 0.00, 0.09, y 0.18, tienen
como factor común el número 0.09. Por lo tanto, si sacamos este factor común, los
números de la columna quedarán reducidos a los valores: -2, -1, 0, 1, 2 de tal forma
el esquema de cálculo es el siguiente: (en este razonamiento se volverá a insistir,
cuando se estudie la desviación típica)
X f u fu
1.55 5 -2 -10
1.64 18 -1 -18
1.73 42 +0 +00
1.82 27 +1 +27
1.91 8 +2 +16
f=100 fu=15
  fu   15 
X  A    c  1.73    0.09  1.74
 N   100 
Finalmente destaquemos los siguientes aspectos importantes:
1º La MEDIA CONJETURADA puede ser cualquier X dentro de los datos en estudio,

pero cuanto mas cercano esté al verdadero valor, menores serán los cálculos por
realizar. Por la forma de la distribución es fácil conjeturar donde se encontrará la

MEDIA ARITMÉTICA. El procedimiento aconsejado es conjeturar la marca de clase

que presente la mayor frecuencia de datos.
2º Cualquier X que sea elegido, el resultado final será siempre el mismo.
3.6 La Mediana
La MEDIANA de un conjunto de datos ordenados en magnitud, es, o el valor central,

o la media de los dos valores centrales.
Ejemplo: 5, 6, 8, 9, 11, 15, 17
La MEDIANA es el número 9, pues antes que él, hay 3 números y después de él hay
otros 3.
5, 6, 8, 9, 11, 15, 17, 19
Ahora la MEDIANA es la media aritmética entre el número 9 y el 11, o sea 10.

El símbolo que representa a la MEDIANA es el siguiente: X ~
Geométricamente, la MEDIANA, es el valor de X, que corresponde a la recta que

divide un HISTOGRAMA en dos partes de igual área.
El siguiente ejemplo sirve para destacar ciertas cualidades de la MEDIANA frente a la
MEDIA ARITMÉTICA.
Cinco empleados de una Empresa, ganan $4.52, $5.96, $5.28, $11.2, y $5.75 la
hora.
Hallar la MEDIANA, y la MEDIA ARITMÉTICA.
Lo primero que debemos hacer es ordenar los datos: 4.52, 5.28, 5.75, 5.96, 11.20
Por lo tanto, la MEDIANA es: 5.75
La MEDIA ARITMÉTICA es 6.54
Como puede apreciarse, la MEDIANA, no está afectada por el valor extremo 11.20,
tal como lo está la MEDIA ARITMÉTICA. El valor 6.54 esta fuertemente sesgado
(corrido) hacia la derecha por causa de un valor que no parece ser del grupo al cual
corresponden los otros cuatro datos. Esta cualidad hace que la MEDIANA sea muy
útil para el estudio de sueldos
Ejercicio:
En la tabla que sigue, se estudian los pesos de 40 unidades de un producto X, con la
precisión de 1 gramo. Construir la tabla de frecuencias, hallar la media aritmética, y
calcular la mediana por interpolación y por cálculo directo
138, 146, 168, 146, 161, 164, 158, 126, 173, 145, 150, 140, 138, 142, 135, 132, 147,
176, 147, 142, 144, 136, 163, 135, 150, 125, 148, 119, 153, 156, 149, 152, 154, 140,
145, 157, 144, 165, 135, 128

Los pesos máximo y mínimo son: 176 y 119, el intervalo o rango es 57. Elegiremos
un ancho impar = 7. El diagrama de frecuencias resultante es:
Clases Marca de Distribución de frecuencias u fu

clase marcas
118-124 121 / 1 -4 - 4
125-131 128 /// 3 -3 - 9
132-138 135 ///// // 7 -2 -14
139-145 142 ///// /// 8 -1 - 8
146-152 149 ///// //// 9 0 0
153-159 156 ///// 5 1 5
160-166 163 //// 4 2 8
167-173 170 // 2 3 6
174-180 177 / 1 4 4
f=40 fu=-12
  fu   12 
X  A    c  149    7  147
 f   40 
X  147
Calculo de la MEDIANA por el método de la interpolación.
f ___
118-124 121 / 1  Por lo tanto, para “llegar” al dato 20,
que sería el
125-131 128 /// 3 de la MEDIANA, necesitamos 1, que lo toma-
132-138 135 ///// // 7 19 datos remos de la clase 149
139-145 142 ///// /// 8 __
146-152 149 ///// //// 9 _ _
153-159 156 ///// 5  El cálculo interpolando, será por regla
de tres
160-166 163 //// 4 12 datos
167-173 170 // 2 Si 9 datos, producen un salto de 7 en la
escala
174-180 177 / 1 _ _ de las X, 1 producirá,
proporcionalmente 0.8
Para hallar la MEDIANA sumaremos este valor hallado, 0,8 a la frontera de la clase
correspondiente, en éste caso, 145.5,
145.5 + 0.8 = 146.3

El resultado del cálculo de la MEDIANA por interpolación es 146.3
Por último, podríamos darnos la tarea de ordenar todos los datos, y encontrar el
valor 20 y 21 y hallar la media:
119, 125, 126, 128, 132, 135, .................., 145, 145, 146, 146, 147...........
1. 2, 3, 4, 5, 6, ................., 18, 19, 20, 21, 22..........
De acuerdo a la definición, la MEDIANA es la media entre los valores 20 y 21, esto

es: 146
3.7 La Moda
Otro de los medidores de la tendencia central es la MODA.
La MODA el valor que más se repite, es decir el de mayor frecuencia. La MODA

puede no existir, e incluso, puede no ser única.

El símbolo de la moda es: X
3.8 Relación empírica entre la Media Aritmética, la Mediana y la Moda.
Para curvas de frecuencias unimodales y que sean poco asimétricas, tenemos la

siguiente relación empírica:
MEDIA - MODA = 3 ( MEDIA -MEDIANA)
3.9 Media Geométrica.
La media geométrica G de un conjunto de números positivos, X1 , X2 , ..... , XN es la

raíz enésima del producto de todos esos números:
G N X1 . X 2 . ... . XN
Ejercicio 1 : La media geométrica de 2, 4, y 8 es:
G  3 2.4.8  3 64  4
Ejercicio 2 : Hallar a) la media geométrica y b) la media aritmética de los números

3, 5, 6, 6, 7, 10 y 12
Esto ilustra el hecho que la media geométrica de un conjunto de números positivos

en menor que la media aritmética
Ejercicio 3 : Los números X1,X2, ... XK ocurren con frecuencia f1, f2 ... fk
3.10 Media armónica.
La MEDIA ARMÓNICA H, de un conjunto de números X1,X2, ... XN es el recíproco de

la media aritmética de los recíprocos de esos números.
En la práctica es más fácil recordar que :

Ejemplo: Una persona viaja de A a B con una velocidad media de 40 km. por hora y
regresa a 100 Km. por hora. La distancia entre A Y B es de 400 Km.
Entonces:
Tiempo para ir de A a B =
Tiempo para ir de B a A =
Tiempo total : 14 hs.
Recorrido total = 800 Km.
Velocidad promedio:
Este promedio es la media armónica de 40 y 100
Nótese que podríamos haber estado tentados a tomar la media aritmética de 40 y

100 = 70 km./h, lo cual es incorrecto.
Relación entre las medias aritmética, geométrica y armónica
H  G 
Mediante la utilización de urnas con datos de una población normal, se deberá
elaborar en clase el siguiente trabajo:
a) Extracción de 40 datos con participación de todos los alumnos.

b) Elaboración de la distribución de frecuencias.
c) Histograma.
d) Cálculo de la media aritmética.
e) Cálculo de la moda.
f) Cálculo de la mediana por interpolación.


Capítulo 3
Media Aritmética: 3.6, 3.7, 3.8, 3.9, 3.10, 3.11, 3.19, 3.23, 3.24, 3.55, 3.59, 3.60,
3.61.
Mediana: 3.28, 3.29.
Moda: 3.31

Capitulo 4
4 Medidas de la dispersión de una distribución de datos.
4.1 Dispersión o Variación.
La dispersión o variación de los datos intenta dar una idea de cuán repartidos se
encuentran éstos.
Hay varias medidas de tal dispersión, siendo las más comunes el RANGO o
INTERVALO y la DESVIACION TIPICA.
Existen otros estimadores, pero están fuera del propósito de éste curso.
4.2 Rango o Intervalo
Es la diferencia entre el valor mayor y el valor menor de todos ellos.
Ejercicio:
Hallar el RANGO de los conjuntos :
Grupo 1: 12, 6, 7, 3, 15, 10, 18, 5 Grupo 2: 9, 3, 8, 8, 9, 8, 9, 18
Solución:
En primer lugar tendremos que ordenar los datos:
Grupo 1 : 3, 5, 6, 7, 10, 12, 15, 18 Grupo 2 : 3, 8, 8, 8, 9, 9, 9, 18
En ambos casos vemos que el resultado es 15, y observamos que el RANGO no

tiene la capacidad de informarnos sobre lo que sucede dentro del grupo, pues una
rápida inspección nos deja ver que el grupo 1 es mucho más disperso que el grupo 2.
Esto es una limitación a tener en cuenta en los estudios, sin embargo, el RANGO
es el medidor de dispersión más utilizado por la facilidad de cálculo.
En nuestro ejemplo, se puede mejorar la información, si decidimos eliminar, en
ambos grupos, los valores extremos, así, el RANGO sería 10 para el grupo 1 y 1 para
el grupo 2.
Como conclusión, podremos decir, que cuando hay valores muy extremos, el rango
es una pobre medida de la dispersión.
4.3 La Desviación Típica
La DESVIACIÓON TÍIPICA es el medidor de la dispersión máas importante.

DEFINICIÓON: La DESVIACIÓON TÍIPICA de un conjunto de N números: X1,
X2, ...XN se denota por  y se define por:

Si X1, X2, ...,Xk se repiten con frecuencias f1, f2, ..., fk, la desviación típica se expresa
como:
pues f=N
Sobre el tamaño de N:
Hay un aspecto importante con respecto al tamaño de N. Si N es 30 o menor a 30, el
cociente en la fórmula, deberá ser N – 1. La demostración de esta conveniencia no
entra en los alcances de este curso, pero debe considerarse que la respuesta es
mejor cuando se divide por N – 1. Esta consideración es extensiva a todos los
desarrollos de fórmulas que veremos a continuación.
Ahora es necesario analizar un aspecto de las denominaciones. Existe en la
bibliografía diversos criterios para la denominación de la desviación típica y de la
media aritmética.
Población y Muestra, Estadísticos y Parámetros.
El alumno tiene que tener muy claro a esta altura del desarrollo de la materia, los
conceptos de UNIVERSO O POBLACION y de MUESTRA.
El UNIVERSO O POBLACION son todos los individuos que lo componen, por
ejemplo, todos los estudiantes del país del INACAP o la producción de clavos de todo
un día.
MUESTRA es una cantidad estadísticamente seleccionada y tomada al azar que
representa al UNIVERSO O POBLACION.
A partir de ahora nosotros llamaremos al total de datos POBLACION.

Las diferentes denominaciones que utilizaremos son las siguientes, el alumno
deberá estar atento a los cambios de la denominación , según lo que se esté
tratando. En general, la letras griegas corresponde a la población, y las letras
latinas a las muestras, usando siempre, las letras griegas para los desarrollos
de fórmulas.
La MEDIA ARITMETICA de la POBLACION La DESVIACION TIPICA de la POBLACION

se denomina con el signo griego:  se denomina con el signo griego:


La MEDIA ARITMETICA de la MUESTRA se La DESVIACION TIPICA de la MUESTRA se
denomina con el signo: X denomina con el signo: S
La CANTIDAD DE DATOS DEL UNIVERSO La CANTIDAD DE DATOS DE LA MUESTRA
se denomina con la letra: se denomina con la letra: n
N
Por otra parte, llamaremos Estadísticos a los medidores de la muestra, es decir a la

Media Aritmética y la Desviación Típica de la Muestra: X y S, y llamaremos
Parámetros a los medidores que describen la Población entera:  y 
Ejercicios de comprensión:
Hallar la S para los siguientes conjuntos de números:
a) 3, 5, 6, 7, 10, 12, 15, 18 b) 3, 8, 8, 8, 9, 9, 9, 18
a) X
X  76
 9.5 b) X
72
9
N 8 8
a) b)
Como se puede apreciar, la DESVIACION TIPICA da un valor significativamente

inferior para b) respecto de a), lo cual indica que los datos están menos dispersos en
este último grupo, cosa que pudimos apreciar observando directamente los datos.
Por esta razón la DESVIACION TIPICA es un excelente medidor de la dispersión de
los valores alrededor del dato central, usualmente, la MEDIA ARITMETICA.
Nótese que por ser una muestra de 8 unidades se ha utilizado para denominar la
desviación típica la letra S en lugar de .
Ejercicio:
Hallar la DESVIACION TIPICA de las alturas de los 100 estudiantes.

La MEDIA ARITMETICA calculada en el capítulo anterior fue de 1.74 mts.
La siguiente tabla contiene la información para hacer los cálculos:

X F (X-1.74) (X-1.74)2 f(X-1.74)2

1.55 05 -0.19 0.04 0.18
1.64 18 -0.10 0.01 0.18
1.73 42 -0.01 0.00 0.00
1.82 27 +0.08 0.01 0.17
1.91 8 +0.17 0.03 0.23
f=100 f(X-X)2=0.77
4.4 Desarrollo de tres fórmulas para el cálculo de la Desviación Típica
Las fórmulas vistas en la definición no son prácticas para el cálculo, por lo cual
haremos ciertas transformaciones, con la finalidad de que los cálculos sean
minimizados.
Desarrollo fórmula 1, Método Largo
El primer desarrollo es simplemente otra forma de escribir la misma fórmula de la

definición:

Aplicaremos ésta fórmula a nuestro ejercicio de comparación de métodos:
Marca de f X2 fX2
clase
1.55 05 2.40 12.01
1.64 18 2.69 48.41
1.73 42 2.99 125.7
1.86 27 3.31 89.43
1.95 08 3.65 29.18
f=100 fX2=304.75
304.75
S  1.7435 2  0.09
100
Desarrollo Fórmula 2, Método Corto.
Volvemos a utilizar los mismos conceptos desarrollados para el mismo cálculo en la

MEDIA ARITMÉTICA.
Siendo A la media conjeturada y d la desviación de Xj respecto de A, será:
d=X-A por lo tanto X = A+d
Este resultado se reemplaza en la fórmula:

Ahora bien, con ésta segunda fórmula podemos hacer el mismo desarrollo que
hicimos con la primera y el resultado será el mismo, por lo tanto la fórmula 2 es
Apliquemos ahora esta fórmula al ejercicio de las alturas de los alumnos:
X f d=X-A fd fd2
1.55 05 -0.18 -0.90 0.16
1.64 18 -0.09 -1.62 0.15
1.73 ==> A 42 +0.00 +0.00 0.00
1.82 27 +0.09 +2.43 0.22
1.91 08 +0.18 +1.44 0.26
f=100 fd = 1.35 fd2 = 0.79
Desarrollo Fórmula 3, Método de Compilación:
En el cuadro de desarrollo de la fórmula 2, podemos observar en la columna del

medio, que la columna de 5 números tienen un factor común que es 0.09 pues:
-0.18 = -2 * 0.09, -0.9 = -1 * 0.09, +0.00 = 0.0 * 0.09, +0.09 = +1 * 0.09,

+0.18 =+2 * 0.09
Este valor 0.09 es precisamente el ancho de clase = c por lo tanto la variable d la

podemos reemplazar por otra variable llamada u :

d=c*u
Esta variable u toma los valores : ...-2, -1, 0, +1 , +2, ... etc.
Si reemplazamos d en las fórmulas anteriores
Por lo tanto la fórmula final será:
Esta última fórmula es la llamada FÓRMULA DE COMPILACIÓN
Aplicaremos esta fórmula al ejercicio de las alturas de los estudiantes:
X f u fu fu2
1.55 05 -2 -10.00 20.00
1.64 18 -1 -18.00 18.00
1.73 42 +0 +00.00 00.00
1.82 27 +1 +27.00 27.00
1.91 08 +2 +16.00 32.00
f = 100 fu = 15 fu2 = 97
Apliquemos estos resultados a la fórmula 3:

4.5 Propiedades de la Desviación Típica
Propiedad nº 1
La desviación típica puede generalizarse como:
Donde a es un promedio distinto de la MEDIA ARITMÉTICA. De tales desviaciones

típicas, la mínima es aquella donde a = MEDIA ARITMÉTICA
Propiedad nº 2
Es la más importante de las propiedades de la desviación típica.
Para distribuciones normales, es decir, perfectamente simétricas, resulta que entre

los extremos de la distribución:
MEDIA ARITMÉTICA  1  = CONTIENE EL 68.27 % DEL AREA BAJO LA

CURVA NORMAL.

CURVA NORMAL.

CURVA NORMAL.
Geométricamente, en una distribución normal, la distancia entre el punto de

inflexión de la curva, y la perpendicular al eje de las absisas, en el valor
correspondiente a la Media Aritmética, es la DESVIACIÓN TÍPICA de dicha
población.
Mas adelante, cuando se estudie la distribución gaussiana se insistirá en este

concepto.

4.6 Varianza
La VARIANZA es otro medidor de la dispersión ligado, en este caso, a la Desviación

Típica.
La VARIANZA es el cuadrado de la DESVIACIÓN TÍPICA
Este medidor de la dispersión es muy importante y se utiliza para ciertos Analisis de

Varianza que pertenecen al campo de la Estadística Aplicada.
4.7 La Desviación Media
La Desviación Media o desviación promedio, de un conjunto de números X1,

X2, ...,Xk es abreviada por MD y se define como :
Desviación Media:
Ejemplo:
Hallar la Desviación Media del conjunto :
2, 3, 6, 8,11
Media Aritmética: 6
2  6  3  6  6  6  8  6  11  6
DM   2.8
5
Si X1, X2, ...,Xk se repiten con frecuencia f1, f2, ..., fk,
Entonces la DM, se puede escribir como:
f X
j 1
j j X
fX X
DM    X X
N N
k
Donde: f  f  N
j1
Ejercicio:

Hallar la DM del conjunto a) 3, 5, 6, 7, 10, 12, 15, 18.
b) 3, 8, 8, 8, 9, 9, 9, 18.
Solución:
a) La media aritmética es 9.5
DM 
 X X 
34
 4.25
N 8
b) La media aritmética es 9.0
DM 
 X X 
18
 2.25
N 8
La DM indica que b) tiene menor dispersión que a)
Ejercicio:
Hallar la DM de las alturas de los 100 estudiantes de la Universidad XYZ.
La Media Aritmética ya calculada era 1.74
Altura = X frecuencia X-1.74 fX-1.74

1.55 5 0.19 0.95
1.64 18 0.10 1.80
1.73 42 0.01 0.42
1.82 27 0.08 2.16
1.91 8 0.17 1.36
f=N=100 =6.69
DM 
fX X 
6.69
 0.07
N 100
Recordemos que el valor de la Desviación Típica fue 0.09

Como ejercicio adicional determinaremos el porcentaje de estudiantes que miden

entre:
a) Media aritmética  1DM
b) Media aritmética  2DM
c) Media aritmética  3DM
Solución: en primer lugar recordemos del Capítulo 2:
Limite inferior Limite Superior Frontera Marca de clase

1.51 1.59 1.595 1.55
1.60 1.68 1.685 1.64
1.69 1.77 1.775 1.73
1.78 1.86 1.865 1.82
1.87 1.95 1.955 1.91
Ancho de clase : 0.09
50 42
1.67 1.81
40
Frecuencias
27
30
18
20
8
10 5
0
1,55 1,64 1,73 1,82 1,91
1,685 1,775
a) 1.74+ 0.07 = 1.81 y 1.74 - 0.07 = 1.67
Es decir nos interesa saber cuantos alumnos se encuentran dentro del intervalo de
1.67 a 1.81 mts.
Este intervalo incluye a todos los integrantes de la tercera clase, los 42, más,
(1.67- 1.685) / 0.09 de los de la segunda, más,
(1.81- 1.775) / 0.09 de los de la segunda, más,
O sea, el número de estudiantes, en el intervalo: Media aritmética  1DM, es :

42 + (0.015/0.09)x18 + (0.035/0.09)x 27= 42 + 3 + 10.5 = 55.5
Es decir que entre más 1DM y menos 1DM se encuentran el 55.5 % de los
estudiantes.
Con el mismo criterio se procederá con el resto de los intervalos:
b) Media aritmética  2DM = 1.74  2 x 0.07
Esto es de 1.60 a 1.88, los cálculos serán ahora, los siguientes.
42 y 27 entran todos, más
(1.685-1.60) / 0.09 de la segunda, más
(1.88 - 1.865) / 0.09 de la quinta clase, o sea:
42 + 27 + (0.015/0.09)x18 + (0.035/0.09)x 8= 42 + 27 + 17 + 1.3 = 87.3
estudiantes.
b) Media aritmética  3DM = 1.74  3 x 0.07
Esto es de 1.53 a 1.95, los cálculos serán ahora, los siguientes.
(1.595-1.53) / 0.09 de la segunda, más
(1.95 - 1.865) / 0.09 de la quinta clase, osea:
42 + 27 + 18 + (0.0722/0.09)x 5 + (0.085/0.09)x 8= 42 + 27 + 18 + 4 + 7.6 = 98.6
estudiantes.
Utilizando la distribución de frecuencias del ejercicio de clase que se realizó para el

capítulo 3, se deberá calcular:
a) el Rango o Intervalo.
b) La Desviación Típica.
c) La Varianza.
d) La Desviación Media.


Desviación Típica: 4.18, 4.19, 4.40, 4.41.

Capítulo 5
5 CUANTILOS
5.1 DEFINICIÓN:
Los cuantilos son una familia de Estimadores Estadísticos que se utilizan

indistintamente tanto para estimar la tendencia central de una distribución como para
calcular valores que nos informe acerca de la dispersión que estos presentan y poder
compararlos entre distribuciones.
Si bien por la importancia de la MEDIANA se la toma fuera de la familia de los

cuantilos, en rigor ésta es el primer cuantilo. Es decir, es el valor que, habiendo
ordenado la serie de datos, se encuentra exactamente en el medio de la fila.
Con el mismo criterio podremos encontrar los valores que dividen serie en 4 partes
iguales, es decir, si tenemos una serie de 100 datos, ordenados de menor a mayor,
los datos números 25, 50 y 75 dividen la lista en 4 partes iguales.
Por ésta razón, estos cuantilos se denominan : CUARTILOS
Si la serie no fuera de 100 datos, fuera por ejemplo de 180, los datos buscados
serian el 45, el 90 y el 135. Es decir aquel valor que separe el 25%, el 50% y el 75%.
Con el mismo criterio, existen los DECILES, que dividen la serie en 10 partes y los
PERCENTILES, que dividen la serie en 100 partes iguales.
Los QUARTILOS son tres, Q1, Q2 Y Q3
Los DECILES son 9, D1, D2, ... , D9
Los PERCENTILES son 99, P1, P2, ..., P99.
Nótese que la MEDIANA es igual a Q2 = D5 = P50
5.2 MEDIDORES DE LA TENDENCIA CENTRAL
Una buena propiedad de los cuantiles es que no están afectados por los valores
extremos o de borde, los cuales a veces reflejan anomalías o valores que se apartan
de la distribución por causas específicas. Los cuantilos utilizan valores que están
adentro de la distribución y por lo tanto son valores normales.
Para medir la tendencia central comenzamos por definir los estimadores del
PROMEDIO o valor central de la distribución:
PROMEDIO CUARTÍLICO = (Q3 + Q1)/2

PROMEDIO PERCENTÍLICO, 10 - 90 = (P90+P10)/2
Nótese con mucha atención que estos valores, no tienen por que coincidir con la
MEDIANA = Q2 = D5 = P50, esto sucede, únicamente si la distribución es simétrica
, solo así, coincidirán todos los estimadores de la tendencia central. Más adelante, al
estudiar las distribuciones Gaussianas comprenderemos mejor éste asunto. En
general, las distribuciones reales, no son perfectas, por lo tanto, cada uno de los
estimadores, darán valores parecidos pero no iguales. El estudioso estadístico,
determina, cual de los valores se ajusta mejor a los fines que persigue.

5.3 MEDIDORES DE LA DISPERSIÓN
Como puede comprenderse, por la cantidad de valores que podríamos seleccionar,

sería posible determinar una gran lista de posibles estimadores, los cuatro que se
mencionan a continuación son los más comunes.
INTERVALO CUARTÍLICO: Q3 - Q1
INTERVALO PERCENTIL 10,90 : C90 - C10
INTERVALO SEMI INTERCUARTÍLICO : (Q3 - Q1)/2
INTERVALO SEMI PERCENTÍL 10,90 : (C90 - C10)/2
En el siguiente ejemplo, se ilustra la utilización de los distintos estimadores.
Los siguientes datos, 99 en total están ordenados de menor a mayor :
# dato # dato # dato # dato # dato

1 18 21 33 41 42 61 70 81 100
2 19 22 33 42 43 62 70 82 102
3 19 23 34 43 44 63 71 83 105
4 21 24 35 44 45 64 73 84 105
5 21 25 35 45 46 65 73 85 106
6 21 26 35 46 49 66 74 86 108
7 23 27 35 47 50 67 75 87 110
8 24 28 35 48 55 68 75 88 111
9 25 29 35 49 55 69 76 89 112
10 26 30 36 50 56 70 78 90 113
11 26 31 36 51 57 71 80 91 115
12 29 32 38 52 59 72 83 92 118
13 30 33 38 53 60 73 83 93 119
14 31 34 39 54 60 74 86 94 120
15 31 35 39 55 60 75 89 95 122
16 32 36 39 56 65 76 92 96 122
17 32 37 39 57 65 77 92 97 123
18 33 38 40 58 67 78 93 98 124
19 33 39 40 59 67 79 95 99 125
20 33 40 41 60 68 80 99
En esta tabla, que representa una población de 99 datos, identificaremos primero,

cada uno de los valores a ser usados en los cálculos:
CUARTILOS: Q1 = 35, Q2 = 56, Q3 = 89
MEDIANA = Q2 = D5 = P50 = 56
PERCENTIL 10 = 26, PERCENTIL 90 = 113
Nótese que el estudio se realizó sobre 99 datos y no sobre 100, pues con 99 se logra
la simetría perfecta para cada uno de los cuantilos. Por ejemplo, la Mediana tiene 49

datos a cada lado del dato 50, Q1 tiene 24 datos anteriores, y Q3 24 datos
posteriores, etc.
5.4 PROCEDIMIENTOS DE CÁLCULO
Estimación de los valores centrales:
MEDIA ARITMÉTICA : X/99: 62

MEDIANA: 56
PROMEDIO CUARTÍLICO: (Q3+Q1)/2: (89+35)/2: 62
PROMEDIO PERCENTÍLICO 90,10: (P90+P10)/2 : (113+26)/2: 69.5
Estimación de la dispersión de los valores:
DESVIACIÓN TÍPICA: (a partir de la fla. gral. con calculadora): 32.3

INTERVALO SEMI INTERCUARTÍLICO: (Q3-Q1)/2: (89-35)/2: 27.0
INTERVALO PERCENTÍLICO 90,10: (P90-P10)/2: (113-26)/2: 43.5
Como puede observarse, los resultados son bien diferentes, esto se debe a varios
factores, en primer lugar, la distribución de los datos seleccionados, no son simétricos
ni se parecen a una distribución Normal o Gaussiana. Si bien aún no hemos
estudiado el tema de la distribución NORMAL o Gaussiana, el alumno ya puede
formarse una idea de que esta importante distribución es de forma de campana, y
tiende a ser simétrica.
La distribución que hemos utilizado no lo es, y eso asegura que los distintos
estimadores estadísticos difieran entre si. La pregunta es entonces: ¿para que
sirven? La respuesta es: para comparar, es decir, podemos comparar sucesivas
distribuciones entre sí, y ver si se dispersan más o menos que la anterior y si los
valores centrales se acercan a lo que se especifica. ¿Cual usar?, el que a criterio del
analista responda mejor a los objetivos que se buscan. Lo importante es que una vez
determinado cual será el estadístico a utilizar, seamos coherentes y utilicemos para
comparar siempre el mismo estadístico.
5.5 Procedimiento de cálculo para datos agrupados.
Cuando la cantidad de datos es grande, y estos se encuentran agrupados en

CLASES, el cálculo de los distintos estimadores debe realizarse por el método de la
interpolación. Para estudiarlo volveremos a nuestro ejemplo de las alturas de los 100
estudiantes.
La tabla de distribución es la siguiente:

Fronteras de Límites de Marca de frecuencia Ojiva

clases clases clase de clases
clase nº 1 1.505 1.51-1.59 1.55 5 05
clase nº 2 1.595 1.60-1.68 1.64 18 23
clase nº 3 1.685 1.69-1.77 1.73 42 65
clase nº 4 1.775 1.78-1.86 1.82 27 92
clase nº 5 1.865 1.87-1.95 1.91 8 100
f=100
Supongamos que nos interesa buscar el valor de Q1, esto es el valor 25
De acuerdo con la ojiva, el valor 25 se encuentra en la clase nº 3, en esta clase hay

42 datos, pero solo necesitamos 2 para llegar a 25. El razonamiento por interpolación
es el siguiente:
42 valores que están en la clase nº 3, producen un cambio en el ordenamiento de

dimensión 0.09, es decir el ancho de clase., proporcionalmente, 2, que son los que
necesito, produciran,:0.004
Este valor es la alícuota que debe sumarse, ¿a quién? a la frontera de clase: 1.685,
por lo cual el valor buscado es 1,689, y aproximando, 1,69.
Resultado, Q1 = 1,69
De igual forma., podemos calcular Q3 y con ambos saber cuanto es el intervalo y el

promedio INTERCUARTÍLICO.
Por último y para dejar el tema completo, calcularemos otro dato, en éste caso, el
valor del percentilo 90, es decir P90.
De acuerdo a la ojiva, el valor 90, está en la clase 4, el razonamiento, igual al

anterior será:
27 datos producen un incremento en las X de 0.09, por lo tanto, 25 serán :

(25*0.09)/27=0.083
Este valor lo sumamos a la frontera de clase 1.775, con lo cual obtenemos : 1.858 y
aproximando a los valores significativos da 1.86
Resultado P90 = 1.86
Se sugiere al alumno, calcular P10 y con ambos valores calcular el intervalo semi
percentílico y el promedio correspondiente.
5.6 Obtención de los valores correspondientes cuando el numero de datos es

distinto de 100:
Por razones pedagógicas, se ha utilizado una distribución de 100 datos para hacer
estos cálculos, pero el alumno debe saber encontrar cualquier dato en una
distribución dada. Daremos dos ejemplos:

Ejemplo uno:
Distribución de 80 datos, el valor de Q1 será el dato 20, es decir, 80 * 0.25

el valor de P90 será el 72, es decir 80 * 0.90
Ejemplo dos
Distribución de 120 datos, Q1 será el valor 30, (120 * 0.25)

el valor de P90, será el 108, ( 120 * 0.90)
5.7 Ejercicios en clase:
Utilizando la distribución de frecuencias determinada en clase para el cálculo de la

media aritmética y la desviación típica (Capítulos 3 y 4), el alumno deberá calcular la
mediana, los tres cuartilos, el promedio y el intervalo semiintercuartílico.
Posteriormente se deberá realizar una tabla donde se ingresen todos los medidores
de tendencia central y de dispersión para compararlos y discutir sobre ellos.

Capítulos 3 y 4:
Cuantílos: 3.44, 3.107, 3.108, 4.6, 4.7, 4.8, 4.48, 4.52.

Capítulo 6
6 Teoría elemental de Probabilidades
6.1 Definición de Probabilidad
6.1.1 Definición Clásica:
Supongamos que un suceso tiene h posibilidades de ocurrir entre n posibilidades,

cada una de las cuales tiene la misma oportunidad de ocurrir que las demás.
Entonces, la probabilidad de que ocurra E (éxito), se describe como:
h
p  PrE 
n
La probabilidad de que no ocurra E, es decir, la probabilidad de Fracaso, se escribe

como:
n h h
q  PrnoE   1   1  p  1  PrE pues p + q = 1
n n
6.1.2 Definición como frecuencia relativa:
La definición clásica de probabilidad tiene el cuestionamiento de que la palabra

“misma oportunidad” aparecen como sinónimas de “equiprobables” lo cual produce un
círculo vicioso.
Por esta razón, algunos autores defienden una definición estadística de probabilidad.
Para ellos, la probabilidad estimada o probabilidad empírica, de un suceso, se

define como la frecuencia relativa de ocurrencia del suceso cuando el número de
observaciones es muy grande. La probabilidad misma es el límite de esa frecuencia
relativa cuando el número de observaciones crece indefinidamente.
El siguiente ejemplo servirá para aclarar el concepto:
Si en una serie de 1000 tiradas de una moneda salen 529 caras, la frecuencia
relativa es de 529/1000 = 0,529.
Si en otras 1000 veces, salen 493, la frecuencia relativa acumulada será:
(529+493)/2000=0.511.
Si continuamos indefinidamente con éste método, el límite será 0,50000.....
6.2 Concepto de Probabilidad.
El siguiente gráfico ilustra progresivamente, el concepto de la probabilidad, desde un

suceso con imposibilidad absoluta hasta un suceso con certeza absoluta.

Certeza absoluta
100% 100% Que un hombre muera algún día

95%
90%
85% 83.3% Que salga “no cuatro” al arrojar un dado normal. (5 en 6)
80%
75%
70% 70% No figura en cartas españolas (28 en 40)
65%
60%
55%
50% 50% Cara al arrojar una moneda ( 1 en 2)
45%
40%
35%
30% 32.4% Primera docena en la ruleta (12 en 37)
25%
20%
15%
10%
05% 7.7% K en un mazo de pocker (4 en 52)
00% 0.0% que salga un 7 al arrojar un dado normal.
Imposibilidad absoluta
Como podemos ver, las probabilidades resultan del cociente:
Casos favorables
P
Total de casos
El suceso buscado, puede ser de afirmación o de negación, (“que no salga figura”).

La probabilidad se puede expresar como fracción decimal o porcentual:
De la definición de probabilidad se deduce que :
0  P  1
ó 0  P  100

El alumno, tiene necesariamente que comprender en éste punto, que la expresión de

las probabilidades, no puede ser mayor que uno (100%) ni menor que cero(0%)
6.3 Regla de la adición de probabilidades
Consideremos el siguiente ejemplo:

Calcular la probabilidad de que quede el 4 ó el 5 en la cara superior de un dado
normal arrojado libremente.
Es evidente que si al arrojar un dado sale un cuatro, no podría salir el 5 y viceversa.
Es decir, estos sucesos son excluyentes entre sí, son EXCLUYENTES entre si, se
eliminan uno a otro. Si ocurre un suceso, no puede ocurrir el otro.
Para estos casos, se aplica la regla de la adición de las probabilidades que dice:
La probabilidad de que ocurra un suceso compuesto de dos o más sucesos que

se excluyen entre si, es igual a la suma de las probabilidades de cada uno de
estos sucesos.
En todos estos casos el enunciado del problema pide la probabilidad de un suceso

compuesto de uno ó de otro. Es decir, 4 ó 5 en nuestro ejemplo.
Por esta razón se conoce ésta regla como la REGLA O .
Resolviendo nuestro problema tenemos:
Observemos que en estos casos, (sucesos EXCLUYENTES) la probabilidad total es

mayor, o a lo sumo igual, que la mayor probabilidad de los sucesos intervinientes, es
decir:
Pt  Pi
6.4 Regla del producto de las probabilidades.

Se arrojan dos dados normales, uno rojo y otro azul.

¿Cuál es la probabilidad de obtener un 4 en el rojo y 5 en el azul?
Observar que esta situación es distinta que la anterior, si sale un 4 en el dado rojo
nada impide que salga el 5 en el azul.
Estos son acontecimientos NO EXCLUYENTES entre sí, no se eliminan el uno al
otro.
La regla es del producto y dice:
La probabilidad de que ocurra un suceso compuesto de dos o más eventos, que

no se excluyen entre si, es igual al producto de las probabilidades que tiene
cada uno de esos sucesos.
Nuestro problema pide la probabilidad de un suceso compuesto de uno y otro, es

decir, 4 y 5 , por esta razón la llamaremos regla y
Del ejemplo precedente, se ve que la probabilidad total, en estos casos, esa menor
que la menor probabilidad de los sucesos intervinientes.
Es decir:
Pt  Pi
El alumno deberá notar que las probabilidades en la segunda regla son menores que
en la primera regla, la circunstancia de que la regla de multiplicar, intuitivamente
generadora de valores mayores que la suma, se explica por la circunstancia de que la
multiplicación se efectúa con números decimales, y esto arroja siempre un valor más
pequeño, ejemplo:
0.2 * 0.3 = 0.06
donde 0.06 es, pese a la multiplicación, menor que 0.2 y 0.3.
6.5 Aplicación de ambas reglas
Se arrojan dos dados, calcular la probabilidad de que se obtenga un 4 y un 5.

Este problema parece el mismo que el anterior pero no es así. el 4 ó el 5 puede salir
en cualquiera de los dados. Supongamos que un dado es rojo y el otro azul.
Podemos obtener 4 en el rojo y 5 en el azul. o bien 5 en el rojo y 4 en el azul. en
ambos casos satisfacemos lo que el enunciado pide.
Si sale 4 en el rojo (suceso simple), nada impide que salga el 5 en el azul. Entonces
corresponde el producto de las probabilidades.
Lo mismo ocurre para el 4 en el azul y el 5 en el rojo.
Pero, si sale 4 en el rojo y 5 en el azul(suceso compuesto) no puede salir el 5 en el
rojo y el 4 en el azul. Por lo tanto corresponde la suma de las probabilidades de cada
uno de estos sucesos compuestos.
Veamos otro ejemplo:
Se arrojan dos dados normales.
Calcular la probabilidad de obtener 9 como suma de las caras superiores.
En este caso, el problema se satisface con 4 alternativas:
que salga 3 y 6 ó 4 y 5 ó 6 y 3 ó 5 y 4
Ptotal = P3y6 + P4y5 + P6y3 + P5y4
Cada término de la suma vale 1/36= 1/6 * 1/6
Ptotal= 4 * 1/36 = 1/9 = 11.1%
6.6 Probabilidades con y sin reposición
Cuando un elemento es extraído de una Población, y tenemos que volver a sacar

otro elemento, se nos presentan dos posibilidades. La primera es reponer a la
Población el primer elemento retirado, con lo cual la Población queda como al
principio, es decir que la segunda extracción tendrá la misma probabilidad de
extracción que el primero.

La segunda alternativa, que es la más frecuente, es que no se reponga la primera

unidad extraída, con lo cual la probabilidad para la segunda extracción habrá
cambiado.
Para aclarar el tema desarrollemos un suceso muy simple, supongamos que tenemos
una Población de 10 especiímenes, y que tenemos que extraer dos unidades, la
probabilidad de la primera extracción es de 1/10=0.1000, ahora bien, la segunda
extracción tendrá distinta probabilidad según lo que hagamos con el primer
espécimen, si lo volvemos a la población, la probabilidad volverá a ser de 1/10, pero
si no lo volvemos, la población es ahora de 9 especiímenes, por lo tanto, la
probabilidad de la segunda extracción será 1/9= 0.1111
Veamos otro ejemplo, Calcular la probabilidad de hallar una pieza defectuosa y otra
buena si se toman dos piezas de un lote de 20 piezas cuya fracción defectuosa es
del 5%.
Esto quiere decir que 19 piezas son buenas y una es mala.
Con reposición:
P(buena) = 19/20 = 0.95
P(mala) = 1/20 = 0.05
Por lo tanto la probabilidad de que la primera sea buena y la segunda mala es:
0.95 * 0.05 = 0.0475
Pero, otro resultado posible, y que también satisface el enunciado del problema es
que la primera sea mala y la segunda buena, el resultado será el mismo:
0.05 * 0.95 = 0.0475
Y el resultado final será: 0.0475+0.0475 = 0.0950 = 9.5%
Sin reposición
Los sucesos posibles son, a)buena - defectuosa y b) defectuosa - buena
Para a) sin reponer la pieza extraída:
19 1
Pa  *  0.05
20 19
1 19
Pb  *  0.05
20 19
Ptotal  Pa  Pb  0.05  0.05  0.10

Como se ve ambos resultados son distintos.
En la práctica, lo más frecuente es que las extracciones sean sin reposición, pero
también sucede que las poblaciones son cantidades grandes, y cuando así sucede,
la modificación que se produce en la población por sucesivas extracciones no son
significativas para el cálculo de probabilidades.
6.7 Probabilidad de las causas, Fórmula de Bayes - Laplace
Probabilidad de las causas
Para comprender éste tipo de problemas, recurriremos a la idea de trabajar con

urnas.
Supongamos 4 urnas A con 7 bolillas blancas y 3 rojas, en cada una, y 6 urnas

B con 2 bolillas blancas y 8 rojas en cada una
Se escoge una urna al azar y de la misma se extrae una bolilla, también al azar,
obteniendo una bolilla blanca, es decir que el suceso b se ha producido.
¿Cuál es la probabilidad de que la urna escogida sea de la familia de urnas A ?
Antes de que se sacase una bolilla y se conociera su color, la probabilidad de ser

elegida una urna
A ó B , estaba perfectamente definida, (1/4 y 1/6), pero el conocimiento de la bolilla
extraída, altera esa probabilidad.
Como el suceso se ha producido, la probabilidad es a “posteriori”,. es decir,
buscamos la probabilidad a “ posteriori “ de la causa A o de la causa B ,
sabiendo que el suceso b se ha producido.
Para resolverlo se aplica la fórmula de Bayes - Laplace
Donde:
es la probabilidad a ” posteriori” de la causa A.
Wi es la probabilidad a “priori” de la causa A
pi es la probabilidad de que actuando la causa A el suceso se verifique.
 Wi pi es la sumatoria de los productos análogos posibles.

De acuerdo a esto tenemos :
Wi = 4/10, probabilidad de la urna
pi = 7/10 , probabilidad de extraer una blanca en A
Por lo tanto la probabilidad de que la urna sea del grupo A , si la bolilla es blanca:
y también podemos calcular el complementario:
Como es de esperar la suma de ambos resultados deberá ser necesariamente igual a

uno.
Ejercicios de comprensión:
Los siguientes problemas se les sugieren resolver al alumno. Los resultados están al
terminar el enunciado.
Problema 1:
Se tiene un grupo M formado por 4 urnas, con 4 bolillas rojas y 2 azules cada una.
Otro grupo N, formado por 6 urnas conteniendo cada una 3 bolillas rojas y 5 azules.
Se selecciona una urna al azar del grupo de diez y de ella se extrae una bolilla,
también al azar, resultando roja.
¿Cual es la probabilidad de que la urna seleccionada provenga del grupo N ?
Respuesta: 45.80%
Problema 2 :

Supongamos que una caja contiene bolillas blancas y rojas marcadas con P; Q; ó R
como sigue:
Marcadas con P : 5 blancas y 3 rojas,

Marcadas con Q : 4 blancas y 4 rojas,
Marcadas con R : 1 blanca y 7 rojas.
Se extrae una bolilla al azar y resulta blanca, ¿ Cual es la probabilidad de que la

bolilla blanca seleccionada esté marcada con la letra P? Cuál con la letra Q ? ¿ y con
la letra R?
Respuesta: 50,0%, 40,0% y 10,0% respectivamente.

Capítulo 6:
Probabilidades: 6.3, 6.5, 6.6, 6.8, 6.33, 6.42, 6.43, 6.44, 6.45, 6.46, 6.47, 6.50,
6.51, 6.90.

Capítulo 7
7. Análisis Combinatorio y Probabilidades
7.1 Principio fundamental del análisis combinatorio.
El análisis combinatorio nos provee una herramienta muy importante para el cálculo
de probabilidades complejas y que no podríamos valorizar con los métodos que
hemos aprendido hasta ahora. Este cálculo matemático se unirá a lo visto en el
capítulo anterior para desarrollar lo que llamaremos distribución binomial en el
próximo capítulo
El principio fundamental dice:
Si un suceso puede ocurrir de n1 maneras y si cuando éste ha ocurrido, otro

suceso puede ocurrir de n2 maneras, entonces el número de maneras en que
ambos pueden ocurrir en el orden especificado es:
n1 * n2
Ejemplo: Si hay 3 candidatos para gobernador y 5 para alcalde, los dos cargos se
pueden ocupar de 3 * 5 = 15 formas.
7.2 Factorial de n.
La factorial de n, denotada por n! se define como:
n! : n(n-1)(n-2)....3*2*1
.
Ejemplos:
5! = 5*4*3*2*1 = 120
4!*5! = 4*3*2*1*5*4*3*2*1 = 2880
Y se define:
Factorial del número cero = uno
0! = 1
7.3 Permutaciones.
Una permutación de n objetos tomados de r en r es una selección ordenada de r

objetos de entre n.

El número de permutaciones de n objetos tomados de n en n se denota por Pn,r y

viene dado por:
Pn,r = n(n-1)(n-2)...(n-r+1)= n! / (n-r)!
En particular, el número de permutaciones de n objetos tomados de n en n
Pn,n = n!
Ejemplo, el número de permutaciones que se pueden dar de las letras a, b, y c,

tomadas de a dos son:
P(3,2) = 3*2 = 6
Son ab, ac, ba, ca, bc, y cb
7.4 Combinaciones.
Una combinación de n objetos tomados de r en r es una selección de r de ellos,

sin importar el orden de los r escogidos.
El número de combinaciones de n objetos tomados de r en r se denota por:
 n n(n  1)(n  2 )...(n  r  1) n!

   
 r r! r !(n  r ) !
Otra forma de denotar al numero Combinatorio es: Cn,r
Ejemplo: El número de combinaciones de las letras a, b, y c, tomadas de dos en dos

es:
 3 3.2.1
   3
 2 2.1
Son ab, bc y ac
Nótese que ab y ba son la misma combinación pero no la misma permutación.
7.5 Probabilidades y análisis combinatorio.
Para interpretar el tema lo haremos a través de un ejercicio.
Una caja contiene 8 bolas rojas, 3 blancas y 9 azules.

Si se sacan 3 bolas al azar, determinar la probabilidad de que:
a) las 3 sean rojas

b) las 3 sean blancas
c) 2 rojas y una blanca
d) al menos una sea blanca
e) una de cada color
En primer lugar debemos destacar que esto problemas se resuelven siempre

sobre la base de que la extracción se realiza sin reposición.
a) las 3 sean rojas
De acuerdo con el anterior razonamiento, esto se resuelve así:
Ahora bien, si razonamos de acuerdo a los números combinatorios, tenemos:
Con el mismo criterio resolveremos los otros casos.
b) Que las tres sean blancas:
c) Que dos sean rojas y una blanca:
d) Para resolver este caso, que al menos una sea blanca, tenemos dos caminos, el
primero sería calcular la probabilidad de que una sea blanca, de que dos sean
blancas y que las tres sean blancas y luego sumar los tres resultados. Pero otro
camino, que suele ser más corto, es calcular que ninguna sea blanca y esto restarlo
de uno. Nosotros resolveremos por el segundo camino y se sugiere al alumno que lo
confirme por la otra vía.

e) Una de cada color. Aquí debemos prestar atención de que no están pidiendo que
salgan en un orden determinado, El cálculo por la vía del número combinatorio nos
da precisamente el resultado acumulado de todas las alternativas posibles.
7.6 Generalización del número combinatorio y probabilidades
Este importante ejercicio nos introduce en la llamada DISTRIBUCIÓN BINOMIAL.
Determinar la probabilidad de sacar tres veces el 6 en 5 tiradas de un dado.
Representemos la 5 tiradas por 5 espacios
_ _ _ _ _
En cada espacio tendremos los sucesos 6 o no 6
Por ejemplo:
6 6 6 6 6
o
6 6 6 6 6

Ahora bien la probabilidad de un suceso como cualquiera de los dos descritos es:
3 2
1 1 5 1 5  1  5 

P 66666   * * * *    
6 6 6 6 6  6  6
Cualquiera de las combinaciones nos dará el mismo resultado.
Pero la pregunta es: ¿cuántas combinaciones hay?
 5
la respuesta es    10 de tales sucesos mutuamente EXCLUYENTES por lo
 3
tanto la probabilidad requerida es:
Ahora podremos generalizar:
5 es el total de intentos que llamaremos N
1/6 es la probabilidad de éxitos y lo llamaremos p
5/6 es la probabilidad de fracasos y lo llamaremos q
por último 3 es la probabilidad de obtener tantas veces p en N intentos y lo

llamaremos X,
Con ésta generalización la fórmula se puede escribir:

Capítulo 6:

Permutaciones: 6.17, 6.18, 6.19, 6.20, 6.21, 6.22, 6.24, 6.66, 6.71,
Combinaciones: 6.25, 6.26, 6.27, 6.28, 6.29, 6.30. 6.72, 6.74, 6.75, 6.78.
Probabilidades y análisis combinatorio: 6.32, 6.33, 6.34, 6.35.

Capítulo: 8
LAS DISTRIBUCIONES BINOMIAL, POISSON Y NORMAL.
8.1 LA DISTRIBUCIÓN BINOMIAL
Definición: Si p es la probabilidad de que ocurra un suceso en un solo intento

(llamada probabilidad de éxito),entonces la probabilidad de que el suceso ocurra
exactamente X veces en N intentos ( o sea X éxitos y N-X fracasos viene dado por :
 N N!
PX    p X qN  X  p X qN  X
 X X !N  X!
Ejemplo: La probabilidad de obtener exactamente 2 caras en 6 tiradas de una

moneda es:
N=6, p=½,q=½,X=2
Se recomienda al alumno que, antes de desarrollar la fórmula, identifique claramente

los valores de N, p, q y X, tal como se muestra en éste ejercicio.
VARIABLES DISCRETAS Y CONTINUAS
Se dice que una variable es discreta, cuando los datos se cuentan, y es continua
cuando los datos se miden. por ejemplo, la producción de sillas es discreta pues un
lote puede ser, por ejemplo de 25 sillas o de 43 sillas, pero no de 25,6 ó 43,25 sillas
pues la fracción no es silla. En cambio, el diámetro de un perno es una variable
continua pues la puedo medir con tanta precisión como resolución tenga el
instrumento, ejemplo 12,345 milímetros.
La distribución de probabilidad binomial se aplica a variables discretas

únicamente.
DESARROLLO DEL BINOMIO

La distribución de probabilidad discreta se llama DISTRIBUCIÓN BINOMIAL porque

para: X = 1, 2,..., N corresponde a términos sucesivos de la fórmula binomial o
desarrollo del binomio.
 N  N
q  pN  qN    qN 1p    qN 2 p 2  ... p N
 1  2
donde:
 N  N
1,   ,   ,... se llaman
 1  2
Coeficientes Binomiales
ALGUNAS PROPIEDADES DE LA DISTRIBUCIÓN BINOMIAL:
VALOR MAS PROBABLE: Np
VARIANZA : Npq
DESVIACION TIPICA = Npq
TRIÁNGULO DE PASCAL
El triángulo de Pascal, nos da los valores de cada término del binomio:
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
....................................................
Si observamos el desarrollo del binomio de Newton, vemos que cada sumando

representa una probabilidad y, si N, p y q son constantes, cada término nos da la
probabilidad para X = 0, 1, 2, ... hasta N.
Por esta razón se lo denomina también DISTRIBUCIÓN BINOMIAL
Si generalizamos tenemos:
q  pN  P0  P1  P2  ... PN
Por otra parte, q+p = 1 por lo cual la suma anterior también es igual a uno.

En otra palabras, la probabilidad de que el suceso esperado se cumpla cero vez, una
vez, dos veces, hasta N veces, es igual a uno.
Si graficamos en un sistema de coordenadas un polígono de frecuencias, que
represente la distribución binomial, tenemos:
P (X) P(Np)
... 
... 
... 
... 
P(3) P(3)  P(n-3)
P(2) P(2) |  | P(n-2)
P(1) P(1) | |  | | P(n-1)
P(0) P(0) | | |  | | | P(n)
0 1 2 3 ... Np ... n-3 n-2 n-1 n
Como puede apreciarse de este gráfico, la representación de cada una de las

probabilidades para cada n y un determinado p conforman un “peine” donde están
todas la posibles probabilidades para cada X. El alumno deberá tener presente los
siguientes aspectos:
a) la suma de todas las probabilidades del “peine” tiene que dar 1
b) recordar siempre que p+q = 1, por lo tanto, aunque solo se especifique p, el valor
de q esta automáticamente fijado pues, q = 1 - p
EJERCICIOS DE COMPRENSIÓN
Para terminar de comprender esto a fondo veremos una familia de distribuciones

binomiales en los siguientes gráficos, las probabilidades evolucionan con los
valores de p.
El valor de N = 10 se mantendrá fijo en los siguientes gráficos:
p = variará desde 0,10 hasta 0,90 y, en consecuencia, q = variará desde 0,90 hasta
0,10
X = serán todas las posibles, es decir: 0, 1, 2, ...., hasta 10
La suma de todos los valores de P de cada gráfico totalizan 1

Como puede observarse, las barras comienzan recostadas sobre la izquierda y se
desplazan, simétricamente hacia la derecha.

si p es igual a 0,20
35
30
probabilidad
25
20
15
10
0
0 2 4 6 8 10
valor de las X
30
25
probabilidad
20
15
10
0
0 2 4 6 8 10
valor de las X

30
25
probabilidad
20
15
10
0
0 2 4 6 8 10
valor de las X
25
20
probabilidad
15
10
0
0 1 2 3 4 5 6 7 8 9 10
ÚNICO GRÁFICO DONDE EXISTE SIMETRIA

PUES p = q
30
25
probabilidad
20
15
10
0
0 2 4 6 8 10
valor de las X

30
25
probabilidad
20
15
10
0
0 2 4 6 8 10
valor de las X
35
30
probabilidad
25
20
15
10
0
0 2 4 6 8 10
valor de las X
40
35
30
probabilidad
25
20
15
10
5
0
0 2 4 6 8 10
valor de las X

Todos estos gráficos constituyen una familia de distribuciones binomiales, en función

de N constante, en este caso igual a 10 intentos, por lo tanto, las veces que
podremos tener éxito van de cero a 10, estas son las X. Las probabilidades de éxito
se han variado de 0,10 a 0,90 lo cual dio origen a la familia de las DISTRIBUCIONES
BINOMIALES.
8.2 DISTRIBUCIÓN DE POISSON
La ley binomial resulta muy laboriosa para el caso de la resolución de la mayoría de

los casos de Control de Calidad, por ello, una buena aproximación es la ley de
POISSON, donde se deberá tener en cuenta algunos supuestos para que la
aproximación sea aceptable.
Estos supuestos son:
N deberá tender a valores muy grandes.

p deberá tender a valores muy pequeños
el producto Np deberá permanecer constante
Estas condiciones, son las más frecuentes en asuntos de Control de Calidad, en

efecto, la muestras, N son siempre grandes, valores cercanos a 100 y superiores casi
siempre a 50. La fracción defectuosa, p, casi siempre es menor al 5% por lo cual la
aproximación resulta siempre muy satisfactoria.
Con estos supuestos la fórmula BINOMIAL :
 N
PX   X
p q
N X
 X
se reduce a:
 Xe  
PX  donde X = 0, 1, 2,...
x!
y  es una constante dada = Np
 otra forma de escribirla sera 
PX 
NpX e  Np
X!
Siendo ambas fórmulas llamadas de POISSON
8.3 RELACIÓN ENTRE LA DISTRIBUCIÓN BINOMIAL Y LA DISTRIBUCIÓN DE

POISSON:
En la distribución binomial, si N es muy grande y la probabilidad p de ocurrencia de

un suceso es muy pequeña, de modo que q = 1 - p es casi 1 se lo denomina un
suceso raro.

En la práctica, un suceso es raro si el número de ensayos es al menos 50 (N  50),

mientras que Np es menor que 5. En tal caso la distribución binomial queda
aproximada muy estrechamente por la DISTRIBUCIÓN de POISSON.
La siguiente tabla muestra las diferencias entre ambas distribuciones:
BINOMIAL POISSON
MEDIA  = Np =
VARIANZA 2 = Npq 2 = 
DESVIACIÓN TÍPICA = = 
Ejercicio de comprensión:
Entre las 2 y las 4 de la madrugada, el número medio de llamadas telefónicas por

minuto que recibe una pequeña central telefónica es de 2,5.
Hallar la probabilidad de que durante un minuto concreto se produzcan:
a) cero llamadas
b) una llamada
c) dos llamadas
d) tres llamadas
e) cuatro llamadas o menos
f) más de seis llamadas

8.4 LA DISTRIBUCIÓN NORMAL, CURVA NORMAL O DISTRIBUCIÓN

GAUSSIANA
Uno de los más importantes ejemplos de una distribución de probabilidad continua es

la DISTRIBUCIÓN NORMAL, también conocida como CURVA NORMAL ó
DISTRIBUCIÓN GAUSSIANA. Está definida por la ecuación :
Donde: µ = media aritmética de la población

y  = desviación típica de la población.

El área total bajo la curva es igual a uno, (o 100%), significa que el 100% de las
probabilidades están representadas por la curva. Consecuentemente, el área bajo la
curva entre X=a y X=b con a < b representa la probabilidad de que X esté entre a
y b . Esta probabilidad se denota por:
Pr{ a < X < b }
VARIABLE CANÓNICA : Z
Esta importante variable Z , se utiliza para transformar la anterior fórmula de Gauss.

La expresión, denominada Unidades Estandard, se define:
Z
X   

Estas unidades Estandard o unidades de Desviación Típica, ( pues está dividido por
sigma ) transforma a la ecuación de Gauss en la siguiente:
1  1 Z2
Y e 2
2
Como se demostrará más adelante, en esta expresión el valor de sigma es igual a

uno, motivo por el cual, desaparece del denominador.
Esta fórmula, que es única, igual para cualquier población, con tal de que calculemos
el valor de Z, tiene la siguiente representación:
CURVA NORMAL DE GAUSS

40
35
PROBABILIDADES
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
VALORES DE Z
Esta “campana” tiene características peculiares:

a) la media aritmética es igual a cero.
b) el punto de intersección de la perpendicular a la absisa en el valor 1 y -1 con

la curva marca un punto en dicha curva, dicho punto es el punto de inflexión de
la curva, es decir, donde la tangente cambia de signo.
c) la distancia del punto de inflexión a la perpendicular a la absisas en el valor

de X = 0 es el valor de la desviación típica y vale uno.
d) el área dentro de ciertos valores es siempre el mismo según el siguiente

esquema:
Área bajo la curva normal desde MENOS UNA DESVIACIÓN TÍPICA (-1) hasta
MAS UNA DESVIACIÓN TÍPICA (+1)
AREA BAJO LA CURVA NORMAL

IGUAL A 68.27%
40
35
PROBABILIDADES
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
DESDE -1 A +1 DESVIACION TIPICA

IGUAL A 95,45%
40
35
PROBABILIDADES
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3


IGUAL A 99,73%
40
35
PROBABILIDADES
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
8.5 RELACION ENTRE LA DISTRIBUCIÓN BINOMIAL y la NORMAL
Si N es grande y si ni p ni q son próximos a cero, las dos distribuciones se

aproximan estrechamente por una distribución normal con variable canónica dada
por:
X  Np
Z
Npq
En el capítulo 8.8, se estudiará la aproximación de la curva normal a los resultados
por la fórmula Binomial.
8.6 EJERCICIOS DE COMPRENSION SOBRE LA DISTRIBUCIÓN NORMAL.
Los siguientes ejercicios, tienen como objetivo aprender el uso de las tablas de
Gauss.
EJERCICIO Nº 1
Hallar el área bajo la CURVA NORMAL en cada uno de los casos siguientes:
a) entre z = 0 y z = 1.20

De tablas leemos que para z = 1,2 es 0,3849, por lo tanto: Pr {0  z  1,2} =

0,3849
Esto significa que el área bajo la curva normal para z entre 0 y 1,2 es del 38.49%
b) Entre z = - 0.68 y z = 0
En tablas se lee para z = 0.68 es 0.2518 por lo tanto,

Pr {-0,68  z  0} =0.2518
Esto significa que el área bajo la curva, para z= -0,68 y z=0 es el 25.18%
c) Entre z = - 0.46 y z 2.21

En tablas se lee que, para z = 0.46 es 0.1772 por lo tanto,

Pr {-0,46  z  0} =0.1772
7Nótese que en la lectura se prescindió del signo menos.
Por otra parte, para z = 2.21 se lee 0.4864. lo cual significa :
Pr {0  z  2.21} =0.4864
Para encontrar el área total debemos sumar ambos resultados:
0.1772+0.4864 = 0.6636
Esto significa que el área bajo la curva, para z= - 0.46 y z=2.21 es del 66.36%
d) Entre z = 0.81 y z = 1.94
Para z = 0.81 es 0.2910 por lo tanto, Pr {0.81  z  0} =0.2910

Para z = 1.94 es 0.4738 esto es : Pr {0  z  1.94} =0.4738
Para encontrar el área entre los dos puntos elegidos, debemos restar ambos
resultados: 0.4738 - 0.2910 = 0.1828
Esto significa que el área bajo la curva, para z= 0.81 y z=1.94 es del 18.28%
e) A la izquierda de z = - 0.6, esto significa, entre z = -  y z = - 0.6

Tener presente que desde z = -  y z = 0 la superficie bajo el área es 0.5000 (50%)
Para z = 0.6 es 0.2258 por lo tanto, Pr {0.6  z  0} =0.2258

Para z = -  es 0.5000, esto es : Pr { -   z  0} =0.5000
Para encontrar el área entre los dos puntos elegidos, debemos restar ambos
resultados: 0.5000 - 0.2258 = 0.2742
Esto significa que el área bajo la curva, para z = -  y z=- 0.6 es del 27.42%
f) A la derecha de z - 1.28, esto es ,entre z = - 1.28 y z = + 
CURVA NORMAL DE GAUSS

40
35
PROBABILIDADES
30
25
20
15
10
0
-3 -2 -1 0 1 2 3
Area entre z = -1,28 y z = + infinito
Para z = 1.28 es 0.3997 por lo tanto, Pr {-1.28  z  0} = 0.3997

Para z = 0 y z= + es 0.5000, esto es : Pr {0  z  +} = 0.5000
Para encontrar el área entre los dos puntos elegidos, debemos sumar ambos
resultados: 0.3997+0.5000 = 0.8997
Esto significa que el área bajo la curva, para z = -1.28 y z =+  es del 89.97%
g) A la derecha de z = 2.05, y a la izquierda de z = - 1.44

Área total bajo la curva = 1-(área entre-1.44 y 0) - (área entre 0 y 2.05)

1 - 0.4251 - 0.4798 = 0.0951, esto es 9.51%
EJERCICIO Nº 2
Este ejercicio ayuda a entender el uso de los procedimientos anteriores para el

cálculo de las probabilidades en eventos reales.
Se recomienda al alumno dibujar las “campanas” e ir identificando las áreas

escogidas.
Si los diámetros de las bolillas de cojinetes están normalmente distribuidas con media
0.6140 mm y desviación típica 0.0025 mm determinar el % con diámetro :
a) entre 0.6100 y 0.6180 mm

b) mayores que 0.6170 mm
c) menores que 0.6080 mm
Solución:
a)- z = (0.6100-0.6140) / 0.0025 = - 1.60
+ z = (0.6180-0.6140) / 0.0025 = + 1.60
Área solicitada = probabilidad buscada = 0.4452 + 0.4452 = 0.8904
La probabilidad de que el diámetro de las bolillas se encuentren entre 0.6100mm y

0.6180 mm es del 89.04%
b) z = (0.6170 - 0.6140) / 0.0025 = 1.20
Area para z = 0.3849
Area solicitada: 0.5000 – 0.3849 = 0.1151

La probabilidad de que el diámetro de las bolillas sea mayor que 0.6170 mm es del
11.51%
c) z= (0.6080 - 0.6140) / 0.0025 = 2.40
Para z = 2.40, es 0.4918
El área buscada es 0.5000 - 0.4918 = 0.0082
Probabilidad = 0.82 %
Ejercicios en clase:
Se desarrollan ejercicios inversos, dado un área, determinar z.
Ejemplo 1: determinar la nota mínima para el 10% mejor de un curso con media 65 y
desviación típica 9.
Ejemplo 2: Calcular a las cuantas horas deberán cambiarse las ampolletas de

una ciudad, si la vida media es 750 horas y la desviación típica es 35 horas, y
se desea hacerlo cuando falle el 20% de las ampolletas.
8.7 LA DISTRIBUCION HIPERGEOMETRICA.
Esta distribución es Discreta, es una alternativa junto a la Distribución Binomial y

la Distribución de Poisson. Vveamos en que caso nos interesa esta distribución
Discreta.
Cuando la magnitud de la muestra es grande, por lo general, del 20% de la cuantía

del lote (Población), la ley Binomial no puede dar una aproximación satisfactoria de
esta distribución. Teóricamente, la fórmula Hipergeométrica es la distribución finita
correcta. Es decir, la fórmula Binomial nos entrega buenos resultados cuando n es
pequeña en relación a N, pero si no lo es debemos acudir a la relación
Hipergeométrica.
En los casos donde el tamaño de la muestra es significativa frente al tamaño de la
Población , sucede que cada vez que se extrae una unidad del lote , cambia el valor
de p del resto del lote.
Supongamos que se extrae una muestra de 5, de un lote de 20 unidades, que tiene

2 unidades defectuosas, esto es p’ = 0,10 , la magnitud de la muestra es de 25% del
lote.
La fórmula de la Distribución Hipergeométrica es la siguiente:

 L  d  d
  
 c   n  c   c
P  
n  L
 
 n
L = Tamaño del Lote (Población)
d = Unidades defectuosas en el Lote
n = tamaño de la muestra.
c == Unidades defectuosas en la muestra.
Esta fórmula se interpreta así: la probabilidad de que una muestra al azar, de n

unidades , contenga c unidades defectuosas, para un tamaño de lote (Población) L
en el cual existen d unidades defectuosas.
Nos preguntamos la probabilidad para c= 0, 1 y 2, los resultados serán:
Para c = 0
Para c = 1
 20  2  2
  
1
   5  1   1
P    0.395
5   20
 
 5
Para c = 2
 20  2  2
  
 2  5  2   2
P    0.053
5  20
 
 5
En la siguiente figura, se ha graficado los tres resultados obtenidos, y también se

muestra los resultados para el mismo caso, resueltos con la fórmula Binomial, y por
Poisson.
Naturalmente, el cálculo Hipergeométrico, muestra valores solo para c= 0, 1 y 2, ya
que el número máximo de defectos posibles en la muestra de 5 es 2.

Tanto el método Binomial como el de Poisson suponen magnitudes de lotes infinitas,

y cuando se llevan a los límites de la expansión, producen valores de probabilidad
para defectos 3, 4 y 5 de la muestra. Esto no tiene sentido en este ejemplo ya que no
existen.
Téngase presente que de los tres resultados, los únicos correctos son los de la
Hipergeométrica, y en los otros datos puede apreciarse el grado de error con los
resultados correctos.
Problema:
En una editorial, en la producción de un determinado tipo de libro, se espera una

probabilidad de 0.10 de encontrar un error en una hoja de los mismos. Para la
impresión de un libro de 70 hojas deseamos conocer, al revisar 3 hojas al azar, que
probabilidad existe de encontrar ninguna hoja con error.
Solución:
L = 70 n=3 p = 0,10
d=7 c=0
 70  7  7
  
 0  3  0   0
P    0.7254
 3  70
 
 3
Respuesta: 72.54 %

8.8 APROXIMACION NORMAL A BINOMIAL
La aproximación normal a Binomial es sencilla, siempre que n no sea grande,

ejemplo:
Para: n = 12 y p = 1/3
La familia binomial tiene las siguientes probabilidades:
P(0)=0.008 P(4)=0.238 P(8) =0.015 P(12) = 0.000

P(1)=0.046 P(5)=0.191 P(9) =0.003
P(2)=0.127 P(6)=0.111 P(10)=0.000
P(3)=0.212 P(7)=0.048 P(11)=0.000
Conceptualmente, la gráfica para una distribución Binomial, deberá representarse,

como se vio anteriormente como una “peineta”, es decir, líneas verticales desde el
valor encontrado a la abscisa, pues entremedio no existen valores. Sin embargo, para
los fines comparativos con la normal, recurriremos a un histograma. Es decir, las
barras indicarán los valores obtenidos con la fórmula Binomial, pero nos dará también
una idea de superficie, de manera que podamos acercarnos, visualmente, a la curva
normal.
0,238
0,212
0,191
0,127
0,111
0,046 0,048
0,008 0,015
0,0030
0 2 4 6 8 10 12
Distribución binom ial para p=1/3 y n=12
En 8.1, definimos que, para la distribución Binomial es:

La curva normal, superpuesta, tiene los datos calculados con la fórmula anterior:
resulta evidente que existe una buena aproximación, pese a que n es solo 12.
0 2 4 6 8 10 12
Distribución binomial para p=1/3 y n=12, con curva
norm al superpuesta
Para verificar este acercamiento, realicemos los siguientes ejercicios:
Si la probabilidad de que un tirador acierte a un blanco es de 1/3, y si dispara 12 tiros,

¿cuál es la probabilidad de que acierte por lo menos 6 de ellos?
La respuesta exacta, a tres decimales, es P(6) + P(7) + P(8)+......+ P(12) = 0.177
Geométricamente, esta respuesta, es el área de aquella parte del histograma, a la

derecha de x = 5.5
Por lo tanto, al aproximar esta probabilidad por los métodos de la curva normal, se
necesita encontrar el área bajo la curva normal, a la derecha de 5.5.
Puesto que la curva normal, fue construida con  = 4 y  = 1.63 se sigue que:
x -  5.5  4
z   0.92
 1.63
De tablas encontramos que para z=0.92, el área correspondiente es 0.179, y esto es

una buena aproximación al 0.177 calculado por la fórmula Binomial. Téngase
presente que el valor correcto es el que se calculó por la fórmula Binomial.

Comprobemos ahora para otro caso.

Calcular la probabilidad de que el tirador acierte precisamente 6 tiros en 12.
De lo calculado al principio del capítulo, la respuesta correcta, a 3 decimales es
0.111.
Por Gauss, la respuesta la da el área bajo la curva normal entre 5.5. y 6.5.
6.5  4
z2   1.53 A 2 0.4370
1.63
5.5  4
z1  = 0.92 A 1 0.3212
1.63
Restando una de otra área, el resultado es : 0.116, que, comparada con 0.111
también es una buena aproximación.
Si utilizamos la fórmula de 8.1 podremos averiguar z con la siguiente expresión:
x  np
z
npq
A la expresión np se le llamó valor más probable y es el equivalente de la media

aritmética de una distribución continua. Por otra parte, np, representa el número de
éxitos más probables, esto es x¸ si dividimos por n tanto x como np nos da la
proporción de éxitos, (en Control de Calidad, lo llamaremos fracción defectuosa),
de tal forma, la fórmula anterior se expresa como sigue:
x
p
z n
pq
n
Es decir que, cuando los datos son entregados en la forma de proporción de éxitos, o
fracción defectuosa, la curva normal de aproximación, será la que se obtiene
utilizando
p
y
pq
 
n
Estas fórmulas serán de utilidad más adelante.


el alumno deberá resolverlos como parte de su desarrollo académico
Capítulo 7
Distribución Binomial: 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 7.42, 7.43, 7.40,
7.44.
Distribución Normal: 7.14, 7.15, 7.16, 7.17, 7.18, 7.20, 7.21, 7.22, 7.23, 7.49, 7.50,
7.51, 7.52, 7.54, 7.57, 7.58.
Aproximación normal a binomial: 7.24, 7.25, 7.26.
Distribución de Poisson: 7.27, 7.28, 7.29, 7.67, 7.68, 7.71

Capitulo 9
Correlación y Regresión
9.1 Introducción
Si mediante procedimientos estadísticos, y basándonos en datos históricos,

procedemos a predecir información futura, estamos realizando un ANÁLISIS DE
REGRESIÓN.
Por ejemplo, con la información de las ventas, estacionarias de los tres últimos años,
podemos PREDECIR las ventas futuras para los mismos períodos. Otro caso, de
acuerdo con las notas obtenidas por un alumno en la enseñanza básica, podríamos
PREDECIR los resultados académicos en la Universidad. En ambos casos
estaríamos aplicando técnicas de REGRESIÓN.
Rápidamente puede advertir, el alumno, las dificultades del método. En el primer
caso, la probabilidad de que la predicción sea buena, depende de que no hallan
cambios en el escenario de donde se obtuvieron los datos históricos. Si para este
año, tenemos un nuevo competidor en el mercado, todos los datos históricos no
serán de la misma utilidad y los resultados serán inciertos. En el segundo caso, es
sabido que los estudiantes tienen un marcado cambio en su pasaje de la Básica a la
Universidad, las razones son múltiples, distinto grado de adaptación a los nuevos
métodos de enseñanza, cambios biológicos importantes, motivaciones distintas,
madurez intelectual, etc., Por lo tanto la predicción, en éste caso, hay que tomarla
con reservas.
Ahora bien, aunque las dificultades existen, el método es matemáticamente muy

bueno, y además los cambios del escenario también pueden de alguna manera
considerarse, de manera que es una herramienta valiosa para Marketing, la Gestión
de Compras, Control de Calidad, etc.
Luego de este ANÁLISIS DE REGRESIÓN, nos queda el problema de saber que
tan bueno es el ajuste entre las distintas variables, esto significa conocer que tan
bueno es el ajuste entre las variables.
Es decir, el ANÁLISIS DE CORRELACIÓN, nos dice con que precisión nos están
informando la predicción.
Por ejemplo, un problema de correlación puede ser, ¿existe relación entre el
consumo del tabaco y las muertes por afecciones cardíacas? ¿Entre la recepción de
radio y la actividad de las manchas solares? ¿entre la belleza y la inteligencia?.
Por ejemplo, la correlación entre el consumo de tabaco y las muertes por afecciones
cardíacas es elevada, esto quiere decir que, conociendo el consumo de tabaco,
podemos hacer una buena predicción de la probabilidad de muerte temprana por
afección cardíaca.
9.2 Análisis de Correlación
Con la finalidad de ilustrar la manera en que se procede a estudiar la relación entre

dos variables, consideremos los datos de la siguiente Tabla, que consiste en las
notas de 30 estudiantes en una prueba de lenguaje y una de ciencias.

La nota máxima era de 50 puntos
x y x y x y x y x y x y
34 37 28 30 39 36 35 35 33 31 34 32
37 37 30 34 33 29 29 36 32 31 36 38
36 34 32 30 30 29 34 37 33 36 34 31
32 34 41 37 33 40 35 39 37 40 38 40
32 33 38 40 43 42 36 40 36 42 31 29
La investigación de la relación entre las dos variables comienza, generalmente, con

un intento de descubrir la forma aproximada de la relación, trazando los datos como
puntos en el plano x,y
Esta gráfica recibe el nombre de DIAGRAMA DE DISPERSIÓN. Esto nos da una
aproximación visual a la posible relación.
45
43
41
Notas de ciencias
39
37
35
33
31
29
27
25
25 27 29 31 33 35 37 39 41 43 45
Notas de lenguaje
Una simple inspección visual, nos sugiere que existe una razonable relación entre los
puntos, la nube sugiere una tendencia a crecer, es decir, a mejores notas en
ciencias, mejores notas en lenguaje, y viceversa. Esta “sugerencia” es la
CORRELACIÓN, y nuestro interés ahora es medir esa relación entre los valores.
Por otra parte, el aspecto general del diagrama de dispersión, es el de una línea
recta. Para determinar la naturaleza de una tendencia, se busca cualquier propensión
de los puntos de agruparse sobre ambos lados de alguna curva simple o bien a
ambos lados de una línea recta. Para estas variables seria conveniente poder medir
en alguna forma el grado en que ambas variables se encuentran relacionadas
linealmente. Con el objeto de obtener esta medida, considérense las propiedades
que seria conveniente que tuviera.
Una medida de la relación tendrá que ser independiente de la elección del origen
para las variables. Esta propiedad puede obtenerse usando las desviaciones de las
variables mismas. Esto es igual a la definición de la Desviación Típica.
Así, se usan las variables xi  X e yi  Y en lugar de las variables xi e yi para

formar la medida de relación deseada.
La notación xi , yi denota el i-ésimo número de nuestra tabla.
También deberá ser independiente de la escala de medidas empleada para x e y.
Esta propiedad puede obtenerse dividiendo x entre cantidades que posean las
mismas unidades que x e y. Esto se logra dividiendo por la DESVIACIÓN TÍPICA.
Esto significa que lo reducimos a UNIDADES ESTANDARD o sea a la variable Z.
De esta forma describiremos ahora dos variables ui y vi siendo,

ui 
x  X
i
y vi 
y  Y
i
x y
Con estas variables podemos volver a representar el diagrama de dispersión. Este
será ahora un DIAGRAMA DE DISPERSIÓN PARA VALORES NORMALIZADOS.
Las coordenadas se cortan en un punto central del diagrama, pero el perfil de la nube
de puntos, continua siendo exactamente el mismo
0
-3 -2 -1 0 1 2 3
-1
-2
-3
Se puede ver, que la mayoría de los puntos se encuentran en los cuadrantes 1 y 3.
Este comportamiento sugiere una relación entre las variables, una medida simple de
esta relación es la siguiente:
n
uv
i1
i i
Los términos de la suma correspondiente a los puntos en los cuadrantes 1 y 3 serán

siempre positivos mientras que los del cuadrante 2 y 4 serán negativos y restaran a la
sumatoria.
Consecuentemente un valor positivo elevado tenderá pues a indicar una tendencia
lineal pronunciada en el diagrama de dispersión. Esto sin embargo no es
estrictamente cierto, ya que si el número de puntos se duplicara sin cambiar la
naturaleza de la dispersión, el valor de la suma se casi duplicaría . Es pues,
necesario dividir la suma entre n antes de usarla como medida de la relación.
Existen razones teóricas para preferir n-1 en lugar de n .
El resultado es  uv , esto es la medida deseada y se llama

COEFICIENTE DE
n1
CORRELACIÓN. Este coeficiente se denota con la letra r. Si se reemplaza por las
medidas originales la expresión es la siguiente:
 x i 
 X yi  Y 
r i 1
n  1sx sy
El resultado de esta ecuación es un número que va desde cero a uno, siendo, cero,
la inexistencia de correlación, y uno la correlación total.
Es decir que r toma valores según la siguiente relación:

0 r 1
Si la tendencia del diagrama es a decrecer, es decir si la nube de puntos sugiere que

los valores tienden a decrecer, en lugar de crecer como sucede en el ejemplo de las
notas que se dio al comenzar este tema, entonces, r toma valores entre 0 y -1,
indicando con cero, otra vez, la inexistencia de correlación, y con -1 la absoluta
correlación.
Nótese, que en realidad, cuando la tendencia de los puntos, es a decrecer, se puede

modificar dicha tendencia, mediante un simple cambio de ejes. Por esta razón, el
alumno, debe fijar, como concepto que r toma valores entre 0 y 1.
Cuando es r = 1, significa que son puntos todos sobre una línea recta. Cuando r = 0
son puntos totalmente dispersos que no guardan entre sí ninguna relación.
Si se calcula r para la tabla de los estudiantes nos da como resultado
r = 0.66
Este resultado indica que existe correlación, aunque mas bien pobre, es decir,
que no necesariamente, los alumnos que tengan buenas notas en lenguaje
tienen que tener buenas notas en ciencias y viceversa. Lo mismo ocurre con
los alumnos con malas notas.
Una buena correlación que nos da oportunidad de pasar al análisis de regresión, es
cuando r supera 0.80. Por supuesto, esto es una sugerencia, el analista es el que
determina el nivel de riesgo con el cual desea trabajar. La regresión es siempre
posible hacerla aunque r sea igual a valores muy bajos cercanos a cero. Lo que
sucede, en estos casos, es que las predicciones no se cumplen.
CALCULO DE r
La fórmula dada para definir a r no siempre es conveniente para fines de cálculo. Se

obtiene una forma mejor multiplicando factores, insertando valores para Sx y Sy,
empleando algo de álgebra, con los siguientes resultados:
Esta última fórmula, (de no ser necesarias las medias aritméticas de x e y), tiene la
ventaja de que solo se requieren las sumas de: x e y, sus cuadrados y sus
productos.

9.3 Análisis de Regresión
Como lo sugiere el estudio anterior, la regresión, consiste en reemplazar, la “nube de

puntos”, por una recta que mejor se ajuste, mediante la cual, podremos leer datos, en
lugares donde la información no existía. es decir, que podremos predecir.
Con el objeto de explicar los métodos de Regresión, considérense el problema
particular de predecir el rendimiento de pasto, como función de la cantidad de agua
de irrigación aplicada.
Los datos de la tabla representan la cantidad, en centímetros cúbicos, de agua

aplicada y el rendimiento en toneladas de forraje del terreno de una granja
experimental.
La gráfica de estos datos se ilustra en la figura.
Agua (x) 12 18 24 30 36 42 48
Rendimiento (y) 5.27 5.68 6.25 7.21 8.02 8.71 8.42
5
12 18 24 30 36 42 48
.
En éste gráfico, resulta que x e y están relacionados en forma aproximadamente
lineal, para ésta clase de valores de x.
Por ello, una línea recta podrá ser aplicada a éste grupo de puntos para PREDECIR
los valores de y partiendo de x .
El procedimiento para trazar la línea recta, partiendo de los datos, se denomina

MÉTODO DE LOS CUADRADOS MÍNIMOS. La recta pasará por los puntos que
mejor se ajusten a los datos disponibles, esto es, por los puntos donde las distancias
a los datos sean menores.
Método De Los Cuadrados Mínimos
Por todo lo visto en los párrafos anteriores, la predicción se reduce al problema de

ajustar una línea recta a un grupo de puntos.

Ahora bien, la ecuación de la recta se escribe en la siguiente forma:
y = a + bx
en donde a y b son los parámetros que determinan la recta.
Así pues:
y = 2 + 3x
e y = 4 - 2x representan:
16 y=2+3x
y=4-2x
11
1
-7 -4 -4-1 2 5 8
-9
Puesto que el problema es determinar los valores de los parámetro a y b de manera

que la recta coincida satisfactoriamente con un juego de puntos, el problema es
esencialmente la estimación de los parámetros a y b de alguna manera eficiente.
El método más conocido es el de los MÍNIMOS CUADRADOS.
Puesto que la recta deseada se va a usar para objetivos de predicción es razonable

el requerir que la recta sea tal que hagan pequeños los errores de predicción.
Por error de predicción se entiende la diferencia entre un valor observado de y , con

el valor correspondiente de línea recta para y.
Por ejemplo, el valor de predicción en el ejemplo visto al comienzo de este tema, para
x= 30 es, aproximadamente igual a 7.21 - 7.00 = 0.21
Si se hubiera empleado una recta diferente para la predicción, el error sería otro.
Lo que se busca es hacer mínimo la suma de los cuadrados de los errores y se

determina lo que se conoce como la línea recta mejor ajustada en el sentido de los
mínimos cuadrados.
Resulta claro que variando a y b de la ecuación de la recta, podremos encontrar la

recta que mejor se ajuste a los puntos de la figura vista al comienzo de este capítulo..

Sin embargo, lo necesario es lograrlo mediante un proceso racional sistemático y es

aquí donde interviene el principio de los MÍNIMOS CUADRADOS. La deducción de
los coeficientes de la recta de regresión está fuera del alcance de nuestro curso, por
lo cual solo se las enunciará de la siguiente manera:
RECTA DE REGRESIÓN : y = a + bx
donde el término constante a y el coeficiente de regresión b se calculan según las

siguientes fórmulas:
Término constante de la fórmula de regresión: a   y  b x

n
n xy   x y
Coeficiente de regresión de la fórmula de Regresión: b 
  x 
2
n x 2
Comentarios acerca del coeficiente de regresión y de la recta de regresión
Cuando vimos el coeficiente de regresión dijimos que si la tendencia de la nube de

puntos era creciente, r varia de 0 a 1, y que si la tendencia era decreciente r
varía de 0 a -1.
Ahora podemos especificar mejor este punto, si la pendiente de la recta de
regresión es positiva r varia de 0 a 1, y si la pendiente es negativa r varia de
0 a -1.
Nota importante: si la recta de regresión resulta paralela al eje de las x, r es

NULO.
9.4 Ejercicio de Aplicación.
El siguiente ejercicio sirve para realizar todos los cálculos vistos y además utilizar la
recta para hacer algunas predicciones.
Con la siguiente serie de datos calcular el valor del COEFICIENTE DE

CORRELACIÓN, calcular los COEFICIENTES DE LA RECTA DE REGRESIÓN Y
PREDECIR en tres puntos fuera de los valores registrados.

X Y X2 XY Y2
65 68 4225 4420 4624
63 66 3969 4158 4356
67 68 4489 4556 4624
64 65 4096 4160 4225
68 69 4624 4692 4761
62 66 3844 4092 4356
70 68 4900 4760 4624
66 65 4356 4290 4225
68 71 4624 4828 5041
67 67 4489 4489 4489
69 68 4661 4692 4624
71 70 5041 4970 4900
X=800 y=811 X2=53418 XY=54107 Y2=54849
Calculo del coeficiente de correlación
r
1254.107  800811  0.7027
1253.418  8002 1254.849  8112 
Calculo del coeficiente de regresión de la fórmula de regresión:
b
1254.107  800811  0.4764
1253.418  8002
Cálculo del Término constante de la fórmula de regresión:
a
811  0.4764800  35.82
12
Diagrama de dispersión y recta de regresión

71
70
69
68
67
66
65
62 64 66 68 70 72
Ecuación de la recta: y = a + bx = 35.82 + 0.48 x
Predicción para los valores de x fuera de los datos registrados:
VALORES DE X PREDICCIÓN PARA Y

50 60
85 77
90 79

En este curso solo se ha visto la regresión de y sobre x, por ello, de los

problemas sugeridos, el alumno solo deberá resolver según lo visto en clase.
Capítulo 13 : 13-8, 13-10, 13-19, 13-20, 14.40, 14.46, 14.47

Capítulo 10
10 Teoría del muestreo
10.1 Muestreo aleatorio
En todas las discusiones referentes al muestreo y a las distribuciones de frecuencias

de muestras siempre se supuso que las muestras se escogían al azar, esto es que el
muestreo era aleatorio.
En términos de probabilidad, esto implica que la probabilidad de que un cierto
miembro cualquiera sea escogido es igual a 1/N donde N es el número total de
individuos de que consta la población.
10.2 Distribución de muestreo
Matemáticamente, y por la teoría de probabilidades, puede demostrarse que la

distribución de X poseerá una distribución normal, si es que X la posee, con el
mismo promedio que X, pero con una desviación típica que es veces la
desviación típica de X. (n es el tamaño de una muestra seleccionada de entre N).
Estos resultados matemáticos se expresan en la forma de un teorema:
TEOREMA UNO: Si X posee una distribución normal cuyo promedio es  y cuya

desviación es , entonces el promedio de muestra X en una muestra al azar de
tamaño n, poseerá también una distribución normal cuya media será  y cuya
desviación típica será
En base a este teorema consideremos el siguiente problema:
Sea X la representación del peso de un individuo seleccionado al azar de una

población de varones adultos. Supóngase que X posee una distribución normal
teórica cuyo promedio  = 68 kg. y  = 3 Kg. Lo que se quiere resolver es lo
siguiente: si se toma una muestra al azar de tamaño n = 25 para esta población,
¿cual es la probabilidad de que el promedio de la muestra X se encuentre dentro del
intervalo 67 - 69 kg.?
El teorema señala que la media poseerá una distribución normal con :
3 
X = 68 y  X  0.6  
25 n
En el siguiente gráfico podemos ver las dos distribuciones, la primera, con trazo
delgado, es la distribución de las X, la segunda, con trazo grueso, es la distribución
de las medias, en el primer caso, la desviación típica vale 3 Kg. y en el segundo
caso, vale 0.6, de acuerdo con los cálculos vistos más arriba.
Por otra parte, el tamaño de la muestra que se consulta es, n es igual a 25.

El problema de calcular la probabilidad de que X se encuentre dentro del intervalo

67 a 69 se resuelve ahora fácilmente utilizando la fórmula :
Z1 = (67-68) / 0.6 = - 1.67 y Z 2 = (69-68) / 0.6 = + 1.67
Según las tablas es 0,4525 + 0,4525 = 0,9050 es decir , la probabilidad de que X

se encuentra entre 67 y 69 es del 90,5%.
Supongamos ahora que la variable X no posea una distribución Normal.
El resultado es que si n es mayor que 25 la distribución de X , parecerá normal
independientemente de la distribución de población que se elija para X.
TEOREMA DOS: (Llamado del límite central) Si X posee una distribución con
promedio  y desviación típica , entonces el promedio de muestra X basado en
un muestreo al azar de tamaño n, poseerá una distribución normal aproximada con
promedio  y una desviación típica : , cuya aproximación se hace cada vez
mejor al crecer n
Esto es válido para variables continuas ó discretas. Veamos un ejemplo para una
variable discreta que puede tomar los valores 1 a 6 con probabilidades según el
siguiente gráfico.
Distribución No Normal

0,25
0,2
0,15
0,1
0,05
0
1 2 3 4 5 6
Esta distribución tiene una media aritmética = 2.75 y una desviación típica igual a
1.48
De esta población, supongamos de 1000 unidades, sacaremos 100 muestras, (con
reposición) de 10 unidades cada una, se obtuvo el siguiente resultado real:
Clases X Tildes Frecuencias

1.5 - 1.6 1.55 / 1
1.7 - 1.8 1.75 0
1.9 - 2.0 1.95 // 2
2.1 - 2.2 2.15 ///// // 7
2.3 - 2.4 2.35 ///// ///// /// 13
2.5 - 2.6 2.55 ///// ///// ///// / 16
2.7 - 2.8 2.75 ///// ///// ///// //// 19
2.9 - 3.0 2.95 ///// ///// ///// / 16
3.1 - 3.2 3.15 ///// ///// //// 14
3.3 - 3.4 3.35 ///// //// 9
3.5 - 3.6 3.55 / 1
3.7 - 3.8 3.75 // 2
Total 100
El histograma para este diagrama de frecuencias es el siguiente:
20
15
10
0
1,55 1,75 1,95 2,15 2,35 2,55 2,75 2,95 3,15 3,35 3,55 3,75

De donde se desprende por cálculo, a partir de la distribución de frecuencias

obtenida, que X = 2.77 y la desviación típica de la población de muestreo es
0.41
Los valores teóricos son :
 X    2.75
y
 1.48
x    0.47
n 10
Por lo tanto vemos que se cumple: a) una muy buena aproximación de los valores
teóricos a los prácticos, y b) que el perfil de la distribución de las medias se parece a
una normal, pese a que la distribución de las X es lo menos parecido a una normal.
10.3 Muestreo de Poblaciones Pequeñas
En todos los cálculos anteriores se ha supuesto que la población era suficientemente

grande como para que la extracción de la muestra no afectara los resultados, Pero, si
la población es pequeña, esta presunción no es correcta, y debemos corregir de la
siguiente manera:
Si N indica el tamaño de la población que se muestrea y n denota el tamaño de la

muestra que se toma sin reposición, entonces puede demostrarse que la fórmula :

X 
n
Se sustituye por la siguiente

 N n
X 
n N1
Para ver el efecto que el factor de corrección tiene, haremos un ejercicio

considerando los tamaños de muestra de población para los cuales:
a) n = 5% de N b) n = 10% de N c) n = 20% de N
Puesto que rara vez tiene objeto tomar muestras de poblaciones menores de 100, y
puesto que N - 1 diferirá de N por menos del 1%, entonces, el factor de corrección
se puede simplificar así:
5 10 20
a) 1  0.97 b) 1  0.95 c) 1  0.89
100 100 100
Con estos resultados, es conservadora la conclusión de que la fórmula original,


X  se encontrará dentro de un error inferior al 10% a menos que la muestra
n
constituya el 10% o más de la población.

Como recomendación final sería: usar la fórmula original mientras que la muestra sea
menor que el 10% con respecto a N, y la fórmula corregida desde el 10% para arriba.
10.4 Distribución de Muestreo de Proporciones.
El mismo factor de corrección, visto en el párrafo anterior, puede aplicarse a la

desviación típica de las proporciones, cuando el tamaño de la población es lo
bastante pequeño como para justificarlo.
Las fórmulas vistas en el capítulo correspondiente para las distribuciones discretas,

esto es, las distribuciones binomiales, nos enseño que el valor más probable es np
(Nótese que éste valor más probable, es el equivalente a la media aritmética de las
distribuciones continuas), siendo n el tamaño de las muestras y p la fracción
defectuosa, es decir la proporción de defectos que tiene la muestra, el producto
indicado, es decir un número discreto, por esto en Control de Calidad a los gráficos
np se les llama gráficos de defectuosos, porque son las unidades con uno o más
defectos que encontramos durante las inspecciones. En ese contexto, la desviación
típica fue definida cómo: . De acuerdo con esto podremos deducir fácilmente
las fórmulas correspondientes a la proporción p dividiendo ambas expresiones por n,
con lo cual np queda reducido a p y la desviación típica que era quedará
como : , nótese que al dividir por n entra dentro de la raíz como n al cuadrado.
Ahora, basándonos en las anteriores demostraciones, podemos hacer extensiva la

correspondiente fórmula, para las proporciones:
10.5 Distribución de muestreo de diferencias y sumas.
Supongamos tener poblaciones de tamaño N1 y N2 , para cada muestra n 1 y n2

calculamos los correspondientes estadísticos S1 y S2 . Esto nos da, una población de
muestreo para ambos estadísticos, (nótese que por estadísticos estamos
suponiendo cualquier parámetro que estamos controlando, como la media aritmética
o la desviación típica, o cualquier otra cosa).
Las dos poblaciones de muestreo tendrán en consecuencia una media del muestreo
y una desviación típica, también de los datos del muestreo. Estas estarán denotadas
por : s1 , s2 , s1 y s2 .
De todas las posibles combinaciones, podremos obtener una distribución de

muestreo para las diferencias de los estadísticos. La media y la desviación típica de
esta distribución de muestreo, se escribe como :
s1-s2 = s1 - s2 y
Para que se cumplan estas condiciones, las muestras seleccionadas no deberán

tener dependencias entre ellas, es decir, deberán ser necesariamente independientes
entre sí.

Si S1 y S2 son las medias muestrales de ambas poblaciones, cuyas medias

escribiremos , entonces la distribución de muestreo de las diferencias de
medias viene dada por:
Estas fórmulas son válidas para muestreo de poblaciones infinitas o con reposición.
Los mismos resultados los obtenemos para distribuciones de muestreo de diferencias

de proporciones de dos poblaciones binomialmente distribuidas con parámetros
(p1,q1) y (p2, q2) respectivamente. En este caso las fórmulas se expresan como sigue:
Todos los desarrollos vistos sirven para el caso de la suma en lugar de la resta, así
para el primer caso tendríamos:
Esta fórmula es de uso frecuente y de gran utilidad en el área de Control de Calidad

Estadístico.
Nótese que para la desviación típica el resultado de la suma es el mismo que para la
diferencia.
Ejercicio 1
Si la desviación típica de las estaturas de niños de primer grado es de 5 cm, ¿cuál es

la probabilidad de que la estatura promedio de una muestra al azar de 100 de estos
niños difiera en más de un cm, con respecto a la estatura promedio para todos los
niños?
Desarrollo:
Supondremos que N (desconocido) es muy grande:
Si la desviación típica es 5 cm será:

Para z = 2, el área bajo la curva normal es igual a: 0,4772

Entonces, el área bajo la curva normal, entre –2 y +2, esto es, entre -1 y +1
alrededor de la media, será 0,4772 * 2 = 0,9544
Pero ésta será la probabilidad de que se encuentre entre los límites dados, la
pregunta lo solicita fuera de dichos límites.
La respuesta será 1,0000 – 0.9544 = 0,0456
Esto significa una probabilidad de 4,56 %
Ejercicio 2
En el mismo ejercicio anterior supondremos que N = 500
En este caso, n = 100 es el 20% de N, por lo tanto usaremos la fórmula

correspondiente:
Para este valor de z, la probabilidad de que se encuentre entre +1 cm y –1cm es del

98,68% y de que se encuentre afuera, del 2.64 %
Ejercicio 3
Hallar la probabilidad de que en los próximos 200 nacimientos a) menos del 40%
sean niños, b) entre 43% y 57% sean niños, c) más del 54%
Se deberá suponer que las probabilidades de nacimiento de niño o niña serán del
50%.
a) p = 0,50 y q = 050, Además N es muy grande
 = P = 0,50

Para este valor de z, la tabla nos da un área de 0,4977, por lo cual, el área
correspondiente a menos de 40 % será: 0,500 – 0,4977 = 0,0023
Respuesta: 0.23 %
b) en este caso tenemos que hacer dos cálculos:
El área correspondiente será de 0,4761 * 2 = 0,9522
Respuesta: 95,22%
c)
El área correspondiente a z = 1.13 es 0,3708.

Pero nos preguntan lo que supera a ese valor, es decir más de 54%, por lo tanto hay
que restarlo de 0,5000.
0,5000 – 0,3708 = 0,1292
Respuesta: 12,92%
Ejercicio 4
Dos distancias se han medido como 27.3 cm y 15.6 cm con desviación típica de
0,16 y 0,08 cm, respectivamente. Hallar la media y la desviación típica de a) la
diferencia y b) la suma de esas distancias.
Solución:
a) d1 –d2 = d1 - d2 = 27.3 – 15.6 = 11.7 cm

b) d1 +d2 = d1 + d2 = 27.3 + 15.6 = 42.9 cm

Capítulo 8
Ejercicios 8.1, 8.2, 8.3, 8.4, 8.7, 8.11, 8.16, 8.21, 8.23, 8.24, 8.25, 8.26,
8.27, 8.34, 8.39, 8.40.

Capítulo 11
11 Intervalos de confianza
11.1 Estimación por punto y por intervalo
Uno de los usos más frecuentes de la estadística, es la ESTIMACIÓN de

propiedades de la población.
Las dos distribuciones de frecuencias de poblaciones que se han estudiado han sido
la Binomial y la Normal, por lo tanto, consideraremos sus propiedades.
La Distribución Binomial,
 N
PX    p X qN X
 X
queda completamente determinada por el número de intentos n, y la probabilidad de
éxito en una sola prueba p.
Los símbolos n y p se llaman Parámetros de la distribución.
Recordemos la diferencia entre Estadísticos y Parámetros, el primero se refiere a

los medidores de la distribución de una muestra, y el segundo a los medidores de la
distribución de la población. En las consideraciones siguientes hablaremos de
parámetros pues estamos estudiando las propiedades de toda la población que nos
interesa. Los parámetros n y p determinan completamente la distribución binomial y,
consecuentemente, cualquier propiedad de la distribución.
La DISTRIBUCIÓN NORMAL queda completamente determinada por los dos

parámetros  y  .
Curva Normal de Gauss
        

Los problemas de estimación para problemas normales pueden reducirse

generalmente a los problemas de estimación de  y .
Existen dos tipos de estimaciones de parámetros . Uno es la estimación por punto y

la otra es la estimación por intervalo.
Una estimación por punto es lo habitual, esto es el número que se obtiene por
cálculo a partir de los valores de la muestra y que sirve como aproximación al
parámetro que se está estimando.
Una estimación por intervalo, para un parámetro es un intervalo determinado por

dos números que se obtienen a partir de cálculos de valores de muestras que se
espera contengan el valor del parámetro en su interior. La estimación por intervalo se
construye de forma tal, que la probabilidad de que el intervalo contenga al parámetro
puede especificarse. Tales estimaciones por intervalo se llaman “INTERVALOS DE
CONFIANZA”
11.2 Intervalo de confianza
Partiremos el estudio de estos intervalos, utilizando las propiedades de la Distribución

Continua llamada Curva Normal, luego de lo cual, extenderemos los conceptos, a la
distribución discreta o Binomial.
Supongamos que se trata de estimar la media X de cierta característica de calidad
de un lote de N unidades. Para ello extraemos una muestra de n unidades y
determinamos los valores X1, X2, ...,Xn
El siguiente diagrama representa una interpretación de lo que se esta tratando:
X 1 XN X4  X3 X2
------------------------------------I---I-----I------I-------I----------I--I--I-------------------->
I1 0 I2 eje de las X
Supongamos tener n datos X de una muestra extraída de una población N, de los

cuales en el eje de las X hemos ubicado los 4 primeros datos y el último dato, estos
son X1 , X2 , X3 , X4 y Xn , está implícito que sobre este eje estarán todos los datos de
la muestra.
La media aritmética de esta muestra es la cual fue ubicada en un lugar central de
los datos escritos. Por todo lo explicado hasta ahora, la media de la población, 
estará cerca del valor anterior pero, probablemente, no coincidirá con el valor
anterior. En el gráfico, lo hemos escrito a la derecha de .

Ahora bien, llamaremos INTERVALO DE CONFIANZA, a una distancia desde la

media aritmética de la muestra hasta I1 e I2 , de tal forma que  se encuentre
dentro del tramo I1 - I2 . Nos haremos ahora dos preguntas: a) ¿cómo calcular los
valores de los extremos de dicho intervalo de manera que contenga el desconocido
valor de ? b) con que confianza, es decir, cual será la probabilidad de que
efectivamente el desconocido valor de  se encuentre dentro de dicho intervalo?
El valor verdadero del lote, esto es , tendrá una cierta probabilidad conocida de
estar situada en el interior de dicho intervalo. Anteriormente hemos visto que el
intervalo: menos una desviación típica y más una desviación típica, alrededor de
la media aritmética, encierra un área de 68.27%, si usamos este concepto en
términos de probabilidades podemos decir que si tomamos una unidad de la
distribución, tenemos una probabilidad del 68.27% de que se encuentre en el
intervalo de mas-menos una desviación típica de la media aritmética.
Con el mismo criterio podemos decir que la probabilidad de que se encuentre en el

intervalo de mas-menos dos desviaciones típicas es del 95.45% y de mas-menos tres
desviaciones típicas del 99.73%
Por otra parte, la variable , es la desviación respecto a la media calculada

con una unidad igual a la desviación normal. Es decir la tabla normal de Gauss es
una distribución donde la desviación típica vale 1 y la media aritmética vale cero.
En consecuencia, la probabilidad de encontrar un valor determinado de z, inferior a

1 y superior a –1, es del 68.27% inferior a 2 y superior a –2, del 95.45% e inferior a 3
y superior a -3, del 99.73%.
En consecuencia, la probabilidad de un valor de z fuera del intervalo 1 a -1, es de

31.73%, fuera del intervalo 2 a -2, del 4.55% y fuera del intervalo 3 a -3, del 0.27%.
Utilizando la Tabla Normal de Gauss, podemos construir la siguiente tabla que nos
será de utilidad para el resto de este capítulo y el siguiente:
% nivel de 99.73 99.0 98.0 96.0 95.45 95.0 90.0 80.0 68.27 50.0 38.30
confianza
z 3 2.58 2.33 2.05 2 1.96 1.645 1.28 1 0.6745 0.500

11.3 Estimación de la media aritmética.
Supongamos que queremos determinar la resistencia a la tracción de un lote de

barras de acero al carbono contenidas en una industria.
De ensayos anteriores, conocemos que la desviación típica poblacional vale 200

Kg./cm2
Extraemos al azar, una muestra de 100 barras y medimos .

¿Qué podemos inferir respecto de la media real ?
Para esto sabemos que:
1) Las medias de las muestras de 100 u, tomadas al azar, tienen como

media general: , (Teorema del Límite Central, Capítulo 10).
2) La desviación normal de las medias, que mide su dispersión alrededor de 

es:
Puesto que n es 100, o sea es mayor de 30, de acuerdo con lo visto en la Teoría del
Muestreo, Capítulo 10, la distribución de las medias de muestreo, será normal.
Supongamos ahora que queremos saber cual es la probabilidad de que el valor

encontrado , no difiera en más de 50 Kg../cm 2de la media de la población : 
Este planteo supone dos hipótesis:
a) 5500 -   50 5500-50  
b)  - 5500  50   5500+50
Y estas expresiones pueden resumirse como:
5500 - 50    5500 + 50
5450    5550

Estos serán los valores extremos que nos interesan, transformemos estos valores en
unidades de la variable z (es ambos lados iguales)
z=
La probabilidad para 2.,5 , según la tabla de Gauss es de 49.38% y por estar a

ambos lados de la media será el doble, esto es 98,76%.
Así pues, podemos decir que existe un 98,76% de probabilidad, de que el
desconocido valor de  , se encuentre entre 5450 Kg./cm 2 y 5550 Kg./cm2.
Y, como consecuencia, la probabilidad de que se encuentre fuera de dicho
intervalo, será 100,00 % – 98.76 % = 1,24 %.
11.4 Margen de error y coeficiente de confianza.
Puesto que con una muestra, estamos infiriendo cual podría ser el valor del
parámetro poblacional, es una consecuencia lógica pensar que la diferencia entre la
conocida y la  desconocida sea considerada como el Error de la Estimación.
Este error será menor, cuando mayor sea la muestra. Lo cual está en línea con todo
lo que se ha venido enseñando, cuanto mayor es la muestra, mejor y más confiable
es la respuesta de la muestra.
Si lo que queremos hacer es una estimación del error que tiene una probabilidad de
ser menor al 5%, significará que el intervalo, que comprende el interior de la curva
gaussiana, será el 95% del área de la curva normal.

5450
5500
5550
Por otra parte, si queremos que afuera del intervalo, exista 5%, como es simétrico,
será, 2,5 % a cada lado del intervalo.
Por lo tanto, si en el interior de la figura, entre ambos límites, tenemos el 95% del
área, de la mitad hacia cualquiera de los dos lados tendremos el 47.5% del área, y si
buscamos en la tablas de Gauss, para el dato más cercanos a dicho a dicho valor,
tenemos que z = 1,96
De acuerdo con lo desarrollado, podemos concluir, que el error de la estimación, de

un 95% va desde z = -1.96 a z = +1.96.
De esta forma llegamos al concepto de Límites de Confianza y es el intervalo dentro

del cual estimamos que puede encontrarse el valor de la Media Poblacional llamada
.
La fórmula generalizada, la podemos describir como sigue:
en el caso que hemos desarrollado, estos límites con 95% de confianza serán:
También podemos expresarlo de esta otra manera:
5461<<5539
Y se expresa que, con un Coeficiente de Confianza del 95% , el desconocido valor

de la media poblacional: , se encuentra entre los Límites de Confianza: 5461 y
5539.

En el cálculo anterior hemos desarrollado los límites de confianza para un margen de

error del 5%, pero de la misma manera podemos rehacer el cálculo para otros
Coeficientes de Confianza, veamos dos ejemplos, para 90% y 99%.
Para el primero, 90% implica un margen de error del 10%, esto es 5% de cada lado.
Para 90% significa 45% a cada lado del cero en la distribución normal de Gauss, por
ello buscamos el z mas cercano a .4500 y encontramos que el valor de z es 1.64.
o bien:
5467<<5533
Esto último significa que, con un margen de error del 10%, o dicho de otra manera,
con una confianza del 90% podemos decir, que el desconocido valor de la media
poblacional se encuentra entre 5467 y 5533.
Rehacemos el cálculo para un 99% de confianza o 1% de error:
o bien:
5449<<5551
Como se puede apreciar, a medida que aumentamos la confianza, los Limites se

abren más, cuando somos menos exigentes, los límites se juntan.
Nivel de Confianza Límites de Confianza
90% 5467<<5533
95% 5461<<5539
99% 5449<<5551
11.5 No siempre se conoce el valor de la desviación típica poblacional.
En el ejemplo anterior se partió de la suposición de que conocíamos el valor de la

desviación típica de la población. En ese caso los cálculos son como se han
mostrado. Pero las fórmulas cambian un poco cuando no se conoce dicho parámetro.
Cuando no se conoce se debe hacer una estimación con una muestra tomada al azar
del lote en estudio, esta muestra deberá ser preferentemente mayor a 30 unidades y
los cálculos deberán contener una corrección dada por la siguiente fórmula:

El valor de  es el que se obtiene de la muestra mayor a 30, y el valor que figura bajo
el signo radical, es el factor que permite estimar, en función del valor hallado, cual
sería el valor del parámetro de la población.
Una vez estimado se hacen los cálculos como se describió anteriormente.
Otra situación que se puede dar es la siguiente, la muestra es menor a 30, pero
conocemos la desviación típica de la población, en ese caso, también procedemos
igual que lo descrito, pues lo que importa es el valor de la población conocido.
Pero, cuando no conocemos la desviación típica poblacional, y la tenemos que
estimar con una muestra de 30 o menos, entonces ya no sirve la distribución
Gaussiana y la estimación vista anteriormente no es válida.
En este caso, se utiliza la llamada Distribución t, que veremos a continuación.
11.6 Distribución t, o Distribución de Student.
Esta distribución se utiliza para muestras pequeñas, el valor de z se reemplaza por el

valor t que es como una z más amplia, debido a la menor confianza que nos brinda la
muestra al ser 30 ó menos.
Esta variable t se encuentra dada en la siguiente tabla y en ella puede observarse
que la columna de la izquierda se titula Grados de Libertad. Esto es uno menos que
el tamaño de la muestra.
Los Grados de Libertad son los valores que se pueden fijar libremente.
La fórmula general para muestras de 30 ó menos y cuando no se conoce el valor de
la desviación típica poblacional es:
donde el valor de  se obtiene a partir de la muestra.

DISTRIBUCIÓN t de Student
El Coeficiente de Confianza está representado por el área interior de la

distribución.
El error está representado por las "colas" a ambos lados de la
distribución.
Confianz
a  0,50 0,75 0,80 0,85 0,90 0,95 0,98 0,99
Error  0,50 0,25 0,20 0,15 0,10 0,05 0,02 0,01
Grados 1 1,000 2,414 3,078 4,165 6,314 12,706 31,821 63,656

De 2 0,816 1,604 1,886 2,282 2,920 4,303 6,965 9,925
Libertad 3 0,765 1,423 1,638 1,924 2,353 3,182 4,541 5,841
 4 0,741 1,344 1,533 1,778 2,132 2,776 3,747 4,604
5 0,727 1,301 1,476 1,699 2,015 2,571 3,365 4,032
6 0,718 1,273 1,440 1,650 1,943 2,447 3,143 3,707
7 0,711 1,254 1,415 1,617 1,895 2,365 2,998 3,499
8 0,706 1,240 1,397 1,592 1,860 2,306 2,896 3,355
9 0,703 1,230 1,383 1,574 1,833 2,262 2,821 3,250
10 0,700 1,221 1,372 1,559 1,812 2,228 2,764 3,169
11 0,697 1,214 1,363 1,548 1,796 2,201 2,718 3,106
12 0,695 1,209 1,356 1,538 1,782 2,179 2,681 3,055
13 0,694 1,204 1,350 1,530 1,771 2,160 2,650 3,012
14 0,692 1,200 1,345 1,523 1,761 2,145 2,624 2,977
15 0,691 1,197 1,341 1,517 1,753 2,131 2,602 2,947
16 0,690 1,194 1,337 1,512 1,746 2,120 2,583 2,921
17 0,689 1,191 1,333 1,508 1,740 2,110 2,567 2,898
18 0,688 1,189 1,330 1,504 1,734 2,101 2,552 2,878
19 0,688 1,187 1,328 1,500 1,729 2,093 2,539 2,861
20 0,687 1,185 1,325 1,497 1,725 2,086 2,528 2,845
21 0,686 1,183 1,323 1,494 1,721 2,080 2,518 2,831
22 0,686 1,182 1,321 1,492 1,717 2,074 2,508 2,819
23 0,685 1,180 1,319 1,489 1,714 2,069 2,500 2,807
24 0,685 1,179 1,318 1,487 1,711 2,064 2,492 2,797
25 0,684 1,178 1,316 1,485 1,708 2,060 2,485 2,787
26 0,684 1,177 1,315 1,483 1,706 2,056 2,479 2,779
27 0,684 1,176 1,314 1,482 1,703 2,052 2,473 2,771
28 0,683 1,175 1,313 1,480 1,701 2,048 2,467 2,763
29 0,683 1,174 1,311 1,479 1,699 2,045 2,462 2,756
30 0,683 1,173 1,310 1,477 1,697 2,042 2,457 2,750
40 0,681 1,167 1,303 1,468 1,684 2,021 2,423 2,704
60 0,679 1,162 1,296 1,458 1,671 2,000 2,390 2,660
120 0,677 1,156 1,289 1,449 1,658 1,980 2,358 2,617

Ejemplo 1:
Para obtener el valor de t que corresponde a un área de 0,10 en ambos extremos de

la distribución combinada, cuando hay 19 grados de libertad, se busca bajo la
columna correspondiente a 0,10 y se baja por ella hasta el renglón de los 19 grados
de libertad; el valor correspondiente de t es 1.729

Ejemplo 2:
Continuando con el ejemplo visto en 11.3, donde queremos determinar la resistencia

a la tracción de un lote de barras de acero al carbono contenidas en una industria.
Extraemos al azar, una muestra de 26 barras y medimos y  =

200 kg/ cm2 ¿Qué podemos inferir respecto de la media real ?
Deseamos pronunciarnos con una confianza del 95%, es decir, con un margen de
error del 5%.
Aplicando la fórmula vista para la distribución t tenemos:
o bien:
5418<<5582
Como puede apreciarse, los límites se han abierto significativamente debido a la falta
de confianza en una muestra chica.
11.7 Intervalos de confianza para las proporciones o porcentajes de

defectuosos.
En 8.1, definimos que, para la distribución Binomial es:

Pero ahora nos interesa solo p, es decir el % defectuoso, para ello dividimos las
fórmulas por el valor de n y nos queda:
Así, la fórmula para los intervalos de confianza para las proporciones o porcentajes
de defectuosos, estará dada por la siguiente expresión:

Capítulo 9
Ejercicios: 9.5, 9.6, 9.7, 9.9, 9.10, 9.11, 9.12, 9.22, 9.23, 9.24, 9.25, 9.26,
9.27, 9.28, 9.30, 9.31, 9.32, 9.33, 9.34.

Capítulo 12
12 Números Índice
12.1 Relaciones de Precios
La Relación de Precios es el cociente entre el precio de un artículo en un período

dado y su precio en otro período, conocido como período base o período de
referencia
Problema
Los precios al por menor, en centavos por libra, del cinc en Usa, durante 1978-84
son:
Año 1978 1979 1980 1981 1982 1983 1984

Precio promedio del 31.0 37.3 37.4 44.6 38.5 41.4 48.6
cinc
a) Con 1978 como base, hallar las relaciones de precios correspondientes a los
años 1982 y 1984
b) Con 1980 como base, hallar las relaciones de precios correspondientes a los años
dados:
Año 1978 1979 1980 1981 1982 1983 1984

Relación de precios 82.9 99.7 100 119.3 102.9 1107 129.9
1980 = 100
c) Usando como base 1978 – 1980, hallar las relaciones de precios

correspondientes a los años dados. Primero hallamos el promedio de precios del
periodo base: 35.2 Segundo dividimos cada precio de la primera tabla:
Año 1978 1979 1980 1981 1982 1983 1984

Relación de precios 88.1 106.0 106.3 126.7 109.4 117.6 138.1
1978-1980 = 100

12.2 Relaciones de Cantidad o de Volumen
Si qo denota la cantidad o volumen de producción, consumo, exportación, etc.,

durante un período base, y q n la correspondiente cantidad producida, consumida,
etc., durante un período dado, definimos:
Problema
La tabla presenta la producción de trigo en Usa de 1977 a 1985. Reducir los datos de
la tabla a relaciones de cantidad usando a) 1982 b) 1977-1980 como base:
Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Producción de trigo 2046 1776 2134 2380 2785 2765 2420 2595 2425
Reducir los datos de la tabla a relaciones de cantidad usando a) 1982 y b) 1977-1980

como base:
a) Se dividen las cifras por 2765:
Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Relación 74.0 64.2 77.2 86.1 100.7 100.0 87.5 93.9 87.7
Cantidad
(1982=100)
b) La media aritmética de los años 1977 – 1980 es 2084, luego se divide la

producción de cada año. ( Comprobación : la suma de los valores del período
dividido 4 = 100)
Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Relación 98.2 85.2 102.4 114.2 133.6 132.7 116.1 124.5 116.4
Cantidad
(1977-1980=100)

12.3 Relaciones de Valor
Si p es el precio de un artículo durante un período y q es la cantidad (o volumen)

Producida, vendida, etc., durante ese período, entonces pq se llama valor total
Si po y qo son el precio y la cantidad de un artículo durante un período base y p n y qn
el precio y la cantidad correspondiente a un período dado, entonces definimos:
Problema
En enero de 1980 una empresa pagó un total de $80.000 a 120 empleados en
nómina.
En Julio de ese mismo año, la empresa tenía 30 trabajadores más en nómina y pagó
$12.000 más que en enero.
a) Con enero de 1980 como base, hallar el número índice de empleo (la relación de
cantidad) para julio.
b) Con enero de 1980 como base, hallar el número índice (relación de valor)
trabajo - gasto para julio.
c) Usando el resultado: relación de precios x relación de cantidad = relación de valor,

¿qué interpretación se le puede dar a la relación de precios en éste caso?
Solución:
a) El número índice de empleo es:
b) El número índice trabajo – gasto es:
c) Despejando de la relación indicada;
Este es un número índice de costo por empleado. Significa que en julio de 1980 el
costo por empleado era el 92% del de enero de 1980.

12.4 Relaciones de Enlace y en Cadena
Si p1, p2, p3,... representan los precios durante intervalos sucesivos de tiempo 1, 2, 3 ...,
Entonces p1/2, p2/3, p3/4, ... representan las relaciones de precios de cada intervalo
respecto al intervalo de tiempo precedente y se llaman: Relaciones de enlace
Cuando se interpretan una a continuación de otra y se lee la variación entre un
tiempo y otro forman una Cadena que muestra la variación del precio entre dichos
dos instantes de tiempo.
Problema
Supongamos que tenemos que actualizar el monto del arriendo de un departamento
que en el mes de Diciembre fue de $100.000,
a) Se desea saber cual será, actualizado el monto en el mes de Julio del siguiente
año.
b) Cual será la variación del precio entre Abril y Junio.
La información disponible son los índices de variación de precios al consumidor (IPC)
de cada mes:
Enero 1.1% Abril 0.5%

Febrero 0.9% Mayo 0.9%
Marzo 1.5% Junio 1.2%
Solución:
a) En primer término se debe escribir la relación de enlace, en forma de índice, para
cada dato mensual:
Enero 1.011 Abril 1.005

Febrero 1.009 Mayo 1.009
Marzo 1.015 Junio 1.012
Luego se calcula el producto de todos ellos:

1.011*1.009*1.015*1.005*1.009*1.012 = 1.0625
Este cálculo indica que la variación de precios a sido del 6.25% en los 6 meses
estudiados. Este cálculo es una cadena de 6 meses.
El producto de 1.0625 por el valor del arriendo en Diciembre nos indica el valor que
deberá cobrarse en Julio. El resultado es: $ 106.250
c) La variación de precios entre Abril y Junio será:
1.005*1.009*1.012 = 1.0262
Esto es el 2.62 %

12.5 El método de agregación simple
Es el cociente del precio total de los artículos en el año dado, p n y el precio total de
los artículos en el año base, po. Se expresa en forma porcentual.
Desventajas del método

1) No tiene en cuenta la importancia relativa de cada artículo.
2) El tipo de unidades escogidas al anotar los precios afectan al índice.
(kg. o gr. , litros o mililitros, etc.)
Problema
La tabla muestra los precios al por mayor y las producciones en Usa de leche,
mantequilla y queso para 1980, 1981, y 1985. Calcular un índice de precios al por
mayor por agregación de estos productos para el año 1985, tomando como base :
a) 1980 y b) 1980 – 1981.
Precios (centavos por libra) 1980 1981 1985

Leche 13.2 14.0 12.9
Mantequilla 139.3 148.0 141.1
Queso 156.2 167.2 162.0
a) El índice de precios por agregación simple es:
b) El precio promedio 1980-1981:

De la leche: 13.5, de la mantequilla: 143.7 y del queso: 161.7
Por lo tanto el índice de precios por agregación simple es:
En la práctica la cantidad de artículos que integran un índice es muy grande y

conforman una “canasta” .

12.6 El método del promedio simple de relaciones
Método de la media aritmética.
Este método mejora respecto al anterior en que ya no tiene la segunda desventaja,

pero, conserva la primera.
Problema
Calcular un índice de precios al por mayor para el año 1985, usando 1980 como
base.
Precios (centavos por libra) 1980 1981 1985

Leche 13.23 13.95 12.90
Mantequilla 139.3 148.0 141.1
Queso 156.2 167.2 162.0
Relación de precios.
De la leche: 12.90/13.23= 97.5%

De la mantequilla: 141.1/139.3=101.3%
Del queso: 162.0/156.2=103.7%

12.7 El método de agregación ponderada
Con el fin de evitar las desventajas del método de agregación simple, asignamos un
peso al precio de cada artículo, en general la cantidad vendida durante el año base,
durante el año dado o durante algún año típico. Tales pesos indican la importancia
del artículo en cuestión. Se usan las siguientes fórmulas de pendiendo de p o y pn,
1. Indice de Laspeyres o método del año base:
El término poqo recibe el nombre de “canasta”
2. Indice de Paasche o método del año dado:

12.7.1 El método de agregación ponderada por el Indice de Laspeyres o método

del año base:
Problema
Precios (centavos por libra) Cantidad ( millones de libras)
Años 1980 1981 1985 1980 1981 1985
Leche 13,23 13,95 12,90 128500 132800 143700
Mantequilla 139,3 148,0 141,1 1145 1228 1248
Queso 156,2 167,2 162,0 2381 2664 2854
Con los datos de la tabla calcular el índice de Laspeyres para 1985 con a) 1980 b)
con 1980-1981 de base:
a)
b)
Este ejercicio de debe realizar en clase formando grupos de alumnos.

12.7.2 El método de agregación ponderada por el Indice de Paasche o método

del año dado:
Problema
Precios (centavos por libra) Cantidad ( millones de
libras)
Años 1980 1981 1985 1980 1981 1985
Leche 13,23 13,95 12,90 128500 132800 143700
Mantequilla 139,3 148,0 141,1 1145 1228 1248
Queso 156,2 167,2 162,0 2381 2664 2854
Con los datos de la tabla calcular el índice de Paasche para 1985 con a) 1980 b)
con 1980-1981 de base:
a) Base: 1980
b) Base: 1980 - 1981

12.8 Deflación de series en el tiempo
Aunque los ingresos de las personas pueden estar creciendo teóricamente durante
un cierto número de años, sus ingresos reales pueden estar disminuyendo debido al
costo de la vida, y por lo tanto puede estar disminuyendo su poder adquisitivo. Es
decir que con la misma plata se compra menos productos. Calculamos los ingresos
reales dividiendo los ingresos aparentes de cada año por el número índice del costo
de la vida en ese año, usando un período bases adecuado.
Ejemplo: Una persona gana en 1980 150% de lo que ganaba en 1970 significa un
crecimiento del 50%. Sien el mismo período el costo de vida creció al 200% entonces
su ingreso real son solo 150/2 = 75% de lo que era en 1970.
Problema
La tabla muestra el salario semanal medio de los trabajadores en el comercio
minorista de Usa durante 1973-1983. También contiene el índice de precios al
consumo para esos años, con 1972 como base. En términos del salario medio de
1973, determinar sus salarios reales en los años 1973-1983.
Año
1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983
Salario 96.32 102.68 108.86 114.60 121.66 130.20 138.62 147.38 158.03 163.85 171.05
Indice
de 106.2 117.9 128.7 136.1 144.9 155.9 173.5 197.0 217.4 230.7 238.1
precio
Solución:
Hallamos primero un número índice de precios al consumo con 1973 como base, dividiendo
todos los números de la fila de abajo en la tabla por 106.2, en %, Luego se divide cada salario
promedio por el correspondiente número índice para obtener los salarios reales.
Año 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983
Indice
(1973 100.0 111.0 121.2 128.2 136.4 146.8 163.4 185.5 204.7 217.2 224.2
=100)
Salario
96.32 92.50 89.82 89.39 89.19 88.69 84.83 79.45 77.20 75.44 76.29
real
El salario real a 1983 es 171.05/224.2%=76.29. Los salarios se han casi doblado, los
salarios reales han decrecido, el salario real en 1983 era 20 pesos menor que el de
1973. En síntesis, el poder adquisitivo disminuyó en 20/96.32=21%


Capítulo 19: 19.1, 19.4, 19.5, 19.7, 19.8, 19.13, 19.20, 19.39, 19.41, 19.45, 19.48,
19.49, 19.50, 19.51, 19.52, 19.53, 19.55, 19.57, 19.61, 19.62, 19.77

Capítulo 13
13 Series en el tiempo.
13.1 Análisis de series en el tiempo
Una serie en el tiempo son observaciones tomadas en momentos determinados

preferentemente a intervalos regulares. Normalmente estas observaciones se
grafican dando así los llamados Gráficos de series de Tiempo.
Para explicar en que consiste el análisis que nos interesa, recurriremos a un ejemplo
tomado del libro de Estadística de M. Spieguel. Se trata de la Producción de energía
eléctrica no industrial en E.E.U.U. en el período 1976-1981.
En este gráfico podremos describir dos tipos de observaciones, dependiendo de que
es lo que queremos averiguar.
La primera observación del comportamiento alterno, si se quiere violento en sus
variaciones, es que el conjunto muestra una tendencia a crecer, a incrementarse con
el tiempo.
La segunda observación será que las ondulaciones del gráfico sugieren variaciones
estacionales donde se repiten situaciones sucesivas de crecimientos muy rápidos
seguidos de depresiones de casi iguales características.
El análisis de la serie va a depender, precisamente, del tipo de información que
necesitamos.
Si lo que buscamos es el comportamiento al largo plazo, nos va a proporcionar la
información requerida una regresión lineal o un análisis de la tendencia. Cualquiera
de estos dos procedimientos, nos proporciona una recta que pasa por los lugares
mas cercanos a todos los puntos representando así a todo el conjunto. Estas rectas
se utilizan especialmente para predecir. Este concepto correlación y regresión, ya
fue visto en el Capítulo 9 de este Apunte.
Pero, si lo que nos interesa son las fluctuaciones en el corto y mediano plazo, nos
interesará conocer las causas de las fluctuaciones, predecirlas pero en el corto plazo,
ver la regularidad, si existe, de dichos ciclos. para eso lo que nos conviene es
suavizar las movimientos enérgicos de los datos individuales, y para ello
recurriremos a los llamados Promedios Móviles.
La función de estos Promedios Móviles es disminuir la variación de los datos
individuales y los transforma de ondas más suaves donde podemos analizar la
periodicidad, si existe, asimilarla a períodos temporales como invierno, verano, noche
y día, o cualquier otra causa que pudiera deducirse como responsables de las
variaciones que se estudian.
Existen promedios móviles para tres períodos, cinco períodos, siete, etc. Es
preferible por razones que veremos adelante utilizar promedios móviles impares
para poder representar los gráficos correctamente.
Si por necesidad se utiliza un promedio móvil par, se lo denomina no centrado.
Los promedios móviles no centrados pueden centrarse, repitiendo los
promedios de nuevo, pero utilizando la misma serie obtenida.

A continuación se analiza cada caso.

En las dos primeras páginas figuran en columnas: a) los períodos estudiados, b) los
valores correspondientes a cada período considerado (consumos mensuales), c) los
valores que describen la Tendencia, d) los valores que describen la Recta de
Regresión, e) los Promedios Móviles de tres meses, f) los Promedios Móviles de 5
meses.
Los gráficos muestran sucesivamente:

Gráfico 1: La variación de los consumos mensuales
Gráfico 2: Las rectas de Tendencia y de Regresión Lineal correspondientes a
los consumos anteriores.
Gráfico 3: El Promedio Móvil de 3 meses
Gráfico 4: El Promedio Móvil de 5 meses.
Gráfico 5 : Todos los gráficos juntos.
La interpretación sería la siguiente:
El consumo muestra un crecimiento sostenido a lo largo del período estudiado. El
incremento del período puede estimarse en 13% considerando los promedios del
primero y el último año.
El promedio móvil de 3 meses es insuficiente para descubrir las variaciones
estacionales, pero el de 5 meses muestra claramente 6 variaciones estacionales
correspondientes a los años estudiados, estas variaciones estacionales anuales
corresponden al incremento de consumo en los meses de invierno y su decrecimiento
en la temporada de verano.
Por otra parte, debemos considerar lo siguiente, los promedios móviles estudiados de
3 y 5 meses se los llama centrados pues el valor hallado puede asignarse al mes del
medio de la serie. Si por alguna razón se toma un número par de meses, el valor
obtenido se lo denomina no centrado pues el valor hallado se encuentra entre los
dos valores centrales, y esto debe tenerse en cuenta en caso de necesitar
graficarlos. Una buena solución es volver a promediar de a pares los valores
obtenidos con lo que se vuelven a centrar. Este caso se discute en clase.
Hemos mencionado hasta ahora dos tipos de movimientos de las series estacionales,
al primero lo hemos denominado tendencia y recibe también el nombre de
movimiento secular o de largo plazo. Al segundo lo llamamos variaciones
estacionales que se suceden dentro del año, pero estos no son los únicos
movimientos de una serie, existen los llamados ciclos con las mismas características
que los estacionales, pero que no se ajustan a un período anual sino que pueden ser
menores o mayores a un año, son muy conocidos los llamados ciclos económicos
que representan prosperidad, recesión, depresión y recuperación. Otro caso pueden
ser los llamados Movimientos irregulares o aleatorios, estos movimientos se
producen a consecuencia de hechos muy significativos, como puede ser guerra,
terremotos y otros que producen un cambio del escenario que hasta ahora
funcionaba y este cambio producirá una interferencia muy importante hasta que se
establezca un nuevo panorama, que permita nuevamente la predicción estadística.
TIEMPO VALORES TENDENCIA REGRESION PROMEDIO PROMEDIO

MENSUALES MOVIL DE MOVIL DE
TRES MESES CINCO
MESES

1976 ERO 178,2 170,5 169,9

FRO 156,7 170,8 170,3 166,4
MZO 164,2 171,2 170,6 158,0 162,0
ABR 153,2 171,5 171,0 158,3 160,8
MYO 157,5 171,9 171,4 161,1 166,7
JUN 172,6 172,3 171,7 172,0 171,0
JUL 185,9 172,6 172,1 181,4 173,4
AGO 185,8 173,0 172,4 178,9 174,6
SET 165,0 173,4 172,8 171,5 173,9
OCT 163,6 173,7 173,2 165,9 173,3
NOV 169,0 174,1 173,5 171,9 175,4
1977 DIC 183,1 174,4 173,9 182,8 175,0
ERO 196,3 174,8 174,2 180,7 176,0
FRO 162,8 175,2 174,6 175,9 173,5
MZO 168,6 175,5 175,0 162,8 170,6
ABR 156,9 175,9 175,3 164,6 167,3
MYO 168,2 176,2 175,7 168,4 174,4
JUN 180,2 176,6 176,1 182,1 179,8
JUL 197,9 177,0 176,4 191,3 183,6
AGO 195,9 177,3 176,8 189,9 183,3
SET 176,0 177,7 177,1 179,4 180,5
OCT 166,4 178,0 177,5 169,6 177,7
NOV 166,3 178,4 177,9 172,2 178,0
1978 DIC 183,9 178,8 178,2 182,5 177,5
ERO 197,3 179,1 178,6 185,0 178,9
FRO 173,7 179,5 178,9 181,4 177,6
MZO 173,2 179,8 179,3 168,9 175,8
ABR 159,7 180,2 179,7 169,4 173,8
MYO 175,2 180,6 180,0 174,1 179,6
JUN 187,4 180,9 180,4 188,4 186,1
JUL 202,6 181,3 180,8 198,5 191,3
AGO 205,6 181,7 181,1 197,9 191,4
SET 185,6 182,0 181,5 188,9 189,1
OCT 175,6 182,4 181,8 179,2 187,0
NOV 176,3 182,7 182,2 181,2 187,7
1979 DIC 191,7 183,1 182,6 192,5 187,9
ERO 209,5 183,5 182,9 195,8 189,4
FRO 186,3 183,8 183,3 192,9 188,0
MZO 183,0 184,2 183,6 179,6 185,3
ABR 169,5 184,5 184,0 176,9 180,7
MYO 178,2 184,9 184,4 178,1 184,0
JUN 186,7 185,3 184,7 189,1 188,3
JUL 202,4 185,6 185,1 198,0 190,6
AGO 204,9 186,0 185,5 196,0 190,9
SET 180,6 186,3 185,8 188,4 189,0
OCT 179,8 186,7 186,2 179,3 186,3
NOV 177,4 187,1 186,5 182,0 185,3
1980 DIC 188,9 187,4 186,9 188,8 187,0
ERO 200,0 187,8 187,3 192,5 188,5
FRO 188,7 188,1 187,6 192,1 186,7
MZO 187,5 188,5 188,0 181,6 184,1

ABR 168,6 188,9 188,4 177,3 182,0

MYO 175,7 189,2 188,7 177,9 187,5
JUN 189,4 189,6 189,1 193,7 193,0
JUL 216,1 189,9 189,4 207,0 197,6
AGO 215,4 190,3 189,8 207,6 198,2
SET 191,4 190,7 190,2 195,1 196,0
OCT 178,5 191,0 190,5 182,8 191,9
NOV 178,6 191,4 190,9 184,2 189,9
1981 DIC 195,6 191,8 191,2 193,1 187,5
ERO 205,2 192,1 191,6 193,5 188,9
FRO 179,6 192,5 192,0 190,1 187,6
MZO 185,4 192,8 192,3 179,1 184,1
ABR 172,4 193,2 192,7 178,5 183,6
MYO 177,7 193,6 193,1 184,3 191,7
JUN 202,7 193,9 193,4 200,2 196,6
JUL 220,2 194,3 193,8 211,0 199,5
AGO 210,2 194,6 194,1 205,8 200,3
SET 186,9 195,0 194,5 192,8 194,9
OCT 181,4 195,4 194,9 181,3 189,9
NOV 175,6 195,7 195,2 184,2
DIC 195,6 196,1 195,6





13.2 Estimación de las variaciones Estacionales. El Indice Estacional.
Utilizando los mismos datos anteriores, procederemos a calcular los índices

estacionales para el período dado.
La siguiente tabla repite los datos pero ordenados para poder realizar los cálculos en
forma ordenada.
Ero Fro Mzo Abr Myo Jun Jul Ago Set Oct Nov Dic
1976 178.2 156.7 164.2 153.2 157.5 172.6 185.9 185.8 165.0 163.6 169.0 183.1
1977 196.6 162.8 168.6 156.9 168.2 180.2 197.9 195.9 176.0 166.4 166.3 183.9
1978 197.3 173.7 173.2 159.7 175.2 187.4 202.6 205.6 185.6 175.6 176.3 191.7
1979 209.5 186.3 183.0 169.5 178.2 186.7 202.4 204.9 180.6 179.8 177.4 188.9
1980 200.0 188.7 187.5 168.6 175.7 189.4 216.1 215.4 191.5 178.5 178.6 195.6
1981 205.2 179.6 185.4 172.4 177.7 202.7 220.2 210.2 186.9 181.4 175.6 195.6
A continuación procederemos a calcular los promedios mensuales para cada año:
AÑO PROMEDIO ANUAL

1976 169.6
1977 176.6
1978 183.7
1979 187.3
1980 190.5
1981 191.1
Utilizando cada promedio mensual, transformaremos cada valor mensual de la
primera tabla en un índice, de la forma siguiente: 178.2/169.6 = 105.1%
ERO FRO MZA ABR MYO JUN JUL AGO SET OCT NOV DIC
1976 105.1 92.4 96.8 90.3 92.9 101.8 109.6 109.6 97.3 96.5 99.6 108.0
1977 111.2 92.2 95.5 88.8 95.2 102.0 112.1 110.9 99.7 94.2 94.2 104.1
1978 107.4 94.6 94.3 86.9 95.4 102.0 110.3 111.9 101.0 95.6 96.0 104.4
1979 111.9 99.5 97.7 90.5 95.1 99.7 108.1 109.4 96.4 96.0 94.7 100.9
1980 105.0 99.1 98.4 88.5 92.2 99.4 113.4 113.1 100.5 93.7 93.8 102.7
1981 107.4 94.0 97.0 90.2 93.0 106.1 115.2 110.0 97.8 94.9 91.9 102.4
Total 648.0 571.8 579.7 535.2 563.8 611.0 668.7 664.9 592.7 570.9 570.2 622.5
108.0 95.3 96.6 89.2 94.0 101.8 111.5 110.8 98.8 95.2 95.0 103.8
Media

Esta última fila son los datos buscados y representan los índices Estacionales


Capítulo 13: 18.1, 18.3, 18.6, 18.7, 18.9, 18.17, 18.18, 18.19, 18.21, 18.32, 18.36,
18.42

Capitulo 14
14 Pruebas de Hipótesis
Los casos prácticos de la toma de decisiones, se ven muchas veces ayudados por
pruebas estadísticas que nos ayudan a decidir si algo es diferente que otro, si ambos
pertenecen a una misma familia o si son estadísticamente diferentes. Estos
procedimientos estadísticos tienen la virtud de que se puede conocer el riesgo que se
tiene al tomar las diferentes decisiones.
14.1 Hipótesis Estadísticas
El siguiente procedimiento es un método formal (y antiguo) de mencionar las

diferentes alternativas de decisiones.
Hipótesis nula = H0
Esta hipótesis se plantea con el propósito de probar si lo que se dice es verdad y se
plantea lo inverso como alternativa. Se dice que no es verdad lo que se quiere
demostrar. Por ejemplo, si sospechamos que una moneda es falsa y queremos
demostrarlo, partimos de la Hipótesis Nula de que la moneda es buena.
Esta Hipótesis la designaremos como H0.
Hipótesis Alternativa = H1
Todo lo que difiera de la Hipótesis Nula, se denomina Hipótesis Alternativa.
Por ejemplo, si una Hipótesis Nula, fuera p = 0,5, Hipótesis Alternativa, podría ser:
P = 0,7 ó p  0,5 ó p > 0,5 etc.
La Hipótesis Alternativa se denota como H1.
14.2 Contrastes de Hipótesis y significación, o reglas de decisión.
En ciertas circunstancias, la información que rodea un experimento sustenta la idea

de que algo es de determinada manera, pero los resultados de los ensayos no
parecen apoyar nuestra presunción. En esas circunstancias, diremos que los
resultados resultan significativamente diferentes y nos veremos inclinados a rechazar
la hipótesis o al menos a no aceptarla.
Por ejemplo, supongamos que tenemos un dado que creemos bueno, pero al
arrojarlo 60 veces el 1 aparece 18 veces, esto esta muy alejado de las probables 10
veces que serian si el dado esta bueno, por ello nos vemos inclinados a rechazar la
Hipótesis de que el dado es bueno. Sin embargo, la duda es factible, pues solo por
azar, el 1 podría salir 18 veces, existe una probabilidad mensurable que apoya que
eso es posible, sin que el dado este realmente malo.
Los ensayos, test o contrastes de hipótesis, significación o reglas de decisión, nos

ayudan a decidir si aceptamos o rechazamos las Hipótesis.

14.3 Errores de Tipo I y de Tipo II
Tipo I: Es rechazar H0 lo que escuando es verdad.
Tipo II: Es aceptar H0 cuando es falsa. lo que es falso
Decisión Si es H0 Verdad Si es H0 Falsa

Acepto H0 Decisión correcta Error de Tipo II
Rechazo H0 Error de Tipo I Decisión correcta
Las reglas de decisión se diseñan para que los errores de tipo I y II sean los menores
posibles, pero no es sencillo, pues cuando se minimiza unos de ellos, va en perjuicio
del otro. La única forma de minimizar los dos tipos de errores es aumentando el
tamaño de la muestra, y eso no es siempre posible.
14.4 Nivel de significación
Cuando hacemos un contraste de hipótesis debemos considerar, antes de realizar el

ensayo, cual será el riesgo que estaremos dispuestos dispuetos a correr respecto del
error Tipo I, o sea de rechazar algo que es verdad. Este riesgo, expresado como
probabilidad, e indicado como , será el máximo que estamos dispuesto a tolerar y lo
llamaremos Nivel de Significación del test de Hipótesis.
En la práctica es frecuente un nivel de significación de 0,05 ó 0,01, aunque hay

otros.
Si se escoge 0,05 (5%), al diseñar una regla de decisión, significa que hay 5
oportunidades entre 100 de rechazar la hipótesis cuando se debiera haber aprobado.
Es decir, tenemos un 95% de confianza de que hemos adoptado la decisión
correcta. En este caso decimos que la hipótesis ha sido rechazada al nivel de
significación 0,05, lo cual quiere decir que la hipótesis tiene una probabilidad 0,05 de
ser falsa.

14.5 Contrastes mediante la distribución normal
La figura nos muestra que podemos tener 95% de confianza de que si la hipótesis
es verdadera, el valor de z para un estadístico de la muestra S, estará
comprendida entre -1.96 y +1.96. Por otra parte, si al sacar una muestra y calcular su
estadístico, y determinar su correspondiente valor de z nos da un valor fuera del
intervalo indicado, podremos concluir que dicho evento, podría suceder solo en el
5% de los casos y por ello nos veríamos inclinados a rechazar la hipótesis. Así
decimos que se rechaza a un nivel de significancia del 0.05. o que el valor de z es
significativo al nivel 0.05.
El conjunto de z fuera del rango –1.96 a +1.96 se llama región crítica de la
hipótesis, región de rechazo de la hipótesis o región de significación. El
conjunto de z en el rango interior se conoce como región de aceptación de la
hipótesis o región de no significación.

Finalmente, las reglas de decisión, o contraste de hipótesis o significación, son las

siguientes:
Alternativa 1
Rechazar la hipótesis al nivel de significación 0.05 si el valor de z para el estadístico

s esta fuera del rango -1.96 y +1.96. Esto significa que el estadístico de la muestra
es significativo al nivel 0.05.
Alternativa 2
Aceptar la hipótesis en caso contrario o bien, no tomar decisión alguna.
Los ejemplos fueron hechos al nivel 0.05 pero podría ser cualquier otro valor
sustituyendo el 1.96.
La siguiente tabla ilustra las alternativas
Nivel de significancia,  0.10 0.05 0.025 0.01 0.005 0.002

Valores críticos de z para -1.28 o -1.645 o -1.96 o -2.33 o -2.58 o -2.88 o
tests unilaterales +1.28 +1.645 +1.96 +2.33 +2.58 +2.88
Valores críticos de z para -1.645 y -1.96 y -2.24 y -2.58 y -2.81 -3.08 y
tests bilaterales. 1.645 1.96 2.24 2.58 y 2.81 3.08

14.6 Tres distintos niveles de significación:ncia.

En el primero y segundo caso, podríamos aceptar la hipótesis nula de que la media

de la población es igual al valor supuesto, pero en el tercer caso sería rechazada,
pues allí nuestro nivel de significancia, 0.50 está tan alto que rara vez la
aceptaremos, cuando no sea verdadera, pero, al mismo tiempo, frecuentemente la
rechazaremos aunque sea verdadera.
Por otra parte, aún cuando el estadístico de la muestra no caiga en la región crítica
no prueba que la Hipótesis nula es verdadera, simplemente, no ofrece videncia
estadística para rechazarla. La única manera de aceptarla o rechazarla con
certidumbre sería si conociéramos el verdadero valor del parámetro de la población,
pero normalmente ese valor, no lo conocemos.
14.7 Selección de un nivel de significancia
No existe un nivel de significancia “oficial" con el cual probar una hipótesis, en

algunos casos conviene al 5%, en otros el 1% de significancia.
Cuanto más alto sea el nivel de significancia que utilizaremos al probar una
hipótesis, mayores probabilidades habrá de rechazar una hipótesis nula que
sea verdadera, (Error Tipo I).
14.8 Uso de la distribución t para la toma de decisiones.
Luego de decidir que nivel de significancia usar, el siguiente paso en la prueba de

Hipótesis consiste en determinar la distribución adecuada de probabilidad. Tenemos
una opción entre la distribución normal y la distribución t.
Condiciones para usar la Distribución Normal y la distribución t en las pruebas

de hipótesis de medias.
Si se conoce  Si no se conoce 
n > 30 Distribución Normal, tabla z Distribución Normal, tabla z
n ≤ 30 y la población Distribución Normal, tabla z Distribución Student, tabla t
normal o aprox. normal
14.9 Ejercicios de aplicación desarrollados.

Ejemplo 1
Una tienda de artículos deportivos ha iniciado una promoción especial para sus
esquís de alta montaña y piensa que la promoción deberá culminar en un cambio de
precio. Sabe que, antes de comenzar la promoción, el precio promedio, al menudeo
del esquí, era de $41,95 con  = $5.36. La tienda saca una muestra en 16 de sus
detallistas y descubre que el precio promedio de los esquís, es ahora $38.95. En un
nivel de significancia de 0.02 ¿tiene motivos para pensar que el precio promedio al
menudeo ha disminuido?
= $38.95 H0 :  = $41.95
n = 16 H1 :  < $41.95
H0 = $41.95 ’ = $ 5.36
Para un nivel de significancia = 0,02 tendremos que z = 2,05, entonces:
41.95-2,05*1.34=39.2
En consecuencia el promedio de la muestra, 38.95 cae en la zona de rechazo y por

ello no se acepta la Hipótesis nula, y la tienda deberá pensar que el precio ha
disminuido.
Ejemplo 2
La comisión promedio que cobran las empresas norteamericanas de servicios

completos de corretaje en las ventas de acciones comunes es de $144, con una
desviación típica de $52. Un corredor ha extraído una muestra de 121
transacciones de sus clientes y determinó que pagaron una comisión promedio de
$151. En un nivel de significación de 0,10, ¿podemos decir que las comisiones de
su cliente son superiores al promedio de la industria?

= $151
n = 121
H0 = $144
’ = $ 52
H0 :  = $144
H1 :  > $144
Para un nivel de significación = 0,10 tendremos que z = 1.28, entonces:
144+1.28*4.73=150
El valor $151 entra en la zona de rechazo.
Se rechaza la Hipótesis nula, las comisiones son significativamente más altas, o

sea se acepta la Hipótesis de alternativa. Y podemos decir que las comisiones son
superiores al promedio de la industria.
Ejemplo 3
Una empresa industrial supone que la vida de sus prensas rotativas es de 14.500
horas, con una desviación típica de 2.100 horas.
De una muestra de 25 prensas la compañía obtiene una media muestral de 13.000
horas. En un nivel de significación de 0,01 ¿debe la compañía concluir que la vida
media de las prensas es menor que las 14.500 supuestas?
= 13.000 Hs. H0 :  = 14.500Hs.

n = 25 H1 :  < 14.500Hs.
H0 = 14.500Hs.
Hs.
’ = 2.100Hs.
Para un nivel de significancia = 0,01 tendremos que z = 2.33, entonces:
14.500 - 2.33 * 420=13.521Hs.
Por lo tanto se rechaza la Hipótesis nula, el promedio de vida es significativamente

más bajo.


Capítulo 10.1, 10.2, 10.6, 10.7, 10.8, 10.9, 10.34, 10.36

Capítulo 15
15 Análisis de Varianza
15.1 Distribución F
La razón F llamada también razón de varianzas, se utiliza para probar la hipótesis

referida a la igualdad de dos varianzas poblacionales estimadas. Se la utiliza para
analizar diferencias entre varianzas de muestras.
Supongamos tener una población gaussiana y que extraemos de ella dos muestras
de tamaño n1 y n2 . De cada muestra calculamos la desviación típica, S 1 y S2. La
razón F se expresa así:
El mayor valor de la varianza va colocado como dividendo y el menor como

divisor.
En el caso que se describe donde partimos sacando dos muestras de la misma

población, no tenemos duda de que las varianzas serán muy parecidas y por ello F
será muy próxima a uno.
Cuando no está cerca de uno nos preguntamos si ello puede ser debido al azar o
bien a otra causa, por ejemplo, que las muestras no sean de dos poblaciones iguales.
Esta variable F se distribuye como otras poblaciones de muestreo, y su forma

depende solo de la cantidad de datos que se tengan disponibles para la estimación
del numerador de s2 y los que se tengan para la estimación del denominador
Al final de este capítulo se incluye dos tablas de la distribución F para probabilidad

1% y 5%. Así para n1 = 6 y n2 = 13, el valor crítico es 3.11 (se busca para 5 y 12, es
decir para n-1 grados de libertad). Esto significa que existe una probabilidad del 5%
de obtener una F mayor al 3.11 solo por motivos de azar. Por ello si se supera este
valor, tendremos la posibilidad de rechazar la H0.
El esquema de cálculo se basa en obtener una estimación de la varianza partiendo

de la columnas de los datos que se analizan, esto nos dará una varianza llamada Vc,
luego procedemos a estimar nuevamente la varianza pero desde otro punto de vista,
esto es empleando la relación que existe entre la varianza de una media de muestra
y la varianza de la población.
El esquema siguiente explica el método:
15.2 Análisis de Varianza y Cálculo de F, con una variable de clasificación.
Problema
Los siguientes datos dan los rendimientos de un producto químico, obtenido de
intentar 4 catalizadores diferentes en el proceso. Probar que los rendimientos se ven
afectados por los catalizadores. Se solicita probar con una probabilidad de
equivocarse del 5%, que los catalizadores afectan al rendimiento, por ello partiremos

de la H0 = 1=2=3=4 . Este planteo es lo opuesto. Es decir si H0 fuera cierta, los

catalizadores no producen efecto en los rendimientos. Los datos experimentales son:
Cálculo de la varianza de las medias:

(variabilidad entre las columnas, variación
entre tratamientos)
I II III IV
36 35 35 34
33 37 39 31
35 36 37 35
34 35 38 32
32 37 39 34
34 36 38 33
34.00 36.00 37.67 33.17
Cálculo de F:
Cálculo de las varianzas por columnas: (variabilidad
dentro de las columnas, dentro del tratamiento)
n-1 1.41 0.89 1.51 1.47
2 2.00 0.79 2.28 2.16
De tablas al 5%: Conclusión:
Para: V1 = 3 y V2 = 20 Se rechaza la Hipótesis de que

el catalizador no tiene efecto en
Es : F0=3.10 los rendimientos.

Distribuciones de F 1%
1% 1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 40 100
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6143 6170 6209 6286 6334
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42 99,43 99,44 99,45 99,48 99,49
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05 26,92 26,83 26,69 26,41 26,24
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37 14,25 14,15 14,02 13,75 13,58
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,77 9,68 9,55 9,29 9,13
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7,60 7,52 7,40 7,14 6,99
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47 6,36 6,28 6,16 5,91 5,75
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67 5,56 5,48 5,36 5,12 4,96
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11 5,01 4,92 4,81 4,57 4,41
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71 4,60 4,52 4,41 4,17 4,01
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40 4,29 4,21 4,10 3,86 3,71
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16 4,05 3,97 3,86 3,62 3,47
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96 3,86 3,78 3,66 3,43 3,27
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80 3,70 3,62 3,51 3,27 3,11
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67 3,56 3,49 3,37 3,13 2,98
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55 3,45 3,37 3,26 3,02 2,86
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46 3,35 3,27 3,16 2,92 2,76
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,43 3,37 3,27 3,19 3,08 2,84 2,68
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30 3,19 3,12 3,00 2,76 2,60
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23 3,13 3,05 2,94 2,69 2,54
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17 3,07 2,99 2,88 2,64 2,48
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12 3,02 2,94 2,83 2,58 2,42
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,14 3,07 2,97 2,89 2,78 2,54 2,37
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03 2,93 2,85 2,74 2,49 2,33
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,06 2,99 2,89 2,81 2,70 2,45 2,29
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96 2,86 2,78 2,66 2,42 2,25
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,99 2,93 2,82 2,75 2,63 2,38 2,22
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,96 2,90 2,79 2,72 2,60 2,35 2,19
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,93 2,87 2,77 2,69 2,57 2,33 2,16
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,91 2,84 2,74 2,66 2,55 2,30 2,13
31 7,53 5,36 4,48 3,99 3,67 3,45 3,28 3,15 3,04 2,96 2,88 2,82 2,72 2,64 2,52 2,27 2,11
32 7,50 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02 2,93 2,86 2,80 2,70 2,62 2,50 2,25 2,08
33 7,47 5,31 4,44 3,95 3,63 3,41 3,24 3,11 3,00 2,91 2,84 2,78 2,68 2,60 2,48 2,23 2,06
34 7,44 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98 2,89 2,82 2,76 2,66 2,58 2,46 2,21 2,04
35 7,42 5,27 4,40 3,91 3,59 3,37 3,20 3,07 2,96 2,88 2,80 2,74 2,64 2,56 2,44 2,19 2,02
36 7,40 5,25 4,38 3,89 3,57 3,35 3,18 3,05 2,95 2,86 2,79 2,72 2,62 2,54 2,43 2,18 2,00
37 7,37 5,23 4,36 3,87 3,56 3,33 3,17 3,04 2,93 2,84 2,77 2,71 2,61 2,53 2,41 2,16 1,98
38 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92 2,83 2,75 2,69 2,59 2,51 2,40 2,14 1,97
39 7,33 5,19 4,33 3,84 3,53 3,30 3,14 3,01 2,90 2,81 2,74 2,68 2,58 2,50 2,38 2,13 1,95
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66 2,56 2,48 2,37 2,11 1,94
41 7,30 5,16 4,30 3,81 3,50 3,28 3,11 2,98 2,87 2,79 2,71 2,65 2,55 2,47 2,36 2,10 1,92
42 7,28 5,15 4,29 3,80 3,49 3,27 3,10 2,97 2,86 2,78 2,70 2,64 2,54 2,46 2,34 2,09 1,91
43 7,26 5,14 4,27 3,79 3,48 3,25 3,09 2,96 2,85 2,76 2,69 2,63 2,53 2,45 2,33 2,08 1,90
44 7,25 5,12 4,26 3,78 3,47 3,24 3,08 2,95 2,84 2,75 2,68 2,62 2,52 2,44 2,32 2,07 1,89
Distribuciones de F 5%
5% 1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 40 100
1 161 199 216 225 230 234 237 239 241 242 243 244 245 246 248 251 253
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,42 19,43 19,45 19,47 19,49

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,71 8,69 8,66 8,59 8,55
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,87 5,84 5,80 5,72 5,66
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,64 4,60 4,56 4,46 4,41
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,96 3,92 3,87 3,77 3,71
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,53 3,49 3,44 3,34 3,27
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,24 3,20 3,15 3,04 2,97
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,03 2,99 2,94 2,83 2,76
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,86 2,83 2,77 2,66 2,59
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,74 2,70 2,65 2,53 2,46
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,64 2,60 2,54 2,43 2,35
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,55 2,51 2,46 2,34 2,26
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,48 2,44 2,39 2,27 2,19
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,42 2,38 2,33 2,20 2,12
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,37 2,33 2,28 2,15 2,07
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,33 2,29 2,23 2,10 2,02
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,29 2,25 2,19 2,06 1,98
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,26 2,21 2,16 2,03 1,94
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,22 2,18 2,12 1,99 1,91
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,20 2,16 2,10 1,96 1,88
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,17 2,13 2,07 1,94 1,85
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,15 2,11 2,05 1,91 1,82
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,13 2,09 2,03 1,89 1,80
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,11 2,07 2,01 1,87 1,78
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,09 2,05 1,99 1,85 1,76
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13 2,08 2,04 1,97 1,84 1,74
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,06 2,02 1,96 1,82 1,73
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,05 2,01 1,94 1,81 1,71
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09 2,04 1,99 1,93 1,79 1,70
31 4,16 3,30 2,91 2,68 2,52 2,41 2,32 2,25 2,20 2,15 2,11 2,08 2,03 1,98 1,92 1,78 1,68
32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,10 2,07 2,01 1,97 1,91 1,77 1,67
33 4,14 3,28 2,89 2,66 2,50 2,39 2,30 2,23 2,18 2,13 2,09 2,06 2,00 1,96 1,90 1,76 1,66
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,08 2,05 1,99 1,95 1,89 1,75 1,65
35 4,12 3,27 2,87 2,64 2,49 2,37 2,29 2,22 2,16 2,11 2,07 2,04 1,99 1,94 1,88 1,74 1,63
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,07 2,03 1,98 1,93 1,87 1,73 1,62
37 4,11 3,25 2,86 2,63 2,47 2,36 2,27 2,20 2,14 2,10 2,06 2,02 1,97 1,93 1,86 1,72 1,62
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02 1,96 1,92 1,85 1,71 1,61
39 4,09 3,24 2,85 2,61 2,46 2,34 2,26 2,19 2,13 2,08 2,04 2,01 1,95 1,91 1,85 1,70 1,60
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,95 1,90 1,84 1,69 1,59
41 4,08 3,23 2,83 2,60 2,44 2,33 2,24 2,17 2,12 2,07 2,03 2,00 1,94 1,90 1,83 1,69 1,58
42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,11 2,06 2,03 1,99 1,94 1,89 1,83 1,68 1,57

A Punt Es Dee Stadi Stica

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

A Punt Es Dee Stadi Stica

Cargado por

Copyright:

Formatos disponibles

Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Estudiantes de Carreras Técnicas e Ingenierías

Marzo del 2006

Profesor Edgardo Ojeda Barcos

Licenciado en Organización de la Producción,

Postítulo en Ingeniería de Calidad,

Derechos de autor en trámite

Derechos de autor en trámite Página 1 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

Derechos de autor en trámite Página 2 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

6.1 Definición de Probabilidad

Derechos de autor en trámite Página 3 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

Derechos de autor en trámite Página 4 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

Derechos de autor en trámite Página 5 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

Prólogo a la edición de Marzo de 2006.

El presente trabajo, tiene una finalidad claramente establecida, facilitar el estudio y

El libro no tiene pretensiones de originalidad, por ello, y sin querer amenguar el

El objetivo de todo futuro profesional es: APRENDER.

Edgardo Ojeda Barcos

Derechos de autor en trámite Página 6 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

La palabra estadística es un concepto muy conocido y por cierto muy amplio.

Supongamos que por necesidades académicas necesitamos conocer la edad

Generalizando, podremos decir que la Estadística es la metodología científica

Estas técnicas pueden además, darnos información acerca de la confiabilidad,

En los trabajos estadísticos podemos distinguir dos áreas de trabajo, la primera se

La segunda área, es la llamada Estadística Inductiva o Inferencia Estadística, es

Derechos de autor en trámite Página 7 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

La estadística encuentra en los gráficos, una herramienta indispensable para

Crecimiento Demográfico en EE.UU. ( en millones de personas)

Año 1860 70 80 90 1900 10 20 30 40 50 60 70 80

La misma información puede representarse como un gráfico o diagrama de barras.

Derechos de autor en trámite Página 8 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

Datos de producción de una región hipotética:

Año Tn trigo Tn maíz Total Porcentual

Derechos de autor en trámite Página 9 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

Gráfico de Barras Acumuladas

Derechos de autor en trámite Página 10 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

Gráfico de Barras Porcentuales

Gráfico de barras horizontales

Derechos de autor en trámite Página 11 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

Gráfico circular abierto.

1.3 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,

Derechos de autor en trámite Página 12 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

En total son 84 mediciones, por lo tanto n = 84

El mayor valor es 955

Derechos de autor en trámite Página 13 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

De acuerdo con la regla empírica, descrita anteriormente, el número de CLASES que

Es costumbre comenzar exactamente por el menor de los datos encontrados, es

En este paso debemos preguntarnos, ¿porqué son 10 las clases, si habíamos

Derechos de autor en trámite Página 14 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

El total de datos es 32+41+53+85+9*3 = 92, N = 92 , pero los datos diferentes