Está en la página 1de 174

E x c e le n c ia A c a d é m ic a

INDICE
Pág.
Fascículo 1
Autoaprendizaje 8 horas

ESTADISTICA, GENERALIDADES, ORGANIZACIÓN DE DATOS Y GRAFICOS

1. Definición de Estadística 9
2. Clases de Estadística 10
3. Conceptos Básicos 10
4. Variable y tipos 12
5. Regla de redondeo 16
6. Notación científica 17
7. Cifras Significativas 17
8. Sumatoria 18
9. Tabla de Frecuencia 20
10. Clases de Frecuencia 20
11. Tabla de Frecuencia para Variables Cualitativas 21
12. Tabla de Frecuencia para Variables Cuantitativas 22
13. Construcción de Intervalos o Reducción de Datos 24
14. Gráficos 30
15. Clases de Gráficos 30
16. Análisis Exploratorio de datos 33

Fascículo 2
Autoaprendizaje 8 horas

ESTADISTICA DESCRIPTIVA: MEDIDAS DE TENDENCIA CENTRAL, DE


DISPERSIÓN, DE ASIMETRÍA Y DE APUNTAMIENTO

1. Medidas de tendencia central o de posición 41


2. La media o promedio aritmético 42
3. Mediana 43
4. Moda 48
5. Relación entre promedio aritmético, mediana, moda 52
6. Media Geométrica 55
7. Media Armónica 57
8. Relaciones entre los Promedios 59

5
E x c e le n c ia A c a d é m ic a

9. Cuartiles 59
10. Deciles 61
11. Percentiles 61
12. Aplicación de Cuartiles, Deciles y Percentiles 61
13. Medidas de Dispersión o Variabilidad. 65
14. Rango. 65
15. Desviación Media. 66
16. Varianza. 67
17. Desviación Estándar. 69
18. Características de la varianza y Desviación Estándar. 70
19. Coeficiente de variación. 71
20. Variable estandarizada. 71
21. Medida de Asimetría. 72
22. Medida de Apuntamiento. 75

Fascículo 3
Autoaprendizaje 8 horas

PROBABILIDAD

1. Introducción a la teoría de la probabilidad 81


2. Concepto de Probabilidad 81
3. Experimento 82
4. Espacio Maestral 82
5. Evento o suceso 83
6. Análisis Combinatorio 88
7. Factorial de un Número 91
8. Permutación 91
9. Variación 93
10. Combinación 94
11. Diagramas de Árbol 95
12. Definición clásica de Probabilidad. 97
13. Probabilidad de Frecuencia relativa. 101
14. Probabilidad Subjetiva. 104
15. Probabilidad Frente a “Apuestas”. 104
16. Probabilidades de Espacios Muestrales Finitos. 105
17. Probabilidad Condicional. 107
18. Sucesos Independientes. 110
19. Teorema de BAYES 111

6
E x c e le n c ia A c a d é m ic a

Fascículo 4
Autoaprendizaje 8 horas

DISTRIBUCIÓN DE PROBABILIDAD

1. Variables Aleatorias 117


2. Clases de Variables Aleatorias 117
3. Distribución de Probabilidad 118
4. Distribución Binomial 119
5. Distribución de Poisson 123
6. Distribución Geométrica 125
7. Distribución Hipergeométrica 128
8. Distribución Multinomial 130
9. Distribución Normal “Z” 131
10. Distribución de Student “t” 131

Fascículo 5
Autoaprendizaje 8 horas

ESTADISTICA INFERENCIAL: MUESTREO, DISTRIBUCIÓN DE MUESTREO,


ESTIMACIÓN, PRUEBA DE HIPOTESIS, PRUEBA DEL CHI CUADRADO Y
ANALISIS DE VARIANZA

1. Muestreo 141
2. Selección de un método de muestreo 142
3. Ventajas y limitaciones del muestreo sobre el censo 142
4. Etapas de la encuesta por muestreo 142
5. Diferencias entre población y muestra 143
6. Tipos de muestreo 143
7. Tamaño de una muestra 144
8. Terminología convencional con que se designa las estadisticas
muestrales 146
9. Inferencia Estadística – Estimación 147
10. Concepto de Error Estándar 147
11. Teorema de Límite Central 149
12. Estimación usando la Distribución Normal 151

7
E x c e le n c ia A c a d é m ic a

13. Intervalo de confianza para la media usando la Distribución “t” 153


14. Prueba de Hipótesis 154
15. Prueba de Hipótesis para las deferencias entre dos medias o dos
proporciones 159
16. La prueba Chi Cuadrado “ x2 ” 161
17. Análisis de Varianza 166
18. Análisis de Varianza para una clase o factor 167
19. Análisis de Varianza para dos clases o factores 170

Fascículo 6
Autoaprendizaje 6 horas

CORRELACIÓN, REGRESIÓN, NÚMEROS INDICES Y SOFTWARE


ESTADÍSTICO

1. Correlación. 179
2. Coeficiente de correlación. 180
3. Regresión. 183
4. Serie de Tendencia Rectilínea. 183
5. Serie de Tendencia Parabólica. 185
6. Aplicación de la Ecuación Exponencial. 189
7. Números Índices 190
8. Precio índice mediante la suma 191
9. Promedio simple de precios relativos 193
10. Índice ponderado de Laspeyres 194
11. Índice ponderado de Paasche 195
12. Índice ideal de Fishers 196
13. Software Estadísticos 197

8
E x c e le n c ia A c a d é m ic a

Unidad Temática I
DISTICA

ESTADISTICA, GENERALIDADES, ORGANIZACIÓN DE


DATOS Y GRAFICOS

Al finalizar el estudio del presente fascículo el estudiante:


- Define la estadística y conoce sus clases.
- Conceptúa lo que es población, muestra, parámetro, estadígrafo y dato.
- Define lo que es una variable, conoce y determina sus tipos.
- Aplica la regla de redondeo y las cifras significativas; así como, la notación
científica.
- Resuelve problemas de sumatoria.
- Organiza datos originales en una distribución de frecuencia.
- Representa la distribución de frecuencia en graficas.
- Interpreta las frecuencias relativas y absolutas.
- Desarrolla una representación de “tallo y hoja”.

1. DEFINICIÓN DE ESTADÍSTICA
La Estadística es la ciencia de la:
- Sistematización, recogida, ordenación y presentación de datos referentes a
un fenómeno que presenta variabilidad o incertidumbre para su estudio
metódico, con el objeto de (Descriptiva).
- Deducir las leyes que rigen esos fenómenos (Probabilidad).
- Y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones
u obtener conclusiones (Inferencia)

Definiciones etimológicas:
El origen etimológico de la palabra “estadística”, no está bien determinado. Para
algunos viene de la voz griega STATERA que significa “Balanza, equilibrio”, otros
dicen que deriva del latín STATUS que significa “situación” mientras que algunos
autores afirman que procede del alemán STAAT cuyo significado es “Estado” por
su función de registrar: población, nacimiento, defunción, etc. Y finalmente, otros

9
E x c e le n c ia A c a d é m ic a

autores dicen que proviene de una voz italiana STATISTA que significa
“estadista” y que acuño Gottfried Achenwall (1719 1772), un profesor en
Marlborough y Gottingen.

2. CLASES DE ESTADÍSTICA

2.1. ESTADÍSTICA DESCRIPTIVA Y DEDUCTIVA


Es la Estadística que únicamente se ocupa de describir y analizar un
conjunto determinado sin extraer ningún tipo de conclusión o inferencia
sobre un conjunto mayor.
El análisis se limita a si mismo a los datos coleccionados. Las gráficas, las
tablas y diagramas que muestran los datos y facilitan su interpretación son
ejemplos de este tipo de Estadística.

2.2. ESTADÍSTICA INFERENCIAL O INDUCTIVA


Es la Estadística que estudia las condiciones bajo las cuales tales
inferencias son válidas, para cuyo estudio se requiere un alto nivel de
conocimiento de estadística descriptiva, probabilidades y matemáticas.
Comprende la teoría de estimación, prueba de hipótesis y análisis de
varianza.
Aquí, la influencia estadística incluye generalizaciones y afirmaciones sobre
probabilidades de su validez.

3. CONCEPTOS BÁSICOS
3.1. POBLACIÓN
Es el conjunto mayor o colección completa de todos los elementos que
posee al menos una característica común observable, cuyo estudio nos
interesa o acerca de los cuales se desea información.
La población puede ser según su tamaño de dos tipos:
- Población Finita: cuando se tiene un número determinado de elementos.
Ejemplo. El conjunto de todos los alumnos de la UPLA
- Población Infinita: Cuando el número de elementos es indeterminado o
tan grande que pudiesen considerarse infinitos.
Ejemplo. El conjunto de Insectos

El conjunto de estudiantes

10
E x c e le n c ia A c a d é m ic a

Tamaño de la población: es el número total de elementos que tiene la


población estudiada y se denota con la letra “N” (ene mayúscula).

3.2. MUESTRA
Es un subconjunto de la población a la cual se le efectúa la medición con el
fin de estudiar las propiedades de la población de la cual es obtenida.
Ejemplo. Un grupo de alumnos del total de estudiantes de la UPLA.

Tamaño de la muestra: Es el número de elementos de la muestra y se


denota con la letra “n” (ene minúscula).

3.3. PARÁMETRO
Es un número que describe alguna característica de la población o medida
de resumen de una población. Se considera como un valor verdadero de la
característica estudiada y para determinar su valor es necesario utilizar la
información poblacional completa y por lo tanto la decisión se toma con
certidumbre total.
Los parámetros se representan con letras griegas.

Ejemplo:La media aritmética con “µ”


La desviación estándar con “σ”.
3.4. ESTADÍGRAFO O ESTADISTICO
Es el número que describe alguna característica de la muestra o medida de
resumen de una muestra y la toma de decisión contiene un grado de
incertidumbre.
La estadística se representa con letras latinas.
Ejemplo:
* La media aritmética con “”
* La desviación estándar con ”S”

3.5. DATO
Es el valor, respuesta o registro que adquiere una característica o variable
asociada a un elemento de la población o muestra, como resultado de la
observación, entrevista o recopilación en general. Puede ser un símbolo,
una palabra o un número.
Los datos pueden ser:

11
E x c e le n c ia A c a d é m ic a

A. Según su naturaleza
a. Datos cuantitativos: Consiste en números que representan
conteos o mediciones.
Ejemplo.
* El número de soldados del Perú
* La talla de los estudiantes de la UPLA
b. Datos Cualitativos: Se pueden dividir en diferentes categorías que
se distinguen por alguna característica no numérica.
Ejemplo.
* Los grados del ejército
* Los colores del arco iris
B. Según su procedencia.
a. Datos Primarios: Son aquellos que se obtienen directamente de la
misma realidad, sin sufrir ningún proceso de elaboración previa.

Ejemplo:
Lo que se recoge directamente de un muestreo o de un censo.
b. Datos Secundarios: Son registros escritos que proceden también
de un contacto con la práctica, pero que ya han sido recogidos y
muchas veces procesados por los investigadores.
Ejemplo:
* Lo que se obtiene de textos, revistas, etc.

4. VARIABLE
Es una característica estudiada de las unidades estadísticas (elementos de la
población)

Tipos de Variable
4.1. Según la Naturaleza de la Variable
a) Variables Cualitativas
Cuando expresan una cualidad, característica o atributo, sus datos se
expresan mediante palabras, no es numérica.
Ejemplo:Estado civil, lugar de nacimiento, profesiones, causas de
accidentes, colores, etc.
b) Variables Cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de
carácter numérico. El dato o valor puede resultar de la operación de
contar o medir.

12
E x c e le n c ia A c a d é m ic a

Ejemplo:Número de hijos, ingresos, talla, peso, producción, edad,


utilidades, etc.

Las variables cuantitativas pueden ser Discretas y Continuas

b.1.Variable Discreta
Cuando el valor de una variable resulta de la operación de
contar, su valor está representado solo por números naturales
(entero positivo).
Ejemplo:Número de hijos, habitaciones por vivienda, población
por país. Etc.

b.2.Variable Continua
Cuando la variable es susceptible de medirse, es toda variable
cuyo valor se obtiene por medición o comprobación con una
unidad o patrón de medida. Se expresa por cualquier número
real.
Ejemplo:Área de terreno, ingresos monetarios, peso, estatura,
tiempo, etc.

4.2. Según la relación entre variables


a) Variables Dependientes
Son aquellas que se explican por otras variables, son los efectos o
resultados respecto a los cuales hay que buscar su motivo, causa o
razón de ser.
Ejemplo:El consumo. Esta variable depende de los ingresos
personales.
La producción. Esta variable depende del tiempo (año, meses, etc.)

b) Variables Independientes
Son las variables explicativas o predictivas, cuya asociación, relación
o influencia en la variable dependiente se pretende descubrir en la
investigación. También, son causas o antecedentes.
Ejemplo:Los ingresos personales, relacionado con el consumo.
El tiempo, relacionado con la producción.

c) Variables intervinientes o interferentes


Son aquellas que coparticipan con la variable independiente
condicionando el comportamiento de la variable dependiente.

13
E x c e le n c ia A c a d é m ic a

Ejemplo: El caso del Presupuesto familiar que es una variable


dependiente, con relación a los ingresos que es una variable
independiente y con otras variables que serían la conducta de
consumo, edad de la familia, etc. Éstos últimos son variables
intervinientes.

4.3. Según la escala de medición


a) Variables Nominales
Son aquellas variables que establecen la distinción de los elementos en
diversas categorías, sin explicar algún orden entre ellas.
Ejemplo: Sexo, estado civil, profesiones, lugar de nacimiento,
deportes de práctica.

b) Variables Ordinales
Son aquellas variables que implican orden entre sus categorías, están
referidas a un orden de jerarquía, donde la categoría expresa una
posición de orden.
Ejemplo: Grado de instrucción, clases sociales, rango de
agresividad, orden de mérito, etc.

c) Variable de Intervalo
Son aquellos que suponen a la vez orden y grados de distancia iguales
entre diversas categorías, pero no tienen origen natural, sino
convencional, tiene un cero relativo.
Ejemplo: Coeficiente de inteligencia, temperatura, puntuación obtenida
en una escala, etc.

d) Variables de Razón
Estas variables comprenden a la vez todos los casos anteriores,
distinción, orden, distancia y origen único natural; el valor se expresa
con un número real, tiene un cero absoluto.
Ejemplo:Accidentes de tránsito, edad, peso, ingresos, número de hijos,
etc.

4.4. Según Amplitud de las Unidades de Observación


a) Variables Individuales
Son referidas a características de individuos o personas, una
empresa, centro educativo, etc. Son variables para estudio de casos,
donde se pueden subdividir en variables públicas y privadas.

14
E x c e le n c ia A c a d é m ic a

a.1.Variables Públicas
Son aquellas en que los valores individuales son conocidos por otras
personas y se saben que son conocidos.
Ejemplo: Edad, sexo, ocupación, estado civil, etc.

a.2.Variables Privadas
Son aquellos valores individuales que pueden ser conocidos por
otros, una vez averiguados.
Ejemplo: Coeficiente de inteligencia, opiniones frente a la política,
conducta de consumo, etc.
ESTADISTICAESTADISTICA
b) Variables Colectivas
Son aquellas que se refieren a características de las unidades
cuando estas son colectivas, conjuntos o grupos (ciudades,
empresas, escuelas, etc.)
Ejemplo: Tasa de mortalidad, urbanización, tasa de crecimiento
demográfico, escolaridad, etc.

Las variables dependientes en un momento o caso pueden ser variables


independientes y viceversa.

Nº 1.1

* Determinar la clase de variable que nos dan los datos de las siguientes
fenómenos o hechos:
a) Temperatura.
b) Razas.
c) Nacionalidad.
d) Precio del dólar en un mes.
e) Número de habitaciones por familia.

15
E x c e le n c ia A c a d é m ic a

5. REGLA DE REDONDEO
5.1. Cuando el número que se quiere redondear le sigue una cifra mayor que
5, este tomará el valor inmediato superior.
Ejemplo:

57,8  58 (redondear al entero)


1,036  1,04 (redondear a 2 decimales)
36,8079  36,808 (redondear a 3 decimales)

5.2. Cuando al número que se quiere redondear le sigue una cifra menor que 5,
se quedará en el mismo valor.
Ejemplo:

74,3  74 (redondear al entero)


1,254  1,25 (redondear a 2 decimales)
53,6182  53,618 (redondear a 3 decimales)

5.3. Cuando al número que se quiere redondear le sigue una cifra igual que 5, se
tomará dos criterios:
a) Si la cifra es par, queda sin alterar.
Ejemplo:

24,5  24 (redondear al entero)


2,385  2,38 (redondear a 2 decimales)
137,6125  137,612 (redondear a 3 decimales)

b) Si la cifra es impar, pasa al inmediato superior.


Ejemplo:

85,5  86 (redondear al entero)


1,315  1,32 (redondear a 2 decimales)
57,5435  57,544 (redondear a 3 decimales)
Not
a: En la práctica por lo general, cuando a la cifra que se desea redondear
le sigue 5, pasa al inmediato superior

16
E x c e le n c ia A c a d é m ic a

6. NOTACIÓN SISTÉMICA O CIENTÍFICA


La notación científica se utiliza cuando una información es seguida o antecedida
de ceros.
Ejemplos:

 8  10
7
80000000

 9 , 3  10
8
930000000
4
0 , 00038  3 , 8  10
7
0 , 000000567  5 , 67  10

 80  10
6
80000000 ( no es notación científica )

Nota: La notación científica solo tiene un entero

7. CIFRAS SIGNIFICATIVAS
Son los dígitos que no precisan una medición, se consideran como cifras
significativas los ceros a la derecha; no así los ceros a la izquierda.

Ejemplo:

17
E x c e le n c ia A c a d é m ic a

Nº 1.2

1. Redondear al entero

a) 4,97 b) 38,49 c) 127,511


d) 36,59 e) 288,71

2. Redondear a un decimal

a) 36,55 b) 123,45 c) 0,06

3. Redondear a 3 decimales

a) 0,0034 b) 137,0056 c) 0,01351

4. Realizar la notación científica de:

a) 7 000 000 b) 9 430 000


c) 0,002 937 d) 0,000 005

5. Cuántas cifras significativas tienen los siguientes números:

a) 23,000 2 b) 0,23
c) 90,000 00 d) 0,000 895 4

8. SUMATORIA
Es un operador que representa una suma de términos cuyos elementos se
encuentran formados de acuerdo a una ley dada.

NOTACIÓN: El operador sumatoria vienen representado por la letra griega


sigma ( ∑ )

18
E x c e le n c ia A c a d é m ic a

Ejemplo:

A) Desarrollar:
La expresión dada tiene la siguiente lectura: “Sumatoria de “a” por “x”
elevado a la “a”, variando “a” desde 4 hasta 7”.
7

  4x  5x  6x  7x
a 4 5 6 7
ax
a4

B) Desarrollar: 4

  1
k k 1
x
k 0

La expresión dada tiene la siguiente lectura: “Sumatoria de -1 elevado a la k por


x elevado a la (k+1), variando k desde 0 hasta 4”.
4

  1   1 x   1 x   1 x   1 x   1 x
k k 1 0 0 1 1 11 2 2 1 3 3 1 4 4 1
x
k 0

 x   1 x   1 x   1 x   1 x
2 2 3 3 4 4 5

 x x  x  x  x
2 3 4 5

3
n  nk
C) Desarrollar:  

a

k 0  k 

La expresión dada tiene la siguiente lectura: “Sumatoria del coeficiente


binómico “n” sobre “k” por “a” elevado a la “n-k”, variando k desde 0 hasta 3”.

3
 n  nk  n  n  0  n  n 1  n  n  2  n  n  3
  a
     a    a    a    a
k 0  k  0 1 2 3

Nº 1.3

9
6
1. Desarrollar 2.  by
Desarrollar
b

  2 
P 1 P 1
y
b3
P 1

M
4
 M
  x
x
c
3. Desarrollar 
M 0 

19
E x c e le n c ia A c a d é m ic a

9. TABLA DE FRECUENCIA
Representación organizada de los datos que muestra el número de
observaciones del conjunto de datos que caen dentro de cada conjunto de
clases mutuamente excluyentes
La tabla de frecuencia consta de:

a) Clase y Marca de Clase

Clase
Está constituido por números o descritos por algún atributo cualitativo o
cuantitativo de muestras de objetos. La información conforme a
características cualitativas son: raza, religión y sexo. Así mismo, puede estar
formado por intervalo de clase.

Marca de Clase ( Xi )
Es la semisuma del límite inferior ( Li ) y limite superior ( Ls ) de cada
intervalo de clase.

Li  Ls
Xi 
2

Los atributos cualitativos y cuantitativos deben ser exhaustivos y mutuamente


excluyentes.

b) Frecuencia
Es el número de observaciones provenientes del conjunto de datos que caen
dentro de cada una de las clases. Si podemos determinar la frecuencia con
que ocurren los valores en cada clase de un conjunto de datos, estaremos
en condiciones de construir una distribución de frecuencia.

10. CLASES DE FRECUENCIAS

a) Frecuencia Absoluta Simple ( Fi )


Es el número de observaciones que presentan una modalidad perteneciente
a la clase.

20
E x c e le n c ia A c a d é m ic a

b) Frecuencia Absoluta Acumulada ( fi )


Representación tabular de los datos que muestra cuantas observaciones se
hallan encima o debajo de ciertos valores. Estas son ascendentes y
descendentes.

- Frecuencia Absoluta Acumulada Ascendente ( F (1 ) )


Sirven para decir si son iguales o menores.
- Frecuencia Absoluta Acumulada Ascendente ( F(2 ) )
Sirven para decir si son iguales o mayores

c) Frecuencia Relativa Simple ( hi )


Son datos que muestran la fracción del conjunto total de datos que caen
dentro de cada conjunto de clases mutuamente excluyente.

d) Frecuencia Relativa Acumulada ( Hi )


Es el tanto por uno de los elementos de la población que están en alguna
clase y que presentan una modalidad inferior o superior a la clase. Estas son
ascendentes y descendentes.

- Frecuencia Relativa Acumulada Ascendente ( H (1 )


)
Nos indica la fracción de los datos que son iguales o menores.
- Frecuencia Relativa Acumulada Descendente ( H (2)
)
Indica la fracción de los datos que son iguales o mayores.

e) Frecuencia Porcentual ( Pi )
Es el producto de las frecuencias relativas por 100.

11. TABLA DE FRECUENCIA PARA VARIABLES CUALITATIVAS

Clase fi hi Pi (%)

C1 f1 h1 P1
C2 f2 h2 P2
C3 f3 h3 P3
   
Cm fm hm Pm

Total n 1.00 100

21
E x c e le n c ia A c a d é m ic a

Ejemplo:
Consideremos la muestra formada por 50 personas y en esta, la variable sexo.
Si se observa que hay 30 varones y 20 mujeres, podemos trasladar esta
información a la siguiente tabla de frecuencias.

Clase fi hi Pi (%)
Varón 30 0.6 60
Mujer 20 0.4 40
Total 50 1.0 100

12. TABLA DE FRECUENCIA PARA VARIABLES CUANTITATIVAS

Clase fi hi F(1) F( 2 ) H (1) H ( 2)

C1 f1 h1 F(11)  f1 F(12 )  n H (11)  h1 H (12 )  1.0

C2 f2 h2 F(12)  f1  f 2 F(22 )  n  f1 H (21)  h1  h2 H (22)  1.0  h1

C3 f3 h3 F(13)  F(11)  f 3 F(32 )  F(22)  f 2 H (31)  H (21)  h3 H (32)  H (22 )  h2

      
Cm fm hm F(1m)  n F(m2)  f m H (m1)  1.0 H (m2 )  hm

Total n 1.0

Ejemplo: Caso cuantitativo discreto


Para estudiar la producción de artículos de una fábrica se tomaron 100 lotes de
250 artículos cada uno. El número de artículos defectuosos en cada lote fue
como sigue:

1 4 3 5 5 2 5 4 2 3 5 3 5
1 3 5 3 3 7 5 2 4 5 8 3 4
2 3 8 5 7 7 4 3 3 4 5 5 5
4 2 3 3 2 4 1 5 4 4 2 2 5
5 2 4 3 4 4 6 5 5 2 6 4
6 2 4 6 5 2 4 7 6 2 3 6
4 4 1 3 3 2 1 5 8 6 4 4
5 6 4 5 3 3 4 4 7 6 6 4

22
E x c e le n c ia A c a d é m ic a

Xi fi hi Pi (%)
1 5 0,05 5
2 14 0,14 14
3 18 0,18 18
4 25 0,25 25
5 20 0,20 20
6 10 0,10 10
7 5 0,05 5
8 3 0,03 3
Total 100 1.00 100

Ejemplo: Caso cuantitativo continuo


Se desea estudiar la cantidad de kilómetro que recorre un automóvil modelo A
por cada galón de gasolina que consume; para tal fin se anotaron las distancias
recorridas por 36 automóviles de tal modelo usando un galón de gasolina. Los
resultados, en kilómetros fueron así:

34,51 31,54 35,40 38,24 34,60 38,20 35,61 36,70


35,47 31,60 36,57 34,50 37,85 33,15 30,16
36,96 35,93 33,80 36,80 33,29 36,88 34,00
40,00 31,57 37,10 32,91 36,23 34,90 33,00
33,20 36,20 30,00 34,55 33,98 38,10 36,00

Distancia
Xi fi hi Pi (%)
Recorrida
[ 30,00 - 31,25 ] 30,6250 2 0,0556 5,6
[ 31,25 - 32,50 ] 31,8750 3 0,0833 8,3
[ 32,50 - 33,75 ] 33,1250 5 0,1389 13,9
[ 33,75 - 35,00 ] 34,3750 8 0,2222 22,2
[ 35,00 - 36,25 ] 35,6250 7 0,1944 19,4
[ 36,25 - 37,50 ] 36,8750 6 0,1667 16,7
[ 37,50 - 38,75 ] 38,1250 4 0,1111 11,1
[ 38,75 - 40,00 ] 39,3750 1 0,0278 2,8
TOTAL 36 1,0000 100

23
E x c e le n c ia A c a d é m ic a

fi = Cantidad de Autos
Li  Ls
Xi  Marca de Clase
2

Por convención, cada intervalo es tomado cerrado por la izquierda y abierto por
la derecha, a excepción del último, que es cerrado en ambos extremos.
Cerrado significa que incluye el límite inferior y abierto no incluye el límite
superior de la distancia recorrida de cada clase.

13. CONSTRUCCION DE INTERVALOS O REDUCCION DE DATOS

Regla:
1. Ordenamiento de datos (según magnitud) en forma creciente o decreciente.

2. Determinar
Valor máximo ( X max )
Valor mínimo ( X min )

3. Calcular el Rango( R )
R  X max  X min  1 para variable discreta
R  X max  X min para variable continua

4. Determinar el número de clases o intervalos (m)

Método de STURGES ( n  50 )
m  1  3 , 322 log( n )

Método de PORTUGAL
( 50  n  100 )

m  1 , 8914  3 , 991 log( n )

( n  100 )

m  2 , 766  5 , 815 log( n )

24
E x c e le n c ia A c a d é m ic a

Método de la RAIZ
m  2 ,5 4
n

m  n

OBSERVACIÓN
m debe ser entero (   ), si sale decimal se redondea.
1. Calcular la amplitud Interválica ( a )
R
a
m
2. Corrección ( D ): D  (m * a )  R
Si el resultado de D es:

 0 
  Se Continua
 0 
 0 Se rehace (En la amplitud interválica se redondea por

exceso)
3. Intervalo de Clase
Ii  X min  a
Ejemplo:
Se tiene las tallas de 41 alumnos de la facultad de Derecho de la UPLA
siguientes; dados en metros:

1,73 1,80 1,70 1,74 1,87 1,59


1,70 1,87 1,72 1,70 1,75
1,71 1,87 1,70 1,78 1,75
1,70 1,87 1,71 1,71 1,75
1,60 1,55 1,65 1,60 1,86
1,65 1,55 1,60 1,85 1,73
1,61 1,51 1,67 1,82 1,57
1,64 1,55 1,68 1,80 1,75

25
E x c e le n c ia A c a d é m ic a

A continuación vamos a aplicar la regla para construir los intervalos y elaborar la


tabla de frecuencia.

Regla:
1º. Ordenamiento de Datos
Se obvia por ser una muestra pequeña
2º. Determinar
Xmax  1.87 mt
Xmin  1.55 mt
3º Calcular el Rango ( R )
R  X max  X min (variable continua).
R  1,87  1,55  0,32
4º Determinar el numero de clases; ( m ) por ser n <50 aplicamos el
método de STURGES
m  1  3,322 log n
m  1  3,322 log 41
m  1  3,322(1,613)
m  6,4
m6 (Tiene que ser entero)

También, se puede aplicar el método de la RAIZ, por ser muestra pequeña.


ESTADISTICA
m  n m  2 ,5 4
n

m  41  6 , 4 m  2 ,5 4
41  6 , 3

m  6 ( entero ) m  6 ( entero )

5º Calcular la Amplitud Interválica ( a )


R
a
m
0,32
a  0,0533  0,053 (regla redondeo)
6
a  0,053

26
E x c e le n c ia A c a d é m ic a

6º Corrección ( D )
D  (m  a)  R
D  (6  0,053)  0,032
D  0,318  0,32
D  0,002 ( Se rehace por ser negativo)
Entonces se corrige a  0,054
D  (6  0,054)  0,32
D  0,324  0,32
D  0,004 (es positivo se continua )
El valor 0,004 se distribuye en la variable máximo y mínimo (se suma
y se resta para ampliar el rango)

-0,002 +0,002

1,548 1,55 1,87 1,872

R=0,324
1,548 1,872

Teniendo los datos siguientes se elabora la tabla de frecuencia:


X min  1,548 mt
X max  1,872 mt
a  0,054 mt
m6
7º Intervalo de Clase
I i  X min  a
I1  1,548  0,054
I1  1,602

27
E x c e le n c ia A c a d é m ic a

Talla(Intervalo) Tabulación fi hi F(1) F( 2 ) H (1) H ( 2) Xi


[ 1.548 - 1.602 ] ||||| |||| 9 0.22 9 41 0.22 1.00 1.575
[ 1.602 - 1.656 ] |||| 4 0.10 13 32 0.32 0.78 1.629
[ 1.656 - 1.710 ] ||||| || 7 0.17 20 28 0.49 0.68 1.683
[ 1.710 - 1.764 ] ||||| ||||| | 11 0.27 31 21 0.76 0.51 1.737
[ 1.764 - 1.818 ] ||| 3 0.07 34 10 0.83 0.24 1.791
[ 1.818 - 1.872 ] ||||| || 7 0.17 41 7 1.00 0.17 1.845
TOTAL 41 1.00

Tabulación: Es ubicar los datos de la muestra en la clase interválica


correspondiente.

Nº 1.4

1. Los hábitos de trabajo de la mano de obra( llevan trabajo a casa) en


Huancayo se muestran a continuación:
c b a b a c b c a a
a b a a a d d a b b
b a c b d b b c b b
a b b c c a c a c a
c a d b a d a d d a

Donde a= Nunca, b= Menos de una vez al mes, c= Una vez al mes, d=


todos los días. Construya un cuadro que presente la información
recolectada.
LLEVAN EL TRABAJO A CASA Nº de trabajadores ( fi ) hi pi

Nunca
Menos de una vez al mes
Una vez al mes
Todos
TOTAL

28
E x c e le n c ia A c a d é m ic a

2. En una muestra de 40 pequeñas empresas se recoge información acerca del


número de trabajadores en cada una de ellas. Los datos fueron los siguientes:

16 15 14 14 14 13 13 14 14 15 12 15 16 12 12 13 14
17 15 13 14 13 13 14 14 15 17 16 18 13 13 14 14 15
16 15 14 16 15 14

Complete la siguiente tabla de frecuencias.

Número de Trabajadores Empresas( fi ) hi pi

12
13
14
15
16
17
18
Totales

2. En el departamento de producción de una fábrica los sueldos mensuales de


los empleados son los siguientes,

440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
224 340 558 460 560 607 382 667 512 492
450 530 501 417 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382

29
E x c e le n c ia A c a d é m ic a

Complete la siguiente tabla de frecuencias

F (1 ) hi H pi Pi
Sueldo Mensual Xi Conteo Empleados fi (1 )

TOTAL

14. GRAFICAS
Es otra forma de presentar los datos referentes a un fenómeno.
Una grafica es el idioma universal que bien presentado e ilustrado evita la
fraseología.
En estadística se emplea una diversidad de tipos de graficas, cuya forma
dependerá de la naturaleza de los datos y de los objetivos de la presentación.
Antes de elegir el tipo de grafico conviene imaginarse de antemano, el grafico a
construir que en general debe tener rasgos simples y de fácil comprensión.

15. CLASES DE GRAFICAS


15.1. Grafica de Coordenadas Ortogonales o Cartesianos

a) Diagrama de Segmentos

100

80

60

40

20

30
E x c e le n c ia A c a d é m ic a

b) Histograma

50
45
40
35
30
25
20
15
10
5
0

c) Polígono de Frecuencia

50 Marca de clase
45
40
35
30
25
20
15
10
5
0

d) Polígono de Frecuencia Acumulada u OJIVA

100
90
80
70
60
50 Punto de equilibrio
40
30
20
10
0
0 2 4 6 8

31
E x c e le n c ia A c a d é m ic a

e) Diagrama de Barra
Simple

100
80

Cantidad
60
40
20
0

o
o
ro

o
ud
ad

ad
lte

as

Vi

ci
So

or
C

iv
D
Compuesta

120
100 Demanda de Algodon

80
Cantidad

Exportación
60 Demanda Interna
40 Producción

20
0
1995 2000

Agrupadas
45
40
35 Asistencia al Cine
30
Cantidad

25 Varon
20 Mujer
15
10
5
0
2000 2001

15.2. Grafica No Ortogonales


a) De Superficie Circular o Torta
C o s ta
10%

S e lva
60%

S ie r r a
30%

32
E x c e le n c ia A c a d é m ic a

b) Pictórica

40

20

10

0 10 20 30 40 50

Nº 1.5

Con los problemas de las actividad 1.4 elaborar gráficas.

16. ANALISIS EXPLORATORIO DE DATOS:

EL DIAGRAMA DE TALLO Y HOJA


Un método para iniciar el análisis exploratorio de los datos, que proporcione
información rápida, visual y es relativamente nueva, es el Diagrama de Tallo y
Hoja. Esta representación de los datos a manera de grafico, pero sin llegar a ello,
utilizando las decenas y las unidades.

Ejemplo:
Los siguientes datos son las calificaciones obtenidas en una prueba de Historia:

78 93 61 100 70 83 88 74 97 72
66 73 76 81 83 64 91 70 77 86

La representación del tallo y hoja se elabora de manera que las decenas se


pondrán en una columna, en forma vertical y las unidades a la derecha:
6 1 6 4
7 8 0 4 2 3 6 0 7
8 3 8 1 3 6
9 3 7 1
10 0

33
E x c e le n c ia A c a d é m ic a

Para entender un poco más, hemos de decir que le primer renglón que dice 6|1 6
4 quiere decir que entre la lista de datos se encuentran los valores 61, 66, 64.

La representación de Tallo y Hoja, donde cada renglón es una posición de tallo y


cada digito de la derecha es una hoja.

REFORZAMIENTO DEL APRENDIZAJE

1. Dado la siguiente tabla de frecuencia que significa:

a) f3 d) F(2)
4

b) h4 e) H
6
(1 )

5 5
c) F (1 ) f) H (2)

TABLA DE FRECUENCIA DE SALARIOS POR TRABAJADOR

i Salario(Intervalo) fi hi F(1) F( 2 ) H (1) H ( 2)

1 [ 82 - 89 ] 4 0.05 4 80 0.05 1.00


2 [ 89 - 96 ] 6 0.08 10 76 0.13 0.95
3 [ 96 - 103 ] 9 0.11 19 70 0.24 0.88
4 [ 103 - 110 ] 13 0.16 32 61 0.40 0.76
5 [ 110 - 117 ] 15 0.19 47 48 0.59 0.60
6 [ 117 - 124 ] 13 0.16 60 33 0.75 0.41
7 [ 124 - 131 ] 12 0.15 72 20 0.90 0.25
8 [ 131 - 138 ] 5 0.06 77 8 0.96 0.10
9 [ 138 - 145 ] 3 0.04 80 3 1.00 0.04
TOTAL 80 1.00

34
E x c e le n c ia A c a d é m ic a

Respuesta:
a) f3 = Hay 9 trabajadores que tienen un salario entre 96 y 103 nuevos soles.

f3 = Hay 9 trabajadores que tienen un salario de 96 a 102.99 nuevos soles.

b) h 4 = El 16% de los trabajadores ganan de 103ª 109.99 nuevos soles.


5
c) F (1 ) = 47 trabajadores ganan menos de 117 nuevos soles.
4
d) F ( 2 ) = 61 trabajadores ganan más o igual a 103 nuevos soles.
6
e) H (1 )
= 75% de los trabajadores ganan menos de 124 nuevos soles.
5
f) H (2)
= 60% de los trabajadores ganan más o igual que 110 nuevos soles.

Una distribución de frecuencia consta de 5 intervalos de igual amplitud y de ella


se conoce los siguientes datos: n=110; límite inferior de la 1ª clase 12.5; f4-f5=10;
f4-f1=0; f2=f4; f1=f5 y L4f4=975, donde L4 es el límite superior de la cuarta clase.

Elaborar la tabla de frecuencia

i Intervalo fi hi Pi %

1 [ 12.5 - 17.5 ] 20 0.1818 18.18


Si f 4  f 5  10 y f 1  f 5  f 4  f 1  10
2 [ 17.5 - 22.5 ] 30 0.2727 27.27
Si f 4  f 3  f 1  0  f 4  f 1  f 3  10
3 [ 22.5 - 27.5 ] 10 0.0909 9.091
Si f 3  10  f 1  f 2  f 4  f 5  100
4 [ 27.5 - 32.5 ] 30 0.2727 27.27
Si f 1  f 5 y f 2  f 4  f 1  f 4  f 4  f 1  100
5 [ 32.5 - 37.5 ] 20 0.1818 18.18
TOTAL 110 1.0000 100.00

Entonces:
2 f 4  2 f 1  100

2 ( f 4  f 1 )  100

f 4  f 1  50

Si f 4  f 1  50 y f 4  f 1  10  f 4  30

Si f 4  f 2  f 2  30

35
E x c e le n c ia A c a d é m ic a

Luego f 1  f 5  20

975
Si L 4 f 4  975  L 4   32 . 5
30

Entonces
R 4  32 . 5  12 . 5  20 . 0

20
a   5
4

Luego los intervalos de clases son:


12.5 + 5 = 17.5
17.5 + 5 = 22.5
22.5 + 5 = 27.5
27.5 + 5 = 32.5
32.5 + 5 = 37.5

- AVILA ., Roberto. Estadística Elemental. Editorial R.A. Lima, 1998.

- CALZADA B., José. Estadística General. Editorial Jurídica S.A., Lima, 1966.

- CAPUÑAY C. Abelino. Sumatoria y Binomio de Newton. Editorial Ingeniería.


Lima 1984.

- JONSON, Robert. Estadística Elemental, Editorial Trillas. 2ª edición. México.


1991.

- MOOD, Alexander M. Introducción a la Teoría Estadística. Editorial Aguilar.


Madrid 1972.

- MOYA, Rufino. Estadística Descriptiva. Editorial San Marcos. Lima 1991.

- VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias


Graficas S.A. 2ª Edición. Lima 1993.

36
E x c e le n c ia A c a d é m ic a

En el siguiente fascículo se calculara los estadígrafos de la estadística descriptiva y


se explicara las características y empleo de estas medidas.

A
u
A
ut
o
t
oe
ev
a
v
al
u
l
uaa
c
ci
ó
i
ónn
f
fo
r
o
rm
ma
t
a
ti
v
i
vaNº
a 01

1. Determinar la clase de variable que nos dan los datos de los siguientes
fenómenos o hechos:

a) Colores b) Nivel de desempleo


c) Accidentes de Tránsito d) Orientación en el tiempo

2. De los siguientes enunciados. ¿Cuál probablemente exija el empleo de la


Estadística Descriptiva y cuál de la Estadística Inferencia?

a) En un campeonato de fútbol se desea conocer el promedio de goles de


los equipos que participan.

b) Un comité para la prevención de la contaminación del aire, analiza la


disminución del tráfico automotriz y el grado de polución.

c) Un psicólogo estudia el efecto de la asesoría personal sobre el


rendimiento de un estudiante.

d) Un Economista registra el crecimiento de la población en un área


determinada.

37
E x c e le n c ia A c a d é m ic a

3. Redondear los siguientes números a las cifras significativas siguientes:

a) 23,5 a 2 cifras significativas

b) 0,0008532 a 1 cifra significativa

c) 0,05 a un decimal y una cifra significativa

d) 90000455 a 7 cifras significativas

4. Desarrollar:

7 5 6
M 
a)  abcx a y b)   3N x N  2 c)   Y k MY
a2 N 3 M 1 

5. ¿Por qué la Estadística es probabilística e Inferencial?

6. De 4 Ejemplos de variable discreta

7. De 4 Ejemplos de Variable continua

8. Se realiza una encuesta a los alumnos de la UPLA a cerca de la preferencia


de marcas de gaseosas, los resultados fueron los siguientes:

PE IK KR PE PE IK IK PE CC CC
IK PE IK IK PE PE KR CC IK KR
O KR CC KR IK PE PE IK O CC
PE O PE PE CC CC KR CC PE IK
IK IK CC PE KR IK IK PE PE CC

38
E x c e le n c ia A c a d é m ic a

a) Construya una tabla de frecuencia


b) ¿Qué porcentaje de estudiantes de la UPLA prefiere Kola Real?
c) ¿Cuántos estudiantes prefieren otras gaseosas?
d) Realizar un tipo de grafico

Donde
IK= Inca Kola PE= Pepsi O= otras
CC= Coca Cola KR= Kola Real

9. Los siguientes datos muestran velocidades en km/h de 48 carros que pasaron


por un punto de control de velocidad.

60 30 31 60 45 34 54
38 35 27 45 40 45 83
30 40 46 105 29 102 60
82 72 63 36 70 31 81
65 80 25 70 108 24 85
45 120 65 39 83 72 60
70 100 55 50 64 61

a) Elabore una tabla de frecuencia.


3 5 4 5
b) Que significa: f4 ; h5 ; F (1 ) ; F(2) ; H (1 )
; H (1 )

c) Represente la tabla mediante un polígono de frecuencia

39
E x c e le n c ia A c a d é m ic a

10. Los puntajes de un aprueba de aptitud se tabularon en una distribución de


frecuencias de 6 intervalos de amplitud constante. Si las marcas de clases
del segundo y cuarto intervalo son 40 y 80, las frecuencias relativas están
relacionadas de la siguiente manera: del primero es igual al sexto intervalo,
la tercera y quinta frecuencia son iguales, la cuarta frecuencia es igual a
0.25, del segundo intervalo es igual al cuarto menos el primero, el tercer
intervalo9 es igual al primero mas 0.10 y la frecuencia absoluta acumulada
del sexto intervalo es igual a 60.
Completar la distribución de frecuencias.
ESTADISTICA
ESTADISTICA

40
E x c e le n c ia A c a d é m ic a

Unidad Temática II

ESTADISTICA DESCRIPTIVA: MEDIDAS DE TENDENCIA


CENTRAL, DE DISPERSIÓN, DE ASIMETRÍA Y DE
APUNTAMIENTO

- Calcula e interpreta la media aritmética, la mediana y la moda.


- Explica las características y propiedades de las medidas.
- Relaciona la media, la mediana y la moda.
- Identifica y aplica los medios geométricos y armónica.
- Reconoce y calcula los conceptos de cuartil, decil y percentil.
- Calcula varias medidas de dispersión para datos simples y agrupados.
- Explica las características, uso de las medidas de dispersión.
- Calcula y explica el uso del coeficiente de variación.
- Calcula, explica y determina los coeficientes de Asimetría y Apuntamiento.

1.- MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN


Las medidas de centralización son valores que tienden a situarse en el centro del
conjunto de datos ordenados según magnitud.
Clases de Medidas de Tendencia Central
A. Medias Fijas:
a) Media Aritmética
b) Media Geométrica
c) Media Armónica
d) Media Cuadrática
e) Media Cúbica
B. Medias Móviles
a) Mediana
b) Moda
c) Cuatiles
d) Deciles
e) Percentiles

41
E x c e le n c ia A c a d é m ic a

2.- LA MEDIA O PROMEDIO ARITMETICO


La media es el valor representativo de la serie; pudiera decirse que es el punto
de equilibrio o centro de gravedad de la serie.
Se representa por para una muestra y para la población

2.1. La Media simple


n

 xi
x1  x 2  x 3    x n
i 1
x  
n n

Ejemplo:
x: 1 8 , 2 4, 4 5, 1 2, 8 9 , 12

18  24  45  12  89  12
x   3 3 .3 3
6

2.2. La Media Ponderada  xi fi


i 1
x 
n

Ejemplo:
x: es la talla de 65 obreros de una empresa, se quiere saber cuál es la
estatura promedia.

 xi f i
i1
x 
n
1 0 9 .1 5
x   1 .6 7 9  1 .6 8 m t .
65

El promedio de la estatura de los obreros de la empresa, es de 1.68


metros.

42
E x c e le n c ia A c a d é m ic a

2.3.- Propiedades de la Media Aritmética c  c


a) La media de una constante es la misma constante.
b) La media del producto de una constante por una variable es igual al
producto de la constante por la media de la variable. cx  c x
c) La media de una variable más o menos una constante, es igual a la
media de la variable más o menos la constante. x  c  x  c
d) La media de la suma o diferencia de dos o más variables e igual a la
suma o diferencia de las medias de cada una de las variables.
x y  x y

Nº 2.1

1. Las edades de los componentes de una familia de 7 miembros, es como


sigue: 52, 42, 26, 24, 13, 8 y 1 años, se pide determinar el promedio de edad
de esta familia.
2. Hallar el salario promedio correspondiente a los trabajadores de cierta fábrica,
extrayendo datos de la tabla de frecuencia:

i Salario(S/.) fi xi xi f i

1 [ 70 – 80  20
2 [ 80 – 90  30
3 [ 90 – 100  60
4 [ 100 - 110 90
5 [ 110 - 120 100
6 [ 120 - 130 85
7 [ 130 - 140 70
TOTAL

3. MEDIANA
La mediana es el punto medio de un conjunto de datos; o es aquel valor de la
variable que divide al conjunto de valores en dos partes iguales.

43
E x c e le n c ia A c a d é m ic a

3.1. CARACTERÍSTICAS DE LA MEDIANA


a) Localiza mejor el centro de distribución para lo cual es necesario
ordenar.
b) Su cálculo es fácil y poco sensible a los valores extremos.
c) Puede ser calculado inclusive cuando los intervalos son abiertos.
d) Pueden ser calculados cuando las variables son cualitativos,
susceptibles de ordenar de acuerdo a alguna propiedad, categoría, etc.
e) No puede ser manejada algebraicamente para cálculo posteriores.
f) Se halla inclusive cuando las amplitudes son diferentes.

3.2. LA MEDIANA SIMPLE O NO AGRUPADOS

a) Datos Impar Me  x n  1
2

Ejemplo:
Se tiene los gastos de 7 personas siguientes:
x: s/. 120, s/. 140, s/. 100, s/. 150, s/. 145, s/. 135, s/. 160
Calcular la mediana.

Solución
PASOS:
1º.En la mediana se ordenan los datos:
x: s/. 100, s/. 120, s/. 135, s/. 140, s/. 145, s/. 150, s/. 160
2º.En datos impar se toma el valor central de acuerdo a la formula.
Me  x n  1  x 7  1  x 4 
S /.
140
2 2

Interpretación: el 50% gastan menos de s/140 y el otro 50% restante


gasta más de s/140

b) Datos Par
1  
Me   x n  x n2 
2  2 2

Ejemplo:
Se tiene los pesos de 8 personas siguientes:
x: 70, 65, 83, 62, 94, 75, 79, 86 kg
Calcular la mediana.

44
E x c e le n c ia A c a d é m ic a

ESTADISTICA
Solución 1   1  
Me   x n  x n2    x 8  x 8 2 
PASOS: 2  2 2

 2  2 2


1º. Se ordenan los datos 1 1
Me  x4  x5    75  79 
x: 62, 65, 70, 75, 79, 83, 86, 94 2 2
kg 154
Me   77 Kg
2
2º. Se aplica la formula
n
 F k 1
(1 )

Me  Li  a 2
fk

Interpretación: el 50% de personas pesan menos de 77kg y el restante 50%


pesan más de 77kg.

3.3. La Mediana Agrupada o Ponderado

Li = limite inferior de la clase mediana


a = intervalo de clase
n = número de elementos (tamaño de la muestra)
(1 )
F k 1 = frecuencia absoluta acumulada ascendente anterior a la clase
mediana.
fk = frecuencia absoluta de la clase mediana.

PASOS PARA HALLAR LA MEDIANA


n
1º.Determinar la clase mediana, a través del cociente de cuyo resultado se la
2
(1 )
ubica en la frecuencia acumulada absoluta ascendente, F que le
contenga más próximo.

2º.determinar la amplitud del Intervalo “ a ”, restando el Límite superior menos el


Límite inferior de la clase mediana.
a  Ls  Li
O si se tuviera la marca de clase, restar una de ella con respecto al siguiente
inmediato.

a  X i 1
 X i

45
E x c e le n c ia A c a d é m ic a

3º.Determinar en la clase mediana el Límite inferior del intervalo o clase.

 Li  Ls 

Si solo tuviera la marca de clase x i entonces el límite inferior seria:


a
Li  Xi 
2

= valor de la marca de clase de la clase mediana.


= amplitud del intervalo
(1 )
F k 1

4º.Determinar la Frecuencia Acumulada Absoluta ascendente anterior a la clase


mediana

fk

5º.Determinar la frecuencia absoluta simple de la clase mediana


6º.Remplazar los valores en la formula de la mediana.

Peso
fi F (1 )
xi

50 5 5

55 15 20
(1 )
60 28 48  F k 1

65 22 70  C la s e

m e d ia n a

70 19 89

75 11 100

80 10 110

110

n (1 )
 F k 1
M e  Li  a 2
fk

46
E x c e le n c ia A c a d é m ic a

PASOS

n 110
  55
2 2

55 esta contenido F (1 ) = 7 1 , este determina la clase mediana.


ESTADISTICA

a  x i  1  x i  x1 1  x1  x 2  x1

a  55  50  5

a
L i  xi 
2
5
Li  65   6 5  2 .5
2

L i  6 2 .5 K g

(1 )
Fk 1  4 8

fk  22

55  48
M e  6 2 .5  5
22
M e  6 4 . 0 9  6 4 .1 K g

Interpretación: el 50% de los obreros pesan menos de 64.1 kg y el


otro 50% de los obreros pesan mas de 64.1 kg

Nº 2.2

1. Hallar la mediana de los salarios mensuales de 6 trabajadores:

s/1000, s/1300, s/1100, s/1150, s/1200, s/970

47
E x c e le n c ia A c a d é m ic a

2. hallar la mediana de las alturas de 100 alumnos de la UPLA

Altura (m)
fi F (1 )
Intervalo
[ 1.57 - 1.61 [ 4
[ 1.61 - 1.65 [ 28
[ 1.65 - 1.69 [ 43
[ 1.69 - 1.73 [ 18
[ 1.73 - 1.77 ] 7
TOTAL 100

4. LA MODA
La moda es el valor de la variable que mayor veces se repite o con mayor
frecuencia sucede.
Un grupo de datos puede tener una moda, dos modas, etc. En tales casos la
distribución se llama, respectivamente, unimodal, bimodal, etc. También, la
moda puede no existir, en caso de haber valores que se repitan.
ESTADISTICA
4.1. La Moda serie Simple

Ejemplo:
Hallar la moda de los números: 2, 2, 3, 4, 5, 5, 5, 5, 6, 6, 7
El número que más veces se repite es 5. Por consiguiente, 5 es la moda
(unimodal).

Ejemplo:
Hallar la moda de los números 2, 3, 4, 5, 6, 7, 8
Ningún número se repite más que los otros. Por consiguiente, no hay
moda.

Ejemplo:
Las calificaciones de un estudiante en 8 asignaturas fueron: 6, 5, 7, 6, 8, 5,
9, 10.
Hallar la moda de las calificaciones.
Las calificaciones que más veces se repiten son 5 y 6. Por consiguiente, 5
y 6 son las calificaciones moda (bimodal)

48
E x c e le n c ia A c a d é m ic a

4.2. La Moda serie Ponderada o agrupada:


1
Mo  Li  a
1   2

= Limite inferior de la clase modal


= Amplitud del intervalo de clase
= Variación 1
= Variación 2

PASOS PARA HALLAR LA MODA

1º.Determinar la clase modal, a través de la frecuencia absoluta simple mayor.


a  Ls  Li

2º.Determinar la amplitud del intervalo “ a ” restando el límite superior menos el


límite inferior de la clase modal.
a  Ls  Li
O si se tuviera la marca de clase, restar una de ella con respecto al siguiente
inmediato.
a  X i 1
 X i

3º.Determinar en la clase modal el límite inferior de la clase.


 Li  Ls 

Si solo tuviera la marca de clase X1 entonces el límite inferior seria:


a
Li  Xi 
2

xi = valor de la marca de clase de la clase mediana.


a = amplitud del intervalo

4º.Determinar la variación 1, 1, restando el valor de la frecuencia absoluta simple


de la clase modal menos la frecuencia de la clase anterior inmediata.
 1  f Mo  f Mo 1

49
E x c e le n c ia A c a d é m ic a

5º.Determinar la variación 2, 1, restando el valor de la frecuencia absoluta simple


de la clase modal menos la frecuencia de la clase posterior inmediata.
 2  f Mo  f Mo  1

6º. Remplazar los valores en la fórmula.


Ejemplo:
Las temperaturas tomadas en la ciudad de Huancayo, cada semana, durante un
año, hallar la temperatura Moda.
ESTA
T e m p e ra tu ra s
fi
(ºC )

5 12

10 8

15 16  C la s e m o d a l

20 7

25 5

30 4


M o  Li  a 1

1   2

PASOS
1º. La clase modal queda determinada por la frecuencia absoluta simple que más
veces se repite, en este caso es 16.
ISTICA
2º. a  x i  1  x i  x 3  1  x 3  x 4  x 3
a  20  15  5

a
3º. Li  x i 
2

5
Li  15   15  2 . 5
2
Li  12 . 5 º C

4º.  1  f Mo  f Mo 1

 1  16  8

1  8

50
E x c e le n c ia A c a d é m ic a

5º.  2  f Mo  f Mo 1

 2  16  7

2  9

6º. Reemplazando en la fórmula


8
Mo  12 . 5  5
89
Mo  14 . 85 º C

Interpretación: la temperatura que mayor veces se repite en el año es 14.85ºC

Cuando en una frecuencia absoluta simple (f) existen 2 o más frecuencias mayores
iguales, se toma cualquiera para determinar la clase modal.

Nº 2.3

1. Al finalizar sus estudios de Derecho, 60 estudiantes tenían 22 años, 50 tenían 23


años, 17 tenían 24años, y 8 tenían 25 años. Hallar la moda de las edades.
ESTADISTICA

2. Hallar la moda del cuadro siguiente:

Intervalo fi

[ 220 - 240 [ 48
[ 240 - 260 [ 60
[ 260 - 280 [ 60
[ 280 - 300 ] 30
TOTAL 198

51
E x c e le n c ia A c a d é m ic a

5. RELACION ENTRE EL PROMEDIO ARITMETICO, MEDIANA Y


MODA

a) Para curvas de frecuencias unimodales que sean ligeramente asimétricas,


se tiene la siguiente relación empírica:
X - M o = 3 (X - M e )

b) Cuando la curva de frecuencia es unimodal y simétrica:


X = Me = Mo

c) La Mediana aritmética está influenciada por los valores extremos, en cambio


la Mediana y la Moda no lo están.

d) Una curva de distribución sólo tiene una Xy una He, pero puede tener más
de una.

REFORZAMIENTO DE APRENDIZAJE
1. La inversión anual (en niveles de soles) de un grupo de pequeñas empresas de la
ciudad fueron:

10 38 30 16 25 30 30 18 23 25 38
13 21 14 27 14 13 18 30 25 18 37
12 10 15 20 28 26 10 17 26 28
17 14 19 22 11 15 20 39 23 38

Calcular:
a) Media
b) Mediana
c) Moda

Solución:
Tenemos que desarrollar una tabla de frecuencia

52
E x c e le n c ia A c a d é m ic a

1º. R  X max  X min

R  39  10  29

2º. m  1  3 . 322 log n

m  1  3 . 322 log 42

m  6 .4  6

R 29
3º. a  
m 6

a  4 . 83

4º. D  (m  a )  R

D  ( 6  4 . 83 )  29

D  28 . 98  29   0 . 02

Por ser negativo se rehace


Entonces a  4 . 84

D  ( 6  4 . 84 )  29

  0 . 02
D  29 . 04  29  0 . 04 
  0 . 02

-0 ,0 0 2 + 0 ,0 0 2

9 .9 8 10 39 3 9 .0 2

Resumen:

X min  9 . 98

X max  39 . 02

a  4 . 84

m  6

53
E x c e le n c ia A c a d é m ic a

Tabla de Frecuencia
Intervalo Tabulación fi F (1 ) Xi X i fi

[ 9.98 - 14.82 [ ||||| ||||| 10 10 12.40 124.00


[ 14.82 - 19.66 [ ||||| |||| 9 19 17.24 155.16
[ 19.66 - 24.5 [ ||||| | 6 25 22.08 132.48
[ 24.5 - 29.34 [ ||||| ||| 8 33 26.92 215.36
[ 29.34 - 34.18 [ |||| 4 37 31.76 127.04
[ 34.18 - 39.02 ] ||||| 5 42 36.60 183.00
TOTAL 42 937.04

Luego, calculamos:
a) La Media
n

 xi fi
i 1
x 
n

En la tabla determinamos  xi fi

937 . 04
x 
42
x  22 . 31 miles de soles

Interpretación: la inversión anual de las pequeñas empresas de la ciudad fue


de 22.31 (miles de soles) = s/22,310.00

B) La Mediana
n
 F k 1
(1 )

Me  Li  a 2
fk

n 42
  21 Determina la clase mediana en de la tabla que es 25
2 2

Interpretación: el 50% de las pequeñas empresas invierten menos de


S/21,270.00 y el otro 50% invierten más de S/21,270.00

54
E x c e le n c ia A c a d é m ic a

ESTADISTICA
c) La Moda
1
Mo  Li  a
1   2

Determinamos la clase modas en F1 mayor = 10


a  4 .8 4

L i  9 .9 8

 1  10  0  10

 2
 10  9  1

10
M o  9 .9 8  4 . 8 4
10  1
M o  1 4 . 3 8 m ile s d e s o le s

Interpretación: la inversión más frecuente es de 14.38 (miles de soles) =


s/14,380.00

6. MEDIA GEOMETRICA
El promedio geométrico se usa cuando hay que promediar razones o
proporciones. Asimismo, se aplica cuando en la serie interviene el factor tiempo,
como sucede en el cómputo de intereses; en el cálculo de números índices y en
series que presentan una progresión geométrica.
La media geométrica de una serie de n números es la raíz enésima del producto
de dichos números.

Xg  n
x1  x 2  x 3   x n

Ejemplo:
Hallar la media geométrica de los números 3, 9 y 27
X g  3  9  27
3

X g 
3
729

X g  9

Para simplificar los cálculos es necesario aplicar logaritmos (recuérdense que


con logaritmos, la multiplicación se transforma en suma y la raíz en división).

55
E x c e le n c ia A c a d é m ic a

6.1. Media Geométrica Serie Simple


n

 log x i
i 1
X g  anti log
n
Ejemplo:
x: 2, 4, 6, 8, 10

3,5 8 4 3 3
X g  a n ti lo g
5
X g  a n ti lo g 0 . 7 1 6 8 7

X g  5 .2 1

6.2. La Media Geométrica serie Ponderada


n

 (log x i ) f i
i 1
X g  anti log
n
Ejemplo:
En un examen de Psicología, 6 alumnos obtuvieron un 3; 8 obtuvieron un 4;
13 un 5; 8 un 6; 5 un 7; 3 un 8 y 1 un 9.
Hallar la media geométrica.

ESTADISTICA

56
E x c e le n c ia A c a d é m ic a

30 . 88002
X g  anti log
44
X g  anti log 0 . 70182

X g  5

Nº 2.4

1. Las velocidades de 100 metros planos de 6 estudiantes de una clase son:


11.6; 12.4; 11.8; 13.5; 13.0; 12.8 segundos. Hallar la media geométrica de las
velocidades.

2. Cuatro grupos de estudiantes, formados por 2, 10, 12, 10 alumnos, registraron


una media de pesos de 65, 70, 75 y 80kg, respectivamente. Hallar la media
geométrica de los pesos de los estudiantes.

3. En una fábrica hay 50 empleados, 30 de los cuales son casados y 20 solteros.


Si el salario mensual de un empleado casado es de s/1200 y el de un soltero
s/1000 ¿Cuál es la media geométrica del salario de un empleado de la
fábrica?

7. MEDIA ARMONICA
Es el reciproco del promedio aritmético de los recíprocos de los valores de la
serie.
Se utiliza para promediar velocidades y cuando los datos de la serie siguen una
progresión armónica.

7.1. La Media Armónica Serie Simple


1
 
n

  xi
1

X a   i 1 
 n 
 
 

57
E x c e le n c ia A c a d é m ic a

E je m p l o :

x: 2 , 4 , 6 , 8 , 1 0

7.2. La Media Armónica Serie Ponderada


1
 
n

  xi fi 
1

X a   i 1 
 n 
 
 

Ejemplo:

1
 12 . 078 
Xa 
 90 
 
90
Xa 
12 . 078
X a  7 . 45

58
E x c e le n c ia A c a d é m ic a

Nº 2.5

Hallar la media armónica de los problemas de la actividad 2.4

8. RELACIONES ENTRE LOS PROMEDIOS


El promedio aritmético está más influenciado por los elementos grandes de la
serie, que el promedio geométrico y el promedio armónico.
Los tres promedios quedan ordenados por su magnitud del siguiente modo.
x  Xg  Xa

9. CUARTILES
Los cuartiles, son tres valores que dividen la distribución (ordenada en forma
creciente) en cuatro grupos de igual número de términos. El primer valor se
denomina primer cuartil (Q1) y los otros segundo cuartil (Q2) y el tercer cuartil
(Q3). El segundo cuartil es igual a la mediana.

O sea Q 2  Me

9.1. Cuartiles Serie Simple

a) Primer Cuartil Q1

n 1
Q1 
4
n es el número de términos

b) Segundo Cuartel
n 1
Q2 
2

c) Tercer Cuartel
3 ( n  1)
Q3 
4

59
E x c e le n c ia A c a d é m ic a

Ejemplo:
x: 2, 5, 6, 8, 11, 14, 15, 17, 21, 24, 26

11  1
Q1  = 3º término de la serie
4

Q 1
 6

11  1
Q2  = 6º término de la serie
2

Q 2  14

3 (11  1 )
Q3  = 9º término de la serie
4

Q 3  21

9.2. Cuartiles Serie Ponderada

a) Primer Cuartil
n
 F k 1
(1 )

Q 1  Li  a 4
fk

b) Segundo Cuartil (Mediana)


n
 F k 1
(1 )

Q2  Li  a 2
fk

c) Tercer Cuartil
3n
 F k 1
(1 )

Q3  Li  a 4
fk

Los pasos de solución de los problemas de cuartiles, son iguales a los


aplicados para obtener la mediana.

60
E x c e le n c ia A c a d é m ic a

10. DECILES
Llámese deciles a 9 valores que se dividen la distribución (ordenada en forma
creciente) en 10 grupos de igual número de términos.

Para Deciles de serie ponderada, la formula es:

La solución es igual a los pasos de la Mediana

11. PERCENTILES
Los percentiles son 99 valores que se dividen la distribución (ordenada en
forma creciente) en 100 grupos de igual número de términos.

Para percentiles de serie ponderada la formula es:

La solución es igual a los pasos de la Mediana

12. APLICACIÓN DE CUARTILES, DECILES Y PERCENTILES


Se tiene los sueldos mensuales de 60 empleados del departamento de ventas
de una compañía de seguros, cuya Tabla de Frecuencia es:
ESTADISTICA

61
E x c e le n c ia A c a d é m ic a

Halla:
a) Cuartil 1
b) Cuartil 3
c) Decil 3
d) Decil 8
e) Percentil 27
f) Percentil 83
g) Percentil 1

Solución
a) Hallamos la clase cuartil 1
n 60
-   15
4 4

La clase se ubica en la frecuencia acumulada 24 por contener a 15

n (1 )
 Fk 1
a  50 Q1  Li  a 4
fk
Li  419
(1 ) 60
F k 1  1 2  12
fk  12 Q1  419  50 4
12
Q 1  4 3 1 . 5 0 N u e v o s s o le s

b) Cuartil 3

- Hallamos la clase cuartil 3


3n 3 ( 60 )
  45
4 4

La clase se ubica en la frecuencia acumulada 45 por contener a 45

3n
 F k 1
(1 )

a  50 Q3  Li  a 4
fk
Li  519
3 (6 0 )
Fk 1  3 5
(1 )  35
Q3  519  50 4
fk  10 10
Q 3  5 6 9 . 0 0 n u e v o s s o le s

62
E x c e le n c ia A c a d é m ic a

c) Decil 3
- Hallamos la clase decil 3
3n 3 ( 60 )
  18
10 10

La clase se ubica en la frecuencia acumulada 24 por contener a 18

a  50 3n (1 )
 Fk 1
Li  419 Dd  Li  a
10
fk
Fk 1  1 2
(1 )

3(6 0 )
fk  12  12
10
D3  419  50
12
D 3  4 4 4 . 0 0 N u e v o s s o le s

d) Decil 8
- Hallamos la clase decil 8
dn 8 ( 60 )
  48
10 10

La clase se ubica en la frecuencia acumulada 54 por contener a 48

a  50

Li  569

F k  1  45
(1 )

fk  9

dn
 F k 1
(1 )

10
D d  Li  a
fk

8 ( 60 )
 45
10
D 8  569  50
9
D 8  585 . 67 Nuevos soles

63
E x c e le n c ia A c a d é m ic a

e) Percentil 27
- Hallamos la clase percentil 27
pn 27 ( 60 )
  16 . 20
100 100
La clase se ubica en la frecuencia acumulada 24 por contener a 16.20.
pn (1 )
 Fk 1
a  50 Pp  L i  a
100
fk
Li  419
2 7 (6 0 )
Fk 1  1 2  12
(1 )

100
P2 7  4 1 9  5 0
fk  12 12
P2 7  4 3 6 . 5 0 N u e v o s s o le s

f) Percentil 83
- Hallamos la clase percentil 83
pn 83 ( 60 )
  49 . 80
100 100
La clase se ubica en la frecuencia acumulada 54 por contener a 49.80
pn (1 )
 F k 1
100
a  50 Pp  L i  a
fk
Li  569
8 3(6 0 )
Fk 1  4 5
(1 )
 45
100
P8 3  5 6 9  5 0
fk  9 9
P8 3  5 9 5 . 6 7 N u e v o s s o le s

g) Percentil 1
- Hallamos la clase percentil 1
pn 1 ( 60 )
  0 . 60
100 100

La clase se ubica en la frecuencia acumulada 4 por contener a 0.60


pn (1 )
a  50  F k 1
100
Pp  L i  a
Li  319 fk
Fk 1  0
(1 )
1( 6 0 )
 0
fk  4 P1  3 1 9  5 0
100
4
P1  3 2 6 . 5 0 N u e v o s s o le s

64
E x c e le n c ia A c a d é m ic a

13.- MEDIDAS DE DISPERSION O VARIABILIDAD


Las medidas de dispersión dan idea de la separación de los datos numéricos
alrededor de un valor medio (estadígrafos de posición), i mide el grado de
concentración o dispersión de los valores.
Clases de Medidas de Dispersión que estudiaremos:

A. Dispersión Absoluta
a) Rango
b) desviación Media
c) Varianza
d) Desviación estándar

B. Dispersión Relativa
a) Coeficiente de Variación
b) Variable Estandarizada

14. RANGO (R)


El rango o recorrido es la diferencia entre los valores extremos, máximo y
mínimo.
R  X max  X min

Ejemplo:
Hallar el rango de la siguiente serie de números: 4, 5, 7, 9.9, 10, 12, 15
R  15  4

R  11

La dispersión de los datos será mayor cuanto mayor sea el recorrido. El rango
no es una buena medida de dispersión, puesto que basta con que un dato se
aleje mucho de la media para que el rango resulte muy afectado, ya que
únicamente depende de dos valores, sin que influyan para nada los datos
restantes.

65
E x c e le n c ia A c a d é m ic a

15. DESVIACION MEDIA (DM)


La desviación media es una buena medida de dispersión.

15.1. Desviación Media Simple

n ( Va lo r A b s o lu to )
 xi  x
i1
DM 
n

xi = elementos o la observación
x = media
n = número de elementos

Ejemplo:
Hallar la desviación media de las tallas 1.47; 1.58; 1.60; 1.62; 1.53 metros.

Hallamos:

1 .4 7  1 . 5 8  1 . 6 0  1 .6 2  1 . 5 3
x 
5
x  1 .5 6

1 .4 7  1 . 5 6  1 .5 8  1 . 5 6  1 .6 0  1 . 5 6  1 . 6 2  1 .5 6  1 . 5 3  1 .5 6
DM 
5
 0 . 0 9  0 .0 2  0 .0 4  0 . 0 6   0 . 0 3
DM 
5
0 . 0 9  0 . 0 2  0 .0 4  0 .0 6  0 . 0 3 0 .2 4
DM  
5 5
D M  0 . 0 4 8 m e tro s

15.2. Desviación Media Ponderada

 xi  x fi
i 1
DM 
n

66
E x c e le n c ia A c a d é m ic a

Ejemplo:
Xi  peso Kg fi xi fi xi  x xi  x fi

40 4 160 5.88 23.52


43 5 215 2.88 14.40
46 8 368 0.12 0.96
49 6 294 3.12 18.72
52 3 156 6.12 18.36
Total 26 1193 75.96

Hallamos:
n

 xi fi
i 1
x 
1· n
1193
x   45 . 88 Kg
26

 xi  x fi
i 1
DM 
n
75 . 96
2· DM 
26
DM  2 . 92 Kg

16.- VARIANZA

16.1. Varianza Simple

a) Varianza de una Población


N

 x 
2
i
 
i 1
 
2

b) Varianza de una Muestra


n

  xi  x 
2

i 1

2
S
n

67
E x c e le n c ia A c a d é m ic a

Ejemplo:
Calcular la varianza de 4, 5, 6, y 7.

xi
x 
n

4 5 6 7 22
x    5 .5
4 4

  x i  x 
2

i 1

2
S
n
2 2 2 2
2 4  5 .5  5  5 .5  6  5 .5  7  5 .5
S 
4
2 2 .2 5  0 . 2 5  0 .2 5  2 .2 5 5
S  
4 3
 1 .2 5
2
S

16.2. Varianza Ponderada

a) Varianza de Una Población


N

  xi   
2
fi
i 1
 
2

b) Varianza de Una Muestra


n

  xi  x  fi
2

i 1
 n  30
2
S para
n
n

  xi  x  fi
2

i 1
 n  30
2
S para
n 1

68
E x c e le n c ia A c a d é m ic a

Ejemplo:

Talla(mts)
xi  x x  x fi
2 2
fi xi fi xi  x i
xi

1.52 3 4.56 -0.08 0.0064 0.0192


1.56 5 7.80 -0.04 0.0016 0.0080
1.60 9 14.40 0 0 0
1.64 6 9.84 0.04 0.0016 0.0096
1.68 4 6.72 0.08 0.0064 0.0256
Total 27 43.32 0.0624

 xi fi
4 3 .3 2
i1
x    1 .6 0
n 27

  x i  x  f i
2

i 1
 por ser n  30
2
S
n 1
0 .0 6 2 4 0 .0 6 2 4
 
2
S
27  1 26
 0 . 0 0 2 4 m e tro s
2
S

17. DESVIACION ESTANDAR


Es la Raíz cuadrada positiva de la varianza; una medida de la dispersión,
expresada en las mismas unidades que los datos originales y no en las unidades
cuadradas de la varianza.
En general, la Desviación Estándar es la raíz cuadrada de la varianza.
S 
2
S para muestra

  
2
Para población

Ejemplo: (de los ejemplos de la varianza)


S 
2
S

S  1 . 25

S  1 . 12

69
E x c e le n c ia A c a d é m ic a

Ejemplo:
S 
2
S

S  0 . 0024

S  0 . 049 metros

Las fórmulas de las Desviación Estándar son iguales a la Varianza pero


aplicándole la raíz cuadrada.

18. CARACTERISTICAS DE LA VARIANZA Y DESVIACIÓN


ESTANDAR.
a) Son siempre un valor positivo.
b) Son influenciado por todos los valores de la muestra o población.
c) Mayor influencia ejercen los valores extremos que los que están próximo a
los promedios.
d) Si en una distribución normal se levanta una ordenada a uno y otro lado del
promedio a una distancia igual a la desviación estándar.

x  S  68 . 26 %

x  2 S  95 . 46 %

x  3 S  99 . 73 %

El porcentaje de esos valores quedan incluidos dentro de estos límites.

e) La varianza y la desviación estándar de una constante es cero.


f) La desviación estándar del producto de una constante por una variable, es
igual al producto de la constante tomada en valor absoluto por las
desviación estándar de la variable.
g) La varianza del producto de una constante por una variable, es igual al
cuadrado de la constante por la varianza de las variables.
h) La desviación estándar de la suma de una variable y una constante, es
igual a la desviación estándar de las variables.
i) La varianza de una función lineal, es igual a la constante al cuadrado por la
varianza de la variable.

70
E x c e le n c ia A c a d é m ic a

19. COEFICIENTE DE VARIACION (CV)


Es una medida relativa de dispersión, semejante entre las distribuciones, que
expresa la desviación estándar en un porcentaje de la media.

CV  100  para población

S
CV  100  Para muestra
x
Ejemplo:
Si la desviación estándar de la población P es 5 y media población es 40 el
coeficiente de variación es:
5
CV  100 
40
CV  12 . 5 %

20. VARIABLE ESTANDARIZADA


La variable estandarizada se calcula:

xi  
Zi  Para población

xi  x
Zi  para muestra
S
Ejemplo:
En un examen de Estadística, la nota media fue de catorce y la desviación
estándar de 1.6. Determinar las variables estandarizadas para los valores o
notas de X: 12, 17, 20, 13
xi  
Zi 

12  14  2
Z1     1 .2 5
1 .6 1 .6

17  14 3
Z2    1 .8 7
1 .6 1 .6

20  14 6
Z3    3 .7
1 .6 1 .6

13  14 1
Z1     0 .6 2 5
1 .6 1 .6

71
E x c e le n c ia A c a d é m ic a

La variable estandarizada se aplica en la probabilidad de la Distribución Normal.

1) Las ventas diarias (miles de dólares) de una tienda de artefactos eléctricos


es:

f i
F
)1(

Ventas Dias Calcular:


xi fi a) Rango

[ 20 - 24 ] 9 b) Desviación Media

[ 24 - 28 ] 12 c) Desviación Estándar

[ 28 - 32 ] 8 d) Varianza
e) coeficiente de Variación
[ 32 - 36 ] 3
[ 36 - 40 ] 3
[ 40 - 44 ] 2
TOTAL 37
E
2) Las estaturas de 12 estudiantes de una clase son: 165, 160, 164, 155, 160
y162 cm.

Calcular:
a) Rango
b) Desviación Estándar
a) Coeficiente de Variación

21. MEDIDA DE ASIMETRIA


La medida o estadígrafo de asimetría indica el grado de deformación de la curva
de frecuencia, puede ser inclinada a la derecha o izquierda. La curva de
frecuencia puede ser simétrica, caso determinado por la posición de la media,
mediana y moda ( x  Me  Mo )

72
E x c e le n c ia A c a d é m ic a

21.1. Tipo de Medida de Asimetría.


a) Curva asimétrica positiva o con cola a la derecha, hay predominio de los
valores menores.

100

80

60

40

20

0
0 5 10 15

b) Curva asimétrica negativa o con cola a la izquierda, indica predominio de los


valores mayores.

100

80

60

40

20

0
0 5 10 15

c) Curva simétrica o campana de GAUSS (curva teórica de análisis).

90
80
70
60
50
40
30
20
10
0
0 5 10 15 20

ESTADISTICA

21.2.- Coeficiente de Asimetría de PEARSON


a) En función de la moda.
x  Mo
As 1 
S

73
E x c e le n c ia A c a d é m ic a

x = Media aritmética
Mo = Moda
S = desviación estandar

Resultados:
- Si el valor es cero, la curva es simétrica.
- Si el valor es igual a, la curva es asimétrica moderada positiva o
negativa.
- Si el valor es igual a, la curva es asimétrica muy marcada positiva
o negativa.
- Si el valor es igual a, la curva es asimétrica máxima positiva o
negativa.

Ejemplo:
La media de los salarios es s/.109.50, la moda s/.108.30 y su
desviación estándar s/.400, calcular el coeficiente de asimetría
109 . 50  108 . 30
As 1 
4 . 00
As 1  0 . 3

Como el valor es positivo es una curva asimétrica positiva muy


marcada.

b) En Función de la Mediana
3 ( x  Me )
As 2

S

x = Media aritmética
Me = Mediana

S = desviación estandar

Resultados:
- Si el valor es igual a cero, la curva es simétrica.
- Si el valor es mayor que cero, la curva es asimétrica positiva.
- Si el valor es menor que cero, la curva es asimétrica negativa.

74
E x c e le n c ia A c a d é m ic a

Ejemplo:
La media de los pesos de los trabajadores de una fabrica es de 68kg, la mediana
71kg y la desviación estándar de 3.5kg. Calcular el coeficiente de asimetría.
3 ( 68  71 ) 9
As 2
 
3 .5 3 .5
As 2
  2 . 57

Como el valor es menor que cero, la curva es asimétrica negativa.

22.- MEDIDA DE APUNTAMIENTO


La medida de apuntamiento o estadígrafo de Kurtosis es el grado de
deformación vertical de una curva de distribución de frecuencia. Se analiza
comparando la curva de distribución con una curva normal o campana de
Gauss.

22.1. Tipos de Curvas de Distribución

a) Leptokurticas (LK)
Es cuando su elevación es muy pronunciada o sea superior a la curva
normal. Se presenta cuando la desviación estándar de dicha
distribución es mínima.

b) Mesokurticas (MK)
Es cuando la elevación es la de una curva normal.

c) Platikurticas (PK)
Es cuando la elevación es inferior o queda por debajo de una curva
normal, se presentan cuando la desviación estándar de la distribución
es relativamente grande.
ESTADISTICA

140
120 LK
100
80 MK
60
40 PK
20
0
0 5 10 15 20

75
E x c e le n c ia A c a d é m ic a

22.2. Coeficiente de Kurtosis


Q 3 = Cuantil 3

Q3 = Cuantil 2
P90 = Percentil 90
P10 = Percentil 10

Resultados:
El valor de K no pasa de 1 tampoco puede ser negativo.

Si K esta de cero a1/8 la curva es platikurtica


Si K esta de 1/8 a 3/8 la curva es mesokurtica
Si K esta de 3/8 a1/2 la curva es leptokurtica
Ejemplo:
Se tienen las tallas de los estudiantes de la UPLA, cuyos cuartiles 1 y 3
son 1.575 y 1.725 metros, respectivamente, y los percentiles
calculados son: P90 = 1.77m y P10 =1.53m Calcular el coeficiente de
kurtosis.
El valor se encuentra en intervalo de mesokurtosis.

Nº 2.7

La inversión anual (miles de dólares) de un grupo de empresarios de Huancayo,


fueron:
12 10 16 28 32 18 40
14 16 27 13 19 38 18
13 32 22 31 10 37
18 15 24 14 23 36
42 14 27 28 21 37
22 19 15 17 29 25

76
E x c e le n c ia A c a d é m ic a

Determinar e interpretar.
a) Coeficiente de Kurtosis
b) Coeficiente de Pearson
- Por la moda
- Por la mediana
ESTADISTICA

AVILA., Roberto. Estadística Elemental. Editorial R.A. Lima, 1998.

CALZADA B., José. Estadística General. Editorial Jurídica S.A., Lima, 1966.

JONSON, Robert. Estadística Elemental, Editorial Trillas. 2ª edición. México. 1991.

MOOD, Alexander M. Introducción a la Teoría Estadística. Editorial Aguilar. Madrid


1972.

MOYA, Rufino. Estadística Descriptiva. Editorial San Marcos. Lima 1991.

VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias Graficas S.A.
2ª Edición. Lima 1993.

En el siguiente fascículo iniciamos el estudio de la teoría de la probabilidad,


conceptos básicos, análisis combinatorio, diagrama de árbol, el método Clásico,
método de la frecuencia relativa, método subjetivo y probabilidades frente a
apuestas, espacios muestrales finitos, probabilidad condicional y Teorema de Bayes.

77
E x c e le n c ia A c a d é m ic a

A
u
A
ut
o
t
oe
ev
a
v
al
u
l
uaa
c
ci
ó
i
ónn
f
fo
r
o
rm
ma
t
a
ti
v
i
va Nº
a 02

1. En el departamento de producción de una fábrica tienen los siguientes sueldos


hasta fines del mes de julio.
Sueldo Mensual
Empleados
(S/.)
485 - 585 15
585 - 685 25
685 - 785 30
785 - 885 20
885 - 985 5
985 - 1085 5
TOTAL

Calcular e interpretar:
a) La Media
b) La Mediana
c) La Moda

2. Los siguientes datos dan las cantidades gastadas (en nuevos soles) en
alimentación de una muestra de familia.
ESTADISTICA
22.7 7.6 29.5 15.19 31.9
19.9 26.6 16.2 27.9 23.2
24.6 30.9 5.0 32.1 4.0
47.4 24.0 17.0 15.1 18.8
29.9 34.2 43.4 57.0 12.3
33.7 27.1 36.3 25.0
17.7 27.9 20.5 32.5
27.8 42.9 18.1 32.0
29.7 19.2 10.0 30.3
23.5 11.6 29.4 33.5

78
E x c e le n c ia A c a d é m ic a

Calcular e interpretar:
a) La Media
b) La Mediana
c) La Moda

3. De un total de 100 números, 15 eran 4; 45 eran 5; 25 eran 6; 15 eran 7

Calcular:
a) La Media
b) La Moda
c) La Mediana

4. Dado la distribución de frecuencia de alturas de 449 plantas en centímetros.


f i

Clases fi
[ 45 - 50 ] 2
[ 50 - 55 ] 7
[ 55 - 60 ] 18
[ 60 - 65 ] 36
[ 65 - 70 ] 59
[ 70 - 75 ] 74
[ 75 - 80 ] 88
[ 80 - 85 ] 72
[ 85 - 90 ] 44
[ 90 - 95 ] 30
[ 95 – 100 ] 11
[ 100 – 105 ] 5
[ 105 – 110 ] 3
TOTAL 449

79
E x c e le n c ia A c a d é m ic a

En forma hipotética calcular:

A) Media geométrica
b) Media armónica
c) Media aritmética
d) Cuartil 1
e) Cuartil 3
f) Decil 4
g) Decil 7
h) Percentil 2
i) Percentil 93
j) La Moda y Cuartil 2
K) Rango
l) Desviación Media
m) Varianza
n) Desviación Estándar.
o) Coeficiente de Variación
p) Coeficiente de Asimetría de Pearson
q) Coeficiente de Kurtosis

80
E x c e le n c ia A c a d é m ic a

Unidad Temática III

PROBALIDAD

- Define lo que es probabilidad.


- Explica los términos experimento, espacio maestral y evento.
- Maneja los principios de probabilidad.
- Cuenta el número de subconjunto que se puede armar a partir de un conjunto.
- Analiza y calcula problemas de permutación, variación y combinación.
- Describe los enfoques clásicos de frecuencia relativa y subjetiva para
probabilidad.
- Define los términos de probabilidad condicional, frente a apuestas y de
espacios muestrales finitos.
- Calcula posibilidades utilizando el teorema de Bayes.

1. INTRODUCCION A LA TEORIA DE LA PROBABILIDAD


Jacob Bernoulli, Abraham de Moure, Thomas Bayes y Joseph Lagrange
inventaron fórmulas y técnicas de probabilidad. En el siglo XIX Pierre Simon,
Marques de Laplace, unificó esas primeras ideas y formuló la primera teoría
general de la probabilidad.

La teoría de la probabilidad fue aplicada con buenos resultados a las mesas de


juegos y, lo que es mas importante para nuestro estudio con el tiempo, también
se aplicó a otros problemas socioeconómicos. La teoría matemática de la
probabilidad constituye el fundamento de las aplicaciones estadísticas tanto en la
investigación social como en la toma de decisiones.

2. CONCEPTO DE PROBABILIDAD
La probabilidad es la posibilidad de que ocurra algo. Las probabilidades se
expresan como fracciones o como decimales entre 0 y 1. Asignar una
probabilidad de cero significa que algo nunca ocurrirá; una probabilidad de 1
indica que algo sucederá siempre.

81
E x c e le n c ia A c a d é m ic a

La noción de probabilidad viene de la necesidad de medir de alguna manera la


certeza o la duda de que algún suceso ocurra o no.
El fin de la teoría de probabilidades es examinar las formas y los medios de
obtener esas medidas de certeza, así como encontrar los métodos para
combinarlos cuandointervienen varios sucesos en un experimento.

3. EXPERIMENTO
Experimento es la prueba, ensayo u observación de un hecho o fenómeno.
Los experimentos pueden ser:

3.1. Experimento Determinístico


Es cuando anticipadamente sabemos lo que va a ocurrir, o sea donde entra
la voluntad del hombre, el resultado puede determinarlo, la persona.

Ejemplos:
- Cuando se lanza una flecha hacia arriba, se sabe que va a caer.
- Cuando se suma números pares, el resultado será también un número
par.

3.2. Experimento Aleatorio


Son aquellos cuyos resultados no pueden predecirse antes de su
realización. Son experimentos que no dan siempre el mismo resultado al
repetirlos en las mismas condiciones. En este experimento no funciona la
voluntad del hombre.

Ejemplos:
- Cuando lanzamos un dado, no sabemos que numero va a salir.
- Predecir la duración de una conversación telefónica.
- Lanzar un proyectil hacia un blanco determinado, no sabemos si dará en
el blanco.

4. ESPACIO MUESTRAL ( S ) (Ω)


Espacio muestral es el conjunto de todos los resultados posibles de un
experimento aleatorio.
Ejemplo:
- Experimento E: lanzar un dado
Espacio Muestral S: {1, 2, 3, 4, 5, 6}
- E: lanzar dos monedas

82
E x c e le n c ia A c a d é m ic a

S:{(cara, cara), (sello, sello), (cara, sello), (sello, cara)}


- E: elegir una persona en la calle, en cuanto a su estado civil
S:{casado, soltero, viudo, divorciado, conviviente}

5. EVENTO O SUCESO (A)


El evento o suceso es el resultado de cada una de las realizaciones del
experimento aleatorio; o sea, un resultado que presenta cierto atributo o
característica que nos interesa para su análisis.A
El evento o suceso es un subconjunto del Espacio Muestral.

Ejemplos:
-Al lanzar una moneda y un dado, obtener cara y un numero par.
Suceso A= {(c, 2), (c, 4), (c, 6)}

-Al lanzar dos dados, dé como resultado 7.


A= {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}

- De un grupo de personas A, B; C; D, elegir una comisión de tres personas en el


que este A. A= {(ABC), (ABD), (ACD)}

- De cuatro libros A, B, C, D, se quieren guardar en un estante, donde C siempre


este ultimo.
A= {ABCD, ADBC, DABC, BADC, BDAC, DBAC}

Cualquier suceso que sea igual al conjunto vació se llama suceso imposible, y
por tanto, será un suceso que no se produce nunca. Cualquier suceso que sea
igual al espacio muestral se llama suceso seguro (es el suceso que ocurre
siempre).

Ejemplos:
- En el lanzamiento de una moneda:
Obtener cara y sello es un suceso imposible.
Obtener cara o sello es un suceso seguro.

83
E x c e le n c ia A c a d é m ic a

- En el lanzamiento de un dado:
Obtener un número negativo es un suceso imposible
Obtener un número menor que siete es un suceso seguro.

Nº 3.1

* Realizar 10 ejemplos de experimentos aleatorios con un suceso y determinar su


espacio muestral y el suceso o evento por extensión.

5.1. OPERACIONES CON EVENTOS O SUCESOS


En el conjuntote todos los eventos o sucesos del espacio muestral, se pueden
definir operaciones entre los eventos.
Estudiaremos brevemente las siguientes operaciones:

a) Reunión o Unión de Eventos


Es designado por A  B, es el evento que esta formado por los elementos
del espacio muestral que están en A, en B o en ambos eventos a la vez.

A B

A B

b) Intersección de Eventos
Es la designación por A  B o AB, es el evento formado por los elementos
comunes a A y B.

A B

A B

84
E x c e le n c ia A c a d é m ic a

c) Complemento de un Evento
El complemento de a se denota con A , A’ o A c , se define con el evento
formado por los elementos del espacio muestral que no están en A.
El evento A se realiza cuando el evento A no se realiza.

A ,A’ o A
c

Ejemplos:
En el experimento aleatorio lanzar un dado, sean los sucesos:
K: obtener número par
L: obtener múltiplo de 3

Ω= {1, 2, 3, 4, 5, 6}
K= {2, 4, 6}
L= {3, 6}

Se tiene:
K L = {2, 3, 4, 6}
K L = {6}
K =K’ = {1, 3, 5}
L = L’ = {1, 2, 4, 5}

Decimos que dos sucesos A y B son incompatibles si no pueden verificarse


simultáneamente, es decir, si

5.2. PROPIEDADES

a) Asociatividad
A  (B  C) = (A  B)  C
A  (B  C) = (A  B)  C

85
E x c e le n c ia A c a d é m ic a

b) Conmutatividad
A B = B A
A B = B A
c) Simplificación
A  (B  A) = A
A  (B  A) = A
d) de Impotencia
A A = A
A A = A

e) Complementación
A  A’= Ω
A  A’= Ø

f) Universal e Ínfimo
A Ω = Ω
A Ω = A
A Ø = A
A Ø = Ø

g) Distributiva
A  (B  C) = (A  B)  (A  C)
A  (B  C) = (A  B)  (A  C)

h) Leyes de Morgan
(A  B)’=A’  B’
(A  B)’=A’  B’

Se lanzan 2 monedas. Sean:


A = {salgan 2caras}
B = {salgan 2 sellos}
C = {salgan una cara y un sello}

86
E x c e le n c ia A c a d é m ic a

Obtener los siguientes sucesos:


a) A  B b) A  C c) A-B
d) A’ e) C’ f) (A  B)’
g) A  B  C h) A  B  C

5.3. RELACIONES ENTRE SUCESOS O EVENTOS

a) Inclusión de Suceso
Diremos que el suceso A esta incluido en B si todas las ocurrencias de A
esta incluido en B si todas las ocurrencias de A son también ocurrencias
de B, se escribe.
A B
Ejemplo:
A = {1, 2, 3}
B= {1, 2, 3, 4, 5, 6}

b) Suceso Mutuamente Excluyente


Dos sucesos A y B son mutuamente excluyentes cuando no tiene
ocurrencias comunes. Se escribe:
A B = Ø
Ejemplo:
No puede ocurrir que un abogado sea analfabeto.
Abogados y analfabetos son sucesos excluyentes.
ESTADISTICA
c) Suceso Mutuamente Exhaustivo
Dos sucesos A y B son mutuamente exhaustivos cuando son a la vez
mutuamente excluyentes y complementarios. Entonces diremos:
A y B son mutuamente exhaustivos sí solo sí: A  B = Ø  A  B =
Ω

d) Partición de Sucesos
Diremos que el espacio muestral esta particionado en A1, A2, A3, etc.
Sí solo sí cumple las siguientes condiciones:

87
E x c e le n c ia A c a d é m ic a

1º A1 ≠ Ø, A2 ≠ Ø, A3 ≠ Ø, …
Esto quiere decir que tiene ocurrencias
2º A1  A2 = Ø, A1  A3 = Ø, A2  A3 = Ø, …
O sea que no comparten ocurrencias, no tienen elementos
comunes.
3º A1  A2  A3…= Ω
Es la unión de todos al unir todos los elementos y dar como
resultado el espacio muestral.

A1 A2

A3
A4 …
Ω

e) Potencia de un Suceso o Algebra de Elemento (25)


Ejemplo: 2 S  A A  S 
Experimento= {lanzar una moneda}
S    c, s
S
 2  4  2   , c , s , c, s
S 2
2

6. ANALISIS COMBINATORIO
Es una parte del algebra que estudia los distintos grupos que se pueden formar
con cierto numero de objetos, atendiendo a determinados criterios.

PRINCIPIOS
a) Principio de Adición
Consiste en que dado dos o más sucesos mutuamente excluyente puede ocurrir
de la primera o segunda forma.
A B

#A = m #B = n
Ocurrencia de A o B = m+n maneras

88
E x c e le n c ia A c a d é m ic a

Ejemplos:
- Se viaja de Lima a Huancayo, hay 2 compañías aéreas y 12 empresas
terrestres. m = 2, n = 12
Hay 14 formas de viajar (son excluyentes o mutuamente excluyentes).
- Para ir de un punto de la ciudad a otro hay avenidas y jirones que son
excluyentes.
Si hay 5 avenidas y 2 jirones de cuantas maneras se puede desplazar.
Avenidas m=5
Jirones n=2
m+n = 5+2 = 7 maneras

b) Principio de Multiplicación
#A = m y #B = n
Ocurrencia de A y B = m

Ejemplos:
- Se quiere combinar 4 chompas y 2 faldas de diferentes colores, donde:

A = 4 chompas (azul, negra, blanca, verde)


B = 2 faldas (roja, marrón)

m × n = 4 × 2 = 8 formas diferentes de combinar


ESTADISTICA
- Cuantos números pares de 3 cifras diferentes, se pueden formar con los
dígitos 2, 3, 4, 5, y 6.

La cantidad de número de 3 cifras diferentes es: 3 × 4 × 3 = 36

- Dado los dígitos 0, 1, 3, 5, 6, 8:

89
E x c e le n c ia A c a d é m ic a

* Cuantos números de 4 cifras se pueden escribir

* Cuantos números de 4 cifras múltiplos de 5 se pueden escribir

* Cuantos números de 4 cifras impares se pueden escribir

1. Con los 10 dígitos (0, 1… 9)

a) Cuantos números de 3 cifras se pueden escribir.


b) Cuantos números de 3 cifras múltiples de 5 se pueden escribir.

2. Un producto se vende en 3 mercados: en el primer mercado se tiene


disponible 5 tiendas, en el segundo mercado 4 y en el tercer mercado 6
tiendas, ¿De cuantas maneras puede venderse el producto?

3. Una persona puede viajar de una ciudad A a otra B de 5 formas y de B a


C de 6 formas diferentes. ¿De cuantas formas puede ir de A a C pasando
por B?

90
E x c e le n c ia A c a d é m ic a

7.- FACTORIAL DE UN NÚMERO


Se llama factorial de un numero “m” o “m factorial” al producto de los m factores
decrecientes a partir de m hasta 1.

Se designa por:!
m factorial= m!

Ejemplo:
5! = 5 × 4 × 3 × 2 × 1 = 120
3! = 3 × 2 × 1 = 6

0!=1

8.- PERMUTACION
Calcula las posibles agrupaciones que se pueden establecer con todos los
elementos de un grupo, por lo tanto, se distingue de los otros en el orden.

Ejemplo:
Calcular las posibles formas en que se pueden ordenar a, b y c.
Hay 6 posibles agrupaciones: (a, b, c), (a, c, b), (b, a, c), (c, a, b), (c, b, a).

8.1.- PERMUTACION ORDINARIA


Pm = m!

Ejemplos:
- Cuantos números de 4 cifras diferentes se pueden escribir con los dígitos
3, 4, 5 y 6

P4 = 4! = 4 × 3 × 2 × 1
P4 = 24

- De cuantas maneras diferentes pueden colocarse, en un estante 5 libros


diferentes de Estadística y tres de Biología.

91
E x c e le n c ia A c a d é m ic a

a) Si no hay ninguna condición sobre las ubicaciones.


b) Si los libros de cada curso deben estar juntos.
c) Si solo los libros de Biología deben estar juntos.

Solución:
a) Pm = m!
P8 = 8! = 8 × 7 × 6 ×5 × 4 × 3 × 2 × 1
P8 = 40320 maneras

b) Libros de EstadísticaP5 (bloque)


Libros de BiologíaP3 (bloque)

Entre grupos de libros de Estadística y de Biología. P2

P5 × P3 × P2 = 5! 3! 2! = 120 × 6 × 2 = 1440

c) Los libros de Biología permutan entre 3 y forman un solo bloque P3

Los libros de Estadística permuta entre los 5 y también permuta con


el bloque de Biología. P6

P3 × P6 = 3! 6! = 6 × 720 = 4320

8.2. PERMUTACION CIRCULAR


PmC = (m-1)!

Se refiere al cambio de posición pero en una circunferencia.


Se toma cualquier punto de referencia por que no hay centro.

Ejemplo:
De cuantas formas diferentes pueden sentarse 10 ministros alrededor de
una mesa si:
a) Si pueden sentarse de cualquier forma.
b) Dos ministros determinados deben estar juntos.
c) Dos ministros determinados no deben estar juntos.

92
E x c e le n c ia A c a d é m ic a

Solución
a) PmC = P10C = (10-1)! = 9! = 362880 formas
b) Dos ministros siempre juntos se considera como 1. Pero permutan en
ellos P2 y luego permutan con los 8 restantes formando como si fueran
9 ministros.
c)
P9 C  P2  ( 9  1 )!  2 !  8 ! 2 !  80640 formas

a) P10 C   P 9 C  P 2  362880  80640  282240

8.3. PERMUTACION CON REPETICION


m!

m
Pm
1m 2
m 1! m 2 !

m = total de elementos

Repetición: Por que los elementos pueden entrar varias veces en las
agrupaciones.

Ejemplo:
- Cuantos numeros de cuatro cifras se pueden escribir con dos5 y
dos 7

Por extensión:
5775 7557
5757 7575
5577 7755

- Cuantos signos diferentes, cada una de 6 banderas, colocadas en línea


vertical pueda formarse con un conjunto de 4 banderas rojas y 2
banderas blancas.
6! 720 720
P4 , 2     15 maneras
6

4! 2! 24  2 48

9. VARIACION
Es una forma de permutación, en el cual no interviene todos los elementos.

9.1. VARIACION SIMPLE O GENERAL


m!
Vn 
m

( m  n )!

93
E x c e le n c ia A c a d é m ic a

m = todos los elementos


n = parte de m
ESTAD
Ejemplos:
- De cuantas maneras diferentes se pueden presentar a, b, c y d
tomados de dos en dos.

4! 24
V2    12 maneras
4

( 4  2 )! 2

- De un conjunto de 6 candidatos, de cuantas maneras se pueden


elegir 3, Presidente, secretario y tesorero.

6! 720
V3    120 maneras
6

( 6  3 )! 6

9.2. VARIACION CON REPETICION

Vn r  m
m n

Ejemplos:
- De cuantas maneras diferentes pueden presentarse a, b, y c
tomados de dos en dos con repetición.
V 2 r  3  9 maneras
3 2

- Cuantos números de dos cifras, con repetición se pueden escribir


con 5, 6, 7 y 8

V2 r  4  16
4 2
maneras

10. COMBINACION
Son ciertos arreglos que se hacen con una parte del total de elementos, en el
cual no interesa el orden, o sea un grupo del otro se diferencia de elemento en
elemento.

10.1. COMBINACIÓN SIMPLE O GENERAL


m!
Cn 
m

n ! ( m  n )!

m = to ta l d e e le m e n to s
n = p a rte d e m

94
E x c e le n c ia A c a d é m ic a

Ejemplos:
- En una reunión hay 15 personas. Cuantos apretones de manos se darán al
saludarse todos ellos entre sí.
1 5! 1 5! 15  14  13   210
C2   
15
= = 1 0 5 a p r e to n e s
5
2 ! (1 5  2 ) ! 2 ! 1 3! 2  1 13  

( s e p u e d e s im p lific a r )

ESTADISTICA
- En una reunión hay 10 varones y 6 damas. De cuantas maneras pueden
colocarse en una fila de grupo de 5; de los cuales 3 sean varones y 2
mujeres.
Solución:
10
Forma de escoger varones C3
6
Forma de escoger damas C2
En al fila se pueden permutar entre 5 P 5
C 3  C 2  P5 !
10 6
Total de maneras =

10 ! 6!
=   5!
3! (10  3 )! 2 ! ( 6  2 )!

= 120  15  120  216000

10.2. COMBINACION CON REPETICIO


Ejemplo:
- Cuantas combinaciones con repetición, obtendremos dados 4
símbolos diferentes, tomados de tres en tres.

( 4  3  1 )! 6! 720
C3r   
4

( 4  1 )! 3! 3! 3! 36

 20 combinacio nes

11. DIAGRAMAS DE ARBOL


Un diagrama de árbol es el dibujo que se usa para enumerar todos los
resultados posibles de una serie de experimentos en donde cada experimento
puede suceder en un número finito de maneras. La construcción de diagramas
de árbol se ilustra en los siguientes ejemplos.
Ejemplo:
Marcos y Enrique intervienen en un torneo de tenis. La primera persona que
gane dos juegos seguidos o que complete tres gana el torneo. El diagrama
siguiente muestra los posibles resultados del torneo.

95
E x c e le n c ia A c a d é m ic a

A
Nótese que hay 10 puntos finales que corresponden a los 10 resultados
posibles del torneo:

MM, MEMM, MEMEM, MEMEE, MEE, EMM, EMEMM, EMEME, EMEE, EE


El recorrido desde el principio del árbol a los puntos finales indica quién ganó
cada juego en el torneo individual.

Nº 3.4

1. A una reunión asistieron, 2 damas y 3 caballeros.


a) ¿De qué maneras pueden sentarse en una fila?
b) ¿De cuántas maneras se pueden sentar alrededor de una mesa
circular?
c) ¿De cuántas maneras pueden sentarse si las damas se sientan juntas
y los caballeros también?
d) ¿De cuántas maneras pueden sentarse si las damas se sientan juntas
y los caballeros también, pero alrededor de una mesa circular?
e) ¿De cuántas maneras pueden sentarse en fila si las damas siempre
están juntas?

2. En una carrera de caballos participan 19 ejemplares, si se trata de que usted


acierte los tres primeros puestos en la clasificación final. ¿De entre cuantas
posibilidades tendría que escoger una?

3. Con 6 consonantes y 5 vocales diferentes. ¿Cuántas palabras pueden


formarse, que consta de tres consonantes y tres vocales?. NO interesando
que las palabras así formadas tengan significado.

4. Un estudiante tiene que contestar 8 de 10 preguntas en un examen.


a) ¿De cuantas maneras tiene que escoger?

96
E x c e le n c ia A c a d é m ic a

b) ¿De cuantas maneras, si las tres primeras son obligatorias?


a) ¿De cuantas maneras, si tiene que contestar 4 de las 5 primeras
preguntas?

5. De un total de 5 preguntas teóricas y 7 preguntas prácticas, un


estudiante debe resolver 2 de teoría y 3 de práctica.
a) ¿De cuantas formas puede escoger?
b) ¿De cuantas formas si debe resolver obligatorio una pregunta practica?
c) ¿De cuantas maneras debe escoger si dos preguntas teóricas
determinadas no deben resolver?

Nº 3.5

1. Se corre una carrera en la que dan premios a los dos primeros participantes
que crucen la línea de la meta. Si hay cuatro corredores (K, L, M, N)
¿De cuantas maneras diferentes pueden repartirse las copas los
participantes?

12. DEFINICION CLASICA DE PROBABILIDADES


Si un espacio muestral tiene n eventos sencillos o elementales, todos igualmente
factibles, posibles o equiprobables entonces las probabilidad del evento A es
igual al número de casos favorables (elementos de A) sobre el numero de casos
posibles (elementos del espacio muestral)
Número de casos favorables # A
P A   
Número de casos posibles #

Ejemplo:
- Al lanzar un dado cual es la probabilidad de obtener un número par.

Ω = S = {1, 2, 3, 4, 5 ,6} #S = 6
A = {2, 4, 6} #A = 3

#A 3 1
P A     ó 0.5
#S 6 2
- En una urna hay 3 bolas negras y 4 bolas rojas. Si se extrae una bola al azar.
¿Cuál es la probabilidad de que esta sea roja?

97
E x c e le n c ia A c a d é m ic a

S= {N, N, N, R, R, R, R}
A= {R}
#A 4
P A    ó 0.57
#S 7

12.1. Axiomas de Probabilidad


a) La probabilidad de cualquier evento es un número no negativo
0  P( A )
b) La probabilidad del espacio muestral es 1
P( S )  1

c) La probabilidad de un evento vacío es igual a cero


P(  )  0

d) Si A y B son dos eventos mutuamente excluyentes; esto es si:


A B  
ESTADISTICA
Entonces:
P ( A  B )  P ( A)  P (B )

12.2. Teoremas de Probabilidad.


a) La probabilidad del complementote un evento es igual a unión menos la
probabilidad de dicho evento.
P ( A')  1  P ( A)

b) Si Ay B E25 (algebra de los elementos) y AB entonces:


P (B )  P ( A)

c) Si Ay B E25 entonces
P ( A  B )  P ( A)  P ( A  B )

d) Si Ay B E25 entonces
P ( A  B )  P ( A)  P (B )  P ( A  B )

98
E x c e le n c ia A c a d é m ic a

Ejemplos:
- Sean A y B, dos eventos que no sean mutuamente excluyentes, tal que:
P ( A )  0 . 20

P ( B )  0 . 30

P ( A  B )  0 . 10

S A B

0.10
0.10 0.20

Hallar:
a) P ( A')

b) P ( A' B ')

c) P ( A' B ')

d) P ( A' B )

e) P ( A  B ')

f) P ( A' B )

Solución:
a)
P ( A')  1  P ( A)

 1  0 . 20

 0 . 80

b)

P ( A' B ')

D e la l e y d e M o r g a n

A ' B '  ( A  B ) '

 P ( A ' B ' )  P ( A  B ) '

P e ro d e :

P ( A  B )'  1  P ( A  B )
 1  0 .4 0

 0 .6 0

99
E x c e le n c ia A c a d é m ic a

C ) P ( A' B ')

P ( A ' B ' )  P ( A ' )  P ( B ' )  P ( A ' B ' )

 0 . 8 0  0 .7 0  0 . 6 0

 0 .9 0

O tr a fo r m a d e o b te n e r :

D e la l e y d e M o r g a n

P ( A '  B ' )  P ( A  B )'

 1  P(A  B)

 1  0 .1 0

 0 .9 0

d) P ( A' B )

P ( A ' B )  P ( A ' B ) s ig n ific a ig u a le s

 P (B  A)  P (B )  P ( A  B ) te o re m a

 0 .3 0  0 . 1 0

 0 .2 0
e) P ( A  B ')

P( A  B')  P(A  B )  P( A)  P(A  B)

 0 . 2 0  0 .1 0

 0 .1 0

e) P ( A' B )

P ( A '  B )  P ( A ' )  P ( B )  P ( A ' B )

 0 .8 0  0 .3 0  0 . 2 0

 0 .9 0

Nº 3.6

Sean A y B cualesquiera, tal que:

P(A  B)  3
4

P ( A')  2
3

P(A  B)  1
4

100
E x c e le n c ia A c a d é m ic a

Hallar:
1. P(B)

2. P ( A  B ')

3. P ( A ' B ' )

4. P ( A' B )

13. PROBABILIDAD DE FRECUENCIA RELATIVA


Cuando nos planteamos ciertas preguntas
¿Cuál es la Probabilidad de vender 2 cocinas en esta semana o de vender una
cocina y una refrigeradora?
¿Cuál es la probabilidad de que Rubén apruebe la asignatura de Estadística?

Para contestar estas dos preguntas no nos sirve la definición clásica, en este
caso necesitamos más información, para lo cual recurrimos a otros tipos de
definiciones, por ejemplo, a la definición por frecuencia relativa, la cual se
define de la siguiente manera:
Sea A2
S

A pertenecer al algebra de elementos.


La frecuencia absoluta ( fi ) es el número de veces que ocurre este evento en
una serie de n repeticiones similares del experimento y denotamos por hi ,
entonces la frecuencia relativa ( fA ) del evento A esta dado por:
fA
hA = = P (A )
h
Luego:
1º 0  hA  1

2º La frecuencia relativa de todo el espacio muestral será:


fS n
hS    1
n n

hA B  h A  hB

Ejemplos:
- Al escoger al azar un trabajador de la tabla ¿ Cuál es laprobalidad de que este
gane de S/. 205 a S/. 233 ?

101
E x c e le n c ia A c a d é m ic a

Tabla de Frecuencia de Salarios de Trabajadores

i Salario fi hi

1 [ 319 – 369 ] 4 0.06


2 [ 369 – 419 ] 6 0.08
3 [ 419 – 469 ] 9 0.13
4 [ 469 – 519 ] 13 0.18
5 [ 519 – 569 ] 15 0.21
6 [ 569 – 619 ] 13 0.18
7 [ 619 – 669 ] 12 0.17
TOTAL 72 1

P ( 4   5 )  P ( 4 )  P ( 5 )

 h4  h5

 0 . 18  0 . 21

 0 . 39  39 %

La probabilidad de encontrar un trabajador que ganes de s/205 a s/233 es del


39%

- El siguiente cuadro contiene la clasificación de 321 obreros de una empresa


respecto a dos características:

1º El numero de años que están trabajando en la empresa.

2º Su respuesta a la pregunta “Desea usted ir a la huelga para obtener un


aumento de salario”.

102
E x c e le n c ia A c a d é m ic a

N ú m e r o d e A ñ o s d e la E m p r e s a

M enos
R e s p u e s ta M ás de T o ta l
de 1 1 a 3 4 a 10
10
año

Si 27 54 137 28 246

No 14 18 34 3 69

N o se 3 2 1 0 6

T o ta l 44 74 172 31 321

A B C D

¿Cuál es la probabilidad de que un trabajador seleccionado al azar:


a) Tenga de 1 a 3 años en la empresa.
b) Haya contestado “si” a la pregunta.
c) Contesto “si” y esta trabajando en la empresa de 1 a 3 años
d) Contesta “si” y pertenece por lo menos 4 años a la empresa.

Solución:
Para facilitar la solución ponemos letras mayúsculas a las filas y columnas.

74
a) P(B)   0 . 2305  23 . 05 %
321

246
b) P (M )   0 . 7663  77 %
321

54
c) P (M  B )   0 . 1682  17 %
321

d)
P  M  C  D   P  M  C    M  D 
 P (M  C )  P (M  D )

137 28
 
321 321
165
  0 . 514  51 . 4 %
321

103
E x c e le n c ia A c a d é m ic a

Nº 3.7

En una encuesta se determino que la probabilidad de que una persona consuma el


producto A es 0.5, que consuma B es 0.37, que consuma el producto C es 0.3, que
consuma A y B es 0.12 que consuma solamente A y C es 0.08, que consuma
solamente B y C es 0.05 y que consuma solamente C es 0.15 ¿Calcular la
probabilidad de que una persona escogida al azar consuma:
a) Solamente consuma el producto B
b) Por lo menos dos de los productos
c) Exactamente dos productos
d) Que consuma A o B pero no C

14. PROBABILIDAD SUBJETIVA


En la vida diaria hay ciertas preguntas que se hacen ciertos especialistas.
Ejemplo:
a) Un medico investigador dirá que al termino de esta década se va a obtener
una vacuna contra el SIDA.
b) Un ingeniero de la NASA dirá que dentro de 20 años estaremos viajando a
Venus.

Este tipo de probabilidad no se puede contestar con la definición clásica ni con la


de frecuencia relativa, porque no dió anteriormente e le enfoque es subjetivo por
que hay una sola oportunidad de ocurrencia de este evento.
La probabilidad subjetiva de la ocurrencia de un evento A es un numero asignado
por un individuo de acuerdo a las evidencias que dispone otra persona con otras
evidencias podría asignar a la ocurrencia del mismo evento A, otra probabilidad
diferente (número diferente al anterior).

15. PROBABILIDAD FRENTE A APUESTAS


Sea A un evento cualquiera. Si las a apuestas a favor de A son de 5 a 3, esto
significa que la probabilidad de A es:
5 a 3 a favor de A
5 5
P (A ) = =
6 + 3 8

Interpretación: de 8 ocurrencias, 5 es a favor de A.

104
E x c e le n c ia A c a d é m ic a

Ejemplo:
En una carrera de caballos, el caballo A tiene la apuesta 3 a 5, mientras que el
caballo B tiene 1 a 4 ¿Cuál es la probabilidad de que cualquiera de estos dos
caballos gane?.
3 3
P ( A)  
35 8
1 1
P (B )  
1 4 5
Pero como son mutuamente excluyentes
P ( A  B )  P ( A)  P (B )

3 1
 
8 5
23
  0 . 575  57 . 5 %
40

Nº 3.8

En una carrera de autos, el auto K tiene las apuestas 5 a 1 en su contra, mientras


que el auto M las tiene 9 a 1 en su contra. ¿Cuál es la probabilidad de que
cualquiera de estos autos gane?

16. PROBABILIDADES DE ESPACIOS FINITOS


Otro método para asignar probabilidades en espacios muestrales finitos.
S  W 1 , W 2 , W 3 ,  W n 

donde =finito
Se asigna a cada una Wi probabilidad Pi, tal que la probabilidad de,
 
n

P Wi   1
 i 1 
la suma de las probabilidades asignados a los elementos y espacio muestral es
la unidad, además cada uno es mutuamente excluyente y relativamente
exhaustivo.

Ejemplo:

En el hipódromo los caballos A, B, C, D compiten en una carrera. A tiene 2 veces


mas probabilidad de ganar que B; B tiene 2 veces mas probabilidad que C y C
tiene 2 veces mas probabilidad que D.

105
E x c e le n c ia A c a d é m ic a

a) Cuales son las probabilidades de ganar de cada uno de los caballos.


b) Cual es la probabilidad de que B o C gane.
ESTADISTICA
S= {gana A, gana B, gana C, gana D}

Este espacio muestral lo reemplazamos por:

S= { W 1 ,W 2 ,W 3 ,W 4 }

a) P (W 1 )  P (W 2 )  P (W 3 )  P (W 4 )  1

Pero
P (W 4 )  x

P (W 3 )  2 x

P (W 2 )  4 x

P (W 1 )  8 x
x  2x  4x  8x  1

15 x  1

1
x 
15

Todos tienen la misma capacidad de ganar, así tenemos:


1
P (W 4 )   0 . 067  7 %
15
P (W 3 )  2 x  2  115   2
15  0 . 13  13 %

P (W 2 )  4 x  4  115   2
15  0 . 27  27 %

P (W 1 )  8 x  8  115   2
15  0 . 53  53 %

b)
P (W 2  W 3 )  P (W 2 )  P (W 3 )

 4  2
15 15
6
  0 . 4  40 %
15

106
E x c e le n c ia A c a d é m ic a

Nº 3.9

En una competencia participan 3 jóvenes 4 señoritas y 2 niños. Si los jóvenes tienen


el doble de habilidad de las señoritas y estas el triple de habilidad de los niños.
¿Cuál es la probabilidad de que:
a) Gane un joven
b) Gane una señorita
c) Gane un niño
d) Gane un niño o una señorita

17. PROBABILIDAD CONDICIONAL


Mide la proposición de veces que ocurre B de entre las que ha ocurrido A.

Sea A un suceso cuya probabilidad es distinta de cero; y sea B cualquier


suceso: se llama probabilidad de B condicionado a A al cociente:

P B  A
 P(A  B)
P ( A)

6.1.- Axiomas

I) Para cualquier suceso E


P E
A
 P (E  A)
 0
P ( A)

Por ser cociente de números no negativos.

II) Sean B y C dos sucesos incompatibles (B C = ). Entonces:

107
E x c e le n c ia A c a d é m ic a

P  B  C   A 

P B  C
A

P ( A)
P  B  A    C  A  

P ( A)

 P B  A
  P C A 
TADISTICA
P   A 
III) 
P 
A
 
P ( A)
1
P ( A) P ( A)

Por ser   A  A

6.2. Probabilidad de la Intersección de dos sucesos.


Consecuencia: P ( A  B )  P  A  P B  A

Ejemplo:
En una encuesta que se hace a 112 personas sobre el color de los ojos se
obtiene la siguiente tabla de resultado.
Asunto Ojos Azules Ojos Negros Total
(A) (N)
Varones (V) 20 30 50
Mujeres (M) 22 40 62
Total 42 70 112

Si la elección se hace sin condiciones, la probabilidad de elegir una persona


con los ojos azules es:
42 3
P ( A)  
112 8

De elegir una persona con los ojos negros será:


70 5
P(N )  
112 8

Sin embargo, si la elección la hacemos solo entre los varones, la


probabilidad de ojos azules y los ojos negros respectivamente son:

108
E x c e le n c ia A c a d é m ic a

20 2 30 3
P ( A)   Y P(N )  
50 5 50 5

Lo anterior se denota que son probabilidades calculadas sobre el conjunto


de los varones, se escribe P que se lee “Probabilidad de A condicionada a
V”; por lo tanto, las condicionadas son:

P A V
 2
5

P N V
 3
5

Considerando lo anterior se dan otras probabilidades condicionadas,


ejemplo:

P A  M
 22

11
62 31


P V
N
  30 
3
70 7

Luego, podemos ver:

P A  V
 2
5
50 25
P (V )  
112 56
20 5
PA  V  
112 28
Entonces:
PA  V 
P A  
V P V 
5
28 5 ( 56 ) 2
  
25 25 ( 28 ) 5
56

P A  V
 2
5

- Se extraen dos cartas de una baraja de 52. Calcular la probabilidad de que


ambas cartas sean reyes.

Solución:
Hacemos A al evento que “la primera carta es un rey” y B al evento que “la
segunda carta es un rey”, nos piden calcular que o sea “ambas cartas son

109
E x c e le n c ia A c a d é m ic a

reyes”.
P ( A  B )  P ( A)  P B  A

4 3
 
52 51
1

221

La probabilidad es de 1
221

Nº 3.10

1. Una urna contiene 10 bolas rojas y 6 negras. Se sacan dos bolas sin posibilidad
de reemplazarlo. ¿Cuál es la probabilidad de que la segunda bola sea negra
si se sabe que la primera ha sido negra?

2. Calcular la probabilidad de obtener cuatro 2 al lanzar cuatro dados.

18. SUCESOS INDEPENDIENTES


Se dice que un suceso B es independiente de otro A cuando
P B  A
 P B 

es decir, el suceso A no influya en B por lo tanto: diremos que A y B son


independientes cuando ocurre que:
P ( A  B )  P ( A)  P (B )

Ejemplo:
Se extraen sucesivamente y con devolución dos bolas de una bolsa que
contiene 4 bolas enumeradas del 1 al 4. Sea A el suceso de “obtener
numero par en la primera extracción” y B el suceso “de extraer la segunda
bola sea impar” ¿Son A y B independientes?

Solución:
Se tiene que verificar que:

110
E x c e le n c ia A c a d é m ic a

P ( A  B )  P ( A)  P (B )

1
P(A) 
2

1
P (B ) 
2

Los casos favorables de A B “par en la primera e impar en la segunda”


es:
A B   2 ,1 ,  2 , 3 ,  4 ,1 ,  4 , 3 

ESTADISTICA
 4  16
2
En total son 4 casos de un total de VR 4,2

4 1
Casos posibles, por tanto P(A  B)  
16 4

Luego
1 1 1 1
P(A  B)      P ( A)  P (B )
4 2 2 4

Los sucesos son independientes.

19. TEOREMA DE BAYES


El teorema de Bayes viene a seguir el proceso inverso al teorema de
probabilidad total.
El teorema de Bayes dice:

A 
P ( Ai )  P B  Ai

P i  
 B 
n
 
 P ( Ai )  P  B
 A

i 
i 1

Donde:
Ai , A2 , , An Son sucesos tales que
, A1  A2    An  E siendo E el espacio muestral
Y donde Ai  A j   si , y V es un suceso del que se conocen las

 
probabilidades condicionales P B  , además de conocerse las
 Ai 

probabilidades . P  A i 

111
E x c e le n c ia A c a d é m ic a

Ejemplo:
El parte meteorológico ha anunciado tres posibilidades para el fin de semana:
a) Que llueva: probabilidad del 50%
b) Que nieva: probabilidad de 30%
c) Si hay niebla: probabilidad de accidente 20%

Según estos posibles estados meteorológicos, la posibilidad de que ocurra un


accidente es la siguiente:
a) si llueve: probabilidad de accidente 10%
b) si nieva: probabilidad de accidente 20%
c) si hay niebla: probabilidad de accidente 5%
Resulta que efectivamente ocurre un accidente y como no estábamos en la
ciudad no sabemos que tiempo hizo. El teorema de Bayes nos permite
calcular estas posibilidades.

1) Las probabilidades que manejamos antes de conocer que ha ocurrido un


accidente se denomina “Probabilidad a priori” (lluvia con el 60%, nieve con
el 30% y niebla con el 10%).

2) Una ves que incorporamos la información de que ha ocurrido un accidente,


las probabilidades del suceso a cambian, son probabilidades condicionadas
P (A/B) que se denominan “Probabilidades a posteriori”.

Solución:
Aplicamos la formula:

a) La probabilidad de que estuviera lloviendo


A  0 . 50  0 . 20
P i  
 B  ( 0 . 50  0 . 20 )  ( 0 . 30  0 . 10 )  ( 0 . 20  0 . 05 )

 0 . 714

La probabilidad de que efectivamente estuviera lloviendo el día del


accidente (probabilidad posteriori) es del 71.4%

112
E x c e le n c ia A c a d é m ic a

b) Probabilidad de que estuviera nevando

A  0 . 30  0 . 10
P i  
 B  ( 0 . 50  0 . 20 )  ( 0 . 30  0 . 10 )  ( 0 . 20  0 . 05 )

 0 . 214

La probabilidad de que estuviera nevando es 21.4%

c) Probabilidad de que hubiera niebla

A  0 . 20  0 . 05
P i  
 B  ( 0 . 50  0 . 20 )  ( 0 . 30  0 . 10 )  ( 0 . 20  0 . 05 )

 0 . 071

ESTADISTICA
La probabilidad de que hubiera niebla es del 7.1%

Nº 3.11

Un laboratorio somete a los choferes que cometen accidentes de tránsito a un


test de “dopaje etílico”. Se ha determinado que:

- Cuando el chofer está ebrio, el test proporciona resultado positivo en el 95%


de los casos.
- Cuando el chofer no está ebrio, el test proporciona resultado negativo en el
94% de los casos.
- El 2% de los conductores que cometen accidentes manejan ebrios.
¿Cuál es la probabilidad de que el chofer esté ebrio dado que el resultado
fue positivo?

113
E x c e le n c ia A c a d é m ic a

AVILA A., Roberto. Estadística Elemental. Editorial R.A. Lima, 1998.

CALZADA B., José. Estadística General. Editorial Jurídica S.A., Lima, 1966.

GALDOS, L. Dominando las Matemáticas: Calculo y Estadística II y III, tomo 15 y 16,


Edición El Popular, Lima-Perú, 2005.

LIPSCHUTZ, S. Probabilidad. Editorial McGraw Hill. Colección Serie Schaum.


Colombia. 1970

MOYA, Rufino y SARAVIA, G. Probabilidad e Inferencia Estadística. Editorial San


Marcos. 2ª edición, Lima.

TRIOLA, Mario. Estadística Elemental. Editorial Addison Wesley Longman. 7ª


Edición, México 2000.

VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias Graficas S.A.
2ª Edición. Lima 1993.

En el siguiente fascículo, estudiaremos las mas importantes Distribuciones de


Probabilidad, tanto de variables discreta como de variables continuas.
ESTADISTICA

114
E x c e le n c ia A c a d é m ic a

A
u
A
ut
o
t
oe
ev
a
v
al
u
l
uaa
c
ci
ó
i
ónn
f
fo
r
o
rm
ma
t
a
ti
v
i
va
a
Nº 03

1. El testigo de un atropello recuerda que la placa del auto tiene 6 dígitos


diferentes y solamente ha memorizado los tres primeros que son: 3, 4, 7,… ¿
Cuántos números de placas diferentes tendrá que investigar la policía?

2. Siete varones y cinco mujeres van a formar comités de 6 personas. ¿De


cuantas maneras pueden formarse si:
a) En el comité hay tres mujeres?
b) Cuándo cómo mínimo 3 mujeres?

3. En un examen de Estadística, un estudiante debe responder 6 preguntas de


10 dadas. ¿De cuántas maneras diferentes debe escoger si debe responder
por lo menos 2 de las 5 primeras preguntas?

4. Un club de voley cuenta con 12 jugadoras. ¿De cuantas maneras diferentes


puede formar un equipo el entrenador, sabiendo que siempre tiene que estar
Rosa que es la preparadora?

5. En una reunión hay tres jóvenes y tres señoritas.


a) ¿De cuantas maneras diferentes pueden sentarse en una banca, tanto los
jóvenes como las señoritas si deben estar juntos?
b) ¿De cuantas maneras diferentes pueden sentarse si solamente las
señoritas deben estar juntas?
c) ¿de cuantas maneras diferentes pueden sentarse en una banca si los
jóvenes ocupan los lugares pares?

6. Una joven tiene 6 amigas, de las cuales invitara para sus cumpleaños
solamente a tres
a) ¿De cuantas maneras debe hacer la invitación si dos de sus amigas están
enemistadas y no pueden asistir juntas?
b) ¿de cuantas maneras debe hacer la invitación, si dos de ellas solamente
pueden asistir juntas?

7. Tres señoritas Maria, Magna y Maritza, compiten en un curso de belleza. Los


premios solamente son otorgados a olas que ocupen el primer y segundo
lugar.

115
E x c e le n c ia A c a d é m ic a

a) Liste los elementos del espacio muestral correspondiente al experimento al


“Elegir las dos ganadoras”
b) Liste el Evento o suceso “Magna y Maria ganan los premios”.

8. 10 libros son colocados aleatoriamente en un estante. Determinar la


probabilidad que 4 libros determinados sean colocados juntos.

9. En una carrera de caballos, el caballo que tiene la apuesta 7 a 2 , en su


contra, mientras que el cabalo R 8 a 5, en su contra¿ Cual es la probabilidad
que cualquiera de esto gane?

10. Una clase consta de 10 varones y 20 mujeres de los cuales, la mitad de los
varones y la mitad de las mujeres viven en Huancayo. Hallar la probabilidad
que una persona escogida al azar sea un varón o sea de Huancayo.

11. Sean los eventos A y B


P ( A)  1
2

P(A  B)  5
8

Hallar:
a) P ( A '  B ')

b) P ( A'  B ) x

12. Una compañía comercial tiene 130 sucursales localizados en las tres regiones
naturales del país, se dedican a la venta de diversos artículos, tales como
aparece en el cuadro.
Se selecciona al azar una sucursal para colocar en el mercado un nuevo
producto que puede ser vendido por cualquiera de las sucursales.
Hallar la probabilidad que las sucursales seleccionadas no esten localizada en
la selva o vendan repuestos

116
E x c e le n c ia A c a d é m ic a

Unidad Temática IV

DISTRIBUCIÓN DE PROBALIDAD

Al finalizar el estudio del presente fascículo el estudiante

- Define lo que son variables aleatorias y conoce sus clases.


- Define lo que es la Distribución de Probabilidad y conoce sus clases.
- Calcula e interpreta las Distribuciones de Probabilidad Discreta como: La
binomial, la de Poisson, la Geométrica, la Hipergeométrica, y la Multinomial.
- Calcula e interpreta las distribuciones de probabilidad continua como: La
normal “Z” y la de Student “t”.
- Calcula y conoce los parámetros de la Distribución de Probabilidad.

1. - VARIABLES ALEATORIAS
Una variable aleatoria es una variable que tiene un solo valor numérico,
determinado por el azar, para cada resultado de un experimento. Es
representada por lo general por la x.

Ejemplos:
x = El número de señoritas entre 30 empleados controlados.
x = El peso en kg de un niño escogido al azar.
x = El número de accidentes de motocicletas de entre 20 accidentes de
carretera, seleccionadas al azar.

2.- CLASES DE VARIABLES ALEATORIAS

a) Variable Aleatoria Discreta


Es aquella que tiene un número finito de valor o un número de valores
susceptibles de contarse.

117
E x c e le n c ia A c a d é m ic a

Ejemplo:
- El número de personas que entran al estadio a ver un partido de fútbol, es
un número entero y se obtiene por conteo.

b) Variable Aleatoria Continua


Es aquella que tiene un número infinito de valores y se obtiene por
mediciones en una escala continua.

Ejemplo:
- La medida de tallas de un grupo de estudiantes de la UPLA. La talla se
obtiene por medición y cuyos valores son enteros y decimales o números
quebrados.

3.- DISTRIBUCION DE PROBABILIDAD


Colección de valores de una variable aleatoria junto con sus correspondientes
probabilidades. O sea, da la probabilidad para cada valor de la variable aleatoria.

A.- REQUISITOS DE UNA DISTRIBUCION DE PROBABILIDAD


a) La suma de las probabilidades individuales debe ser igual a 1 y se basa en
la regla de la suma para sucesos mutuamente excluyentes.
 P( x )  1 Donde x asume todos los valores posibles

b) Para cualquier suceso implica que la probabilidad individual debe estar


entre 0 y 1 para cualquier valor de la variable aleatoria.

0  P( x )  1 Para todos los valores de x

Ejemplo:
- Determina si P( x )  x es una distribución de probabilidad: donde x puede
3

ser 0, 1 o 2

Solución:
Para la función vemos que:
P( 0 )  0
3

P( 1 )  1
3

P( 2 )  2
3

118
E x c e le n c ia A c a d é m ic a

Si se trata de una distribución de probabilidad debe cumplir con los requisitos:

0 1 2 3
a)  P( x )     1
3 3 3 3

b) Cada uno de los valores de esta entre 0 y 1

Respuesta
Cumple con los requisitos, por lo tanto es una distribución de probabilidad.

B. CLASES DE DISTRIBUCIONES DE PROBABILIDAD

a) Distribuciones de Probabilidad Discreta Importantes


- Distribución Binomial
- Distribución de Poisson
- Distribución Geométrica
- Distribución Hipergeometrica
- Distribución Multinomial

b) Distribuciones de Probabilidad Continua Importantes


- Distribución Normal o Gauss “z”
- Distribución de student “t”
- Distribución chi cuadrado “”
- Distribución “F”

4.- DISTRIBUCION BINOMIAL


Es el conjunto de todos los valores posibles de una variable discreta y las
probabilidades que le son asociadas.

La Distribución Binomial se usa para encontrar la probabilidad de x números de


ocurrencias de un suceso, en n ensayos del mismo experimento cuando:

1º Solamente hay dos resultados posibles y mutuamente excluyentes: éxito y


fracaso ó acierto y no acierto.
2º Los n ensayos son independientes.
3º La probabilidad de ocurrencia permanece constante en cada ensayo.

119
E x c e le n c ia A c a d é m ic a

ænö
P(x)  çç ÷÷ p xqn-x
è xø
n!
P( x)  p xqn- x
x!(n - x)!
n = número de experimento o ensayo
q = probabilidad de acierto o éxito
p = probabilidad de no acierto o fracaso
x = suceso que se busca

p  q 1

Toda Distribución Binomial tiene:

- Media o Esperanza Matemática o Valor Esperado


  x  E (x)   x P( x )  np

- Varianza
  x  E (x)   x P( x )  np

- Desviación estándar
 (x)
 V(x)  npq

Ejemplo:
- Un matrimonio planifica el nacimiento de 4 hijos. Hallar la probabilidad que:

a) haya un varón
b) 3 sean varones
c) ningún varón
d) a lo mas 2 varones
e) sean 2 o 3 varones
f) hallar la media y la desviación estandar

Solución
n=4 hijos
p=1/2 = 0.5
q=1 p = 1 0.5 = 0.5

120
E x c e le n c ia A c a d é m ic a

n! n-x
P( x  1 var on ) 
x
a) p q
x ! ( n - x )!

4! 4 -1

1
( 0 .5 ) ( 0 .5 )
1! ( 4 - 1 )!

4  3 2 1

1 3
( 0 .5 ) ( 0 .5 )
1 3  2 1
 4 ( 0 . 5 )( 0 . 25 )  0 . 25

La probabilidad de que haya un varón es del 25%

4! 4-3

3
b) P( x  3 var ones )
( 0 .5 ) ( 0 .5 )
3! ( 4 - 3 )!

4  3 2 1

3 1
( 0 .5 ) ( 0 .5 )
3  2 11
 4 ( 0 . 125 )( 0 . 5 )

 0 . 25

La probabilidad de que ninguno sea varón es del 25%.

4! 4-0

0
c) P( x  0 var ones )
( 0 .5 ) ( 0 .5 )
0 ! ( 4 - 0 )!

4  3 2 1

1 4
( 0 .5 ) ( 0 .5 )
1 4  3  2 1
 1 (1 )( 0 . 0625 )

 0 . 0625

La probabilidad de que ninguno sea varón es del 6.25%.

2
n!

n-x

x
d) P( x  0 ,1 , 2 var ones )
p q
x0 x ! ( n - x )!

4! 4-0 4! 4 -1 4! 4-2
  
0 1 2
( 0 .5 ) ( 0 .5 ) ( 0 .5 ) ( 0 .5 ) ( 0 .5 ) ( 0 .5 )
0 ! ( 4 - 0 )! 1! ( 4 - 1 )! 2 ! ( 4 - 2 )!

4  3 2 1 4  3 2 1 4 3 21
 ( 0 .5 ) ( 0 .5 )  ( 0 .5 ) ( 0 .5 ) 
0 4 1 3 2 2
( 0 .5 ) ( 0 .5 )
1 4  3  2 1 1 3  2 1 2 1 2 1
 1 (1 )( 0 . 0625 )  4 ( 0 . 5 )( 0 . 125 )  6 ( 0 . 25 )( 0 . 25 )

 0 . 0625  0 . 25  0 . 375

 0 . 6875
La probabilidad que a lo más sean 2 varones es del 68.75%

121
E x c e le n c ia A c a d é m ic a

4! 4-2 4! 4-3
 
2 3
e) P( x  2 , 3 var ones )
( 0 .5 ) ( 0 .5 ) ( 0 .5 ) ( 0 .5 )
2 ! ( 4 - 2 )! 3! ( 4 - 3 )!

4  3 2 1 4  3 2 1
 ( 0 .5 ) ( 0 .5 ) 
2 2 3 1
( 0 .5 ) ( 0 .5 )
2 1 2 1 3  2 11
 6 ( 0 . 25 )( 0 . 25 )  4 ( 0 . 125 )( 0 . 5 )

 0 . 375  0 . 25

 0 . 625

La probabilidad que a lo mas seas 2 ó 3 varones es del 62.5%

f) La media o valor esperado


  np
  4 ( 0 .5 )
  2

La desviación estándar
 (x)
 npq

 (x)
 4 ( 0 . 5 )( 0 . 5 )  1

 (x)
1

Nº 4.1

A. Se ha calculado que el 9% de la producción de una planta de lapiceros es


defectuosa.

a) Calcular la probabilidad de obtener 3 lapiceros defectuosos en una muestra


de 8 lapiceros.
b) Hallar la media y la desviación estándar.

B. El 20% de fluorescentes en cierto lote es defectuosa.

a) ¿Cuál es la probabilidad de encontrar 2 fluorescentes defectuosos por


docena?
b) Hallar el valor esperado y la varianza.

122
E x c e le n c ia A c a d é m ic a

5.- DISTRIBUCION DE POISSON


Es una distribución de probabilidad discreta que se aplica a ocurrencias de algún
suceso dentro de un intervalo especificado. La variable aleatoria es el número
de ocurrencias del suceso en el intervalo. El intervalo puede ser tiempo,
distancia, área, volumen o alguna unidad similar.
La distribución de Poisson es una distribución binomial cuyo suceso es raro, o
sea:
n tiende al
p tiende a 0
q tiende a 1
np 5

La formula es:
-
 e
x

P( x ) 
x!
  np

e=2.71828…
X= es el suceso que se busca.

La distribución de Poisson tiene los siguientes parámetros:

- Media o Esperanza Matemática


  E (x)  

- Varianza
  V(x)  
2
(x)

- Desviación estándar
 (x)
 

Ejemplo:
- Si el 3% de las lámparas producidas por una fabrica son defectuosas. Hallar la
probabilidad de que de una muestra de 60 lámparas sean exactamente:
a) ninguna defectuosa
b) sean 2 defectuosas
c) menos de 3 defectuosas

123
E x c e le n c ia A c a d é m ic a

Solución:
n= 60 lámparas
p= 0.03 = 3%
q= 0.97 = 97%
p+q=1

a) = np = 60 x 0,03 = 1,8

0 -1.8
xe- 1.8 e 1(0.1653)
P( x0 defectuosa )   
x! 0! 1
 0.1653

La probabilidad de que ninguna lámpara sea defectuosa es del 16.53%

2 - 1 .8
1 .8 e 3 . 24 ( 0 . 1653 )
b) P( x  2 defectuosa s)
 
0! 2 1
0 . 5356

2
 0 . 2678

La probabilidad de que 2 lámparas sean defectuosas es del 26.78%

-
 e
2 x

c) P( x  3 defectuosa s)
  x!
x0

2 x - 1 .8
1 .8 e
  x!
x0

0 - 1 .8 1 - 1 .8 2 - 1 .8
1 .8 e 1 .8 e 1 .8 e
  
0! 1! 2!
1 ( 0 . 1653 ) 1 . 8 ( 0 . 1653 ) 3 . 24 ( 0 . 1653 )
  
1 1 2 1
 0 . 1653  0 . 29754  0 . 2678

 0 . 73064

La probabilidad de que menos de 3 lámparas sean defectuosas es del


73.064%.

124
E x c e le n c ia A c a d é m ic a

Nº 4.2

A. Si tenemos = 4.2 en una distribución de Poisson encuentre:


a) P ( X  2 )
b) P ( X  5)

c) P ( X  8)

B. Un proceso de fabricación produce 10 artículos defectuosos por hora.


Encuentre la probabilidad de que 4 artículos defectuosos o menos provengan
de la producción de una hora dada escogida al azar usando la distribución de
Poisson.

6. DISTRIBUCION GEOMETRICA
La distribución geométrica esta relacionada con un proceso e Bernoulli, excepto
que el número de ensayos no es fijo (hasta obtener el éxito).

La distribución Geométrica tiene los siguientes parámetros:

- Media o Valor esperado


x -1
P( x )  pq

- Varianza
1
  E (x) 
p

q
  V(x) 
2
- Desviación Estándar (x) 2
p

q
Ejemplo:  (x)

p

125
E x c e le n c ia A c a d é m ic a

1. La probabilidad de éxito al lanzar un cohete es 0.8 suponga que el ensayo del


lanzamiento ha ocurrido.

¿Cuál es la probabilidad que exactamente sean necesarios 6 ensayos?


p = 0,8
q = 0,2
x=6
x -1
P( x  6 )  pq
6 -1
 ( 0 . 8 )( 0 . 2 )

 ( 0 . 8 )( 0 . 2 )
5

 0 . 000256

La probabilidad de que sean 6 ensayos es 0.03%

2. Los 2/3 de los niños de un colegio están ausentes por causa de una epidemia. En
una clase de 25 estudiantes, el profesor pasa lista.

a) Cual es la probabilidad que el décimo niño llamado sea el primero que


responda presente.

b) Calcular

c) Determine E (x) y desviación estándar 


P (x  2) , P (x  2)

1
p 
3
a) Solución:
2
q 
3

10 - 1 9
æ 1 öæ 2 ö 2
P( x  10 )  ç ÷ç ÷  10
 0 . 0087
è 3 øè 3 ø 3

La probabilidad de que el décimo niño sea el primero que responda


presente es de 0.87%

126
E x c e le n c ia A c a d é m ic a

1-1 2 -1
1æ 2ö 1æ 2ö 1 æ 1 öæ 2 ö 5
b) P( x  2 )  P( x  1 )  P ( x  2 )  ç ÷  ç ÷   ç ÷ç ÷   0 . 556
3è 3ø 3è 3ø 3 è 3 øè 3 ø 9

La probabilidad de que sea x ≤ 2 es del 55.6%


1-1
1æ2ö 2
P ( x  2 )  1 - P ( x  2 )  1 - P( x  1 )  1 - ç ÷   0 . 667
3è3ø 3

La probabilidad de que sea x ≥ 2 es del 66.7%

1
c) E (x)   
p

1
E (x)   3
1
3

La media es de 3 niños
q
 
2
2
p

2
3
   6
2

 3
2
1

  6  2 . 45

La desviación Estándar es de 2 niños.

Nº 4.3

Se dispone de un aparato que fabrica objetos de plásticos. Este aparato se utiliza


hasta que aparece el primer objeto defectuoso. Se sabe que la probabilidad que el
objeto sea no defectuoso es, la probabilidad que el objeto sea defectuoso es.
Determinar la distribución de probabilidad.

127
E x c e le n c ia A c a d é m ic a

7.- DISTRIBUCION HIPERGEOMETRICA


Cuando una población finita con N elementos dividido en dos clases. Una con M
elementos (M<N) y la otra con N-M elementos. Llamaremos éxito a la primera
clase y fracaso a la segunda.

æ M öæ N - M ö
ç ÷ç ÷
ç ÷ç ÷
è x øè n - x ø
P( x )  h ( x , N , n , M )  X=0, 1, 2, … min (n, M)
æN ö
ç ÷
ç ÷
è n ø

n= tamaño de la muestra sin reemplazamiento


N= población finita
x= lo que se busca

La distribución Hipergeométrica tiene los siguientes parámetros:


- Media o Esperanza matemática o Valor esperado
æ M ö
E (x)  nç ÷
è N ø

- Varianza
æ M öæ M öæ N - n ö
V(x)  nç ÷ç1 - ÷ç ÷
è N øè N øè N - 1 ø

- Desviación Estándar
  V(x)

Ejemplo:
En una urna contiene 5 bolas blancas y 6 rojas. Se extraen 4 bolas de la urna
sin reposición.
a) Hallar la distribución de probabilidad del número de bolas rojas extraídas.
b) Cual es la probabilidad de extraer exactamente 3 bolas rojas.
c) Cual es el número esperado de bolas rojas extraídas.

Solución:
N=6+5=11
M=6
n=4

128
E x c e le n c ia A c a d é m ic a

a)
æ 6 öæ 5 ö
ç ÷ç ÷
ç ÷ç ÷
è x øè 4 - x ø
P( x )  h ( x ;11 , 4 , 6 ) 
æ 11 ö
ç ÷
ç ÷
è 4 ø

æ 6! öæ 5! ö
çç ÷÷ çç ÷÷
è x ! ( 6 - x )! ø è ( 4 - x )! [ 5 - ( 4 - x )]! ø
 x 1  0 ,1 , 2 , 3 , 4
11 !
4 ! (11 - 4 )!

b)
æ 6 öæ 5 ö æ 6! öæ 5! ö
ç ÷ç ÷ çç ÷÷ çç ÷÷
ç ÷ç ÷
è 3 øè 1 ø è 3! ( 6 - 3 )! ø è 1! ( 5 - 1 )! ø
P( x  3 )  
æ 11 ö 11 !
ç ÷
ç ÷ 4 ! (11 - 4 )!
è 4 ø

æ 6  5  4  3  2  1 öæ 5  4  3  2  1 ö
çç ÷÷ çç ÷÷
è 3  2  1 3  2  1  ø è 1 4  3  2  1  ø ( 20 )( 5 ) 100
    0 . 303
11  10  9  8  7  6  5  4  3  2  1 330 330
4  3  2  17  6  5  4  3  2  1 

La probabilidad de extraer 3 bolas rojas es de 30.3%

æ 6 ö 24
c)   4ç ÷   2 . 18
è 11 ø 11

El número esperado de bolas rojas extraídas es 2

Nº 4.4

En cierta clínica has 20 enfermos de los cuales se sabe que el 30% tienen cáncer,
se extrae aleatoriamente 4 pacientes para el despistaje de cáncer.
a) Cual es la probabilidad que al menos uno tenga cáncer.
b) Cual es el número esperado de pacientes con cáncer.

129
E x c e le n c ia A c a d é m ic a

8.- DISTRIBUCION MULTINOMIAL


La distribución multinomial es similar a la distribución binomial, con la diferencia
de que en lugar de dos posibles resultados en cada ensayo, puede haber
múltiples resultados. Siendo:
n! x x xk
P ( x 1 , x 2 , x 3 ... x k )  P1 1 P2 2 ... Pk
x 1 ! x 2 !... x k !
k

Donde:  xi  n
i 1

La distribución multinomial tiene los siguientes parámetros:

- Media o Esperanza matemática o valor esperado


E ( x i )  npi

- Varianza
V(x )
 npi (1 - p i ) , i  1, 2 ,... k
i

- Desviación Estándar
 xi
 V(x )
i

Ejemplo:
Las posibilidades que una declaración de impuestos sea llenada correctamente
es 0.60, que contenga un error que favorezca al declarante 0.20, que lleve un
error que favorezca al fisco 0.10 y que contenga ambos tipos de errores 0.10. Se
escoge al azar 10 de tales declaraciones de impuestos para una auditoria.

¿Cuál es la probabilidad que 5 estén correctos, 3 tengan error que favorezcan al


declarante, una lleve un error que favorezca al fisco y una contenga ambos tipos
de errores?

1º Definir los siguientes eventos


E1  Una declaración de impuestos llevada correctamente
E1  Una declaración de impuestos en error que favorezca al declarante

E1  Una declaración de impuestos en error que favorezca al fisco


E1  Una declaración de impuesto que contengan ambos tipos de error

130
E x c e le n c ia A c a d é m ic a

2º P1  0 . 60 P2  0 . 20 P3  0 . 10 P4  0 . 10

Pi  ( i  1, 2 , 3 , 4 )

X 1
 5 X 2
 3 X 3
1 X 4
1

n! x x xk
P ( x 1 , x 2 , x 3 ... x k )  P1 1 P2 2 ... Pk
x 1 ! x 2 !... x k !

10 !
P( 5 , 3 , 1 , 1 )  ( 0 . 60 ) ( 0 . 2 ) ( 0 . 1 )( 0 . 1 )  0 . 032
5 3

5! 3! 1! 1!

La probabilidad de que ocurran todos los eventos es de 3.2%

Nº 4.5

En cada población grande el 70$ de las personas son derechos; el 20% izquierdos y
10% ambidiestros. Se escogen 10 personas aleatoriamente de la población ¿Cual es
la posibilidad?

a) Todos sean derechos


b) 7 sean derecho, 2 zurdos, 1 ambidiestro

9. DISTRIBUCION NORMAL “Z”


La Distribución Normal es una distribución de probabilidad continua y es la más
común que se usa en el análisis estadístico.
La curva Normal tiene forma de campana y es simétrica con respecto a su media,
pero la mayor parte del área (probabilidad) está concentrada alrededor de la
media.

131
E x c e le n c ia A c a d é m ic a

90

80

70

60

50

40

30

20

10
x escala Curva Normal
0
0 2 4 6 8 10 12 14 16 18 20
Z escala Curva Normal
-3 -2 -1 0 1 2 3 Estandar
68.26%
95.54
99.74

La Distribución Normal Estándar es una distribución con una media de 0 (M=O) y


una desviación estándar de 1 (   1 ).

Cualquiera distribución normal (escala de x) se puede convertir a una


distribución normal estándar estableciendo que M=O y expresando las
desviaciones de M en unidades de desviación estándar (Escala de Z), también
llamada variable estandarizada.

Para encontrar probabilidades (áreas) para problemas de distribución normal,


primero se convierte el valor de x a su correspondiente valor en Z (variable
estandarizada); a través de

Luego se localiza al valor de Z en la tabla de área para la distribución normal


estándar.
x- 
Z 

Ejemplo:
En un examen de Estadística la media fue de 14 y la desviación estándar de 1.6.
Determinar las variables estandarizadas (Zi) para valores de x: 12, 17, 20, 13, 16

  14
  1 .6
x i  12 , 17 , 20 , 13 , 16

Zi  ?

132
E x c e le n c ia A c a d é m ic a

x-
Z

12 -14 - 2
Z1    -1.25
1.6 1.6

17 -14 3
Z2    1.875
1.6 1.6

20 -14 6
Z3    3.75
1.6 1.6

13 -14 -1
Z4    -0.625
1.6 1.6

16 -14 2
Z5    1.25
1.6 1.6

 USO DE LA TABLA DE LA DISTRIBUCIÓN NORMAL ESTÁNDAR (Z)


La tabla de distribución normal Z solamente tabula el 50% de la Campana de
Gauss y por su parte interna.

El área bajo la distribución normal estándar de probabilidad, entre la media y


el valor sucesivo de Z, está determinada por la intersección de los valores de
la variable estandarizada, de la primera columna y primera fila de la tabla de
la distribución normal.

Ejemplo
Si Z es 1.36, en la primera columna de Z se buscaría en 1.3 y con la primera
fila en 0.06, cuya intersección daría 0.4131 de área. Cuya probabilidad
representa el 41.31%

133
E x c e le n c ia A c a d é m ic a

Ejemplo de la distribución Normal “Z”


Si la talla de 300 estudiantes se distribuye normalmente y   68 pulgadas   3 y
pulgadas, hallar la probabilidad para los estudiantes:

a) Entre 64 y 72 pulgadas
b) Mayor de 72 pulgadas
c) Menor o igual a 64 pulgadas
d) Cuántos estudiantes tienen tallas mayores a 72 pulgadas

Solución
  68 pulgadas
  3 pulgadas
n  300 estudiantes

a) P ( 64  x  72 ) = P (Z1  Z  Z2)

134
E x c e le n c ia A c a d é m ic a

3º Hallamos las variables estandarizadas


x1 -  64 - 68
Z1    -1.33
 3
x2 -  72 - 68
Z2    1.33
 3

4º Hallamos las áreas a través de la tabla de la normal


-1.33 = 0.4082
1.33 = 0.4082

P (-1.33  Z  1.33)  0.4082  0.4082  0.8164

La probabilidad es del 81.64%

b)
P(x  72) PZ  Z1 

3º Hallamos la variable estadarizada


x2 -  72 - 68
Z1    1 . 33
 3

4º Hallamos el área a través de la tabla de la normal


1.33 = 0.4082
P ( Z  1 . 33 )  0 . 5000 - 0 . 4082  0 . 0918

La probabilidad de que las tallas sean mayores a 72 pulgadas es del 9.18%


135
E x c e le n c ia A c a d é m ic a

La tabla Z, al tabular solamente el 50% de la Campana de Gauss, para éste caso se


le resta el área interna de que es de 0.4082.
C) P ( x  64 ) Reducir Tamaño

3º Hallamos la variable estadarizada


x2 -  64 - 68
Z1    - 1 . 33
 3

4º Hallamos el área a través de la tabla de la normal


1.33 = 0.4082
P ( Z  - 1 . 33 )  0 . 5000 - 0 . 4082  0 . 0918

La probabilidad de que las tallas sean menores o igual a 64 pulgadas es del


9.18%
d) K  n(P( x ) )
K  300 P( x )

P( x)  P(x  72)  P(Z  Z1 )  P(Z  1.33)  0.5000 - 0.4082  0.0918


\K  300  0.0918  27.54 @ 28
El numero de estudiantes que tienen talla mayor a 72 pulgadas son 28.

136
E x c e le n c ia A c a d é m ic a

Nº 4.6

A. Hallar el área bajo la curva normal.


a) A la izquierda de Z = -1.78
b) A la izquierda de Z = 0.56
c) A la derecha de Z =-1.45
d) Correspondiente a Z ≥ 2.16
e) Correspondiente a -0.80 ≤ Z ≤ 1.53
f) A la izquierda de Z = -2.52 y a la derecha de Z = 1.83

B. Hallar el valor de Z tal que:


a) El área a la derecha de Z sea 0.2266
b) El área a la izquierda de Z sea 0.0314
c) El área entre -0.23 y Z sea 0.5722
d) El área entre 1.15 y Z sea 0.0730
e) El área entre Z y Z sea 0.9000

1. DISTRIBUCION DE STUDENT “t”


Se utiliza la distribución “t” en la estimación.
- Cuando el tamaño de la muestra es 30 o menos
- Se desconoce la desviación estándar de la población
- Se supone que la población es normal o aproximadamente normal

140
120 Normal
100
80 n=15

x -
60
40 n=2 t
20 S
0
n
0 5 10 15 20

 Grado de Libertad
Numero de valores de una muestra que podemos especificar libremente, una
vez que sepamos algo de ella.
gl  n - 1

137
E x c e le n c ia A c a d é m ic a

 Uso de la Tabla de distribución “t”


Para calcular el valor t correspondiente a un área de un determinado nivel de
significación, se busca en la columna de grados de libertad y en la fila de los
niveles de significación, cuya intersección determina el valor de “t”
Ejemplo:

Halle el valor de t para 29 grados de libertad, para las siguientes áreas que
caen dentro de la cola derecha de la distribución t
a) 10%
b) 5%
c) 2.5%

Respuesta
Con estos datos buscar en la tabla “t”
a) t = 1.311
b) t = 1.699
c) t = 2.045

AVILA., Roberto. Estadística Elemental. Editorial R.A. Lima, 1998.

CALZADA B., José. Estadística General. Editorial Jurídica S.A., Lima, 1966.

GALDOS, L. Dominando las Matemáticas: Calculo y Estadística II y III, tomo 15 y 16,


Edición El Popular, Lima-Perú, 2005.

JONSON, Robert. Estadística Elemental, Editorial Trillas. 2ª edición. México. 1991.

LEVIN, Richard. Estadística para Administradores, Editorial, Prentice Hall. 2ª edición.


Mexico 1988.

LIPSCHUTZ, S. Probabilidad. Editorial McGraw Hill. Colección Serie Schaum.

MOOD, Alexander M. Introducción a la Teoría Estadística. Editorial Aguilar. Madrid


1972.

138
E x c e le n c ia A c a d é m ic a

MOYA, Rufino y SARAVIA, G. Probabilidad e Inferencia Estadística. Editorial San


Marcos. 2ª edición, Lima.

TRIOLA, Mario. Estadística Elemental. Editorial Addison Wesley Longman. 7ª


Edición, México 2000.

VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias Graficas S.A.
2ª Edición. Lima 1993.

MOOD, Alexander M. Introducción a la Teoría Estadística. Editorial Aguilar. Madrid


1972.

MOYA, Rufino y SARAVIA, G. Probabilidad e Inferencia Estadística. Editorial San


Marcos. 2ª edición, Lima.

TRIOLA, Mario. Estadística Elemental. Editorial Addison Wesley Longman. 7ª


Edición, México 2000.

VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias Graficas S.A.
2ª Edición. Lima 1993.

En el siguiente Fascículo estudiaremos la teoría del muestreo, La inferencia


estadística a través de la estimación y la prueba de hipótesis. Así como la prueba de
Chi cuadrado y el análisis de varianza.

A
u
A
ut
o
t
oe
ev
a
v
al
u
l
uaa
c
ci
ó
i
ónn
f
fo
r
o
rm
ma
t
a
ti
v
i
va
a
Nº 04

1. Si el 20% de los estudiantes que entran a estudios superiores se retiran antes de


recibir sus diplomas, encuentre la probabilidad de que de 20 estudiantes elegidos
al azar entre un gran número de estudiantes que ingresan a estudios superiores,
menos de 3 se retiren.

139
E x c e le n c ia A c a d é m ic a

2. La experiencia histórica muestra que 0.003 de la fuerza laboral nacional se


enferma gravemente durante un año. Si 1000 personas son seleccionadas al azar
de la fuerza laboral nacional:

a) Cuál es el número esperado de trabajadores que se enferman durante un año.


b) Cuál es la probabilidad de que 5 trabajadores se enfermen durante un año.

3. Suponga que las lecturas de los termómetros tiene una distribución normal con
media de 0º y desviación estándar de 100º. Se selecciona al azar un termómetro y
se prueba.

a) haga un dibujo y encuentre la probabilidad de cada lectura en grados de entre


- 2.22 y 1.11
b) Encuentre la probabilidad indicada donde Z es la lectura en grados

4. En una población grande, el 25 % de las personas tienen ojos azules. Escogemos


aleatóriamente voluntarios de esta población, una cada vez, hasta escoger un
voluntario con ojos azules.

a) Cual es la probabilidad que la quinta persona es la primera que tiene ojos


azules.
b) Cual es el número esperado de personas escogidas.

5. Se extraen al azar 13 cartas sin reemplazo de una baraja de 52 cartas.

a) Cual es la función de probabilidad para el número de cartas rojas en la


muestra.
b) cual es la media y la varianza del número de naipes negras.
6. Halle el valor de t para n=16 para las siguientes áreas:
a) que caen dentro la cola derecha de la dist. t al 0.05%
b) que caen dentro la cola izquierda de la dist. t a 2.5%
c) que caen dentro la cola izquierda de la dist. t al 10%

140
E x c e le n c ia A c a d é m ic a

Unidad Temática V

ESTADÍSTICA INFERENCIAL: MUESTREO, DISTRIBUCIÓN


DE MUESTREO, PRUEBA DE HIPÓTESIS, PRUEBA DE
CHICUADRADO Y ANÁLISIS DE VARIANZA

- Conoce el concepto del muestreo, selección, ventajas y limitaciones.


- Conoce las etapas de la encuesta por muestreo y tipos de muestreo.
- Conoce las diferencias entre población y muestras.
- Calcula el tamaño de una muestra.
- Conoce lo que es inferencia Estadística y Estimación.
- Conoce y calcula el error estándar de la media y de la proporción.
- Conoce y aplica el teorema del Limite central.
- Conoce, calcula y estima usando las distribuciones Normal y Student.
- Aplica y calcula Prueba de Hipótesis sobre la media de la población y la
proporción.
- Aplica y calcula Prueba de Hipótesis para las diferencias de medias y
proporciones.
- Conoce, aplica y calcula la distribución Chi Cuadrado.
- Aplica, conoce y calcula el análisis de Varianza con uno y dos factores.

1. MUESTREO
Tiene por objeto seleccionar de tal manera una fracción de la población, que la
muestra obtenida represente a la población entera.

El muestreo estadístico, es un enfoque sistemático para seleccionar unos cuantos


elementos (una muestra) de un grupo de datos (una población), a fin de hacer
algunas inferencias sobre el grupo total.

141
E x c e le n c ia A c a d é m ic a

2.- SELECCIÓN DE UN MÉTODO DE MUESTREO


El método que se elija debe ser objetivo y basado en las leyes del azar. Se debe
tener en cuenta:
a) Los resultados que se pretende obtener
b) El tipo de población por muestrear
c) La seguridad requerida
d) El costo de muestreo
e) Los recursos disponibles

3.- VENTAJAS Y LIMITACIONES DEL MUESTREO SOBRE EL


CENSO
Los estadísticos usan la palabra población para designar no sólo a las personas,
sino todos los elementos que han sido escogidos para ser estudiados.
La aplicación de un cuestionario a la población se llama censo.
Los estadísticos usan la palabra muestra para describir una porción elegida de la
población. La aplicación de un cuestionario a una muestra se llama muestreo.

A. Las ventajas
a) Mayor economía
b) Mayor rapidez en la recolección y análisis de la información
c) Menor personal
d) El personal puede ser mejor entrenado
e) Mayor información en el contenido

B. Las Limitaciones
a) Errores en el muestreo
b) Limitación en la medición
c) Limitación en el tiempo disponible
d) Límites en la información personal
e) Limitaciones en el estudio de las relaciones sociales
f) Tiempo y costo

4.-ETAPAS DE LA ENCUESTA POR MUESTREO


a) Planeamiento
b) Selección de la muestra
c) Desarrollo de los cuestionarios
d) Trabajo de campo

142
E x c e le n c ia A c a d é m ic a

e) Preparación del material para el análisis


f) Procesamiento de la información obtenida
g) Preparación del informe

5. DIFERENCIAS ENTRE POBLACIÓN Y MUESTRA


Asunto Población Muestra
Definición: Grupo de elementos que Parte o proporción de la
van a ser considerados población seleccionada
para el estudio
Característica: Parámetros Estadísticos
Símbolos: Tamaño Población = N Tamaño Muestra = n

Media =  Media = x

Desviación Standard de Desviación Estándar de


la población =  la muestra = S

6. TIPOS DE MUESTREO

A. Muestreo Aleatorio o probabilística

a) Al azar simple
- Con reemplazo (no exhaustiva)
- Sin reemplazo (si exhaustivo)

b) Al azar sistemático

c) Al azar con estratificación


- Sin proporcional
- No proporcional a los estratos

d) Al azar de conglomerados
- De igual tamaño
- Se desigual tamaño

143
E x c e le n c ia A c a d é m ic a

e) Al azar en etapas sucesivas


- Bietápico
- Trietápico

f) Al azar por experimentación

B. Muestreo no aleatorio o de juicio o no probabilístico


a) Basado en criterio de expertos
b) Basado en juzgamiento de unidades tipo
c) Basado en cuotas
d) Basado en el acaso

Nº 5.1

Desarrollar en forma resumida los conceptos y dar ejemplos correspondientes


a los tipos de muestra

7. TAMAÑO DE UNA MUESTRA


Corresponde al número de elementos u observaciones que integran una
muestra.

A. Obtención del tamaño de una muestra para estimar proporciones


2
Z NPQ
n 
Z PQ  NE
2 2

n = tamaño de la muestra
N = población
E = error
P = Probabilidad de acierto
Q = Probabilidad de no acierto
Z = distribución normal a un nivel de confianza

Ejemplo
Los alumnos que usan o concurren a INTERNET, según características socio
familiares, del colegio Secundario “San Andres” que tiene 880 alumnos
distribuidos en 15 secciones. Cual es la muestra representativa con un error
del 5% y un nivel de confianza del 95%

144
E x c e le n c ia A c a d é m ic a

N  880

E  0 . 05

P  0 .5

Q  0 .5

n  ?

Nivel de confianza del 95% Z = 1.96.

1 . 96  880  0 . 5  0 . 5 
2

n 
1 . 96   0 . 5  0 . 5   880  0 . 05 
2 2

845 . 15
n 
3 . 16
n  267 alumnos

B. Tamaño de una muestra considerando un tamaño provisional


n'
n 
1 n'
N

Tamaño provisional de la Muestra ()


2
S
n'
V

Donde:
n= Tamaño de la muestra
N = Tamaño de la población

 = error estándar

V = Varianza de la población =  2
V = Varianza de la muestra = P (1  P )  P (Q )

Ejemplo
Conociendo los siguientes datos determinar el tamaño de la muestra

N  1234 empresas
 = 0.015
P  0.9

145
E x c e le n c ia A c a d é m ic a

 P 1  P   0 . 9 1  0 . 9   0 . 09
2
S

  0 . 015 
2
V   0 . 000225
2

0 . 09
n'  400
0 . 000225
400
n   302 Empresas
1 400
1234

El nivel de confianza (  ) más el nivel de significación (  ) siempre es igual al


100% o 1.
 1  ó  1

Ejemplo:
Si   0.05 ó 5%,   0.95 ó 95%

Nº 5.2

Hallar el tamaño de una muestra, por los dos métodos de un distrito de la


provincia donde reside.

8. TERMINOLOGIA CONVENCIONAL CON QUE SE DESIGNA LAS


ESTADISTICAS.

C u a n d o q u e r e m o s r e f e r ir n o s a : U s a m o s e l t é r m in o c o n v e n c io n a l :

146
E x c e le n c ia A c a d é m ic a

9. INFERENCIA ESTADÍSTICA - ESTIMACIÓN


La inferencia estadística es uno de los aspectos mas importantes y cruciales en
el proceso de toma de decisiones, en la economía la administración y en las
ciencias.
La inferencia estadística se refiere a la estimación y la prueba de hipótesis.

La estimación es el proceso de inferir o estimar un parámetro de población (tales


como x y ) del correspondiente estadístico de una muestra extraída de la
población.

10.- CONCEPTO DE ERROR ESTÁNDAR


Es la desviación estándar de la distribución de un estadístico muestral
- Error estándar de la media
- Error estándar de la proporción

A. ERROR ESTÁNDAR DE LA MEDIA


Es la distribución de probabilidad, cuando se mide la media de cada muestra
aleatoria9de una población y se encuentra que la mayoría de estas medias
muestrales ( x s ), difiere una de otra

x  Media
 x
 Desviación Estándar o error estándar
x  


 x
 Error estándar de la media para población infinita
n

 N  n
  Error estándar de la media para población finita o sea
N 1
x
n

cuando n  0 . 05 N

Población Finita: Es la población que posee un tamaño formulado o limitado


Población Infinita: oblación que teóricamente es imposible observar todos sus
elementos.

147
E x c e le n c ia A c a d é m ic a

Ejemplo:
Una población tiene 740 elementos con una media de 13 unidades y una
desviación estándar de 9.

a) Cuanto es la media y el error estándar de la distribución muestral de la


media para un tamaño de muestra de 25.
 x    13 unidades

 9
 x
   1 .8
n 25

b) Si la muestra n , es 49 en vez de 25
n  0 . 05 N

49  0 . 05 ( 740 )

49  37

Entonces se aplica:
 N  n 9 740  49 9 691
     1 . 24
N 1 740  1
x
n 49 7 739

B. ERROR ESTÁNDAR DE LA PROPORCIÓN


P  P  (Proporción de sucesos en la población)
n

P (1  P )
 P
 (Error estándar de la población)
n

Ejemplo:
En un estudio se encuentra que en una muestra aleatoria de 100 estudiantes
que asistieron a la universidad, 40 recibieron un grado universitario. Encontrar
la proporción y el error estándar de la esa población.

La proporción es:
 40
P  P    0 .4
n 100

148
E x c e le n c ia A c a d é m ic a

El Error Estándar es:


P (1  P ) 0 .4 0 .6 
 P
   0 . 049
n 100

11. TEOREMA DE LÍMITE CENTRAL


Cuando n tiende al  la distribución muestral de la media se aproxima a la
distribución normal, cualquiera que sea la forma de la población original.
La aproximación es suficientemente buena para n 30
x  x
Z  0
 x

20
140

120 D is t r. M u e s t r a l d e la m e d ia , n = 2

100

80
D is t . M u e s t r a l d e la m e d ia , n = 5
60

40 P o b la c ió n o r ig in a l
20

0
0 5 10 15 20

40
60
Cuanto mayor es n , mas pequeña es la amplitud o error estándar de la media.
El teorema del Límite Central es el resultado del incremento del tamaño de la
muestra

1. La media de la distribución muestral de la media, será igual a la media


poblacional, prescindiendo del tamaño de la muestra.
2. La distribución muestral de la media se acercará a la normalidad.

Importancia del teorema del Límite Central

- Garantiza que la distribución muestral de la media se acerque a la distribución


normal a medida que crece e tamaño de la muestra.
- Nos permite usar el estadístico muestral para hacer inferencias sobre los
parámetros de la población, sin conocer nada sobre la forma de la distribución
de frecuencia de esa población, salvo la información que logremos recabar de
la muestra.

149
E x c e le n c ia A c a d é m ic a

Ejemplo.
La distribución de las ganancias anuales de todos los cajeros de un banco con 5
años de experiencia tiene un sesgo negativo, según se advierte en la figura. Esta
distribución tienen una media de S/. 15000 y una desviación estándar de S/.
2000. Si extraemos una muestra aleatoria de 30 cajeros ¿Cuál es la probabilidad
de que sus ganancias promedien mas de S/. 15750 al año?.

100
100
80
80

60
60

40
40

20 20

0 0
15000 15750
0 5 10 15 20
0 5 10 15

20
1. Calcular el error Estándar
 2000 2000
 x
    S / . 365 . 16
n 30 5 . 477

2. Distribución Normal Estándar para =15780


x 
Z 
 x

15750  15000 750


Z  
365 . 16 365 . 16
Z  2 . 05

Respuesta
Hay un poco mas del 2% de probabilidad de que las ganancias promedio
asciendan a mas de S/. 15750 al año en un grupo de 30 cajeros.

Nº 5.3

* Con los datos del ejemplo anterior, determinar la probabilidad si fueran 70


cajeros de una población de 800 cajeros.

150
E x c e le n c ia A c a d é m ic a

12. ESTIMACIÓN USANDO LA DISTRIBUCIÓN NORMAL


Se puede obtener:
- Una estimación puntual
- Una estimación de intervalo de un parámetro de la población.

A.Estimación Puntual
Es un número simple. Es insesgado si en muestras aleatorias repetidas de la
población, el valor esperado o medio del estadístico correspondiente es igual al
parámetro de población.

Ejemplo
La media muestral ( x ) es una estimación puntual insesgada de la media
poblacional (  ) por que x   , donde x es el valor esperado x . La
desviación estándar de la muestra S es una estimación insesgada de  , y la
proporción de la muestra P es una estimación insesgada de P (la proporción
de la población con una característica dada).

B. Estimación de Intervalo
Se refiere a la amplitud de valores junto con la probabilidad o nivel de
confianza, de que el intervalo incluya el parámetro de población desconocida.

Nivel de confianza usado frecuentemente, para n 30


90% = 1.64
95% = 1.96
99% = 2.58

O para el Nivel de significación:


10% = 1.64
5% = 1.96
1% = 2.58

La tabla anterior se utiliza cuando no se puede hallar “Z” o variable


estandarizada.
Un intervalo de confianza se puede construir de modo semejante para la
proporción de la población.

151
E x c e le n c ia A c a d é m ic a

Ejemplo:
Se toma una muestra aleatoria de 14 con una media de 100 y una desviación
estándar de 60, de una población de 1000. El intervalo de confianza al 95%
para la media de población desconocida es:

  x  1 . 96  x
puesta n  30

 N  n
 x  1 . 96 puesta n  0 .5 N
n N 1

60 1000  144
 100  1 . 96 usando S como estimacion de 
144 1000  1

 100  1 . 96 ( 5 )( 0 . 93 )

 100  9 . 11

Respuesta
La M esta entre 90.89 y 109.11 con un grado de 95% de confianza

Ejemplo.
Un grupo de investigadores encuentra que en una muestra aleatoria de 100
personas que asistieron a la universidad, 40 recibieron un grado universitario.
Encontrar el intervalo de confianza al 99% para la proporción de graduados
universitarios; del total de personas que asistieron a la universidad,

P  P  Z P

P (1  P )
P  P  Z suponiendo n  0 . 05 N
n

0 .4 ( 0 .6 )
 0 . 4  2 . 58 usando P como estimación de P
100

 0 . 4  2 . 58 ( 0 . 05 )

 0 . 4  0 . 13

Respuesta
La proporción de graduados P esta entre 0.27 y 0.53 con un nivel de 99% de
confianza.

152
E x c e le n c ia A c a d é m ic a

13. INTERVALO DE CONFIANZA PARA LA MEDIA USANDO LA


DISTRIBUCION “T”
Cuando la población tiene distribución normal pero no se conoce  y n<30 se
empleará la distribución “t”

Donde
Grado de libertad: gl  n  1

 s
Error Estándar:  x
 
n n

s
Intervalo de Confianza:   x  t
n

Ejemplo:
Una muestra aleatoria de n = 10 pilas de Cadmio con una vida media de
operación de x = 5 horas y una desviación estándar muestral de s = 1 hora, se
escoge de una compañía conocida, que produce pilas con vida de operación,
normalmente distribuidos y nivel de confianza del 95%. Encontrar el intervalo
de confianza.

  95 %
n  10

x  5

gl  10  1  9

s 1

t  ?

  ?

90
80
70
60
50
40
30
0.025
0.025
95%
20
10
0
0 5 10 15 20
t t
- 2.262 + 2.262

153
E x c e le n c ia A c a d é m ic a

t   2 . 262

1
  5  2 . 262
10
  5  2 . 262 ( 0 . 316 )

 4 . 29
 5  0 . 71 
 5 . 71

Respuesta:
El intervalo de confianza está entre 4.29 y 5.71 horas, con un grado del 95% de
confianza.

Nº 5.4

Halle el valor de “t” para 27 grados de libertad para las siguientes áreas que
caen dentro de la cola (derecha) de la distribución t.
a) Al 10%
b) 5%
c) 2.5%

14.- PRUEBA DE HIPOTESIS


En la prueba de hipótesis comenzamos haciendo una suposición respecto de
una característica poblacional desconocida. Luego tomamos y sobre la base de
la característica muestral correspondiente aceptamos o rechazamos la
hipótesis con un grado particular de confianza.

A.TIPOS DE ERRORES AL PROBAR UNA HIPÓTESIS

a) Error del tipo I (α)


Sobre la base de la información muestral podemos rechazar una
hipótesis que indudablemente es verdadera.

b) Error tipo II (β)


Cuando aceptamos una hipótesis falsa α se le denomina nivel de
significación.
1-α es el nivel de confianza de la prueba

154
E x c e le n c ia A c a d é m ic a

B.-LOS PASOS ESTABLECIDOS PARA LA PRUEBA DE HIPÓTESIS


Los pasos formales establecidos para la prueba de hipótesis sobre la media
de la población o sobre una proporción son los siguientes:

1º.- Suponer que  es igual a algún valor hipotético 0 , esto se representa


por:
H 0
:  0

H 0
se denomina hipótesis nula.

H1 :  0

H 1
se denomina hipótesis alternativa.
H1 :  0
(dependiendo del problema))
H1 :  0

2º. Decidir sobre el nivel de significación de la prueba (generalmente 5%


pero a veces 1%) y definir la región de aceptación y la región de rechazo
para la prueba usando la distribución apropiada.

3º. Tomar una muestra aleatoria de la población y calcular x , “ Z ”, o “ t ”. Si


ellos caen en la región de aceptación, se acepta H 0
; de lo contrario, se
rechaza H 0
a favor de H1.

Ejemplo 1:
Una compañía quiere probar si puede garantizar que los focos que producen
duran 1000 horas de operación útil. La compañía toma una muestra aleatoria
de n=100 de sus focos y halla que la media muestral =980 horas y la
desviación estándar muestral S = 80 horas.
La compañía quiere conducir la prueba al nivel de simplificación del 5%

1º Paso
H 0
:   1000

H 1 :   1000

2º Paso
Como n>30 la distribución muestral de la media es aproximadamente
normal.

155
E x c e le n c ia A c a d é m ic a

La región de aceptación de la prueba al nivel de significación del 5% esta


dentro de ±1.96 bajo la curva normal y la región de rechazo está afuera.

Puesto que la región de rechazo esta en ambas colas, tenemos una prueba
de dos colas.

90
80
70
60
50
40 0.95
30
0.025
20 0.025
10
0
-1.96 0 1.96
0 5 10 15 20
Región Rechazo Región Aceptación Región Rechazo

3º Paso
x  0 x  0 x  0 980  1000  20
Z        2 .5
  S 80 8
x
n n 100

Como la Z calculada cae en la región de rechazo la compañía debe rechazar


H 0 que   1000 y acepta   1000 a nivel de significación del 5%.

Ejemplo 2:
Una empresa quiere saber con un nivel de confianza del 95% si puede
garantizar que las cajas de jabones que vende contienen más de 500 gr. del
producto. Por experiencia la empresa sabe que la cantidad de jabones en las
cajas tiene distribución normal. La firma toma una muestra aleatoria de n=
25 y halla que x  520 gr y S  75 gr.
La firma quiere probar si   500 gr

1º Paso
H 0
:   500

H 1 :   500

156
E x c e le n c ia A c a d é m ic a

2º Paso
Como la distribución de población es normal, pero n < 30 y  no se conoce,
de debe usar la distribución t (con n 1 = 24 grado de libertad).
Para definir la región de rechazo de la prueba a nivel dignificación 5% se
busca en la tabla. Este es “Prueba de cola derecha”
90
80
70
60
50
40 0.95
30
20 0.05
10
0 t
0 5
0
10 1.711
15 20
Región Aceptación Región Rechazo

3º Paso
x  520  500 20
t     1 . 33
S 75 15
n 25

t  1 . 33 cae en la región de aceptación, aceptan la H 0


que   500 gr a

nivel de dignificación del 5%.

Ejemplo 3:
En el pasado, 60% de los estudiantes que ingresaron a una facultad de la
Universidad recibieron su grado al cabo de 4 años. Para la clase que ingreso
en 1999, solamente 15 de los 36 que iniciaron recibieron sus grados en
2003. Probar si la clase de 1999 se desempeñó peor que las clases
anteriores a un nivel de significación del 5%.
- Notamos primero que este problema involucra la distribución binomial.
- Puesto que n > 30 y np y n(1-p)>5 podemos utilizar la distribución
normal, por p=0.60

15
- Para la clase de 1999. la proporción de éxito p   0 . 42 y el error
36

estándar

p (1  p ) ( 0 . 6 )( 0 . 4 )
Pp    0 . 08
n 36

157
E x c e le n c ia A c a d é m ic a

Tenemos:
1º Paso:
H 0
: p  0 . 60

H 1 : p  0 . 60

2º Paso
Esta es una “prueba de cola izquierda”
90
80
70
60
50
40 0.95
30
0.05
20
10
0
0 -1.645
5
0
10 15 20

3º Paso
p  p 0 . 42  0 . 60
Z     2 . 25
 p
0 . 08

-2.25 cae en la región de rechazo. Rechazamos la Ho

Al nivel de significación del 5% la clase de 1999 se desempeña peor que


las clases anteriores.

Nº 5.5

Un fabricante de avionetas necesita comprar láminas de aluminio de 0.05


pulgadas de espesor. Las láminas más delgadas no serían apropiadas y las más
gruesas serían demasiado pesadas. El fabricante toma una muestra aleatoria de
100 láminas de un proveedor y halla que su grosor promedio es 0.048 pulgadas
y su desviación estándar es 0.01 pulgadas. Debe el fabricante comprar las
láminas de aluminio a ese proveedor si quiere tomar la decisión a nivel de
significación del 5%.

158
E x c e le n c ia A c a d é m ic a

15. PRUEBA DE HIPÓTESIS PARA LAS DEFERENCIAS ENTRE DOS


MEDIAS O DOS PROPORCIONES
En muchas situaciones de toma de decisiones, es importante determinar si las
medias o proporciones de dos poblaciones son o no las mismas.
Para hacer esto, tomamos una muestra aleatoria de cada población y solo si
las diferencias en las medias muestrales o proporciones se pueden atribuir al
azar aceptamos la hipótesis de que las dos poblaciones tienen iguales medias
o proporciones
Si las dos poblaciones están normalmente distribuidas o si como entonces las
distribuciones son también normal con el error estándar dado:

1 
2 2

 x1  x 2
 
2
para probar si 1   2
n1 n2

P 1  P  P 1  P 
 P1  P2
  para probar si P1  P2
n1 n2

Promedio ponderado de P1 y P2 :

n 1 P1  n 2 P 2
P 
n1  n 2

Ejemplo 1:
Un gerente quiere determinar al nivel de significación del 5% si los salarios
horarios para trabajadores semicalificados son los mismos en dos ciudades.
Con el fin de hacer esto toma una muestra aleatoria de salarios por hora en

ambas ciudades y halla que, x 1  x 2  5 . 40 S1  2 S 2  1 . 80


$ $ $ $
6 , , y y para
n 1  40 y n 2  54
y respectivamente.

Las hipótesis que deben probar son:


H 0
: 1   2 o H 0
: 1   2  0

H 1 : 1   2 o H 0
: 1   2  0

Esta es una prueba de dos colas y la región de aceptación para se sitúa entre
±1.96 bajo la curva normal estando:

159
E x c e le n c ia A c a d é m ic a

1 
2 2 2 2
S1 S2
 x1  x 2
 
2
 
n1 n2 n1 n2

2 2
2 . 00 1 . 80
   0 . 1  0 . 06  0 . 16  0 . 4
40 54

Z 
x 1

 x 2   1   2 

x 1
 x2  0 
 x1  x 2
 x1  x 2

0 .6
  1 .5
0 .4

Ejemplo 2:
Una empresa quiere determinar al nivel de significación del 1% si la proporción
de componentes electrónicos aceptables de un proveedor extranjero, es mayor
que para un proveedor nacional. La empresa toma una muestra aleatoria para
el embarque de cada proveedor y encuentra que
p 1  0 . 9 y p 2  0 . 7 para n 1  100 y n 2  80

Las hipótesis serian:


H 0
: p1  p 2

H 1  p1  p 2

Esto es una prueba de cola derecha.


Y la región de rechazo de se sitúa a la derecha de 2.33 bajo la curva normal
estándar.
n1 p1  n 2 p 2 100 ( 0 . 9 )  ( 80 )( 0 . 7 ) 146
p     0 .8
n1  n 2 180 180

p 1  p  p 1  p  0 .8 ( 0 .2 ) ( 0 . 8 )( 0 . 2 )
 p1  p 2
   
n1 n2 100 80

 0 . 0016  0 . 002  0 . 0036  0 . 06

 p1  p 2    p1  p 2  0 .9  0 .7   0 0 .2
Z     3 . 33
 p1  p 2
0 . 06 0 . 06

160
E x c e le n c ia A c a d é m ic a

Rechazamos H 0
y aceptamos la hipótesis de que p1  p 2 al nivel de

significación del 1%.

Nº 5.6

A. Una muestra aleatoria de 90 estudiantes universitario indica que el 15%


se casa durante el primer año, mientras el 30% se casa durante el
segundo año. Determine si aceptar la hipótesis que la proporción de
estudiantes casados en primer año es menor que la del segundo año.
a) Al nivel de significación del 5%
b) Al nivel de significación del 1%

B. Una firma de consultores quiere decidir, al nivel de significación del 5%,


si los salarios de los trabajadores de construcción civil difieren entre
Trujillo y Arequipa. Una muestra aleatoria de 110 trabajadores e
construcción civil en Trujillo tiene un salario promedio mensual de 900
nuevos soles con una desviación estándar de 100 nuevos soles. En
Arequipa, una muestra aleatoria de 80 trabajadores, tiene un salario
promedio mensual 810 nuevos soles, con una desviación estándar 80
nuevos soles. ¿Hay diferencia significativa entre los salarios de los
trabajadores de construcción civil en Trujillo y Arequipa?

16. LA PRUEBA CHI-CUADRADO “ X 2 ”


Se usa para probar:
a) Si las frecuencias observadas difieren significativamente de las
frecuencias esperadas cuando son posibles más de dos resultados.
b) Si dos variables son independientes o no.

A. EL ESTADÍSTICO “ X 2 ” CALCULADO DE LOS DATOS MUESTRALES

( f0  fe )
2

 
2
X
fe

f0  frecuencias observadas

fe  frecuencias esperadas

161
E x c e le n c ia A c a d é m ic a

a) Si “ X 2 ” calculado es mayor “ X 2 ” tabulado, al nivel de significación


especificado y los grados de libertad. La hipótesis nula H 0
se rechaza a

favor de la hipótesis alternativa H 1

f0  fe  X  0
2
b)

B. GRADOS DE LIBERTAD DEL “ X 2 ”


a) Para pruebas de bondad de ajuste

gl  c  m  1

c = numero de categorías
m = numero de parámetros de población estimados a partir de
estadísticos muestrales.

Partir de estadísticos muestrales.

b) Para pruebas de independencia o pruebas de tabla de contingencia

gl = (r - 1) (c - 1)

r = número de filas de la tabla de contingencia


c = número de columnas

C. FRECUENCIA ESPERADA PARA CADA CELDA


Intersección de una tabla de contingencia

fe 
 r c

D. USO DE LA TABLA DE CHI CUADRADO


La proporción del área de la distribución Chi cuadrada queda determinada
por la intersección de los niveles de significación y confianza con los
grados de libertad.

162
E x c e le n c ia A c a d é m ic a

Ejemplo 1:
En el pasado, 30% de los refrigeradores vendidos por una tienda eran de
10 pies3, 40% eran de 12 pies3 y 30% de 15 pies3, con el fin de determinar
el inventario que debe para mantenerse de cada tipo de aparato, el gerente
toma una muestra aleatoria de 100 compras recientes y halla que 20 son
de 10 pies3, 40 de 12 pies3 y 40 de 15 pies3. Probar al nivel de significación
del 5%, la hipótesis que el patrón anterior de ventas, todavía tiene vigencia.

Comprar observadas y esperadas de refrigeradores por capacidad.

Capacidad Total
10 pies3 12 pies3 15 pies3
Patrón Observado f0 20 40 40 100

Patrón esperado fe 30 40 30 100

( f0  fe )
2
( 20  30 ) ( 40  40 ) ( 40  30 )
2 2 2

    
2
X
fe 30 40 30

 10
2 2 2
0 10 100 100
     0  6 . 67
30 40 30 30 30

gl = c – m – 1 = 3 – 0 –1 = 2

No se estimo parámetro alguno de población m=0


 0.005
gl = 2
2
Valor calculado de X = 6.67
2
Valor tabulado de X = 5.99

Respuesta
2
Como el valor calculado de X = 6.67 es mayor que el valor tabulado de
2
X = 5.99, se rechaza H 0

163
E x c e le n c ia A c a d é m ic a

Ejemplo 2:
Un vendedor de motocicletas ha recolectado los datos que se muestran en
la tabla sobre el número de motocicletas importadas y nacionales
comprados por clientes menores de 30 años y de 30 años en adelante.
Para probar el nivel de significación del 1% si el tipo de motocicletas
adquiridas es independiente de la edad del comprador.

Tabla de contingencia para compradores de automóviles


Tipos de motocicleta Total
Edad
Importada Nacional
Menos de 30 años 30 40 70
De 30 en adelante 20 80 100
Total 50 120 170

1º Elabora tabla de frecuencia esperados para la frecuencia observada

fe 
 r c

( 70 )( 50 )
f e1   21
170

( 70 )( 120 )
fe2   49
170

(100 )( 50 )
f e3   29
170

(100 )( 120 )
fe4   71
170

Tabla de frecuencia esperada para las frecuencias observadas

Tipos de motocicletas Total


Edad
Importado Nacional
Menos 30 21 49 70
Mayor 30 29 71 100
Total 50 120 170

164
E x c e le n c ia A c a d é m ic a

2º Hallamos el grado de libertad

Donde
r = numero de fila = 2
c = numero de columnas = 2

gl = (r-1) (c-1) = (2-1) (2-1) = 1

3º Hallamos el Chi cuadrado calculado


( f0  fe )
2

 
2
X
fe

( 30  21 ) ( 40  49 ) ( 20  29 ) ( 80  71 )
2 2 2 2

     9 . 44
21 49 29 71

4º Hallamos el Chi cuadrado tabulado en la tabla


tabulado = 6.63

Respuesta
calculado = 9.44 es mayor que tabulado = 6.63, rechazamos porque la
edad no es un factor en el tipo de motocicleta comprada (Los jóvenes están
mas inclinados a comprar motocicletas importadas)

Nº 5.7

A. En la tabla se indica la frecuencia observada y esperada de 4


enfermedades poco comunes (A, B, C, D) en una ciudad. ¿Es
significativa la diferencia entre la frecuencia observada y esperada de las
enfermedades al nivel del 10%?

Frecuencias observadas y esperadas de enfermedades varias A, B, C, D


Tipo de enfermedad Total
A B C D
fo 3 5 6 3 17

fe 6 6 3 2 17

165
E x c e le n c ia A c a d é m ic a

B.- El número de ataques cardiacos sufridos por hombres y mujeres de


varios grupos de edades en una ciudad esta dado por la tabla de
contingencia. Pruebe al nivel de significación del 1% la hipótesis de que
la edad y el sexo son independientes en la ocurrencia de ataque
cardiaco.

Número de ataques cardiacos de hombres y mujeres en varios grupos de


edades en una ciudad.

Grupo de Edad Hombre Mujeres Total


Menores de 30 años 10 10 20
Entre 30 -60 50 30 80
Mayores de 60 años 30 20 50
90 60 150

17.- ANALISIS DE VARIANZA


Se emplea para probar la hipótesis de que las medias de más de dos
poblaciones son iguales o diferentes cuando las poblaciones están normalmente
distribuidas con igual varianza. (ANOVA, ANDEVA)

Pasos
1. Estimar la varianza de población partiendo de la varianza entre las medidas
muestrales (MSA).
2. Estimarla varianza de población partiendo de la varianza dentro de las
muestras (MSE).

a) Calcular la relación F
Varianza entre las medidas muestrales MSA
F  
Varianza dentro de las muestras MSE

b) Si la relación F calculada es mayor que el valor tabulado de F al nivel de


significación especificada y grados de libertad, la hipótesis nula, de medias
de población iguales se rechaza a favor de la hipótesis alternativa.

166
E x c e le n c ia A c a d é m ic a

18. ANÁLISIS DE VARIANZA PARA UNA CLASE O FACTOR

TABLA DE ANALISIS DE VARIANZA DE UNA CLASE O FACTOR


Fuente de Grados de Cuadrado Relación
Suma de cuadrados
Variación Libertad Media F
Entre las medias 2
 
 SSA MSA
(Explicado por el SSA  r   x j  x  c 1 MSA 
  c 1 MSE
factor A)
Dentro de las
SSE   xij  x j 
SSE
2
r  1 c MSE  -
muestras (Error
r  1 c
o inexplicado)
2
 

Total SST    xij  x   SSA  SSE rc  1 - -
 

x j  media de la muestra j compuesta por r observación

xj 
 i
x ij

x  media poblacional de todas las muestras c



  j
X i j
x
i

rc

SSA= suma de cuadrados explicados por el factor A


2

 
SSA  r   x j  x
 

SSE= suma de cuadrados de errores no explicados por el factor A


SSE    x )
2
(X ij j

SST= Suma total de cuadrados


SST    (X  x)
2
ij
= SSA + SSE

167
E x c e le n c ia A c a d é m ic a

USO DE LA TABLA

En la tabla
 0 . 05 (el número superior)
 0 . 01 (El número inferior o en negrita)

Para cada grado de libertad

gl del numerador = c-1


c = número de muestras
gl del denominador = (r-1)c
r = número de observaciones en cada muestra

Ejemplo:
Una compañía vende jabón idéntico en 3 envolturas diferentes al mismo precio.
Las ventas de 5 meses se presentan en la tabla. Los datos de las ventas tienen
distribución normal con igual varianza. Probar al nivel de significación del 5% si
las ventas medias de jabón para cada envoltura son iguales o no.

Tabla venta de 5 meses de jabón en las envolturas 1, 2 y 3

Envoltura 1 Envoltura 2 Envoltura 3


87 78 90
83 81 91
79 79 84
81 82 82
80 80 88
410 400 435

168
E x c e le n c ia A c a d é m ic a

1º Planteamos la hipótesis
H 0
: 1   2
 3

H 1
: 1   2
 3

2º Hallamos las medias, donde:


401
x1   82
5

400
x2   80
5

435
x3   87
5

410  400  435
x   83
5 (3)

3º Determinamos la suma de cuadrados


SSA  5 [( 82  83 )  ( 80  83 )  ( 87  83 ) ]  130
2 2 2

SSE  ( 87  82 )  ( 83  82 )  ( 79  82 )  ( 81  82 )  ( 80  82 )  ( 78  80 ) 
2 2 2 2 2

 ( 81  80 )  ( 79  80 )  ( 82  80 )  ( 80  80 )  ( 90  87 )  ( 91  87 ) 
2 2 2 2 2 2

 ( 84  87 )  ( 82  87 )  ( 88  87 )  110
2 2 2

SST  ( 87  83 )  ( 83  83 )  ...  ( 88  83 )  240


2 2 2

SST  SSA  SSE  130  110  240

Tabla de análisis de Varianza para envoltura de Jabón

169
E x c e le n c ia A c a d é m ic a

F u e n te d e Sum a de G ra d o s d e C u a d ra d o
R e la c ió n F
V a ria c ió n c u a d ra d o s L ib e r t a d M e d ia

E x p lic a d o p o r

la s e n v o lt u r a s 130 M SA 65
SSA  130 c 1 2 M SA   65   7 .0 9
(e n tre 2 M SE 9 .1 7
c o lu m n a s )

E rro r o

in e x p li c a d o 110
SSE  110 r  1 c  1 2 M SE   9 .1 7 -
( d e n t r o d e la 12
c o lu m n a )

T o ta l SST  240 rc  1  1 4 - -

F calculado = 7.09
F calculado = 3.88

g l d e l n u m e ra d o r = 2
  0 .0 5
g l d e l d e n o m in a d o r = 1 2

R e s p u e s ta :

C o m o la re la c ió n F c a lc u la d a e s m a y o r q u e e l v a lo r ta b u la d o d e F a n iv e l d e

s ig n ific a c ió n d e l 5 % , s e re c h a z a la h ip ó te s is n u la H 0
a fa v o r d e la h ip ó te s is

a lte rn a tiv a H 1

19. ANÁLISIS DE VARIANZA PARA DOS CLASES O FACTORES

TABLA DE ANALISIS DE VARIANZA DE 2 CLASES O 2 FACTORES


F u e n te d e G ra d o s d e C u a d ra d o R e la c ió n
S u m a d e c u ad ra d o s
V a ria c ió n L ib e r t a d M e d ia F

2

E n tre la s m e d ia s  
S S A  r   x. j  x  SSA M SA
( E x p li c a d o p o r e l   c 1 M SA 
c 1 M SE
fa cto r A )
V a ria c ió n e n tre c o lu m n a

2

E n tre la s m e d ia s  
SSB  c  x i.  x  SSB M SB
( E x p li c a d o p o r e l   r 1 M SB 
r 1 M SE
fa cto r B )
V a r i a c i ó n e n t r e f il a

SSE
E rro r o M SE 
SSE  SST  SSA  SSB r  1 c  1  r  1 c  1  -
i n e x p li c a d o

2

 
T o ta l SST    x ij  x  rc  1 - -
 

170
E x c e le n c ia A c a d é m ic a

La media condicional vertical esta dado por

 x ij
x. j 
i

La media condicional horizontal esta dado por

 x ij
j
xi. 
c

La media poblacional esta dado por



 x .  x. j
x  
i

r c

Ejemplo:
En la tabla se da los rendimientos de una granja experimental que usó 4
fertilizantes y 3 pesticidas, de modo que cada parcela del terreno tenia una
probabilidad igual de recibir cada combinación de fertilizantes-pesticidas
(diseño experimental completamente aleatorio).

Hallar la relación de F y probar las hipótesis a nivel de significación del 1%

Tabla Rendimiento con 4 Fertilizantes y 3 Pesticida

Factores Fertilizante 1 Fertilizante 2 Fertilizante 3 Fertilizante 4


Pesticida 1 21 12 9 6
Pesticida 2 13 10 8 5
Pesticida 3 8 8 7 1

171
E x c e le n c ia A c a d é m ic a

1º Paso: Planteamos las hipótesis

H 0
: 1   2  3   4

Factor A
H 1
: 1,  2,  3,  4
no son iguales

H 0
: 1   2
 3
Factor B
H 1
: 1,  2 ,  3 no son iguales

2º Paso: Hallamos la media condicional Vertical

x. j 
 ij

21  13  8
x .1   14
3

12  10  8
x.2   10
3

9  8  7
x .3   8
3

6  5 1
x.4   4
3

3º Paso: Hallamos la media condicional horizontal

xi 
 X ij

21  12  9  6
x1   12
4

13  10  8  5
x2   9
4

8  8  7 1
x3   6
4

172
E x c e le n c ia A c a d é m ic a

4º Paso: Hallamos la Media Poblacional


 x .  x. j
x  
i

r c


14  10  8  4 
12  9  6
x   9 ó x   9
4 3

5º Paso: Hallamos la Suma de cuadrados

SST    x)
2
(X ij

( 21  9 )  144 (12  9 )  9 (9  9 )  0
2
(6  9 )  9
2 2 2

(8  9 ) 1
2
(13  9 )  (10  9 )  1 (5  9 )  16
2 2 2
16

(7  9 )  4
2
(8  9 )  (8  9 )  1 (1  9 )  64
2 2 2
1

161 11 5 89

SST = 161 + 11 + 5 + 89 = 266


6º Paso: Hallamos los grados de libertad

gl de SSA = c - 1 = 4 - 1= 3
gl de SSB = r - 1 = 3 - 1 = 2
gl de SSE = (r-1) (c-1) = 6
gl de SST = rc - 1 = 11

7º Paso: Hallamos los cuadrados medios

SSA 156
MSA    52
c 1 3

SSB 72
MSB    36
r 1 2

SSE 38
MSE    6 .3
( r  1 )( c  1 ) 6

173
E x c e le n c ia A c a d é m ic a

8º Paso: Hallamos la relación F calculada

MSA 52
FA    8 . 25
MSE 6 .3
MSB 36
FB    5 . 71
MSE 6 .3

9º Paso: Determinamos la relación F tabulada

Factor A:
Grados de libertad del numerador = 3
 0 . 01
Grados de libertad del denominador = 6
F A  9 . 78

Grados de libertad del denominador = 6


F B  10 . 92

Respuesta:
Para el factor A, como el F calculado es menor que el F tabulado, se acepta
la hipótesis nula H 0

Para el factor B, como el F calculado es menor que el F tabulado, se acepta


la hipótesis nula H 0

Factor B:
Grados de libertad del numerador = 2
 0 . 01
Grados de libertad del denominador = 6
F B  10 . 92

174
E x c e le n c ia A c a d é m ic a

Respuesta:
Para el factor A, como el F calculado es menor que el F tabulado, se acepta
la hipótesis nula H 0

Para el factor B, como el F calculado es menor que el F tabulado, se acepta


la hipótesis nula H 0

Nº 5.8

A. El número de ataques cardíacos sufridos para hombres y mujeres de varios


grupos de edades en la ciudad de Piura esta dado por la tabla de contingencia
siguiente: Pruebe al nivel de significación del 1% la hipótesis de que la edad y el
sexo son independientes en la ocurrencia de ataques cardíacos.

Número de ataques cardíacos de hombres y mujeres en varios grupos de


edades en la ciudad de Piura

Grupo de edad Hombres Mujeres Total


Menores de 30 10 10 20
Entre 10 – 60 50 30 80
Mayores de 60 30 20 50
90 60 150

B. La tabla siguiente da la producción para 8 años de una granja experimental que


uso 4 tipos de abonos diferentes. Supóngase que la producción con cada abono
tiene distribución normal con igual varianza. Pruebe la hipótesis de que las
medias de población son las mismas a nivel de significación del 5%.

175
E x c e le n c ia A c a d é m ic a

T a b l a d e P r o d u c c ió n d e 8 a ñ o s c o n 4 t i p o s d e a b o n o s

Abono 1 Abono 2 Abono 3 Abono 4

50 47 51 57

61 50 47 48

57 58 56 52

65 61 52 60

58 51 57 61

53 48 59 57

61 59 58 51

59 50 60 46

464 424 440 432

AVILA., Roberto. Estadística Elemental. Editorial R.A. Lima, 1998.

CALZADA B., José. Estadística General. Editorial Jurídica S.A., Lima, 1966.

GALDOS, L. Dominando las Matemáticas: Calculo y Estadística II y III, tomo 15 y 16,


Edición El Popular, Lima-Perú, 2005.

JONSON, Robert. Estadística Elemental, Editorial Trillas. 2ª edición. México. 1991.

LEVIN, Richard. Estadística para Administradores, Editorial, Prentice Hall. 2ª edición.


Mexico 1988.

LIPSCHUTZ, S. Probabilidad. Editorial McGraw Hill. Colección Serie Schaum.


Colombia. 1970

MOOD, Alexander M. Introducción a la Teoría Estadística. Editorial Aguilar. Madrid


1972.

MOYA, Rufino y SARAVIA, G. Probabilidad e Inferencia Estadística. Editorial San


Marcos. 2ª edición, Lima.

176
E x c e le n c ia A c a d é m ic a

TRIOLA, Mario. Estadística Elemental. Editorial Addison Wesley Longman. 7ª


Edición, México 2000.

VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias Graficas S.A.
2ª Edición. Lima 1993.

En el siguiente Fascículo estudiaremos las relaciones que existen entre variables,


los ajustes de curva para poder inferenciar y los números índices de Laspeyres,
Paasche y Fishers.

A
u
A
ut
o
t
oe
ev
a
v
al
u
l
uaa
c
ci
ó
i
ónn
f
fo
r
o
rm
ma
t
a
ti
v
i
va Nº
a 05

1. Una agencia gubernamental recibe muchas quejas de consumidores de que las


cajas de detergentes vendidas por una compañía contiene menos de las 20
onzas de detergente anunciadas. Para verificar las quejas de los consumidores,
la agencia adquiere 9 cajas de detergente y encuentra que X=18 onzas y s=3
onzas. ¿ Como puede conducir la agencia la prueba a nivel de significación del
5% si sabe que la cantidad de detergente en las cajas tiene distribución normal?.

2. Una muestra aleatoria de 21 jugadores de fútbol del SC tiene un peso medio de


265 libras con una desviación estándar de 30 libras, mientras una muestra
aleatoria de 11 jugadores de la U tiene un peso medio de 240 libras con una
desviación estándar de 20 libras. ¿ Es el peso medio de los jugadores de fútbol
del SC mayor que el de los jugadores de la U al nivel de confianza del 99%?.

3. La tabla de contingencia muestra el número de componentes electrónicos


aceptables y no aceptables producidos a diversas horas de la mañana en una
muestra aleatoria de la producción de una planta. ¿Debe aceptarse o rechazarse
al nivel de significación del 5%, la hipótesis de que la producción de
componentes aceptables es independiente de la hora de la mañana en la cual se
producen?

177
E x c e le n c ia A c a d é m ic a

4. Una urna contiene bolas de 4 colores: verde, blanco, rojo y azul. Se escoge una
bola de la urna y se anota su color. Se coloca de nuevo en la urna; se mezcla
bien, y se escoge otra bola. El proceso se repite 18 veces con el resultado que se
escoge 8 veces una bola verde, una blanca, 7 veces; una bola roja una vez, y
una bola azul, dos veces. ¿Contiene la urna un igual número de bolas verdes,
blancas, y rojas o azules?. Pruebe la hipótesis al nivel de significación del 5%.
(Chi)

5. La Tabla da los datos de venta de jabón con 3 envolturas y 4 formulas diferentes


en un diseño experimental totalmente aleatorio. ¿Debe aceptarse la hipótesis al
nivel de significación del 5% de que las medias de población son las mismas
para cada: a) Envoltura? b) Fórmula?

178

También podría gustarte