Está en la página 1de 237

a lo antes expuesto, se presenta hoy, la Tercera Edición de

Aplicada que corresponde al desarrollo del contenido


i I >prqgbzmático de esta asignatura en diversas universidades del país, en la
de estudio presencial como la de distancia. Consta de siete unidades
que se inician con sus correspondientes objetivos; en algunas de
enseña el uso de ciertas funciones de la calculadora cientfjica no
de la familia CASIO fx-82 MS, io que le permitirá estudiante
rapidamente los cálculos aritméticos y a utilizar un instrumento
.. complementario en el estudio de esta aSignatura.

,I

1 .

~ \

\
--. ----. --
dl".,n- .'"",;,? ~. ..
' -

Introducción
Unid ,

de
de
Contenido. ••••. '.'
- ..............•.;.;••••••••••.•. _

1.1 Introducción. Definición de Estadística. Clasificación. 2


Población, muestra, datos, variables.
1.2 Niveles o escalas de medición 6
1.3 Tablas o cuadros estadísticos. Distribución de frecuencias 11
para datos nominales y ordinales
1.4 Proporciones. Porcentajes, razones. Uso de la calculadora científica: Potenciación y 14
Radicación. Proyección de poblaciones
1.5 Representación gráfica de datos estadísticos 23
1.6 El rango. Tamaño o ancho de clase. Marca de clase. 36
Distribución de frecuencias. Límites reales de clase
1.7 Representación gráfica de distribución de frecuencias. Histograma. 45
Polígonos y Ojivas

Unid
de
Contenido.
2.1 Introducción. Notación sigma o sumatoria - 60
2.2 Media, uso de la calculadora científica, mediana, y moda de datos no agrupados 64
2.3 Media, mediana y moda de datos agrupados en frecuencia simple 69
2.4 Media aritmética ponderada 72
2.5 Media, mediana y moda de datos agrupados. 75
Ventajas y desventajas de la media aritmética, de la mediana y de la moda

Unid
y
Contenido. ....._..................•.•.•. _

3.1 Introducción a las medidas de posición 86


3.2 Cálculo de la posición y del valor de un percentil en datos no agrupados 87
3.3 Cálculo de la posición y del valor de percentiles en datos agrupados 90
3.4 El Rango percentil de un puntaje dado. Significado 94
3.5 Conceptualización de las medidas de dispersión. ¿Por qué estudiar la dispersión? 97
3.6 Desviación estándar y varianza de datos no agrupados. 99
3.7 Desviación estándar y varianza de datos agrupados en frecuencia simple 103

...
Desviación estándar y varianza de datos agrupados 101
3.9 Desviación relativa. Coeficiente de variación. Variable normalizada 112

o --.N...--Tú--¡¡ñ-e~z • •

_o 00 _00 o oo_o .~_~~~~_


4.1 Introducción. Variables Aleatorias Probabilidad, experimento. Eventos mutl¡amente 120

excluyentes. Probabilidad clásica, probabilidad como frecuencia relativa,

probabilidad subjetiva

4.2 Reglas básicas de la probabilidad. Regla general de adición para todo tipo de eventos. 125

4.3 Probabilidad condicional. Eventos dependientes e independientes 132

4.4 Conceptualización de distribución de probabilidad. Distribución nonnal, 138

características. Area bajo la curva nonnal.

Aplicaciones de la distribución normal. 147

154

5.1 Elementos de muestreo. ¿Por qué muestrear la población? Técnicas de muestreo 159

5.2 Distribucion muestral para la media de la muestra 164

5.3 Distribucion muestral para proporciones de la muestra

168

6.1 Introducción. Estimación. Intervalos de confianza para medias de

muestras grandes y pequeñas 177

6.2 Intervalos de confianza para proporciones. Muestras grandes 180

6.3 Hipótesis estadísticas. Hipótesis nula y alternativa. Tipo de errores 183

6.4 Prueba de hipótesis con una y dos colas o extremos. Pruebas concernientes a medias 189

6.5 Prueba de hipótesis concerniente a proporciones de muestras grandes 192

6.6 Prueba de hipótesis utilizando la distribución Ji cuadrada. Tablas de contingencia

202

7.1 Introducción. Diagrama de dispersión 204

7.2 Estimación mediante la línea de regresión. Método de los mínimos cuadrados 207

7.3 Error estandar de la estimación. Método abreviado 210

7.4 Análisis de correlación. Coeficiente de correlación de Pearson

T 218

a y 223

Blbl iogtllfíll 237

111I•
••
1.1Inttoducción, Población,
La palabra Estadística tiene varias acepciones para cada persona. Así, para un fanático de fútbol, es la
infonnación referente a los juegos jugados 11, juegos ganados lG, juegos empatados lE, juegos perdidos lP,
goles a favor GF, goles en contra GC y puntos P. Para el gerente de una central de energía eléctrica, la
estadística puede ser la infonnación sobre la cantidad de contaminantes que están siendo emitidos hacia la
atmósfera. Para el director de un colegio, es la infonnación acerca del ausentismo, las calificaciones de los
alumnos y los sueldos de los profesores. Para un investigador médico que indague los efectos de un nuevo
medicamento, la estadística es la evidencia del éxito de sus trabajos de investigación. Y para un estudiante
de cualquier nivel, la estadística son las calificaciones logradas en todos los problemas de un curso del
semestre o del año.

Todas estas personas están empleando correctamente el tennino estadística y sin embargo cada una le da un
significado ligeramente diferente y la usa para un propósito un poco distinto. Estadística es un vocablo que
en plural puede designar datos cuantitativos (por ejemplo la producción de frijoles por manzana cultivada)
y en singular puede designar una disciplina (por ejemplo, se dice que un estudiante se puede especializar en
estadística). En nuestros dfas la estadística se ha convertido en .un método efectivo para describir con
exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos o físicos y sirve
como herramienta para relacionar y analizar dichos datos.

La Estadística es la técnica por medio de la cual la ciencia se vale para la recopilación, clasificación,
presentación, análisis e interpretación de datos con el fin de realizar una toma de decisiones más efectiva.

Clasificación de la Estadística

La Estadística se preocupa en gran parte de los promedios o medidas de sucesos pasados, de la variabilidad
de estos procesos y de la probabilidad de ocurrencia de futuros sucesos de acuerdo con los promedios
pasados.

Se divide en:
I
a) Estadística Descriptiva: Que trata de los métodos de organizar, presentar y analizar datos numéricos de
modo que se haga fácil su interpretación.

. b) Estadistica Inferencial: Trata de los métodos de obtener conclusiones probables acerca de una
I

población, basados en una muestra.


1
Supóngase que un profesor calcula la calificación promedio de su clase de Computación. Dado que. la
estadística describe el aprovechamiento de ese grupo pero sin hacer generalizaciones sobre varios grupos,
se puede afirmar que el profesor esta aplicando la Estadística Descriptiva. Las gráficas, tablas y diagramas
que muestran los datos y facilitan su interpretación, son ejemplo de este tipo de estadística. Ahora, el
profesor decide servirse de la calificación promedio lograda por un grupo para estimar el promedio de los
10 grupos que asisten al mismo. El proceso de estimación de la calificación promedio sería un problema de
11
Estadística Inferencial. Sin duda, cualquier conclusión a la que llegue el profesor respecto a los 10 grupos
del curso, se basará en una generalización, la que no será totalmente válida, sino hasta que el profesor 1
1
indique la probabilidad de que sea verdadera. De modo que la ínferencia estadística incluye
y afinnaciones sobre la probabilidad de su

• •Horacio Reyes Núñez


,j
.ii.i.i'iiii.'.•••• .. . .
En el estudio de la estadística, es importante conocer algunos términos básicos, como los siguientes:
Población: Colección de todos los elementos en estudio y sobre los cuales se intenta llegar a conclusiones
Es una parte de la población de interés, que comparten la misma característica, para efectuar un
estudio estadístico.
Dato: Es el valor de la variable asociado a un elemento de la muestra o de la población.
Variable: Característica de interés acerca de cada elemento de una población o de una muestra.

Las variables en estadística pueden ser:

a) Cualitativas
b) Cuantitativas

A las variables cualitativas, también se les llama atributos, ya que son expresadas mediante palabras. A las
partes en que se divide un atributo se le llama

Una variable cualitativa, produce datos cualitativos los que se subdividen en:

a) Datos Nominales
b)Datos

Los Nominales se obtienen cuando se definen las categorías o atributos y se cuenta el número
observaciones o valores que quedan en cada una.

Ejemplos:

1. Sexo: Masculino, femenino

2. Estado Civil: Soltero, casado, viudo, divorciado,


unión libre

3. Película: Ficción, comedia, drama, terror, sexo,


violencia, musical, etc.

4. Area de Estudio: Matemáticas, Letras y Lenguas,


. Ciencias Naturales, Ciencias Sociales, Trabajo
Social, Odontología, Medicina, Ingeniería, etc.

Los Jerarquizados constan de valores relativos para denotar orden: 1°, 2°, 3°,4°, etc.

Ejemplos:
1. Concurso de belleza
2. Campeonatos
Competencias

Las Variables Cuantitativas son las que se expresan mediante valores numéricos; es decir, que sus
resultados son números, peso, estatura, temperatura, etc, se subdividen en:

a) Variables Discretas
b) Variables Contínuas

••
._--------------­

••"
. . . .".",..••••".,.*

Una variable cuantitativa es discreta, cuando sus resultados pueden ser números enteros, por ejemplo:

1. Número de niños nacidos vivos en el Hospital Escuela en el año 2006


2. Número de personas que estudian Administración de Empresas en la Universidad Católica
3. Número de matriculados en Matemática en la Universidad Pedagógica Nacional
4. Número de profesores de la carrera de Pedagogía en la UNAH

Una variable cuantitativa es continua cuando sus resultados pueden ser números enteros o decimales; por
ejemplo:

1. El nivel de combustible de un automovil


2. La estatura de una persona
3. El diametro de un anillo

Una variable cuantitativa produce datos cuantitativos o numéricos y se subdividen en:

a) Datos Discretos b) Datos Contínuos

En la mayoría de los casos, ambas clases pueden distinguirse observando si los datos son el resultado de
contar o de medir. Un conteo siempre produce datos numéricos discretos y una medición por lo general
datos contínuos; por lo tanto, la medición y el conteo es lo único que será necesario tener presente al hablar
de datos numéricos. La edad y el peso de una persona, son ejemplos de variables cuyo dato es continuo y no
discreto. ¿Puede explicarlo?
1

Hay casos en que los datos se obtienen en forma numérica, y sin embargo, son informados y analizados
como atributos. Dos de tales casos son: ­

a) La contaminación atmosférica (aunque se evalúa numéricamente, en los periódicos se les indica


como baja, media, alta)
b) La escala de Richter y las medidas de la intensidad de un terremoto, que por lo general se les asigna
1, 2, 3, ... 10 a la magnitud de dicha intensidad

__ Los datos Discretos, son el resultado de contar número de conceptos y objetos.


Sus resultados solo pueden expresarse como números enteros. _
2. Los datos Contínuos, asumen cualquier _valor dentro de un intervalo continuo.
Para su cuantificación usa un número real.
3. En estadística, la mayoría de las variables tienden a ser tratadas como contínuas.

¿ Qué tipo de datos son los correspondientes a: la placa de un automóvil, si se considera solamente la parte
numérica?, ¿el número de un taxi?, ¿el número de la camiseta de un atleta?, ¿el número de teléfono?, ¿el
número de las aulas de la universidad? Apárentemente esos números corresponden a una variable discreta,
puesto que solo tienen números enteros, sin embargo; tales números sólo sirven como etiquetas o marcas Se r
de identificación. Como puede observarse, la apariencia de los datos, después de que se han anotado, puede de 1
ser engañosa en relación con su tipo. Si no se olvida examinar un dato individual, se tendrá poca dificultad
en distinguir entre datos que son atributos, y datos discretos y contínuos.

Los datos son originados de alguna forma. Los lugares-o sitios de donde se obtienen se llaman Fuente De
Datos, que pueden ser: Un

a) Primaria : Censos, Encuestas

b) Boletines informativos

••

AIi.i . .

Dar otros ejemplos de : Variables continuas


Variables discretas
Datos continuos
Datos discretos

Escribir dentro del un 2 si es Variable Discreta, un 4 si es Variable


Continua y un 5 si es Variable Cualitativa.

Variable
1. (4) * La velocidad de un automóvil en km/h
2. ) * El número de iglesias de Comayagua
3. (2 ) * Los árboles cortados por día en los bosques hondureños
4. ) * El total de tornillos producidos por día en una fábrica
5. (2) * Número de abortos reportados mensualmente en Tegucigalpa
6. ) * El tiempo requerido para realizar un trabajo
7. (5 ) * La religión de un individuo
8. * La raza de un individuo
9. ) * La altura de un tipo experimental de maíz
10. (4) * El período de duración de un bombillo eléctrico
11. * Carreteras en km por clase
12. * Producción agrícola seleccionada
13. ( ) * Longitud de cerrojos producidos por una fábrica
14. * El precio de un artículo
15. * El número de camas en un hospital
16. * El coeficiente intelectual de las personas

Se requiere saber el costo de la educación. Uno de los gastos que hace un estudiante es la compra de libros
de texto. Sea x el costo de todos los libros comprados este semestre por cada estudiante de cierta
universidad. Describir.

17. La L \8. La muestra


e l ;Ilrerencla entre mues tra y pobl"
'- de 12 anos qUIere sauerTa
Un mno aClOn

19. ¿Qué información le daría como respuesta?

Horacio Reyes Núñez• •


. .. ••".i'* :.1
"

,
20. ¿Qué razones le daría sobre el porqué se debe tomar una muestra en vez de estudiar a cada
miembro de la Roblaciqn?J"" .
·.1
Determinar las modalidades en que se dividen las variables:

21. Estado civil:


22. Nivel de escolaridad
23. Nivel
24. Asistencia escolar :
25. TIpo de construcci6n : . I
26. Categoría de una poblaci6n según el tamaño

Un técnico de control de calidad selecciona partes de una línea de_ ensamblaje y anota para cada una de ellas
la siguiente informaci6n: Clasifique las respuestas como 1 =atributo; 2 =dato de variable discreta; 3 =dato
de variable continua. Escribirlos dentro del paréntesis.

) Si una pieza está o no defectuosa


28. El número de identificaci6n de la persona que arm6la pieza
29. (3) El peso de la pieza

Identificar uno de los siguientes casos y escribir dentro del paréntesis: 1= atributo; 2 = variable
discreta; 3 =varible continua

30. (1 ) La resistencia a la ruptura de un determinado tipo de cuerda


31. (2) El color del cabello de los niños que están viendo televisi6n
32. (2) Número de señales de tránsito en poblados con menos de 5000 personas
33. ( I ) Si una llave de lavabo está defectuosa o no
34. Número de preguntas correctas contestadas en un examen de Matemática
35. El tiempo que se necesita para contestar una llamada telef6nica
36. (1 ) El resultado de la encuesta hecha por un grupo de votantes acerca ,lel candidato de su

preferencia

37. El tiempo necesario para que una herida cicatrice cuando se utiliza un nuevo medicamento
38. (2) El nÓInero de llamadas telef6nicas recibidas en un conmutador en 10 minutos
39. La distancia a la que puede llegar un bal6n de fútbol al ser pateada
40 (2) El nÓInero de páginas escritas por minuto en una impresora de alta velocidad 1
41. La clase de árbol utilizado como símbolo navideño e
42. (2) Las marcas de las computadoras que tiene. un laboratorio de cómputo 1
p
a
1. O 1

Siempre que se hace un análisis estadístico, se cuenta con variables ya sean cualitativas o cuantitativas;
como las cualitativas están expresadas alfabéticamente, a cada modalidad se le puede asignar números que
son regidos por ciertas reglas; de esta, manera se está estableciendo una escala de medida para los datos
alfabéticos.
Los datos alfabéticos a los cuales se les asigna escala de medici6n numérica no pueden ser utilizados para
aplicarle algunas operaciones aritméticas; además, existen variables cuantitativas a las que tampoco se les
puede aplicar ciertas operaciones; es por eso que se han establecido 4 niveles de medici6n:

n• •. 'o-o-r e-y-e-s-.
M"·i"'Ijit·i,.-n.,,=.. .

a) Nivel de Medición Nominal


b) Nivel de Medición Ordinal
c) Nivel de Medición por Intervalos
tI) Nivel de Medición de Razón

Nivel Nominal

A este nivel se le considera como el más "primitivo", el más "bajo", o el tipo más limitado de medición.
Este nivel se refiere a los datos que solo pueden contarse colocarse en grupos o categoríaS, a los que con
frecuencia, para su procesamiento se codifican como 1,2,3,.. números que no podrán ser utilizados para
realizar aritmética, sino que solo como medio para identificar a los elementos de las categorías o clases, a
las cuales pertenecen los objetos estudiados. La información presentada en la siguiente tabla representa
s medición nominal:
o

Religión indicada en Pedro Sula


por personas mayores de 14 años
Honduras, Enero 2006

Total 120 959

disposición de las religiones podría haberse modificado. Se podría haber enlistado la Católica como en
10 lugar, la Judía en 20, Y astsucesivamente. Esto indica fundamentalmente que no existe orden particular,
su
para los grupos ni tampoco unidad de medida. En este nivel las categorías son mutuamente excluyentes, lo
por ejemplo, que una persona no podría ser protestante y al mismo tiempo no tener religión;
lto
además tambjén son exhaustivas, lo cual significa que los miembros de la población o muestra deben
aP.arecer necesariamente en una de las categorías. Si una persona se negara a indicar cual 'es su se
le incluiría en la categoría "religión no indicada". se convirtiera al budismo, su religión se incluiría en la
categoría "otra religión". .
En este nivel, los números son utilizados como medios para identificar los elementos de una' categoría; así
por ejemplo las categorías podrían codificarse con 1,2,3,... en donde 1 representa protestante, 2 católico y
así sucesivamente. Lo anterior facilitaría el conteo cuando se utiliza una computadora u otro dispositivo.

'as;
__ - " ! j Los siguientes son atnbfJtos que se miden con una escala o nivel nominal:
profesiones, nivel de organización, raza, religión, partidos políticos, estado
civil, etc.
lara
les

", ".

Nivel Ordinal
••

Este nivel implica que una categoría es mayor que la siguiente. En caso de que puedan detectarse diversos
grados de un atributo o propiedad, la medida ordinal es la indicada, puesto que entonces puede recurrirse a
la propiedad de "orden" de los números asignándolos a los objetos en estudio, de modo que si la cifra
asignada al objeto A es mayor que la de B, puede inferirse que A posée un mayor grado de atributo que B.

En este nivel los números pueden asumir el lugar de los objetos en estudio, puesto que los números son
representaciones parciales de éstos. En la medida ordinal, los números constituyen una especie de resumen
para trasmitir información. Por ejemplo en un concurso de belleza, en lugar de informar que "se juzgó que
Beatriz era la menos bonita, seguida de Juana, María y por último Alicia que fue la más bonita de todas", es
más fácil decir y establecer lo siguiente:

María

La principal diferencia entre un nivel de medición nominal y uno ordinal es la relación "mayor que" entre
las categorías de nivel ordinal. Por otra parte la escala ordinal de medición, tiene las mismas características
que la escala nominal, es decir, las categorías son mutuamente excluyentes y exhaustivas.

__ Los siguientes son atributos que se midén con esta escala o nivel de medición:

estrato socio-económico, jerarquías en el ejército. participación en las

asoCiaciones, posición dentro de la clase, dureza de los minerales, etc.

Nivel por Intervalo

Incluye todas las características de la escala ordinal, pero además específica que la distancia entre números 1
o valores, es la misma. En este caso la unidad de medida se defme en términos de algún parámetro (grado, ,r,
pulgada, centímetro, onza, etc). Una de las características distintivas de la medida de intervalos es que el
cero no necesariamente implica que el objeto carece del atributo en estudio. Por ejemplo, el que el agua este
a O grados centígrados, no quiere decir en absoluto que carezca de temperatura puesto que en una escala de
intervalo el punto cero es puramente arbitrario.

Los números asignados en una escala de intervalo poséen la propiedad de distintividad y orden, y además,
debe tenerse en cuenta que, en este caso, la diferencia entre los números si es signficativa. Por ejemplo, si la
temperatura de hoyes de 60° F Yla de ayer fue de 55° F, sabemos entonces que la temperatura de hoyes de
5° F más alta que la de ayer y si la de mañana va a ser de 70° F, sabremos así mismo que, había más
semejanza entre ayer y hoy que entre hoy y mañana puesto que la diferencia entre 55 y 60 es la mitad de la
que hay entre 60 y 70.

Las medidas de intervalo implican la asignación de números de modo tal que, a iguales diferencias entre
grados del atributo estudiado en un objeto, corresponden iguales diferencias entre los números. El nivel de
medición por intervalo tiene las propiedades de ser mutuamente excluyentes y exhaustivas.

-.Horado Reyes Núñez


Las siguientes son variables que se miden con escala o nivel por intervalo:
peso, edad, temperatura, tiempo, ingresos, coeficiente intelectual, etc.

Nivel por Razon

Es el nivel de medición "más alto". Tiene todas las características del nivel por intervalo, pero además
posée un punto cero significativo y la razón, relación por cociente entre dos números también es
s significativo. Siendo que cero ya no es arbitrario sino un valor absoluto, podemos decir que A tiene dos,
tres, o cuatro veces más la magnitud de la propiedad presente en B.

La estatura y el peso son ilustraciones de este tipo de escala, puesto que una persona que mide 6 pies, es el
doble de alto de un niño que mide solo 3 pies, y dichas escalas poséen denominación puesto que las
razones de los números en las escalas así denominadas tienen un determinado sentido, pudiéndose
interpretar como razones entre las cantidades de objetos medidos. Las magnitudes físicas fundamentales
(espacio, tiempo, masa) son medidas en este nivel.

En la mayoría de las investigaciones educacionales, psicológicas o de ciencias


lS
del comportamiento, las mediciones se efectúan según escalas nominales
..: ..­ ordinales o de intervalo, puesto que hay muy pocas variables de importancia
. que den pié para medirse según escalas de razón y de hecho, el encontrar una
11: escala de intervalo satisfactoria ya es de por si problemático.

;?::nW~t::.::~~:::::.:, . .
. . . .:.:.:.:.: : : : . . :
r::¡:¡::ttti q 1\1
Del N° 1 Si es falsa, anote la respuesta correcta sobre la
os
lo, raya.
el 1. Las gráficas, tablas y diagramas que muestran los datos, son ejemplos de Estadística
ste
de _
2. (V) Una muestra de consumidores probó una nueva hojuela de queso y la clasificó de
.ás, excelente, muy buena, regular o mala. El nivel de medición para esta investigación es
i la de intervalo.
de ----------------------_.:._------- •.. _----------------------------------------------------------------­
l1ás 3. ) Un sindicato de plomeros y colocadores de tubería tiene 5020 agremiados. Se
la seleccionó e interrogó a un grupo representativo de 248 integrantes. Se considera que

_
4. ) Un total de 9386 madres solteras menores de 15 años tuvieron un hijo. El año pasado
I de hubo 6950 muertes accidentales en enero. La mayor trucha pescada en un lago pesó
25 kilogramos. A este conjunto de cifras y datos se le denomina estadística.

o-r-a-c--.¡.---o-----R:-e-y-e-s-. YC
'
•• •

. .
5. (V) Los métodos empleados para saber algo acerca de la pobláción de truchas en el Lago
de Yojoa con base en una muestra de 40 truchas se denomina Estadística Inferencial.

6. () Gallup y otras empresas de sondeos de opinión rara vez emplean métodos de


muestreo porque las poblaciones con las que trabajan son muy grandes.

7. (V) La Cámara de Comercio preguntó a una muestra de personas que se asoleaba en Tela,
si vivían en Tela o en una zona a menos de 30 millas de la playa, si vivían fuera del
departamento, o en un· país extranjero. Este proyecto de investigación se relaciona
con datos de nivel nominal.

8. La Oficina del Censo informó que hay 12955000 trabajadores de producción en la

industria manufacturera. A esta cifra se le denomina valor estadístico.

9. El nivel nominal se considera el "más bajo" nivel de datos y estos deben ser
mutuamente excluyentes. .
,
10. Se seleccionó una muestra de 3014 trabajadores en la industria del acero -para

si irían a la huelga el lunes. Más del 50% de las personas de la muestra

indicaron que lo harían. Puesto que el número muestreado es grande y los que están a

favor la huelga constituyen más del 50%, puede suponerse que la mayoría de los

trabajadores de la industria de acero están a favor de una huelga.

11. Una Cía Comercial de Puerto Cortés pidió a una muestra de 1960 consumidores que probaron un
platillo de,pescado congelado de elaboración reciente por un fabricante, denominado Fish Delight. D« .
los 1960 consumidores consultados 1176 dijeron que probarían el platillo si se pusiera a la venta. ­
a) ¿Qué informará la compañía al fabricante respecto a la aceptación de Fish Delight?
b) ¿Es éste un ejemplo de estadística descriptiva o inferencial?

12. La Dirección de Censos y Estadística de Honduras informó acerca de las poblaciones en los siguientes
lugares.

¿Qué nivel de medición reflejan estos datos? ¿Porqué?


13. La calificación de un examen especial aplicado al personal del ejército interesado. en asistir a la
Escuela para Oficiales son:

¿Qué nivel de medición representan estos datos? .

1m•

li. i.ll d .i.i
.
o de y
Básicamente las técnicas quepenniten organizar los datos son la tabular o cuadros y la gráfica. La primera
es una de las fonnas mas sencillas, se hace mediante tablas o cuadros. Generalmente se colocan los valores
en orden ascendentes o descendente de magnitud, lo que ofrece las siguientes ventajas:

1. Se pueden descubrir rápidamente los valores máximos y mínimos.


2. Se pueden dividir facilmente los datos, secciones.
3. Se puede dar cuenta si algunos valores aparecen repetidos más de una vez en el arreglo.
4. Se puede observar la distancia entre valores consecutivos de la tabla o cuadro.

de o
a) Título
b) Encabezado y Subencabezado
c) Concepto o columna matriz
ti) Cuerpo
e) Nota preliminar
f) Nota de
g) Fuente de

Las cuatro primeras y la última, son básicas y deben ser siempre incluidas en cualesquier tabla o cuadro
estadístico. Las partes restantes, no son relevantes y pueden no estar presentes.


La figura de la izquierda corresponde al esquema de un cuadro o tabla, que pennite" observar la ubicación de
cada unade las partes del mismo; la de la derecha es otro esquema que también se utiliza; en ella se puede
observar, que la parte superior de la primera columna se subdivide mediante una diagonal,compartiendo una
parte con "Encabezado· y la otra con "Matriz". El siguiente cuadro muestra lo antes descrito

Notarle pié Nota de pié


Fuente de datos Fuente de datos
a) Título

El título es una descripción del contenido del cuadro. Un título completo usualmente indica:
_ Lo que son los datos incluidos en el cuerpo del cuadra
_ Dónde está el área representada por los datos
Cómo están clasificados los datos

Cuándo ocurrieron los datos

b) El

El encabezado es el título de la parte superior de una columna o columnas. Los cuadros mas simples

..........N u..,.·
.m
z• •
i
¡

.. .
pueden consistir solamente de dos columnas y dos encabezados: uno para los conceptos y otro para los
datos. Sin embargo, muchas cuadros tienen más de dos encabezados y columnas y algunas veces tienen
encabezados principales y sub-encabezados.
¡

c) Concepto o Columna Matriz:

Las descripciones en filas del cuadro, son llamados conceptos o columna matriz. Los conceptos son
colocados alIado izquierdo del cuadro. Usualmente representan las clasificaciones de las cifras incluidas ,
dentro del cuerpo del cuadro. La naturaleza de ellas, es indicada por los encabezados de la columna,
;
incluyendo la columna matriz. ..

d) Cuerpo:

El cuerpo es el contenido de los datos estadísticos. Estos datos son arreglados de acuerdo con las
descripciones o clasificados de los encabezados y conceptos por lo tanto, la presentación efectiva de los
datos del cuadro depende de los arreglos de las filas y columnas.

e) Nota Preliminar

Las notas preliminares o notas del encabezado son usualmente escritas justamente arriba de los
encabezados y debajo del título. Son usadas para explicar ciertos puntos relacionados con el cuadro
completo que no han sido incluidos en el título ni en los conceptos.

t) Nota de Pié:

Las notas de pié son usualmente colocadas debajo de los conceptos. Son usadas para clarificar algunas de
las partes incluidas en el cuadro que no son explicadas en otras partes del mismo.

g) Fuente de Datos

La fuente de los datos se escribe debajo de las notas de pié. Si los datos fueron recopilados y representados
por la misma persona, no es necesario establecer la fuente en la tabla, ya que éstas se mencionan en la
explicación del cuadro. Si los datos fueron tomados de otras fuentes, estas deberán ser declarados en el
cuadro, u obtener información adicional de la fuente original, si es necesario y dará propio crédito o
responsabilidad al recopilador original de-los datos.

Cada uno de los siguientes cuadros,..muestran todas las partes del mismo tanto las que son partes básicas,
como las que pueden faltar sin que por ello la información se altere; además, también muestran las
categorias correspondientes en estudio.

Ejemplos:
Distribuci6n de Personas por Actividad
Matricula según sector de
Económica. Honduras 2005
Educación Media Honduras

(En miles de personas)


(En mües de personas)

.•' 1824.2
Mineria . ­ 143.8
Industria
Construcción ..

Período Investigación: 01/01 al 01/12 2005

Fuente: B.C.H. Honduras-Cifras 2004-2006


Fuente: B.C.H. Honduras-Cifras 2004-2006
CuadroN°l
Cuadro N° 2

m•
••
QU.i.' i
. .

Agudeza Visual en Televidentes Grado Académico del Personm


y No Televidentes Docente Universitario
Tegucigalpa, Honduras, CA. 2006

Período de Investigación: 10-03 al 10-09 2006


Período de Oct-Nov 2006

Fuente: IHSS. BoletÚl Informativo Dic. 2006


Censo de Población Universitaria Honduras 2006

Cuadro N° 3
CuadroN°4

s
o

1. Los cuadros N° 1 Y N°2 muestran distribuciones en las que solo se


consideran la categoría y la frecuencia correspondiente. Generalmente se les
le
conoce con el nombre de o tablas de una entrada.
2. Los Cuadros N°3 y N°4 son llamados de doble entrada. Esta identificación
se basa en el hecho de que tienen por lo menos 2 filas o hileras y por lo
menos 2 columnas.
)s 3. La y la columna de total no se consideran como parte del cuadro y no
la cuentan como tales para identificar la dimensión del mismo. El cuadro N°3
el es de dimensión 2 x 2 (2 fIlas, 2 columnas) y el cuadro N°4, es de dimensión
o
3 x 5 (3 fIlas, 5 columnas). Desde luego, puede haber cuadros de dimensión
2 x 3, 4 x 3,3 x 2 u otras dimensiones.
15, 4. En el cuadro N°3, las cantidades (3473,2483) de la fIla total y las cantidades
.as (3439,2517) de la columna total, son llamados totales marginales y el
número (5 956) de la última casilla derecha, se le llama gran total.
¿Cuáles son los valores de los totales marginales y del gran total en cuadro

. :'. •0.:.::.:•
..;
1. Identificar cada una de las partes de un cuadro.
2. Interpretar el significado de cada número en cada cuadro tanto en el cuerpo
del cuadro como en los totales marginales.
3. Presentar cuadros que tengan un esquema semejante al cuadro de la
derecha de la página 11 anterior
4. Ampliar el cuadro N° 4 a las Universidades nuevas de Tegucigalpa que no
aparecen en él, haciendo un estimado de docentes con el grado académico
correspondiente

H
.m
-ez• •
.. • • •MiR

Compara el número de casos de una categoría dada (f) con el número total de casos
en la distribución:

f= frecuencia de una categoría


N= total de casos
(1) p= Proporción

Ejemplo:
En una clase hay 40 estudiantes, 10 de los cuales son hombres. ¿Cuál es la
proporción de mujeres?

Solución:

40 - 10 = 30 Total de mujeres

P = =0.75 de mujeres ... Resp.

Es la frecuencia de ocurrencia de una categoría por cada 100 casos. Indica que una

proporción está expresada en un tanto por ciento (%) del total.

. .
(2)

Se
a)
El problema anterior se expresa en porcentaje así:

p = (100%)= 75 %
El 75% de son mujeres ... Resp.

Compara el número de casos de una categoría (fl ) con los de otra (f2), generalmente

expresada por cada 100 o por cada 1 000 b)

e)
(3.1)
(3)

Ejemplo: .
En la clase de MAE - 200 hay 45 mujeres y 25 hombres. a) ¿Cuál es la razón de
hombres a mujeres?, b) ¿Cuántas mujeres habrán por cada 1000 hombres?,
c) ¿Cuántos hombres habrán por cada 1000 mujeres

m•

Q'i.i·¡'di'.i'.'d"" .
~. . ~, ~

Solución:
=
a) f l Frecuencia de hombres 25 = =
b) f l Frecuencia de mujeres = 45
f2 = Frecuencia de mujeres = 45 f2 = Frecuencia de hombres = 25

R= ~I c(100) R= JL( 1000)


2 f
2

R= ¡~ (100) = 55.5 ~ 56 R = 45
25 (1000) = 1 800

Significado: Por cada 100 mujeres Significado: Por cada 1000 hombres
hay 56 hombres Resp.
oo. habrán 1 800 mujeres ... Resp.

c) f l =Frecuencia de hombres =25


f 2 = Frecuencia de mujeres 45

R=. JL
=
'~laClase
f (1000)
2
25 .
R= 45 (1000) =555.6 ~556 Que el profesor indique la fonna de cómo el
alumno debe utilizar cada uno de los 4
Significado: Por cada 1 000 mujeres cuadros anteriores para calcular:
>. habrán 556 hombres oo. Resp. proporciones, porcentajes y razones.

a Ejemplo 1:
En el cuadro N°2 calcular a) La proporción de Bachilleres en 2005; b) El porcentaje de nonnalistas en
. 2006; c) ¿La razón y su significado de matriculados en el ciclo común en 2006 a matriculados en
aI:tística en 20051; d) ¿Cuántos matriculados en Ciclo Común hay por cada 1000 matriculados en
Bachillerato en el 20061..
Solución:
a) N = 1 208.1+328.7+120.9+110.4 = 1 768.1 miles ... Calculando N para 2005
N= 1211.5+433.0+121.3+110.5 1876.3 miles = ... Oilculando N para 2006
=
f 328.7 miles de personas ... Frecuencia de Bachilleres en 2005

;p. "p- _f__ 328.7


- N - 1 768.1
º$s. -o. 185'9
es - ... Proporción de Bachilleres en 2005 .ooResp.

b) p=+ (100%) Ill.h~l:f¡f:s(1oo%) = 6.46% OO' El 6.46% son nonnalistas en el 2006..,.Resp.

c) R = ;~ (100) ... Fónnula de la razón (3)


f l = 1 211.5 miles ... Matriculados en el ciclo común en 2006
f2 = 1.10.4 miles ... Matriculados en artística en 2005

R = \~~~l .'e~s (100) = 1 097.37~ 1098 OO. Sustituyendo y operando en la fómula (3)

de Significado: Por cada 100 moJriculados en


~s?, Artística en el 2005, habrán 1 098
matriculados en el Cklo Común en el 2006 ... Resp.

i ".16
"H;-o-'r-a-c-'i'-o---¡¡R·e-'-y-::-::Ce-=s'--"Nr:'ú<'n;<~
-=e-=z• •
1
L_ i-·-~'('})·:·-"3r'~*-
: '
'mwiéirie
.
. .
. ) "MiR
d) f l = Frecuencia de matriculados en el Ciclo Común en el 2006 = 1 211.5 miles
f z = Frecuencia de matriculados en Bachillerato en el 2006 = 433.0 miles

R= (1000) '" Fórmula (3.10) de la razón

R = 1 211.5 . es (1000) = 2772 2773 ... Sustituyendo y operando en la fórmula


433 es .
(3.1)

Significado: Por cada 1 000 estudiantes

matriculados en Bachülerato en el 2006 hay

2 773 lTlalrkulados en el Ciclo Común en el

mismo año ... Resp.

1.EI resultado de la razón deberá darse siempre como un número entero.


2.Tanto la proporción como el porcentaje y la razón se pueden calcular con
datos del cuerpo del cuadro, o con datos de los totales marginales o con la
combinación de ellos.

Ejemplo 2.
En el cuadro N°4, calcular: a) El % de catedráticos universitarios con grado de Maestría, b) El % de
catedráticos con doctorado de la U.P.N. con respecto a supersona1 docente, c) ¿Cuántos catedráticos
con grado de Licenciatura hay UNITEC por cada 100 con título de Maestría de la U.l.C.V.? d)
¿Cuántos catedráticos con Doctorado hay en la U. CAT por cada 100 Licenciados de la U.N.A.H.?

Solución:
a) p= (100%) = 0J7(100%) =42.71% ... Explique lo que se hizo
42.71% : de "Master" ... Resp.

b) P = (100%) = (100%) = 20.00% ... Explique lo que se hizo


20.00%: Porcento.je de "Doctor" en U.P.N. ... Resp.

c) R = (100) = (100) = 113 ... Explique lo que se hizo


113: Son "Licenciados" UNITEC por cada 100 "Master" en U¡CV ... Resp.
S
d) R = (100) = (100) =55 ... Explique lo que se hizo
55 : Son "Doctores" en la U. CATporcada100 "Licenciados" en UNAH ... Resp

y
La calculadora científica no programable CASIO fx-82MS o cualesquiera de la misma familia, es la que se
utilizará en este curso de Estadística Aplicada. Una razón para ello, es el bajo costo de adquisición y otra,
es que es muy completa.

•• N"7:ú-,..ñ~ec-:::.z ~'
.••d JWdii 4.
En esta calculadora la pantalla tiene una presentación de dos líneas lo que hace posible la visualización de
la fórmula de cálculo y su resultado al mismo tiempo.
En este momento se usará la tecla • para hacer cálculos de potenciación y radicación. La primera se

identifica con la tecla cuyo símbolo de color blanco está sobre la tecla y se acciona con pulsarla
directamente. La segunda que es la radicación se identifica con • y está sobre el cuerpo de la calculadora
en color amarillo y para accionarla primero debe pulsarse la tecla gris • y después para activar la
radicación.

Ejemplo: Calcular el valor de P y/o R en las siguientes operaciones

1. P = (1+0.0432)8

Solución:

1 0.0432. ... Aplicando este algoritmo utilizando las


teclas de los paréntesis para hacer de una
sola vez la operación.
... Valor desplegado en la pantalla
P= 1.402621937 Resp.
•.•
Otra forma de ejecutar esta operación, es de hacerla por pasos y no utilizar las teclas de los paréntesis así:

de ... Ejecutando primero la operación dentro


1 0.0432.
os de los
d)
º:~ª'ª:[ 8 ... Con este valor en pantalla pulsar la tecla
de
... Valor desplegado en la pantalla
1.402621937 ... Resp.
sp.

Cualesquiera que sea el método seleccionado se le recomienda al usuario practicar con operaciones
;sp.
similares a [m de adquirir destreza en el uso de su calcuradora y especificamente en la potenciación
y radicación

2. =:! 4320 I
3840
Solución:
Shift
5 38400 ... Presionando primero el índice (5) de la
raíz, después la teclalShift" para activar
.esp
la radicación. En la pantalla aparece
5 y se sigue el algoritmo de la
izquierda utilizando los paréntesis y
los demás
le se 1 ... Valor desplegado en la pantalla
otra,
R 1.023836256 ... Resp.

o---..R·e'""y-,-e,,-s--.N"'u:>é·
.m
••
~
. . • •QJiH

5480 1_ 1
4750 i;

SoluciÓn:

8 5 480 4750 • l . ... Utilizando el algoritmo de la radicación

mostrado a la izquierda, los parentesis y

demás datos

o •• Valor desplegado en la pantalla


R = 0.018030685 ... Resp.
Sbift
__ 1. Se reconocerá que la calculadora está en modo. o segunda función cuando

la parte superior izquierda de la pantalla aparece el ícono


2. La tecla sirve para borrar el último dígito de un número de derecha a
izquierda cuando se ha cometido un error. Si desea borrar toda la
dígito po,r debe de consecutivamente la tecla en mención
3. La tecla '," con la marca • le permite desplazarse de derecha a
izquierda hasta la posición donde se ha digitado 'mal un número; en esa
posición el cursor y el número titilan cuando se digita el número correcto
ambos dejan de titilar. Esta tecla no borra la cantidad ni el número digitado.
Con la marca se recorre la cantidad marcada de izquierda a derecha
hasta la primera posición del número. Esta tecla no borra la cantidad ni el
número digitado. En la parte estadística se le explicarán otras funciones de S
esta tecla.
4. Si su calculadora no responde correctamenta a los algoritmos de la 1
potenciación y radicación aquí explicados, consulte con su profesor ,y/o el t
manual del usuario de su calculadora. n
F

T de Promedio t.
Tasa: Indica una frecuencia relativa con que un hecho o suceso se presenta dentro de un conjunto dado, en

un determinado período de tiempo y expresa una probabilidad por 1000 u otro múltiplo de 10.

Se supone que la población un comportamiento de .tipo exponencial, dado por la fórmula (7).

donde:
t = Tasa crecimiento promedio anual La fórmula (7) se emplea para estimar
Pf = Población final proyección de poblaciones
Pi = Población inicial Eje:
n = Tiempo en años entre Pe YPi

• • H"o=-=r=-=aC-:c"'i-=o-R"'--=e-=-=y=-=e=-=s'-N'-'-:>Ií""ñ'---e=-=z
m".I·"""·,,.- 'n", ~ .
Si de la ecuación anterior se despeja la variable t, que representa la Tasa de Crecimiento Promedio Anual,
se tiene:

= (1+t)n
1

.
....
1.··.·.··.··.··-1 · (8)
_ . ' .
' ... ¿Qué se hizo?

- t.":."
Esta fórmula (8) se utiliza para estimar la tasa de_ cambio promedio anual. Pe Y Pi son datos históricos
dados en el problema. .
Ejemplo 1:
Con los datos del cuadro de abajo calcular a partir de 1992, la población de esa ciudad para 1998,

Solución:
Pe =? Pi = P92 = 4,604.8 (miles de personas) ... Datos del problema
t =1.03%= =0.0103 ... la tasa como decimal
n = 6 (años entre 1998 y 1992) ... (1998 - 1992 = 6)
P98 = P92 (1+t)n ... Empleando la fórmula (7) Sustituyendo y
operando. Usando la calculadora científica,
= 4 604.8(1+0.0103)6 y truncando el resultado a las décimas
= 4 604.8(1.0103)6 = 4604.8 (1.0634125)
= 4 896.8 (miles de personas) oo. Resp.

Este problema también se puede resolver con la calculadora utilizando el algoritmo de la potenciación así:
P98 = 4604.8 (1+0.0103)6 oo. Sustituyendo valores en la fórmula (7).

4604.8. 1 0.0103 • Utilizando calculadora con el


algoritmo de la potenciación.

oo. Valor desplegado en la pantalla


P98 = 4896.8 miles de personas 'oo Resp.
lar

Ejemplo 2.
Con los mismos datos, proyectar la población de esa ciudad para el año 2008 considerando las
poblaciones de 1990 y 1993.
i
j

ú-::ñ.-e-z-:• •

.
.
. . •• ,,'uiR
Solución:
t =? P f = P93 = 4 700.3 (miles de personas) ... Datos del problema. Se desconoce el
n = 3 (años entre 1990 y 1993) valor de la Tasa de Cambio Promedio
Anual (t)
Pi = P90 =4313.4 miles de personas

Calculando el valor de t con la fórmula


(8) y operando con la calculadora

I
t=

= (1.029047167) - 1
t = 0.029047167

Este valor para 1 también se puede calcular utilizando la calculadora y el algoritmo de la radicación así:

_ 700.3 1_1 Sustituyendo valores en la fórmula (8)


t - 4313.4 para calcular la taza de cambio
promedio anual (l).
Sbift
3 4700.3114313.4 A.plicando el algoritmo de la radicación
para calcular el valor de (/) de una sola
vez.
Valor desplegado en la pantalla

t =0.029047166 Valor de (/)

15 Proyectando la población para el año


P 2008 = P93 (l +0.029047 167)
2008, a partir de 1993, donde n 15
(2008 - 1993 = 15).
= 4700.3 (1.029047167)15 Sustituyendo y operando con la

= 4700.3 (1.536488169) = 7221.9 calculadora científica

. ¡
= 7221.9 (miles de personas) oo' Truncando a décimas el resultado.
P 2OO8 = 7 221.9 (miles de personas) ... Resp.

Esta parte del problema puede resolverse con la calculadora utilizando el algoritmo de la potenciación asi:
P 2008 = 4700.3 (l +0.029047166)15 Sustituyendo valores en la fórmula (7)

4700.3 ;111 iD 0.0290471668 158 Utilizando la calculadora con el algoritmo

de la potenciación

1 Valor desplegado en pantalla I

P 2008 = 7 221.9 miles de personas oo, Resp.

Reyes Núñez
__
mil,I.'IC.'.'.•'
l. El valor de la Tasa de Cambio Promedio Anual (t) siempre debe expresarse
48
. .
como decimal, al momento de proyectar la población.
2. El valor de t debe tener todas las cifras posibles de la pantalla de su
calculadora, lo que permitirá una proyección más aproximada.
3. En el ejemplo 2, la proyección bien pudo hacerse a partir de 1990 y el
resultado debe ser el mismo. Para la proyección, se selecciona el año que se
desée y qu.e esté dado en el problema. i i i co.mpruébelo haciendo la
a proyeccion desde 1990!!!
4. El resultado final de una proyección puede expresarse con la aproximación
que se desee. En los ejemplos anteriores los resultados se han dado
truncados a las décimas.

8) Elaborar un cuadro
·io 1. Se entrevistaron muestras aleatorias de hombres para determinar si fumaban cigarrillos o no.
Se encontró que de 29 hombres, 15 eran fumadores y que de 30 mujeres, 20 eran fumadoras.
2. En 2006 los graduados de la UNAR fueron 1979 de los cuales 1176 eran hombres. En el área Físico­
ón
Matemática se graduaron 323 hombres y 225 mujeres; en el área Económica-Administrativa 280
Jla
fueron hombres y 193 mujeres; en el área de Ciencias BiológiCas y de la Salud fueron 273 hombres y
180 mujeres y en área de Ciencias SoCiales 300 fueron hombres y 205 mujeres. Los datos fueron
proporcionados por la Sección de Estadística de laUNAR, en ese mismo año.
El período de investigación fue del 25 al 29 de noviembre de 2006. Completar el cuadro con los
'. totales marginales y el gran total.

Distribución de la Población Total En la distribución de la izquierda completar el


la por área de Residencia Honduras 2003·2005 cuadro y calcular:
(En miles de Personas) 3. La distribución porcentual para cada año
4. La razón y su significado de la población
urbana a la rural por año, por cada 100 y cada
1000.
5. La tasa de cambio promedio anual para cada
tipo de población de 2003 - 2005.
6. Proyectar la población rural para el año 2012
tomando como base la' población de 2003,
usando la tasa calculada en el problema anterior.
Fuentes: RC.H. Honduras en Cifras 7. Proyectar la población urbana para el año 2015
2003 - 2005 tomando como base la población 2003 y
itmo después la de 2005. ¿Cómo son ambos
resultados? Usar la tasa calculada en el
problema N° 5.
;
i

·.m
::"'z• •
~
. . •• ".i&
Matriculo. Universitaria de UPN En distribución de izquierda, calcular:
por modalidad de estudio. 2° y 3° período
Honduras 2003 ·2005 8.La tasa de cambio promedio anual para los

alumnos de 2° Período Presencial y proyectar

esta población para el año 2015, tomando como

base la población del 2005.

9.Lo mismo que en el problema N° 8. para 3°


Período de Distancia.
1O.La tasa de cambio promedio anual de toda la
población de la UPN del 2003 - 2005 y
. :::
.".. :.:. :.'. . . proyectar esta población para el año 2020,
tomando como base la población del 2004.

Fuente: Estadísticas 2003 - 2005 UPN


Utilizar la calculadora comprobar los
los problemas númeroS, 6, 7,8,9 Y 10
A partir del cuadro siguiente, completar y calcular:

11. La razón y su significado de matriculadoll en Ciencias Naturales en el 2002, a la de Ciencias


Sociales en el 2004 por cada 100 y por cada 1 000.
12. La razón y su significado de matriculados en Matemática en el 2002, a la de Orientación en el 2005
por cada 100 y por cada 1 000.
13. La razón y su significado de matriculados en Educación Física en el 2003, a la de Educación
Técnica Industrial en mismo año por cada 100 y por cada 1 000.
14. ¿Cuántos matriculados hubieron en Ciencias Comerciales en el 2003 por cada 100 de Educación
Especial en e12004? ¿por cada 1 000? .
15. ¿Cuántos matriculados hubieron en la Facultad de Humanidades en el 2002, por cada 100 de la
Facultad de Ciencia/y Tecnología en 2005? ¿ y por cada 1 OOO?

Universidad Pedagogica Nacional "Francisco Morazán"


/ Honduras C.A.
Matrícula por Facuüad y Ca"era 2002 - 2005 11

11

2(

por
Un
(pu

CONTINUA PAGINA SIGUIENTE.._

m•
•• ú ñ--:e-z
I iiiii.i.i"iii.i,w-d.dM1Cf,
. .
...VIENE DE LA PAGINA ANTERIOR

.•. ,••. • .• •
··· ·.•

•.••••.. . . ••.••>< .....<>.,....\\


.•.•.•i.e. ·. .•.
s
....
.•·:. •
. • . •. •. .
s.· ·. •. •. •. . .:0 ~..:·•,. s:
.• ••. .•. .•.•••.· · •. •· :
.. ·5·.
. • •0•.· • : ... .• ·........>CI¡
•••

.'.
. ·.:,•·. ·.•·,•,7•. •. .• •. .• . : :· :
·H·.

los •.• . •.·.• .•.• e:·.:··.·..• •.· : •.


•. . . . .• . ·:··e•. .:·._:. E. •.c.•·.•s u.:.ti
.• . •. ·.• t·: ..:.... •. .•·.·::
-lO E ca o

s .
. '

5
. ....
n .• t.• ...•. .• •. :.• .• . •. •.¡ :
" . ... ': ..:.:::: ·:0 ·" ,:".
::.- .., :..' ..: :.. .. ,":",
.... · :.

'.'
la

Fuente: Estadísticas U.P.N. 2002 - 2005

Calcular y escribir dentro del cuadro lo siguiente:


16. Los totales marginales de matriculados por año en cada Facultad
17. Los porcentajes de matriculados por cada año por carrera para cada Facultad
18. totales marginales de matriculados en la cada año
19. El porcentaje de matriculados por carrera en la Facultad de Ciencia y Tecnología en el año 2003

tomando como base la matrícula de ese año en dicha Facultad

20. El porcentaje de matriculados por carrera en la Facultad de Humanidades en el año 2005 tomando

como base la matricula total de ese año.

1.5
Para lograr una mayor comprensión números arreglados en forma tabular, utilizamos los gráficos
que nos destacan algunos hechos claramente. Un gráfico para ser de utilidad real, debe ser simple y
poner mayor énfasis en los rasgos significativos de los datos.
Un gráfico estadístico es la representación de un fenómeno estadístico por medio de figuras geométricas
(puntos, líneas, rectángulos, círculos, etc.) cuyas dimensiones son proporcionales a la magnitud los
datos presentados. Entre estos gráficos se tienen el de barras simples, el de barras el
.el de líneas, el de barras compuesto o de barras seccionadas. . l
TE... de barras bidireccionales, mapas, pictograma.

Horacio ••
di•
. .
..

1. Diagrama de Barras Simples


..
11
El diagrama de barras simples es apropiado para mostrar una sola serie a través de un intervalo de tiempo.
En este tipo de gráfico se trata de construir barras paralelas colocadas en fonna horizontal o vertical, que
nos permitan efectuar comparaciones.entre aspectos más o menos similares.
El método para la construcción de un gráfico de barras, es sencillo y para ello se deben tener en cuenta lo
siguiente:

a) La linea base: Todas las barras o rectángulos deben partir de una línea horizontal llamada linea base,

para poder establecer comparaciones entre los mismos, por una simple y rápida inspección.

b) El ancho de las barras: Todas las barras o rectángulos de un gráfico tendrán el mismo ancho, siendo

éste arbitrario. El ancho de cada barra generalmente depende del número de datos a representar con

relación al espacio disponible para la construcción del gráfico.

c) Separacion entre barras: El espacio entre barras o rectángulos, no debe ser menor que la mitad del

ancho de una barra, ni mayor que el ancho la misma, teniendo siempre la misma distancia.

Algunos autores usan como espacio de separación entre barras, la mitad del ancho de la barra.

Producción de Café
Ejemplo. Honduras 1990 -1994
s
de Café a.
Honduras 1990 -1994
(Millones de sacos) c)

rr
1990 e)
1991
1992
1993 30
1994 48
Fuente de Información:

Banco Central de Honduras

Solución:

a) Trazar la línea de base y sobre ella la escala años (divisiones iguales)

b) En la vertical usar escala apropiada para representar la producción en millones de sacos (divisiones
iguales: I divo = 10 millones de sacos)
c) Dibujar el diagrama de barras correspondiente.

Diagrama de Barras Comparativo

En este tipo de gráficas, se presentan dos o más indicadores que corresponde a una unidad del sujeto, esto
es, dos o más variables correspondientes a un dato identificativo.
Para el gráfico de barras comparativo se utiliza una escala que partiendo de la linea de base tenga la
amplitud necesaria para representar los datos de la investigación.
m •
• • H'-;-o-r-a-c....¡
.
-.:.. - .
I mil.I .I '.'.".- . .
Como cada unidad del sujeto corresponde a más de un indicador, las barras que las representan están
yuxtapuestas, separando cada dato identificativo de acuerdo con las normas expuestas para la separación
,. entre barras, esto es, que el espacio entre grupo no debe ser menor que la mitad del ancho de la barra, ni
mayor que el ancho de la misma, pero manteniéndose la separación una vez determinada. '
e
Los rectángulos o barras representativas se distinguirán unos de otros por los diferentes rayados o
sombreados. Este gráfico se utiliza para establecer comparaciones tanto entre los valores absolutos como
o
relativos.
'Ejemplo.
Carreteras en Km. Por
Honduras 1995 -1997

lo

fel
ia. ,.
Fuente de lnfonnación: Banco Central de Honduras

Se desea construir un diagrama de barras comparativas para los tres años.

Solución:
a) Trazar divisiones iguales en la recta vertical, por ejemplo: 1 divo es igual a 1,000 kms.
b) Trazar la linea base, la horizontal para colocar en ella los períodos-años
c) Hacer el diagrama para los tres años tomando los datos del cuadro de arriba
d) Efectuar el rayado y/o sombreado para cada tipo de carretera en el mismo año y usar ese mismo
rayado y/o sombreado para los períodos restantes.
e) Especificar el indicador. (Véase el gráfico de barras comparativas de abajo).

Carreteras en Km. Por Clase


Honduras 1995 -1997

iones

1000

1995 1996 1997 Años

, esto Pavimentadas

ga la Transitables en todo tiempo


Transitables en verano

I
.r
• :.;;"""'"",.,,,.,,.,,,
'. ..
3. Diagrama de Barras Compuesto o de Barras Seccionadas

Este diagrama es muy similar al diagrama barras comparativas, su diferenciaestaba en el hecho de que
las barras se superponen para un mismo período de tiempo. Representan en una sola figura geométrica,
datos cuyos conjuntos forman un todo definido. También pueden representar la relación porcentual de cada
una de las partes, en base al 100% que forma la totalidad de ellos.

Ejemplo:

Una cadena de tiendas de descuento está organizada en tres grupos para ventas y compras. Cada grupo
está dirigido por un gerente general. El cambio en ventas totales para los años de 1987, 1988 Y 1989 Y
el «ambio para cada grupo en relaci6n con el total se ha de representar en una gráfica o diagrama de
barras compuestos o de barras seccionadas.

Las ventas de cada grupo son:

Ventas

(en millones de lempiras)

*,
Construir un diagrama de barras compuesto para la información anterior:

*1
Solución:
a) Trazar un sistema de ejes cartesiano con escala apropiada y al gusto del investigador.
b)Dibujar las barras superpuestas de acuerdo con la escala y el valor dado en el cuadro, para cada año.
c)Trazar el diagrama con su respectivo indicador, tal como a aparece a

Lo
Diagrama de Barras Compuesto o de Barras Seccionadas dis
Ventas de la 'ase

Ropa

Medicina y artículos domésticos


Autom6viles y artículos deportivos

.,

Para
miSI
mét<
¿ Qué conclusiones se pueden obtener ? decr·

1987 1988 1989 Años


• • Horacio Reyes Núñez
I mii ..... . .
4. DÚlgrama de Barras Bidireccionales

A una gráfica bidireccional, se le denomina también de dos direcciones, de dos sentidos o bilateral. Una
gráfica bidireccional puede utilizarse para mostrar pérdidas y ganancias, actividades por encima y por
.a debajo de lo normal, y cambios porcentuales de un período a Para ilustrar esto, supóngase que las
ventas de aparatos electrónicos de casetes, tocadiscos compactos, etc., en un establecimiento durante los
primeros seis meses de 1998 se han de comparar con las de los primeros seis meses de 1999. En este
problema el objetivo es mostrar los cambios porcentuales en ventas, no el cambio en cantidades de dinero.
Los datos de las ventas (en Lempiras) son:

'Y
de Ventas los Cambio porcentual de
primeros seis mes 1998 ­ 1999

L. :.•.. .. ..:.•..•. .•. .•. .. .•. '.•. .• .•... · ·.::.;. .

. :.:.:. .:.:. . :. "

l
.,.-.-:",:-:.:.:.:.".:.:.:.:.:.:.:.:-:::::::.:.:.:.:,",",

* Obsérvese que las ventas de aparatos electrónicos disminuyeron 25% de 1998 a 1999
V99- V98 (3000-4000) x 100% =-0.25 x 100% =-25%
V98 4000
* Las ventas de tocadiscos compactos durante el mismo período aumentaron 50%

V99- V98 (1500-1000) x 100% =O 50 x 100% =50%


V98 1000 .

Los cambios porcentuales se dividen en dos grupos. Por lo general los incrementos porcentuales se
disponen en orden descendente, y por común los decrementos porcentuales se disponen en orden
ascendentes.

Para elaborar una gráfica de barras bidireccional, los cambios porcentuales por lo general se grafican en el
mismo orden ascendente o descendente (diagrama siguiente). La línea central es el origen de cada barra. El
método mas común consiste en graficar los incrementos porcentuales' a la derecha del origen y los
decrementos porcentuales a la izquierda, según se ilustra
¡

I •z~•
. . ,;,¡.'I"'C'ir.'.JJD!CD'C'
Diagrama de Barras Bidireccional de Cambios Porcentuales

-100 -50 -25 O 25 50 75 100

Cambio Porcentual (%)

El siguiente ejemplo muestra un diagrama bidireccional de la pirámide de edades que distingue entre la

supervivencia de hombres y mujeres. La variable independiente es la cantidad de personas vivas de un

grupo de edades. Se aprecia muy claramente la diferencia entre hombres y mujeres

Diagrama bidireccional de la pirámides de edades


Olanchito, Yoro,2006

PIRAMIDE DE EDADES

100 +

90 - 94

80 - 84
Varones . ~.
--------.,_._- .....
70 -74 - -----
------------._­
60 - 64 ----------

50 - 54

40 -44

30 - 34

20 -24 Ej
10 - 14

0-4

2000 1500 1000 500 o 500 1000 1500 2000

Personas

¿Cuántas mujeres hay aproximadamente entre 25 y 39 años?, ¿entre 40 y 44 años?, ¿ entre 71 y 79 años?
¿Cuántos hombres hay aproximadamente entre 55 y 59 años?, ¿entre 30 y 34 años?, ¿ entre 11 y 29 años?

m
••

• 5. Diagrama de Líneas
. .

El diagrama de líneas es ideal para representar tendencias de ventas, importaciones, precios, y otras series
de valores durante un cierto período.

Este diagrama, es un gráfico en el que se emplea un sistema de ejes cartesianos y puntos en el plano para
representar un fenómeno estadístico. Los puntos del plano que identifican las magnitudes que
intervienen, se unen con segmentos de rectas teniendo el cuidado de que siempre debe quedar un punto
sobre el eje YY'para "amarrar" la gráfica para que no dé la impresión que "esta flotando en el aire".

Se suelen usar los indicadores para identificar las magnitudes representadas en la gráfica, especialmente
cuando se analizan más de una.

Ejemplo 1

la La tabla siguiente muestra el número de quintales de trigo y maíz que Honduras cosechó durante el

In decenio de 1989 a 1999. Utilizar estos datos para elaborar un diagrama o gráfICO de l{neas de

ambos productos.

Producción de trigo y maíz Gráfico de producción de trigo y ma{z

Honduras 1989-1999 Honduras 1989-1999

(Miles de. Quintales) Indicadores:


-Trigo
250

150

100

50

o
1989 1991 1993 1995 1997 1999

1990 1992 1994 1996 1998

Años
Ingreso Compañía Monsato
600 1993 -1999
Ejemplo 2.
El siguiente diagrama de líneas 400

muestra el ingreso neto de la

Compañía Monsato de 1993 a


200

1999. Obsérvese que en 1995

sufrió una pérdida. ¿Cuánto se

perdió aproximadamente en
-200

1995?

os?
-600

íos? 1993 1994 1995 1996 1997 1998 1999 Años

Se perdieron aproximadamente 300 millones de Lempiras

I Horacio Reyes Núñez• •


·..." .•.11";•."••••".,,.,
6. Diagrama Circular

Este diagrama también llamado de sectores, resulta muy útil para representar una distribución de

frecuencias relativas. '

En la práctica es frecuente encontrar situaciones o fenómenos estadísticos que hacen relación a la

subdivisión de un total en sus partes componentes y porcentajes que cada una de ellas representa. Para

representar tales situaciones se emplea el circular o de sectores.

Un gráfico circular nos ilustra la de un conjunto en varias partes, resaltando la o

porcentaje de observaciones que integran cada parte con relación al total de observaciones del conjunto.

__ 1. Al 100% del área del círculo le corresponden 360° por tanto, al 1% le


corresponde 3.6°
2. Toda cantidad debe expresarse en porcentaje.
3. Asignar a cada porcentaje parcial un sector circular de acuerdo con el
ángulo correspondiente a dicho porcentaje.
4. Usar el compás y el transportador para hacer el círculo y para dibujar los
ángulos respectivamente obtenidos,

Ejemplo:
l
De 450 personas, 125 hablan inglés; 100 hablan francés; 75 alemán y el resto hablan español?

a) Cuántas personas hablan español?

b) ¿Cuál es el % correspondiente a las personas que hablan cada idioma?

c) Construya un <!iagrama circular para esta,información


fr

Solución:
a) 450 - (125+100+75) = 450 - 300 = 150 hablan español 7.

125 27.8% hablan inglés


b) P= 450 x 100% = yJ
qu
P= 100 x 100% = 22.2% hablan francés re]
450

p- 75 x 10O%
- 450 = 16.7% hablan alemán Ej<

P= x 100% = 33.3% hablan español ...Resp

c) Para hacer el gráfico circular, convertimos los porcentajes (%) en grados con la relación: 1% = 3.6° y se

forma un cuadro como el siguiente donde los grados se redonde'an al entero.

33.3x3.6°= 119.88 '" 120°


. .... 27.8x3.6°= 100.08 100°
Inglés 22.2x3.6°= 80°
•• •} 80 16.7x3.6°= 60°
•• ¡:· ••• 100.0 360.00 360°
: q{i
m•
•• z-
I
Diagrama circular de personas que hablan esos idiomas

a
a

1. Si no desea sombrear, puntear o rayar dentro del circulo, se sugiere


le . escribir los indícadores en la parte superior o inferior derecha del gráfico.
2. La suma de los grados debe "cuadrar" a 3600 y la de % a 100%.

el

los

Una autoridad urbana desea diseñar una gráfica que muestre a los causantes que asistan a una próxima
reunión, lo que sucede con el dinero que pagan por impuestos. El monto total recolectado es 2 millones de
ol?
lempiras. Los gastos fueron L. 440 000.00 para escuelas, L. 1 160000.00 para carninos, L. 320000.00 para
administración y L.. 80 000.00 para suministros. Una gráfica de sectores parece ideal para mostrar la
fracción de cada Lempira de impuestos que se escuelas, carninos, administración y suministros:
Convierta las cantidades totales a porcentajes del total general y represente los una gráfica ..
de sectores.

7. Pictograma
Es un diagrama de figuras. Es la forma mas amena de mostrar una situación, sin embargo, no la mas exacta
y las comparaciones que pueden hacerse son limitadas. Este tipo de gráfico son dibujos representando algo
que ilustran magnitud, comportamiento u otro fenómeno en estudio. Son utilizados a menudo para
representar datos estadísticos en forma que llame la atención a todo público que los vea. Muchos de estos

Ejemplos:
1.
Resp

y se

Fuente: Bureau of the Census USA 2006


. . .• ,.

Ejemplos:
2.
Causa de mortalúúul en San Pedro Sula

1 de dieciembre del 2005 a 31 de mayo del 2006

30 muertes)

Utilizando el pictograma anterior:


a) ¿Cuántas muertes hubieron por hipertensión?
b) ¿Cuántas muertes hubieron por accidente automovilístico?:::
c) ¿Cuántas muertes hubieron por otras causas? 120

¿Qué es un Pictorama de Operación?

Es un señalizador visual y luminoso que orienta al usuario sobre como opera por ejemplo, la puerta
giratoria de acceso a un banco (Molinete).

Ejemplos:" Molinete liberado o bloqueado para paso, o también para compas de espera.

¿Qué es un Pictorama de

Es un visual y luminoso (flecha verde o señal roja o de contramano) que le permite al usuario
visualizar a distancia cual será el molinete que utilizará.

8. Mapas EstmIísticos

. Muestran la variación geográfica de un fenómeno.

Mapas sombreados: Muestran para cada área geográfica, la magnitud del fenómeno que se estudia por
medio de diferencias progresivas en el rayado o sombreado. También puede mostrarse diferencias
utilizando colores.

Mapas punteados: Muestran la distribución geográfica de sucesos de tal manera que las regiones con
mayor frecuencia, muestran fuertes concentraciones convertidos en puntos o manchas negras.

Mapa de alfileres: Se consideran un caso particular de los mapas punteados donde en vez de puntos por
cada suceso, se colocan alfileres particularmente con aquellos de cabeza grande y de colores.

¡
I

-.Horado Reyes Núñez


I 1iI'I.i.'ICiit.',.Mdij".'E ~. .
Tasas de mortalidad infantil por departamento. Honduras 2004
(Mapa Sombreado)

.. .
"
70
0
- ....

.
0<1 1...

130 11I.
Lerta

uario

1. Construya un diagrama de barras simples usando las alturas de las montañas dadas en la tabla de abajo.

~.•e .'
a por
ncias

I. i J. . !.

s con

por

I Horado Reyes Núñez• •


~
. .
2. La tabla de abajo representa la temperatura máxima media para el mes de julio de 6 años. Construya un
barras simples para ilustrar esa

3. Se hizo un estudio del número de automóviles que pasaban por un cruce de calles. Los resultados
en la tabla. Construya un de barras simples para-la

9.

4. La siguiente tabla muestra la matrícula de escuelas privadas de Tegucigalpa, San Pedro Sula Ceiba de
2004 a 2006. Construir un de barras comparativas y otro de barras compuesto para la
siguiente información:

2004

2005

2006

10.
5. Trazar un diagrama circular para los valores dél cuadro de carreteras del año 1997 del cuadro de
carreteras de la página 25.

6. Trazar un diagrama de barras comparativa para la siguiente información de algunas escuelas normales.
También trazar un diagrama de barras compuesto.

<2003 \IV
. ,~.':. :.
.. ..

... ..,. ;.•. ..•: ••.;.· .•.; ·.;.; ..


•... . .
: , .
, .•.
: ..
. .. I;. I;
. ' .•;... . .•:. ..
..1.:.'
;:

_
.. ;.;j. .. :;.. '
I;: ;;.:

h
• -o-'-a-c..¡. .

g'¡.i."'iii·'.•

7. Construír un diagrama circular para la siguiente información que permita ver comparativamente el área
~
. .

de los 7 países descritos en la tabla cuyas extensiones territoriales en Km2 Ud. tiene que investigar. (Sin
respuesta)

Honduras
El Salvador

:en 8. El Ministerio del Trabajo, realizó una investigación sobre la distribución de obreros de acuerdo con el
tipo de industria en que se emplean y obtuvo los siguientes resultados:

Construir un diagrama circular


que muestre la distribución de los
Textil . obreros según el tipo de industria
en que se

9. El precio al cierre de las acciones comunes de NCR, por trimestre, de 1995 de acuerdo con el informe
anual de NCR y con el Wall Street Journal es:

ade

66118
74112
82318
.•. . u .... .• 63114

Represente la tendencia de los precios al cierre de las acciones en un gráfico simple de líneas.

10. El Departamento del Ejército de Estados Unidos informó estas cifras sobre el personal en servicio
ro de activo en 1999 y 2006:

nales.

I
- 5235
10000
•·

Represente los cambios porcentuales, por sexo, para cada uno de los tres grupos entre 1999 y 2006 en
1
forma de gráfica de barras bidireccional. .

I
L Horacio Reyes
~
. . •• "m¡"
11. De acuerdo con el Bureau of Justice (de Estados Unidos) el número de reclusos con sentencia de muerte, por
grupo de edad, es:

(
a) Dependiendo de su objetivo, seleccione una forma de gráfica y represente los datos.
b) ¿Cuál es el objetivo de su gráfica?
s

12. Una empresa petrolera en su informe anual mencionó las siguientes ventas netaS y el costo de ventas F
desde 2002 (en millones de dólares): SI

S(
Represente en una gráfica la tendencia de estos dos conceptos desde 2002.

1.6 tango. Tamaño o

Cuando la toma de datos contiene mucha información, no es práctico escribirlos todos ellos en una misma
columna, sino que se emplea la. agrupación de los valores de la variable en clases o calegorias y se
Sol
detennina el número de valores de la variable que pertenecen a cada clase que se llamará frecuencia de

clase. Usaremos el símbolo "X" para las Clases o Categorías y "f' para las Frecuencias de Clase.

Rango: En una serie de datos, la diferencia entre el Valor Máximo (Vmax) y el Valor Mínimo (Vmin) de la
variable, se llama rango.

- Vmin (9)

Si en una tabla se tiene que: Vmax =20 Des}


Vmin = 13, con la fórmula (9): Rg = 20-13 = 7 suge
Rg =7 ... Resp.

El número de clases debe ser suficiente para que no se pierda excesiva información primaria y para que la

estadística resultante, sea manejable y útil para expresar las características de la variable. Algunos

investigadores rara vez utilizan menos de 6 o más de 15 clases. El número exacto que se utilice en una
situación dada, dependerá de la naturaleza, magnitud y orden de los datos.

••
.
.
I
Si en un momento dado no se está seguro del número de clases a utilizar, la fórmula (10) dada por
dará un número de clases sugerido (k):

donde N = total de frecuencias


k = Número de clases
Log N =Logaritmo decimal de N

La respuesta dada por la aplicación de la fórmula de Sturges no debe considerarse como final, sino solo
como una guía o sugerencia. El número de clases especificado por la regla, debe aumentarse o disminuirse
según convenga y en beneficio de una presentación clara.
lO" .
Para la aplicación de la fónnula (lO) utilizando la calculadora se usa la tecla situada en la parte
.tas superior de las teclas de funciones. Las letras de "log" son blancas y están sobre la tecla, lo que indica que
es una función que se acciona directamente con solo pulsar la tecla.

Ejemplos: Calcular el logaritmo de los siguientes números

1. Log 75.38

Solución:

... Aplicando el algoritmo correspondiente


al logaritmo
... Lo que se despliega en pantalla

Log 75.38 =1.877256133 ... Resp.

isma 2. Log 0.00527


y se Solución:
de 10'
0.00527 ... Aplicando el algoritmo correspondiente
al logaritmo
de la ... Lo que se despliega en pantalla

Log 0.00527 = -2.278189385 oo. Resp.

Después de conocer el número de clases sugeridos (k) es importante determinar el ancho de clase (C)
sugerido con la aplicación de la siguiente fórmula.

que la
19unos
en una

I
L Horacio Reyes
~
. . ".ii'
Ejemplo 1:
Cierta distribución de datos acerca de la contaminación del aire, fueron proporcionadas por 57 grandes
ciudades. ¿cuántas clases se sugiere fonnar con esos datos?

Solución:
N=57
k = 1+3.322 Log N ...Fónnula de Sturges
k = 1+3.322 Log 57 ...Usando la calculadora científica para hallar Log57 y
operando para hallar el valor de k==7 .
=1+3.322 (1.755874856)
k = 6.83 7
k = 7 Número de clases sugerido ... Resp.

Con la calculadora se puede hacer la comprobación del resultado de k, así:


I
1 • 3.322 57 ...Aplicando el algoritmo correspondiente. La
calculadora está programada para reconocer la
prioridad de las operaciones.
~:~ªJÜ¡,g7::¡;1 ...Lo que se despliega ella pantalla

k =6.83
k = 7 Número de clases sugerido ...Resp.

Una vez fijado el número de clases también llamadas intervalos de clase, se calcula el ancho o tamaño de S(
para lo cual se usa la fónnula (11) en la que tiene que conocerse necesariamente el Vmax y Vrnin de a)
la distribución y el número de clases deseado.
b)
Ejemplo 2:
c)
En una distribución de 50 elementos, el Vmax = 98 Y Vrnin = 47; a) Calcular el número de clases
(k) sugerido y b) El ancho de clase (C) sugerido.
Solución:

a) k = 1+3.322 Log 50 ... Aplicando la fónnula (10) de Sturges y operando

con la calculadora científica.


k= 1+3.322 (1.698970004)
= 1+5.643978353 = 6.643978353 = 6.64
k = 7 Número de clases sugerido ... Resp.
Haciendo uso de la calculadora se puede comprobar el valor de k, así:

1 • 3.322 50 11 ... ¿Qué se hizo?


... ¿Qué es este valor?
l

k = 7 Número de clases sugerido ... Resp.

-~- Vmax-Vmin ... Aplicando la fónnula (11) y operando

- k - k

e - 98-47 - 51 ­ 7 .2857

... Resp.

'-o-r

__ 1. En muchos casos al investigador utiliza un número prefijado de clase y por
lo tanto ya no es necesario utilizar la fórmula (lO) de Sturges.
les
2. El número de clases debe ser número entero, por tanto, si el resultado de la
operación es un número decimal, se aproximará al número entero inmediato
superior. (Véanse ejemplos 1 y 2 anteriores).
3. Hasta donde sea posible. debe de omitirse trabajar tanto con clases de anchos
diferentes, como con clases abiertas.
4. El ancho de clase no necesariamente será número entero, en algunos casos
7y podrá ser un decimal.
5. Si su calculadora es de otra marca debe consultar el manual para calcular el
logaritmo de un número
6. No existe el logaritmo de un número negativo. Su calculadora le enviará el
mensaje de MATIl ERROR. Pruébelo calcuhido log (-3.23)

Ejemplo 3:
La tabla 15 de la izquierda corresponde a la toma de datos
de las calificaciones finales de 50 alumnos de un Instituto

HGB en la asignatura de Inglés. Se pide:

a) Determinar el Rango Rg.

b) Determinar la anchura del Intervalo de Clase y

agruparlos en 10 clases.
c) Hacer una tabla que contenga las 10 clases, (X), los
datos ordenados correspondientes y la frecuencia (f).

o de Solución:
de a) Rg = Vmax - Vmin
=98 -51 =47 ... Resp.
b) Tamaño o anchura del intervalo C = = = 5 ... Resp.
c) Tabla de clases. Datos ordenados y frecuencias
lases

rando

1. Los intervalos de las clases bien pudieran tomarse a partir de 51; también
pudo haberse pedido 6, 8, 15 etc., clases, o simplemente calcularlos con la
fórmula de Sturges.
2. La clase 55 - 59 se forma contando 5 a partir de 55, así: 55, 56, 57, 58, 59.
C = 5 = anchura o tamaño del intervalo de clase.
3. La ordenación de datos además de ser útil para calcular la frecuencia de
clases, sirve para contestar algunas preguntas que pudieran ser pedidas de
acuerdo al problema que se analiza y resuelva.

••

.dil.,.'IIi"".'."".'"

. .
. '

Una tabla que contiene las y frecuencia, se de


'

T
f
Supóngase que en lá::Universidad Pedag6gica N.acional (UPN) se midió la estatura en púlgadas de 100
estudil!lltes' y se decidió formar una OistrilJuci6n con 5 clases tal como se muestra la
Tabla (Las aitúras
.. se registraron " ,
'. .'. ., ." ' . ". . P

a)La primera clase: comprende las estaturas de 60 a 62


pulgadas y, viene indicada por elsúnbolo: 60 - 62 yen eUa
hay 5 estudiantes cuyas estaturas están comprendidas entre
esos Jímites; frecuencia correspondiente a esa
claSe es: '
b)La segunda, claSe: 63 - 65 tiene una frecuencia: f = 18. ¿Qué
significa? ' '
c)La tercera clase: 68 tiene una frecue.,cia f = 42. ¿Qué
significa? así la quinta clase: 72 - 73
. con frecuencia: f = 8..
Un súnbolo que defme una clase como: 60 62 Ó 63- 65666 - 68, etc,de la Tabla N°16 se conoce con el
nombre de IntervaldAe Clase. Los extremQs!Íe cada intervalo cOmO 60 y 66 y68, Eje
etc. Se llaman Límites de Clase. El número menor 60 es el límite inferior de ,la primera el
'mayor 62 es el pri'mera cltísé. stgunda clase, '63 es ellíntite inferior y 'el
lilnue superior. '

El tamaño o anchura' de es la diferencia entre dos lúnites sucesivos de clase ya sean inferiores' o
Suele repre'sentarse por "C". anterior es válido para datos agrupados como los de la Tabla
N°16.
Solu
Si deseamos conocer el tamaño de un intervalo de clase dado por datos agrupados en una distribuci6n de a)
frecuencias como la de la Tabla N° 16, podemos optar por calcularlo con lítnites inferiores o superiores, así:
b) e
límites inferiores (Li) Con límites superiores (Ls)
c) D
C=63-60=3 C=65-62=3
C=66-63=3 C=68 -65=3

La marca de clase es el punto medio de intervalo de clase y se obtiene sumando los lúnites inferior y
superior de la clase y ·dividiendoesta por 2. La marca de clase se suele representar por el súnbolo
"Xm"; también se llama Punto medio de la La marca de clase se calcula con la f6rmula i2.

tÜj donde: Xm = Marca de clase


Li = Límite inferior de la clase
Ls = Lúnite superior de la clase

','
• •Horacio Reyes Núfiez

Ejemplos:
..................... .

¿Cuál es la marca de clase de la segunda clase? ¿De la quinta clase de la Tabla N°16?
Solución:
Para la segunda clase: Li = 63; Ls = 65
100 Xm = Li + Ls= 63 + 65 = 64 .., Resp.
2 2
Para la quinta clase: Li =72; Ls =74
Xm =Li +Ls= 72 + 74= 73 ... Resp.
2 2
62
ella Para formar la distribución de frecuencias, se sugiere lo siguiente:·
1. Determinar el número de clases con la fórmula de Sturges.
esa 2. Determinar el mayor y el menor entre los datos registrados y calcular el
RangoRg. ,
,Qué 3. Dividir el rango entre el número de clases, para hallar el ancho de clase.
4. Determinar el número de observaciones que caen dentro de cada intervalo, es
decir, encontrar la frecuencia f.
-73 5. Evitar muy pocas o demasiadas clases.
6. El ancho de clase debe ser el mismo, para todas las clases.
7. Deben evitarse las claSes de extremos abiertos.
on el
y68, Ejemplo:
Las calificaciones obtenidas por SO alumnos en la asignatura de Matemática del Instituto HRN fueron
'el las siguientes:

a) Calcular el rango Rg.


b) Encontrar el tamaño o anchura de intervalo de clase C si
se desean 10 clases o intervalos de clase.
c) Elaborar una tabla de frecuencias que contenga: X, f,
ores o Xm Y N (Total de frecuencia)
Tabla
Solución:

i6n de a) Rg. = Vmax - Vmin = 99 - 50 = 49 oo. Resp.


s, así: b) C 49 oo. Resp.
10 10 .
c) Distribución de frecuencias con datos agrupados
Datos agrupados 3
... Resp.

ferior y
símbolo 65-69
70.:.74

Xm_ Li + Ls 50 +54 52
- 2 2

Xm 55+ 59
57
2

Xm 60+64
2 62, e ct
.

=-=.-
ú:-:Oñr:e
.. . ".i.••••••••

Límites reales Son números que se emplean para representar las clases. El menor de ellos se llama
límite real inferior (Lri) y el mayor, el limite real superior de la clase (Lrs).

En la distribución de frecuencia anterior, se tienen los Límites Reales de cada clase en la columna 3. He
. "
aquí algunos de ellos:

.'
2.
Los Umites reales de una clase cualquiera se obtienen prácticamente, sumando al límite superior de una
clase, el límite inferior de la clase contigua siguiente y dividiendo este resultado por 2. Ejemplos:

En la 38 clase: Lri =(59+60) 59.5 E


2
(64+65)
Lrs 64.5
2
En la 58 clase: Lri =(69+70) 69.5
2
Lrs - (74+75) 74.5
- 2 O. l
el
l.Para calcular los límites reales de una clase cualesquiera, cuando sus
respectivos límites son números enteros, basta con restarle 0.5 al límite
inferior y sumarle 0.5 al límite superior de la clase.
2. Si los límites de clase están escritos con aproximación de décimas, entonces
los límites reales se forman restando 0.05 al límite inferior y sumando 0.05
al superior. Si la aproximación de los límites es de centésimas, entonces los l.V
límites reales se forman restando 0.005 al límite inferior y sumando 0.005 al
superior, así:

a) Si Li =55 entonces 55--0.5 =54.5 =Lri oo. Restando y


Ls =59 entonces 59+0.5 =59.5 =Lrs sumando 0.5 a los
límites de clase La
dados cOI

b) Si Li =65.5 entonces 65.5-0.05 =65.45 =Lri .oo Restando y gel


Ls =69.5 entonces 69.5+0.05 =69.55 =Lrs sumando 0.05 a los rall
límites de clase dada

c) Si Li =85.54 entonces 85.54-0.005 =85.535 =Lri 2. Co


Ls =89.54 entonces 89.54+0.005 =89.545 =Lrs oo. Que se hizo?
jus
3.La diferencia aritmética entre el límite real superior y el límite real inferior ser
list
de cualquier clase, es igual al ancho de clase:
4. En una distribución de frecuencias, el límite real superior de una clase 3. Eln
cualesquiera (Lrs) es igual real inferior (Lri}de la clase contigua siguiente. enu ,

m • --'-,
•• o ..•
• gii.I.C""'.".' """".. .

Uama

Los salarios mensuales de una muestra de 87 empleados de una empresa tienen valores que van de
3. He L. 1 041.00 hasta L. 2 548.00

a) ¿cuál será el número de clases sugerido para la distribución?


b) ¿qué ancho sugerido tendrá cada clase? .
c) ¿cuáles serán los límites reales de las clases?, ¿los puntos medios de las clases?

2. Supóngase que las clases de una distribución, se expresan así:

le una 40- 60

60 - 90

150y más

Estas clases ilustran 3 prácticas que deben evitarse, ¿cuáles son?

O. Utilizar la calculadora y el número de clases sugerido y el ancho de


clase sugerido para: .
io sus
límite a) N =40, Vmax =83, Vrnín =43 d) N =73, Vmax =80, Vmin =45
b) N =65, Vmax =78, Vmin =30 e) N =73, Vmax =90, Vrnín =36
ltonces c) N =80, Vmax =75, Vrnín =38 f) N =94, Vmax =93, Vrnín =60
lo 0.05
Ices los 1. Una compañía de transmisores electrónicas, registró como sigue el número de recibos de servicio prestado
1.005 al por cada una de sus 20 tiendas:

801 641 628 731 641 446 342 545 909 568
¡ 335 449 727 848 649 229 347 309 575 757
a los i
lSe La compañía piensa que una tienda realmente no puede esperar financieramente el punto de equilibrio
con menos de 450 servicios prestados mensualmente. Además dá un bono financiero al gerente que
genere más de 700 servicios al mes. a) Disponer los datos en forma ascendente, b) calcular el
rango, c) ¿cuántas y que porcentaje de esas tiendas no están consiguiendo el punto de equilibrio?, d) ¿a
5 a los cuántos y que porcentaje de gerentes les dan un bono fmanciero?
lsedada
2. Con los datos de la compañía del problema anterior, el vicepresidente ha establecido lo que se llama
"lista de vigilancia de tiendas", que es una lista cuya cantidad de servicios es muy baja como para
justificar su atenci6n especial por parte de la oficina central. En esta categoría quedan las tiendas cuyos
servicios oscilan entre 500 y 600 servicios al mes. ¿Cuántas y qué porcentaje de esas tiendas están en
inferior
lista?

ua clase 3. El número de horas que tardan los mecánicos de transmisiones en quitar reparar y reemplazar una transmisión
en una tienda especializada, en un día son:

..... ur• "z• •

'

. . ••d.ii'
2

6.7 2.3 3.3 7.7 2.2 5.5 3.3 6.7


3
8.7 2.9 304 504,,3.6 2.7 404 504 3.2 4.6 3.3 4.1
3.2 3.3 5.5
f
I

1.
2 ' , .
La gerencia de la tienda, dá un estímulo económico a los mecánicos que tarden menos de 4 horas;
.
1 L
ne
de descanso pagado, a los que tarden entre 4 y 6 horas y una llamada de atención a los que tarden más de
6 a) disponer los datos en forma ascendente, b) calcular el rango, c) ¿cuántas y que porcentaje de ut
personas estimula la gerencia? d) ¿cuántos y que porcentaje de mecánicos los mandan a descansar un fr,
día? e) cuántos y que porCentaje de mecánicos, les lhiman la atención?" .. ,
' . . . . .

4. Una cierta compañía muestreó sus registros de embarque durante cierto día y obtuvo los siguientes
resultados: . se:

Tiempo transcurrido desde la recepción de la orden hasta la entrega (en días)

4 12 8 14 11 67 13 11 13
11 20 5 19 10 15 7 24 29 6
El
a) Construir una distribución de frecuencias. Usar intervalos de 6 días . cer
b) Calcular Xm. ¿Qué afIrmación se puede hacer sobre la eficacia del procesanuento de pedidos a pilitir de a Cj
esta distribución?
Eje
c) Calcular los límites reales de las clases formadas.

5. Se muestrearon 30 comunidades en el país y se ha explicado los precios en cada una de ellas al inicio y al
final de agosto 1999, a fin de averiguar aproximadamente cuanto ha cambiado en ese mes el índice de
precios al consumidor. El cambio porcentual de precios en las 30 comunidades fue:

61
0.8 0.2 -0.1 0.1 -0.2 0.2 0.3 0.5 -0.1 -0.2
0.0 0.6 0.3 0.2 1.0 -004 0.0 0.1 0.3 0.1
-0.5 -0.2 0.0 004 0.6 0.0 0.1 -0.2 0.1 0.3

a) Disponer los datos en orden ascendente.

b) Con las siguientes clases de igual tamaño, formar una distribución de frecuencias: -0.5 a - 0.2;

d) S
- 0.1 a 0.2; 0.3 a 0.6; 0.7 a 1.0;

II
c) Formar la columna Xm. ¿Cuál es el ancho de cada intervalo?
e) S
d) ¿Cuántas comunidades tenían precios que no cambiaron?
(,
e) Calcular los límites reales de clase.
al
f) S.
6. Dada la siguiente distribución de frecuencia: pe
a) ¿Cuántos elementos forman la muestra?
b) ¿Entre qué límites reales está el peso de mayor frecuencia?
c) ¿Entre qué límites reales está el peso de menor frecuencia?
d) Determinar las marcas de clase
e) ¿Cuántas y qué % de elementos pesan al menos 144 lbs?
f) ¿Cuántas y qué % de elementos pesan 135 o menos lbs?
g) ¿Cuántas personas pesan cuando mucho 153 libras? ¿Qué % le
corresponde?
h) ¿Cuál es el tamaño del intervalo de clase?
i) Formar la columna de límites reales.

a-c""'i

' .
.
H • ii• •. • •
.

.
o"

1. 7 ' . . .. . .:. .'.


•.
.•. ~
y
.. " .. ',' _ o,,

Los gerentes de ventas, anatistas de valores, directores de escuelas. colegios, hospitalCs


1 día necesitan tener noción rápida de la tendencia de venta, precios de acciones, índices de escolaridad, de
.s de nacimientos, de ingreso de pacientes,. costos de administración, etc. Estas tendenCias pueden mostrarse
e de utilizando diagranias gráficas. Tres diagramas que representan de manera adecuada. una distribución de
r frecuencias. son el Histograma, El Polígono de FrecuencÚl y el Polígono de FrecuencÚl Acumultulas u
.
. ' -.

El Histograma deFrecuencÚls. Es uno de los medios gráficos de más fácil interpretación y consiste en una
serie de rectángulos que: .... ..•.... " .'.
a). Tienen su base en el eje horizontal (eje llamada también línea de ,un sistema cartesiano
con centro en las marcas de clase (Xm) y longitud o ancho, igual al 'de inte..valós de
clase (C). Véase Fig. 40 ..' ' . ' . .•. ..
b). Tiene superficies las frecuencias de clase. Las frecuencias se
elel eje vertical (eje YY') de un sistema cartesiano. .... . .."
'

El Poligonode FrecuencÚls es un gráfico de líneas trazado sobre las marcas de clase(Xm). Se acostumbra
cerrar el polígono con PQ y RS hasta las marcas de clase inferior y superior inmediatas corresponderían
a clases de frecuencias cero (f =O). . ' . '
tirde
Ejemplo.
la siguiente distribución Tabla W 18, construir el histograma y el poligqno defrecuencÚlS.
. . . . " .

.0y al Solución:
ice de ,.. ili6Z:iS: a) Se calcula la columna Xm y de la Tabla W 18.
63-65 ······:·:\:,:.•. :.Jg:
.•. . . b) traza un sistema de

... ".:. '.' escala adecuada para ambos ejes. Véase Fig. 40.
. :: Total 39
c) Se levantan por los límites reales, rectángulos de
alturas iguales a las frecuencias de clase f.
. 18 .
- 0.2; d) Se dibuja en otro sistema de ejes cartesianos, lo mismo que en b) solo que en el eje se colocan las
marcas de clase X m . . . .
e) Se trazan los puntos del polígono de frecuencias con las marcas de clase Xm y la respectiva frecuencia f
(véase Fig. 41). Los puntos Q y S corresponden a marcas de clase de frecuencia ceró (O), los cuales deben.
aparecer siempre para cerrar el polígono. .
f) Se une con segmentos de recta todos y cada uno de los puntos en forma. consecutiva hasta cerrar el
polígono (Véase Fig.41).

Histograma de FrecuencÚls

~z • •
'. . I

__ Tanto el histograma como el poügono de frecuencias permiten obtener una

imagen rápida de las principales características de los datos (máximos,

mínimos, concentración de puntos, etc.).

2.El polígono de frecuencias tiene la ventaja notable con respecto al histograma


para poder comparar dos o más distribuciones de frecuencias.

Las exportaciones anuales para un grupo de pequeñas empresas farmacéuticas

1. Representar las exportaCiones en un histograma


2. ¿Cuáles son los puntos medios?
3. Representar las exportaciones en un polígono de frecuencias 16
4. Interpretar las gráficas

1.
frecuencias
b.:;~~~~~en:~o~:
8 clases de anchura la distribución A y 10 clases de anchura 7 para la distribución B.

A. 3 2 .6 1 42 35 3 5 2.8 17 1 7 2 O B. 64 54 34 34 64 54 44 47 64

17 17 18 35 18173.5422842 748492778745 87598855

21211821203520351817 4455456785 64 84

32 3261 21 35 61 20 68 34 44 54 64 3454 64 74 87 88
322118 21 20 17 17 35 28 42 34.65 92,54 67 87 3459 88 55
33 61 17 20 35 18 17 35 64 84 45 64 67 87 45 64 84 98

La Tabla siguiente muestra una distribución de frecuel'lcia de duración de ciertos tubos de radio, determinar:
1
SI

2. Los límites reales de la séptima clase


3. El límite real inferior de la tercera clase
4. Marca de clase de la sexta clase
5. Tamaño del intervalo de clase
-
6. Frecuencia de la cuarta clase
7. Cantidad de tubos que no sobrepasan las 60 horas
8. Cantidad de tubos cuya duración es más de 80 horas
9. Cantidad de tubos cuya duración es mayor de 50 pero menor de 80
horas

.
• •Horado ¡
• Dada la siguiente distribución de los pesos en libras de 50 niños:

.mos, 10. Ordenar los datos en forma creciente


11. Calcular el rango
12. Agrupar la muestra en 10 Intervalos
¿Cuál es la anchura deUntervalo?
13. Formar las columnas X, f, Xm, Lri - Lrs ó L.R..
14. Dibujar el histograma y el polígono de frecuencias
de los datos agrupados.

15. En lá distribución dadas en A y B, hacer una tabla de distribución de frecuencias


donde aparezcan las columnas X, f, Xm, Lri-Lrs ó L.R. Dibujar el histograma y el polígono de frecuencias
tanto de A como de B.

16. Dibujar un histograma y un polígono de frecuencias de la tabla del problema 2 de esta guía de estudio
encias
Las edades de 50 bailarinas que se presentaron a concurso de selección para una comedia musical, fueron:

21 19 2219 18 20 23'19 19 20 17. Construir una distribución de frecuencia agrupada


19 20 21 22 2120 22-'20 -21 20 18. Construir 5 2 comenzando con la
21 19 21 21 21 22 19 19 21 clase 16-17,18-19...
20 20 19 21 21 22 19 19 21 19 19. Trazar el histograma y el polígono de frecuencia
21 19 18 22 21 24 20 24 17

En una calle de la ciudad policía de tránsito midió las velocidades de los automóviles km/h,e hizo
;iónB. el siguiente registro:

47 64 20. Construir una distribución de frecuenciaagrupada


27 43 24 35 26 28
88 55 utilizando las clases: 15-19; 20-24; ...40-44
64 84 -18 20 '25 23 ,22 31 .30 41 29
21. Calcular las Xm de cada clase y el valor del ancho
\45 27 43 29 ;28 27· 25 29 28 24
87 88 de clase.
88 55
¡ 37 28·29 18-26 33·25 25 '34
"
22. Trazar el histograma y el polígono de frecuencias.
84 98 .í

La prueba KSW de aptitud en ciencias de la computación fue aplicada a 50 estudiantes y los resultados
se

23. Calcular el ancho de clase, las marcas de clase y los


límites reales de clase.
24. Trazar el histograma y el polígono de frecuencias de
, la distribución.

lor de 80 3
1

=-z• •
.. .
La prueba de Hemoglobina Ale, es una prueba sanguínea aplicada a los diabéticos durante sus exámenes
rutinarios de control, e indica el nivel de azúcar en la sangre durante 26 3 meses anteriores a prueba.
r L
I
,

Los siguientes datos se obtuvieron de. personas diabéticas diferentes en un hospital que atiende pacientes L
la
de este tipo:
Er
6.5 5.0 5.6 7.6 4.8 8.0 7.5 7.9 Clasificar estos valores en una distribuci6nde
ca
8.0 9.2 6.4 6.0 5.6 6.0 5.7 9.2 frecuencias. Calcular el ancho de clase si se utilizan las
8.1 8.0 6.5 6.6 5.0 8.0 6.5 6.1 clases 3.7 - 4.6; 4.7 - 5.6; etc.
la
6.4 6.6 7.2 5.9 4.0 5.9 4.0 5.7 26. Calcular las Xm de cada clase
fa.
27. Trazar el histograma y el polígono de frecuencias de la
col
distribución

Los pesos de 75 mazorcas de maíz de la variedad growfast se registraron en la siguiente distribudón:

28. Representar los valores en un histograma


16 29. Representar los valores en un polígono de frecuencias
18 ­ 30. Con base a los diagramas, interpretar la distribución
20 -21
22 -23
"

;::

Las puntuaciones obtenidas en una prueba de aptitud mecánica se organizaron en la siguiente distribución. La j


Frec

31. Representar los valores en un histograma La 1


32. Representar los valores en un polígono de frecuencias acun
33. Utilizando los dos diagramas, interpretar la distribución por 1

La Cía Automotriz Toyota está estudiando los reclamos por daños a automóviles de 5 años de antigüedad
o más, y para automóviles con menos de 5 años. Los datos son los siguientes: Ejem

Número
===== 34. Representar las distribuciones en un mismo
eje para facilitar la comprensión.
35. Trazar el polígono de frecuencias para
ambas distribuciones
36. Interpretar las gráficas La Dj
relativ

1
2.


• •Horacio Reyes Núñez
• Aii.I"I.".".-""".'. ~. .
Diagramas de Frecuencias Acumuladas u Ojivas Porcentuales
nes
La Frecuencia Acumulada (fa) para cualquier clase, es la suma de las frecuencias de esa clase y la suma de
Ites las frecuencias de todas las clases precedentes.

En la distribución de frecuencias de abajo, se puede ver que la columna de frecuencia acumulada (fa) se ha
de calculado, sumando a la frecuencia de la primera clase, la frecuencia de la segunda (1+2=3); a este
las resultado se le suma la frecuencia de la 3& Clase (3+5=8); a este nuevo resultado se le suma la frecuencia de
la 4& clase (8+10=18) y así sucesivamente hasta sumar la frecuencia de la última clase de la distribución. La
fa. de la última clase necesariamente debe ser igual al tamaño de la muestra o de la población. Véase
e la columnas 1 y 2 del cuadro.
2 3 4
===
ión:

as

La información de la tabla puede presentarse de otra manera, utilizando una distribución de


:ión. Frecuencia Relativa Acumulada Porcentual (fra, %) como la de la columna 5 de la tabla de arriba.

La Frecuencia Relativa Acumulada Porcentual (fra, %) de una clase, se calcula dividiendo la frecuencia
acumulada (fa) de la clase por el número total de casos (N) de la distribución y multiplicando éste resultado
:ias
por 100%. Gene se expresa como %.
.ción

N = total de los casos en distribución


fa = frecuencia acumulada
(fra, %) = frecuencia relativa acumulada porcentual

üedad
Ejemplos:

1
x 100% = 2.94%
¡a. clase es: (fra,%) =( 34)
3
nismo 2a clase es: (fra,%) =( 34 ) x 100% = 8.82%
8
3a clase es: (fra,%) =( 34) x 100% = 23.53% ... columna 5
; .para

La Ojiva es un gráfico de líneas de una distribución de frecuencia acumulada (fa) o de una frecuencia
relativa acumulada porcentual (fra,%). Tiene las siguientes componentes:

1. Un título que identifica a la población y/o muestra


2. Un sistema de ejes cartesianos, en la que el eje YY' identifica las frecuencias acumuladas (fa) o las
frecuencias relativas acumuladas porcentuales (fra,%) según el caso.

H o-r-a-c.....¡-o- n:; ¡-· z ••


.. .
3. El eje .xx'de una ojiva, siempre esta basado en los L.R. superiores de la clase (Lrs) de la
distribución y el eje YY' con 100%.
4. Toda ojiva "menor que" comienza con una frecuencia relativa acumulada porcentual de O asociada
. al lfmite real inferior de la primera clase y termina con una frecuencia acumulada porcentual de
100% asociada al límite real superior de la última clase. Si la ojiva es "mayor que", el
procedimiento es a la inversa.
5. Una ojiva, que muestra las frecuencias acumuladas (fa) o las frecuencias relativas acumuladas (%)
menores que cualquier límite real superior de clase, se llama ojiva "menor que" y en caso contrario,
se llama ojiva "mayor que".
Ejemplo 1.
La siguiente distribución muestra la estatura en pulgadas de 80 estudiantes de Bachillerato en
Computación del Instituto "XYZ".
..... a) Elaborar una distribución de frecuencia que contenga X, f, fa, (fra,%) b)
yLR.
63 - 65 b) Dibujar la ojiva "menor que" de la distribución.
66 - 68 c) ¿Qué % de estudiantes tienen estatura menor que 68.5 pulgadas?
69 -71 d) ¿Qué % de estudiantes tienen estatura menor que 71.5 pulgadas?
72-74
N=80
Solución:
a) 2 3 4

... Construyendo la tabla de frecuencias pedida


... Resp.
* Explicación de la construcción de la Tabla c)El
En la la clase: fa =8 ... Calculando las frecuencias acumuladas fa.
Sumando a la frecuencia de la la clase, la
2a clase: = =
fa 8 + 10 18
frecuencia de la 2a clase; a ésta, la frecuencia de la d)El
3a clase: fa = 18+30 =48 3a clase; a ésta, la frecuencia de la 4a y a ésta la de
4a clase: fa =48+25 = 73 la 5a clase.
5a clase: fa =73+ 7 =80
Ejeml

En la la clase: (fra,%) = )x100% = 10.00% .:. Calculando la frecuencia relativa de cada clase,
. multiplicando por 100% la frecuencia relativa
a
2 clase: (fra,%) = ( )x100% = 22.50% acumulada de cada clase (Columna 3. Fórmula 4).
a
3 clase: (fra,%) = ( )x100% = 60.00% 10­
4a clase: (fra,%) =( )x100% = 91.25% 13-]
5a clase: (fra,%) = ( )x100% = 100.00% 16-]

En la 1aclase: =
Lri 60 - 0.5 59.5 = ... Calculando los lúnites reales (L.R.) de cada clase,
Lrs = 62 + 0.5 =62.5 restando 0.5 a cada lfmite inferior y sumándole 0.5
al lfmite superior de cada clase, porque los lúnites
2a clase: Lri =63 - 0.5 = 62.5
son números enteros. ¿De qué otra manera se
Lrs =65 + 0.5 =65.5... etc. pueden calcular? Explique (Columna 4).

m • ¡
• • !Hioo-'-a-c...... ...

le la

al de ... Construyendo la Tabla de Ojiva "Menor Que" ~


, el

5(%)
rario,

lo en

%) b) Ojiva. "menor que" ... Los puntos graficados representan el porcentaje de


80 Estudiantes de Bcu:hillerato en estudiantes que tienen estatura menor que el valor
Instituto "XYZ" correspondiente especificado en el eje XX' de las
? estaturas.
?

J
.
71.51

c) El 60% de los estudiantes tienen estatura ... Resp. (obtenida de la tabla y de la gráfica).
meno': que 68.5 pulgadas.
1S fa.
lse, la
d) El 91.25% los estudiantes tiene estatura ... Resp. (obtenida de la misma tabla y gráfica).
ia de la
:a la de
menor que 71.5 pulgadas

Ejemplo 2.
La siguiente distribución de frecuencias corresponde a un estudio hecho sobre el número de horas
l clase, semanales de 40 estudiantes que hacen uso del laboratorio de cómputo para sus prácticas.
relativa
Ila 4). a) Elaborar una tabla de distribución de frecuencias que incluya: f,
fa, (fra,%), L.R.
b) Elaborar una tabla que" y construir la ojiva "mayor que"
c) ¿Qué % de usan el laboratorio más de 18.5 horas
semanales?
d) ¿Qué % de estudiantes usan el laboratorio más de 21.5 horas
la clase, semanales?
dole 0.5 e) ¿Qué % de estudiantes usan el laboratorio más de 15.5 horas
s límites N=40
semanales.
mera se

'l z~• •
. . .......
Solución:
1 2 3 4

.
Calculando la frecuencia acumulada (fa).
Columna 2
a) •... . . . •. , 18 clase: fa =4
:
...

8
13 - 15 lS.S clase: fa = 4 +8 =12
16 - 18 .38 clase: fa = 12+12 =24. 1.
13 48 clase: fa 24+6 30
8 . •. :.: :.: 1:.:.:.:.·. . : 1
.. S8 clase: fa =30+4 = 34
:. •. ·
21 .... . •: : . • :. . .

•..·.:::::::.:.: .. :.'
40 . 68 clase: fa = 34+6 =40
Calculando (fra, %) con la fórmula (4)
Columna 3
¿Cómo se formó la columna de los límites
reales L.R.? (Columna 4) .
o" Esta tabla se construye utilizando los Lrs de
cada y la columna de las frecuencias
acumuladas fa, calculada en la columna 2 del
cuadro del inciso a). Del último valor 40,
se restan todas y cada una de las fa. de abajo
para arriba. Se incluye un intervalo al inicio 2.1
tal que su fa =00 JI
40 - 40 O; 40 - 24 = 16;
40 - 34 = 6; 40 - 12 = 28;
40 - 30 = 10; 40 - 04 = 36;
40-00=40

Ojiva "mayor que"

En Laboratorio
Horas Semanales. 40
... Gráfica de la Ojiva "mayor que"

\\
3. La
O V

... .l5.. 18.S 24.5 '27.5 L.R.S.' ..--


I

- . Laboratorio

c de los estudiantes usan el laboratorio de '0' Resp. (Obtenida de la tabla y de la gráfica. 16


18.5 horas. Estudiantes
d)EI2S% de los estudiantes usan el laboratorio de oo, Resp. (Obtenida de la tabla y de la 10
4. Las
de 21.5 horas.. Estudiantes.
de los estudiantes usan el laboratorio de 'oo Resp. 28 Estudiantes (Ver la tabla delinciso b)
de 15.5 horas.

m•
•• ú,-.,ñ"e..,..-z
.. .".i.CiMi.i,.+diJ".'W . .

a (fa).

136 92 115 121 137 132 120 104 125 119 115
101 129 87 108 110 133 135 126 127 103 110
(4)
128 118 82 104 137 120 146 95 126 119 119
105 132 126 118 100 113 106 125 117 146148
límites

: Lrs de a)Formar una distribución de frecuencias de estos pesos, que tenga clases 80 - 89; 90 - 99; ... 140 - 149
Yque tenga las columnas de f, fa, (fra,·%) y L.R.
;uencias
b) Elaborar la tabla de "más que" y trazar la .ojiva "mayor que"
na 2 del
c)¿Qué porcentaje de muestras pesan más de 109.5 gr? ¿más de 129.5 gr? ¿más de 139.5 gr?
40,
de abajo
2. Las siguientes son las calificaciones obtenidas por estudiantes de comercio en la asignatura de Contabilidad
al inicio
Intermedia.

73 65 82 70 45 50 70 54 32 32 75 75
75 67 65 60 75 87 83 40 72 64 58 89
70 73 55 61 71 88 89 65 93 43 51 59
38 65 71 75 85 65 85 49 97 55 60 76

a)Fonnar una distribución de frecuencias que tenga clases de 30 - 39; 40 - 49; 50- 59; ... 90 - 99 Y
las columnas f, fa, (fra, %) YL.R.
b)Elaborar una tabla de "menos que" y dibujar la ojiva respectiva, "menor que"
c)¿Qué porcentaje de alumnos obtuvieron notas menores que 59.5?; ¿menores que 79.5%?; ¿menores
que 89.5%?

3. La siguiente es una distribución de frecuencias de las edades de los miembros de un club de servicios de
presentación para personas solteras.

a)Elaborar una tabla de frecuencias, la tabla de "más que" y la


ojiva "mayor que"
i 224 .
i b)Elaborar una tabla de "menos que" y la ojiva "menor que"
·30-34

I
.:35-39

16

rática. 10 4. Lasque siguen, son las millas por galón que recorren 40 tanques de gasolina:

inciso b) 24,1 25.0 24.824.3242 25.3 24.2 23.6 24.5 24.4


24.5 23.2 24.0 23.8 23.8 25.3 24.5 24.6 24.0 25.2
25.2 24.4 24.7 24.1 24.6 24.9 24.1 25.8 24.2 24.2

I 24.8 24.1 25.6 24.5 25.1 24.6 24.3 25.2 24.7 23.3

L o-ra~· -c ¡ ñ'e::-::"z• •
~
. . • •"MIR I
I}

a) Agrupar estos datos en una distribución que tenga las clases: 23.0-23.4; 23.5-23.9; 24.0-24.4; 24.5-24.9;
25.0-25.4; 25.5-25.9
b) Formar la tabla de distribución de frecuencias con las columnas f, fa, (fra, %) Y L.R.
c)Fonnar la tabla y la ojiva "mayor que" comenzando con: "más que 22.95" y tenninando con: "más
que 25.95". .

d) Formar la tabla y la ojiva "menor que".

5. El Hospital Escuela de Honduras tiene, los siguientes datos que representan control de peso neonatal en
libras de 200 niños prematuros:

Construir una ojiva que le ayude a contestar la pregunta:


a) Si normalmente a los niños prematuros que pesan
menos de 3.0 libras se les mantiene en incubadora
varios días, ¿qué porcentaje de niños prematuros
la
b)¿Qué porcentaje de niños prematuros pesan menos de
3.45 libras?
c)¿Qué porcentaje de niños prematuros pesan más 2.95
libras? 9.1

6. Antes de construir la represa se hacen una serie de pruebas para medir el flujo de agua más allá del sitio
propuesto para la obra. Los resultados fueron los siguientes:

a) Construir una distribución de frecuencias y la ojiva


"mayor que"
b) Construir una distribución de frecuencias y la ojiva
"menor que"
c) ¿Qué porcentaje de flujo ocurre en menos de 1250.5
gallmin?
d) ¿Qué porcentaje de flujo ocurre en más de 1300.5
gallmin?
N= ...
Nota: El flujo del agua se mide en miles de galones por minuto IO.EI
se

7. Pedro Mena capitán de un barco pesquero de Islas de la Bahía, tiene la creencia de que la pesca mínima
para recuperar la inversión debe ser de 5000 libras por viaje. A continuación se tienen los datos de una
muestra de la pesca de 20 salidas al mar.

6500 6700 3400 3600 2000 Construir una ojiva para responder
7000 5600 4500 8000 5000 a) Aproximadamente, ¿qué fracción de los viajes recupera
4600 ,8100 6500 9000 4200 exactamente la inversión?
4800 7000 7500 6000 5400 b) ¿Cuál es el valor medio aproximado del arreglo de
datos para los viajes del capitán?
c) ¿Qué pescas del señor Mena exceden al 80% del
tiempo?

m•
•• e-z

. _....

24.9;
Giii.i.iiRir.i,.M• •
­
. .

8. Osiris Montoya, asesora de una peq\leñ",empresa de corretaje intenta diseñar programas de inversión
atractivos para jubilados, Ella sabe qü¿ mi inversionista potencial pudiera obtener un nivel de
"más intereses, estaría dispuesto a invertir su capital; pero debajo de un cierto nivel de intereses, no estaría
dispuesto a hacerlo. De un grupo de 50inrlividuos, Osiris obtuvo los siguientes datos con respecto a los
diferentes niveles de réditos requeridos por cada individuo para que pueda invertir L. 1 000.00.

len
Construir distribuciones de frecuencia relativa acumulada
porcentual "menor que 11 y "mayor que ".

1ta:
pesan
,adora
aturos

lOS de

s 2.95
9. Una fábrica de cremalleras de San Pedro Sula manufactura 15 productos básicos. La compañía tiene
registros del número de elementos de cada producto fabricados al mes, con el fin de examinar los niveles
relativos de producción. Los siguientes corresponden a números de cada elemento que produjo la
el sitio compañía durante 20 días laborables.

9908 9897 10052 10028 9722 Construir una ojiva que le ayude a responder las
10098 10587 9872 9956 9928 siguientes preguntas: (Sugerencia, hacer 5 clases
ojiva 10132 10507 9910 9992 10237 comenzando con 9 700 - 9 899)
a) ¿En cuántos de sus productos. la compañía el
a ojiva punto de equilibrio de 10000 unidades?
b)¿Qué nivel de producción excedió el 75% de sus
1250.5 productos durante ese mes?
c)¿Qué nivel de producción, excedió el 90% de sus
1300.5 productos de ese mes?

1O.El administrador de un hospital ordenó un estudio del tiempo que un paciente tiene que esperar antes de
ser tratado por el personal de la sala de urgencias. Los siguientes datos fueron tomados de un día normal.

mínima
de una
de espera (minutos) a) Organizar los datos en forma ascendente. ¿Qué
comentario puede hacer con respecto al tiempo de
espera de los pacientes a partir del ordenamiento?
recupera b) Construir una distribución de frecuencias de 6 clases.
¿Qué interpretación adicional puede dar a los datos a
reglo de partir de la distribución de frecuencias?
c)A partir de una ojiva, establecer ¿cuánto tiempo se debe
suponer que el 75% de los pacientes aguarden en la
80% del . sala de espera?

e~z •

• • - . .
J

. .

Conteste fonna de a lo

1. a) ¿Qué nos dá el cociente de una categoría y el número total de casos? Ejemplifique


b) LEn qué consiste la fuente de datos en una tabla estadística?
c) ¿Qué significa que el nivel de medic6n por intervalo tiene la propiedad de ser exhaustiva?
d) Diferencie los conceptos: dato y variable. Ejemplifique cada uno.
e) ¿Qué diferencia existe entre el diagrama de barras compuesto y el seccionado?
f) Sea una distribución de frecuencias. ¿Qué nos da la diferencia entre dos lúnites superiores de clase?
4.
g) ¿Qué significa el parámetro n en la fórmula de proyección poblacional?
h) ¿Cuáles son las unidades a considerar en los ejes coordenados en el polígono de frecuencias?
i) ¿Cuál es el número de clases y el ancho sugerido para una distribución de 89 datos si el dato mayor
es 103 y el menor 65?

Desarrolle cada fonna clara


2. En la siguiente distribución se dan las áreas protegidas más e.xtensas de Honduras clasificadas como
bosques nublados (declaradas y propuestas). Las 3 primeras son parques nacionales y la última es reserva
biológica

5.

El 2 17. 2006 /
I
I
I
a) Calcular el porcentaje de la Pico Bonito

b) Hallar la razón y su significado de la montaña de Comayagua a la de Sierra de Agalta

c) ¿Cuál es la proporción de Guajiquiro?


a
d) ¿Cuántas hectáreas cuadradas tiene Pico Bonito por cada 1 000 de la Sierra de Agalta?
b

m•
•• a-e'--¡

3. La siguiente tabla muestra el total de desocupados en San Pedro Sula en el período comprendido del año
2000 al 2006

Con estos datos y, considerando que la tendencia se mantiene, calcular:

a) La tasa de crecimiento anual para el período 2002 - 2006

b) Proyectar la población al año 2016, tomado como base el 2006 y la tasaca1culada en el inciso a)

:lase? 4. La siguiente tabla de doble entrada muestra las finanzas de 4 sectores del INPREMA.

,'.:~ ~,:a.~
layor

IS como
I ,•. . ,•. . ,•. .
:,il :I ,.,:I.
.. :.I·


:. .

Diario El
.•. •. ,1.,,: ,';.'.. . . .•. . •. .: ::•.·. . ..
:; :• ..
:. . : :0.,,.. •', ':.,.:.•,,.• :. . •.•.•,.,•:.:,•.:,..•'. •. .'.,........
: :: •......

• • •

10 2006. 3
..

reserva
a) Construya un diagrama de barras comparativos para Media y Superior
b) Construya un diagrama circular para el sector Administrativo
c) Construya un diagrama de barras simples para Valor en Mora

5. Las cuentas por comidas en un determinado restaurante tiene la distribucion de frecuencias de la

I siguiente tabla:

a) Complete la tabla. Redondee (fra, %) a enteros


b) construya la ojiva mayor que.
c) ¿Qué porcentaje de comidas tienen un valor mayor que L. 34.501
d) Construya el Polígono de frecuencias de esta distribución

Reyes
A •••
Y
Y y

y
Y Y
y

y
y •.

..

y
:[,;

/~,

,~

. .
2.1Inftoducción.
.

o
Una fonna útil de describir un grupo en su totalidad, es encontrar un número único que represente lo

"promedio" o lo "típico" de ese conjunto de gIlntajes o valores. A este número se le puede considerar como
"representativo" de todos los datos. En la Estadística, a ese valor se le conoce con el nombre de medida de
tendencia central, ya que está· generalmente localizado hacia el centro de la distribución, en la que la
mayoría de los puntajes o valores tjenderl a concentrarse. Por lo general, la tendencia central se refiere al
punto medio de una distribución.
L
Las principales medidas de central y que por lo general son mas utilizados en educación,
administración, econonúa, ciencias de la salud, etc. son: la media aritmética, la media
la media cutUlrática, la J.edia armónica, la mediana y la moda. Cada una de ellas tiene sus·
ventajas y desventajas.

Antes de iniciar el estudio de estas medidas de centralización, es conveniente que el estudiante se


familiarice con el significado y aplicación de lo que en Estadística se conoce con el nombre de
sigma o notación sumatoria.

La letra griega sigma mayúscUla se utiliza mucho en matemática y estadística para simbolizar la suma
indicada o un conjunto de sumandos, valores o elementos de una sucesión. Cada uno de éstos, 2.
debe ser de lafonna de la variable que subsigue al símbolo. Por ejemplo:

1. significa: La sumatoria de la variable x


2. significa: La sumatoria del conjunto de
sumandos que son S, menos que los valores de cada x.
3. significa: La sumatoria de los cuadrados de la variable y.
Cuando se recopilan grandes cantidades de datos, por lo general, es conveniente asignar un subíndice a la 3.
variable, para que en un momento futuro pueda saberse su procedencia o de donde se inicia. Este subíndice
se señala en la notación mediante la letra i (ój ó k) y adjuntando el índice del primero y último sumando a
la parte inferior y superior del símbolo.
n
Cuando se escribe una expresión de la fonna: indica que lo que se desea es la suma de todas las X¡
desde 1 hasta n. i=l

i.. . X2+~3+'" + .. (S)

A partir de la expresión definida en (5), los siguientes ejemplos se pueden interpretar en lenguaje corriente,
así:
3
1. = x1+XZ+X3 Sumar todos los valores consecutivos de x, desde 1 hasta 3
i=l

2. Sumar todos los valores consecutivos de y al cuadrado.


desde 1 hasta 4

m•••
• 4
3. = 3x¡+3x2+3x)+3x4 Sumar todos los valores consecutivos de x
i=¡ multipli«ados por 3, desde 1 hasta 4.
lo
no
de

al

1. La variable de adición en una sumatoria, es la que tiene el subíndice; todos los otros súubolos que no lo
llevan se consideran constantes. Ejemplos:
)

sus a) =(y¡-a)+(y2-a)+(y)-a) y = variable de adición


i=l ' .
=
a constante
2
b) = (x-l+l)+(x-2+l) = 2x-l i = variable de adición
¡=l
ion 1, x = constantes
4
c) = =variable de adición
i=l 1 =constante
lffia
2. La posición del primer elemento de la sumatoria, se indica debajo del signo, de sumatoria y la del
tos,
último, encima de él. La suma incluye todos los elementos, procediendo en orden desde el primero
' .
)

a) = Yl+Y2+Y)
i=l

4
b) = x
2+x)+x,¡
i=2

a la 3. La ausencia del Índice de la sumatoria, señala que todos los se están considerando. Ejemplos:
,dice
Si Xl =3; X 2 = x) = -5; = 10
do a
Yl=-2;Y2=8;'y)=0;Y4 =5

a) = 2+x)+x,¡ = 3 + 4 + (- 5) + 10 = 12
asX¡

b) 2 2 2 2 = (-2)2
= Yl+Y2+Y)+Y4 +82 2= 4 + 64 + 0
+O2+5 +2 5
=39

e) = = 3(-2)+4(8)+(-5)0+10(5)
-6+32+0+50 76.
iente, 3 3 2
4. La expresión es diferente de Ejemplos:
i=l i=¡

ta3 Si Xl =2; X2= 3; X) =4


3
a) + + =22+3 2+42 = 4+9+16 = 29
lrado, i=l

3 2 2 2 2
b) = (X l+X 2+X) = (2+3+4) = 9 =81
1=1

.... -!~~• •..


~
. . •
Se puede observar que los resultados de ambas proposiciones son diferente: 81. El ejemplo del inciso

a) significa: "Elevar al cuadrado cada valor de x y luego sumar estos resultados". El ejemplo del inciso b)

significa: "Sumar los valores de x y después, elevar al cuadrado esa suma", ; -

"::;.

Si XI = 2, Xz = 3, x 3 = -1, =-2
Yl = 1, Yz = -1, Y3 = 2, Y4 =-3
Comprobar si son iguales los resultados de:
4 4
2 Y L(XiYi+ 2)
i=l i=l

5. Evaluar una sumatoria es desarrollar dicha sumatoria; es decir, sustituir


valores, operar y determinar la suma Ejemplos:

Si Xl =6; X2 = 8; x3 =-6 Evaluar las siguientes sumatorias


YI =2; Y2 = -3; Y3 = -2 Escril
3
2 2 2
a) = (Xl +X2 + x3) +1 • 00 Desarrollo de la sumatoria
i=l

=[6 +8 +(-6) +1 1 ._. Sustituyendo valores

= (36+64+36) + 1 .0. Operando

= 137 oo' Resp. Suma final


Escrib
3
b) L2xiYi = 2XzY2 + 2X3Y3 ... Desarrollando la sumatoria
i=2 7.
= 2(8)(-3)+2(-6)(-2) ... Sustituyendo valores
9.
=-48+24 .., Operando
11.
=-24 ... Resp. Suma final

2 3 Dadas:
c) (Xl + xz) • (YI + Y2 + Y3) ... ¿Qué se hizo? sumatoJ
i=l i=l
= (6+8)(2-3-2) ... ¿Qué se hizo?

= 14(-3) =-42 ... Resp. Suma final

• •Horado Reyes Nüñez


~
-inciso 6. En una sumatoria como ¿XiYi =
3
+ X3Y3 el miembro de la izquierda
.
. .",
,.

11
:iso b) del signo n:::n se le llama forma compacta de la y el de la derecha,
se le llama forma desarrollada de la

Ejemplos:
Determinar laforma compacta de las siguientes sumatorias:
3
a) 2XI+2x2+2x3 ::: .,. Resp.
i=1
2
b)(x¡-l) + ... Resp.
i=l
3
- a) '" Resp.
3
= 3Yi) ... Resp.
i=1

matorias
Escribir laforma

6 5 5
oria
1. 2. 3.
i=1 1=1 i=¡
7 4 3 2
4. 5. 6.
i=1 i=l i=1

Escribir laforma compacta de las siguientes sumatorias:

ltoria
7. 8.

9. 10.

11. 12.

Dadas x¡= 1; X2 = 3; x3 ::: 5; X4 ::: 7; f I = 1, f 2 = -5; f 3 ::: O; f 4 = -2; evaluar cada una de las siguientes
sumatorias:
4 4
32
14. 15.
13. ¡=2
i=¡ i=l

3 3 3
4 2 2
16. 3Xi f i 17. 18.
i=2 i=l i=1

Evaluar las siguientes sumatorias si:

Xl = -2; X2 = 3; X3 = 1; =O
YI= O;Y2=-1;Y3=-2;Y4=-3
=
a 3; b = -2; c = 1; f =-3

4 4 3 2
19. + by0 - c 20. f(3Xj-2Yi) 21. ab(2xi-Yi )
i=l i=\ i=l

de y de no
Cuando se han obtenido los datos, se procede al cálculo de cie,rtos valores que describen la muestra o la
población Los cálculos de usualmente afectan a todos
datos. número de datos es grande se procede a agruparlos, 'calculándose las medidas correspondientes
de esta última forma. Se comienza por el cálculo o se tienen pocos datos, de fOrma que
no se efectuará ningún tipo de agrupación. La m
peque
Cuando los datos que se han recabado, no se han hecho con ellos ninguna agrupación se tiene que se
llaman: no agrupados. Este tipo de datos lo único que requiere de preferencia para el estudio
estadístico, es una ordenacion ascendente de ellos. el nún
es la 1
mediá aritmetica: Es una medida que da el centro de un corijunto de datos organizados preferentemente repres,
en orden ascendente. Para su cálculo, se suman todos los valores de las observaciones y se divide por el Ejt
número de observaciones realizadas. Usualmente se usa la letra X con una barrita sobre ella:

Media PobÚlcional (>~'¡;';¡:i+~!.+ JtN .. , (6)


donde: = Media Poblacional (Letra
griega, se lee mu)
Xl, X2' X3.··· XN : Valores de la
X =
n = Número de observaciones de la
Media Muestral muestra
(6.1) X = Media Aritmética muestral para Ejel
no agrupados
N = Número de observaciones de la
población Solt

El número único. que representa lo "promedio" o "típico" de un conjunto de datos valores o puntajes. por
lo general se localiza hacia el centro o hacia el medio de la distribución en la que la mayoría de los puntajes
tienden a concentrarse.

oraclo Re es Núñez
- "

Ejemplo l.
M""E'.·Nu"·"'é"i"'M . .

Hallar la media aritmética de los pesos de cinco estudiantes, si sus pesos son: 56, 47, 61, 44,
78libras.

Solución:

44,47,56,61,78 ... Ordenando los pesos en forma ascendente.

= = 57.2 libras o ••Calculando la con la fórmula (6.1)

media aritmética de los pesos de

los cinco niños es: =57.2 libras ... Resp.

Ejemplo 2.
Una compañía tiene 8 empleados, los cuales ganan al mes L. 876.50; L. 786.87, L. 567.00,
L. 800.00, L. 669.80, L. 700.00, L. 550.60, L. 567.13 respectivamente. ¿Cuál es la media
mensual que se paga?

L. = L. 5 90 = L. 689.7375
i o la
)s Elpromedio de pago por empleado

ientes es de L. 689.74 al mes ... Resp.

que
La media se calcula muy fácil y es muy utilizada. Tiene un inconveniente, si el tamaño de la muestra es
pequeño y hay una observación muy grande, la media crece desmensuradamente.
se mediana: Es el valor de la variable que ocupa la posición central de una distribución. Una vez
studio ordenados de menor a mayor los datos de una muestra o población, si el número de datos es impar entonces
el número del medio de la distribución es la mediana; y si el número de datos es par entonces la mediana
es la media de los dos. números del medio de la distribución. Generalmente se usa el símbolo "Me" para
representarla.
por el Ejemplo l.

Hallar la mediana de una muestra, cuyas observaciones son 5,8,3,6,9,4, 10.

Solución:

3,4,5,6,8,9,10 ... Ordenando de menor a mayor


I 7 es el total de observaciones en la ... La muestra' tiene número impar de
1
muestra. La cuarta observación o observaciones
le la sea el número 6 es la mediana,

s de la mediana es: Me =6 ... Resp.


Ejemplo 2.
al para
Hallar la mediana de una muestra cuyas observaciones son: 3, 6,4, 7,9, 8.
:s de la
Solución:

3, 4, 6, 7, 8, 9 ... Ordenando de menor a mayor

6 es el total de observaciones en la ... Número par de observaciones

ajes, por muestra. mediana es = 6.5

puntajes
mediana Me = 6.5 ... Resp.

••
. .)
~

La mediana al igual que la media, puede ser un número que no corresponde a ninguna observaci6n.
11
moda: de un conjunto de observaciones es aquel valor que ocurre mayor número de veces en una.
distribución. Generalmente se usa el símbolo "Mo" para representarla.

Ejemplo 1.
Hallar la moda de las observaciones: 7, 8, 4, 6, 5, 6, 6,

Solución:

4,5,6,6,6,7,8 ... Ordenando de menor a mayor

La observaci6n 6 es la que ... Número que se repite más veces: 6


ocurre más veces, luego
la moda es 6. Mo = 6 ... Resp.
Ejl

Ejemplo 2.
Hallar la moda de las observaciones: 2, 7, 5, 3,4,6,5,7 Sol

Solución:
2,3,4,5,5,6, 7, 7 ...Ordenando de menor a mayor

Las observaciones 5 y 7 son ... Números que se repiten: 5 y 7

las que aparecen más veces


repetidas y en igual número.
La moda es: Mo =5 YMo =7 ... Resp.

Se dice en este caso que la muestra es bimodal porque tiene dos modas

A se pregunta cual de las medidas de tendencia central debe usarse. No puede responderse a esta
interrogante satisfactoriamente para todos los casos. es muy fácil de calcular y dá mucha
infonnaci6n, pero se ve afectada por valores extremos de la muestra. mediana no viene afectada por las
medidas extremas y por eso, a veces es más aconsejable como medida de tendencia central. moda es
casi inútil como medida de tendencia central cuando la. muestra solo contiene un número reducido de
observaciones, su significación aumenta con el tamaño de la muestra.

.
La calculadora científica CASIO'fx-82 MS y modelos equivalentes en su modo estadísticos (SD) puesto en
pantalla, permiten la resoluci6n de problemas estadísticos en una y dos variables. En una variable las
operaciones estadísticas que se pueden realizar son: la media aritmética muestral la desviaci6n
estandar muestral (s) y la desviaci6n estandar poblacional (a). Veamos algunos casos:

Ejemplo 1.
Hallar la la media aritmética de los pesos de 5 estudiantes si sus pesos son 56, 47, 61, 44 y 78 libras En toe
respectivamente para el
l. Los
Solución: eXpl
a) Encender su calculadora Teclear: l. l. 3 111 para borrar todo el contenido de la 148,
memoria de la calculadora 145.

m
••
• ñ-,e,---z
- I b) Seleccionar el modo estadístico en una variable. Con su calculadora encendida pulsar •
MODECLR
y

I
S-YAR .
luego teclear ; aparecerá en la pantalla en ícono "SD"
una
c) Ingres·ar los datos de la siguiente manera: 56 y aparecerá en la pantalla "n=" en la parte
superior izquierda y "1" en la parte inferior derecha; 47 la inferior derecha a "2"

61 44 78 al ingresar el último dato 78 aparecerá en la pantalla n=, 5 que indica

el total de datos ingresados.


.
d) Presionar y aparecerá en la pantalla: a continuación teclear
y se obtiene en la pantalla 57.2 que es el valor buscado de la media.

I Ejemplo 2.

La media aritmética de los pesos de los 5 estudiantes es: = 57.2 libras oo. Resp.

I
Resolver el problema número 2 de la página 65 que dice: "Una compañía tiene 8 empleados.... "

Solución:
MODE
a) Teclear: • • 3 (11 (11 oo' Para borrar todo en la memoria de la
calculadora
S·YAR
b) Teclear: _ oo. Aparecerá en pantalla el ícono "SD"

c) Teclear: 550.60 ... Ingresando los datos


669.80 786.87 ; 800.00
876.50

d) • 1 Y se despliega en la pantalla .oo Calculando. la media de los datos


se a esta
mucha •
a por las
moda es El pago promedio por empleado es de L. 689.74 al mes ... Resp.
ucido de
1. En este modelo de calculadora solo se puede calcular la media aritmética
de datos no agrupados, de acuerdo los algoritmos explicados en la
solución de los 2 problemas anteriores.
2. Se rec9mienda ·borar el contenido de la memoria antes de realizar otros
cálculos estadísticos, utilizando el algoritmo explicado en el inciso a) de
mesto en los ejemplos 1 y 2 anteriores
iable las

·78 libras
para comprobar el resultado ..
1. Los siguientes valores corresponden a las estaturas un grupo de alumnos de una institución "HGB"
expresada en centímetros:

mido de la 148, 160, 145, 184, 155, 138, 174, 156, 150, 156, 159, 156, 148, 173, 172, 145, 145, 160, 145, 146, 150,

145.

Determinar: a) la media, b) la mediana, c) la moda de esas alturas

ú'"ñ.-ec-:z'";• •
'. . •.• ii,i.ij,iifM'i,im
I

2. Roberto encontró que las edades de 10 de sus profesores del colegio eran 29,26,37,28,30,45,22,27,31

Y28 años. Detenninar: a) la media, b) la mediana, c) la moda de las edades.

3. Luis Antonio obtuvo las siguientes puntuaciones en una carrera de obstáculos: 78, 89, 76, 77, 77, 77, 78,

78, 79, 70, 68, 75, 80 puntos. ¿ Cuál es la media, mediana y moda de esas puntuaciones?

4. Las temperaturas más bajas de cada día en grados centígrados fueron las siguientes: 13, 14, 15,23, 13, 15,
12.
12, 13, 12, 14, 13, 12, 13,20,20 ¿Cuál es la media, mediana y moda de esas temperaturas?

5. Las alturas en m. de cierto número de estudiantes fueron las siguientes: 1.60, 1.65, 1.65, 1.65, 1.65, 1.65,

1.70, 1.70, 1.70, 1.75, 1.80, 1.67, 1.80, 1.90, 1.77, 1.75 ¿Cuál es la media, mediana y moda de estas

estaturas?

1
6. La distancia media del sol a cada uno de los nueve planetas aparece en la tabla siguiente: (distancia en

e
millones de Km):

13.L

Venus
.
·Z~~::

¿Cuál es la distancia media de los nueve planetas al sol?

7. Una empresa informó que la participación de los accionistas (ajustada para una cartera de acciones
comunes de 5 a 3 pagada en enero de 1999) durante los últimos 11 años es: (por acción común en
lempiras); .

21.07, 23.24, 26.28, 28.55, 30.09, Unac


29.15, 29.10, 28.92, 29.90, 30.34, 32.41 obser

¿Cuál es la media, mediana y moda de la participación de los accionistas? La


no
8. Una compañía petrolera ha tenido las siguientes cifras de ventas e ingresos de operación en millones de
corres
lempiras. Calcular la media, mediana y moda anual de esos valores.

Los sil
6253,9555, 12496,14708,17717,19116,15856,14154, 15344,17096 enprol

9. El Ministerio de Educación informó que durante los últimos años recibieron grados de Licenciatura en

Ciencias Matemáticas e Informática Administrativa el siguiente número de personas: 5 033, 5 652, 6407,

7201,8719, 11 154, 15 121. ¿Cuál es el promedio anual de personas graduadas? ¿es una media muestral

o pob1acional?

10. El mismo Ministerio informó que durante los últimos años, el número de mujeres que recibieron grados

doctorales en Ciencias Matemáticas e Informática Administrativa fue: 23, 19, 15,30,27, 25. ¿Cuál es el

número medio anual de mujeres que reciben ese grado? ¿Se trata de media muestral o pob1acional?

11. El Gerente de Producción de la imprenta Prografip desea determinar el tiempo promedio que se necesita

para fotografiar una placa de impresión. Utilizando un cronómetro y observando a los operadores, registra

los tiempos siguientes (en segundos).

m•
•• ....ú ñ.-e-z
-
27, 31 20.4, 20.0, 22.2, 23.8, 21.3, 25.1, 21.2, 22.9, 28.2,24.3,
22.0, 24.7, 25.7, 24.9, 22.7, 24.4, 24.3, 23.6, 23.2, 21.0

7,77, 78, Un tiempo promedio por placa menor a las 23.0 seg. indica una productividad satisfactoria. ¿Debería

estar preocupado el gerente de producción?

13, 15, 12. Un fabricante de cosméticos adquirió una máquina para llenar botellas de perfumes de 3 mI. Para probar
la precisión de volumen que deposita la máquina en cada botella, se hizo una corrida de prueba con 18
recipientes. Los volúmenes resultantes (en ml) de la prueba fueron:
l,65, 1.65, 3.02, 2.89, 2.92, 2.84, 2.90, 2.97, 2.95, 2.94, 2.93,
a de estas 3.01, 2.97, 2.90, 2.94, 2.96, 2.99, 2.99, 2.97.

La compañía no está dispuesta a recalibrar la máquina, a menos que el volumen promedio de llenado

istancia en esté a 0.04 ml por debajo de los 3 ml. ¿Deberán recalibrarla?

l3.La compañía XYZ tiene un contrato de crédito rotativo con El crédito tiene los siguientes
saldos mensuales el año anterior:

Enero L. 121300 May. 72800 Sept. 50400 La compama es elegible para


Feb. 112300 Jun. 57300 Oct. 52800 otorgarle una tasa de baja, si
Mar. 72800 Ju1. 58700 Nov. 49200 su saldo mensual promedio es mayor
Abr. 72800 Ago. 61 lOO Dic. 46100 de L. 65 000.00 ¿La compañía obtiene
la tasa de interés baja?

le acciones
común en

Una distribucion de frecuencia simple, es aquella en donde figuran los valores de la variable realmente
observados, con sus respectivas frecuencias o número de veces que aparece repetida en la distribución.

La tabla o distribución siguiente muestra un ejemplo de datos agrupados en frecuencia simple, en la que
no existen agrupaciones, sino los valores reales de la variables y la suma de las frecuencias
millones de correspondientes al total de observaciones: f = n

Los siguientes datos corresponden al aumento de peso en gramos, de pollos alimentados con una dieta rica
en proteínas.

:enciatura en
652, 6407,
:dia muestral

,ieron grados
i. ¿Cuál es el
ional?

le se necesita
lores, registra

Bajo estas condiciones la media, mediana y moda se obtiene de la siguientefonna:

donde: = Media poblacional


n = Tamaño de la muestra
Media aritmética f = Frecuencia
X = Valor de la variable

r (7.1j
N = Total de observaciones de la población
= Sumatoria de los productos fX
= Media muestral
c)

La mediana: Es el valor de la variable que ocupa la posición central de la distribución. La posición de ese
valor, se calcula con la fórmula:

donde: n =Tamaño de la muestra


P =Posición de la mediana
N =Total de observaciones de la población

Para calcular su valor, se necesitan las frecuencias acumuladas de la distribución y después determinar en
cuál de ellas está contenido el valor de la posición P.

La moda: Es el valor de la variable que tiene mayor frecuencia en la distribución. Para su cálculo, no
se necesita efectuar ninguna operación. a)

Ejemplo l.
En la distribución de la tabla de la página anterior, calcular el valor de: a) la media, b) la mediana, c) la
moda
Solución:
2 3
a) ... Calculando el producto de la frecuencia (f) con
su respectivo valor de la variable (X) y sumando
estos productos. Columna 2. =980.7 x
oo. Sumando las frecuencias (f). Columna 1.
=n
oo. Calculando fa. Columna 3. b) P

n= 75 980.7 (

= = 980.7= 13.076 oo. Calculando la media X con la fórmula (1)


N 75 M,
=13.1 gramos oo' Resp. Con una cifra de aproximación
Calculando la posición de la mediana (Me). c) Me
b) P = = 38 a oo'

Fórmula (8)

-.Horado Reyes
- Clase mediana: 13.1 ... Es la clase de menor valor de fa. que contiene el

)lación
II c)
Me = 13.1 gramos

Mo = 13.1 gramos
valor de P = 38. El valor 38 está contenido en
59. Columna 3.
... Resp.

... Es el valor de la variable que tiene mayor


frecuencia f. Columna 1. ... Resp.

Ejemplo 2.

Se pidió a reclutas de una academia de policía, se sometieron a una prueba que mide la capacidad para

el ejercicio. Se midió dicha capacidad en minutos y se obtuvieron los siguientes datos: Calcular a) la

media, b) la mediana y c) la moda.

1 de ese

lación

ninar en

Solución:
.culo, no 2 3
a) ... Sumando las frecuencias (t) Columna 1.
=n
... Calculando el producto de fX y la suma de ellos.
ana, c) la Columna 2

... Calculando fa. Columna 3

n = 20 550
ia (t) con
sumando
x= n
= 550 = 27.5
20
... Calculando' la media
0.7
1. 27.5 minutos ... Resp.

b) P= n+l = 20+1= 10 5a ... Posición de la mediana


2 2 .
Clase mediana: 28 ... Clase de menor valor de fa. que contiene el
valor de la posición P = 10.5. Este valor está
contenido en 15. Columna 3.
Me = 28 minutos ... Resp.

a (Me). c) Mo = 28 minutos ... Es el valor de la variable que tiene mayor


frecuencia f. Columna 1. ... Resp.

•m
o-r-a-c-,i.-o--¡;¡R.,e::-y-e.,--s-=---iN~ú-:;;¡ñ~e~z • •
'. .

A veces se asocia a los números Xl, XZ' X3, ... Xk, ciertos factores o pesos w¡, W3,... Wk que dependen de la
significaci6n e importancia de cada uno de los números. En este caso se llama media aritmétil:a ponderada
la cual viene dada por la f6rmula:

(9) donde: w media aritmetica ponderada


x Valores de las variables
W Peso, ponderación o número
de veces que se cuenta una
partida de la serie
sirn¡
Ejemplos:
1. En una compañía constructora, 10 asesores principiantes reciben L. 60.00 cada uno; 4 asesores
antiguos reciben L: 85.00 cada uno y un asesor especialista L. 125.00 como complemento de sus
sueldos. Es evidente que las diferentes cantidades recibidas son de distinta importancia y que es
necesario ponderar estas tasas con el número de personas que reciben estos complementos para
poder determinar el pago promedio correcto. La media aritmética se convierte así en una media
ariunética ponderada, donde:

X¡L.60.00; W¡ = 10 asesores principiantes

L.85.00; = 4 asesores antiguos

X3 = L.125.00; W3 = 1 asesor especialista

Con los datos anteriores y con la fórmula (9) se tiene:


= L. 60.00 (10 asesores)+L. 85.00(4 asesores)+L. 125.00(1 asesor)
7. Un
w (10+4+1) asesores

en 1
600 (L. x asesor)+340 (L. x asesor)+ 125 (L. x asesor) = 1 065 L. x = L. 71.00
15 asesores 15 x 8. Por
últi¡
Entonces: L. 71.00 es media aritmética ponderada ... Resp. que
cali:J
2. Un profesor de matemática decide medir la importancia relativa de las 5 calificaciones bimestrales
de un alumno que obtuvo 50%, 80%, 70%, 70% Y 65% de acuerdo a la duración; esto es, 1,2,3,2,3 9. Las
a) ¿Cuál es la media aritmética simple? b) ¿Cuál la ponderada?
¿CU¡
a) 50% + 80% + + 70% + 65% = = 67.00%
10. Una
pesa:
Entonces: 67.00% es media aritmética simple ... Resp. los c
b) ¿ W= 1+2+3+2+3 = 11 H. Una
L.
= 50%(1)+80%(2)+70%(3)+70%(2)+65%(3) = (50+160+210+140+195)% = 755% es la

= = 755%= 68.64%
12. Una
w 11
. aCUer
utilid
Entonces: 68.64% es media aritmétil:a ponderada ... Resp.

-.Horacio Reyes Núñez


-
n de la
derada Resolver el ejercicio N° 19 de la Guía de Estudio N° 10

!derada

número
lta una
I simple.
......:.. :.: : :.. :

. :.:.:.:.:
.:

.
10
de las siguientes distribuciones de frecuencia

l. 3.
1 2.5
lsesores .... 3.8 15.3 .
) de sus 5 8 4.9 17.2 8
, que es 7 5 5.1 5 19.2 10
tos para 9 3 2 21.2 1
a media 1 4 4

4. :~¡ :¡:¡ ¡ : 5. 6.
12.5 22.55 123.8
15.5 6 23.6 2 126.9 10
18.5 11 24.7 3 129.0 8
21.5 9 27.1 9 133.1 15
24.5 7
29.2 13 . 136.2 9
4
8 7

7. Un elevador de un hotel está diseñado para soportar un peso máximo de 2 000 libras. ¿Se sobrecarga si
en un viaje transporta 8 mujeres que pesan 123 libras y a 5 hombres que pesan 174 libras cada uno?
00 8. Por un error un profesor ha borrado la calificación que recibió uno de 10 alunmos en u'! examen del
último parcial de Contabilidad. Sin embargo él sabe que los alunmos promediaron 71 % en el examen y
.. , Resp. que los otros 9 recibieron calificaciones de 99, 44, 82, 70, 47, 44,82,78, 82. ¿Cuál debe haber sido la
calificación que borró? Calcular la mediana y la moda de esas calificaciones de los 10 estudiantes.
mestrales
.2,3,2,3 9. Las puntuaciones finales en Inglés, Computación, Contabilidad, Matemática y Español de un
estudiante fueron: 78%, 85%, 63%, 70%, 80% respectivamente. Si tenían 4,6,5,5,3 créditos o U.v.,
¿Cuál es su promedio adecuado?

10. Una línea naviera embarca 80 contenedores con aguacates que pesan 2235 lbs c/u, 60 con bananos que
pesan 4280 lbs y 40 con piñas que pesan 2 835 lbs c/u. Calcular el peso promedio ponderado de todos
... Resp. los contenedores.

11. Una compañía de TV pagó dividendos en efectivo por acción de L. 53.20 a 500 de sus socios en 1993;
L. 65.32 a 575 socios en 1994; L. 73.20 a 608 socios en 1995 y L. 87.32 a 660 socios en 1996. ¿Cuál
¡% es la media ponderada del dividendo anual del período?

12. Una compañía embotelladora ofrece 3 tipos de servicio de entrega. La utilidad por entrega varía de
acuerdo con el tipo. Para determinar que efecto tiene si lo hay, cada tipo de entrega en el cuadro de
utilidades, la empresa ha hecho la tabulación que sigue en base en las entregas del trimestre anterior.
... Resp.
.m
••

,'. .n .

promociones especiales y cuidadosa


planificación ¿cuál sería su utilidad por
entrega, si las 100 tiendas que solicitan
servicio de inmediato cambiaron al
servicio durante el mismo día?

13. En cierto año, el lenguado, el bacalao, la perca,· el abadejo y el atún han producido a los pescadores
comerciales 54.0, 58.6, 26.6, 33.9, Y 61.6 centavos por cada libra de pescado respectivamente. Dado
que la pesca correspondió a 254 millones de libras de lenguado, 33 millones de libras de bacalao, 13
millones de libras de perca, 112 millones de libras de abadejo y 279 millones de libras de atún. ¿cuál es
el promedio general de los precios por libra que reciben los pescadores?

14. En un análisis de las llamadas telefónicas que salían a diario de una oficina se determinó que 64
llamadas de 3 minutos o menos promediaron 2.3 minutos; 47 llamadas de mas de 3 minutos pero no
mas de 10 minutos promediaron 6.1 minutos; y 4 llamadas de mas de 10 minutos duraron un promedio
de 20.6 minutos. ¿Cuál es el promedio de la duración de esas llamadas?

15. Como parte de un proyecto de investigación, los investigadorert>btuvieron los siguientes datos respecto
a los niveles de peróxido lípido en el suero informados por un laboratorio para una muestra de 10
individuos, adultos bajotrátamiento de diabetes mellitus; 5.85, 6.17, 6.09, 7.70, 3.17, 3.83, 5.17,4.31,
3.09,5.24. Calcular la media, mediana y moda. Explique su resultado Ejell
1
I
16. Los siguientes datos representan los valores de lípido obtenidos a partir de la muestra de 10
adultos aparentemente sanos; 4.07, 2.71, 3.64, 3.37, 3.84, 3.83, 3.82,4.21,4.04,4.50. Para estos datos;
calcular la media, mediana y moda. ¿Qué representa cada uno de esos· valores?

17. En 4 depllI'ÚlIIlentos de una compañía, 190 trabajadores reciben en promedio un salario de L. 4.80 por
hora; 610 trabajadores una paga por hora cuya media es L.8.90; 180 reciben un promedio de L. 12.65
por hora y 20 reciben. una paga en promedio de L. 14.10 por hora. ¿Cuál es el promedio general del
.salario por hora que se paga a estos trabajadores?

18. Si un trabajador recibe L. 9.50 por hora en las.4O horas de trabajo ordinario, una y media veces este
sueldo por 10 horas extras entre semana' y el doble de la tarifa por 4 horas de trabajo en Sol
¿Cuál es el promedio del sueldo por hora de ese trabajador?

19. Durante la campaña de ventas de fabricantes de cierto equipo, los 20 trabajadores del centro
promediaron 150 nuevos contactos de compra, los 2S del norte promediaron 180 y los 15 del sur
promediaron 160. ¿Cuál fue el promedio total de los nuevos contactos de compra logrados por esos
vendedores?

Reyes Núñez
-
la
de
y
y
de y de

pañía
los La media
de
ladosa Algunas veces la .variable toma muchos valores distintos y se organizan en tablas de distribución de
Id por
frecuencias, donde no figuran los valores de la variable realmente observados. El cálculo de la media en
,licitan
on al casos como éste, será una aproximación. En esa tabla de distribución de frecuencias, los intervalos de
clase (X), se sustituyen por sus puntos medios o marcas de clase (Xm), que son valores singulares y, la
media resultante puede variar ligeramente según sea el agrupamiento.
adores . La aritmética con ·las características anteriormente apuntadas, se calcula con la fórmula (lO)
. Dado cuando es media muestral y con la (lO. 1) cuando es poblacional.
lao.,13
cuál es
donde: Media aritmética poblacional
(lO) = Media aritmética muestral
que 64 .f = Frecuencia de la clase
)ero no Xm = Marca de clase
omedio
n = Tamaño de la muestra (n = f)
(10.1) N = Tamaño de la población
'especto
a de 10
7,4.31, Ejemplo 1.
La siguiente tabla muestra la distribución de la estatiuaen pulgadas de 80 estudiantes de un instituto de
Educación Media. Calcular la media de las estaturas esos estudiantes, si se supone que es una
'a de 10 muestra.
)s datos;

...... :.:.:.:.:.:
4.80 por
L. 12.65'
neral del
•.• :• •.••.
:: •.:·..:.••...•.:.•.•.• ..
eces este
Solución:
jomingo, 1 2 3

el centro
5 del sur
: por esos

t
Horacio Reyes Núñe.
.,: ••"•.• ... ".

Pasos: 1. Elaborar una distribuci6n de frecuencias igual al cuadro dado.
2. Calcular n = = 80. Columna 1. L'
3. Calcular las marcas de clase (Xm) de cada clase con: Xm = 1)

la clase: Xm = 61; 2a clase: Xm= (63;65) 64; ... etc. Columna 2.

4. Calcular el producto de la frecuencia (f) por las marcas de clase (Xm) para cada clase y sumar
estos productos. Columna

la clase: fXm= 15x61 =915; 2a clase: fXm= 19x64 = 1216; ... etc.

5. Calcular la media con la f6rmula (lO)

=66.36
estaturas de esos estudiantes es: 66.36 pulg ... Resp. 1.
2.
Ejemplo 2.
Calcular la media aritmética de la siguiente dislribuci6n suponiendo que es una muestra. 3.
4.
5.
.
Desl

1.

2.

~ 3.
Soluci6n:
1 2 3

Lal
Es UI
50%

Para,
En di
f6rm\

Pasos: 1. Construir la dislribución de frecuencias igual al cuadro dado


2. Calcular n = =130. Columna 1. (Ls + Li)
3. Calcular las marcas de clase (Xm) de cada clase con: Xm = 2 Columna 2.
(65+69) (70+74)
1a clase: Xm - 2 - 67; 2a clase: Xm = 2 - 72 ... etc,


• •Horacio Reyes Núñez
..
.•ii,i.ij,d'.j,im ~. .
4. Calcular el producto de la frecuencia (f) por la marca de clase (Xm) de cada clase y sumar estos
productos. Columna 3.

18 clase: fXm = 13x67 = 871; 28 clase: fXm = = 1440; ...etc. = 10,690

5. Calcular el valor de la media conJa fórmula (10)

= = 10,690 82.23

n 130

La la distribuci6n es: 82.23 oo. Resp.

y de

. Resp. 1. Todo conjunto de datos posée sola media. Es una medida calculable.
2. Sirve para realizar procedinúentos estadísticos como la comparación de las medias a partir de varios
conjuntos de datos.
3. Es una medida confiable y no necesita ninguna ordenación de los datos.
4. El uso de la media se restringe exclusivamente a datos por intervalo.
5. Si se desea utilizar un estadístico muestral como estimación de un parámetro de la población, la media,
es la mas fácil de aplicar.

1. La media es afectada por los valores extremos (Valores muy pequeños o muy altos) que no son
representativos del resto de ellos.
2. Su cálculo es tedioso debido que usa todas las observaciones de la distribución, salvo el caso cuando
éstas se agrupan en clases.
3. Es imposible calcular la media para un conjunto de datos que tengan clases abiertas en su extremo
superior o inferior (investigar lo que son las clases abiertas).

La media1Ul:
Es un valor central de una distribución. El 50% de las observaciones está por arriba de este valor y el otro
50% está por debajo de él. Se suele representar con el súnbolo "Me".

Para obtener el valor de la (Me) de datos agrupados, se usa la fórmula (11) dada a continuación.
En dicha fórmula se necesitan los limites reales de clase (Lrs, Lri) y la frecuencia acumuladas (fa). Esta
fórmula se emplea para una muestra (n) o una población (N).
•• , •••••••••••• , •••••••

...
o" •

.. donde: Me = Mediana
(ll) . Lri = Límite real inferior de la clase mediana
••...•....... .( C Tamaño o ancho de la clase mediana
= Suma de todas las frecuencias de las clases
por debajo de la clase mediana
n =La mitad de las observaciones. Posición de
la mediana.
fMe = Frecuencia de la clase mediana

Horado Reyes
I

Ejemplo 1.
Calcular la (Me) de las estatura de los 80 estudiantes, cuya distribución se da en la página
69.

Solución: 2 3

Pasos: 1. Calcular n = = 80. Columna 1.

2. Calcular la frecuencia acumulada fa. Columna 2.

3. Calcular la posición de la mediana con: = = 40 a

4. Ubicar la clase mediana (C.Me) en la distribución. La clase mediana es la clase de menor


frecuencia acumulada (fa) que contiene a 40. Esta clase es 66 - 68 (Ver eMe. en el cuadro de
arriba)

5. Calcular la suma de todas las fa. por debajo de la de la clase mediana. Este valor corresponde a:
= 34. Columna 2.

6. Ubicar la frecuencia de la clase mediana: fMe = 21. Columna l.marcada con doble asterisco (**).
(Ver cuadro de arriba).
7. Determinar el límite real superior (Lrs) y el inferior (Lri) de la clase mediana. Columna 3.

Lri = 66 - 0.5 = 65.5; Lrs = 68 + 0.5 = 68.5

8. Calcular el ancho de la clase (C) mediana: C = Lrs - Lri = 68.5 - 65.5 = 3

9. Calcular la mediana (Me) con la fórmula (11)

Me=65.5+3 [40-34]
... Sustituyendo valores en la fórmula
21
(11) y operando

= 65.5 + 3[

= 65.5 + 3(0.2857)
= 65.5 + 0.8571 = 66.3571 Venta)
Me = 66.36 pulgadas valor de distribucion ... Resp. ¿qué significa? 1. Los
2. Pue<
lam
3. Pue<

m
••
• Reyes Núñez

ágina
I Ejemplo 2.
Calcular la mediana (Me) de la distribución del ejemplo 2 de la página 70·
~
. .

Solución: 1 2 3

130

Pasos: 1.n= 130 ... ¿Qué se hizo?, ¿Cómo se hizo?


2. Calcular la columna de las fa. oo' Columná 2. ¿Cómo se hizo?
3.
2
130
2
= 65 a oo. Posición de la mediana
4. La clase mediana es C.Me: 80 - 84 oo. ¿Cómo se identificó? ¿Por qué?

oo' ¿Qué es esto? ji Explique !!

= 43
menor
6.fMe =32

oo. Frecuencia de la clase mediana marcada con


¡dro de
doble asterisco. Columna 1.

onde a: 7.Lri = 80 - 0.5 = 79.5 ... Calculando los limites reales de la clase mediana
Lrs = 84 + 0.5 = 84.5 Columna 3.
co (**). 8.C = Lrs -Lri = 84.5 -79.5 = 5 oo. Calculando el ancho (C) del intervalo de la clase
mediana.

9. Calcular la mediana (Me) con la fórmula (11)


Me = 79.5 + ... Sustituyendo en fórmula (11) y operando
22
= 79.5 +

= 79.5 + 5(0.6875)

f6nnula = 79.5 + 3.4375 = 82.9375

Me = 82.94 valor de la mediana de la ... Resp.

Ventajas:

1. Los valores extremos no le afectan tan profundamente como a la media.


2. Puede ser calculada aún con aquella distribución de frecuencias que tienen clases abiertas, a menos que
la mediana caiga dentro de una de ellas.
3. Puede usarse como una localización central para datos cualitativos y cuantitativos.
. .:
Desventajas:

1. No se puede calcular la mediana de una distribución de datos nominales.
2. Ciertos procedimientos estadísticos que se sirven de ella, son mas complejos que los que usan la media.
3. La mediana, siendo un promedio de posición, exige organizar los datos antes de realizar los cálculos.

moda:
Es el valor que más se repite en una distribución de frecuencias. Se suele usar para representarla, el símbolo
"Mo".

Para obtener el valor de la (Mo) de datos agrupados, se usa la fórmula (12) dada a continuación, la Eje]
que es utilizada tanto para una muestra (n) como para una población (N).

donde: Mo = Moda Soh


..
. ; (12) Lri = Límite real inferior de la clase modal

(C. Mo.) que es la clase que contiene a

la moda.

.
C = Tamaño o ancho de la clase modal
= Frecuencia modal menos la frecuencia
de la clase contigua anterior
z = Frecuencia modal menos la frecuencia
de la clase contigua posterior
Ejemplo 1.
Calcular la moda de la estatura de los 80 estudiantes de la distribución del ejemplo 1. de la página 69 Pasos

Solución:
1 2

Pasos: 1. Calcular n = = 80. Columna 1.


2. Identificar la clase modal (C. Mo). Es aquella que tiene mayor frecuencia dentro de la
distribución: C.Mo. : 66 - 68
3. Determinar la frecuencia de la clase modal: fMo = 21. Columna 1., marcada con doble asterisco en
la distribución
.4. Determinar los límites reales de la clase modal:

Lri = 66 - 0.5 = 65.5; Lrs = 68 + 0.5 = 68.5

5. Calcular Al y A
2
Al = f Mo - 19 = 21 - 19 = 2
Ventaja
z = fMo -18 = 21-18 = 3

6. Calcular el ancho (C) de la clase modal: C= Lrs - Lri = 68.5 - 65.5 = 3 1. La


y cua

D!I•
• • !-.----o-ra-c..--¡ z
-
7. Calcular la moda (Mo) con la fórmula (12)
2
mh"dU.f.".....
. .

Mo = 65.5 + 3 [ ]
... Sustituyendo valores en la fórmula
dia. 2
(12) y
=65.5 +
=65.5++

= 65.5 + 1.2 = 66.7

nbolo
Mo = 66.70 pulgadas valor de la moda de la distribucion ... Resp.
Ejemplo 2.
ón, la
Calcular la moda (Mo) de la distribución del ejemplo 2 de la página 70

Solución: 2

modal
:iene a

al
uencia

uencia

a69 Pasos 1. n:::: 130 ... ¿Qué se hizo? ¿Cómo se hizo?

2. Clase modal, C.Mo: 80 - 84 .,. ¿Cómo se determina?

3. Frecuencia de la clase modal: fMo = 32 '" ¿Porqué?

4. Lri :::: 80 - 0.5:::: 79.5;


... ¿Qué se hizo? ¿Cómo se hizo?

Lrs :::: 84 + 0.5 = 84.5

5. = fMo - 10 :::: 32 - 10 :::: 22


.., ¿Qué se hizo? ¿Cómo se hizo?

2 :::: fMo - 30 = 32 - 30 = 2

6. C :::: Lrs - Lri :::: 84.5 - 79.5 :::: 5 ... ¿Qué es este valor de 5?

7. Calcular la Mo con la fórmula (12)

22
.., Sustituyendo valores en fórmula (12) y
Mo = 79.5 +5(22 + 2)

operando
22

:::: 79.5 + 5("2.4)


:::: 79.5 + 5(0.9166)
o de la = 79.5 + 4.5833 =84.083

:risco en Mo :::: 84.08 pulgadas valor de la moda de la ...Resp.


distribución

Ventajas:

1. La moda puede usarse a semejanza de la mediana, como una localización central para datos cualitativos
y cuantitativos.

~_-.----=--
Horacio Reyes Núñez• •
'. .

2. No le afectan demasiado los valores extremos de la distribución 7.
3. Puede usarse sin importar la magnitud o la dispersión de los valores de la distribución
4. Se puede emplear cuando hay clases abiertas

Desventajas:

1. Se usa menos para medir la tendencia central que la media y la mediana .

2. Es una medida inútil cuando no hay un valor modal, porque el conjunto de datos no contiene valores que
ocurran más de una vez y, también cuando todos los valores son la moda, ya que ocurren el mismo
número de veces.
3. Cuando la distribución contiene 2, 3 ó más modas, es difícil interpretarlas y comparar.

8. 1
c

Resolver el ejercicio N° 13 de la Guía de Estudio N° 11

9. La
de

1. 1
3.
1 :1 8 - 10
15 -19 4 . 11 -13
10
20 -24 10
6

5. 6. 10. La
4. pese
-
. 6- 9
9- 11 .
14 O.
7 2 25.'

m•

• • HO::o,--'.,--,a-c-.¡--=o-R..--=e"':":y=-=e--=s=-N.....-.ú""jire=-=z
- .•

7. La distribución de frecuencias que se da en seguida, representa los pesos en kilogramos de una muestra
de paquetes que en mes de junio, transportó una compañía aérea.
... . 1

Calcular a) la media. b) la mediana, c) la moda de los


pesos transportados.

mismo

8. La distribución siguiente muestra la carga máxima en Ton. cortas de ciertos cables producidos por una
compañía. .

Calcular a) la media, b) la mediana, c) la moda de la


carga máxima.

·11 7
::~Jr-~';+J2:26
~ 12.7 3

9. La siguiente distribución corresponde a los pesos registrados en el correo de las cartas distribuidas el 31
:uencias de agosto de 1999. Peso en gramos.
Calcular a) la media, b) la mediana, c) la moda de los
pesos de esas cartas.

10. La siguiente distribución de frecuencias corresponde al peso de peces atrapados en las redes de los
pescadores en un día de la semana. Peso en libraS.

Calcular a) la media, b) la mediana, c) la moda de


los pesos de los peces.

úo;ñ,-e...JzO;• •
. . n

11. Las edades de los residentes en la Colonia Jardines de Loarque del Bloque 19 están descritas en la
siguiente distribución de frecuencias.
Calcular a) la media, b) la mediana, c) la moda de las
edades de los residentes en dicha colonia.
. 17.0

12. Los reclamos al del seguro de accidentes, se ajustan a la distribución de frecuencias siguientes:
Reclamos hechos durante el mes de enero de 1999.

Calcular a) la media, la mediana, c) la moda de los


reclamos durante ese mes hechos al

13. Una máquina automática llena latas de jugo de naranja. Una verificación de los pesos del contenido de
un cierto número de latas reveló lo siguiente:
Redondeando a décimas de gramos, estimar: a) la
media b) la mediana, c) la moda de los pesos del
contenido de una lata.

14. El número de sistemas de calentamiento solar disponibles al público es bastante grande y su capacidad
de almacenamiento de calor es diversa. A continuación se presenta una distribución de la capacidad de
almacenamiento de calor (en días) de 28 sistemas que fueron probados recientemente por Laboratorios
Universal.
Calcular a) la media, b) la moda, c) la mediana y
d) seleccionar la respuesta entre los resultados de a),
0. b) y c) que mejor refleje la tendencia central de los
.J . datos y justificar su respuesta.

..
• •HoracioReyes Núftez
-
en la

de las

ientes:

_de los

nido de

r: a) la
:sos del

apacidad
.cidad de
oratorios

ediana y
os de a),
al de los
.. .) •. i •.i·iiii8.i,••.•• i"·U¡ji.i,

La

Las de posici6n sirven para describir la localización de un dato específico, con relación al resto de
la muestra. Tres de las medidas de posición más populares son los llamados:

1.
2. Deciles
3. Percentiles

Los (Q): Son los números que dividen a los datos ordenados en 4 partes iguales
Los decUes (O): Son los números que dividen a los datos ordenados en 10 partes iguales
Los percentiles (P): Son los números que dividen a los datos ordenados en 100 Partes iguales

Existen 3
9 deciles:
D 2• D3•···• D9
99 percentiles: P2• P3•···• P99

El Primer Cuartil Ql:


Es un número tal que el 25% a lo más de los datos tienen un valor más pequeño que Ql y a lo más el
75% tienen un valor mayor. '
Para·
El Segundo Cuartil
Es un número tal que el 50% a lo más de los datos tienen un valor más pequeño que y a lo más el
50% tienen un valor mayor. El segundo cuartil Qz, es mediana. Pasos

El Tercer Cuartil
Es un número tal que el 75% a lo más de los datos tienen un valor más pequeño que Q3. y a lo más el
25% tienen un valor mayor.

El Tercer Decil D 3:
Es un número tal que el 30% a lo más de los datos tienen un valor menor que D 3 y a lo más el 70%
tienen un valor mayor.

El Quinto Decil D s:
Es la mediana. Es el segundo Cuartil ¿Qué significa?

El Primer Percentil PI:


Es un número tal que el 1% a lo más de los datos. tienen un valor menor que P l y un 99% a los más
tienen un valor mayor.
4
El Segundo Percentil P2: Los eje
Es un número tal que el 2% de los datos. tienen un valor menor que P2 y un 98% a los más tienen valor
mayor. Ejempll
Se 1
El 50 0 Percentil Pso: de 1
Es el Ds yel o la mediana. ¿Qué significa?

El k-ésimo Percentil. Pt :
Es un número tal que el k% a los más de los datos tienen un valor menor que P k y a lo más (100-k) %
son mayores.
Cale

. .

-.Horacio Reyes

•••••
La siguiente escala muestra la relación entre: percentiles,
•.••.i'fJA"" ••
y cuartiles
--"

; el y no
Para calcular el valor de la posición (p) y el valor (v) de los percentiles en datos no agrupados, se usará la
siguiente regla:
Pasos 1. Ordenar los datos de la distribución en forma ascendente.
2. Determinar la posición (p) del percentil deseado, con la fórmula (13) siguiente:

s el (13) donde: n =Tamaño de la muestra


k = Número del percentil deseado .

10% 3. Si el valor de la posición (p) resulta entero, entonces sumar 0.5 a ese valor y en caso contrario.
aproximar el valor de (p) al entero mayor siguiente (no usar la regla del redondeo).

Ejemplos:
a

Si P = 4 entonces la posición verdadera es: 4+0.5 = 4.5


p =4.2 entonces la posición verdadera es: 5 a

p =5.7 entonces la posición verdadera es: 6


a

más
4. Localizar el valor del percentil deseado en la distribución comenzando por la izquierda
Los ejemplos siguientes ayudarán a interpretar mejor la regla arriba mencionada:

Ejemplo:
Se tomó una muestra de 30 calificaciones de una población de resultados de un examen de Estadística'
de la Universidad Pedagógica, que aparecen a continuación:

54 58 65 68 71 71 71 73 73 74
75 76 77 79 80 81 82 82 84 84
·k) % 8688 88 91 91 93 9494 94 96

Calcular: a) el primer cuartil: b) el cuarto decil: 0 4

N •. .
I
Solución:
Pasos: 1. Ordenar los datos en formas ascendente ... Paso 1. Ordenar datos
a) Q¡ = P25 entonces: n = 30 ... Paso 2. Determinar la posición del
k=25 percentil deseado. Fórmula (13)
nk
p= 100
1.
30x25 a
... Paso 3. Si P =7.5a entonces la verdadera
p 7.5
posición es la S8.
p=S8 2 .1
Q¡ =P2s =73 ... El valor de este cuartil es el que ocupa la
S8 posición en la distribución contando
de la izquierda a la derecha.
Ql =73 ¿Qué significa? ...Paso 4. ... Resp. 3. 1
í
b) D4 = P 40 entonces: n=30 ... Paso 1. y paso 2. Explique lo que hizo. s
k=40
4. (
_30x40 _ 128 h
P - 100 ­
5. E
p= 12+0.5 ... Paso 3. Si P = 12. entonces la verdadera 8
P =12.58 posición está en 12.5 8
6. L
- 76 2
D4- + 77 -- 76.5 ... 3. El valor de este decil es la media si
entre los valores que ocupan la 128 y
138 posición dentro de la distribución.
Esos valores son 76 y 77
respectivamente 7.
D4 = 76.5 ¿Qué significa? ... Paso 4 un
D4 =P40 =76.5 ... Resp.

Para calcular el valor de cualesquier percentil de una distribución, ésta debe


Ca
estar siempre
8. Un

tiel

Cal,
Detenninar la posición. el valor y el significado de a) b) D 8• c) pss • d) P 90• e) D 3 en la siguiente
distribución: 9.

22 21 19 19 18 20
21 20 21 18 17 24
19 18 17 19 20 21
22 17 23 23 24 20
Cale

1:1:1.
• • H,-o-r-a-c-.--i
-
:,:-~':::~~::'fFt;'~:~~::;;~~::?%r.':0;~r:~;!!.@.t::2:::'!!§~"@y:i~y
•. C•• iij.i¡'ji.
.
~
. ..

n del . . .: .... -.:' -.- -.:.:.:.:. . .


1. Los en su camino al trabajo, tuvo que esperar el
autobús en 14 días de trabajo: 10, 12, 13, 1, 10. Calcular la posición y el valor
dadera de a) b) c) Q¡ y explicar sus respectivos significados.

2. Ciertas fallas de energía eléctrica duraron: 18, 125,44,98,31,26, 80,49, 125, 89,44,33,39, 12, 103,
cupala 75,40,80 Y28 minutos. Calcular la posición y el valor de a) b) Q¡, c) Explicar sus respectivos
significados.
,ntando
3. En 1993, 12 hacendados vendieron respectivamente hatos de: 58, 70, 86, 42, 64, 46, 89, 44, 93, 58, 70 Y
. Resp. 70 novillos a una empacadora de carne. Calcular la posición y el valor de: a) b) c) Q¡. Explicar
sus respectivos significados.
,hizo.
4. Calcular la posición de Q¡ y Q3 en una distribución que tiene 21 términos y verificar cuántos valores
haya la izquierda de la posición de Q¡; entre Q¡ y entre y Q3 y a la derecha de

5. En una semana el número de comidas que ingirieron 13 personas fueron: 3,10, 15, 1,8,5,6, 12, 15, 11,
rdadera 8,7,5. Determinar el valor de: a) b) D6 , c) Pso, d) e) D7 , f) Pn

6. Los siguientes datos son rendimientos de una hortaliza en libras, calcular la posición, el valor y el
significado de: a) Q¡, b) Q2, c) D7, d) P95 , e) D3, f) P71
a media
.a 128 y 3.9 3.4 5.1 2.7 4.4 7.0 5.6 2.6 4.8
ibución. 7.0 4.8 5.0 6.8 4.8 3.7 6.8 3.6 4.0
y 77
7. La siguiente tabla muestra el tiempo en segundos que corredores de los 100 metros planos, hicieron en
una competencia durante las Olimpiadas:

10.9 11,1 12.0 10.5 10.7 11.8 12.5 10.9 11.8 10.3
11.5 11.0 12.0 10.6 10.8 11.0 10.9 10.8 11.0 10.5

sta debe Calcular la posición y el valor de: a) D9 , b) D3, c) P30, d) P90 , e) f) Q¡

8. Una investigación sobre destreza manual abarcó el tiempo requerido para terminar cierta tarea, los
tiempos correspondientes en minutos fueron los siguientes:

7.1 7.2 7.2 7.6 7.6 7.9 8.1 8.1 8.1 8.3
8.3 8.4 8.4 8.9 9.0 9.0 9.1 9.1 9.1 9.1
9.1 9.1 9.2 9.2 9.3 9.3 9.5 9.7 9.8 9.8

Calcular la posición y el valor de: a) b) D2, c) P27 , d) e) Ds, f) P66 , g) Q¡, h) D3, i) P59
siguiente
9. La siguiente tabla muestra la concentración de cloro en ppm. de 30 galones de agua tratada:

16.2 15.8 15.8 16.3 15.6 15.7 16.0 16.2 16.8 16.0
16.4 15.2 15.9 15.9 16.8 15.4 15.7 15.9 16.0 16.3
16.4 14.7 18.3 15.6 16.9 16.0 16.6 17.3 15.8 16.9

Calcular la posición y el valor de: a) b) D3 , c) P40, d) D7, e) Pso, f) Ds


'. . •.
i·¡jdi.i,••.i.·"'·U¡ji.i,

10. El siguiente conjunto corresponde al tiempo en segundos, del encendido de todas las máquinas de una
fábrica de hilados y tejidos:

30.1 31.5 34.0 37.5 37.5 34.5 31.6 30.1 30.2


31.6 34.4 37.6 38.0 35.0 30.5 32.5 35.0 38.0
31.1 30.4 32.5 33.0 31.1 31.3 35.0 34.5 34.4

Calcular la posición y el valor de: a) P20, b) P36, c) P38 , d) D3, e) f) D9 , g) h) P88 •

11. La siguiente tabla muestra las edades en años de los compradores de artículos en un supermercado que
entraron de 10.00 a 12.00 m durante cinco días de la semana.

24 29 38 21 16 44 34 16 32 35 Se
19 33 23 21 44 34 18 30 24
18 17 19 34 54 29 18 30 27 28

Calcular la posición y el valor de: a) b) Ds, c) P79 , d) D 7 , e) P88

de y del de

Para el cálculo de la posición y los valores de este tipo de números, empleando una distribución de
frecuencias de datos agrupados, se hace uso de la fórmula (14) que a continuación se presenta:
a) Q
= Percentil k-ésimo *C
= N° del percentil deseado
n = Tamaño de la muestra *n

= Suma de todas las frecuencias de


las clases por debajo (antes) de la
C.
clase cenu1ica (C.Ce.)
nk
= Posición de la clase centílica
100 (C.Ce.)
= Frecuencia de la clase centJ.1ica
(C.Ce.)
Lri = Límite real inferior de la clase Lri
cenu1ica (C.Ce.)
C = Ancho o tamaño de la clase * C:
cenu1ica (C = Lrs - Lri)

La clase centílka (C.Ce.) es la clase que contiene la posición del percentil


deseado o buscado.

Q¡:

m•
• • .H.-o-r-a-c...... .
-
de una
Ejemplo:

Calcular: a) b) D 7 , c) P S5 de la siguiente distribución de frecuencias con datos agrupados:

ado que 14
7

Solución:
2 3

n=55

lción de

a) * Ql P25 = ? Percentil buscado

* Calcular la frecuencia acumulada fa. Columna 2

* n = 55', k = 25 entonces p = 100


55x25
100
Calculando la posición del
a
Ql = P25 . Esta
posición es la 14
a
P = 13.75a p = 14
:ocias de * La clase centílica C.Ce para Ql =P25 es: Porque es la menor fa. que contiene la 14a
=60 -
I
:es) de la C.Ce. 69 . posición del percentil deseado. Columna 2.
(Ver el cuadro de distribución de frecuencia,
centílica marcado con flecha y el inciso a).
Frecuencia de la C.Ce. Columna 1.
Suma de todas las frecuencias por debajo de
la C.Ce. Columna 2.
la clase * Lri = 60 - 0.5 = 59.5 Límites reales de la C.Ce. Columna 3.
Lrs =69 + 0.5 =69.5
la clase * C =Lrs - Lri =69.5-59.5 = 10 Ancho de la clase centílica, C.Ce.
14-8
Ql = P25 = 59.5 + 10(----¡() Sustituyendo valores "en la fónnula (14) y
operando.
6
percentil = 59.5 +

=59.5 + 10(0.6)
=59.5 +6
=65.5 oo. Significa que el 25% de los casos, a lo más de
las observaciones son menores que el valor 65.5
Ql = P25 = 65.5 Resp.

••

..

b) * D 7 =P70 = ?

* La frecuencia acumulada fa. ya se conoce Columna 2

* n =55; k =70 entonces p = = =38.5a Calculando la poslclon de D7 = P70. Esta


100 100 posición es la 39a
p= 39a
]
* La clase centílica CCe., para D7 =P70 es:
Es la clase que tiene la menor fa. que
contiene la 39 a posición. Columna 2.
CCe. = 80 - 89 Marcada con flechas y el inciso b) y c). Ver
cuadro de distribución de frecuencias

* = 14 Frecuencia de la clase centílica. Columna 1.


* = 34 Suma de todas las frecuencias por debajo de
la CCe. Columna 2
* Lri = 80 - 0.5 =79.5
Límites reales de la CCe. Columna 3.
Lrs = 89 + 0.5 = 89.5

* C =Lrs - Lri =89.5 - 79.5 = 10


Ancho de la clase centílica. CCe.
2. L
39-34
* D7 = P70 =79.5 + 10(--) Sustituyendo valores en la fórmula (14) y tr
14 operando.
5
=79.5 +
=79.5 + 10(0.3571)
=79.5 + 3.571 =83.07 Significa que a lo más el 70% de las
observaciones son menores de 83.07

C)*P85 =?
* n =55; k =85 entonces p = nk =55x85 =46 7 a
100 100 .
¿Qué se hizo? ¿cuál es la posición de P85 ?

a
3. La
=47 ¿Porqué?

* La clase centílica para P 85 es: 80 - 89 ¿Porqué?

* =34
¿Qué es esto? ¿Cómo se .calcula? Columna 2.

* Lri = 79.5; Lrs = 89.5


¿Cómo se obtuvieron estos valores?

* C =Lrs - Lri =89.5 - 79.5 = 10 ¿Qué es esto?

* f p = 14
¿Qué es esto? ¿Cómo se obtiene?
.
* P 85 _ 79 5 + 1O( 47-34)

-. " 14 ¿Qué se hizo?

13
=79.5 +
=79.5 + 10(0.9285)
= 79.5 + 9.285 = 88.79 Explique el significado de este valor.

* P 85 =88.79 Resp.

m •
• • '"o-ra-c·i
-

Esta

que
2.
). Ver Calcular y explicar el significado de:
2 4 a) Pso e) Ql
- 7 b) P70
1.
8 c) D s g) P4S
IjO de
d)Ds h) PS9
..

2. La siguiente distribución de frecuencias corresponde a los pesos en kg de una muestra de paquetes


transportados por una línea aérea en el mes de diciembre.
14) Y

Calcular y explicar el significado de:


le las a) Pn e)
b) Ql f) D 6
e) P93 g) P67
d) h) P 90

3. La siguiente es la distribución de las cantidades de tiempo que permanece en un gimnasio de un club


atlético una muestra de 75 miembros. .

Calcular el número de miembros tales que:


.mna 2. a) El 30% alo más de los casos son menores que
ese valor
b) El 48% a lo más de los casos son menores que
ese valor
e) El 50% a lo más de los casos son menores que
ese valor
d) El 70% a lo más de los casos son menores que
ese valor
e) El 85% a lo más de los casos son menores que
ese valor
f) El 93% a lo de los casos son menores que
ese valor

Horacio Reyes Núñea.


-
de

de la
Las descripciones más comprensivas de las dispersión son aquellas que tratan con la desviación promedio
con respecto a alguna medida de tendencia central. Dos de tales medidas importantes para el estudio de la
Estadistica son: y desviaci6n estándar. Ambas medidas nos dan una distancia promedio de
cualquier observación de la distribución de datos, con respecto a la media de dicha distribución.
Las fórmulas a utilizar para el cálculo de la varianza y la desviación estándar para los tres tipos de datos,
está son matematicamente equivalentes a la defInición, y son las que se usan a menudo por que nos liberan de
te, por calcular las desviaciones con respecto a la media de dicha distribución
. de los
que la
19rama
como

Con base a lo anterior, la expresión para calcular la desviación estándar para datos no agrupados viene dada
por la fórmula (17) para la población y la (17.1) para la muestra

Desviación estándar

(17) ,,= - (11.1)


donde: a = Puntaje no procesado
Tamaño de la muestra
La media poblacional
Tamaño de la población
. . 2
= Sumatoria de los puntajes
no procesados, elevados
Sula. La al cuadrado
Pedro la s Desviación estándar de la
: que las muestra
para
El procedimiento paso a paso para calcular la desviación estándar, se da a continuación:
1 las dos
en
Ejemplos:
es más
1. Calcular la desviación estándar del conjunto de puntajes dados de una población en la siguiente
disposición: 1,2,4,6,8,9
Solución:
Paso 1. Hacer una tabla como la de la izquierda en la que se
consigne X y X2 • Elevar al cuadrado cada puntaje no
procesado y después calcular la sumatoria de estos
cuadrados.

6 36
2
=202
8 64
.9 81

1+ 2 +4 +6+8+9 Paso 2. Obtener la media y elevarla al cuadrado


6
30
= =5.
2
=25

••
. . ..
'. . •.i •.i·'iiii.i,•••i.·"i·ij'ji."

... Paso 3. Sustituir los resultados "de los pasos 1 y 2 en la
a fórmula de la desviación estándar, operar y
calculara
a -25'

a = 33.67 - 25'= = 2.94 Desviación Estándar Poblacional '" Resp.

2. Cuál será el valor de la desviación estándar del problema anterior, si se consideran los datos como una
muestra? ¿Cómo considera usted esta diferencia?

Solución:
... Paso 1. Hacer una tabla corno la de la izquierda en la que se
consigne y calcule: X, X 2, n, = 202

La
n=6
Sólo
- 30 -2
la
X n
5'' X = 25 ... Paso 2. Calcular la-media de la distribución y elevarla
al cuadrado en Cl
202 6(25)
s= ... Paso 3. Sustituyendo y operando en la fórmula (17.1) la va

202 6(25)
s=

- 30' =3.22

s = 3.22 Desviación Estándar Poblacional ... Resp.


(La diferencia entre la desviación estándar
niuestral y poblacioDlu es poco significativa.)
(3.22 - 2.94 = 0.28).
Estos 2 ejemplos pueden resolver usando la calculadora tanto para hallar el valor de la desviación

í.•
estandar poblacional como la muestral, así: -

l.
Solución

MODBCUl

Paso 1) Teclear: 3 ... Borrando el contenido de la memoria


En el
... Aparece el ícono "SD" en la pantalla cuadré
Paso 2) Teclear:

Paso 3) Teclear: ... Ingresando los datos del problema o

a
Paso 4) Presionar: ¿e

••
• -z
MORFi,.i.,i·ilo,·".,'.·"'·'j"'· ~. .

Paso 5) Presionar: 2 ... Aparecerá: 2.943920289 que corresponde


en la a la desviaci6n estandar de los datos
y tomados como poblaci6n (a)
= 2.94 ...Resp.

Resp.

no una
Teclear:

Presionar: 3
l.
Si lo que se pide es calcular la desviaci6n estandar de los datos tomados como una muestra entonces:
VAR
... Aparecerá en pantalla lo descrito en el
paso 4)
... Se desplegará en pantalla el número
3.224903099 que corresponde a la
desviaci6n estandar de los datos
tomados. como muestra (s)
l que se s =3.22 muestral ...Resp.
202

La

La de la poblaci6n se parece a una Desviaci6n Absoluta Promedio calculada para una poblaci6n.
S610 que en este caso, se obtiene la suma de los cuadrados de las distancias entre la media y cada valor de
la variable, divididos entre el número total de los elementos de la poblaci6n. Al elevar al cuadrado cada
elevarla distancia, automáticamente se hacen positivos todos los números y por consiguiente, no se necesita tener
en cuenta el Valor Absoluto de cada desviaci6n. La varianza de la poblaci6n, se representa con el símbolo
(sigma al cuadrado). La Fórmula (18) se usa para calcular la varianza de la poblaci6n y la (18.1) para
7.1) la varianza de la muestra, cuando se tienen datos no agrupados

(18)

... Resp.
estándar __ 1. La f6rmula de la varianza, es la misma que la de la desviaci6n estándar, s610
.va.)
que sin la raíz cuadrada.
2. La es el cuadrado de la desviaci6n estándar o la desviaci6n
estándar es la raíz cuadrada de la
3. Al tener calculada una de ellas, fácilmente se obtiene la otra elevando al
cuadrado o extrayendo raíz cuadrada, según el caso.

¡memoria En el problema anterior N° 1; si la desviación estándar es: = entonces con solo elevar el
cuadrado esta expresión, se tiene así
la pantalla
Desviación estándar poblacional ... Resp.
oblema
8.67 Varianza poblacional ... Resp.

¿Cuál es el valor de la varianza muestral del problema 2?

.
Horacio Reyes Núñez• •

3. En seis domingos consecutivos un operador de grúa recibió: 9, 7, 11, lO, 13, 7 llamadas de servicio.
Calcular la desviación estándar para la población dada.
Solución:
'" Paso 1. Hacer una tabla como la de la izquierda. Elevar al
¡
f cuadrado cada puntaje no procesado y después
calcular la sumatoria de estos cuadrados.

ll Si
10

49

9
_ _ 9 + 7 + 11 +6 10 + 13 + 7 oo. Paso 2. Obtener la media y elevarla al cuadrado.

= =9.5

= (9.5)2 = 90.25

_ 2 I

=V oo. Paso 3. Sustituir los resultados de los pasos l y 2 en la


fórmula (18) de la desviación estándar, operar y
calculara.

-90.25'

=2.14

=2.14 Desviación estándar poblacional ...Resp.


=( = 4.58 oo, Paso 4. Varianza poblacional oo, Resp. cálc
la v
¿Cuál es el valor de la varianza muestra! de este problema? ¿es = 5.5? SI/NO·'

Si la respuesta es No, verifíquela de nuevo y corríjala

Usando la calculadora para comprobar y resolver el 3 en relación con la varianza poblacional se


tiene:

Solución
Paso 1) Teclear:. • 3 [11 [11 oo' ¿Qué se hizo?

Paso 2) Teclear: • ... ¿Qué aparece en la pantalla?

Paso 3) Teclear: 9 7 oo. ¿Qué se hizo?

Paso 4) Teclear: • 2 ... ¿Qué aparece en la pantalla?

=2.14 Desviaci6n poblacional ...Resp.

Horacio Reyes
_ úñ.z

-
• Mm.,,'··.·'·".'·"."»""·""C, . .

J. Paso 5) Teclear: ... Elevando al cuadrado el valor


obteIÚdo en pantalla
... Lo que aparece en la pantalla
al
és a 2 =4.58 ...Resp.

Si lo que se pide en el problema es la varianza muestral. ejecute el Paso 4) anterior así:


SIIIPT VAR
Paso 4) Teclear: • 3 ... ¿Qué obtiene en la pantalla?
s =5.50 ...Resp.

Paso 5) Teclear: ...¿Qué se hizo?

...¿Qué se hizo?

S2 = 30.25 muestral ...Resp.

En este modelo de calculadora. solo se puede calcular la deviación estandar


, la
y la varianza de datos no agrupados
ry

7 y
sp.
Cuando se trata de datos agrupados en frecuencia simple, las fónnulas (19) y (20) nos pennite efectuar los
sp. cálculos de la desviación estándar y de la varianza poblacional y la (19.1) y (20.1) la desviación estándar y
la varianza muestral respectivamente.

x =Valor de la observación
ional se (19) estándar pobúu:ional =Media poblacional de la
distribución
N =Tamaño de la Población
f = de las observaciones
=
fX2 Producto de la frecuencia por
.. .: '. .. ,": ,"-:
- ", (19.1)
ll:4(\i"' - ••
"
estándar muestral
el respectivo valor de la
-l-o-1 observación elevado al
cuadrado
n =Tamaño de la muestra
=Media muestral

~
. . •. i"jiii.i,• .i •.i'j·D¡j'·"

(20) Varianza poblacional


2.

J (20.1)

En los siguientes ejemplos, se explica paso a paso, la metodología que debe seguirse para calcular la
desviación estándar y la varianza en un conjunto de datos que están agrupados en frecuencia simple.

1. Determinar el valor de la desviación estándar y de la varianza, de la siguiente distribución de frecuencia


Solu
simple, considerada como una población.

Solución:
1 2
... Paso 1. Multiplicar' cada valor (X) por su frecuencia f
para obtener fX. (Columna l.)
... Paso 2. Multiplicar cada fX por X para obtener fX2
(Columna 2.)
... Paso 3. Calcular de la Columna 1. y de la
Columna 2.
N = 16; = 65; = 303
... Paso 4. Calcular la media y elevarla al cuadrado
s =
65
= 16 = 4.06

=(4.06)2 =16.48

=
a = : '

oo. Paso 5. Sustituir los resultados obtenidos de los pasos 1,


2, 3 Y 4 en la fórmula (19) de la desviación s =,
a = -16.48' = y en la (20) de la varianza
=(

a =1.57

a =1.57 Desviación estándar poblaciolUll '" Resp.


= = 2.46
La col
=2.46 Varianza poblacional oo. Resp. multipl
fácil.

••
• T
'
- •.i.¡¡A,.i,q.i•.i,,.¡¡¡iii'

2. La siguiente distribuci6n corresponde a los números primos entre 3 y 17 incluyéndolos. Calcular la


'. ..

desviaci6n estándar y la varianza de esa distribuci6n de datos agrupados en frecuencia simple,


considerados como una muestra.

llar la

uencia Solución:
1 2
... Paso 1. Multiplicar cada valo.! de X por su respectiva
frecuencia f para obtener fX. Columna 1.
... Paso 2. Multiplicar cada fX por su propia X para obtener
fX2 Columna 2.
... Paso 3. Calcular de la Columna 1. y de la
Columna 2.
2
encia f n = 30; = 286; = 3 358
286 3358

... Paso 4. Calcular la media muestra! y elevarla al cuadrado


- 286 ­
:2 de la X= =9.53
2 = (9.53)2 = 90.88

... Paso 5. Sustituir los resultados obtenidos en los pasos 1,


3358 30(90.88)
s = 30-1 - 30-1
2, 3 y 4 en 1: fórmula (19.1) de la desviación
estándar mue ,'jl y en la (20.1) de la varianza
muestral.

=
pasos 1,
sviaci6n s =4.67 Desviación estándar mues/rrll ... Resp.
varianza
S2 = 21.78

S2 = 21.78
Varianza muestral ... Resp.

... Resp.

La columna 2. puede calcularse de otra manera: Elevando al cuadrado cada valor de X y después
.., Resp. multiplicar este valor por su respectiva frecuencia f. Ud. debe seleccionar la que le parezca mejor o la más
fácil.
~. . •.•.i·ijDi·',n·.·i'i·i.".i,

E11
una
cale

Las
17 21 18 27 17 21 20 22 18 23
para
El gerente de producción de la compañía siente que una desviación estándar de más de 3 botes por día
indica variaciones de tasas de producción inaceptables ¿deberá preocuparse por las tasas de producción
de la planta?

2. Una compañía de teatro de Honduras está seleccionando una muestra de extras para una película. La
edad de los primeros 20 aspirantes que van a ser entrevistados es: I
50 56 55 49 52 57 56 57 56 59
54 55 61 60 51 59 62 52 54 49

El director de la película desea tener personas cuya edad se agrupe estrechamente alrededor de los 55
años. Como es aficionado a la estadística, sugiere como aceptable una desviación estándar de 3 años. I

¿Este grupo de extras, cumple con el requisito?

3. Los números de casa vendidas semanalmente por una compañía de bienes raíces, durante un período de
8 semanas fueron 3, O, 6,4, 1,5,4 Y1. Calcular la desviación estándar de esta población de casas.
4. Una estación de pesca en el Lago de Yojoa tiene registros de los peces atrapados. La pesca en libras de
los últimos 20 días fue:
101 132 145 144 130 88 156 188 169 130
90 140 130 139 99 100 208 192 165 216
Calcular a) rango, b) varianza, c) desviación estándar para estos datos, como muestra, d) En este
ejemplo, ¿es el rango una buena medida de variabilidad? ¿por qué?

5. Los 16 edificios más altos de una ciudad tienen:

47,43,42,40,38,36,33,33,33,32,32,32,27,27,26 Y22 pisos.

a) Calcular la desviación estándar de esta muestra de edificios Los sil


b) Vuelva a determinar la desviación estándar después de eliminar las alturas de los 4 edificios
más altos. ¿Que concluye7 1.
Calcular la desviación estándar y varianza de las siguientes distribuciones en frecuencia simple.
6. 8.

23 9

n=

"'"R""'."'iJd"".,.'(j,ljil'·.. . -
El método del cálculo de la desviaci6n estándar y de la varianza, para el caso de frecuencias descrito por
una muestra agrupada, es esencialmente el ya descrito en páginas anteriores, s610 que las desviaciones se
de la calculan con los puntos medios de cada clase (Xm).

Las f6rmulas (21) y (22) se pueden usar para calcular la desviaci6n estándar y la varianza para una
distribuci6n de frecuencias con datos agrupados, cambiando solamente el valor de X por Xm. Sin embargo,
para evitar dificultades, estas f6rmulas se dan a continuaci6n:
Jor día

(21) Desviación estándar poblacional


uta. La
,. .. > ''
.

(21.1) Desviación estándiu muestra'


los 55
3 años.

iodo de
s.
(22) Varianza poblacional
ibras de

En este
(22.1) Varianza muestral

Los siguientes ejemplos ayudarán a interpretar lo antes expuesto, siguiendo los pasos que se especifican:

1. Calcular la desviaci6n estándar y la de la siguiente distribución de frecuencias con datos


agrupados, considerados como una poblaci6n.

5
8 -10
11 - 13
- 16
-19

. _ . _ _••• • AO .•• , - - _ _ • •
• . .._~ ...

Horacio Reyes
.
'. ..
Solución:


Paso 1. Calcular los las marcas de clase Xm. Columna l. y multiplicar cada uno de estos valores por la
2.
frecuencia en el intervalo de clase, fXm. Columna 2. y sumar estos productos
1 2

5
10

N=17
Pase
Paso 2. Calcular la media y elevarla al cuadrado

=9.35

= (9.35)z = 87.42

Paso 3. Multiplicar cada marca de clase por tXm para obtener f(Xm)z y sumar estos productos para

obtener Columna 3.

1 2 3

Paso

Paso.
Paso 4. Sustituir los valores obtenidos en los pasos 1,2 Y3 en la fórmula (21) haciendo X = Xm L

... Fórmula (21) con X =Xm

... Sustituyendo valores y operando en la


fórmula mencionada
a = 04.29 - 87.42'

a =4.11 ... Resp.

2
a = N ... Fórmula (22) para calcular la varianza

Z
=104.29 - 87.42 =16.87

Z
= 16.87 ... Resp.

• •H
• ""'y===.=="c=j=¡;;N'""'rl1 l\"'.7.z
:;:C·
• L'10""'-'_·'·"A'-"'.·'.·"'·""«· . ..
2. La siguiente tabla de distribución de frecuencias de datos agrupados, corresponde al tiempo en horas
la
que 80 estudiantes dedicaron a actividades en sus horas libres durante una semana en la UNAH.
Calcular la desviación estándar y la varianza de la distribución, si los datos correspondan a una muestra.

Solución:
Paso 1. Calcular las marcas de clase Xm de cada clase. Columna 1. y multiplicar cada uno de ellas por la
frecuencia; para formar fXm Columna 2. y sumar estos productos fXm. Calcular
Columna 3
1 2 3

Jara

Paso 2. Calcular la media y elevarla al cuadrado

= = 20.625 ... ¿Qué se hizo?

(20.625)2 = 425.39

Paso 3. Calcular Columna 3

Paso 4. Sustituir los valores obtenidos en los pasos 1,2 Y 3 en la fórmula (21.1) y (22.1) para obtener
la desviación estándar: s y la varianza S2, respectivamente.
2
f ()(m)2 nX i
36180 80(425.39) ... Sustituyendo y operando en la fórmula
s-
-
-0-1
---- -­
n-1- 80-1 - 80-1
(21.1)
1
1 en la -430.77

... Valor de la desviación estándar muestral

s = 5.21 Desviación estándar muestral oo. Resp.

S2 = 27.2 ... Valor de la varianza muestral

S2 = 27.2 muestral OO' Resp.


'. . •. i.¡ji;,.i,••.•.i'j.u¡j''''

3. El número de cheques cobrados diariamente en la sucursal de un banco durante el mes anterior, tuvo la
siguiente distribución de frecuencias muestrales: . 2.

El director de operaciones del banco sabe que una desviación


estándar en el cobro de cheques mayor de 28 cheques diarios
ocasiona problemas de personal y de organización, debido a la
carga de trabajo. ¿Deberá preocuparse por la cantidad de
empleados que van a utilizar el mes siguiente?

Solución:

OO' Calculando en el cuadro: Xm, fXm Y


f(Xm)2 en las columnas 1, 2 Y 3
respectivamente
... n= 100
3.
OO' f(Xm) = 5 850 Y también
=400 925
oo. Calculando la media de la distrlbucióny
elevándola al cuadrado
OO, Sustituyendo y operando en la fórmula
(21.1) de la desviación estándar muestral
400 925 100.0(3 422.25)
= 100-1 100-1
(
f
s= -

s= 592.9295' = 24.35
s= 24.35
Con tUS'Viaci6n estálU1ar de 24.35 cheques diarios, ." Resp.
tUbería preocuparse porque es menor que 28

1. La de millas por galón de los automóviles


producidos por un fabricante. Calcular la me(llli:':'U:::aesviación estándar y la varianza de la distribución,
si se considera que es una población la investigada.

• • H;-o-r-a-c-'-i ...

..
uvo la
•.i.¡,nl,¡,.··.·'¡,·i,,ji. ~
. .
2. De los empleados de una empresa, se obtuvo la siguiente distribución de frecuencia sobre los recorridos
en los viajes entre el hogar y la oficina. El recorrido X se da en Km. Hallar la media, la desviación
iación
liarios estándar y la varianza de la distribución. Considérese como población (N) primero y después como
lo a la muestra (n). Explique la diferencia si la hay.
ad de

..
5.0 ­

Y
Y 3

3. La siguiente distribución, corresponde al gasto en Lempiras de los viajes que los técnicos en reparación
de computadoras hicieron en un día. Hallar la media, desviación estándar y varianza de los gastos
ambién diarios, de la siguiente población:

Llcióny

lUestral

Calcular la desviación estándar '/ varianza para cada una de las siguientes tablas de distribución de
frecuencias.

4.
5. 6. 7.

60 - 6 - 6 - 8-10-
70 -79 9 -11 10 - 13 11-13 6
80 - 89 8 - 14 9
14 - 17 14 14 - 16 5
90 - 99 6 15 - 17 8
18 - 21 10 17 - 19 1
N=23 4 25 9 7
2 4 n=24
N=47 n=81
lutomóviles
Iistribución, 9.
10.
8.
O 2 9\::5/:
1
4-5 11 20.01 -
6-7 5 20 -24 2 30.01 - 40.00
8-9 8 29 7 40.01 - 50.00 4
n=67 30- 34 10 - 60.00 3
5 70.00 1
n=41 N=34

-
~
. . •.i.iidC·i"¡'·.·"j·'i¡ji.i, •

La desviación estándar es una medida absoluta de dispersión y expresa la variación en las mismas unidades·

que los datos originales.


*
La desviación estándar no puede ser la única base para comparar dos distribuciones. Si se tiene un a = 10 Y

una = 5, los valores varían en una cantidad que es el doble de la media; en cambio, si se tiene una a = 10
*
Y una = 5000 la variación relativa a la media, es insignificante. Por tanto, no se puede conocer la

dispersión de un conjunto de datos sin conocer la a, la y la relación del tamaño existente entre ésta y la *
Lo que se necesita es una medida que nos dé una idea general de la magnitud de la desviación
q
estándar en relación con la magnitud de la media. Esta medida de dispersión es el de
(cv). Relaciona una y otra, expresando la a como un porcentaje de la De ahí que la unidad de medida, se

llame "por ciento" en vez de las mismas unidades que la de los datos originales.

.
..

.
(23) .
.."
.. (23.1) donde:
cv = Coeficiente de variación
= Media muestral
= Media poblacional
s = Desviación estándar muestral
a = Desviación estándar poblacional La de
distril
El coefICiente de variación es una medida relativa que resulta de utilidad al comparar la cantidad de
variación en grupos de datos que posean medias diferentes. deten
nomb
Ejemplos:
calcul
1. El técnico de laboratorio A en promedio realizó 40 ariálisis, con una a = 5. El técnico B hace 160
análisis diarios como promedio con una a = 15. ¿Cuál de los dos muestra menor variabilidad?

Solución:
* Para tener una respuesta concreta, calcular

los coeficientes de variación de cada técnico.

* cv = 100% ... Coeficiente de variación. Fórmula (23)

* cv(A) = 100% = 12.5% oo. Coeficiente de variación para el técnico A

* cv(B) = 100% = 9.4% ... Coeficiente de variación para el técnico B

* Se descubre que el técnico B, quien tiene

una mayor desviación absoluta en la salida


Ejernr
que el técnico A, muestra una menor

variación relativa ya que la salida media de

B es mucho mayor que la suya.


60
un
* El técnico B muestra menor variabilidad oo. Resp Inl
a)

b)

DE•
•• ~~
-
"'··.·'·".'··'••

2. Una fabricante de tubos de TV tiene dos tipos de tubos: A y B. El A tiene una duraci6n media de 1 495
horas con una desviaci6n estándar de 280 horas. El tubo B tiene una duraci6n media de 1 875 horas
··.·"'·ij"C·
-- . .

con una desviaci6n estándar de 310 horas. ¿Qué tipo de tubo tiene mayor dispersi6n relativa?

Sohición:
nidades­
* cv = x 100% ... Coeficiente de variación. F6rmula (23)
r= 10 Y
la= 10
* cv(A) = x 100% = 18.72% ... Coeficiente de variaci6n para el tubo de tipo A

locer la * cv(B) = 100% = 16.53% .._Coeficiente de variaci6n para el tubo de tipo B


ylaa.
El tubo tipo "A" tiene mayor dispersi6n relativa ... Resp.

¡viaci6n que el tubo "B".

dida, se El Coeficiente de variación es una medida de dispersi6n, que permite


comparar dos distribuciones. Relaciona la des iaci6n estándar (a) y la media
al expresar la primera como un porcentaje de la segunda.

¡tral
lCional La desviaci6n estándar,· es también útil para describir que tan lejos las observaciones individuales de una
distribuci6n se apartan de la media de la distribuci6n. Una medida denominada puntuación estándar o
idad de puntuación normalizada o puntuación nos dá-el número de desviaciones estándar a que está
determinado valor de la variable, por arriba o abajo del valor de la media. Este proceso se conoce con el
nombre de o estandarización. Si se denota con X el valor de la variable, entonces la
normalizaci6n, estandarización o puntuaci6n estándar o puntaje z correspondiente a esa observaci6n, se
calcula con la f6rmula (24) para la poblaci6n y con la (24.1) para la muestra.

ilce 160

donde: =Media muestral


J(24) X = Valor de la observaci6n
- =La media de la poblaci6n
a = La desviaci6n estándar poblaci6n
z = Puntaje estandarizado
· (24.1) s = Desviación estándar de la muestra
. ···••
. ;,. :--
.

. -
.....

Ejemplo 1.

En la asignatura de Programación Estructurada 1 las calificaciones del curso, tuvieron un promedio de


60% con una desviación estándar de 16. En Contabilidad Intermedia, las calificaciones finales tuvieron
una media de 58% con una desviación estándar de 10. Si un alumno obtiene 72% en Contabilidad
Intermedia y 68% en Programaci6n Estructurada I.
a)-¿A cuántas desviaciones estándar está cada una de esas calificaciones por arriba del promedio de
la asignatura respectiva?
b) ¿Qué se puede decir de esto, acerca de su desempeño en ambas asignaturas?

-
_______________________ ._. . . _~,_",.,, '"""'
__ ' • . ,­ ._ _ - ¡¡¡líl.d.iíIIi _4
..
Solución:
•.i,'j·C··,¡:¡·i•.'".",,,.,

3. I

z= ... Puntaje estandarizado. Fórmula 24.

a) z =68 60 =0.50 Programación Estructurada I ... 0.50 de desviación estándar arriba de la


media en Programación Estructurada 1. 4.
z = =1.40 ContabilúlDd Intermedia ... 1.40 de desviación estándar arriba de la
media en Contabilidad Intermedia.
b) Su desempeño relativo en Contabilidad ... Resp. Porque en Contabilidad Intermedia, la
Intermedia fue mejor que en Programación desviación estándar en unidades z, está más
I. retirada de la media, que la desviación
estándar de Programación Estructurada I
con respecto a propia media. 5.
Ejemplo 2.

En un examen final de Matemática la media de la muestra fue de 72% y la desviación estándar de 15.
Determinar las puntuaciones z o normalizadas de: a) 60%, b) 93%, c) 72%. 6.
Solución:
a) =_12 =-08 '" 0.8 desviaciones estándar por de la
s 15 15 .
media. ... Resp.
b) =X = 93-72 = 14 ... 1.4 desviaciones estándar por de la
s 15 15 .
media. ... Resp.
c) = ... Está sobre la media 7.
1572 = = 0.0

1. El signo positivo en una puntuación z o estandarizada (+z) significa que el


valor correspondiente de la variable está por arriba o sobre el valor de la 8.
media.
2. El signo negativo en una puntuación z o estandarizada (-z) significa que el
valor correspondiente de la variable está por debajo del valor de la media.
3. El signo negativo en esta parte de la Estadística, no significa un numero
menor que cero; significa que el valor correspondiente de la variable es
menor que la media.
9.

A requirieron en promedio 32. de 68.09 horas y el grupo 2 con el paquete B


quienes requirieron un promedio de 19.75 horas y una varianza de 71.14 horas. ¿Cuál programa mostró 10.1
la menor variabilidad relativa? ¿Por qué? J

2. Con las siguientes observaciones se describen las edades de los estudiantes que asisten al programa
diurno y nocturno de postgrado en computación:

Curso diurno: 24 30 28 23 25 22 26 27 28 25
Curso Nocturno: 26 33 29 28 27 29 33 34 37 28

Si la homogeneidad del grupo es un factor positivo en el aprendizaje, aplicar una medida de variabilidad
relativa que indique a cuál de los dos grupos es más fácil enseñarles.
- M'I"F"··.·¡·ij"'·¡'.·'W·;'J·i¡'ji.

3. En los 3 últimos años la compañía A alcanzó un promedio de rendimiento sobre la inversión del 28%
con una desviación estándar de 5.3% y la compañía B, un rendimiento promedio de 37.8% con una
desviación estándar de 4.8%. Si se supone que el riesgo se acompaña de una mayor dispersión relativa,
..
l.
I
,.
¿cuál de las dos compañías ha logrado una estrategia más riesgosa? ¿por qué?
de la
l.
4.' La constancia con que un vendedor cumple con las metas establecidas, es un factor que la compañía
L de la "DELR" toma en consideración para incentivar económicamente a los vendedores. Los datos siguientes

corresponden al porcentaje de la meta lograda por 3 vendedores el año 2001.

edia, la Patricia 88 68 89 92 73
más Juan José 76 88 90 86 79 ¿Cuál de los vendedores es más
viación Francisco 88 95 78 88 63 constante? ¿por qué?
I
5. Una máquina diseñada para producir dosis de cierto medicamento tiene una dosis media de 100 cc con
una desviación estándar de 5.22 cc. Otra produce 180 cc como promedio con una desviación estándar
de 8,6 cc. ¿Cuál de las dos máquinas tienen la menor exactitud desde el punto de vista de la dispersión
relativa? ¿por qué?
: de 15.
6. El gerente de un banco, revisa las, cuentas por cobrar de 3 clientes y el tiempo promedio de días que se
,han atrasado en sus pagos. El gerente considera que además de un promedio mínimo, es de suma
importancia la consistencia basada en la dispersión relativa. ¿cuál de los 3 es el mejor cliente?
de la
H. Reyes N. : 62.2 61.6 63.4 63.0 61.7
G. Reina C. :.62.5 61.9 62.8 63.0 60.7
de la A. CanosM. : 62.0 61.9 63.0 63.9 61.5
7. El dueño de un supermercado emplea dos fórmulas diferentes para predecir las ventas mensuales. La
primera fórmula tiene. una falla promedio de 700 discos con una varianza de 1225. La segunda de 300
discos con una desviación estándar de 16. ¿Cuál fórmula es relativamente menos precisa?
l que el
lr de la 8. Se van a comparar la variabilidad en los precios anuales de las acciones que se venden a menos de
L. 10.00 y la dispersión en los precios de aquellos que se venden por arriba de L. 60.00. El precio medio
l que el de las primeras es de L. 5.25 con una varianza de L. 2.3104; en las segundas el precio medio es de
ledia. L. 92.50 y la varianza es L. 27.8784. a) Calcular la dispersión relativa en el precio de ambos tipos de
numero acciones y explicar cualquier diferencia, b) ¿Porqué utilizar el coeficiente de variación para esta
.able es comparación?

9. Un analista de investigación para una empresa de corretaje de acciones, desea comparar la dispersión en
las razones precio-rendimiento para un grupo de acciones comunes, con la distribución de su pago sobre
la inversión. Para las razones precio-rendimiento la media es 10.9 y la varianza 3.24. El rendimiento
medio sobre la inversión es 25% y la desviación est<Í!ldar de 5.2% a) Comparar la dispersión relativa
para las razones precio-rendimiento y el rendimiento sobre la inversión, b) ¿Por qué debe utilizarse el
coeficiente de variación para comparar la inversión?
paquete
quete B
10. Un ingeniero probó 9 muestras de cada uno de 3 diseños de soporte para un nuevo tomo electrónico.
, mostró
Los siguientes datos corresponden al número de horas que tardó cada soporte en fallar teniendo el
motor del tomo funcionando continuamente a su máxima potencia, con una carga en él, equivalente a
1.9 veées su capacidad esperada.
rograma

OlA: 16 16 53 15 31 17 14 30 20

B:18 27 23 212226391728
C: 31 16 42 20 18 17 16 15 19
a) Calcular la media y la desviación estándar para cada grupo.

abilidad
b) Basándose en las respuestas del inciso anterior, ¿ cuál diseño es mejor y por qué?

Horacio Reyes Núñez'.,


11. A un grupo de aspirantes a la EA.H. se les aplicaron dos pruebas experimentales: una de aptitudes

mecánicas (AM) y otra de destreza manual (DM). La media de la primera prueba fue de 200 y la
desviación estándar de 10. En la segunda, la media fue de 300 y la varianza de 36; Comparar la
dispersión relativa de ambos grupos y explicar cualquier diferencia.

12. La media y la desviación estándar de una población son 120 y 20.0 respectivamente. Encontrar el valor
de X que corresponde a:

a)z=O.O b)z=1.2 c)z=-1.4 d)z=2.05 e)z=-2.75

13. ¿Cuál valor de X tiene la mayor magnitud relativa al conjunto de datos del cual procede?
1.
A: X = 85 donde = 72.0 ya = 8.0
B:X = 93 = 87.0 ya= 5.0

14. ¿Cuál valor de X tiene menor posición relativa con respecto al conjunto del cual procede?

A: X = 28.1 donde = 25.7 ya = 1.8


B: X = 39.2 donde = 34.1 Ya= 4.3

15. El número de aciertos en un examen de aptitud, aplicado a nivel nacional, tiene una media y una
desviaci6n estándar de 500 y 100 respectivamente, calcular el número de aciertos para cada valor de'z:

a) z= 1.8 b) z= -2.03 c) z= -1.2 d) z= 1.22 e) z = 3.02 2. E:



16. a) ¿Qué significa decir que X = 152 tiene un valor z= + 1.5? ro
b) ¿Qué significa que un valor particular de X, tiene un valor z = -2.1 ?
d) ¿Qué es lo que mide generalmente un puntaje z? 3.10
17. Una población tiene una media y desviación estándar de 50 y 4.0 respectivamente. Hallar el valor z
e
para cada uno de los siguientes valores de la variable:

a) X = 35; b) X = 26; X = 50; d) X = 59; e) X = 70

18. El precio promedio de lechuga es L. 0.711a libra con desviaci6n estándar de 0.05; el tomate L. 0.40 la
libra con desviación estándar de 0.03 y el pepino L. 0.19 la libra en promedio con una desviación
estándar de 0.02. Si en cierto mercado se tienen los precios de 0.78 la libra de lechuga, L. 0.45 la de
tomate y L. 0.21 la de pepino, ¿cuál de estas verduras tiene relativamente un precio excesivo?

19. En una compañía, la acción e tiene un precio normal medio de L. 58.00 con una desviación estándar de
L. 11.00 Y se vende actualrnenteen L. 76.00. La acción D se vende a un precio medio de L. 38.00 con
una desviación estándar de L. 4.00 Y se vende actualmente en L. 50.00. Si una persona posée ambos
tipos de acciones, ¿cuál deberá vender primero? ¿por qué?

20. Dos personas están haciendo dieta. La primera tiene un peso medio de 146 libras con desviación
estándar de 14 libras y la segunda pertenece a un grupo de edad en la que el peso medio es 160 libras
con una desviaci6n estándar de 17 libras. Sus respectivos pesos son 178 y 193 libras. ¿Cuál de las dos
personas están seriamente pasada de libras con respecto a su grupo de edad?

21. Los solicitantes a ingresar a la UPN tienen una calificación de matemática ACf promedio de 21.4 con
desviación estándar de 3.1, mientras que los solicitantes a íngresar a UNITEC tienen una calificación
de matemática ACT promedio de 22.1 con desviación estándar de 2.8. ¿Con respecto a cuál de estas 2
. universidades está un estudiante en una posición relativamente mejor, si obtiene: a) 26 en su examen
b) 31 en su examen? 5. El

re
'
•• orado Reyes úij.ez
-
itudes
) y la
rar la
•.•.•.".,.,•.••.•".•j",. ~. .
.::::::" ..:.::.0.': ....

. valor

"
Dé respuesta a cada una de las siguientes preguntas:

1. a) lEn qué consisten las medidas de disperción tomadas como un todo?


b) Escriba una ventaja de la media, una de la mediana y una de la moda
c) ¿Qué describen las medidas de posición?
d) ¿Cuál es la relación entre los cuartieles y los percentiles?
e) Liste por lo menos 3 medidadas de tendencia central
f) Indique la diferencia entre la desviación estandar y la varianza
g) lQuee indica rango percentil de un puntaje dado? Use sus propias palabras
h) ¿Qué indica la mediana en una distribución de datos?
i) Mencione un caso preactico y cotidiano en que se una la media aritmética ponderada.
y una
Desarrolle cada ejercicio clara
2. En un clase de química hay 18 estudiantes de primer año, 16 de segundo y 10 de tercero. Si los de primer
año promediaron 62 en un examen, los de segundo 70 y los de tercero, entonces calcule la calificación
media de toda la clase.

3. los siguientes datos representan las calificaciones, en porcentaje, que los estudiantes de la sede de
Comayagua obtuvieron en la asignatura de Cálculo 11 en el primer período del año 2006: 64, 61, 60, 60

valor z
68, 71, 68, 68, 73,80 y 82. Calcule a) La mediana de los datos, b) La varianza de los datos c) El percentil
75 y su significado.

4. Sea una distribución de frecuencia agrupada de calificaciones de examenes finales para 20 estudiantes de
educación a distancia en la asignatura de Algebra 1
0.40 la
lviación
la de

indarde
1.00 con
ambos

sviación
50 libras
las dos

a) Complete la tabla, b) Calcule la moda de la distribución de datos c) Calcule el cuarti.l1, dando su


21.4 con significado, d) Calcule la desviación típica o estandar de los datos
ificación e) Calcule el Rp (67) y su significado.
e estas 2
I examen
5. En cuatro examenes, un estudiante promedio 63.2 con una varianza de 10.89, mientras que otro
estudiante obtuvo un promedio de 78.8 con un desviación estandar de 5.3 lCuál de los estudiantes es
relativamente menos consistente?
Los'Bosq,ues Nublados de
humedad proveniente de las tierras

bajas es empujada por los vientos

hacia las montañas. Conforme se

incrementa la altitud, la temperatura

decrece y la precipitación y laconden­

sación aumentan. Así los' bosques

ubicados en las partes altas de, las

montañas, ó bosques montanos como

se les conoce, se ven envueltos

durante buena parte del día en una

densa neblina, creando el término

bosque nublado.

Darlo Alberto Mejía en el libro "Bosques del los define y explica a cabalidad: "En
Honduras se utiliza el término Bosque Nublado (BN) para definir áreas que existen en las partes
altas de las montañas y están cubiertas con neblinas o lluvias durante más del 70% del Más
adelante continúa el autor diciendo: "Los BN de Honduras se encuentran en de 35 montañas
(formando cerca de 4% del territorio), distribuidos en altitudes desde 800 hasta 2,859 metros sobre
el nivel del mar. La altura normal sobre los 1,800 metros".
Los bosques nublados poseen una gran abundancia de plantas epifitas. es decir, plantas que
crecen sobre otras plantas.
Debido a la poca presencia de luz solar bloqueada por las nubes, los árboles no crecen tanto,
como aquellos de tierras bajas, entre otros factores.
El principal beneficio que proporciona al los bosques nublados es la producción de agua.
Tegucigalpa, por citar un ejemplo, recibe del Parque Nacional La Tigra, entre el 30 y el 40% del
agua que consume. Eso sin contar comunidades cercanas que también se' del
parque.
Lo mismo pasa con Celaque y cerca de 100 comu'nidades, entre ellas Gracias; Pico Bonito que
sustenta a200 pueblos, aldeas, caserios y, por supuesto, La Ceiba; oCusuco que le da vida aSan
Pedro Sula y 20 centrospoblacionales Dicho de otra forma, es muy probable qué Ud. amigo
, 'lector, dependa hoy de un bosque nublado para agua.
y animales de los bosques nublados constituyen un extraordinario banco genético
irremplazable. Son la cura de innumerables enfermedades que nos agobian yla esperanza
ticia de los próximos años, son nuestro futuro. Una vez que desaparecen de su entorno, las
y los zoológicos nos los recuerdan.
"Aislados en las partes altas de las montañas nacionales,'los bosques nublados son verdaderas
olvidadas por
de Hlbueras·, Edición 2 Diario "El Heraldo·, Tegucigalpa M.D.C. '
: "En
artes
Más
tañas

que

tanto,

agua.
% del
del

:0que
aSan
amigo

nético
Iimen­
las
..
~ •••••••.,",•.•.+.••.•;.••••• I
E
Ptobabilidad. d(
Ptobabilidad Ptobabilidad como Ptobabilidad

Jacob Bemoulli, Abrahamde Moivre, Thomás Bayes y Joseph Lagrange inventaron fónnulas y técnicas de

probabilidad. En el siglo XIX Pierre Simón, Marquis de Laplace unificó esas primeras ideas y fonnuló la

primera Teoría General de la Probabilidad.

La Teoría de la Probabilidad fue aplicada con buenos resultados a las mesas de juego y, lo que es aún más El
en
importante, con el tiempo se aplicó a otros problemas socioeconómicos. La industria de los seguros, que
nació en el siglo XIX, requería un conocimiento exacto del riesgo de pe,rder, pues de lo contrario no se La
­
podían calcular las pólizas. En la actualidad la teoría matemática de la probabilidad constituye el pe:

fundamento de las aplicaciones estadísticas tanto en la investigación social romo en la toma de decisiones.
op,

La probabilidad forma parte de nuestra vida En las decisiones de carácter personal y gerencial, se
Au
enfrenta la incertidumbre y nos valemos de la teoría la probabilidad, sin importar si se admite o no el ha
empleo de una cosa tan Cuando se escucha el pronóstico del tiempo según el cual hay un 80% de prc
probabilidad de lluvia, lo más aceptable es que tome. precaución al salir, de llevar consigo un paraguas.
Los administradores deben preguntarse sobre las posibilidades de que las ventas de cierto artículo alcancen
o excedan uÍl cierto nivel. ¿Qué debería preguntarse un profesor? ¿un sociólogo? Est
ent
reSl
Vivimos en un mundo donde se es incapaz de pronosticar el futorocon absoluta certeza La necesidad de
sortear la incertidumbre, nos lleva a estudiar y aplicar la Teoría Probabilidad. En muchos casos se COI
tendrán algunos conocimientos sobre Jos posibles resultados de una decisión. Si se organiza esta deb
infonnación y se analiza sistemáticamente, se podrán reconocer las suposiciones, comunicar a otros el
prol
razonamiento y tomar una decisión mas inteligente de la que se lograría recurriendo a un método que no sea

científico.

En las ciencias, constantemente se están haciendo experimentos. A fin de poder obtener resultados, es

necesario que estos experimentos puedan repetirse cuantas veces se desée, con la exigencia de que dichas

repeticiones puedan efectuarse en condiciones experimentales similares.


.
En]
En el estudio de la probabilidad, son muy utilizados entre otros, los términos: enfe

Experimento: Es todo proceso que produce una observación o medición. La¡


utili:
Ejemplos: ento:
dado
razOI
l. Lanzar una moneda al aire. 2. Lanzar un dado sobre una mesa

Evento: Es el resultado parcial de un experimento. encu­


Ene:
Ejemplos:
defot
evenl
l. Letra, Escudo en el lanzamiento de la moneda 2. 1 Ó 2 Ó 3 Ó 4 Ó 5 Ó 6 en el lanzamiento del dado

-.Horado

Espacio Muestral: Es el conjunto de todos los resultados posibles de un experimento. Por lo general, se
designa con S. Se le llama también Universo o lista colectivamente exhaustiva. . .
Ejemplos:

1. S= {letra, escudo} en lanzamiento de la moneda


de 2. S = {I, 2, 4, 5, 6}en lanzamiento del dado
16 la

En general la probabilidad es la posibilidad de que algo ocurra. El cálculo de probabilidad tiene aplicación
más en todos los aspectos de la vida: en la ciencia, en el comeido, en la ooucacióil, en las comunicaciones, etc.
. que
10 se La idea de probabilidad se encuentra relacionada con el o Por ejemplo, cuando una
le el persona juega al naipe o las cartas, primero se asegura de que las cartas estén bien barajadas para garantizar
Iles. que ninguna carta o cartas tengan un lugar especial en la baraja y asegurar que cada carta tiene la misma
oportunidad de encontrarse en cualquier parte de la baraja.
al, se Aunque separados, la Probabilidad y la Estadística son campos de Matemática con relación entre sí. Se
no el ha dicho que es el vehículo de estadlstica". Es decir de ser por las leyes
de probabilísticas, la Estadística no sería posible.

Históricamente, la manera más antigua de medir la incertidumbre es el concepto clásico de


mcen
Este se creó originalmente con relación a juegos de azar y se presta mas fácilmente para formar el camino
entre las posibilidades y las Este concepto· se aplica exclusivamente cuando todos los
resultados posibles tienen la misma probabilidad de ocurrir
.
y en este caso se estudia el siguiente concepto:
ad de
se Si hay n posibilidades igualmente probables, de las cuales una
deberá ocurrir y junto con s se consideran favorables, o corno un "triunfo" o "éxito",. entonces la
l esta
probabilidad de que haya un triunfo o éxito es:
ros el
10 sea

os, es
lichas
En la aplicación de esta regla, lós ténninos "favorable" ó "triunfo" ó "éxito", se utilizan libremente y se
pueden aplicar a cualquier tipo de resultádos, aunque favorable ó triunfo ó éxito sea por ejemplo, caer
enfermo. Generalmente lo que es un éxito o triunfo para unjugador, es una falla o fracaso para sU oponente;

La probabilidad clásica, a menudo se le conoce como probabilidad a priori debido a que si se sigue·
utilizando ejemplos previsibles, como monedas no alteradas, dados no cargados y de barajas normales,
entonces se puede establecer la respuesta de antemano (a priori) sin necesidad de lanzar una moneda, un
dado o tomar una carta; es decir, no se tiene que realizarel experimento para obtener conclusiones en un
razonamiento lógico antes de realizar el experimento.

La probabilidad a priori no se puede aplicar a los· problemas de toma de decisiones como los que se
encuentran en administración y ciencias sociales.
En el siglo XIX los estadísticos británicos, interesados en la fundamentación teórica del cálculo del riesgo
de pérdidas en las pólizas de seguros de vida y comerciales, empezaron a recoger datos sobre nacimientos y
defunciones. En la actualidad, a este planteamiento se le llama Frecuencia Relativa de Presentación de un
evento y define la probabilidad como:
I dado
1. La frecuencia relativa observada de un evento durante un gran número de intentos
2. La fracción de veces que un evento se presenta a la larga, cuando las condiciones son estables.
_. .: ••••.11.1.1,1.,•.".•••

Este método utiliza la frecuencia relativa de las presentaciones pasadas de evento como probabilidad.
Determina que tan frecuente ha ocurrido algo en el pasado y usa esa cifra para predecir la probabilidad de
que suceda de nuevo en el futuro. Por ejemplo, una compañía de seguros sabe por información obtenida de
los datos actuariales registrados, que de los. hombres de 50 años de edad, 60 de cada 100,000 morirán de un
período de un año; con esos datos, la compañía estima la probabilidad de muerte de ese grupo, de edad en
particular como:
60 =0.0006
100 000
Una dificultad del presente planteamiento de la probabilidad como frecuencia relativa, es que la gente lo
utiliza a menudo, sin evaluar el número suficiente de resultados.

Otro tipo de probabilidad lo constituyen las las que basadas en las creencias de
las personas efectúan la estimación de probabilidad. De hecho, la probabilidad subjetiva se puede definir
como la probabilidad asignada a un evento por parte de un individuo, basada en la evidencia que se tenga
disponible. Esta evidencia puede presentarse en forma de frecuencia relativa de presentación de eventos
pasados, o puede tratarse simplemente de una creencia meditada.
(

Quizá la más antigua estimación de probabilidad subjetiva de que fuera a llover, se dió cuando los abuelos
decían: "Los gallos cantan en la madrugada, creo que mañana lloverá". .

Las asignaciones de probabilidad subjetiva se dan con más frecuencia cuando los eventos se presentan sólo
una vez o un número muy reducido de veces; por ejemplo: si una población sólo es de 4 personas y se
desea una de ellas para un puesto de gerencia de producción; cada pe¡sona.tiene buena apariencia, alto nivel
educativo y de actividad, experiencia, bastante confianza en sí mismo, buen récord de trabajo anterior y
disposición para enfrentarse a los retos que se presenten, ¿cuál es la probabilidad de que cada candidato se
relacione exitosamente con el cliente? El'responder a esta pregunta y escoger a uno de ellos requerirá que
se asigne una probabilidad subjetiva al potencial de cada aspirante.

Como casi todas las decisiones sociales y administrativas de alto nivel se refieren a situaciones específicas

y únicas, los responsables de tomar decisiones en este nivel hacen uso considerable de la probabilidad

subjetiva.

Se presentan a continuación algunos ejemplos sobre el cálculo de probabilidades:

Ejemplos:

1. ¿Cuál es la probabilidad de sacar un as de una baraja de 52 cartas de juego?

Solución: Hay s =4 ases entre las n =52 cartas, de manera que: S

P(A) *
= = 0.0769
2. ¿Cuál es la probabilidad de obtener un número par en el lanzamiento de un dado?
... Resp.
rr.

Solución: Hay s =3 números pares entre {l, 2, 3,4,5, 6}, n = 6 posibles casos, de modo que

P(A) = 0.5000 ... Resp.

3. Una ruleta tiene inscritos los números del 1 al 20 encontrándose éstos igualmente espaciados. Se le
da vueltas y después se detiene en forma aleatoria, en alguno de los números.

.
• •Horacio Reyes Nuñez

•.•m.¡.dC.•.•.C..... . ..
a) ¿Cuál es la probablidad de que se detenga en el número 14?

idad.
Id de Soluci6n:

la de
le un
Hay s = 1 (un número 14) dentro de n = 20 números de la ruleta, de modo que:

id en
s 1

peA) = = 20 = 0.05 ... Resp.

b) ¿Cuál es la probabilidad de que se detenga en un número par?


lte lo
Soluci6n:

ias de Hay s =10 (Diez números pares entre 1 y 20) dentro de n = 20 números de la ruleta, de modo que:
efinir
tenga s _10_ 1- 05
P(A) -- n ... Resp.
'entos .

c) ¿Cuál es la probabilidad de que se detenga en el número 15 u otro más grande?

lUelos
Soluci6n:

n s610 Hay s = 6 (números mayores o iguales que 15: 15, 16, 17, 18, 19, 20) dentro de n = 20 números
s y se (1 a 20) de la ruleta, de modo que:
1 nivel
:rior y peA) = = = 0.3000 ... Resp.
lato se
rá que Si A es un evento cualesquiera, entonces:
peA) significa: probabilidad de ocurrencia del evento A
peA') significa: probabilidad de no ocurrencia del evento A.
cíficas
)ilidad

Se envía una encuesta a 358 directores de recreaci6n en colegios y universidades. A continuaci6n se


muestra resumen de las matrículas de tales centros de enseñanzas
. Resp.
Se selecciona al azar una de las 358 colegioslUniverisdad.
... . . Encontrar las probabilidades de los siguientes eventos:
.
a) La matrícula de la escuela era menor de 2 500 estudiantes
O
b) La matrícula de la escuela era de 10 000 6 más
1250
2500 - 4999 c) La matrícula de la escuela era entre 2 500 Y9 999 estudiantes;
.. Resp. - d) ¿Qué porcentaje de escuelas tienen matrícula menor de 5 000
- 17999 estudiantes?
s. Se le e) ¿Qué poecentaje de escuelas tienen matrícula mayor o igual
que 10 000 estudiantes?
f) ¿Qué porcentaje de escuelas tienen entre 2 500 y 10 000
estudiantes?

Horacio Reyes úñez• •


¡1
~
. .'
• • • • • •tEdi.i,•.•.

e
Cl
Si a cada resultado de un experimentos de probabilidad se-le asigna un valor numérico, entonces a medida pi
que se presentan los resultados de la prueba se observa una variable aleatoria. Este valor numérico es la el
variable aleatoria. la

Es la variable que asume un valor numérico único para cada uno de los resultados
que aparecen en el espacio muestral de un experimento de probabilidad.

En otras palabras, para denotar los resultados de un experimento de probabilidad se usa una variable
aleatoria. Esta puede asumir cualquier valor numérico que pertenezca al conjunto de todos los resultados
posibles de un experimento (Se denomina "aleatoria" porque el valor que asume es producto de un evento
al azar o aleatorio). Cada evento en un experimento de probabilidad también debe definirse de modo que se 1.
le asigne solo un valor de la variable aleatoria, y todo evento debe poseer un valor asignado.

La siguientes ilustraciones ejemplifican diversas variables aleatorias:


2. :
1. Se lanzan 5 monedas y se observa el "número de escudos" visible. La variable aleatoria es el número de
escudos observados y puede asumir valores enteros de Oá 5.

2. Sea el "número de llamadas telefónicas recibidas" por día en una compañía una variable aleatoria. Los 3.I
valores posibles para esta variable son enteros que varían desde Ohasta un número muy grande.
4. a
3. Sea la "longitud del cable" de un aparato eléctrico una variable aleatoria. Esta es un valor numérico entre b
12 y 72 pulgadas para casi todos los aparatos eléctricos.

4. Sea la "velocidad de calificación" de los automóviles de carrera, que intentan calificar para la carrera 5.
final de 500 millas, una variable aleatoria. s(
vo
Las variable aleatorias numéricas pueden subdividirse en dos clases: variables aleatorias discretas y
variables aleatorias continuas 6. U
Y
Variable Aleatoria Discreta: Es la variable aleatoria cuantitativa que puede asumir una cantidad medible Id
numerable de valores pe

Variable Aleatoria Continua: Es una variable aleatoria cuantitativa que puede asumir una cantidad 7. U
innumerable de valores.
va
En muchos casos, los dos tipos de variables pueden distinguirse al decidir si estan relacionadas con un
conteo o con una medición. Las variables de los ejemplos 1 y 2 soº, discretas; los valores de las variables se
encuentran al contar el número de escudos observados o al contar número de las llamadas recibidas (ar'
contar no pueden ocurrir valores fraccionarios).

Las variables en los ejemplos 3 y 4 son variables aleatorias continuas; los valores de las variables se
encuentran midiendo la longitud del cable y la velocidad (al medir puede ocurrir cualquier valor
fraccionario).

Cuando se intenta determinar si una variable es discreta o continua es necesario observar la variable y
pensar en los valores que podrían ocurrir. por ejemplo en el 1 y 2 no puede ocurrir ningun valor numérico
entre 3 y 4 (3.7 escudos no es posible, como tampoco 3.52 llamadas telefónicas). Sólo son posibles valores
enteros; así hay "huecos" entre los valores posibles..
Las pi
ciertas
variable aleatoria continua está rel;lcionada con una recta numérica continua y con todos los números
deben
representados en ésta. Cuando son posibles todos los números reales, racionales o iracionales, entonces la
variable es continua. El número de valores posibles es ilimitado.

••
. R.-:e-::c:y-,-e.,....s-,-···--.N"·-.-ú---ñ,-e-z
- mM."".-mm·""C·"-·'.·"·'M."".1)
Considere la variable "puntajes otorgados por un juez" en una competencia de patinaje artístico. Si se
considera algunos puntajes.ya ocurridos, 9.9, 9.5, 8.8, 10, Y se advierte la presencia de cifras decimales,
ledida podría pensarse que son posibles todas las fracciones y así concluir que la variable es continua. Sin
, es la embargo, esto no es cierto. No es posible un puntaje de 9.134, así entre los valores posibles hay "huecos" y
la variable es discreta.

ltados

..::=
lItados
1. Se aplicará una encuesta a los estudiantes de una universidad con respecto al número de cursos en que se
que se inscribieron cada uno para este período. Identifique la variable aleatoria de interés y enumere sus valores
posibles.

2. Se aplicará una encuesta a los estudiantes de una universidad con respecto al peso de los libros y útiles
que llevan según los cursos del día. Identifique la variable aleatoria de interés y enumere sus valores
lero de posibles.

3. Las variables en los ejercicios 1 y 2 anteriores son ¿discretas o continuas?, ¿qué son y porqué?
Los
4. a) Explique por qué la variable "puntaje" para el equipo local de un juego es discreta
o entre b) Explique por qué la variable "número de minutos para trasladarse al trabajo" de los trabajadores de una
maquila local es discreta.

carrera 5. Una trabajadora social está llevando a cabo un estudio sobre la estructura familiar; obtiene informaciones
sobre el número hijos por familia, en cierta comunidad, a partir de los datos del censo. Identifique la
variable aleatoria de interés, determine si es discreta o continua y enumere sus posibles valores.
y
6. Un experimento implica la prueba de un nuevo interruptor encendido/apagado. El interruptor se enciende
y se apaga hasta que se descompone, y se anota el número de intento en el que se descompuso.
nedible Identifique la variable aleatoria de interés, detennine si es discreta o continua y enumere sus valores
posibles. .

antidad 7. Un arquero dispara flechas a un blanco y se mide la distancia que hay entre la diana y la flecha
disparada. Identifique la variable aleatoria de interés, determine si es discreta o continua y enumere sus
valores posibles
con un
ibles se 1. A pÍlrtir del inciso 4.1 hasta el 4.3 inclusive de esta unidad, se trabaja con
idas (ar· las probabilidades cuya variable de estudio es cuantitativa discreta.

2. A partir del 4.4 hasta el 4.5 de esta misma unidad se trabaja con
lbles se
probabilidades cuya variable de estudio es cuantitativa continua.
:r valor

todo
riable y
Jmérico
valores

Las probabilidades pertenecen siempre a la incidencia o no incidencia de eventos. Estos deben cumplir

ciertas reglas en las cuales se "comportan" las probabilidades; es decir, son reglas matemáticas que siempre

lúmeros deben cumplirlas. Las siguientes son algunas de estas Reglas Básicas:
la

HoracioReyes ••
'. . •.i'G'·',M"."¡""Mf@.

RI. Las probabilidades son números reales que están en el intervalo [0,1] es decir: So

P(A):s 1
a)
R2. Si se tiene certeza de que siempre ocurrirá un evento, su probabilidad es l. Y si se tiene la
certeza de que nunca ocurrirá, su probabilidad es O.

P(S) = 1
. =0 •
R.3. SI dos eventos son mutuamente excluyentes o mutuamente exclusIvos (o sea que no pueden b)
ocurrir al mismo tiempo, AnB = la probabilidad de que uno o el otro ocurran es igual a la
suma de sus probabilidades.

P(AUB ) =P(A) + P(B)


RA. La suma de las probabilidades de que ocurra un evento P(A) y de que no ocurra P(A') es igual a 1.

P(A) + P(A') = 1

R5. SiAnB = entonces p(A'nB') = 1- P(AUB)

Ejemplo 1. d)

Si A es el evento de que un estudiante se quedará en casa; B el evento de que irá al cine; P(A) =0.64 Y
P(B) =0.21, detenninar: a) P(A'); b) P(AUB); c) p(AnB)
Solución:
Da(
a) * P(A) + P(A') = 1 ... Regla 4. R4 vale
P(A') = 1 - P(A) .oo P(A') = Probabilidad de que no
se quedará en la casa.
P(A') = 1 - 0.64 =0.36 oo. Sustituyendo valores y
operando Det.
P(A') =0.36 Probabilidad de que no se quedará en casa oo. Resp. cart

7. l
b)* P(AUB) = P(A) + P(B) oo. R.3. Son eventos mutuamente
excluyentes. 8. l
0.64 + 0.21 = 0.85 oo. Sustituyendo. Operando
Ac
P(A U B) = 0.85 Probabilidad de que se quedará en casa o oo. Resp.
estu
irá al cine

c) * p(AnB) =O No existe esta probabilidad OO' Resp. Los eventos A y B son


mutuamente excluyentes
Ejemplo 2.

Si e es el evento de que a las 9:30 a.m. un cierto médico esté en su consultorio y D es el evento de que
= =
esté en el hospital; P(C) 0.48 y P(D) 0.27. Determinar la probabilidad de que: a) no esté en el
consultorio; b) no esté en el hospital, c) no esté en el consultorio ni en el hospital; d) que esté en el
hospital y en el consultorio.
coro

13.1
14.

••
• -iJ

• Solución:
•. mm·l'di·•.• ·.·¡'·.aM"" ~. .
a) * P(C') ... Probabilidad de no estar en el
consultorio.
:ne la P(C') = 1 - P(C) ... Despejando . de la fónnula
= 1 - 0.48 =0.52 sustituyendo y operando. R.4.

P(C') =0.52 Probabilidad de no en el consultorio ... Resp.


leden b)* P(D') = l-P(D) ... Probabilidad de no estar en el
1 a la hospital.
P(D') = 1 - 0.27 = 0.73 ... ¿Qué se hizo?

P(D') = 0.73 de no en el hospital ... Resp.

al. c) * P(C' nD') =1- P(CUD ) ... ¿Por ser mutuamente excluyentes
= 1 - (0.48 + 0.27) Sustituyendo y operando
= 1-0.75 =0.25
P(C' nD') =0.25 Probabilidad de no en el Resp.
ni en el hospital

d) * p(CnD) =O ¿Qué representa? Resp. ¿Por qué?

).64 Y

[ue no
1. P(A') 2. P(B') 3. P(AUB) 4. p(AnB) 5. P(A'UB) 6. p(A'nB')
y
Determinar la probabilidad de los siguientes eventos que se dieron al sacar una carta de llila baraja de 52
cartas:
7. Un7 9. Un as o un rey ll. Una figura roja (rey, reina, sota)
mente 8. Una carta negra 10. Un 2 o un 3 negros 12. Un 4 rojo y un as negro

A continuación da una distribución de frecuencias de las .;omisiones anua 1­ - or ventas tomada de un


estudio de 300 vendedores promedio.

B son

de que
é en el
é en el
Basándose en esta información ¿cuál es la probabilidad de que un vendedor promedio obtenga una
comisión:

13. Entre L. 5 000 Y L. 9 999 15. Más de L. 17. Más de L. 25 000


14. Menor que L. 15 000 16. Entre L. 15000 YL. 19999
~
.. •. mm.i'iii·i"·'.·ii·i"M@"

18. El secretario de un sindicato, redactó una lista con un conjunto de demandas salariales y de prestaciones
que se presentará al gerente de la empresa. Para darse una idea del grado de apoyo que existe entre los
trabajadores con respecto al paquete de demandas, hizo un sondeo aleatorio entre los dos grupos
principales de trabajadores, los maquinistas (M) y los inspectores (1). Tomó 30 trabajadores de cada Si
grupo con los resultados siguientes:
jU[
62

La
pre

30 30

a) ¿Cuál es la probabilidad de que un maquinista, seleccionado al azar del grupo sondeado, apoye
levemente el paquete?
b) ¿Cuál es la probabilidad de que un inspector, seleccionado al azar del grupo sondeado, esté indeciso dOI
con respecto al paquete?
c) ¿Cuál es la probabilidad de que un trabajador (maquinista o inspector), seleccionado al azar del
grupo sondeado, apoye el paquete, ya sea fuerte o levemente?
d) ¿Qué tipos de estimación de probabilidades son éstos?
Eje
19. Clasifique las estimaciones de probabilidad siguientes según su tipo (clásica, de frecuencia relativa o
subjetiva):
a) La probabilidad de anotar en tiro de castigo durante un juego de fútbol es de 0.47
b) La probabilidad de que el director actual de la escuela renuncie es de 0.85
c) La probabilidad de obtener dos seises al lanzar dos dados al mismo tiempo es de 1136
d) La probabilidad de que un presidente electo en un año que termine en cero muera en su oficina es de
e) La probabilidad de que usted vaya a Europa este año es de 0.14.

20. El gerente administrativo de una compañía de seguros tiene los datos siguientes acerca del
funcionamiento de las fotocopiadoras de la compañía:
Sol

Segón los datos ¿cuál es la probabilidad de que una fotocopiadora esté fuera de servicio?

21. Un tazón tiene 18 bolitas rojas, 12 blancas, 14 azules y 6 negras. Si se saca una bolita al azar,
determinar la probabilidad de sacar:
Se 1
a) una bolita roja; b) una bolita blanca o roja; c) una bolita azul; d) una bolita que no sea ni roja ni
con
negra; e) una blanca y una negra

• Horacio Reyes
• ••,·I,··".·,.··'··MM"" ~. .
iones
"e los

cada Si dos eventos no son mutuamente excluyentes, es posible que ambos se presenten al mismo tiempo.
Ejemplo: sacar un as 6 un 2 de diamantes de una baraja de 52 cartas son eventos que pueden presentarse
juntos ya que puede aparecer uno u otro al momento de extraer una carta de la baraja. en consecuencia, as
6 2 de diamantes son eventos no mutuamentes excluyentes.

La R.3. de las probabilidades se debe ajustar para evitar conteo doble, es decir, se tiene que reducir la
probabilidad de obtener un as o un 2 de diamantes en la posibilidad de que se puedan obtener ambos
eventos juntos. Como resultado de lo anterior, la ecuación correcta para la probabilidad de uno 6 más
eventos A, B que no son mutuamente excluyentes es:

(24.1)

eciso donde: P(AUB) = Probabilidad de que ocurra el evento A 6 el B siendo no mutuamente excluyentes
P(A) = Probabilidad de que ocurra el evento A
del P(B) = Probabilidad de que ocurra el evento B
p(AnB) = Probabilidad de que ocurran Ay B juntos
Ejemplo 1.
iva o
Los empleados de la compañía XYZ han elegido a 5 de ellos para que los representen en el Consejo de
Administraci6n. Los perfiles de los cinco elegidos son: .
1. Hombre 30 años de edad
2. Hombre 32 años de edad
3. Mujer 45 años de edad
4. Mujer 20 años de edad
5. Hombre 40 años de edad
¿Cuál es la probabilidad de que el vocero sea mujer o cuya edad esté arriba de 35 años?
a del
Soluci6n:
Sea A = evento de ser mujer ... Especificando los eventos
B = evento de ser mayor de 35 años
AnB = evento de ser mujer y mayor de 35 años

P(A) = ; P(B) = ; p(AnB) = ... Calculando las probabilidades


correspondientes
P(AUB) =P(A) + P(B) - p(AnB) ... F6rmula general de la adición
para eventos no mutuamente
= + _ excluyentes. Sustituyendo y
5 5 5 5 operando
P(AUB)
. 5
=0.6 ... Resp.
azar,
Se puede verificar este trabajo mediante inspecci6n y ver que de los 5 empleados del grupo, 3 cumplirán
con el requisito de ser mujer o de tener mas de 35 años.

. - ...· ·- - . 1

'. . •.

Ejemplo 2:

La siguiente tabla muestra el resultado de 527 entrevistas 'durante una encuesta para estudiar las
opiniones que tienen al aborto legalizado los residentes de cierta ciudad. Los datos están
clasificados por área de la ciudad.

1.

Si se elige al azar una de las entrevistas de las 527, ¿cuál es la probabilidad de que el entrevistado
2.
a) Estuviera a favor del aborto legalizado?

Solución: P(F) = 0.5692 ." Resp

b) Estuviera indeciso?
3.
Solución: P(R) = 0.1745 ... Resp.

e) Viviera en el área E?

Solución: P(E) = 0.2751 ... Resp.

d) En contra del aborto legalizado y viviera en el área B? 4.

Solución: p(QnB) = 0.0094 ... Resp.

e) A favor del aborto legalizado o que viviera en el área E?

Solución: P(F U E) =P(F) + P(E) - p(FnE) ... ¿Porqué?


300 145 35 ... Sustituyendo
= 527 + 527 - 527
= 0.5692 + 0.2751 -
5.
=0.7779 ... Resp.
t) Indecisos ó que viviera en el área B?

Solución: P(RUB) =P(R) + P(B) - p(RnB) ... ¿Porqué?


92 127 7 ... Sustituyendo
= 527 + 527 - 527
= 0.1745 + 0.2409 - 0.0132 ... Operando

=0.4022 ... Resp.


- .
·••·I'u.· i ,•.,•.•
. .

las
están

Los resultados de un experimento correspondiente a


cada evento, y el número de resultados que·ii:¡rtófiéiponden a ningún evento. Tomando en cuenta estos
diagramas, dé las probabilidades que se piden:

1. Total de resultados = 50
P(A) =
P(B)=
P(AUB)=
p(AnB)=

2. Total de resultados = 60
P(A) =
P(B) =
P(AUB) =
p(AnB) =

3. La compañía Herr-McFee, que produce barras de combustible nuclear, debe revisar con rayos X y hacer
una inspecci6n meticulosa de cada barra antes de entregarla. Karen Wood, una de las inspectoras, se ha
dado cuenta de que cada 1 000 barras de combustible que revisa, diez tienen defectos internos, ocho
tienen defectos en su contenedor y cinco tienen ambos tipos de defectos. En su informe trimestral,
Karen debe incluir la probabilidad de que haya defectos en las barras de combustible. ¿Cuál es esta
probabilidad?

4. Una urna contiene 75 canicas: 35 son azules y 25 de estas canicas azules están veteadas. El resto de
ellas son rojas, y 30 de éstas también están veteadas. Las canicas que no están veteadas son
transparentes. ¿Cuál es la probabilidad de sacar:

a) una canica azul?


b) una canica transparente?
c) una canica azul veteada?
d) una canica roja transparente?
e) una canica veteada?

5. La Hal Corporation desea mejorar la resistencia de sus computadoras personales que construye, con
respecto a fallas en la unidad de disco y el teclado. En la actualidad, el diseño de sus computadoras es
tal que las fallas de la unidad de disco significan un tercio de las fallas del teclado. La probabilidad de
que se presente una falla conjunta en la unidad de disco y en el teclado es de 0.05.
a)Si la computadora es 80% resistente a fallas en la unidad de disco y/o en el teclado, ¿qué tan baja
debe ser la probabilidad de que se presente una falla en la unidad de disco?
b)Si el teclado se mejoró de tal modo que s6lo falla el doble de veces que la unidad de disco (y la
probabilidad de falla conjunta sigue siendo de 0.05), ¿la probabilidad de falla en la unidad de disco
del inciso a) producirá una resistencia a fallas en la unidad de disco duro, en el teclado, o en ambos,
mayor o menor que 90%?
~. . •.• m.i'Gi.i,M.i••

6. Un inspector de Alaskan Pipeline tiene asignada la tarea de comparar la confiabilidad de dos estaciones Si
de bombeo. Cada estación es susceptible de dos tipos de falla: fallas en las bombas y fugas. Cuando una se
de éstas (o ambas) se presentan, la estación debe quedar fuera de servicio. Los datos disponibles indican cal
que prevalecen las siguientes probabilidades: res

¿Cuál estación tiene la mayor probabilidad de quedar fuera de servicio?

Las
igu.
Frecuentemente un evento A contiene elementos muestrales que son elementos de otro evento B, o sea que
AnB Ya que los dos eventos tienen como mínimo un elemento en común, entonces pueden ocurrir
simultáneamente. El propósito de esta sección es examinar la probabilidad de dos eventos con elementos
comunes, sabiendo que uno de los sucesos ya se ha realizado; es decir, la probabüidad de que ocurra el se o
evento A que haya ocurrido el evento B ó viceversa. A lo anterior es lo que se le llama: probabilidad
condicional. .
y e
prol

La probabilidad condicional de A, dado B que se escribe P(AIB), es igual a la probabilidad de AnB,


dividida entre la probabilidad de B, siempre que la probabilidad de B no sea cero; es decir:

.'J. .'-an~ .
.•..... ~ .(24.2) donde: P(AIB) = ocurra
Probabilidad
B de ocurra A dado que
. =
p(AnB) Probabilidad de que ocurra A y B que
P(B) = Probabilidad de que ocurra B
.. 1= La línea vertical se lee: "dado que"
Ejer
Para interpretar con mayor facilidad la Probabilidad Condicional, se analizarán los siguientes ejemplos:

Ejemplo 1
Solu
Una organización investigadora en pro del consumidor, ha estudiado los servicios que prestan 150
técnicos en reparación de aparatos eléctricos de cierta ciudad y se resumen en la siguiente tabla:

86
ISO
Si G = Evento de que un técnico brinda buen servicio
G' = Evento de que un técnico brinda servicio deficiente
F = Evento de que un técnico esté capacitado en la fábrica
F' = Evento de que un técnico no esté capacitado en la fábrica
*
-

iones Si se selecciona un técnico al azar (es decir, cada uno tiene misma probabilidad de ser seleccionado: l/ISO),
".18
ouna se describe que las probabilidades de escoger: a) un técnico que brinde buen servicio, b) un técnico que esté
dican capacitado en fábrica, c) un técnico que ofrezca buen servicio y que esté capacitado en fábrica, son
respectivamente:
_72_
a) P(G) -150 - 0.48 ... Se designa cada evento con una letra, por ejemplo
G y F Y sus respectivos complementos o
b) P(F) = 0.43
negaciones con la misma letra solo que con un
apóstrofe: G' y F'.
48
... GnF es obtenido de la tabla donde se intersecta la
c) p(GnF) =150 = 0.32
columna de G con la línea de F (48) Y este número
se divide por el total de las observaciones. (150).
El cociente obtenido (0.32) es probabilidad pedida.

a que
:urrir
r
Las probabilidades anteriores se obtuvieron con la fórmula de abajo en relación con probabilidades

lentos Al apreciar el espacio de eventos reducido que se presenta (columna total y/o ftla total del cuadro) la tabla.
rra el se obtiene:
48
P(GIF) = 64 = 0.75
Y esta es en realidad una mejora sobre P(G) = 0.48, como se podría esperar. Obsérvese que esta
probabilidad condicional 0.75, también puede expresarse como:
48
P(GIF) = p(GnF) = = 48 150
P(F) 6 4 6 4 x 150
150
.0 que 48
P(GIF) = 64 = 0.75
que es la razón de la probabilidad de: elegir un técnico que brinde buen servicio G que esté
capacitado en fábrica F. En símbolos, lo anterior se escribe: P(GIF).

Ejemplo 2.
De la tabla del ejemplo 1. ¿Cuál es la probabilidad de seleccionar un técnico que brinde un buen
servicio que no esté capacitado en fábr..
Solución:
n 150 * P(GIF') =p(GnF') ... Probabilidad condicional pedida
P(F')
... Probabilidad de que un técnico brinde buen
servicio y que no esté capacitado en fábrica. Ver
cuadro
P(F') ... Probabilidad de no estar capacitado en la fábrica.
150
24 Ver cuadro
* P(GIF') = p(GnF') = ISO = 24 x 150 ... Sustituyendo y operando
P(F') 86 86 x 150
150
= 24 =0.28
86
P(GIF') = 0.28 ... Resp.

....
_ .. ..-: .

Horacio Reyes ••.


.. . •.mm.ii¡;i.i.M.i•.

Ejemplo 3. s(
De la misma tabla del ejemplo 1. a) ¿Cuál es la probabilidad de seleccionar un técnico que brinde
servicio deficiente dado que sea capacitado en fábrica? b) Cuál es la probabildad de seleccionar un
técnico que no esté capacitado en fábrica que brinde mal servicio.
Solución:

a) * P(G'IF) = ...Probabilidad condicional pedida

150 ...¿Qué representa esta probabilidad?

P(F) = 16 ...Probabilidad de ser capacitado en fábrica.


Ver el cuadro Ej
P(G'IF) =p(G'nF) = 150 = 16 x 150 = 0.25 ...Sustituyendo y operando
P(F) 64 64 x 150

150

P(G'IF) = 0.25 ...Resp.

b) * . ... Complétela. ¿Qué significa? Explique


So
62 ... ¿Qué representa esta probabilidad? Ver el
150
cuadro.
8
P(G') = 0 ... ¿Qué representa esta probabilidad? Ver el
cuadro

62

P(F'IG') _p(F'nG')_ 150 _ 62 x 150 _ 62


...¿Qué se hizo?
- P(G') , 78 x 150 - 78
150

P(F'IG') 0.79 ... Resp.

Definieion: El evento A es del evento B, si la probabilidad del evento A no se ve afectada


por la ocurrencia o no ocurrencia del evento B. Se escribe:

Siempre que el evento A sea independiente del evento B, se acostumbra decir simplemente que A y B
independientes. Si A YB no son independientes, se dice que son
Ejemplo 1.

La probabilidad de aprobar Estadística, Matemática o ambas son respectivamente


P(E);;: 0.75, P{M);;: 0.84 Y p(EnM) = 0.63; ¿cuál es la probabilidad de aprobar Estadística dado que
apruebe Matemática? ¿Son eventos Independientes? ¿Por qué?

.. .. ..
l.

• •. 1)
..
Solución:

inde =
*P(EIM) p(EnM) ... Probabilidad condicional pedida
P(M)
r un
p(EnM) =0.63; P(E) = 0.75; P(M) =0.84 ... Datos dados en el problema

P(EIM) = =0.75 ... Sustituyendo y operando en la fórmula de


la probabilidad condicional.
P(EIM) = 0.75

* Como P(EIM) = P(E) =0.75 son eventos independientes ... Resp. Ambas probabilidades son iguales
P(EIM) = P(E) por definición
Ejemplo 2.

La probabilidad de que habrá escasez de cemento es 0.28, la de que obra se terminará a tiempo es
0.53 y la de que la obra se terminará a tiempo y no habrá escasez es 0.64. a) ¿Cuál es la probabilidad
de que la obra se terminará a tiempo dado que no habrá escasez de cemento? b) Son eventos
independientes? ¿Por qué?
Solución:
el =
a)* Sea N Evento de que habrá escasez de cemento ... Identificando los eventos
N' = Evento que no habrá escasez de cemento
Ter el F = Evento de que la obra se terminará a tiempo
F' = Evento de que la obra no se terminará a tiempo

P(N') = 1 - P(N) = 1 - 0.28 = 0.72 ... Calculando P(N') de la ecuación


P(N) + P(N') = 1
p(FnN') =0.64 ...... ¿Qué representa esta probabilidad?

P(FIN') := p(FnN'):= 0.64 := 089 ... Calculando la probabilidad condicional.


P(N') 0.72 .
Sustituyendo y operando
P(FIN') = 0.89 ... Resp.

b)* Como P(FIN') =0.89 es diferente de P(F) =0.53, ... Resp. P(FIN') P(F)
entonces los eventos no son independientes
. 1. Si ambos lados de la ecuación 24.1 se multiplican por P(B) se obtie,'.e lo que
E~ se llama la regla de multiplicacion general que permite cal\.ular la
probabilidad de que ocurrirán dos eventos:
ó

2. Cuando A y B son independientes, se puede sustituir P(AIB) por P(A) en la


primera de las dos fórmulas ó P(BIA) por P(B) en la segunda y obtener la
B ecuación de abajo llamada regla de multiplicaci6n especial (Eventos
Independientes).
.J (24.3)
mente 3. La regla anterior a veces se utiliza como definición de Independencia de
lo que Eventos; en cualquier caso, se puede utilizar para verificar si dos eventos
dados son independientes, así:

• . .• '

Horacio Reyes úñe~• •


F

.. •

Ejemplo 1.

Si P(C) = 0.60; P(D) =0.40 Yp(CnD) = 0.24 ¿son indpendientes los eventos C y D? ¿Por qué?

Soluci6n:
p(CnD) = P(C) . P(D) ... Definici6n de eventos independientes.
0.24:b 0.60 (0.40) Fónnula 24.3. Sustituyendo y operando 6.
=
0.24 0.24 Son eventos independientes ... Resp. Los productos son iguales
Ejemplo 2.

Si P(A) = 0.56; P(B) = 0.45 Yp(AnB) = 0.89 ¿Son independientes los eventos Ay B? ¿Por qué?
Soluci6n:
p(AnB) =P(A) . P(B) ... DeflIÚci6n de Eventos independientes
0.89 0.56 (0.45) ... Sustituyendo y operando
No son eventos independientes ... Resp. Los productos no son iguales
7.

8.

a) Ser indolente y justo

b) Deshonesto dado que sea indolente

c) Honesto e indolente dado que sea justo

2. Con referencia al ejercicio anterior, exprese con, palabras las probabilidades que expresan las siguientes
proposiciones: 9.
a) P(HI W') d) P(H') g) P(W'UH')
b) P(W'IE') e) p(H'nE) h) P(W'IE)
c) p[(WnE)IH] t) p(WnH) í) P[(HUW)UE]
3. Si D es el evento de haber suficientes médicos: H el de haber suficientes camas en un hospital, expresar
en palabras las siguientes probabilidades:

a) P(D') b) P(H') c) P(DUH) d) p(DnH) e) p(D'nH')


4. Comprobar si los eventos A y B son o no independientes, bajo las condiciones:

a) P(A) = 0.80; P(B) = 0.2; p(AnB) = 0.16;


b) P(A) = 0.17; P(B) = 0.36; p(AnB) = 0.29;
c) P(A) = 0.80; P(B) = 0.35; p(AnB) = 0.28;
d) P(A) = 0.24; P(B) = 0.36; p(AnB) = 0.36;

= =
5. En una prisión hay 400 convictos. Si H evento de ser criminal empedernido, L evento de condena
larga y el c.uadro siguiente resume la calidad del convicto, calcular las probabilidades a partir de las
e.ntradas y los totales de las filas y columnas,.·
-
·.m·lil'···,_·,.··'·'MM"",:. 1.
a) P(H)
b) P(L)
c) p(LnH)
d) p(H'nL)
e) P(LIH)
t) P(H'IL)
entes.
ando 6. En un banco de la localidad llevan estadísticas de clientes morosos y los tienen clasificados en el
siguiente cuadro donde L =evento de que debe menos de L. 100.00 YM =evento de ser moroso un mes
o más. Hallar las probabilidades a partir de las entradas y los totales de las filas y columnas:
a) P<L)
b)P(M)
Menos de L. 100.00 c).p(LnM)
L. 100.00 o más d)p(M'nL')
Ites e) P(L1M')
t) P(M'IL')
7. Utilizar los resultados del problema 5 para probar los incisos a) y b) dados abajo y con los resultados
del problema 6 comprobar los incisos x) y z) de abajo. ¿Cómo son entre si respectivamente?

a) p(LnH) P(LIH) • P(H) x) p(LnM') =P(LIM') • P(M')


b) p(H'nL) =P(H'IL). P(L) z) p(M'nL') = P(M'IL'). P(L')

,ólica 8. Cierto departamento de sanidad municipal, ha recibido 25 solicitudes de empleo para una plaza de
enfermera. De las aspirantes 10 tienen más de 30 años y 15 menos de este valor. Sólo 17 de las
aspirantes tiene grado de Licenciatura y 8 de maestría. De las que son menores de 30 años, 6 tienen el
grado de maestría. se hace una selección al azar, ¿cuál es la probabilidad de que: a) sea seleccionada
una aspirante de mas de 30 años o que tenga maestría?; b) sea seleccionada una aspirante menor de 30
años dado que tenga una licenciatura?; c) Sea seleccionada una menor de 30 años con licenciatura?
Haga el cuodro respectivo.
entes
9. Un diputado por el departamento de Yoro, sabe que pronto deberá votar acerca de un controvertido
proyecto de Ley. Para darse una idea de las inclinaciones de los ciudadanos acerca del proyecto, hizo
reuniones con algunos grupos en 3 ciudades y apuntó las opiniones de 15 de los asistentes a cada
reunión:

'resar

¿Cuáles la probabilidad de que:


a} Alguien del Progreso sea neutral con respecto al proyecto de ley?
b} Alguien de los 3 grupos apoye fuertemente la propuesta de ley?
Idena c} Una persona de Olanchito o de sea neutral o ligeramente opuesta al proyecto?
e las d} Una persona este ligeramente a favor del proyecto?

e} Se seleccione una persona de Progreso y que esté fuertemente a favor del proyecto de ley?

' ..
~
. . mm·¡'iir·i,M·.·ii·i"MU:FF
I

1O. El desglose por partido político de los 435 miembros del Congreso Nacional de una república "X" antes
y después de las últimas elecciones es:
(
e

p
d

Determinar la probabilidad: t
a) De que un miembro seleccionado al azar antes de las elecciones, sea republicano·
L
b) De que un miembro seleccionado al azar después de las elecciones, no sea republicano
Cl
c) De seleccionar un miembro que sea del partido independiente

d) De seleccionar un miembro que sea demócrata dado que se haga después de las elecciones
E:
m
11. Un transportista de productos tiene 10 000 cajas de bananos que vienen de Honduras y Costa Rica. Una
inspección a la carga ha arrojado la siguiente información:

de

Calcular las siguientes probabilidades: Es

a) De que una caja seleccionada al azar contenga fruta mala 1


b) De que una caja seleccionada al azar sea de Honduras o de Costa Rica
c) De que una caja seleccionada al azar contenga fruta muy madura dado que sea de Costa Rica
d) Si tener fruta mala y fruta muy madura son eventos mutuamente excluyentes, ¿cuál es la probabilidad 2
de que una 'caja contenga fruta mala o fruta muy madura? ¿Qué sucede si no son mutuamente
excluyentes?

Las distribuciones de frecuencias se preparan haciendo una lista de todos los resultados posibles de un
experimento y, después, indicando la frecuencia observada de cada resultado posible. Las distribuciones de
probabilidad están relacionadas con las distribuciones de frecuencias. De hecho, se puede pensar, en la
distribución de como una distribución de frecuencias teóricas. Lo anterior quiere decir que
una distribución de frecuencias teórica es una distribución de probabilidades que describe la forma en que
se espera que varíen los resultados. Debido a que estas distribuciones tratan sobre expectativas de que algo
suceda, resultan ser modelos útiles para hacer inferencias y tomar decisiones en condiciones de
incertidumbre.

Las distribuciones de probabilidad se en discretas y contínuas. Se permite que una distribución


de probabilidad discreta asuma únicamente un número limitado de valores; en tanto que una distribución
de probabilidad contínua, las variables puedan asumir cualquier valor dentro de determinados límites.

..
• •HoracioReyés
-

antes Variable aleatoria:


".·ti.·'I"'·"-·'.·"·'M.N" ~. .

Como se explic6 anterionnente, una variable aleatoria, es aquella variable que asume diferentes valores a
consecuencia de los resultados de un experimento aleatorio.

Esas variables pueden ser discretas o continúas, según adopte un número limitado de valores o que se le
permite asumir cualquier valor dentro de determinados límites. A la primera se le llama variable aleatoria
discreta y a la segunda variable aleatoria continua.

La distribución normal es una distribución continua de probabilidad. La variable aleatoria puede asumir
cualquier valor dentro de ciertos límites.

Esta distribuci6n, con frecuencia se le identifica como la piedra angular de la Estadística moderna y a
menudo se le dá el nombre de Distribuci6n de Gauss en honor al matemático y astr6nomo Karl Gauss.
. Una
La representación gráfica de esta distribuci6n es una curva en forma de campana que obedece a una
fónnula matemática especial y se utiliza para describir distribuciones de puntajes, para interpretar la
desviaci6n estándar, para infonnes de probabilidades, etc.

Existen dos razones básicas para las cuales la distribuci6n nonnal ocupa un lugar prominente en la
Estadística:

1. Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es
necesario hacer inferencias mediante la toma de muestras.

ilidad 2. Casi se ajusta a las distribuciones de frecuencias reales observados en muchos fenómenos, incluyendo
nente características humanas (pesos, alturas, coeficiente intelectual), resultados de procesos físicos
(dimensiones y rendimientos) y muchas otras medidas de interés para quienes trabajan en la docencia,
las ciencias de la salud y para los administradores tanto en el sector público como privado.

La curva de la figura de abajo es llamada curva normal ó campana de Gauss.

un Moda
les de
en la
ir que
n que
algo
de

ución -3
uci6n
1. La curva tiene un solo pico; por consiguiente es Tiene forma de campana
2. La media de la población distribuida normalmente, se encuentra en el centro de su curva normal. 1
(
3. Es simétrica con respecto a la recta que está en el centro y que representa la media, la mediana y la moda
de la distribución; todas ellas tienen el mismo valor.
E
4. Las "colas" o "extremos" de la curva de la distribución normal de probabilidad se extienden de manera
indefinida y nunca tocan al eje horizontal. (Imposible de demostrarlo gráficamente).
z
5. Para defInir este tipo de distribución, se necesitan conocer dos parámetros: La Media y la Desviación
(a) de la población. La distribuci6n normal que tiene a = 1 Y = O, se llama unitaria.

No importa cuales sean los valores para y a para una distribución de probabilidad normal, el área bajo la
curva es 1.00 de manera que se puede pensar en áreas bajo la curva como si fueran probabilidades.

Matemáticamente es verdad que:


* Aproximadamente el 68% de todos los valores de una población normalmente distribuida se encuentra
dentro de ±1 desviaciones estándar de la media; el 95.5% de todos los valores se encuentran dentro de
desviaciones estándar de la media y aproximadamente el 99.7% de todos los valores de la población E
normalmente distribuida se encuentran dentro de ±3 desviaciones estándar de la media. Cl

Estas tres afIrmaciones se muestran de manera gráfica en la figura de abajo.

pr
pr
la

Er
va
2.25%

do

Ex
Relación entre el área
bajo la curva de
distribución normal de
probabilidad y la
distancia a la media
medida en desviaciones
estándar.

B• ••H'"o-ra-c"--¡
• 1
ii
Estas figuras muestran tres formas diferentes de medir el área bajo la curva normal. Sin embargo. muy
pocas de las aplicaciones que se hacen de la distribución normal de probabilidad implican intervalos de i;
exactamente ±1, y desviaciones estándar a partir de la media. Para los otros casos por fortuna se
pueden utilizar las tablas estadísticas las que indican porciones del área bajo la curva normal que están "

Gontenidas dentro de cualquier número de desviaciones estándar (mas menos) a partir de la media.
lOda
En la tabla N° 1 del final del libro se muestra el área bajo la curva normal entre la media y cualquier valor
nera de la variable aleatoria normalmente distribuida. La clave para trabajar con esta distribución. es el valor de
z que es considerado como una variable aleatoria 7 'lda o normalizada ya que sus unidades de
ción medida son desviaciones estándares.

El valor de z se calcula con la siguiente fórmula:

jo la
r (244)
donde: x = valor de la variable aleatoria a estudiar
= media de la distribución de la variable aleatoria
=desviación estándar de la distribución
z = número de desviaciones estándar que hay desde
x hasta la media de la distribución
o de
ción En general. se puede afirmar que z es un cambio en la escala de medición del eje horizontal de la
curva normal.

de z de de

La Tabla N°l del fmal del libro que corresponda a valores del bajo la curva normal. enlista las
probabilidades asociadas a los intervalos centrados en la media para valores específicos de z. Otras
probabilidades pueden encontrarse por adición ó sustracción en base al concepto de simetría que existe
la distribución normal y el hecho de que el área total bajo la curva es 1. (0.5 a la derecha e izquierda
media).

En la Tabla No. 1 de las áreas bajo la curva normal de O a z (al final del libro) puede observarse que los
valores de z están en la primera columna encabezada con "Z" al margen izquierdo, y contiene las unidades y
décimas de z desde 0.0 hasta 3.4; en la parte superior y en la primera fila. se encuentran las centésimas de z
donde 0.00 hasta 0.09, marcadas unicamente con O, 1.2,3•...• 9.

Ejemplo 1.

Calcular el valor del área bajo la curva normal entre O y z = 1.52

Explicación:
área Se busca 1.5 en la columna "Z " y el 2 en la primera fila superior.
de El valor del área se encuentra dentro de la tabla. en la intersección de la horizontal trazada por 1.5 y
1 de vertical trazada desde 2.
En esa intersección está el valor 0.4357 que corresponde al área buscada (ver el cuadro de la página
la
siguiente)
edia Esa área es también la medida de la probabilidad asociada al mismo intervalo, es decir:
ones
P(O < Z < 1.52) =0.4357
~
. . ) •

Ejemplo 2. S(

Calcular el valor del área bajo la curva entre z =-2.05 YO

Explicación:
* El signo negativo "-" indica que este valor de z, está a la izquierda de z =O ó que está abajo de la
media.
* Se busca 2.0 en la columna "z" y el 5 en la primera ftla superior.
* El valor del área se encuentra en la intersección de la ftla 2.0 con la columna 5. 2.
* En esa intersección está el valor 0.4798 que corresponde al área buscada. (Ver cuadro de abajo)
* Escrita como probabilidad asociada al intervalo, se tiene: P(-.2,05 < z < O) 0.4798

El cuadro de abajo, muestra un esquema de parte de la Tabla N° l Y de su uso.

Sol

__ l. Por simetría, la media divide a la cutVa en dos partes congruentes y bajo de


cada una de esas partes hay 0.5 del área, una parte a la derecha y la otra a la
izquierda.
2. Un signo negativo para z, significa que z esta a la izquierda de la media.
3. Por la misma simetría, no es necesario usar valores negativos para z en la

4. El área bajo la curva es también la medida de la probabilidad asociada al


mismo intervalo.
5. La adición y sustracción de áreas bajo la curva normal, son válidas porque
las "áreas" son eventos mutuamente excluyentes.
6. Para facilitar la escritura de las áreas, se tomará siguiente conl'ención:
A( a, b) El área entre a y b
A(z > a) significa: El área a la derecha de a 6 A(a,+
A(z < a) significa: El área a la izquierda de a 6 A(- a)

Los siguientes ejemplos muestran algunos cálculos de las áreas bajo la curva normal y la probabilidad
asociada al mismo intervalo.
Ejemplos:

Calcular el área (A) bajo la curva


normal y la probabilidad (P)
asociada al intervalo respectivo.
Solu
1. A la derecha de z =1.52
_oo
j
z
J

e• •.H"=-o-r-a-c-·..--fO-·--R--.,--y-e-::-·s-·--N..-u
T

."Mdb.·em·l'dl .',;.•. ~. .
Solución:
A(1.52. = A(O. -A(O, 1.52)
... Planteando el problema como una
= 0.5 - 0.4357
diferencia de áreas
= 0.0643
... A(O. 1.52) = 0.4357 obtenido de la Tabla N°1
A(z> 1.52) = 0.0643 Como área
... Resp.
ajo de la P(z > 1.52) = 0.0643 Como ... Resp.

2. A la izquierda de z = 1.52
o)

+ 00
z=O z= 1.52 z

Solución:

A(-oo, 1.52) = A(-oo, O) + A(O. 1.52) ... Planteando el problema como una suma de
bajo de áreas
otra a la = 0.5000 + 0.4357 ... A(0.1.52) = 0.4357 obtenido de la Tabla 1
=0.9357 ... Operando
lia. =
A(z < 1.52) 0.9357 Como ... Resp.
. z en la P(z < 1.52) = 0.9357 Como probabilidad ... Resp.

ciada al
3. Entre O y z =-2.1
: porque

:ión:
Area por la que se Area en la tabla:
ha preguntado 0.4821

abilidad

_00 _ _ +00

z =-2.1 O Z =2.1 z
: 0.4357

que se
Solución:

A(-2.1, O) = A(O. 2.1) ... Por simetría (ver la gráfica de arriba)


= 0.4821 ... Obtenido de la Tabla N°l
A(-2.1 < z< O) =0.4821 ... Resp.
z P(-2.1 < z < O) = 0.4821 Como ... Resp.
•.

. .~.,,".m m".i'iiC·i,M.i•.

4. A la izquierda de = -1.35

L
""
O z= 1.35 z
Solución: el
-1.35) = A(-oo,O) - A(-1.35, O) ... Planteando el problema como una
diferencia de áreas
= 0.5 - A(O, 1.35) ... Por simetría. Explique
= 0.5 - 0.4115 e
=0.0885 el
A(z < -1.35) = 0.0885 Como área ... Resp.
P(z < -1.35) = 0.0885 Como probabilidad ... Resp.

5. Entre z = -1.5 Y z = 2.1

d)
z = -1.5 O
__ +""

z= 2.1 z
Solución:
A(-1.5, 2.1) = A(-1.5, O) +A(O, 2.1) ... Planteando el problema como una suma de
áreas
_c
= A(O, 1.5) + A(O, 2.1) ... Por simetría. Explique
= 0.4332 + 0.4821 oo. Valores obtenidos de la Tabla N° 1
A(-1.5, 2.1) = 0.9153 Como área oo. Resp.
P(-1.5 < z < 2.1) = 0.9153 Como probabilidad oo. Resp. g)

6. Entrez=0.7 y z = 2.1

+""
O z=0.7 z=2.1 z

0.4821

(Medida del área sombreada total)

. ,- -'S " -'


• Solución:
M" .•.ii.i•. . .

A(0.7, 2.1) =A(O, 2.1) -A(O, 0.7) ... Planteando el problema como una diferencia
de áreas
=0.4821 - 0.2580 ... ¿Qué se hizo?
A(0.7, 2.1) =0.2241 Como área Resp.
P(0.7 < z < 2.1) =0.2241 Como probabilidad Resp.

La Tabla N° 1 de la distribución normal puede utilizarse también para determinar el valor de z si se conoce
el área bajo la curva. Es importante aclarar que para no interpolar, se aceptará el valor de la tabla que esté
más próximo al valor del área dada. El valor del área dada se busca en el cuerpo de la tabla y se identificará
el valor de z en la fila y columna correspondiente. en ese orden.
una
lnvestigacion

Calcular el valor aproximado de z, para cada uno de los siguientes casos, en los cuales se dá el área bajo la
curva normal respectiva.

a) b) c)
0.1844

_00 O +00 _00 O +00 _00 O +00

d)

la de
+00

h) i)
0.025 0.01

_ 00
O O
~
. . •.ii,m."';i.i" .•.
-

4-.5
Las p
..:.;.:.:. :.::::::. .. ....- ..
infore
Determinar el área bajo a los siguientes valores de z. desvió
1. Entre O y 1.5 3. Entre -2.15 y O estan<
2. A la derecha de 1.59 4. A la izquierda de 3.21
Calcular el valor del área bajo la curva normal situada entre los pares de valores de z:
5. z = -1.23 Y z = 1.35 7. z =-1.30 y z = 2.85
EjemI
6. z = -1.67 Yz = 1.86 8. z = -2.5 Y z = -0.39
Determinar las siguientes áreas bajo la curva normal: Le
no
9. A la derecha de z = 0.01 13. A la izquierda de z = -2.57 az;
10. A la derecha de z = 1.87 14. A la derecha de z = -1.74 b)
11. A la derecha de z = 2.30 15. A la izquierda de z = 1.89 es
12. A la izquierda de z = 1.60
Soluci
Obtener el valor de:
16. P(0.03 < z < 2.35) 19. P(z> 1.47) a:
17. P(-2.15 < z < 2.34) 20. P(-3.16 < z < -1.88)
18. P(z < 1.38) 21. P(-2.22 <'Z < -1.11) a) * p(
Hallar la probabilidad de que un dato seleccionado aleatoriamente de una población normal que tenga un
valor z que caiga:

22. z = O a z = 2.10 25. Menor de 3.000


23. z = O a z = 2.57 26. Mayor que -1.75
24. z = O a z = -1.57 27. Menor que 0.99

*(
Hallar los valores de z para cada distribución normal estándar:
28. 30. e

00 o z

=- =-_ _ =- _
0.4590

*p

*L
L-_oo - o z + 00
oo
_------....:----=-....:.-

• •Horado

mM."".·mm.lili'."_.'•. ~. ..
de

Las probabilidades asociadas a cualquier distribución pueden encontrarse aplicando las técnica discutidas y
analizadas en la sección anterior. Sin embargo, primero deben "estandarizarse" o "normalizarse" la
información dada. Cuando se trabaja con una distribución normal, es necesario conocer su media y su
desviación estándar a. Una vez que se conocen estos valores, cualquier valor de la variable aleatoria
puede ser convertida facilmente en el valor z estándar utilizando la fórmula de normalización o
estandarización ya conocida:

Ejemplo 1.

Los coeficientes intelectuales CI de los alumnos de una escuela primaria están distribuidos
normalmente con una media = 100 Y una desviación estándar a = 10: Si una persona es elegida al
azar, a) ¿Cuál es la probabilidad de que su CI esté entre 100 y 115; es decir, cual es P(IOO < <115)?
b) ¿Cuál es la probabilidad de que una persona seleccionada aleatoriamente tenga un CI mayor que 95;
es decir, P(x. > 95)?
Solución:
= 100 ... Datos del problema
0= 10
a) * P(IOO < x < 115) está presentado por el área sombreada de la figura de abajo
un

_00 100 115 x +

* Cuando x = 100 entonces z =100 100 0.00 ... Normalizando los valores de la variable,
usando la fórmula (24.4), para z.

Cuando x = 115 entonces z =115 100 1.50

00

_
100 115 x
O 1.5 z

* P(lOO < x < 115) =P(O.OO < z < 1.50) =0.4332 ... Escribiéndolo como probabilidad y
empleando la Tabla N° 1
-
* La que la persona selecciontula ... Resp.
00
tenga un el entre 100 y 115, es 0.4332
~ .. •. mm.¡'iii.i,M.i••
. I

b) * P(x > 95) está representada por el área de la figura que se presenta abajo

_00 95 100 X+ OO
-0.5 Z

* Si x =95 entonces z =95 10100 ... Normalizando o estandarizado 95 con la

fórmula respectiva.

* P(x > 95) = P(z > ... ¿Qué se hizo? ¿Por qué?

=0.1915 + 0.5000

=0.6915

* La probabilidad de seuccionar a una persona ... Resp.

que tenga un el mayor que 95 es 0.6915

Ejemplo 2.

Se tiene un programa. de entrenamiento diseñado para mejorar la calidad de las habilidades de

supervisión en la ünea de producción. Como este programa es autoadministrativo, los supervisores

requieren un número diferente de horas para terminarlo.

Un estudio de los participantes anteriores indica que el tiempo medio para completar el programa es de

50 horas, y que esta variable aleatoria normalmente distribuida tiene una desviación estándar de 10

horas.

¿Cuál es la probabilidad de que un candidato seleccionado al azar:

a) Se tome más de 70 horas en completar el programa?

b) Requiera entre 55 y 65 horas en completar el programa?

c) Se tomen menos de 58 horaS en completar el programa


c)
d) Se requiera entre 40 y 48 horas para completar el programa

Solución:

= 50 horas; a = 10 horas ... Datos del problema

a) * P(x > 70) = 7


Si x = 70 entonces z = 70 50 =2 ... Normalizando x = 70 Y escribiendo la

probabilidad pedida en términos de z

P(z >2) = 7

... Planteando el problema como una

diferencia de áreas auxiliado de la gráfica y


calculando los valores en la tabla N° 1


• • H'--o-,-a-c--'¡-o-'R=-e-y-e-s---=-N"-lI--·
• em·i"'t·',M.•. ..
A(2,'+ = A(O, +(0)
=0.5000 - 0.4772
A(2, + = 0.0228 Como área ... Planteado como área; en ténninos de z y
P(z > 2) = 0.0228 como probabilidad
P(x > 70) = 0.0228 Probabilidadpedida ... Resp.

b) * P(55 < x < 65)


n la
55 -50 5
Si x = 55 entonces z 10 = 10 = 0.50 ... Normalizando los valores de la variable
x =55, x =65 Y escribiendo la probabilidad
Si x = 65 entonces z = 65 10
- 50 = 15 = 1.50 pedida en ténninos de z.

P(0.50 < z < 1.50) =?


... Planteando el problema como diferencia de
áreas auxiliándose de la gráfica y
calculando los valores con la Tabla N° 1.

l de
ores _00
o 0.5 1.50 + 00

s de A(0.50, 1.50) = A(O, 1.50) - A(O, 0.50)


= 0.4332 - 0.1915
=0.2417 Como área
P(0.50 < z < 1.5Ú) = 0.2417
P(55 < x < 65) = 0.2417 Probabilidad pedida oo' Resp.

c) * P(x < 58) =?


S1· X =58 entonces z = 58 10
- 50 8 -- O.80 oo. ¿Qué se hizo? Explique todo el
procedimiento paso a paso
P(z < 0.80) = ?
oo. ¿Qué se hizo?

o la

una = O) + A(O, 0.80) oo. Explique lo que se hizo


,ca y = 0,5000 + 0.2881
A(-oo, 0.80) = 0.7881 Como área
P(z < 0.80) = 0.7881
P(x < 58) = 0.7881 Probabilidad pedida oo. Resp.
#

. . •.i •.

d) * P(4O < x < 48) =?
Si x = 40 entonces z = 40-50 =-1 ... ¿Qué se hizo?
10
Si x = 48 entonces z = 48 50 = -0.20
P(-l <z<-0.20)=? ... ¿Qué se hizo?

_00 -1 -0.2 o +00

A(-I, -0.20) = A(-I, O) -A(-O.20,O) ... ¿Qué se hizo?


= 0.3413 - 0.0793
-0.20) = 0.2620 Como área
P(-I < z < -0.20) = 0.2620
P(40 < x < 48) = 0.2620 Probabilidad pedida ... Resp. 27.

28.

l. Plantear y calcular el área bajo la curva normal, para cada caso:


a) , - - - - - - - - - - - -----

29.:
-
2. Plantear y calcular el valor de z para cada caso:
b)
I 30.1
1

00 z o 1.85

3. Resolver el problema 30 de la guía de estudio N° 22


31.1

(
(

32.
1. P( x > 60) x < 83) 5. P(38 < x < 58) (

(
2. P(60 < x < 72) 4. P(65 < x < 82) 6. P(x < 40) 1
Si h es una variable aleatoria distribuida normalmente con = 26.7 Y = 3.4, hallar la probabilidad de
que un valor individual h seleccionado al azar: 33. [

7. Esté entre 26.7 y 31.7 9. Esté entre 20.4 y 24.0 P


8. Esté entre 28.8 y 30.0 10. Esté entre 20.0 y 30.0 q
• ·II.Ii!Ij!M.Wm"IdC·¡·M.i•. . .')
Las lecturas de colesterol de un grupo de personas, están distribuidos nonnalmente con = 210 = 15.
¿Qué porcentaje de la población tiene lecturas:
11. Mayores que 250? 13. Entre 215 y 230? 15. Entre 170 y 190?
12. Menores que 225? 14. Mayores que 2oo? 16. Menores que 208?
La vida útil de un tipo de lámpara está distribuida normalmente con, =600 horas y = 40
horas. Si se compra una de ellas determinar la probabilidad de que su vida útil esté:
17. Entre 620 y 680 horas 19. Dure más de 660 horas
18. Entre 580 y 590 horas 20. Dure menos de 630 horas
- El período de espera x en un cierto banco para cobrar un cheque, está distribuida normalmente, con un
=3.7 min.-y = lA mino Calcular la probabilidad de que un cliente espere:
21. 2.0 min. 23. Entre 2.5 y 504 mino 25. Menos de 3 mino
22. Más de 6 min. 24. Más de 4 mino 26. Entre 2.5 y 3.5 mino
27. Las comisiones anuales por agente de ventas de una empresa fabricante de maquinaria ligera, tuvo un
promedio de L. 40 000, con una desviación estándar de L. 5 000. ¿Qué porcentaje de los vendedores
ganan entre L. 32 000 YL. 42 000?

28. Un vendedor maneja de una ciudad a otra y descubre que el tiempo que tarda en el recorrido es una
variable aleatoria que tiene más o menos una distribución normal con = 4.3 horas = 0.2 horas.
Detenninar la probabilidad de que un viaje dure:

a) Más de 4.5 horas b) Menos de 4.0 horas c) Entre 4.1 y 404 horas

29. La experiencia con respecto al número de pasajeros en el buque Queen Elizabetb II reveló que el número
medio de pasajeros es de 1 820 Y la desviación estándar de la distribución normal es 120. a) ¿Qué
porcentaje de las travesías tendrán entre 1 820 Y 1 970 pasajeros?; b) ¿qué porcentaje de los recorridos
tendrán 1970 pasajeros o más?; c) ¿qué porcentaje de las travesías tendrán 1 600 pasajeros o menos?

30. Un fabricante de garajes para anexar a las casas descubrió que los tiempos que necesitan dos
trabajadores para construir un modelo, se distribuye normalmente con una media de 32 horas y una
desviación estándar de 2 horas. a) ¿Qué porcentaje de garajes necesitan entre 30 h Y 34 h para ser
construidos?; b) ¿qué porcentaje de los gJIajes necesitan 28.7 h o menos para su construcción?; c) ¿qué
porcentaje necesitan entre 29 h Y 34 h'!; d) ¿qué porcentaje de garajes requieren 35 h o más para ser
construidos? ­

31. Una industria produce cojinetes de bolas en forma automática. Para uno de los cojinetes, la media
aritmética de los diámetros dIstribuye normalmente con media de 20 mm y desviación estándar de
0.15 mm. ¿Qué porcentaje de los cojinetes a) tendrán diámetros, entre 20nun y 20.27mm?; b) tendrán
diámetros de 20.27mm o más?; c) tendrán diámetros entre 19.85 mm y 20.30 -1?; d) tendrán diámetros
de 19.91 mm o menos?

32. Se determinó hi resistencia a la tensión de un gran número de alan.ores y después se organizó una
distribución de frecuencias. La distribución es aproximadamente normal con media de 300 lbs y
desviación estándar de 20 lbs. ¿Qué porcentaje de los alambres probados a) quedaron entre 296 y 310
lbs?; b) por encima de 332 lbs; c) quedaron por debajo de 298 lbs?
d de
33. La puntuación media en una prueba de ingreso a una universidad es 500 y la desviación estándar 75. Las
puntuaciones se distribuyen normalmente; a) ¿qué porcentaje de los estudiantes tuvieron puntuaciones
por debajo de los 320 puntos?; b) ¿qué porcentajes tuvieron puntuaciones entre 400 y 510 puntos?; c)
qué porcentaje tuvieron puntuaciones mayores que 640 puntos?;

.'. ----. --.-.. -----.--.. . .__ _. . .~-~ - --.--


Horado Reyes Núñez• •
La Reserva de la Biósfera del Río Plátano.

concepto de Reserva de Biósfera


nació en eL año junto aL
programa Hombre y Biósfera,bajo eL
patrocinio de La UNESCO. Hasta hoy
. se estabLecieron más de 300 de éstas
reservas en todo eL mundo, siendo La
Reserva deL Río La primera
biósfera reconocida por La UNESCO .
. en Centroamérica R

.
Universidad de Greifswald, Alemania

"Patrimonio Natural de la Humanidad" fue el título que le confirió la UNESCO en 1982 a la


Reserva del Hombre y a la Biófera del Río Plátano. Con una extensión de 8,300 kms
cuadrados, que representan el 7% del territorio nacional, es el área protegida más grande
de Honduras, sin duda, una de 'as más fascinantes.

reserva está ubicada al noroeste de Honduras en el corazón de la Mosquitia


hondureña. Incluye la cuenca del Río Plátano y una gran parte de las cuencas de los ríos
Wampu, Paulaya y Sicre; alberga áreas marinas costeras importantes y una variedad de
hábitats ricos que incluyen extensos manglares, humedales, lagunas, arrecifes de coral y
cayos. Sin embargo la mayor parte del Río Plátano está cubierto por bosque lluvioso, hogar
de la mayor biodiversidad de la reserva.

Aquí conviven cuatro grupos étnicos hondureños: Garífunas, Pech, Miskitos y Tawahkas.
Con ellos Jaguares, Dantos y Jagliías, recorren los bosques húmedos, manglares y plani­
cies costeras, mientras el águila harpía señorea los nítidos cielos azules.

'Desafortunadamente, la extracción desmedida de madera, la, cacería furtiva, el saqueo de


objetos arqueológicos, narcotráfico y la invasión de campesinos provenientes de Valle, '
Choluteca, Olancho y Francisco Morazán, principalmente, han provocado una enorme
presión en los recursos naturales de la biósfera ycambios radicales en sus culturas nativas.
Al punto tal, que desde 1997 esta área protegida encuentra inscrita en la Lista de Sitios
de Patrimonio Mundial en Peligro.
'Crónicasde Hibueras' Edición 10, Diario "El Heraldo', Tegucigalpa M.o,C, 15 - 09 -06
o.
. .:"I""'·II.I•.'."II""U.4.'••.II..,.',I"II'''.

5.1
Una de las aplicaciones más importantes de la Estadística es hacer inferencias acerca de grupos muy
grandes, basándose en la infonuación obtenida en pequeños grupos. En otras palabras, se trata de conocer la
población entera a partir de datos de una o más muestras de esa población; la medida en que estas
inferencias sean exactas, dependerá de lo adecuado de las muestras.
.0
Tipo de muestras: ju
pe
Las muestras se clasifican en aleatorias y no aleatorias. Las muestras aleatorias son aquellas donde los
elementos por seleccionar se tornan de acuerdo con las leyes probabilísticas. Cada elemento en una Ej
población tiene la misma probabilidad de ser seleccionado corno parte de la muestra. Las muestras no
aleatorias, son aquellas que se seleccionan a partir de su consideración corno "típicas".

A menudo no es posible estudiar la población completa. Alguna de las razones principales son: La
qu
1. La naturaleza destructiva de ciertas pruebas
2. La imposibilidad revisar todos los integrantes de la población
3. El costo de estudiar todos los elementos de la población, a menudo es prohibitivo
4. Lo adecuado de los resultados de la muestra
5. En ocasiones se necesitaría mucho tiempo para entrevistar a toda la población Es

fOI

Existen dos técnicas para seleccionar las muestras de una población: el muestreo no aleatorio y el muestreo
aleatorio:

no Co
dal
Es el método que recoge las muestras de manera que no todos los elementos de la población tienen la
misma posibilidad de ser seleccionados. Este muestreo puede ser por accidente, por cuota e intencional o da1
de juicio. tab

El muestreo por accidente: cal

Consiste en estudiar los datos que a criterio del investigador conviene analizar. La
pUl
Ejemplo: pre
En la U.P.N. se realiza un trabajo de investigación sobre el transporte colectivo universitario, para Se
ello se elabora una encuesta y se le aplica a un grupo de estudiantes seleccionados por el investigador
libJ
con elprop6sito de establecer una conclusión del problema en estudio.

El muestreo por cuota:

Consiste en· fonuar las muestras considerando las diversas características de la población de acuerdo al
porcentaje que ocupan dentro de ella; estas características pueden ser, edad, sexo, religión, etc. La selección
se hace siguiendo un criterio no aleatorio.

Ejemplo:

Se hace un trabajo estadístico en una población estudiantil en la que el 54% son mujeres y 46% son
varones. Corno la muestra debe ser estimada mediante este método, significa que la muestra debe
constar de un 54% de y un 46% de varones. Si la ll1uestra consta de 300 estudiantes, entonces
deben haber 162 mujeres y 138 varones obtenidos así:

.. _.-._ .. --_ ... .. ... __ .,


- 54 162 mujeres
jij"ij,i1·'··'M,,'i'i"a¡···mm.'i'iC.i.',,'i'iJM.. .:

46 =138 varones
1)
muy (162 mujeres) + (138 hombres) =300 estudiantes
cer la
estas EI'!'uestreo intenciontJl o de juicio:

Consiste en tomar los datos para fonnar la muestra de acuerdo a experiencias. al sentido común o al
juicio del investigador es decir. solo tomará aquellos datos que considere son representativos en la
población.
le los
Luna Ejemplo:
IS no
¿Qué revistas ejercen una marcada influencia en el comportamiento de mujer latinoamericana? Para
un investigador serían: Cosmopolitan. Vanidades, Buenhogar. Otro investigador podría tener criterios
adversos o parciales.

La ventaja principal del empleo de muestras no aleatorias, es que son más económicas y rápidas; mientras
que las aleatorias pueden ser caras y laboriosas.

Es aquel que le permite a cada elemento de una población la misma probabilidad de ser seleccionado para
fonnar parte de la muestra. Este muestreo puede ser: simple, sistemático, estratificado y por congwmerado.

Muestreo aleatorio simple,

Consiste en enumerar cada dato de una población para después escoger aleatoriamente cada uno de los
datos que fonnarán la muestra. El procedimiento a seguir cuando la población es pequeña, es depositar en
la una urna cada uno de los números que representan los datos y luego ir sacando al azar de uno en uno los
Jalo datos de muestra. Para evitar tener que usar una gran urna cuando la población es grande, se han creado
tabla de dígitos aleatorios, que son números que se han seleccionado al azar y escritos en el orden que
hayan salido. Estos mlmeros pueden generarse con una computadora programada para tal efecto, o con las
calculadoras científicas que tienen la función RND.

La manera de usar una tabla de dígitos aleatorios es escoger en fonna aleatoria, un punto de partida que
puede ser en la intersección de una fila y una columna o emplear otra metodología sistemática, clara y
precisa definida al comienzo del proceso.
para Se presenta a continuación, una parte de esta tabla de dígitos aleatorios. (Ver la Tabla N°2 del final del
ador libro).

Parle Dfgitos aleatorios

[o al 8374856049 4637567488
ción 7055508767 6472382934
0684012006 0933147914 .
1291265130 4890031305
5973470495 9776035501
2229367983
son 5432114610 2966095680
iebe
nces 4011966963.
0385998136 9999089966 7544056852

- -
Horado •• ,
_. ~_. ._, • _ ••• .~_. ._._ •• __ 4 ._._. ~ ••• _ _ • _ _ • ._. •• _ " _ .
. . .•.•,,"dlili.•.mm.".li,,¡¡QiM I

Esta porción de tabla tiene una cierta cantidad de dígitos ·aleatorios escritos en conjuntos de 10 dígitos. La

probabilidad de que un dígito cualesquiera de O a 9 aparezca, es la misma que la que tienen los restantes, y

la probabilidad de que ocurra una secuencia de dígitos es idéntica a la de cualquier otra secuencia.

Para aprender a usar la Tabla N°2 de dígitos aleatoriós, se analizará el siguiente ejemplo:
F
Se desea formar una muestra aleatoria de tamaño 10 de una población de cien elementos. Usando la
Tabla de dígitos aleatoria, ¿qué elementos formarán esta muestra? P
a
Solución:
E
Paso 1. Asignar numeración correlativa a cada elemento, teniendo el cuidado de que todos los
elementos tengan mismo número de cifras o dígitos que el del último elemento de la
población (2 cifras en este caso). E
Paso 2. El número correspondiente al primer elemento debe ser 00, el del segundo 01, el del tercero
02, el del cuarto 03 y así sucesivamente hasta el último que debe ser 99.
Paso 3. Seleccionar un método sistemático, ejemplo pasar de la parte superior a la inferior de .las
columnas comenzando con la primera columna de la izquierda y leer solamente los dos
primeros dígitos de cada renglón. Notar que el primer número, usando este método será el
15, el segundo 09, el tercero 41, el siguiente 74, el siguiente 00 y así sucesivamente hasta
. llegar al décimo número que será 35.
Paso 4. Si al llegar a la parte inferior de la columna, todavía no se tienen los 10 elementos
deseados de la muestra, entonces se puede volver al inicio, es decir, a la parte superior de la Se
primera columna de la izquierda de la tabla y luego comenzar a leer los dígitos tercero y 01
cuarto de cada grupo de dígitos; estos empezarán con 81,28, 12,57, etc. (Véase la tabla). H
Paso 5. Los 10 elementos de la población que tengan asignados los números obtenidos en los pasos

3 y 4, corresponderán a los 10 elementos de la muestra deseada.

La metodología a seguir con la tabla de dígitos aleatorios para obtener los


elementos de la muestra, debe definirse en forma clara, concisa, exacta y
respetarla desde el principio en un 100%. Esta metodología puede ser la que ffi·
Ud. desee.
an

Muestreo sistemático: M

En este los elementos son seleccionados de la población dentro de un intervalo uniforme que se Es
mide con respecto al tiempo, al orden o al espacio. es·
Consiste en dividir la población entre el tamaño de la muestra, para así formar tantos grupos como datos co
tendrá la muestra. Para obtener el primer eletnento que formará párte de la muestra, se toma al azar un el
elemento del primer grupo; para escoger, el segundo dato de la muestra se le suma al primero el tamaño de
cada grupo y así sucesivamente hasta completar todala muestra.

Ejemplo:

Si se desea formar una muestra de tamaño 10 de una población de 800 datos. PJ;imero se divide 800

entre 10, dando 80, que corresponde al tamaño de cada grupo. Luego, se selecciona al azar un número

entre 1 y 80, por ejemplo, el 53 que será el primer elemento que formará la muestra. Para seleccionar el

segundo elemento solamente se le suma 80 a 53, dando 133; después al 133 se le 80 y así

sucesivamente, hasta completar la muestra deseada. La muestra quedará formada por los siguientes

datos: 80, 133,213,293,373,453,533,613,693 y 773.

• i¡j,,".• '.i.'N,."u,'g.•.mW.I!.I·,.,,"uj. ~. .'


;. La El muestreo sistemático difiere del aleatorio simple, en que cada elemento tiene la misma probabilidad de
y ser seleccionado, pero cada muestra no tiene esa probabilidad. ¿Por qué?

Muestreo estratificado:

Para utilizar este muestreo, se divide la población en grupos relativamente homogéneos llamados estratos.
o la Este muestreo es similar al muestreo por cuotas, excepto en que después de haber determinado los
porcentajes de cada grupo o estrato, los elementos se extraen de cada estrato mediante un muestreo
aleatorio.

El muestreo estratificado es una combinación del muestreo por cuota y el aleatorio simple. Este muestreo es

los
adecuado cuando la población ya está dividida grupos o estratos de diferentes tamaños.
e la
Ejemplo:

Se hace una encuesta sobre la asistencia dominical a las iglesias de una población. En esa población hay
1200 habitantes y 4 tipos de religiones: Católica, Evangélica, Testigos, y Mormones. Para hacer un

dos
trabajo representativo es necesario estudiar cada religión por separado y formar 4 estratos:
á el Estrato 1. Católicos
asta Estrato 2. Evar:gélicos
Estrato 3. Testigos
ltos Estrato 4 Mormones
e la Se sabe que el 40% son católicos, 30% evangélicos, 20% son testigos y el 10% son mormones. Se desea
obtener una muestra de tamaño 1200 aplicando el muestreo estratificado.
Haciendo los cálculos necesarios, la muestra estará formada así:
LSOS
Católicos: 40% 1200 x 0.40 = 480
Evangélícos: 30% 1200 x 0.30 =360
Testigos: 20% 1200 x 0.20 = 240
los Mormones: 10% 1200 x 0.10 = 120
ay Una vez que se ha establecido la cantidad de elementos de cada estrato, se toma la lista de católicos y por
medio del muestreo aleatorio simple, se obtienen los elementos católicos (480) que integrarán la muestra.
Se hace lo mismo con los demás estratos hasta obtener los 1200 elementos que formarán la muestra a
analizar.

Muestreo por conglomerado:

: se Es el más adecuado para realizar censos y consiste en dividir geográficamente una población para después
escoger al azar los grupos que formarán parte de la muestra. Esos grupos se llaman cúmulos o
Itas conglomerados. En un censo, las principales limitaciones son el presupuesto, el tiempo, y en algunos casos

un
el personal y, para evitar muchos problemas, se hace lo siguiente:

de

1. Se establece la población que se va analizar. Se divide en departamentos, municipios, ciudades,


áreas, empadronamientos, etc. A cada división se le llama cúmulo.
2. Una vez que se tienen los cúmulos, a cada cúmulo escogido, se le aplica el método de muestreo
aleatorio que estime más conveniente.

ero Ejemplo:
r el
así . Se va a establecer un censo en una ciudad X del país. La disponibilidad que presenta es limitada, la
tes oficina encargada de recoger la muestra, tiene a su cargo 8 encuestadores y decide realizar un muestreo
por cúmulos. Se provee de un mapa de la ciudad, se divide en áreas, se escogen 8 de ellas así:

Horacio Reyes Núñez


. .:"J"ijiJi.¡•.'."ii'iiiij.•.••.I'U'....
8.
1.
.,

Cada cuadro representa un cúmulo y los sombreados son los 8 cúmulos que serán encuestados para

realizar el trabajo, aplicando un tipo de muestreo aleatorio para obtener las respectivas muestras y

efectuar la integración total, para obtener la muestra representativa de la población en estudio.

5.

P~tü'llit1Ñ~'2g
La
val

......
1. Una reportera desea 6285 personas. Estas personas se numeran 0001.
0002•...• 6284. 6285. ¿A quienes seleccioD'anttjjiM la entrevista, si se obtiene la muestra con la Tabla La
N°2. de dígitos aleatorios empleando las primeras 4 columnas de la tabla, recorriendo la tabla hacia la
abajo y comenzando en el renglón 10 inclusive de la 1& columna? Utilizar los dígitos de las posiciones:
3&. 5& Y 7&. La
apr
2. Un sociólogo desea incluir en una muestra. 10 de 83 personas. Si las numera con OO. 01. 02•... 82. ¿qué apr
personas incluirá en la muestra si mediante la tabla de dígitos aleatorios. selecciona el uso de las 2
primeras cifras de la izquierda comenzando con 22 en el 6° renglón de la 2a columna y hacia abajo? N.,

3. Se tiene una población de 10,000 y se desea muestrear 20 aleatoriamente. Usar la Tabla N° 2 de dígitos COI

aleatorios para seleccionarlos. Enumerar los elementos de la muestra que se han seleccionado. Describa car;
su propia metodologia y explíquela.

4. Con un calendario muestrear sistemáticamente cada día décimo octavo de un año. comenzando con el 6

de enero.

5. Una población está constituida por grupos que tienen una gran variación entre sí pero poca variación

entre uno y otro. El tipo adecuado de muestreo en esta población es:

a) Estratificado b) Sistemático c) Por conglomerado d) De juicio


Si s
6. Un bacteriólogo desea evaluar una muestra de 8 de 754 probetas de sangre. Si numera las probetas del
001,002.003•... , 753. 754. ¿Cuáles seleccionará si le dice a Ud. que le resuelva este problema usando la de u
tabla de dígitos aelatorios? Explique la metodología que seleccionó.

7. Un investigador desea reevaluar una muestra aleatoria de 20 de 8312 casas. Si las numera del 0001.

0002, 0003,... 8311, 8312. ¿cuáles se seleccionarán si con la tabla de dígitos aleatorios utiliza las 4

cifras del centro de cada grupo. comenzando en la Isa fila de la 2& columna de arriba para abajo.

Continuando con las columnas 3&,4&, 5& Y 1& en el mismo orden?

1m•
••

ji¡"'j,'i·¡j·'M,,·"¡jiij·.·mm·I'lii.',M,,¡"¡'@ ~
. .

8. Los empleados de una compañía tienen distintivos enumerados del 001 al 544. Utilizando los 3 últimos
dígitos de cada grupo de la tabla de dígitos aleatorios, comenzando en la 12" fIla de la 2" columna de
arriba para abajo. ¿Cuáles serían los elementos de esa muestra? Seleccionar 10 de ellos.

Se ha decidido muestrear 25 de 250 accidentes laborales. Un empleado ha sugerido que se use la técnica del
muestreo sistemático y que sea seleccionado cada 8° informe en archivo para la muestra. ¿Cuáles serían
los elementos seleccionados de la muestra? ¿será apropiado este método en el presente caso? ¿Por qué?
Jara
y

La media, la mediana y la desviación estándar de una muestra, son ejemplos de variable aleatoria, cuyos
valores varían de una muestra a otra Las distribuciones que reflejan estas variaciones de oportunidad,
desempeña un papel importante en la Estadística y recibe el nombre de distribución de muestreo o
distribución muestral.
J01,
La distribución muestra! de una estadística, es la distribución de todos los valores posibles que puede tomar
la estadística, a partir de muestras del mismo tamaño y extraídas al azar de esa población.
acia
nes:
La construcción real de una distribución muestral, es una tarea muy grande si la población es de un tamaño
apreciable (y es totalmente imposible si la población es En dichos casos pueden obtenerse
qué aproximaciones de la distribución muestral tomando un gran número de muestras de un determinado
lS2
tamaño. El número de muestras posibles de tamaño n obtenidas con reemplazo de una población de tamaño
2
N, es igual a •
Desde un punto de vista matemático, se pueden describir las muestras y poblaciones, mediante medidas
como la media, mediana, moda y la desviación estándar. Cuando estos términos describen las
itos
características de una muestra se les llama y cuando describen las características de una
riba
población se les llama A continuación se presentan los símbolos utilizados en esta sección.

el6

:ión

Si se toman varias muestras de una población por uno de los métodos aleatorios antes mencionados, no es
del necesario que los estadísticos que se calculan en cada muestra, sean iguales; lo mas probable es que varíen
o la de una muestra a otra.

__ 1. La distribución de probabilidad de todas las medias posibles de las muestras,


101, se llama distribución muestral de la
184 2. La distribución de probabilidad de todas las proporciones posibles de las
ajo, muestras, se llama distribución muestral de las proporciones.
.)
. .•. Mm.i'dt.i,M"i¡Djm

Toda distribución de probabilidad, puede describirse en parte, mediante su media y su desviación estándar.
En vez de usar la "desviación estándar de la distribución de las medias y de las proporciones muestrales" ,
los estadísticos hablan del en-or estándar de la y en-or estándar de la proporci6n respectivamente.

La desviación estándar de la distribución de las medias muestrales, mide el grado en que se espera que las
medias de las diferentes muestras, vanen por este error accidental en el proceso de muestreo y también la
exactitud que alcanzará si se usa un estadístico muestral para estimar un parámetro. Cada distribución
muestral de media tiene su propia media y su propia desviación estándar.

__ 1. El en-or estándar de la j
) es el cociente entre la desviación estándar

de la población (a) y la raíz cuadrada del tamaño de la muesta (n), para

situaciones donde la población sea infinita; fórmula (2). también puede

afirmarse que x ' es una medida de dispersión de las medias de las muestras

alrededor de la media poblacional. Si la dispersión disminuye ( i se hace

mas pequeña) entonces los valores tomados por la media de la muestra,

tienden a agruparse mas cercanamente alrededor de y viceversa.

2. Cuando se desconoce la desviación estándar de la población, el


estandar de la se calcula con la fórmula (1):
1

Cuando el muestreo es a partir de una· población con distribución normal, la distribución muestral de la
media, tendrá las siguientes propiedades:

1. La distribución muestral de medias, será normal.


2. La media muestral, será igual a la media poblacional.
3. La varianza de las medias será igual a la varianza de la población dividida por el tamaño de la muestra:

x n
4. El error estándar de la distribución muestral de medias, es menor que el error estándar de la población:
<a

Muchas de las poblaciones que examinan los encargados de la toma de decisiones son finitas; es decir,
tienen un tamaño limitado o establecido. La fórmula diseñada para calcular el en-or estándar de la
cuando la población es fmita, y el muestreo se hace sin reemplazo, es:

donde: N = Tamaño de la población


n =Tamaño de la muestra
a = Error estándar de la población
-

ándar. El término:
iij,,·j,'i·"·'M,,¡i'¡i"j·.·mm·"A'·i,¡,,¡i'4'.

I se llama multiplkador o factor de corrección de poblaeión finita y su efecto es el de


. .

'ales", disminuir el error estándar de la media. .


nte. Si el factor de correcéión es cercano a 1, este producirá poco efecto en los cálculos del error estándar de la
distribución muestral de la Para rápidamente la conveniencia del uso del factor de
ue las corrección, se usa la expresión: llamadafracci6n Cuando esta fracetón es menor que 0.05,
ién la no es necesario usar el factor de correcci6n, ya que en caso contrario estaría muy próximo a 1 y tendrá
ución muy poco efecto sobre el error estándar la media muestral..
La aplicación más sencilla de la distribución muestra! de medias, es calcular la probabilidad de obtener una
con implica necesariamente utilizar la Tabla N° 1 de valores de z y
de.norm.a1izacióno que en este casoparticular, convierte en' la ecuación
ándar (4) de a b a j o : ' .
para
Juede
donde: ::::; media de la población
(4) ::::; media la muestra
hace '
estra, x: : ; error estándar de la media
.. :", , .. .

error

Ejemplo 1.

Considérese una población normal con = 100; = 20. Si se selecciona aleatoriamente una muestra de
n ¿cuál es la probabilidad de que esta muestra tenga un valor medio entre 90 y 110?; es
decir, qué es igual P(90 < < 1lO)? -.

Solución:
de la
, '

_ 00
lOO . x
-2.0'0 z

z = --a- ... Fórmula para evaluar z si se conoce valor de


la media muestral

_ 90':"'100 -10 - 200 ... Evaluando z, cuando x = 90. Normalizando


[ecir, 20 - -7'"·

z,=110Z0100=110S100= 1
5
°= 2.00 ... Evaluando z, cuando x = 110. Normalizando

* = A(-2.00,O) + ... Véase la gráfica de arriba. Planteando como


. =0.4772+0.4772 suma de área y calculando los valores con la
. Tabla z de áreas bajo la curva normal.
* P(90 < X.< 110) = P(-2.00 < z < 2.00) = 0.9544 ... Planteando como probabilidad
* P(90 < < 110) = 0.9544 ó 95.44% . ...
. .
'

Ejemplo 2.

La distribuci6n de las ganancias anuales de todas las cajeras de un banco, tiene un sesgo negativo .como

lo advierte la figura a). Esta distribuci6n tiene una media de L. 15000.00 Y una desviaci6n estándar de

L. 2 000.00. Si se extrae una muestra aleatoria de 30 cajeras, ¿cuál es la probabilidad de que sus
ganancias promedien más de L. 15 750.00?

=L. 365.16

0.5000
0.4798 .
L. 15000 L. 15 750 +
=L. 15000 o 2.05 z

*La figura a) muestra el sesgo negativo y la figura b) muestra la media que resultará. La parte

sombreada representa las ganancias de de L. 15750.00"

* = 15 000; a = 2 000; n = 30; = 15 750 ... Datos del problema para calcular el error

estándar de la media

* = a = 2000 = 5.477 2000


= 365.16 ... Calculando el error estándar de la media

*z = - = 15 750 - 15 000 = = 2.05 ... Normalizando para = 15 750

x 365.16 365.16

* A(2.05, = A(O, +(0) - A(O, 2.05) ... Véase la gráfica del inicio. Planteando como

= 0.5000 - 0.4798 diferencia de áreas y calculando el valor de z

=0.0202 en la tabla N° 1.

* P(z > 2.05) = 0.0202 6·2.02% ... Resp.


La probabilidad de que las ganancias promedio
de l. 15,750.00 es de 0.0202 62.02%
7
Ejemplo 3.

Se desea conocer la poblaci6n de 20 compañías textiles del mismo tamaño, todas las cuales sufren una

excesiva rotaci6n de personal. La desviaci6n estándar de la rotaci6n anual es de 75 empleados. Si se

muestrean 5 de esas compañías textiles, ¿cuál es el error estándar de la media?

Soluci6n:
* N = 20; a = 75; n = 5 ... Datos del problema. Se quiere conocer la

desviaci6n estándar de la media.

.oo Probando si es necesario usar el Factor de

* = = 0.25 Correcci6n

*0.25 >0.05 ... Como > 0.05, entonces es necesario usar


8.
el Factor de correcci6n.
* N - nl _'l2-Y20-5'_-.1L oo. Usando la f6rmula (3) para el error
ax 20-1 -2.236 I9 estáDdar de la media Sustituyendo valores y
operando
* = 33.54(0.888)=29.8

= 29.8 error est4ndar de la media. ... Resp.

-ey-e-5 N.. --u..,. .·ñ. ---e_-z


I j'J,,',,'i·"·'M,,"'jji'¡·.·mm·¡'gC··,¡,,'i'¡¡m,. .

¿F~~~':J;~ "'"
.. ::: :: : :: ..

1. .. ¿qué sucede con el error estándar de la media, si


el tamaño de la muestra: ,.:.:.:.:.:

a) Se incrementa de 25 a 225? c) Se disminuye de 480 a 30?


b)Aumenta de 20 a 45? d) Se disminuye de 250 a 4O?

2. Cuál es el valor del factor de corrección de la población fInita cuando:

a) n = 5 YN = 150? b) n = 10 YN = 150? c) n = 10 y N = 400?

3. Si una población normal tiene una desviación estándar de 25 unidades, ¿cuál es el error estándar de la
media si se utilizan muestras de tamaño:

a) n = 16 b) n = 25 c) n = 50 d) n = 100 e) n = 150

4. En una población de tamaño N = 80 con una media de 8.2 y una desviación estándar de 2.1, calcular el
error estándar de la media para los siguientes tamaños de la muestra:

a) n = 16 b) n =25 c)n=49 d)n=35 e) n =55


5. Se tiene una población de tamaño N = 80, con una media de 22 y una estándar de 3.2, ¿cuál
es la probabilidad de que una muestra de tamaño 25 tenga una media entre 21 y 23.5?

6. Se escogieron 64 elementos de una población de 125 elementos, con una media de 105 y una
desviación estándar de 17. a) ¿Cuál es el error estándar de la media?; b) ¿Cuál es la P(107.5 < < 109)?

7. Las estaturas de los niños de un jardín están distribuidas normalmente con una media de 39 pulg. y una
desviación estándar de 2 pulg.
a) Si se un niño aleatoriamente, ¿cuál es la probabilidad de que tenga una estatura entre 38 y
40 pulg.?
b) Se utiliza como muestra un grupo de 30 niños, ¿cuál es la probabilidad de que-la media del grupo
esté 38 y 40 pulg.?
c) Si se selecciona un niño aleatoriamente, ¿cuál es la probabilidad de que su estatura supere las 40
pulg.?
d) Se utiliza como muestra un grupo 30 niños, ¿cuál es la probabilidad de que la media del grupo
exceda a 40 pulg.?

r 8. Se aceptará un cargamento de barras de acero si la resistencia media a la ruptura de una muestra


aleatoria de 10 barras es mayor que 250 libras por pulgada cuadrada. En lo pasado, la resistencia a la
r ruptura de tales barras ha tenido una media y una varianza de 235 400 respectivamente. Suponiendo
que la resistencia a la ruptura está distribuida normalmente, ¿cuál es la probabilidad de que:
a) una barra seleccionada al azar tenga una resistencia dentro del intervalo 245 a 255 Ibs/pulg2?

b) el cargamento tenga resistencia mayor de 240 Ibs/pulg 2?

c) el cargamento sea aceptado?

d) el cargamento sea rechazado?

... _
Horado • • ·' .
~
. . •.i."i'iij¡iJ.•. mm.i,,;,.',M,,"'ijm

Ej

La proporción de unidades que poséen una caracteóstica particular en determinada población, se representa

por p. Si se conoce la proporción de unidades de muestra que tiene una misma caracteóstica denotada
Se
por se puede utilizar esta última como un estimador de p. Los estadísticos' a menudo' emplean una

muestra para estimar una proporción de ocurrencias. Por ejemplo, el gobierno estima mediante un

. procedimiento de muestreo, la tasa de desempleo, o la proporción de desempleados en la fuerza de trabajo.

Es muy común tratar problemas relacionados con proporciones. La de muestra viene

representada por: y la desviación estándar de la proporción por significa: número de eventos

x que en n ensayos. Las fórmulas (S), (S.l) y (6) son utilizadas para calcular la desviación

estándar de las proporciones y la referencia tipificada o normalización de una muestra para proporción.

donde: q =(l-p)
p .. .• ·Jl. : : ,. (S) - x
• ,,'o ••• " ",.
= Error estándar de la proporción

(5.1)

Cuando la muestra es aproximadamente menor que el S% de la población, el


impacto del factor de corrección es bastante pequeño. La regla general es
que si la proporción es menor que O.OS, se omite el factor de corrección
para población finita. 1.'

2.
Ejemplo 1.

Un psicólogo social entrevistó a ISO ejecutivos de alto nivel y encontró que el 42% de ellos eran
incapaces de sumar fracciones. Estimar el error estándar de la proporción muestra!.
3. :
Solución:
* n = ISO; P 42% 0.42; = = ... Datos del problema
4. ]
=
q (l-p) (1-0.42) 0.58 = = 1
= = 10.42(0.58) i = '= 001624' oo. ¿Qué se hizo?
p n V ISO ISO .
5.1
* p =0.0403 = 4.03%
* 4.03% E"or estándar de proporción muestral: oo. Resp.
6. ]
• ii¡"'j,.'.i.".""',j'ij·.·.W·'iCit···¡,,¡i'¡im ~
. .
Ejemplo 2.

El 8% de los estudiantes de Estadística son zurdos. Se seleccionan 150 personas de esa población.
:nta ¿Cuál es la probabilidad de que la muestra de los que sean zurdos, sea 15% o más?
Solución:
una * p = 8% = 0.08; n= 150; = 15% = 0.15 oo. Datos del problema
un q = (l-p) = (1-0.08) = 0.92
o.
* a- = YO.08(0.92) j = i = 0022 ... Calculando el error estándar de la proporción,
ene P n 150 150' usando la fórmula (5)

p =0.022
* =p-p=0.15-0.08= 0.07 =318 oo. Calculando el valor de z con la fórmula (6)
z p 0.022 0.022 .
para normalizar. Utilizar la Tabla z.
* z = 3.18 ... Trazando la del área bajo la curva
correspondiente
ión

O 3.18+ 00
* P(z 3.18) =A(O, +00) -A(O, 3.18) 'oo ¿Qué se hizo? ¿Por qué?
= 0.5000 - 0.4993
= 0.0007 ó 0.07%
* 0.07% ... Resp.

1, el
1 es
......
1. En Si se seleccionan al azar 150 individuos de esa
población, ¿cuál es la que los que son daltónicos sea: a) tan grande como
0.15; b) esté entre 0.10 y 0.13?; c) menores que 0.12?; d) mayores que 0.14?

2. En una población de adultos, el 15% están sometidos a algún tipo de dieta. ¿cuál es la probabilidad de que una
al azar de tamaño 100, dé una proporción de aquellos que se encuentran a dieta; a) sea mayor o igual
a 0.20; b) esté entre 0.10 y 0.20; c) no mayor de 0.12?
,ran
3. En cierta ciudad se observa que el 20% de las familias tienen por lo menos un miembro que sufre de algún
malestar debido a la contaminación atmosférica. Una muestra al azar de 150 familias dió = 0.27. Si el valor
del 20% es correcto ¿cuál es la probabilidad de obtener una proporción de la muestra así o mayor?

4. En una muestra al azar de 75 adultos, 35 dijeron que consideraban que el cáncer mamario era curable. Si la
proporción real de quienes piensan que dicho cáncer puede ser curado es de 0.55, ¿cuál es la probabilidad de
obtener una proporción tan pequeña o menor que la obtenida en esta muestra?

5. El 60% de los adultos de cierta ciudad asisten regularmente a los oficios religiosos. Se obtiene una muestra
aleatoria de 150 de ellos; ¿cuál es la probabilidad de que la proporción muestra! esté comprendida a) entre
0.50 y 0.6O?; b) sea menor que 0.70?; c) sea mayor que 0.55?

6. En cierta ciudad el 18% de los jóvenes han tenido algún contacto con la policía por efecto de las drogas. Se
selecciona una muestra aleatoria ¿Cuál es la probabilidad de que la proporción muestral esté comprendida a)
entre el 15% y 25%; b) sea menor que 20%; c) sea mayor que 23%? n = 36.

.. ---
Horacio Reyes úñez• •
a lo solicitado empleando sus.propias en se aplique:

1. a) ¿Qué significa la fórmula =O? .


b) lCómo, mediante cálculós,se determina que dos eventos son independientes?
c) lQuéquiere decir que la curva normal es sinlétrica con respecto al eje vertical?
d) lA qué es igual el área total bajo la curva normal? y l a la izquierda de z=O?
e) LEn qué consiste la probabilidad clásica? .
t) lCómo se interpreta la fórmula p(AnB) =peA) x P(B)?
. g) lQué tipo de distribución es la distribución normal?
h) lQué particularidad presentan la media, la mediana y la moda en la curva normal?
. i) LEn qué consiste el muestreo no aletaorio por cuota?
j) lA qué se les llama parámetros y bajo que condiciones?
k) Sea una distribución muestral para proporciones de una muestra lqué indica p?

cada en clara
2. Si los datos que lleva una agencia muestran que, en un período de tiempo 50 de 65 aereonaves que
volaban de la Ceiba a Roatán llegaron a tiempo l cuál la probabilidad de que algun miembro de la
flota aerea que cubre tal ruta arribe a la hora indicada.
3. Suponga una clase de 100 estudiantes formada por varios grupos

Si se elige al azar un estudiante para que presida la clase, lcuál es la probabilidad de que tal estudiante
sea: a) Un hombre? b) una mujer? c) que curse Matemáticas? d) un hombre o alguien que curse
\ Matemáticas? e) una mujer que curse Matemáticas?
4. Con los datos de cada inciso, determine la independencia o no de los eventos A y B:

a) P(A«B)= 6.12%; P(A) = 0.17; P(B) = 36%. b) = 80%; P(B) =0.3; = 0.28

5. Dada una distribución normal de calificaciones brutas en la cual la media es 60 y la desviación estandar es
3.5, calcular: a) la probabilidad de estudiantes que obtuvieron notas de 55 ó menos b) El porcentaje de
encontrar un estudiante que haya logrado una nota entre 55 y 65 c) la probabilidad de estudiantes que
obtuvieron notas de 55 ó más.
6. El 55% de los adultos de cierta ciudad -asisten regularmente a los oficios religiosos. Se obtiene una
muestra aleatoria de '100 de ellosl cuál es la probabilidad de que la proporción muestral sea mayor que
.
7. Sean 60 estudiantes de un colegio determinado practicando diversos deportes y distribuidos así: fúbol, 30;
basquetbol, 20; béisbol, 20; fútbol y basquetbol 5; basquetbol, y béisbol, 5; los tres deportes, 2. Supongase
ll

'que se elige al azar un estudiante para hacerle una entrevista. Auxiliándose de un diagrama de Venn,
calcular la probabilidad que el estudiante sea: a. un atleta que practique por lo menos un deporte. a) un
jugador de fútbol exclusivamente. b) un jugador de fúbol o uno de béisbol. c) un jugador de basquetbol
."
, exclusivamente. d) un jugador tanto de basquetbol como béisbol.

. '• • ~=,

.­ -. -

la

nte
Irse

res
: de

que

30¡
:ase
nn,
un
:bol
. .

. .:_..",gl.','•.IIII'." ,".I."'"
Jnttoducción. - . - .. .
y

Todo el mundo hace estimaciones. Cuando se va a cruzar una calle; se hace una estimación de la velocidad
de los automóviles que se acercan, de la distancia que hay entre Ud. y el automóvil más cercano y de su
propia velocidad. Habiendo estimado rápidamente estos factores, usted decide si espera, camina o se echa a
correr.
(

Los administradores utilizan las estimaciones debido a que hasta en las cosas más triviales, deben tomar c
decisiones racionales, sin que tengan la información pertinente completa y con gran incertidumbre acerca p
de lo que pueda deparar el futuro. Los jefes de departamento de una Universidad hacen estimaciones acerca
de las inscripciones para el período de estudio siguiente. Los directores de crédito estiman si un cliente
pagará o no sus débitos. Los compradores de casas hacen estimaciones al comportamiento de las tasas de
interés de los préstamos hipotecarios, etc. Todas estas personas hacen estimaciones sin preocuparse de que
su comportamiento sea o no científico, pero con la esperanza de que las estimaciones posean una semejanza
razonable con el resultado.
e
Los conceptos básicos de probabilidad y de distribución muestral, sirven como introducción al método de d
Inferencia Estadística. Generalmente ésta se descompone en dos áreas: Pruebas de Hipótesis y
Estimación. La Prueba de Hipótesis constituye el proceso relacionado con aceptar o rechazar declaraciones
acerca de los parámetros de la población, mientras que la Estimación se ocupa precisamente de estimar los
valores de los parámetros de la población..
S1
si

Se ocupa del uso de los conceptos de la probabilidad para afrontar la incertidumbre en la toma de
decisiones. Se basa en la estimación y en la prueba de hipótesis. En ellas se harán inferencias respecto a las
características de la población a partir de la información contenida en las muestras. La estimación puede
ser:

Estimación puntual:

Es un solo número que sirve para estimar un parámetro'desconocido de una población.

Estimación por intervalo:

Es una gama de valores dentro del cual es posible que esté un parámetro desconocido de una población.

En Estadística la probabilidad asociada a una estimación de intervalo se llama nivel de confianza., Esta
probabilidad indica pués, la confianza que se tiene de que la estimación por intervalo, comprenda el
parámetro de la población. Una probabilidad mayor significa más confianza. En una estimación los niveles
de confianza mas utilizados son 90%, 95% y 99%; pero se pueden utilizar otros como el 95.5%. Con
frecuencia los intervalos de confianza, se expresan así:

'

• O rae i O es--M6itez
I
. .

donde: x- ZaJ2' x =Límite inferior del IC; (LIC)


+ ZaJ2' x =Límite superior del IC; (LSC)
=Nivelo grado de confianza
= Estimador
=
x Error estándar
d zan = Coeficiente o valor crítico de confianza
u =
a Probabilidad de error
a
Cuando se conoce la desviación estándar de la población, se usa x =
y cuando no se conoce, se estima
con: x = debiendo en ambos casos corroborar si es necesario usar o el factor de corrección para .
a población finita. .
a
e
e
e
z
a o
-Zan zan

Como el nivel de confianza o probabilidad es de que una variable aleatoria, que tiene una
e distribución nonnal estándar tome un valor entre -zan y + zan es
y
s
s
Se puede sustituir en esta desigualdad, la expresión z de normalización (ver fórmula 4) y obtener mediante
sustitución y algunas operaciones algebraicas, la misma desigualdad, pero reescrita en las formas
siguientes:

s r (7) 1. La fórmula (7) se emplea cuando se conoce la desviación


estándar de la población infinita, o < 0.05

1-- = Z..
.... .U.• .··.d7....l .
(7 1) 2. La fónnula (7.1) se emplea cuando
desviación estándar de la población finita
conoce la
0.05

3. La fórmula (8) se emplea cuando no se conoce la


desviación estándar de la población infinita, o < 0.05

4.La fórmula (8.1) se emplea cuando no se conoce la·


desviación estándar de la población finita y 0,05

:.
Horacio
~
. . • .i¡'ij.,•.•,ii.i·iiij'

Todas las fórmulas anteriores representan los lúnites superiores e inferiores de un intervalo de confia1Wl 1
para muestras grandes de la media poblacional y se puede afirmar con la probabilidad t
(l-a)xloo% de confianza, que el intervalo contiene la media poblacional o parámetro que se intenta
estimar.
__ 1. Los coeficientes o valores críticos de confianza más usados, de acuerdo al
nivel de confianza,son:

1.64 para el 90%

1.96 para el 95%

2.58 para el 99%

2. Para calcular un coeficiente o valor crítico de confianza cualesquiera,


primero se expresa el nivel de confianza como un número decimal, después S
se divide por 2 y este resultado se busca en el cuetpo de la Tabla z y se
determina el valor de correspondiente, empleando la columna z y la
primera fila de la misma tabla. Así, por ejemplo, si el nivel de confianza es
80% entonces el coeficiente o valor crítico de confianza correspondiente es:
80% = 0.8000
0.8000 = 0.4000
2
El valor que más se aproxima a ese valor en la Tabla z, es 0.3997 que
corresponde a 1.2 colunuia 8. Luego, el coficiente de cofianza o valor crítico
es 1.28 por defecto. (Sin intetpolar)
3. La probabilidad de error (a) expresada en % se calcula restando de 100% el
nivel de confianza respectivo, así:
90%, su probabilidad o de error es: 100% - 90% = 10%·
95%, su probabilidad o margen de error es: 100% = .5%
99%, su probabilidad o margen de error es: 99% = 1%
todos los cuales se distribuyen en dos partes iguales, una en cada cola de la
curva normal. (Ver figura de la página anterior). .

Ejemplo l.

De una muestra de lOO pacientes se obtiene una media = 4.6 minutos con una desviación estándar de
s = 1.1 ¿Cuál es el intervalo del.95% de confianza para el tiempo promedio que tarda un
analgésico en hacer efecto?

Solución:
* n = lOO; s= 1.1; = 4.6; NC= = 95% ... Datos del problema. Muestra grande. Nivel de
* s = 1.1 (Se desconoce confianza NC = 95%

= Vn-! = v 100-1 = v99 =0.11 ... Calculando la desviación estándar de la media


poblacional. ¿Por qué se utiliza esta expresión?
* = 1.96 ... ¿Porqué?
* LIC = 4.6 - 1.96(0.11) =4.6 - 0.22 =4.38 ... Calculando el1ímite inferior de confianza (LIC) y
* LSC:;: 4.6 + 1.96(0.11) = 4.6 + 0.22 = 4.82 el1ímite superior de cofianza (LSC) del intervalo
de confianza con la fórmula (8)
IC(95%) = 4.38 < < 4.82 ... Formando el IC para la media poblacional

El intervalo confianza está entre 4.38 y 4.82 ... Resp.


minutos

-'1 - ' .. i'


• 'ii'''EliI.•.H·II'iii·¡···'''·iiiil.. .:

Lo anterior quiere decir, que ·se tiene la certeza en un 95% de que la verdadera media poblacional del
¡dad tiempo que tarda un analgésico en efecto, está entre 4.38 y minutos.
enta
Ejemplo 2.

lo al El departamento de vivienda está interesado en estimar el ingreso medio anual de 700 familias que
viven en una sección de 4 manzanas de una cierta comunidad. Selecciona en forma aleatoria una
muestra de 50 familias y en ellas encuentra un ingreso medio de L. 11 800 con desviación estándar de
L. 950. Calcular un IC del 93% de confianza de que la media de la población está dentro de este
intervalo.
lera,
Solución:
y se
y la
* N = 700; n = 50; = 11 800; s= 950; NC= 93% :.. Datos del problema. n = muestra grande
a es * = = 0.071 0.05 ... Calculando el valor de la fracción de muestreo
es: para definir que ecuación utilizar
__
s _ni _ 950 1700-50'
* N -1 - 3o=l V 700 -1 ... Calculando

que
tico = i= 135.7142 (0.9643) ... Sustituyendo y operando para calcular el error
estándar de la media ( al( )
el * = 130.87

* NC = 93% = 0.9300 ... Calculando el coeficiente o valor crítico de


0.9300 = 0.4650 confianza ZaJ2
2
e la
* ZaJ2 = 1. 81 (Por defecto) .,. ¿Cómo se calculó ZaJ2 = 1.81?

LIC = 11 800 - 1.81 (130.87) = 11 800 - 236.87 ... Calculando los límites del intervalo de
= 11563:13 confianza: LIC y LSC [(fórmula (8.1)]
de LSC = 11 800 + 1.81 (130.87) = 11 800 + 236.87
un = 12036.87
IC(93 %) = 11 563.13 < < 12036.87 ... Resp. Formando el IC del 93%. Explique su
significado

de Ejemplo 3.

Se obtiene una muestra de 38 calificaciones para estimar el puntaje medio de un primer parcial
de Estadística, obteniéndose una media de 74.3%. Determinar el intervalo de confianza del 98% de la
dia media de todas las calificaciones obtenidas en dicho examen si a = 14%
Solución:
') y * n = 38; a = 14; = 74.3%; NC = 98% ... Datos del problema. n = 38 : muestra grande
alo = 98% ó = 2%
* = 98% 0.9800 ... Calculando ZaJ2 auxiliándose de la Tabla z.

= 0.4900 entonces:
* ZaJ2 = 2.33 exceso (ver figura de la siguiente página)

.
Horacio Reyes
. .
~ ••·ii¡ij.,• • •",.i.iiii'

z ... ...

0.4901 (Valor tabular más

próximo a 0.4900

z (0.01) = 2.33
1

= = =2.27 (Por exceso) ... Calculando

74.3 - 2.33 (2.27) =74.3 - 5.29 =69.01 LIC ... Calculando los límites de IC con la fónnula
(7). ¿Por qué?
74.3 + 2.33 (2.27) =74.3 + 5.29 =79.59 LSC

IC (98%) = 69.01 < < 79.59 ... Fonnando el IC

El intervalo confianZll esta entre 69.01% Y ... Resp. ¿Qué significa?


79.59%

.1

L Al
media es 76.3. Encontrar un intervalo de para la media poblacional del: a) 91 %; b) 97%;

c) 89%

1
2. Un estudiante muy escrupuloso escribió su trabajo de grado de 700 páginas. El desea conocer el
promedio de errores tipográficos por página. Seleccionó al azar 40 páginas y descubrió que el
promedio de errores por páginas era 4.3 con una desviación estándar de 1.2 a) Calcular el error estándar
estimado de la media y b) Construir un IC del 93% para el valor promedio verdadero de errores por
página en su tesis.

3. Una muestra de 35 individuos se escoge de una población de 360. En la muestra se descubre que la
media es 20.9 y la desviación estándar es de 6.1. Construir un intervalo de confianza para la verdadera
media pob1acional del: a) 96%; b) 90%; c) 98%. .

4. Un corredor de bolsa muestreó 45 órdenes y descubrió que el tiempo medio de ejecución era de 24.3
minutos con una desviación estándar de 3.2 minutos. Construir un IC para el verdadero tiempo medio de
1
ejecución del: a) 96%; b) 88%; c) 99%.

5. Una muestra de 36 obreros no calificados tienen un sueldo medio de L. 7 280.00 con una desviación
estándar de L. l 200.00. Construir un intervalo de confianza para la verdadera media poblacional, del:
a) 94%; b) 97%; c) 99%. 1

6. Se estudió una muestra aleatoria de 75 estudiantes para estimar el dinero medio que gastan en la compra
de libros. Se descubrió que gastan L. 85.30. Si la desviación estándar de la población es L. 15.00
IC del: a) 87%; b) 94%; c) 96% para la verdadera media poblacional.

..
• Dil"f"i·".·"'O·"·.""·'R'.. .
7. Las longitudes de 200 peces capturados en el Lago de Yojoa, tuvieron una media de 14.3 pulg. La
desviación estándar poblacional es 2.5 pulg. Construir IC del: a) 90%; b) 98%; c) 84% para la
-
verdadera media poblacional.

. 8., El gerente de la división de bombillas de la Cardinal Electric debe estimar el número promedio de
horas que durarán los focos fabricados por cada una de las máquinas. Fue elegida una muestra de 40
focos de una máquina A y el tiempo promedio de funcionamiento fue de 1 416 horas. Se sabe que la
desviación estándar del tiempo de duración es de 30 horas. .
a) Calcular el error estándar de la media
b) Cons1!Uir un intervalo de confianz¡l del 90% para la media de la poblaci6n

9. Después de recolectar una muestra de 250 elementos de una población con una desviación estándar
lUla conocida de 13.7, se encuentra que la media es de 112.4
a) Encontrar un intervalo de confianza del 95% para la media
b) Encontrar un intervalo de confianza del 99% para la media

10. En una prueba de seguridad automovilística efectvada por el Centro de Investigación en Seguridad
Carretera, la presión promedio en la llantas de los automóviles de una muestra de 62 neumáticos fue de
24 libras por pulgada cuadrada y la desviación estándar fue de 2.1 libras por pulgada cuadrada.
. a) ¿Cuál es la desviación estándar estimada para esta población? (hay aproximadamente un millón de
automóviles registrados)
b) Calcular el error estándar estimado de la media
c) Construir intervalo de confianza del 95% para la media de la población

11. De una población de 540 individuos, se toma una muestra de 60. A partir de esta muestra, se encuentra
que la media es de 6.2 y la desviación estándar de 1.368
: la a) Encontrar el error estándar estimado de la media
'%; b) Construir un intervalo de confianza del 96% para la media

12. El gerente de producci6n de la compañía Citrus Groves Inc. esta preocupado debido a que las heladas
. el tardías de los' últimos tres años han estado dañando los 2 500 naranjos que posee la Citrus Groves. Con
el el fm de determinar el grado de daño ocasionado a los árboles, ha recogido una muestra del número de
dar naranjas producidas por cada árbol de un total de 42 naranjos y encontró que la producción promedio
por fue de 525 naranjas por árbol, con una desviación estándar de 30 naranjas por árbol.
Estimar la desviación estándar de la población a partir de la desviación estándar de la muestra
.b) Estimar el error estándar de la media para esta población finita.
: la c) Construir un intervalo de confianza del 98% para la producción media por árbol del total de 2 500
era árboles.
d) Si la producción media de naranjas por árbol fue de 600 frutas hace cinco años, ¿qué puede decirce
acerca de la posible existencia de daños en el presente?
4.3
de 13. Un corredor de la Bolsa de Valores tiene curiosidad acerca de la cantidad de tiempo que existe entre la
de una orden de venta y su ejecución. Se hizo un muestreo de 45 órdenes y encontró que el
tiempo medio para la ejecución fue de 24.3 minutos, con una desviación estándar de 3.2 minutos.
ión construir un intervalo de confianza del 95% para el tiempo medio para la ejecución de una orden.
lel:
14. La jefa de Policía Kathy Ackert recientemente estableció medidas enérgicas para contrarrestar a los
traficantes de droga de su ciudad. Desde que se pusieron en funcionamiento dichas medidas, han sido
pra capturados 750 de los 368 traficantes de droga de la ciudad. El valor promedio, de las drogas
.00 . decomisadas a estos 750 traficantes es de L. 250000.00 Y la desviaci6n estándar es de L. 41 000.00
Construir para la jefa Ackert un intervalo de confianza del 90% para el valor medio de los
estupefacientes que están en manos de los traficantes de droga de la ciudad.

.
Horacio Reyes tez• •

__.. __ . ~ ~ __._. . """"''''''''''' -···· -· ~' ,-"¿¡;¡¡¡,,@


', . ••.ii'ij.'M. • ,'i.,.'i'j' •
Para generar la teoría correspondiente que se aplica así mismo a muestras pequeñas (n < 30), será necesario
suponer que la población muestreada tiene aproximadamente una distribución muestral normal, por lo tanto
se puede basar el método en el estadísticO t, dado por la fórmula (9).

cuya distribución de muestreo es una distribución llamada distribución t de student

Distribución t para el
El
=
tamaño de muestra n 15
IDl
tOl

o
En esta distribución presentada en la figura de arriba, para muestras de tamaño 15 y tamaño 2, se tiene que:
l. Es simétrica con respecto a la media =O
2. Su forma es muy semejante a la distribuciQn normal, sólo que es menor en la media y más alta en los

. extremos o colas que una distribQción normal.

3. La forma exacta de la distribución t, depende de un parámetro llaltladas grados de libertad (gl) que Se
no es mas que "El tamaño de la muestra menos 1: gl = n-1" en otras palabras, es el m1mero de
valores que se pueden escoger libremente.
4. Esta distribución usa la Tabla 3 llamada Tabla de distribución t de o simplemente Tabla t.

Verla al fmal del libro.


.

__ ... 1. La Tabla t es más compacta que la Tabla z y muestra las áreas y valores de t
para unos cuantos porcentajes exclusivamente (25%, 10%, 5%, 2.5%, 1%,
0.5%). Una tabla más completa resUltaría demasiado larga, pues hay una
distribución t para cada número de grados de libertad (gl).
2. La Tabla t mide la probabilidad de que el parámetro poblacional que está
siendo estimado no caiga dentro del intervalo de confianza, es decir la
probabilidad de que esté fuera de éste. Si se hace una estimación con un
nivel de confianza del 90% se buscará en la Tabla de Distribución l, bajo la
columna 0.10 (100%- 90% = 10% =0.10). Esta probabilidad de error del
10% = 0.10 está representado por a. Se encontrarán los valores
correspondientes a t para intervalos de confianza del 75% 90%, 95%, 97.5%,
99% y 99.5% bajo las columnas encabezadas por 0.25, 0.10, 0.05, 0.025,
0.010 Y 0.005 respectivamente en la· Tabla· t del final del libro.
¡jiVerifíquelo! !!
3. En el uso de la distribución l, siempre debe especificarse los de
(gl) con que ha de trabajarse.
Utilizando el hecho de que esta distribución es simétrica con respecto a t =O,
se descubre que la probabilidad de que una variable aleatoria que tiene
la distribución t tome un valor entre:
• ."",";.i'.·""'·E-·"'"·''''' . .
io
lo
•I':~J
..............

•••• o • • • • __ ••••

y mediante un sencillo proceso algebraico, se llega a la fórmula (10) de intervalo de confianza de


muestra que aparece abajo:

donde x- taJ = LIC


(10)
+ taJ2 = LSC

El grado de confianza es es una diferencia existente entre esta fórmula.(lO) del IC y la fórmula de la
muestra grande dada en la fórmula (7) (donde se sustituye por s). También hay diferencia en que
toma el lugar de zaJ2'

Ejemplo 1.

e: El gerente de una empresa desea una estimación por intervalo de la media del consumo de carbón y
quiere tener la confianza del 95% de que el consumo caiga dentro de dicho intervalo. Los datos
los obtenidos son n = 10 semanas, = 11 400 ton. s = 700 ton
lue Solución:
de
* Usar la distribución t ... Porque n < 30 y se desconoce
t. n = 10; = 95%; = 11 400; s = 700 Datos del problema

* n = 100%- 95% = 5% = 0.05 ." Calculando la probabilidad de error


le t
n, expresado como decimal.
%,
ma * =0.025 ... Diviendo por 2 para entrar a la Tabla t
en la columna 0.025
:stá
la * Si n = 10 entonces gl = 10-1= 9 gl
... Calculando los grados de libertad gl.
un

* taJ2 =2.26 ... Calculando el taJ2 entrando a la tabla


del con 9 gl en la columna 0.025; en la
·res interesección de ellas se encuentra el
i%, valor crítico para t. (2.26)
25, *LIC = 11400 - 2.26 ( 700 ) = 11400 - 2.26 (221.36) ... Calculando el IC(95%) usando la
TII ..
Iro. = 11400 - 500.27 = 10 899.73 fórmula (10) sustituyendo valores, y
*LSC =11400 - 2.26 = 11400 +500.27 =11900.73 operando
de v lO
IC (95%) = 10 899.73 < 11 900.27 Resp.
=0,
ene El intervalo de confianza está entre Resp.
10899.73 Y 11 900.27 toneltulas

. ..... .....-- -
Horacio Reyes .

...... _ .. __•.. _.. ~~-


..
~

n =10
gl=9
0.025 del área 0.025 del área
bajo la curva bajo la curva
0.95 del área
bajo la curva
........... ,........ : z
10 x =11 400 11 901
1

Figura del problema anterior: una t con 9.g1 de libertad y un intervalo de confianza de 95%
Ejemplo 2.

Una parada de camiones ha conservado registros de diversas transacciones con los clientes. Una muestra
aleatoria de 15 de ellos revelan ventas en promedio de 63.9 galones de diesel con una s = 2.8 galones.
Construir un IC del 99% de las ventas en promedio de diesel que se hacen.
Solución:
* n = 15; = 63.9; s =2.8; =99% ... Datos del problema
* Usar la distribución t. oo. ¿Porqué?
* a = 100% - 99% = 1% = 0.01 Calculando la probabilidad del error
8
=0.005 .oo ¿Para que? ¿Por qué?
* Si n = 15 entonces gl = 15-1 = 14 gl
oo. ¿Qué se hizo?
* tal2 =2.98 ... ¿Cómo se encontró este valor?

9
* LIC = 63.9 - 2.98 ,) 63.9 - 2.98 (0.72) oo. ¿Qué se hizo?

_ = 63.9 -2.15 =61.75

* LSC = 63.9 + 2.98 2.8 ,) = 63.9 + 2.98 (0.72)

15
=63.9 + 2.15 = 66.05
IC(99%) =61.75 < 66.05 oo. Resp.
El intervalo de confianZJI. está entre 61.75 y 66.05 oo. Resp. ¿Qué significa?
11
de diesel

los cuales se construyen los IC. . . . y


a)n = 6; 95% c) n= 29; 99% e) n = 16; 99% ql
b) n = 19; 90% d) n = 14; 90% f) n = 12; 99% m
c(
2. Si se tienen los siguientes tamaños de muestra y valores de t usados para construir IC, encontrar los la
niveles de confianza correspondientes:
a) n = 21; t =±2.09 b) n = 13; t=±1.78 c) n = 8; t =±3.00
Una muestra de 12 tiene una media de 16.2 y una desviación estándar de 10. Construir un IC del 95%
.para la media de la población.
• .'

4. La siguiente muestra de 8 observaciones está tomada de una población infinita con distribución normal:
10.3, 12.4, 11.6, 11.8, 10.9, 11.2, 10.3, 12.6. Calcular: a) la media; b) estimar la desviación estándar de
la población; c) un IC de 99% para la verdadera media de la población.

5. Siete amas de casa fueron muestreadas aleatoriamente y se investigó que caminaban un promedio de
39.2 km por semana durante sus tareas domésticas, con una desviación estándar de 3.2 km por semana.
Construir un IC del 90% para la media de la población.

6. Nueve soportes construidos por medio de ciertos procesos tienen un diámetro medio de 1.005 cm con
una desviación estándar de 0.004 cm. Construir un IC del 95% para la verdadera media poblacional.

7. Las autoridades de Salud han encontrado, que la población posee severos problemas relacionados con
ra
su placa dental. Cada año, el departamento de salud dental local examina una muestra tomada de los
habitantes y registra la condición de la dentadura de cada paciente en una escata que de l al lOO, en
la que 1 iJÍdica que no hay dentadura y 100 indica que la dentadura está en excelentes condiciones. En
el presente año, el departamento de salud dental examinó a 21 pacientes y encontró que tenían un
resultado de revisión dental (RRD) de 72, con una desviación estándar de 6.2. Construir para el
gobierno un intervalo de confianza del 98% para la media del RRD.
or
8. En 6 intentos un cerrajero tardó 9, 14,7,8, 11,5 segundos en abrir un cierto tipo de cerradura. Calcular
a) la media; b) la desviación estándar de esa muestra y c) construir un IC del 95% en relación con el
tiempo medio que la toma abrir este tipo de cerradura.
. '.
9. La siguiente muestra de ocho observaciones fue tomada de una población con distribución nonnal:
75.3 76.4 83.2 91.0 80.1 77.5 84.8 81.0

a) Encontrar la media
b) Estimar la desviación estándar de la población
c) Construir un intervalo de confianza del 98% para la media

10. El número medio de accidentes que se presentaron en los 7 días de la Semana Santa en las playas de
Tela fue de 31, la desviación estándar de esa muestra fue de 9 accidentes por día. Construir un IC del
99% para el número real de accidentes por día.

de confianza
on
Ya se sabe que = comesponde a la media de la proporción de la muestra, donde x es el número de veces
que ha ocurrido un evento en n ensayos. Por ejemplo, si a 63 de 150 televidentes entrevistados en una
muestra, les gusta el programa "cinco entonces: = = = 0.42 = 42%. También ya se
conoce, que la distribución de muestras de una proporción, utiliza la distribución normal como sustituto de
.os la binomial, cuando np > 5 y nq >5, entonces:

i%

Horacio Reyes Núñe-z


)
. .:ti""t¡¡i,','""iij·f··d.i1.•.iijii
I
El intervalo de confianza para una proporción de la población se estima así:

=• . (11)

..
s

En donde p es el error estándar de la población: p Y sustituyendo en la fórmula (11) se tiene:

F6rmula calcular el intervalo de confianza


(12) la proporción a partir de muestras grandes de p.
donde: = Proporción de la muestra

n = Tamaño de la muestra
zaJz = Coeficiente crítico de confianza

A partir de la fórmula (12) se obtienen el Límite Inferior de Confianza (LIC) con el empleo del signo
negativo (-) y el Límite Superior de Confianza (LSC) en el signo positivo (+)

Ejemplo 1.

Si a 400 personas, que constituyen una muestra tomada al azar, se les aplica una vacuna contra la
influenza y 136 de ellas experimentan cierta incomodidad, construir un IC del 95% en relación con la
proporción correspondiente.

Solución:

* n =400; x = 136; = = =0.34 ... Datos del problema y calculando la


proporción muestra!
(1-a) =95%; = 1-0.34 = 0.66 1.
* (1-a) = 95% = 0.9500 ... Calculando zaJz y empleando la
Tabla z. ¿Por qué?
0 .. 00 =0.4750 entonces:
2.
= 1.9.6
zaJz ... ¿Cómo obtuvo este valor?
* LIC =0.34 _ 1.96 ( 0.34 (0.66) i ) =0.34 _ 1.96 (0.023) ... Calculando el intervalo de
400 confianza con la fórmula (12)
= 0.34 - 0.045 =0.295 3.
* LSC = 0.3.4 + 1.96 (j i ) = 0.34 + 1.96 (0.023)

= 0.34 + 0.045 = 0.385

IC (95%) ':: 0.295 < p < 0.385 ... Resp. ¿Qué significa? 4.

El intervalo de confianza está entre 0.295 0.385 6 ... Resp.

que es lo mismo decir que entre el 29.5% el 38.5%


5.
de experimentan incomodidad

••
. --
• .""*,""".'11 1".,••••11.1.11#11 .. .
Ejemplo 2.

Con el objeto de determinar el grado de reprobación en un examen de Estadística del primer período de
estudio, se tomaron al azar las secciones "A", "F" Y "H" de la UPN, observándose que se reprobaron 67
alumnos de 132. Construir un IC del 99% para determinar la proporción de alumnos que reprobaron en
todas las secciones.
Solución:

x =67; n =132; = 16372 =0.51 = oo. Datos del problema


= =(1-0.51) =0.49
:za
p.
. =99% =0.9900
0.9900 =0.4950 entonces: ... ¿Qué se hizo?
2
za/z =2.58 por exceso oo. ¿ se calculó este valor de z?
* LIC =0.51- 2.58 = 0.51 _ 2.58 (0.044)
i
... ¿Que se hizo?
132
za = 0.51 - 0.113 = 0.397

no
* LSC = 0.51 + 2.58 0.5 i =0.51 + 2.58 (0.044)
=051 + 0.113 =0.623
IC (99%) =0.397 < p < 0.623 ... Resp.
El inteTllalo de confianza está entre 0.397 y ... Resp.
la 0.623 Ó que es lo mismo decir que entre el 39.7%
la y el 62.3% está el índice de

la
1. En un estudio de
~~~ti1ifi'lr~~~ dijeron que hacen sus compras en el
supermercado, cuando menos una vez Construir un IC del 99% de confianza para la
la proporción verdadera correspondiente. ¿Qué significa ese resultado?

2. Entre 80 peces capturados, 28 resultaron incomibles por efecto de la contaminación química de su


ambiente. Si se utiliza una proporción de la muestra para calcular la proporción verdadera
correspondiente, construir un IC del 95% para dicha población. Explicar el resultado.
de
3. En una muestra aleatoria de 1200 votantes entrevistados, sólo 324 dijeron que no debía aumentarse los
salarios de ciertos funcionarios del gobierno. Construir un IC el 97.5% para la proporción verdadera
correspondiente. ¿Qué significa ese resultado?

4. En una muestra tomada al azar de 250 alumnos del último año de Ingeniería en Sistemas, 175
contestaron esperar continuar sus estudios de post-grado. Construir un IC. del 90% para la proporción
verdadera correspondiente. ¿Qué significa ese resultado?

5. En una muestra tomada al azar de 80 personas convictas, 36 recibieron libertad condicional. Construir
un IC del 92% para la proporción verdadera correspondiente, si las personas convictas estaban acusadas
de posesión de drogas. Explicar el resultado. -

- ----
6. De 300 personas entrevistadas que hacen sus compras en un almacén de abastos, 207 de ellas utilizaban
su tarjeta de crédito. Construir un IC del 90% para la proporción verdadera de los que compran con
tarjetas de crédito. ¿Qué significa ese resultado?

7. Una tienda de aparatos electrónicos, compra 250 chips para computadora. El dueño comprueba
mediante muestreo aleatorio que el 5% de esos chips son defectuosos: a) estimar el error estándar de la
proporción de chips defectuosos; b) construir un IC del 98% para la proporción verdadera
correspondiente. Explicar el resultado.

8. De una muestra de 70 ejecutivos minoristas, el 65% de ellos creyó que la disminución de ventas se
debía a lo caro de las divisas; a) estimar el error estándar de la proporción de ejecutivos que pensó eso;
b) construir un IC del 95% para la proporción verdadera correspondiente.

9. De 1500 consumidores, 956 pensaron que el nuevo producto era cera para pisos según su tipo de
envase, cuando en realidad era un nuevo detergente; a) estimar el error estándar de la proporción de
personas con ideas erróneas; b) construir un IC del 96% de. confianza para la verdadera proporción
correspondiente. Explicar el resultado.

10. Un jugador profesional de baloncesto lanzó 150 tiros libres de los cuales encesto 126; a) estimar el
error estándar de la proporción de tiros libres encestados; b) construir un IC del 93% para la proporción
de tiros libres que encesta el jugador. Explicar el resultado.

11. Un dueño de inmobiliaria revisó en forma aleatoria 3000 cuentas de la compañía y encontró que el 60%
de ellas están al día en sus cuentas; a) estimar el error estándar de la proporción de esas cuentas;
b) construir un IC del 91 % para la proporción verdadera correspondiente. Explicar el resultado. I

12. Durante año y medio las ventas han estado disminuyendo de manera coherente en las 1,500
sucursales de una cadena de tiendas de comida rápida. Una empresa de asesores ha determinado que el
30% de una muestra de 95 sucursales tiene claros signos de una mala administración. Construir un IC
del 98% para esta proporción. Explicar el resultado.
s
13. La directiva estudiantil de una universidad tomó una muestra de 45 libros de texto de la librería
universitaria y determinó que de ellos, 60% se vendía en más del 50% por arriba de su costo de
mayoreo. Formar un IC para la proporción de libros, cuyo precio establecido es más del 50% por arriba
del costo al mayoreo, que tenga la certeza de un 96% de contener la proporción verdadera.

Muy a menudo en la práctica, se toman decisiones sobre poblacjones partiendo de la información muestral
de la misma. Tales decisiones se llaman Decisiones Estadísticas; para llegar a ellas conviene oocer ciertos
supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos se llaman Hipótesis

Hipótesis Estadística: Es una afirmación o conjetura del parámetro o parámetros de una población.


• • '--o-r-:-a-c-'ir:07 u
:>'"'
I mi""" .•.••.• .
.•",, . ..

n En la prueba de hipótesis se ha de fonnular un supuesto valor del parámetro de la población antes de


n
empezar el muestreo. La suposición que se desea probar se llama hipótesis nula y se suele representar con
el símbolo "Ho". A fm de saber cuando se rechaza una hipótesis nula, también se debe fonnular una
hipótesis alternativa representada por esta es la hipótesis que se acepta cuando se puede rechazar la
hipótesis nula.
a
a La Ho. o hipótesis por contrastrar, generalmente es una aseveración en el sentido de que el parámetro de
'a una población, tiene un valor específico. La Ha. generalmente específica que el parámetro poblacional
tiene un valor diferente, de alguna manera al establecido en la Ho.

.e __ 1. Las hipótesis nulas se fonnulan' examinando el o aseveración


>; buscada, planteándose primero dos afirmaciones opuestas.
2. La prueba de hipótesis no pone' en tela de juicio el valor calculado del
. estadístico muestral, sino emite un juicio sobre la diferencia existente entre
él y un supuesto parámetro poblacional.
3. !-a hipótesis nula nunca se prueba, se acepta o se rechaza.
le
·n Supóngase que se desea probar la hipótesis nula Ho., de que la media de la población es igual a 200. Se
puede representar así:
Ho: = 200

Contra esa hipótesis nula, se pueden considerar tres posibles hipótesis alternativas, así por ejemplo:
Ha: 200
Ha:JI<200
Ha:JI>200
s;
Ejemplo:

Una compañía fabrica arandelas con un espesor de 1.0 mm. Se sospecha que el proceso no mantiene su
10 promedio previsto. Si la compañía desea modificar su proceso: a) el espesor promedio es menor de 1.0
el mm. ¿Qué Ho y;Ha deberá usar?; b) El espesor promedio es diferente de 1.0 mm. ¿Qué Ho y Ha deberá
e usar?

Solución:
ía
ie a) Ho : =1.0 mm
la Ha : < 1.0 mm La palabra "menor que" sugiere el símbolo" < "

b)Ho : =1.0 mm
Ha : 1.0 mm La palabra "diferente" sugiere el símbolo" "

__ 1. A partir de este momento en el procedimiento de Prueba de Hipótesis se


trabajará con el supuesto de que la Ho es ajinnación correcta. Este caso puede
ser comparado con un juicio legal donde se supone que el acusado es inocente
'al en tanto no se presente evidencia para demostrar lo contrario.
os 2. Al concluir la Pmeba de Hipótesis, se.tomará una de las dos decisiones: Se
estará de acuerdo con Ho y se dirá: "no se puede rechazar Bo". (Esto
corresponde en el juicio, a "no condenar al acusado") o bien se decidirá en
contra de la Ho y se dirá: "se rechaza Bo" (esto corresponde a "condenar al
acusado")..

.
. . •.i¡'ij.'M. •,ii.i.iiJj'

Se presentan a continuación, los posibles casos relacionados con la veracidad de la Ho y lo correcto de la

decisión que se tome. Puede llegarse a 4 resultados posibles como consecuencia de Ho sea "verdadera" o

"falsa" y que la decisión sea "no rechazar" o bien "rechazar". Así:

AceptarHo. Rechazar Ho.

Si la hipótesis Nula Ho es verdadera.y se acepta, o es fal§a y se rechaza, la decisión que se tome en un caso

u otro es correcta; si es verdadera y se rechaza, o si es falsa y se acepta, la decisión que se tome en uno u

otro caso es equivocada.

El error de rechazar cuando es verdadera se denomina de tipo 1 y la probabilidad de cometerlo se


representa por medio de la letra griega a. El error de aceptar Ho cuando es falsa'se «onoce como el de
tipo II y la probabilidad de cometerlo se denota por medio de la letra griega

En la prueba de hipótesis se emplea lo que se denomina nivel de significancia °


de significación
especificado por la letra a, que no es más que la probabilidad de cometer el Error de Tipo 1, e indica el
porcentaje de medias muestrales que se .encuentran fuera de ciertos límites. Por lo general estos niveles son
10%,5%, 1%. Las siguientes figuras ilustran como interpretar un nivel de significancia del 5%. Adviértase
que 2.5% del área bajo la curva está situado en cada extremo.

l
Regi6n donde no existe I I Aceptar la hip6tesis nula si el I
I estad{stico muestral cae en
diferencia significativa entre : I
I el estad{sticode la muestra y I I esta regi6n (no rechazar Ho) 2.
I el supuesto parámetro de la I 1
I
: poblaci6n : I

I I
I
0.025 I I 0.025 : 0.025
I I
del área I I I del área área: I del área
I I I I
I I I
I 0.95 del área J I 0.95·del área
I I I I I

... -l.96qi +l.96qi z ~ ... +l.96al . z


d - .,:; la . la"
n estas os regiones existe una ec ar Ip tesIs nu SI e
diferencia significativa entre el de la muestra cae en
estad{stico de la muestra y el de estas dos regiones
supuesto parámetro de la I
L-

••


·""flii·¡,g·i1'U·fi.d\jIJ.ldJi.. .:

la
= 1. Es posible probar las hipótesis en cualquier nivel de significancia.
o ~ 2. Cuanto más alto es el nivel de significancia empleado al probar una
lúpótesis, mayores son las probabilidades de rechazar una lúpótesis que sea
verdadera.

u 1. Una prueba de hipótesis de dos extremos o colas rechazará la lúpótesis nula si la media muestra! es
significativamente más alta o más baja que la supuesta media de la población. Este tipo de pruebas es
apropiado cuando: .
¡e
le
Si la media de la muestra cae i
en esta regi6n, aceptaremos I
Ho: = donde: =Supuesto valor de la la hip6tesis nula I
Ha: media poblacional I
I
I
el I
I
I
¡e I
Prueba de lúpótesis de
dos extremos, que
muestra las dos regiones Rechazaremos la hip6tesis nula
si la media de la muestra cae en
de rechazo. una de estas dos regiones.

2. Una prueba de hipótesis de extremo o cola izquierda rechazará la lúp6tesis nula si la media muestral
cae significativamente por debajo de ·la supuesta media de la población. Este tipo de pruebas es
apropiado cuando:

I Si la de la muestra cae ....


I en esta regi6n, aceptaremos

Ho: = hip6tesis nula


Ha: < I
I I

Prueba de extremo izquierdo'


(una prueba de extremo
Si media de I
inierior) con Ja región de I
~ muestra cae en I
rechazo en la izquierda regi6n, rechazaremos I
Oado inferior) la hi 6tesis nula

Horacio Reyes Núñez• •


. .
~ •.•,ii.i.iuj'

3. Una de de extremo o derecha rechazará la hipótesis nula si la media muestral cae


.significativamente por encima de la supuesta media de la población. Esté tipo de pruebas es apropiado
cuando:· .
I Si la media de la ~
I muestra cae en esta
Ha: I regi6n,
: la hip6tesis nula
Ha: >
I
I

Prueba de extremo JlHo I


derecho (extremo la hip6tesis:
.... nula si la media de· la
superior) muestra cae en esta regi6n.

En la prueba de hipótesis es apropiado seguir en forma sistemática los siguientes seis (6) pasos:

Paso 1. Formular una hipótesis nula Ha simple y una hipótesis alternativa Ha apropiada
Paso 2. Especificar el nivel de significancia a. Decidir la distribución a usar (t ó y encontrar los
valores críticos para a. - .
Paso 3. Establecer un criterio de demostración que incluya la estadística de prueba.la(s) regíón(es) de
rechazo y aceptación. y los valores críticos, auxiliado de una gráfica de la distribución, a
utilizar
Paso 4. Realizar los con los datos del problema y la estadística de prueba.

Paso 5. Tomar la decisión sobre si se acepta o se rechaza el resultádo de los pasos 3 y 4.

Paso 6. Establecer la conclusión

de

Ejemplo 1.

Se ha asegUrado que el peso medio de los alumnos de una universidad es de 54.4 kg. Unos profesores
no creen que tal ·aseveración sea correcta. COIi el fm de comprobar la afirmación. reúnen una muestra
aleatoria de 100 pesos registrados de los estudiantes. De ello resulta una media muestral de 53.75 kg.
En el nivel de significancia (a) del 5% y con una desviación estándar de 5.4 kg. ¿es esta evidencia
suficiente para rechazar Ha?

Solución:

* Paso 1. Hipótesis: Ha : 54.4 kg. _Formulando la Ha y la Ha apropiadas


Ha : 54.4 kg.

.* Paso 2. Nivel de significancio: 5% 0.05


Es una prueba de 2 colas, por la

1
al2 =0.025/
\ /
I

¡ \. L
al2 = 0.025 1 relación La región crítica está
dividida en dos partes iguales, una a
cada extremo. Ver de la
Se

L_______________ ·zl izquierda.

n• •. !H'oo~r 0--. 'ñ---e--z



mi ","'.•.•.• """_."'''''¡' ~. .
cae Paso 3. Criterio de demostración ... Si = 5% entonces = 95%
a=O.05 = 0.9500. (0.9500)/2 = 0.4750
r-----·-- luego ZaJ2 = 1.96 obtenido de la
aJ2=O.025 I Tabla z. Se convierte en 1.96 a la
I
! I derecha y Y a la izquierda.
Ver figura. Los valores críticos de
ó 1.96 z -. ZaJ2 representados por son ±1.96.

Luego, el criterio de demostracion se establece oo. = Valor crítico calculado de Za/2


así: Ha si > 1.96 ó < -1.96

Paso 4.

n =100; =53.75; =5.4; =5%; =54.4 oo. Usar la estadística de prueba z


porque la n 30 Y se conoce
z= 53.75 -54.4 -0.65 --120
5.4 0.54 - .
100i

_e
=-1.20 Oo, El z calculado localizado en la
a
fig. del paso 3., cae dentro de la
i zona de aceptación. Ver fig. de la
I izquierda.
II
r
r

1>-.
I -1.96 u 1.96 zI
Z* = -1.20 _

Paso 5. Decisión: no puede rechazarse Ho .oo Porque el cae dentro de la zona


de aceptación.

res Paso 6.
:tra Conclusi6n: En el nivel de significancia
kg. del 5%, probablemente el
cia peso medio de los alumnos
de esa universidad, es de
54.4 kg.

Ejemplo 2.
las
Se hizo la pregunta en la UPN: ¿Qué distancia promedio en un solo sentido, debe recorrer el estudiante
promedio para llegar la universidad?· Se respondió: "No más de 9.0 Km" Para comprobar esta
hipótesis se tomó una muestra aleatoria de 50 estudiantes y se calculó una distancia media de 10.22
la Km. Probar la hipótesis al nivel de significancia 5% utilizando = 5 Km.
stá
aa Solución:
la
Como n 30 Yse conoce la desviación estándar de la población a, entonces se utiliza la Distribución z .

0.­

Horacio Reyes Núñeiz'lII


~ •.•,ii.i.i4i'
. .
* Paso 1. Hipótesis: Ho : = 9.0 km ... Formulando la Ho y la Ha
Ha: >9.0 km apropiadas.
* Paso 2. Nivel de significancÚJ: = 5% = 0.05 ... Es una prueba de una cola o
extremo derecho por la' relación >
I _ ,Másdc9.0Km
Nomásdc9.0Km , La relación crítica o zona de
r. \,
I

I
rechazo está a la derecha de la
media muestral. Ver figura de la
izquierda.
.
= 0.05 entonces 0.5000 - 0.05 =

ó z(0.05) - 1.65 z I 0.4500 luego za 1.65 en Tabla z.


¿Porqué no se usa ?
* Paso 3. Criterio de demostración ... El valor crítico en la Tabla z
corresponde a 1.65 y se ubica en el
extremo derecho de la curva
normal. Ver figura del paso 4.
Luego el criterio de demostración se establece

así: Ho si z* > 1.65

* Paso 4. Cálculos ... Usar la estadística de prueba z. ¿Por


qué? los datos del problema
n = 50; = 10.22; = 9.0; =5
calcular z* que corresponde al z
calculado.
z= = 10.22 - 9.0 _ 1.22 - 1 73
5 - 0.707 - .
. '

z* = -1.73 ... El valor de z* cae dentro de zona de


rechazo. Ver figura de la izquierda.

. a=0.051

1.65
zO=I.73J

* Paso 5. Decisión: rechaziu Ho. ... Porque el valor calculado de z


(z*=1.73) cae dentro de la zona de
rechazo. Ver figura del paso 4.
* Paso 6.
Conclusión: Al nivel de significancia

del se concluye que

probablemente el estudiante

promedio recorre más de

9.0 km para llegar a la


universidad.
Ejemplo 3.

Una oficina de investigación de contaminación ambiental afirma que: "El nivel medio de mon6xido de
carbono "no es mayor que 4.9". ¿Constituye suficiente evidencia una muestra de 25lecturilS (resultados
muestrales = =
5.1; s 2.1) para rechazar esta afmnación?Utilizar 5%. =


• •:!H!-o-o-r-a-c ¡

'a'II''W

Soluci6n:

o Como n < 30 entonces se utilizará la Distribución t con gl. Tabla t


1>
de
la
* Paso 1. Hipótesis: Ho : = 4.9 ... ¿Qué se hizo?
la
Ha: >4.9.
1=
* Paso 2. Nivel de signijü:ancia: =5% =0.05 .... Se utiliza Tabla t con = 0.05 Y
con grados de libertad (25 -1)
. z.
---.:=-==..:::....:>.=--.:-=-----_I'
No mayor que 4.9 ~ Mayor que 4.9 gl =24. Es una prueba de una cola
..
o extremo 'por la relaci6n >.
z i
I La región crítica zona de
el a=O.OS
rechazo está a lá derecha de la
'va 'media Ver figura de la izquierda
t t
1(24, 0.05) - 1.71 I

* Paso 3. Criterio de demostración ... Cómo de un solo extremo o


'or cola entonces t = 1.71 en la Tabla t
Luego el criterio de demostración se establece
na .(t* = t calculada)
así: Ho si t* > 1.71
z
* Paso 4. Cálculos ... En este caso se utiliza el
estadístico t porque n < 30 y se
n= 25; 5.1; s = 2.1; =4.9
desconoce la desviación estándar
de la población. Sustituyendo y
de
t=
s
= 5.1 - 4.9 = = 0.20 =O O48 operando, para determinar el t*
l. 2.1 2.1 0.42' .
Ver figura de abajo.

t* =0.48

z
de

* Paso 5. Decisión: no puede rechazarse Ho ... Porque t* esta en la zona de


aceptación. Ver la figura de arriba.

* Paso 6.
Conclusión: No se tiene suficiente
evidencia en el nivel de
significancia del 5%, para
:le rechazar la aseveración de
os que el nivel medio de
mon6xido de carbono, es
no mayor de 4.9.

• un o • .. o.· .
Horado Reyes úñe4-,

_ _ _ • • _ _ , __ ~ ~o __ •
~
. . • .i¡'ij.'M ,ii.i.iiij'

"'?-..;. ,.,....., __

... ro····· o 29

1. .....
b) ¿Qué error puede cometerse en la decisión si falsa?

c) Si se toma la decisión de "rechazar Ho" ¿Qué error puede cometerse?

d) Si se toma la decisión de "no rechazar Ho" ¿Qué error puede cometerse?

2. Para los siguientes casos especificar que distribución de probabilidad se empleará en una prueba de
hipótesis:
1
a) Ho : = 19.5 Ha: 19.5 =23.2 a=5 n=36
b) Ho: = 536 Ha: < 536 s=42 n= 26
c) Ho : = 307 Ha: > 307 a=63 n= 19
d) Ho: = 38 Ha: 38 . s=3.6 n=42 1
e) Ho : = 1297 Ha: > 1297 x = 1325 s = 163 n= 13

3. ¿Qué decisión debe tomarse si la estadística de prueba:

a) cae en la región de rechazo? b) no cae en la región de rechazo?

4. Una empresa industrial supone que la vida de su prensa rotativa más grande es 14550 horas con una
desviación estándar de 2100 horas. De una muestra de 25 prensas con una media de 13000 horas, en un
nivel de significancia del 1%, ¿debe la empresa concluir que la vida media de las prensas es menor que
las horas propuestas?

5. El gerente de una empresa de servicio de paquetería tiene la impresión de que el peso de los envíos que
ha manejado es inferior al que tenía en el pasado. Los registros pasados tuvieron una media de 36.7
. libras con una desviación estándar de 14.2 libras. Una muestra aleatoria de 64 paquetes manejados el
mes anterior indica un peso promedio de 32.1 libras. ¿Es esta evidencia suficiente en un nivel de
significancia del 2%, para rechazar la hipótesis nula a favor de la impresión del gerente?
Pa
6. Un fabricante de lámparas fluorescentes utilizadas por un gran complejo industrial asegura que tienen cUJ

una vida útil de por lo menos de 1600 horas. Se identifica aleatoriamente una muestra de 100 lámparas. obl
¿Respalda una media muestra! de 1562.3 horas con una desviación estándar de 150 horas, el parecer del el,
jefe del departamento en el sentido de que la duración efectiva de las lámparas es menor de 1600 horas
en el nivel de significancia de15%? .

7. El puntaje medio obtenido en una prueba de autoestimaciónpor quienes reciben ayuda del gobierno es
igual a 65, con una desviación estándar de 5. La prueba se aplica a 52 beneficiarios de dicha ayuda en
una muestra aleatoria reunida en cierto distrito. Estas personas alcanzaron un puntaje medio igual a 60.
¿Difiere de la media puntaje del distrito relativo a esa variable, en un nivel de significancia del 0.01?
La
8. Una tienda de implementos deportivos ha iniciado una promoción especial para su pelota de fútbol y
pro
piensa que la promoción deberá culminar con un cambio de precio. Antes de comenzar la promoción, el
promedio al menudeo de las pelotas era de L. 41.95 con una desviación estándar de L. 5.36. La tienda
muestrea a 16 de sus detallistas una vez comenzada la promoción y descubre que el promedio de la disl
·venta de las pelotas es de L. 38.95. En un nivel de significancia del 1% ¿tiene motivos para pensar que sol<
el precio al menudeo ha disminuido? z<
I .'...",e,i,.·j"')·"·."'·'·"I" ~. .­
9. La comisión promedio que cobran las empresas en la venta de acciones comunes es de L. 144.00 con
una desviación estándar de L. 52.00, Un corredor ha extraído aleatoriamente una muestra de 121
transacciones y determinó que pagaron una comisión promedio de L. 151.00. En un nivel de
significancia del 10%, ¿se puede afirmár que las comisiones de su cliente son superiores al promedio de
la industria? .

10. En un experimento con un nuevo tranquilizante, se determinó el pulso cardíaco de 12 pacientes antes de
administrarle el tranquilizante y una vez más cinco minutos después se descubrió que su pulso se redujo
en promedio 7.2 pulsaciones con una desviación estándar de 1.8. En el nivel de significancia del 5%,
¿se puede concluir que en promedio este tranquilizante reducirá el pulso cardíaco en un paciente en
menos de 9.0 pulsaciones?
le
11. Un fabricante garantiza que cierto rodamiento tiene un diámetro exterior medio de 0.75 pulgadas con
una desviación estándar de 0.003. Si una muestra tomada al azar de 10 de estos rodamientos tienen un
diámetro exterior medio de 0.7510. ¿Se puede rechazar la garantía que dá el fabricante con respecto al
diámetro exterior medio con el nivel de significancia del 1%?

12. Una muestra elegida al azar de 12 muchachas graduadas de una escuela secretarial, promedian 72.6
palabras por minuto con una desviación estándar de 4.2 palabras por minuto. Utilizar el nivel de
significancia del 5% para demostrar la afirmación de un empleador de que las graduadas de la escuela
promedian menos de 75.0 palabras por minuto.

13. Una máquina vendedora de refrescos está programada para servir 6.0 onzas por vaso. Si la máquina se
examina 9 veces, produciendo un llenado medio del vaso de 6.2 onzas con una desviación estándar de
la 0.15 onzas ¿es evidencia en el nivel de significancia del 5% que la máquina está llenando los vasos más
de lo debido?
le

ue
,.7
el
de
Para n 30, las pruebas de hipótesis concernientes a proporciones suelen basarse en la aproximación de la
curva norrnal a la distribución binomial. Mediante el uso de la misma estadística que se empleó para
en
1S.
obtener el intervalo de confianza de muestra grande de p, se basan las demostraciones de la Ho de p = Po en
lel el valor que se obtiene de la fórmula (13) que tiene aproximadamente la distribución norrnal estándar.
:as
(13)

es
en

?
La, expresión (13) anterior, es la estadística que se utilizará en las pruebas de hipótesis concernientes a
IY proporción de muestra grande.
, el Los criterios de demostración y se sustituyeron por p y Po Y corresponden a los mismos que la
Ida distribución z. Para la Ha de un solo extremo o cola p < Po se rechaza la Ho si z < -Za. Para la Ha de un
la
solo extremo o cola p > Po, se rechaza Ho si z > Za y para la Ha en la que p Po' se rechaza la Ho si
lue
z < -Za/2 Ó z > Za/2'

#

. . • .iEii·E'·.,"·i.ii'"

Ejemplo 1.

Un nutricionista afirma que cuando menos el 75% de los niños de pre--escolar de ciertos país, tienen
dietas deficientes en proteínaS y que en un estudio de muestra revela que esto es cierto de 206 niños de
pre--escolar en una muestra de 300. Probar la hipótesis en el nivel de significancia del 5%.
Solución:

* Paso 1. Hipótesis: Ho : p = 0.75 ...Formulando las hipótesis.


Ha: p <0.75 correspondientes.
* Paso 2. Nivel de significancia: = 5% = 0.05 .. Es una prueba de un
extremo izquierdo. Se
utiliza la Tabla z. Si =
0.05 entonces:
= 0.5000 - 0.05 = 0.450
luego = -1.65 por que
-1.65 o z
esta a la izquierda de la
-2.53. _._.
media. ¿Por qué no se
usa
* Paso 3. Criterio de demostración
Rechazar Ho si < -1.65 ... ¿Cómo se estableció este
* Paso 4. criterio?

n = 300; x = 206; P = Po = 75% = 0.75

z= = 206 - 300(0.75) = 206 - 225 = -19 = -2.53 oo. Usando la estadística z de


x - npo
V3OO(0.75) 56.25 o 7.5 la fórmula (13).

Sustituyendo valores y

z * =-2.53 operando para calcular z*

* Paso 5. Decisión: rechazar Ho ... ¿Por qué? Ver figura del


paso 2.
* Paso 6.
Conclusión: Probablemente en el nivel

de significancia del 5%, al

menos el 75% de los niños


1.
de' pre-escolar, tienen

dietas deficientes en

Ejemplo 2. proteínas.
2.
En una muestra tomada al azar de 400 accidentes automovilísticos, se descubrió que 128 de ellos se
debieron en parte a fatiga del conductor. Utilizar el nivel de significancia del 1% para probar si esto
soporta la afirmación de que el 35% de tales accidentes se deben en parte a fatiga del conductor.
3.
Solución:
* Paso 1. Hipótesis: Ho : p = 0.35 ... ¿Qué se hizo? ¿Por qué?
• Ha: p
4.
* Paso 2. Nivel de signijicancia: =1% =0.01 ... ¿Qué tipo de prueba es?
¿Por qué?


• •Ho ra e
I

* Paso 3. Criterio de demostración


"1"fI'C····'·II".,•. dljlJ.ii¡Ii.
-
..
... ¿Cómo se estableció este criterio?
Rechazar Ro si < -2.58 ó z* > 2.58 Ver figura de la izquierda

s
* Paso 4. Cálculos
n
n =400; x = 128; P =Po =35% =0.35 ... Datos del problema
e
= z= x - npo 128 :....140 ... Usando la estadística z, cuando
V4OO(0.35) n = 400, x = 128, Po = 0.35 para
o calcular el valor de z*
e -12
a
=9.5393 =-1.26
e z* =-1.26
* Paso 5. Decisión: no se puede rechazar Ho. ...Explicar la razón. Ver figura del
paso 3.
:e * Paso 6.
Conclusi6n: No se tiene suficiente evidencia
estadística en el nivel de
significancia del 1%, para rechazar
la aseveración de que el 35% de
le los accidentes automovilísticos se
). deben a la fatiga del conductor.
y
.*

'~em~f;mJif'~O
el

1. al azar, afirman que realizarán práctica privada


después de graduarse. ¿Apoya esto la afirmaeióit·de que cuando menos el 70% de los estudiantes de
medicina realizarán práctica privada poco después ·de graduarse? Utilizar el nivel de significancia del
5%

2. Un crítico de TV asevera de que cuando menos el 80% de los televidentes encuentran inconveniente el
se nivel de ruido de cierto comercial. Si 9 de 35 personas objetan el ruido de este comercial, ¿qué se puede
oto concluir de esta afirmación en el nivel de significancia deI5%?

3. Un fabricante de un removedor de manchas afirma que su producto elimina cuando menos el 90% de
ellas. Si en una muestra aleatoria el removedor de manchas elimina solo lO de 44 manchas, demostrar
esta aftrmación en el nivel del 1%.

4. En un esfudio de aviofobia, un psicólogo afirma que el 30% de todas las mujeres temen a volar en
avión. Si 54 de 200 mujeres de una muestra aleatoria afirman que temen volar en avión, ¿refuta esto la
afirmación del psicólogo? Utilizar un nivel de significancia de12%
'
. .' •. i¡'n.•.•,F'.i.ii4j¡
5. Una línea aérea afirma que solo el 6% de todo el equipaje que se extravía, nunca se recupera. Si 37 de
200 unidades de equipaje perdido no se encuentran, demostrar la Ho : p =0.06 contra la Ha : p > 0.06 en
el nivel de significancia del 5%.

6. Para verificar la afirmación de un servicio de ambulancias que cuando menos la mitad de las llamadas
que reciben son urgentes de vida o muerte, se tomó una muestra aleatoria de sus archivos yse descubrió
que solo 63 de 150 llamadas fueron urgencias de vida o muerte. Demostrar la Ho : p =0.50 contra la Ha
adecuada en el nivel de signiflcancia del 5%.

7. En una muestra aleatoria de 500 automóviles que viran a la izquierda en cierta intersección, 169 se
metieron al carril equivocado. Probar la Ho de que la producción real de conductores que cometen este
error (en el cruce dado) es de 0.30 contra la Ha de que este número es demasiado bajo. Utilizar un nivel
de significancia del 1%.

8. Se ha observado que el 30% de todas las familias que salen del campo se van a la ciudad. Si en una
muestra tomada al azar de los registros de varias compañías de mudanzas grandes, se descubrió que las
pertenencias de 104 de 400 familias que salen del campo se enviaron a la ciudad.
Demostrar la Ho : p =0.30 contra la Ha : p < 0.30 en el nivel de significancia del 5%.

Ji T
Los estadísticos en muchos casos necesitan saber, si la diferencia que observan entre varias proporciones
muestrales son singillcativas o si solo se deben a la casualidad. Supongamos que el director de la campaña
de un candidato presidencial estudia 3 regiones geográficamente diferentes y descubre que el 35%, 42% Y
51 % de los votantes entrevistados en ellas, respectivamente reconocen el nombre del candidato. Si la
diferencia es significativa, ( es decir, si el director de la campaña llega a la conclusión de que la diferencia
se debe exclusivamente al azar), tal vez decida que el lugar escogido para pronunciar determinado discurso
sobre la plataforma del candidato, no influirá en la acogida por parte del público. Así pues, para realizar con
éxito la campaña, el director necesitará conocer si el lugar y la aceptación son dependientes o
independientes entre sí. La
ma

T
Es una disposición de datos en una tabla o cuadro de doble entrada. Los datos se ordenan en casillas o
celdas y reporta el número de datos ofrecuencia obsenada (fo) ofrecuencia real en cada casilla.
En la tabla de contingencia están indicadas dos factores o variables y la pregunta común en relación con
tales tablas, es si los datos indican que las dos variables son dependientes o independientes.

El siguiente ejemplo muestra una tabla de contingencia considerando la clasmcación por sexo, de los
estudiantes de una escuela y su área académica favorita, en la que se resume la preferencia de 300
estudiantes entrevistados acerca del área de su predilección:

El
Ob
X2,•
fón
Esta tabla contiene:

** Dos Renglones (R) y tres Columnas (C)


** Los dos (2) renglones o filas ofrecen una base de clasmcación (Masculino y Femenino) y las tres(3)
columnas otra base de clasmcación (Matemática, C. Humanidades)
** Es una tabla de contingencia de 2 x 3 (2 filas x 3 columnas) o de dim (2 x 3)
__
•• R-eyes-Núñez
I .""Fil'.I,.·j"o·,.·."·,·¡",,,. .
e .. '

11

s
Ó
a
donde: fe = Frecuencia.esperada
(14) TR = Total de renglones al que
e pertenece la fe. deseada.
e Te = Totalde columnas a la
pertenece la .deseada.
n=
.a
4. Las frecuencias esperadas (fe), se refieren a los términos de la hipótesis nula
LS
de acuerdo con lo cual se espera que la frecuencia relativa (proporción) sea
l.
la misma de un grupo a otro.
En contraste, las frecuencias observadas (fo) se refierenalos resultados que
se obtienen realmente al realizar un estudio, y por lo tanto pueden variar o
no de wi grupo a otro. .
5. Los grados (gl) de una tabla de contingencia de dimensión (RxC)
se calculan con la fórmula (15).
ía
donde: R = Renglón o Fila
y
la
ia
so
(15) e = columna
gl = Grados de Libertad

)n

o La tabla de contingencia anterior, para efectos de cálculos numéricos, se puede escribir de la siguiente .
manera, en la cual ya se han calculado las frecuencias esp!?radas con la fórmula (14). .

- 122x72 _ 29 28
le: 300 - .
_122x1l3 -4'595
o le: 300 -, .
122x115- 46 77'
on e: 300 - . .
178x72 '.
fe: 300 =42.72
.os 178x1l3 - 67 05
e: 300 - .
00

gl = (2-1)(3-1)
• . .
El Ji (X2): Si se desea ir más allá de las meras intuiciones respecto a las frecuencias
Observadas o reales (fo) y esperadas o W6ricas (fe), se emplea el ji representado por
X2 ; este se usa para hacer comparaciones entre dos o más muestras. Este estadístico se calcula con la
fórmula (16) siguiente: .

· . •.•. .• .•. . .••.••.••••.


··••· t e
. •.•. . · _ · ·. .
.'
(16)

Horado
'. . •.
La distribución Ji se utiliza para hacer las pruebas de hipótesis que involucran tablas de

contingencia que sirven para comparar casos experimentales con resultados esperados a fin de determinar:

l. Preferencias
2. Independencia
3. Homogeneidad
La información que se usará en esta técnica será colocada en categorías y contada. Si la hipótesis nula

es verdadera, entonces la distribución muestral del estadístico Ji Cuadrada, puede ser aproximada por

una curva continua denominada Ji Igual que en el de la distribución t, hay una

distribución Ji cuadrada diferente para cada número de grados de libertad. La figura siguiente muestra 3

distintas distribuciones Ji cuadrada que corresponden a 1, 5 y 10 gl. Tratándose de números muy

pequeños de grados de libertad, esta distribución muestra un fuerte sesgo hacia la derecha. Conforme

crece el número de grados de libertad, la curva se toma rápidamente mas simétrica hasta que el número

alcanza valores altos, punto en el cual la distribución puede ser aproximada por la normal.

Distribución de 1
grado de libertad

Distribución de S
grados de libertad
s
Distribución de 10
_____ grados de libertad

Distribuciones ,de Ji

cuadrada de 1,5 Y 10

grados de libertad . __
O 2 4 6 8 10 12 14

La distribución Ji cuadrada,es una distribución de probabilidad; por tanto, el área total bajo la curva en

dicha distribución, es 1.0. a semejanza de la distribución t, son posibles tantas distribuciones Ji cuadradas

diferentes que no resulta práctico construir una tabla que contenga las áreas bajo la curva para todos los

valores posibles \lel área. La Tabla N°4 del final del libro, muestra solo las áreas en el extremo que más se

emplean en las pruebas de hipótesis en las cuales se utiliza la distribución Ji cuadrada.

__ 1. Para no hacer inferencias incorrectas a partir de las pruebas Ji cuadrada de la


hipótesis, se seguirá la regla general de que la frecuencia esperada (fe) de
menos de 5 en una casilla de una tabla de contingencia, es demasiado
pequeña para usarla. .
2. El valor de Ji cuadrada nunca puede ser negativo porque las diferencias entre
fo y fe siempre están elevadas al cuadrado.
3. El siguiente gráfico corresponde a una prueba de hipótesis Ji cuadrada en el
nivel de significancia del 10% y muestra la región o zona de aceptación y el
2
valor muestral de Ji cuadrada =2.764) con 3 grados de libertad (3 gl).
4. La curva Ji cuadrada no es simétrica respecto a la media; es asimétrica hacia
la derecha.

Región de aceptación Distribución Ji cuadrada


1 de 3 grados de libertad

I Valor Ji
I cuadrada de 2.764

0.10 del


2.764
.' . .
.
.

de Ejemplo l.
ti""fiil·".·II'IJ·'··d,",i.IA'K..

Un sociólogo desea determinar si existe una relación entre la inteligencia de muchachos que se han
sometido a un programa de capacitación especial en el'trabajo y su desempeño subsiguiente en' sus
empleos. Una muestra de 400 casos tomados de archivos muy grandes, produjo la información de la
tabla. de abajo. Utilizar el nivel de significancia del 1% para demostrar hipótesis nula de que la
lor inteligencia y el desempeño en el trabajo son independientes en relación con muchachos que se han
na sometido al programa especial de capacitación.

uy
ne
:ro

'
Solución:

Paso 1. Hipótesis: Ho : La inteligencia yel desempeño en


.. el trabajo son independientes.
Ha : La inteligencia y el desempeÍío en
el trabajo no son independientes..
Paso 2. Nivel de significancio: = 1% = 0,01 .
en Paso 3. Criterio de demostración:
Rechazar Ho si * >13.3 2
... Valór para (3-.1) (3-1)=4 gl
los . ver la Tabla de X.2.
se '2
... X *

la
de
ido

ltre

1 el Paso 4. Cálculos:
{ el

lcia
1

.., .
X~*
.. ... .•.••I m.
fe 19 = 46.4 fe: = 63.6 fe: = 46.0 .oo Estructurando el cuadro de
cálculos. Calculando fe con la
fe: =51.8 fe: = 70.9 fe: = 51.3 fórmula (14) y escribiendo la
columna (2). Calculando la
fe: =20.8 fe: = 28.5 fe: = 20.8 columna (3) y (4). Sumando la
columna (5) para calcular
=40.89 ... Valor calculado de Ji Cuadrada

Paso 5. Decisi6n: rechazar Ho porque > ... Ver figura del paso 3
es decir 40.89 > 13.3
Paso 6.
Conclusi6n: Existe una relación entre el
coeficiente intelectual y el
desempeño en el trabajo.
Ejemplo 2.

Cada persona de un grupo de 300 estudiantes fue identificado como hombres o como mujer,
preguntándosele si preferería recibir cursos de matemática 00, Ciencias Sociales (CS) o Humlmidades
(H). La tabla de contingencia de abajo muestra las frecuencias para cada categoría:

¿Presenta esta tabla con el nivel de significancia del 5%, la suficiente evidencia para rechazar la

hipótesis nula de que la preferencia por las matemáticas, ciencias sociales o humanidades, es

independiente del sexo del alumno?

Solución:

Paso 1. Hipótesis: Ho : La preferencia por el área de estudio oo. ¿Qué se hizo? ¿Qué tipo de 2.
es independiente del sexo. tabla es? ¿De cuántos gl?
Ha : La preferencia por el área de 'estudio
no es independiente del sexo.
Paso 2. Nivel de = 5% = 0.05

Paso 3. Criterio de demostraci6n: ... Explicar como se formuló este

Rechazar Ho si > 6.00 criterio. Ver gráfica

o
~
i ..
6.00
.
2
ti""i·i'.',.,¡"ij.¡W·d"n·"iJ . .
Paso 4. Cálculos:

4.604 ~ 4.60

... Explicar como se obtUvo la columna (2)


de fe. ¿Qué representa la sumatoria de la
columna (5)?
2• =4.604 = 4.60 ... Valor calculado de X2
Paso 5. Decisión: No se puede rechazar Ho. ... ¿Por qlié?
Paso 6.
La evidencia no permite rechazar

la idea de independencia entre el

área de estudio preferida y el

sexo del alumno.

1. Si se conocen las de contingencia, ¿cuántos gl tendrá el estadístico


Ji cuadrada para cada una? ;.;.;.;.

a) 2 R Y 3 C; b)7Ry3C; c)4Ry 5C; d) 2 Ry4C

2. A un gerente de marca le preocupa que la participación de ésta, no se encuentre distribuida


uniformemente en el país. En un estudio en que el país fue dividido en 4 zonas geográficas, se
entrevistó una muestra aleatoria de 100 consumidores en cada zona, consiguiéndose los siguientes
resultados:

N o compra marca 40
Compra marca . 60

a) Elaborar una tabla con las frecuencias observadas y esperadas. b) Calcular el valor muestral para X2 .
c) Formular la Ho y la Ha. d) Si se utiliza un nivel de significación del 5%, ¿debe rechazarse la Ho?

_--_. té /·:W#r·1td
• .¡ 11 .....

3. Para averiguar si las pastillas de siliciQ independiéntes del punto donde se lialla'eicicloecon6nrlco .
de un país, se recabaron datos, íos'que s"epresentiri a cóntinuación: . .'.
. ... :

En aumento

. En . 5.

total
a) Elabor¡rr unll y esperadas; la Ho yla Ha; catclilar el valor
. muestral para b) ¿Cuál será su conch.isióJi en un nivel de significancia del 1O%?'
'.- ".'

4. Un financiero quiere conocer las diferencias en la estructura de capital de varios tamafios de empresas
en cierta industria. Para ello hace u'na encuesta en un grupo de fmuas que cantidades de
activos y las divide en 3 grupos. Clasifica cada una según que su deuda sea mayor que el capital
con14ble de los accionistas que su "deuda"íotaI sea A contihuación se resumen estos:datOs: .
. '. ..' .. ; . .

Deuda menor que capital social 7 ' .

Deuda mayor que capi!a.l .


Usar el nivel de significancia si tienen idéntica estructura de
5. El editor de un identificar con precisión las características desú 'Iriercadó se
pregunta si el número de lectores la comunidad guarda relaci6ncoÍl la escolaridad de ellos. A
continuación los datos dé la investigadón réalizada los adultos que vivían eIÍla zona: '.
. " .
educacional ."

defectos

¿Existe la hipótesis de que es


independiente del día de la semana que se fabrican? Usar un nivefde significancia del 0;05...
..'
•• -Núni!~

_
... . . .. """"' _---­
.i'''f·'··i'.''''ij.,'.• -
. .

7. Una psicóloga está investigando como reacciona una persona en cierta situación. Cree que la reacción
puede estar influida por el grado de sentido ético que impera en el entorno de la persona. Los datos
constituyen la información que reunió sobre 500 personas:

Entorno Reacci6n

En un nivel de significancia del 5% ¿parece existir una relación entre el entorno y la reacción?

8. 400 individuos fueron clasificados poüticamente como Conservador; Moderado y Liberal. Además,
cada uno se clasifica por edad, como se indica a continuación:

Comprobar en un nivel de signficancia del 1%, si la preferencia política es independiente de la edad.

9. A [m de determinar si existe relación entre el tipo de sangre y la severidad de los resfriados en invierno,
se realizó un estudio y se obtuvieron los siguientes resultados:

Con el nivel de significación de 0.05, ¿existe relación?

10. Se enviaron muestras tomadas al azar de papas cultivadas en varios lugares a un comerciante, que las
examinó para determinar su calidad. Los resultados son los siguientes (libras de papas):

1 Lugares de

Probar con el nivel de significación de a =0.01 si los tres lugares cultivan papas de la misma calidad.

------- ... _ .. --- . - - ---- -- --- -"-

. f .,.- -
-- ..
. . ...111.1 "
1. En un estUdio de las actitudes de empleados hacia su programa de beneficios médicos, un fabricante de
automóviles importante toma una muestra al azar de 385 de sus empleados,' clasifica sus puestos como
soldadores, pintores o terminadores, y pide a cada persona que' clasifique el programa de beneficios
.como bueno, regular o deficiente. Los resultados son los siguientes.

. Con el nivel. de significación de 0.01 ¿existe una relación entre la actitud del empleado hacia el
programa de beneficios y el trabajo querealiza?

12. En un estudio realizado para determinar si existe relación entre los grados académicos que tienen los
empleados de firma y los salarios que perciben, una muestra tomada al azar los,resultados
que se muestran en la tabla siguiente: . , -.

Tipo de

de
Grado de Licenciatura
Título de E. Media

Utilizar el nivel de significación de 0.05 para probar la hipótesis nula de que no existe una relación real
entre los grados académicos y los salarios de estos empleados.

13. El departamento administrativo de cierta universidad desea determinar, con base en los siguientes
resultados de un estudio, si existe relación entre la clase social de un estudiante y su evaluación de un
curso de producción.

Ultimo año
.
r.¡.'i.!.I.'.,I.I.
I.
:I. II 'I:.:i '· •. .•'.• .:• '
' :

Con el nivel de significación de a = 0.01, ¿existe tal relación?

. .
, cio Reye$
"

I
e
o
8

18
18

al

m
~ • .'iiim"i,.jF"i·ii'
. ..
7.1lnftoducción

Todos los días los administradores se toman decisiones personales y profesionales que se basan en las
predicciones de sucesos futuros. Para hacer tales pronósticos, debe coÍlfiar en la relación (intuitiva y
calculada) entre lo que se conoce y lo que se debe estimar. Si se puede determinar como se relaciona lo
conocido con el evento futuro, se contribuirá de manera importante al proceso de toma de decisiones.

Los de Regresión muestran como determinar la de una


relación entre dos variables; una variable conocida llamada Independiente y otra desconocida llamada
variable Dependiente.

Es la relación existente entre la media de una variable aleatoria y los valores de una o más
. variables independientes de los cuales depende.

Correlación: Es la relación (asociación o interdependencia) de los valores de dos o más variables


cualitativas o cuantitativas.

En el Análisis de Regresión se desarrolla una· ecuación de estimación, es decir, una fórmula matemática
que relaciona las variables conocidas con las desconocidas y el Análisis de Correlación permite determinar
el grado de relación que hay entre las variables, de tal manera que éste afirma con que grado de precisión,
la ecuación de estimación describe la relación.

Para determinar si existe una relación entre dos o más variables, es oportuno primero examinar su gráfica
de datos observados o conocidos llamada diagrama de dispersión el que visualmente puede primero buscar
los patrones de relaciones entre las variables y después buscar la relación entre ellas.

Se desarrolla a continuación un diagrama de dispersión específico. El siguiente cuadro corresponde a las


calificaciones de un estudiante universitario en su examen de admisión y el promedio de puntos de grado 1
acumulativos (G.P.A. grade - point average) después de su graduación.

Variable independiente
Variable dependiente

Trazar el diagrama de dispersión. y "ajustar" una linea recta a través del diagrama para representar la

relación.

Solución:

La primera figura muestra el diagrama de dispersión completo y en segunda figura se ha "ajustado" una

. línea a través de diagrama de dispersión correspondiente.

. .
".H Ji1t"!k:c­
.
Diagrama de dispersión de

calificaciones de

estudiantes en exámenes de

admisión representadas

gráficamente contra

promedios de puntos de

grado acumulativos.

Diagrama de dispersión en
donde la línea recta

representa la relación entre

X y Y "ajustada" a ella.

En este caso, la línea trazada a través de nuestros puntos de datos representa una relación directa, porque Y
a .. se incrementa al incrementarse X. Como . los puntos de datos· están relativamente cerca de esta línea,
.r podemos decir que existe un alto grado de asociación entre las calificaciones de exámenes y el GPA
.acumulativo. En la segunda figura podemos ver que la relación descrita por los puntos de· datos está bien
descrita por una línea recta. Por tanto, podemos decir que es una relación lineal.
Las siguientes figuras muestran algunas posibles relaciones entre X y Y en los diagramas de dispersión:
o
(a) Lineal directa (b) Lineal inversa (c) Curvilínea directa
y y y

••• • •• ••
• • •• •
• ••
•• •• •• ••
• •• •
• • ••• •
•• • • ••
Relaciones ••
X X
posibles entre X y
(d) CurvilInea inversa (e) Lineal inversa (f) Ninguna relación
Y en diagramas de y Y con más dispersión y
la dispersión
• •• •• • • •
• • • • •• ••
•...
• ••• •
•.:
• •• ••
• • •••• • •
• • • • • ••
• •
•• • • • • • •• •

X
~
. .
En los diagramas de dispersión anteriores, las líneas de regresión (Regresión Líneal) han sido dibujadas
ajustando las líneas visuahnente entre los puntos de datos.

7.2
¿Cómo "ajustar" una línea matemáticamente, si ninguno de los puntos se halla sobre ella? Para un
estadístico, la línea tendrá "buen ajuste" si minimiza el error entre los puntos estimados sobre la línea y los
puntos reales observados empleados para dibujarla. De tal manera que la Ecuación de L{nea de
Estimación del Mejor Ajuste, está dado por:

donde: Y = Valores individuales de los puntos


estimados
a =Intersección en el eje YY'
b = Pendiente de la' recta
Los estadísticos han derivado ecuaciones que sirven para obtener la pendiente (b) y la intersección en YY'
(a) de la línea de regresión del mejor ajuste. Ellas son

donde: X = Valores de la variable independiente


(l8) y =Valores de la variable dependiente
=Media de los valores de X

r a= J (19)
= Media de los valores de Y
=Número de puntos de datos
b = Pendiente de la línea de estimación
a = Intersección en el eje YY'

Con estas dos ecuaciones (18) y (19) se puede encontrar la ecuación de la línea de regresión del mejor
reajuste para cualquier conjunto de puntos de .dos variables.
Ejemplo 1.

El director del departamento de salubridad quiere conocer la relación entre la edad de un camión de
basura y los gastos de reparación anual entre los cuales se espera que incurra. Si el departamento tiene
un camión de 4 años, predecir con la ecuación estimada, el gasto anual de reparación destinado a ese
camión. La infonnación es la siguiente:

SI

n=4
(1) (2) (3)
Solución:

• n=4
¡'¡."¡".,.'.'I"'u'·."",·,: ~. .
... Datos dados y calculados en el cuadro de la
-
n 4 página anterior.
=6;

*Y= a+bX ... Ecuación de la recta de estimación


= 78-4(3)(6) = 78-72 .., Usando la fónnula (18) para calcular le
1
S
_ nX2 44 - 4(3)2 44 - 36 pendiente de la línea del mejor ajuste
6 3 Valor de la pendiente de la línea del mejor
b= = =0.75 oo.

ajuste
* ... Calculando la Intersección de la línea con la
= 6 - 0.75(3) = 6 - 2.25 = 3.75 fórmula (19) y operando
a = 3.75 ... Valor de la intersección de la línea con el eje YY'
*y = 3.75 + 0.75X Ecuación de estimación ... Resp
* Para 4 años (X=4) el gasto estimado (Y) será: ... Sustituyendo X = 4 en la Ecuación de
* Y = 3.75 + 0.75(4)
Estimación encontrada
= 3.75 + 3 = 6.75

* L. 6.75 x 1000 = L. 6,750.00 ... Porque?


* L. 6,750.00 Gasto anual esperado de reparación ... Resp.

Ejemplo 2.

La tabla siguiente muestra el tiempo que 6 personas han estado trabajando en un taller de revisión de
automóviles y el número de unidades que cada uno de ellos ha revisado entre las 12:30 y las 3:30 p.m.
de un día dado:
Jr a) Calcular la ecuación de estimación de la línea del mejor ajuste

b) ¿Cuántos automóviles se pueden esperar que una persona revise durante 10 semanas?

ie
le
se

Solución:

a) Completando el cuadro con los datos del problema


N° Semana Autos Rev. (1) (2) (3)

n=6 36 = 304 = 2008

..
'. .
* n = 6; = 36; = 108; = 715 ... Calculando los elementos para formar la
ecuaci6n de estimaci6n. Datos dados y

= 304; = 2008; = = 36 = 6 calculados

= = 108 = 18

n 6
*y= a+ bX ... Ecuaci6n de la recta de estimación
*b - _ 715 - 6(6)(18) 715 - 648 ... Calculando la pendiente b de la linea del
- _ nX2 - 304 - 6(6)2 =304-216
mejor ajuste. Fórmula (18)
67
.
b= = 0.7614

b =0.7614 ... Valor de pendiente de la línea de

estimación del mejor ajuste

* ... Calculando la intersección de la linea del

a = 18 - 0.7614(6) = 18 - 4.5684
mejor ajuste con el eje YY'

a = 13.4316 ... Valor del intersecto con el eje YY'

*y = 13.4316 + 0.7614X Ecuación de estimación ... Resp.

b) Si X = 10 entonces: ... Sustituyendo valores en la ecuación de


estimación y operando
* y = 13.4316 + 0.7614(10)

Y = 13.4316 + 7.614 = 21.0456

Y = 21 Se estiman revisar 21 autos en 10 semanas ... Resp.

La calculadora científica CASIO fx-82MS, permite calcular problemas de regresión lineal si se tienen n
datos en parejas (x,y); la ecuación de estimación de la línea del mejor ajuste ( = a + bX ); el valor del
coefiCiente de corelaci6n de Pearson (r); la estimación para X la estimación para Y las sumatorias
el valor de n.

Para utilizar esta calculadora se resolverá el ejemplo 2 anterior con el siguiente algoritmo:
(

Paso 1. Teclear. • 3 oo. Borrando el contenido de la memoria

Paso 2. Teclear 1_ 3 ... Se ingresa al modo estadístico en 2 variables


y aparece el ícono "REG" en la pantalla
Paso 3. Teclear ... Ingresando todas las parejas de datos del
problema E
2 12821 ... La pantalla debé de mostrar n =6
Paso 4. Teclear. 1 ... Aparece en pantalla 304
S
.02ll1 ... Aparece en pantalla = 36

.., Aparece en pantalla n = 6

-.Horacio
¡',.'iti····.p··il'il " . •"""': ~. .
paso 5. Teclear. e 1 ... Aparece en pantalla = 2 008

2• ... Aparece en pantalla = 108

3 ... Aparece en pantalla = 715

Paso 6. Teclear • S-VAR


1 [11 ... Aparece en pantalla a = 13.43181818
ee·
'p,. '.' .

S-VAR
• '" '" 2 ... Aparece en pantalla b = 0.761363636
Paso 7. y = a + bX ... Ecuación de estimación
= 13.4318 + 0.7613 X ... Sustituyendo valores obtenidos en el paso 6 con
. 4 cifras decimales y con truncamiento '
a) = 13.4318 + 0.7613 X Ecuru:ión de estimación ... Resp.
Paso 8. Teclear • • • 2 • . . . Aparece en pantalla = 21.04545455 cuando X=lO

b) = 21 Se estiman revisar 21 autos en 10 semanas (cuando X = 10) ... Resp,

Compare los resultados del ejemplo 2 del libro con los obtenidos con su calculadora
¿Cómo son estos resultados?

Siguiendo el· algoritmo propuesto en estos 8 pasos del problema 2, comprobar con la calculadora el
ejemplo 1 anterior. ¿Cómo son estos resultados?

·
Con el propósito de medir la confiabilidad de la ecuación de estimación, los estadísticos han desarrollado el
Error estándar de la estimación (se), el cual mide la variabilidad o dispersión de los valores
alrededor de la línea de regresión. La ecuación (20) pemúte hacer su cálculo de manera abreviada,'
donde: X =Variable independiente
..- -.y2..... (2.0) Y = Variable dependiente
a =Intersecto en el eje YY'
.

b = Pendiente linea de regresión


n = número de puntos dados
Ejemplo 1.

En el problema de los camiones de basura de la página 207 y en el cuadro de valores correspondiente,


se agregó la columna (3) de Y z y su respectiya· sumatoria. El error estándar de la estimación
correspondiente a ese problema, se calcula con la fórmula (20), así: .
Solución:·

se = 150 ..... 3.75(24) ..... 0.75(78) , ,.. Sustituyendo valores en la fórmula (20) y
4-2
se= =0.866

2 2

se = 0.866 x 1 000 = 86.6 =87 ... ¿Porqué? ... Resp.


• • .i¡iimi.i'.i'"i·¡'4
. .
'

Ejemplo 2.

Calcular el error estándar de la estimación del problema de la revisión de los automóviles en el


ejemplo 2 de la página 208 a cuyo cuadro se le agregó la columna (3) de y 2 y su respectiva sumatoria.

Solución:

se = 2008 - 13.4316(108) - 0.7614(715) I ... ¿Qué se hizo?


6-2

2OO8 -1450.6128 - 544.40 i

se=
4

se = 2008 1:95.0128 i = i = = 1.8

se = 1.8 = 2 ... Resp.

__ 1. Cuando mayor sea el error estándar de la estimación, más grande será la


dispersión o esparcimiento de puntos alrededor de la línea de regresión.
2. Los valores observados de Y están distribuidos alrededor de cada valor
estimado de
3. La varianza de las distribuciones alrededor de cada valor posible de es la
misma.
4. Si se supone que los puntos están normalmente alrededor de la
línea de regresión, cabe esperar que el 68% de ellos esté entre ± 1 se, el
95.5% dentro de ± 2 se y el 99.7% dentro de ± 3 se. Véase la figura
siguiente:

y
Y=a+bX+ 3 se
Y=a+ bX+ 2se
Y=a+ bX+ 1 se
se • y
=a + bX (línea de regresión
Y=a+ bX-l se
Y=a+ bX-2 se
Y=a+bX-3se 5

± 3 (99.7% de los puntos debe encontrarse


dentro de esta región)
± 2 (95.5% de los puntos debe encontrarse
dentro de esta región)
±1 (68% de los puntos debe encontrarse
X
Límites ±lse • ±2se Variable independiente
y ±3se alrededor de
la línea de regresión.
Ni·"I'···,"·';"""·.""'·':;.
- .

. .w

1. Para el siguiente conjunto de dispersión, b) desarrollar la ecuación de


estimación que mejor describa los datos, c) predecir el valor de t para cada uno de los siguientes
valores de X = 10, X = 15, X =20, X =25, d) calcular el error de estándar de la estimación.
X 13 16 14 11 17 9 13 17 18 12

Y 1.0 2.0 1.4 0.8 2.2 0.5 1.1 2.8 3.0 1.2

2. Usando los datos de la tabla siguiente: a) graficar el diagrama de dispersión, b) desarrollar la ecuación
de estimación que mejor describa los datos, c) predecir Y para cada valor dado de X =5, X =6, X = 7,
X = 8, d) Calcular el error estándar de la estimación.
X 15 6 10 5 12 14
Y 6 16 15 18 9 10
3. A partir del siguiente conjunto de datos: a) encontrar la ecuación de la línea de estimación, b) calcular el
error estándar de la estimación, c) para cada valor de X = 3.6, X = 1.7, X = 4.0, X = 2.5

X 46 48 42 58 40 39 50

Y 9.5 7.5 7.0 9.5 6.2 6.6 8.7

4. Supóngase que está encargado del dinero de un país. Recibe los siguientes datos históricos sobre la
oferta de dinero y el producto nacional bruto (ambos en millones de lempiras):

.
10.0
a) des.lITollar la ecuación de estimación para determinar el producto nacional bruto (Y) y de la oferta de
,n dinero (X); b) ¿cómo se interpreta la pendiente de la lfuea de regresión, con respecto al signo de la
IIÚsma?; c) calcular e interpretar el error estándar de la estimación; d) calcular cuando X = 2.7,
= =
X 5.3, X = 3.8, X =4.7, X 5.6, X =7.25

5. Una tenista se pregunta si la altura de su oponente contribuye a explicar el número de lanzamientos que
no son devueltos durante un partido. Se reunieron los siguientes datos en 8 p_artidos jugados:

.........::::::

'I. ..•'..
. ..: - ·;;'.····. .·" ,.,··)·"...0,

a) ¿Cuál es la variable dependiente?; b) ¿cuál es la ecuación de estimación de los datos anteriores?; c)


¿cuál es la mejor -estimación del número de lanzamientos altos no devueltos con un oponente de 5.9
pies de altura?

6. En un estudio efectuado por un departamento de transporte, sobre el efecto que los precios del autobús
tienen en un número de pasajeros, produjolos siguientes resultados:
Precio del boleto (Lps.) 15 20 25 30 35 40 45 50

Pasajeros por 100 Km 440 430 430 370 360 340 350 350

a) Dibujar el diagrama de dispersión de estos datos; b) desarrollar la ecuación de estimación de estos


datos; c) calcular el error estándar de la ecuación de estimación; d) determinar el número de pasajeros
por 100 Km si el precio del boleto costase L. 32.00, L. 43.00, _L. 48.00, L. 52.00.
7. Durante el trabajo, un supervisor interrumpe a un operario a fin de "ayudarle" a finalizar su trabajo.
Una vez concluidas las tareas, el trabajador es sometido a un test psicológico que mide la hostilidad
ante la autoridad (puntuación alta, denota poca hostilidad). A 8 trabajadores se les asignaron tareas y se
les interrrumpió varias veces (Línea X). En la línea Yse indican las puntuaciones correspondientes a la
prueba de hostilidad.

X (No. interrupciones) 5 10 10 15 15 20 20 25
y (Puntuac. /trabajador) 58 41 45 27 26 12 16 3

a) Dibujar el diagrama de dispersión; b) desarrollar la ecuación que mejor describa la relación entre el
número de veces de la interrupción y la puntuación conseguida en la prueba; c) calcular el error
estándar de la ecuación de la estimación, d) determinar la_puntuación esperada de la prueba, si se
interrumpe al trabajador en 18,23,28,32 Y 35 veces.

7.4

El análisis de es la herramienta estadística que describe el grado de relación que hay entre dos
variables. Los estadísticos han inventado dos medidas para describir la correlación entre dos variables, ellas
son los coeficientes de correltu:wn, que expresan numéricamente tanto lafuerza como la dirección de la
correlación lineal en la línea recta. Tales coeficientes

1. El coeficiente de determinación
2. El coeficiente correlación _

El valor de estos coeficientes de correlación, generalmente se encuentran en 1 y -l. Con respecto al grado
de asociación, mientras más cerca esté de 1.00 en una u otra dirección, mayor es la fuerza de la
correlación. En vista de que la fuerza de correlación es independiente,de su dirección, se puede decir que
-0.10 y +0.10 son iguales en cuanto a fuerza (ambas son muy débiles) y que -0.95 y +0.95 también tienen
igual fuerza (ambas son muy fuertes).

Este tipo de coeficiente de correlación, es uno de los más utilizados en la estadística. Lleva este nombre en
- honor a Karl Pearson (1857-1936) uno de los fundadores de la Estadística Moderna, se representa con la
letra r y se utiliza para medir la relación lineal entre dos conjuntos de medidas y permite determinar con
grado de exactitud se ajusta en realidad a los datos.

-
• •Horacio Reyes

"
¡'j.i'¡Ji.• ,.p.¡""gl·IMji,,'.• . .
El Coeficiente de correlación (r) es una valor entre -1.00 y +1.00. Si r = +1, se dice que existe una
correlación positiva perfecta. Si r = -1, se dice que existe una correlación negativa perfecta. Si r = O
entonces no hay correlación. La fórmula para calcular el de de Pearson, está dada
en la siguiente expresión:

donde: r =Coeficiente
de correlación de
Pearson
n = Número de puntos dados
X =Valor de la variable
independiente
y =Valor de la variable
dependiente

La fórmula anterior (22), es una fórmula alternativa que trabaja con los datos reales, crudos o no
estandarizados y facilita el cálculo del coeficiente de correlación de Pearson. Tiene la ventaja adicional de
que a r le asigna el signo correcto en forma automática.

Ejemplo 1.

En una investigación sobre el número de años de estudio que completó el padre (X) y el número de años
de estudio que completó su hijo 00, se especifican en la tabla. Calcular el coeficiente de correlación de
Pearson para la relación entre X e Y. Interpretar su significado.

6
11
10
8

Solución:

... ..
. . . . :.:

n=7
'.

~. . •.';',,"«.•j'"'.'''
*r = 7(720) - 73(66) ... Calculando X, X 2,Y, y 2, XY en el
[7(825) - (73)2] [7(650) - cuadro anterior.
5040 -4818 222
..; Sustituyendo valores y operando en
= " 446(194)1 la fórmula (22) para calcular el
222 222 Coeficiente de correlación de
= = 29415 =+0.7547 Pearson (r).
V 86524 .

r= + 0.7547 correlación de Pearson ... Resp.

* Interpretación: La correlación entre los años de estudio ... Resp.

que completó el padre y los que

completó el hijo, es bastante fUerte

porque +0.7547 esta próximo a 1.00

Ejemplo 2.

Seis estudiantes sustentan una serie de exámenes con un consejero vocacional, con los resultados que se

presentan en el cuadro siguiente:

a) Calcular el coeficiente de correlación de Pearson para las calificaciones en Matemática (X) y las de

interés por el Teatro (Y). Interpretar el significado; b) Lo mismo que en a) para Matemática (X) y el

interés por la Lectura (Y)


.
Solución:
a) Preparando el cuadro y haciendo los cálculos numéricos necesarios.

n=6

= 6(166200) - 2 875(350) ... Calculando valores de las. variables


que intervienen en la fórmula (22).
390875) - (2875)2] [6(24 1oo}-(350)2] Sustituyendo y . operando para
997 200 - 1 006 250 -9050 determinar el coeficiente de
correlación de Pearson (r).
= (79625) (22100) I =

-9050

= 41948.9 =-0.22

1 * r = - 0.22 de Pearson ... Resp.


* Interpretación: Existe' muy poca relación entre las .,. Resp.
calificaciones de matemática y las de interés
11 por el teatro. El valor de r esta muy próximo a
cero y la relación es por tanto, muy débil.
e b) Preparando el cuadro y haciendo los cálculos numéricos necesarios.

n=6 875 390 875 209 415


,e
*r = 6(190415) - 2875(407) ... ¿Qué se rozo? ¿Para que?
- (2875)2] [6(29209) - (407)2] I

= 1142490-1170125 = -27635 =-0.999


764 798 125' 27 654.98 .

*r=-0.999 CoefICiente de de ... Resp.


Interpretación: Existe mucha relación entre las calificaciones de
matemática y el interés por la lectura. La
le correlación es negativa. El valor de r esta muy
el próximo a -110 que implica una relación muy
fuerte.
__ 1. La r de Pearson es útil solamente para calcular una relación lineal en la línea'
recta, entre X e Y.
2. Las variables X e Y deben medirse al nivel por intervalos, de manera que se
puedan asignar puntajes a los sujetos de estudio.
3. La muestra debe ser aleatoria.
4. Las pruebas de significado de r de Pearson, requieren que X e Y estén
normalmente distribuidas en la población.

Utilizando la calculadora científica, comprobar y resolver el problema 1 de la página 211.

a) calculár de la línea de estimación del mejor ajuste, b) el valor del coeficiente de correlación de Pearson,

c) estimar cuando X=7, y cuando es X=9 con los siguientes datos:

les
2).
lIa
de

. --------------- - --- - - - - - - - - - - - - ­
_ _____________ .. = -- · '''
'. .
Solución

M&Wl
Paso 1. Teclear _ 3 ... Borrando el contenido de la memoria

Paso 2. Teclear _ 3 ... Se ingresa al modo estadístico en 2 variables


y aparece el ícono "REG" en la pantalla
Paso 3. Teclear 10. 6.6 ... Ingresando todas las parejas de datos del
problema. ¿Qué aparece en pantalla después de
S 9.S ingresar la última pareja de datos?

Paso 4. Teclear. 1• ... Aparece en pantalla X 2 =825

Paso 5. Teclear
.03.e
lIi D

1
... Aparece en pantalla

... Aparece en pantalla n = 7

... Aparece en pantalla


X =73

y2 =650

2 a ... Aparece en pantalla Y = 66

•• 0'0 .oo Aparece en pantalla =


oo. Aparece en pantalla a = 4.237668161

.oo Aparece en pantalla b = 0.497757847

.oo Aparece en pantalla r= 0.754717951

Paso 7. y= a+ bX oo. Ecuación de estimación

a) = 4.2376 + 0.4977 X ... Sustituyendo valores obtenidos en el paso 6


con 4 cifras decimales y con truncamiento
= 4.2376 + 0.4977 X de Resp.

b)r=0.7547 de de Pearson elpaso 6 Resp.

VAR
Paso 8. Teclear 7 0'0
• 0"
• •
° , , 2 . . . . Aparece en pantalla y" = 7.721973094

c) =7.7219 cuando X = 7 ... ¿Cómo se interpreta este resultado?

Teclear 9 • • • Z . . . . ¿Qué aparece en pantalla?


= 8.7174 cuando X = 9 ... ¿Cómo se interpreta este resultado?

Reyes Núftez

-
l. para cada una de las siguientes distribuciones de
datos, e indicar el tipo de relación entre

b)

1
5
4

2. La tabla siguiente proporciona los tamaños de algunas piezas de pladera en pies y pulgadas:

a) El diagrama de dispersión
b) La-ecuación de estimación del mejor ajuste
c) El error estándar de la estimación
d) El coeficiente r de Pearson y su significado

3. Se llevó a cabo un experimento para saber si existía alguna correláción entre el volumen de agua de una
pecera y la longitud promedio que crecen 4 peces de colores que habían sido creados en la pecera. Los
siguientes son los resultados:

4. llevo a cabo un experimento en el que se dejaba caer un objeto dentro cierto líquido. La distancia
por el ºbjeto fue anotada cada segundo a lo largo de 6 segundos. Los siguientes fqeron los
resultados:
Calcular lo mismo que en el problema N°2
l.

l.

5. A continuación se tiene una lista de todas las distancias que necesitan ciertos vehículos para detenerse
cuando viajan a diferentes velocidades:
Calcular lo mismo que en el problema N°2
.... ---------------------------------------------

.•.••.iiijm,.j',,'.'A
. .
.

6. A continuación se dan los días y las temperaturas Max. y Min. en grados °F que fueron registrados en
una ciudad:
Calcular lo mismo que en el problema N°2

7. Una inversionista que estaba estudiando la posible correlación entre dos tipos de valores, notó que le
pareció un patrón de relación entre los precios. ¿Existe una relación lineal entre los precios? ¿Cómo es
esta relación? .

en fonna breve
........, , , ,,., ,.,
a lo
.. :, 'w/ /
1. a) lCuál es la idea fundamental de la inferencia estadística?
b) lA qué se le llama nivel de confianza?
c) lCuáles son los valores críticos de confianza más usados deacuerdo al nivel de confianza cuando n es
mayor o igual que 301

d) lOe quién depende la forma exacta de una distribución t?

e) ¿A qué se le llaman grados de libertad en la distribución t?

f) lEn qué consiste el error Tipo II?

g) ¿Qué mide el error estandar de la estimación?

h) lCómo se calculan los grados de libertad en una tabla de contingencia de 3x4?

i) lPara qué tipo de pruebas de hipótesis se utiliza la distribución Ji Cuadrada?

j) ¿Cómo se llamalo que los estadísticos han desarrollado con el propósito de medir la confiabilidad de'

la ecuación de estimación?

Desarrolle cada en fonna clara a


2. De consumidores. 956 pensaron que el nuevo producto era cera para según su tipo de b
envase, cuando en realidad era un nuevo detergente,
a) Estimar el error estándar de la proporción de personas con ideas erróneas c
b) Construir un Le. del 96% para la verdadera proporción resultante. Explique el resultado
.
;'j"'j,i.i,Mfi·¡i'¡,"'.i,.j·,,··,Z ~
­
..

3. El número medio de accidentes que se presentaron en los 7 días de la Semana Santa del 2006 en las
playas de Tela fue de 35, las desviación estándar de esa muestra fue de 9 accidentes por Contruir un
Le. del 99% para el número real de accidentes por día.

4. Una psicóloga desea determinar si el tiempo promedio que tarda un conductor adulto en reaccionar a
cierte situación de emergencia es en realidad de 0.56 segundos, como lo han afinndo otros. De la
información recopilada en estudios similares, ella puede suponer que la variabilidad de estas mediciones
está dada por una desviación estándar 0.082 segundos. As! mismo, ella decide basar la demostración en
una muestra aleatoria de tamaño 35 y utilizar el nivel de significacia del 0.05. lQué concluirá si sus datos
producen una media de 0.59 segundos?

5. Un supervisor de un proceso de ensamblado desea conocer si el de artículos determinados con


defectos depende del día de la semana en que son producidos. Reunió la siguiente información:

Sin defectos
. Defectuosos. 15

¿Existe la evidencia suficiente para rechazar la hipótesis de que el número de artículos defectuosos es
indepediente del día de la semana qen que se un nivel de significancia del 5%

6. La tabla que sigue muestra el periódo de tiempo (X) que 6 personas han estado trabajando en una
estación de inspección de y el número de unidades (Y) que revisó cada uno entre el medio
día y la 1:00 pm en un determinado día

a) hallar la ecuación de regresión que mejor se ajusta a los datos


b) Si una persona ha trabajado en la estación de inspección durante 10 semanas,ICuántos automóviles
podemos esperar que inspeccione esta persona en el lapso de tiempo dado?
c) Calcular el coeficiente de correlación Pearson y dar su interpretación

f
--
. . ?·'i"·'I'.·M."'.' '.'
,

N°}. Area Bajo la Curva Normal

Tabla N°2. Dígitos Aleatorios

N°j Valores Críticos de la Distribución t de Student.

Tabla N°4. Valores Criticos de la Distribución Ji cuadrada Xl

DD•
• •I"!Hfo-o-r-a-c....-¡
"" ~. .
Tabla 1

O z
Areas bajo curva normal

_ ._.._ .. .~_ . ·
--
~
. . ••• 'F,i¡'umi.'

TablaN"2

1 250 D{gitos aleatorios

* Basada en los primeros 834 números seriaks rifa


incluida en The New York
30 octubre 1940, p. 12. 1940 by The New
York TinJes Company. Reimpreso con autorizlu;ión.

Reyes

.
Valores Criticos de la Distribución t de

Nota: Para gl 30 el valor critico t (gl., es aproximado por


dado en el último renglón de la tabla.

_________ -- --.----------_ _
--
. ..: . ·,ga'''·41.''·'
'H

Valores crlticos de la Distribúci6n Ji 2

o (gl, a)

'
, '''Horacio Reyes Núñez
,.'I"'" ••••••••••••••••••••••••

1. m
9000

7000
3.
400
5000 Automóviles
3S0

3000

1000

ISO

Horas _

5.

=
= Transitable tltinnpo
= 'n-ansitable verano

7. Sin respuesta;
a) Una posibilidad es:
9. 80 11.
800
70
..
o.
60 600

50
Mostrar que el mayor grupo
40 con sentencia muerte
el de edades de 2S - 34 Y
30 200 que muy pocos tienen
menos de 20 6 SS 6
•.

1 I1111IV 1 I1IDIV 1 I1111IV I I1illIV

1995 . 1997 1998

'lnmestres

HoracioR-eyes·N
i·'j·¡IuJC ~
. .

O. a) 7,6; b) 8,6; e) 8, 5; d) 8,5; e) 8,7; 8, 5; 1. b) 680; c)7, 35%; d) 6, 30%; 3. b) 6.5; e) 12,
50%; d) 8, e) 4, 16.6%;

s.
.' '2
:.'.[...·.' . . .
.. ~.:¡ [;.,':;.~
~
..'•.
. 4

b) e) e)

1. a) Rg = 51 (A) a) Rg =65 (B)

'2
N=60

HIstograma de Frecuencias
f
36

32
15. A) 28

24

20

16

12

15.5 29.5 43.5 57.5 71.5 L.R.


22.5 36.5 50.5 64.5
'. .'

f Polígono Frecuencias

32

28

24

20

16

12

12 19 26 33 40 47 S4 61 68 7S Xm

Histograma Frecuencias ~ Polígono de Frecuencias


f
19. 24

20

16

12

15.5 19.5 23.5


17.5 21.5

C=5

25. C=1
•••••••••••••••••••••••••••

Histograma de Frecuencias Polfgono de Frecuencias


f
27. 18

15

12

3.65 5.65 7.65 9.65 L.R.


4.65 6.65 8.65

Polígono de Frecuencias Histograma de Frecuencias


29. 31
f

40
::.:
. :. ...
"
....
30
.

20

Z
10
:: ..
.:.. :, ::

.. .:::.

....
: .:

o:: 99.5 139.5 179.5


:.: 119.5 199.5
Puntuación de pruebas

33. Las calificaciones de pruebas tienden a entre 140 y 160. Una puntuación representativa es
aproximadamente 150. la puntuación mínima es cercana a 100, y la maxima, 200
Polígono de Frecuencias

Monto de reclamos de autos de


menos de 5 años

Monto de reclamos de autos de


de 5 años o

- ._-
HoracioReyes ••
~
. .

l.

e) 32. 72.73%; lO, 22.73%; 3, 6.82%

Tabla 11 más que 11 Tabla 11 que 11


3.

5. a) 54.50%; b) 71.50%; e) 45.5%; 7. a) 65% es decir, obtiene 5 000 lbs o más; b) 6000 lbs., 4 300
lbs. 9. a) aproximadamente 50% (7 u 8 elementos) exceden el punto de equilibrio; b) aproximadamente
9 900 unidades, e) aproximadadmente 9 800 unidades.

oracio
¡'iJ.""" . .' :

S 6 S

1. 3. 5. +x; +x; 9. 11.


;=t
13. -28; 15.4094; 17. -3 372a; 19.17; 21.6.

1. a) = 155.0 cm, b) Me = 152.5 cm, e) Mo = 145 cm; 3. = 77.08, Me = 77, Mo = 77, Mo = 78


(Bimodal); 5. = 1.71; Me = 1.70, Mo = 1.65; 7. = 28.10, Me = 29.10, Mo: No tiene;
9. Aproximadamente: 8470, Media Poblacional; 11. = 23.295 seg; debe estar preocupado;
13. = L. 68,966.67. Si la obtiene.

10 Página 73

1. a) = 5.55, b) Me = 5, Mo = 5; 3. a) = 17.94, b) Me = 17.2, e) Mo = 19.2; 5. a) = 27.89,


b) Me = 29.2, e) Mo = 29.2; 7. No; 9. 75.09%; 11. 70.98; 13. 53.5 ctsllibra; 15. = 5.062,
. Me = 5.205, Mo: No tiene; 17. L. 8.90; 19. 165.

11 Página 82

1. a) = 17.61, b) Me = 18.88, Mo = 22.5; 3. a) = 15.71, b) Me = 15.60, e) Mo = 15.30;


5. a) x=lO.77, b) Me = 10.95, e) Mo = 11.37; 7. a) = 14.66, b) Me = 14.74, e) Mo = 14.75;
9. a) = 322.58, b) Me = 327.03, e) Mo = 330.38; 11. a) = 34.2, b) Me = 33.56, e) Mo = 31.75;
13. a) =161.4 g, b) Me = 159.8 g; Mo =156.6 g.

Página 89

1. a) = 7.5 a , v (<b) = 9, El 50% de los casos son menores que 9 minutos de espera, b) = 11 a,
a
= 10, el 75% de los casos son menores que 10 minutos de espera, e) p(Qt)= 4 , v(Qt) = 5, el 25% de
los casos son menores que 5 minutos de espera; 3. a) p(<b) = 6.5 8 , = 67, el 50% de los casos son
menores que 67 hatos; b) P(Q3) = 9.5 a , V(Q3) = 78, el 75% de los casos son menores que 78 hatos;
e) p(Qt) = 3.5 a , v(Qt) = 52, El 25% de los casos son menores que 52 hatos; 5. a) = 8,
8
b) v(D 6) = 8, c)v(Pso) = 12, d) V(P7S) = 12, e) v(D7) = 11, 7J = 11; 7. a) P(D9) = 18.5 ,

v(D9) = 12.0; b)P(D3) = 6.5 , v(D3) = 10.8; e) P(P30) = 6.5 , V(D3) = 10.8; d) P(P9Q) = 18.5 ;
a 8 3

V(P90) 12.0; e) p(<b) = lO.5 a , f) p(Qt) 5.5a , v(Qt) = 10.75; 9. a) = 15.5a ,


a a
= 16.0; -b) P(D3) 9.5 , V(D3) = 15.8; e) p(P4Q) = 12.5 , v(P4Q) = 15.9; d) P(D7) 21.5 8 ,
V(D7) 16.35; e) P(Pso) = 24.5 3 , v(Pso) = 16.7; f) p(Ds) = 24.5 a,v(Ds) = 16.7; 11. a) p(Qt) = 8a,
v(Qt) = 19; b) p(Ds) = 15.5a , v(Ds) = 28.5, e) P(P79) = 24a , V(P79) = 34; d) P(D7) = 21.5 a , V(D7) = 32.5;
e) P(Pss) =27a, v(Pss) = 38.

1. a) Pso = 9, el 50% a lo más de los casos son menores que 9 años, e) Pso = 12.375, el 80% a lo más de
los casos son menores que 12.375 años, e) Qt = 6.9, el 25% a los más de los casos son menores que 6.9
años, g) P4S = 8.7, el 45% a lo más de los casos son menores que 8.7 años; 3. a) P30 = 27.13,
.te
e) Pso = 36.17; e) Pss = 57.19.
.
' •.•,ii.i.i4i'

1. a) RP(25) = 17.14%,eI17.14% de las edades de los obreros al comienzo de su incapacidad, están por
debajo de 25 años, c) RP(36) = 55.60%, el 55.60% de las edades de los obreros al comienzo de su
incapacidad, están por debajo de 36 años, e) RP(27) = 20.70%, el 20.70% de las edades de los obreros
al comienzo de su incapacidad, están por debajo de 27 años; 3. a) RP(96) = 11. 22%, el 11.22% de los
alumnos tienen un coeficiente intelectual por debajo de 96, c) RP(110) = 31.29%, el 31.29% de los
alumnos tienen un intelectual por debajo de 110, e) RP(l18) = 50.98%, el 50.98% de los
alumnos tienen un coeficiente intelectual por debajo de 118;
5. a) RP(22) = 15.26%, el 15.26% de los socios en el Club tienen edad por debajo de 22 años,
c) RP(28) = 45.99%, el 45.99% de los tienen edades por debajo de 28 años;
e) RP(33) = 65.15%, el 65.15% de los socios tienen edades por debajo de 33 años.

Página 106

1. s = 3.13, representa un nivel inaceptable de variabilidad, el.gerente debe preocuparse por las tasas de
producción de la planta; 3. = 2 casas; 5. a) s = 6.8 pisos, b) s = 4.5 pisos. 7. s = 1.8247

Página 110

1. = 17.4588, = 3.8640, =14.9306; 3. L. 20.76, = 9.1207, = 83.1877; 5. = 11.98,


i
7. s=5.0287, s2=25.2881; 9. s= 1O.3623,s2= 107.3781. I
!

1
Página 114

1. cv(1) = 25.70%, cv(2) = 42.71 %, el programa del grupo (1) mostró menor variabilidad, porque tiene
menor porcentaje de dispersión; 3. cv(A) = 18.93%, cv(B) = 12.70%, la compañía A porque presenta
mayor porcentaje de dispersión; 5. cv(1) =5.22%, cv(2) = 4.78%, la máquina (1) tiene menor exactitud
I
porque presenta mayor porcentaje de dispersión; 7. cv(1) = 5.00%, cv(2) = 5.33%, la fórmula (2) es la
menos precisa; 9. a) cv(1) = 16.51%, cv(2) = 20.8%, hay mayor dispersión relativa en las ganancias
sobre la inversión, b) las razones precio- rendimiento y rendimiento - sobre inversión están en unidades
diferentes; 11. cv(AM) = 5%, cv(DM) = 2 %; los aspirantes presentaron mayor rendimiento en las
pruebas experimentales de AM.; 13. el X = 85 del conjunto A porque zA=1.63 es mayor que ZB = 1.20;