Está en la página 1de 167

___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ

0


ESTADSTICA I
APLICADA A LA ADMINISTRACIN DE EMPRESAS



0
5
10
15
20
25
30
Comidas Transporte Alojamiento
Ene
Feb
Mar
Abr
May
Jun




ALBERTO QUINTO JIMNEZ
Especialista en Matemtica Avanzada.
Universidad Nacional de Colombia.



FACULTAD DE HUMANIDADES
PROGRAMA DE ADMINISTRACIN DE EMPRESAS
UNIVERSIDAD TECNOLGICA DEL CHOCO
DIEGO LUIS CORDOBA

2005



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



1








OFRENDA

A mi abuela MIGUELINA MOSQUERA de QUINTO, a mis hijos, a
todos y cada uno de mis actuales y futuros alumnos promesas del
maana, dedico.





















___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



2

INDICE

PAGINA
Ofrenda
Prologo

UNIDAD 1.0
LA ESTADSTICA Y SU HISTORIA 6
1.1 Historia 6
1.2 Definicin de Estadstica 8
1.3 Trminos de uso corriente en Estadstica 8
1.4 Divisin de la Estadstica 11
1.5 Aplicacin de la Estadstica 11
1.6 Importancia de la Estadstica 12
1.7 Fenmeno que abarca y no abarca la Estadstica 13
1.8 La investigacin Estadstica 13
1.9 Clases de investigacin 14
1.10 Etapas de la investigacin 15
Evaluacin de la unidad 23
UNIDAD 2.0
REPRESENTACIN DE DATOS 31
2.1 Distribucin de frecuencia 32
2.2 Distribucin de frecuencia simple 33
2.3 Distribucin de frecuencia por intervalo 37
2.4 Grficos Estadsticos 42
Evaluacin de la unidad 54



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



3
UNIDAD 3.0
MEDIDAS DE POSICIN O TENDENCIA CENTRAL 62
3.1 Media Aritmtica 63
3.1.1 Propiedades 67
3.1.2 Ventajas y desventajas 68
3.2 Mediana 69
3.2.1 Ventajas y desventajas 74
3.3 Moda 75
3.3.1 Ventajas y desventajas 80
3.4 Caractersticas principales de los promedios anteriores 80
3.5 Relacin entre la Media, Mediana y Moda 82
3.6 Media Geomtrica 83
3.6.1 Propiedades 86
3.6.2 Ventajas y desventajas 87
3.6.3 Caractersticas 88
3.7 Media Armnica 89
3.7.1 Caracterstica 90
3.8 Relacin entre Media Aritmtica, Geomtrica y Armnica 91
3.9 Cuartiles, Decles y Percentiles 91
Evaluacin de la unidad 97
UNIDAD 4.0
MEDIDAS DE DISPERSIN 107
4.1 Varianza 108
4.1.1 Propiedades 110
4.1.2 Correccin de Shepard 110
4.2 Rango o recorrido 111
4.2.1 Caractersticas 111
4.3 Desviacin Tpica o Estndar 114


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



4
4.3.1 Propiedades 114
4.4 Coeficiente de variacin 118
4.4.1 Caracterstica 118
4.5 Puntaje Tpico o Stndarizado 120
4.6 Recorrido intercuartilico 122
4.7 Desviacin Mediana 124
4.8 Desviacin Media 125
Evaluacin de la unidad. 129
UNIDAD 5.0
REGRESIN Y CORRELACION 133
5.1 Introduccin a la bidimensionalidad 134
5.2 Relacin entre dos variables 134
5.3 Regresin 138
5.4 Teora de la correlacin 141
5.5 Error tpico de la estima 144
5.6 Variacin explicada y no explicada 146
5.7 Coeficiente de correlacin 146
5.8 Correlacin gradual 151
Evaluacin de la unidad. 161
UNIDAD 6.0
INTRODUCCIN A LAS COMPUTADORAS 165
6.1 La computadora en la Estadstica 166
6.2 Introduccin a Microsoft Excel 167
6.2.1 Grafica en Excel 168
6.3 Manejo del Statgraphics 169

BIBLIOGRAFA.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



5
INTRODUCCIN

El uso de la Estadstica se ha generalizado en los ltimos aos no slo como
herramienta de anlisis de problemas de economa, sino como auxiliar en el
estudio y valoracin de cualquier investigacin. El propsito de este mdulo
es proporcionar a los estudiantes de administracin de empresas, el material
bsico exigido en su curso de Estadstica I, incluyendo algunas de sus
aplicaciones.

Se ha hecho un esfuerzo para lograr que el mdulo sea til a la mayor
cantidad posible de profesionales dedicados a las ciencias econmicas,
porque existe la necesidad de un modulo de Estadstica que aborde tpicos
que exceden estas reas de las ciencias.

En un esfuerzo por llenar este vaco, he incluido ejemplos y ejercicios que no
slo interesan al estudiante de administracin de empresas, sino tambin al
contador, al Educador y, a muchos otros profesionales dedicados a las
ciencias econmicas.

Por la forma en que est estructurado el mdulo, es poca la preparacin
matemtica que se requiere para usarla. Aquellos que hayan tomado un
curso de lgebra, no tendrn dificultad alguna para seguir la manipulacin
matemtica. Tengo fe en que el estudiante, o el lector comn, llegar a darse
cuenta que en la estadstica hay ms que las meras matemticas; que la
Estadstica, primero que todo, es una filosofa, una manera de pensar. Si el
estudiante puede desarrollar los conceptos, ver las matemticas
simplemente como el vehculo para su expresin y comunicacin.

Aspiro, en consecuencia, prestar un nuevo servicio a los educadores
Colombianos; porque considero que todo lo que se hace en beneficio de los
futuros ciudadanos ha de estar inspirado en un elevado anhelo de
engrandecimiento patrio, y ello slo se logra con la dedicacin y el sacrificio
constante de cada uno de nosotros, pues como lo expresa claramente
CHARLES SUMMER, la verdadera grandeza de las naciones est en
aquellas cualidades que constituyen la grandeza del individuo.






___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



6


UNIDAD 1.0

LA ESTADSTICA Y SU HISTORIA











OBJETIVO
DE LA UNIDAD: describir la importancia y el uso de la Estadstica y su relacin
con otras ciencias; dar un concepto general de la metodologa de la
investigacin Estadstica.
CONTENIDOS:
1.1 Historia
1.2 Definicin de Estadstica
1.3 Trminos de uso corriente en Estadstica
1.4 Divisin de la Estadstica
1.5 Aplicacin de la Estadstica
1.6 Importancia de la Estadstica
1.7 Fenmeno que abarca y no abarca la Estadstica
1.8 La investigacin Estadstica
1.9 Clases de investigacin
1.10 Etapas de la investigacin
Evaluacin de la unidad



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



7
1.1 HISTORIA.

El estudio de la estadstica ha sufrido cambios substanciales desde su
comienzo. Merecen mencin especial dos fuentes de tendencia de
desarrollo. Primeramente, el de origen de la estadstica puede advertirse ya
en la necesidad de datos numricos en los estados que surgan de la
sociedad medieval en la Europa Occidental. Al transformarse la sociedad
medieval en el estado poltico, el nuevo gobierno necesitaba informacin
sobre los recursos del pas para poder tener xito. As pues era obligado
para los nuevos gobernantes el obtener descripciones numricas, tales
como : el nmero de ciudadanos de las diversas unidades polticas bajo su
jurisdiccin, ciudades, condados y provincias.

El trmino estadstica, se deriva del latn status, que significa estado en el
sentido poltico, se emple entonces para referirse a la recoleccin y
descripcin de tales datos del estado. La necesidad de acopiar y analizar
datos numricos impuls a desarrollar mtodos para facilitar la labor, que era
lo que constitua lo ms considerable de la estadstica hasta la era moderna.

No es necesario enumerar todos los que contribuyeron al desarrollo de los
mtodos estadsticos; pero ha de mencionarse sin embargo al Belga
ADOLPH QUETELET (1796 - 1874), que fue el primero en aplicar mtodos
modernos a conjuntos de datos.

Suele llamarse a QUETELET Padre de la estadstica moderna, por su
continua insistencia en la importancia de aplicar mtodos estadsticos. Sus
distinguidas contribuciones a la practica y a la metodologa estadsticas
cubrieron muchos campos de la estadstica oficial, tales como los censos, el
desarrollo de la uniformidad y compatibilidad de estadsticos entre las
naciones, y la organizacin de la primera conferencia estadstica,
internacional. La comisin central de estadstica, que QUETELET fund, fue el
modelo para instituciones similares en otros pases.

Otra fuente de la estadstica se encuentra en la atencin prestada al juego de
azar en el siglo XVII, que organizaba la nobleza de Inglaterra y Francia para
la recreacin, tales como dados y cartas; cosa que sin proponrselo, llev al
desarrollo de la Teora de las probabilidades.

Al mismo tiempo los estudios de probabilidades requeran el tratamiento de
los errores en las mediciones, de lo que resulto la distribucin de tales
errores. Ya desde el siglo XVIII se haba observado que las medidas de
cierto objeto o fenmeno daban lugar a una configuracin en la distribucin
de los errores que tena la forma de una curva acampanada.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



8

A propsito de la evaluacin de los errores de observacin en Astronoma,
se hizo un descubrimiento de mayor importancia para la estadstica. La
distribucin de errores resultante con su forma de campana y su simetra se
llama Curva Normal de Errores . Tambin se dice Distribucin Gaussiana
de errores, por el nombre de su descubridor Karl Friedrich Gauss (1777 -
1855).

Entre los contemporneos de QUETELET Y GAUSS que contribuyeron al
avance de la estadstica como ciencia, estaban : Florence Nightingale
(18820 - 1911).

Florence Nightingale crea firmemente en los mtodos estadsticos.
Sostena que todo Director debera guiarse por el conocimiento estadstico si
quera tener xito y que los polticos y los legisladores fracasaban
frecuentemente por la insuficiencia de sus conocimientos estadsticos.

Galton, como su primo Charles Darwin, se interes profundamente en el
estudio de la herencia, a la cual aplico mtodos estadsticos. Entre sus
principales contribuciones se encuentra, el haber desarrollado mtodos tan
fundamentales como la Regresin y la Correlacin.

La obra de Galton fue estmulo para una serie de investigaciones de Karl
Pearson ( 1857-1936 ), el cul inici la publicacin del peridico Biomtrica,
que ha influido profundamente en el desarrollo de la Estadstica, uno de los
mtodos ms importante, descubierto por Pearson es la Distribucin Ji-
cuadrado, que encontr en 1900.

En el siglo XX, quienes han contribuido de manera ms sobresaliente al
estudio de la Estadstica, han sido Willian S. Gosset ( 1876 - 1967 ) y Sir
Ronald Fisher ( 1890 - 1962 )

Gosset, que escriba bajo el seudnimo Student , dedujo la distribucin
t y su contribucin especial fue en el campo de la teora de pequeas
muestras.

Fisher hall la conocida distribucin F y aport contribuciones
continuamente hasta 1962 ; muchas de ellas han tenido grandes influencias
en los modernos procedimientos Estadsticos. Si bien su trabajo era sobre
todo en los campos de la Biologa, Gentica y la Agricultura, su impacto ha
llegado a todas las aplicaciones de la Estadstica.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



9
1.2 DEFINICIN DE LA ESTADSTICA

En trminos generales, la palabra estadstica se refiere a un sistema o
mtodo cientfico usado en la recoleccin, organizacin, anlisis,
interpretacin numrica de la informacin.

Tambin se puede decir que la estadstica est ligada con los mtodos
cientficos en la toma, organizacin, recopilacin, presentacin y anlisis de
datos, tanto para la deduccin de conclusiones, como para tomar decisiones
razonables de acuerdo con tales anlisis. El trmino se utiliza para denotar
datos o nmero, por ejemplo, estadstica de empleo, accidente, produccin,
etc.
1.3 TRMINOS DE USO CORRIENTE EN ESTADSTICA
1.3.1. POBLACIN O UNIVERSO. Es el conjuntos de individuos, medidas u
objetos que poseen alguna caracterstica comn observable como son :
altura, peso de estudiantes de un colegio, el nmero de camisas defectuosas
o no defectuosas producidas por una fbrica de un da determinado, el nivel
de glucosas en la sangre extrada a 50 nios en determinada hora del da.

Una poblacin puede ser finita o infinita. La poblacin consistente en todas
las camisas producidas por una fbrica en un da es FINITA, y la poblacin
formada por todos los posibles sucesos ( cara o sello) en tirada sucesiva de
una moneda es INFINITA.

1.3.2.MUESTRA. Una muestra puede definirse simplemente como una parte
de una poblacin. Supongamos que una poblacin consiste en los pesos de
todo los estudiantes de un colegio, si se renen para el anlisis los pesos de
slo un nivel o grado del total de nios del colegio, slo se tiene una parte de
la poblacin de pesos, es decir se tiene una muestra.

1.3.3 PARMETRO. Cualquier caracterstica de una poblacin que sea
medible, por ejemplo, la proporcin de nios de un pas que entran a
estudiar.

1.3.4.VARIABLE. Rasgo, caracterstica o propiedades que poseen los
elementos de una poblacin o de una muestra.

1.3.5.VARIABLE DISCRETA. Son aquellas que slo admiten valores enteros,
por ejemplo el nmero de hijos de una familia, ya que no se puede decir que
una familia tiene dos hijos y medio.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



10
1.3.6.VARIABLE CONTINUA. Son aquellas que admiten valores fraccionarios
por ejemplo, la estatura de una persona, su peso, etc.
1.3.7.VARIABLE CUANTITATIVA. Es aquella que puede medirse, por
ejemplo se puede obtener mediciones de los adultos del sexo masculino, los
pesos de los nios en edad preescolar y las edades de los pacientes que se
ven en una clnica dental.
1.3.8. VARIABLE CUALITATIVA. Algunas caractersticas pueden no ser
medidas, en el sentido en que se miden las estaturas, el peso, la edad ;
muchas caractersticas slo pueden catalogarse, como por ejemplo cundo a
una persona enferma se le da un diagnostico mdico, cuando a una persona
se le designa dentro de un grupo socioeconmico.
Las variables cualitativas dan origen a los atributos, como por ejemplo,
profesin, sexo, estado civil.
1.3.9.ESCALA. Es un patrn o conjunto de criterios claramente definidos que
permite asignar, sin ambigedades, valor a una variable. El concepto de valor
incluye, adems de nmeros, letras, letras y nmeros, palabras, etc.
1.3.9.1.ESCALA NOMINAL. Sirven nicamente para identificar, como el criterio
para asignar el nmero de la cdula a un individuo o el cdigo para saber el
color del pelo de una persona.
1.3.9.2.ESCALA ORDINAL. Que permite asignar valor a una variable que sirve
slo para ordenar, como el puesto que ocupa un atleta en una carrera.
1.3.9.3 ESCALA DE RAZN. Asigna un valor numrico, a una variable usando
una unidad determinada inicialmente como 1. En este caso estn las
unidades fsicas como peso, volumen, longitud, rea, resistencia etc.
En una escala el cero ( 0 ) no necesariamente representa la ausencia
absoluta de la variable, sino que se toma en referencia a un valor no nulo y
se tiene una escala conocida como intervalo. Por ejemplo en la temperatura,
los grados Kelvin usan una escala de razn mientras que los grados
centgrados usan una escala de intervalo, en la aeronutica la altura sobre
Bogot usa una escala de intervalo, mientras que la altura sobre el nivel del
mar es de razn.
En sntesis se tiene que, una variable puede clasificarse segn el diagrama.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



11

NOMINAL
CUALITATIVA DISCRETA
ORDINAL

VARIABLE
ORDINAL
DISCRETA

CUANTITATIVA DE RAZN
CONTINUA DE RAZN

1.3.10 BIOESTADISTICA. Es la rama de la Estadstica que trata de los seres
vivientes desde un punto de vista biolgico.
1.3.11 ESTADIGRAFOS. Clculos realizados con los datos de la muestra.
1.3.12.FRECUENCIA. Repeticin de un dato en una muestra.
1.3.13.PARMETROS. Clculo realizado con los datos de la poblacin.

1.4. DIVISIN DE LA ESTADSTICA.
Prcticamente todos los autores estn de acuerdo en clasificar la Estadstica
en dos tipos: Estadstica Deductiva o Descriptiva y la Estadstica Inductiva o
de Inferencia.
1.4.1 ESTADSTICA DEDUCTIVA O DESCRIPTIVA: Esta fase slo se limita a
la descripcin y anlisis de una serie de datos sin llegar a conclusiones o
generalizar con respecto a un grupo mayor.
1.4.2 ESTADSTICA INDUCTIVA O DE INFERENCIA: Trata de llegar a
conclusiones a cerca de un grupo mayor basado en la informacin de un
grupo menor o muestra.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



12

1.5. APLICACIONES DE LA ESTADSTICA.
La Estadstica o mtodos estadsticos como a veces se le llama est
desempeando un importante papel ascendente en casi todas las facetas del
progreso humano.
Anteriormente slo era aplicada a los asuntos del Estado, de donde viene su
nombre ; pero ahora la influencia de la Estadstica se extiende a la
agricultura, biologa, negocio, ciencias polticas, sicologa, sociologa y otros
muchos campos de ciencia e ingeniera.
1.5.1. EN LA EMPRESA: Una compaa de fbrica de harina, empaqueta la
harina en bolsa de papel, cada una de las cuales se supone contener 25
libras. Si el proceso de empaque est bajo control, el peso medio de las
bolsas ser de 25 libras. Supngase que se toma peridicamente una
muestra de bolsas para comprobar la bondad del proceso de empaquetado.
Si una muestra de 50 bolsas da una media muestra de 24 libras y 12 onzas,
se puede aplicar el mtodo de la inferencia estadstica para determinar si el
proceso est bajo control.
1.5.2. EN QUMICA Y BIOLOGA: Considrese una nueva vacuna contra el
resfriado que ha sido desarrollado por una compaa farmacutica. Dicha
compaa afirma que la nueva vacuna es eficaz en un 95 % o sea que de
cada 100 personas que la han utilizado, 95 pasaron a invierno sin sufrir
resfriado, si en una muestra de 30 personas que han sido vacunados, hay 27
que pasaron el invierno sin resfriado: prueba esto suficientemente las
pretensiones de la compaa ?.
1.5.3 EN BIOLOGA Y AGRONOMA: Para ayudar a determinar los efectos de
los tipos de semillas, de los insecticidas y de los fertilizantes en la cosecha.
Se ha utilizado para producir ganado de mejor calidad con planos especiales
de alimentacin y cra.
1.5.4 EN LA PRODUCCIN : En la produccin de un artculo en grandes
cantidades se hace necesario detectar y eliminar alteraciones sistemticas
de calidad.

1.5.5 EN FINANZAS : En la estimacin de la magnitud que tomar cierto
aspecto en algn punto futuro del tiempo( corto, mediano o largo plazo), en


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



13
los controles presupustales y en el planteamiento de ciertas actividades de
carcter financiero.

1.5.6 EN CONTABILIDAD : De gran importancia en la auditoria, ya que
mediante la aplicacin de ciertos mtodos se seleccionan algunas facturas,
cuentas o documentos de cobro, sin recurrir a la totalidad y con base en el
examen de ellas, se puede obtener conclusiones sobre la situacin actual de
cartera.

1.5.7 EN PERSONAL : El control sobre el nmero de horas laboradas,
tiempo dejado de laborar, accidentes de trabajos, clasificacin del personal
( por antigedad, sueldo, estudios, etc),informacin estadstica necesarias en
una empresa, para toma de decisiones en las polticas empresariales.

1.5.8 EN MERCADO : Las encuestas estadsticas son indispensables para
determinar la reaccin de los consumidores frente a los actuales productos
de la empresas y para el lanzamiento de los nuevos.

1.6 IMPORTANCIA DE LA ESTADSTICA.

A continuacin se precisan algunos aspectos para las cuales la Estadstica
es de gran importancia:

1.6.1 Conocimiento de la realidad de una observacin o un fenmeno. Para
conocer la situacin actual de un fenmeno es necesario cuantificarlo o graficarlo.

1.6.2.Determinacin de lo tpico o normal de una observacin. Esto se realiza
mediante el clculo de promedios representativos de la caracterstica cualificada.

1.6.3.Determinacin de los cambios que representa el fenmeno. Estas
variaciones se determinan en el tiempo, lo cual requiere una observacin
continua.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



14
1.6.4.Establecimiento de la relacin entre dos o ms fenmenos. Se
relacionan las caractersticas o variables que determinan los fenmenos.
1.6.5.Determinacin de las causas que originan el fenmeno.
1.6.6.Realizacin de estimaciones e inferencias estadsticas. Los
resultados obtenidos al estudiar una muestra se generalizan como
comportamiento de la poblacin entera. En estos casos es necesario
precisar el grado de validez y confiabilidad de los anlisis efectuados.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



15
1.7. FENMENOS QUE ABARCA Y NO ABARCA LA ESTADSTICA
Los fenmenos o hechos que continuamente suelen suceder, presentan
ciertas caractersticas tales como la de ser observables y manifestarse y a
un el de poder determinar la intensidad con que se produce el fenmeno.

1.7.1.Los fenmenos que abarca son:

1.7.1.1. Fenmenos colectivos o de grupos

1.7.1.2. Fenmenos de frecuente repeticin

1.7.1.3. Fenmenos de distintas frecuencias

1.7.1.4. Fenmenos distantes en el espacio

1.7.1.5. Fenmenos distantes en el tiempo

1.7.1.6. Fenmenos cualitativos que no se pueden cuantificar


1.7.2. Los fenmenos que no abarcan son:

1.7.2.1 Fenmenos individuales
1.7.2.2 Fenmenos que no se exteriorizan
1.7.2.3 Fenmenos accidentales en el tiempo y en el espacio
1.7.2.4 Fenmenos cualitativos que no se pueden cuantificar


1.8. LA INVESTIGACIN ESTADSTICA

La investigacin estadstica por sencilla que sea, es una operacin compleja
que requiere atender mltiples aspectos, y que genera muy variadas
funciones.
El resultado depende en gran parte de la finalidad que se persiga, de la
naturaleza de los fenmenos que desean estudiar y de la facilidad que se
tenga para observar los elementos.

1.8.1. CARACTERISTICA BASICAS: Toda la investigacin debe reunir las
siguientes caractersticas bsicas:



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



16
1.8.1.1. Claridad: En todos sus aspectos debe ser clara y precisa. Conocida
por todas las personas que en ella participan.

1.8.1.2 Sencillez: Es indispensable aunque no debe limitar la presentacin
completa de la investigacin. Es condicin esencial de claridad.

1.8.1.3 Utilidad: Toda investigacin estadstica debe tener alguna aplicacin
practica que justifique su realizacin.


1.9. CLASES DE INVESTIGACIN
1.9.1 INTERNA. Investiga fenmenos originados dentro de la misma empresa
o entidad. Requiere organizar la informacin de tal manera que permita la
aplicacin de mtodos estadsticos, a fin de lograr las conclusiones vlidas
deseadas
.1.9.2 EXTERNA. Se realiza con el fin de obtener informacin que permita
comparar fenmenos o entidades, establecer suposiciones relativas, estudiar
su comportamiento actual o futuro.
1.9.3 EXHAUSTIVA. Se denomina as a aquella investigacin donde se
observan todos los elementos: que constituyen la poblacin objetivo.
1.9.4.PARCIAL. Slo se observa una parte de los elementos o unidades que
constituyen la poblacin (muestra), es decir, estudia la poblacin a travs de
la muestra. Se realiza cuando no se desea o no es posible una investigacin
exhaustiva.
1.10. ETAPAS DE UNA INVESTIGACIN.
Se requiere una investigacin de carcter estadstico cuando no se tiene un
buen flujo de informacin que permita que dicha informacin se organice y;
por lo general se encuentre dispersa.
Se puede considerar tres clases de operaciones o etapas en una
investigacin. Planeamiento, Recoleccin y Anlisis.
Las etapas que requiere una investigacin estadstica la podemos sintetizar
as:
1.10.1 PLANEAMIENTO: Al trazar un plan de inversin, se debe definir y
organizar cada una de las actividades necesarias para llevar a cabo el
trabajo y poder alcanzar los objetivos propuestos.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



17
Dentro de la etapa del planteamiento se podrn considerar ciertos aspectos
que a continuacin se presentan, donde el orden y la necesidad de cada uno
de ellos depender de la misma naturaleza de la investigacin.
1.10.1.1 Objeto de la Investigacin: Que se investiga?
Es el hecho o fenmeno que se desea estudiar; en una investigacin de
salarios, ser el salario, en una sobre el rendimiento acadmico de un grupo
de estudiantes, ser los resultados obtenidos en su perodo escolar.
Es de gran Importancia definir el objeto de investigacin y determinar su
naturaleza cualitativa y cuantitativa. Definir adems, las posibilidades de
investigarlo y limitaciones.
1.10.1.2 Objetivo o Finalidad de la Investigacin: Que pretende la
investigacin?
Identificar con claridad y precisin el fin que se propone, formulando el
problema de tal manera que nos permita establecer los objetivos generales y
los especficos y, de ser posible una jerarquizacin de los mismos.
En esta fase se deben contestar los siguientes interrogantes: Que se
investiga ?, como se realizar la investigacin? (condiciones y medios),
cundo y donde se realizar?
1.10.1.3 Unidad de Investigacin: Donde se realiza una investigacin?
La unidad es la fuente de informacin es decir, a quien va dirigida; puede ser
a una persona, un grupo familiar, laboral o social, una vivienda, una empresa
pblica, una explotacin agropecuaria, una regin. Su seleccin depende del
objeto propuesto.
La unidad debe ser clara en tal forma que sea entendida por todos, adems
adecuada al tipo de investigacin; mensurable, que permita ser medida, y
comparable con los resultados obtenidos en investigaciones similares.
Al lado de la unidad principal se pueden establecer unidades secundarias.
La fuente de informacin puede ser directa o indirecta.
- ES DIRECTA. Si all se produce el hecho, ejemplo: Las notaras, para
determinar el nmero de nacimientos.
- ES INDIRECTA, cuando se consideran aquellas en las cuales el hecho
se refleja, ejemplo: Las rentas departamentales, para determinar el


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



18
consumo de bebidas alcohlicas. Estas se usan, generalmente, como
complementarias a las fuentes directas.
1.10.1.4 Examen de la documentacin y metodologa: Qu y cmo se
ha investigado al respecto?.
Es importante determinar si la investigacin ha sido realizada con
anterioridad, con el fin de prescindir del estudio; averiguar si se cumpli el
objetivo propuesto y si la informacin estaba actualizada.
En caso contrario se realizar tratando de corregir las diferencias
presentadas en anteriores investigaciones, al mismo tiempo que
aprovechando sus aspectos positivo.
1.10.1.5 Mtodo de observacin: Que caractersticas debe reunir la
investigacin? En qu forma se realiza la toma de dato?
Debe decirse el mtodo que se emplear: Censo o Muestra. Esta eleccin
depende, entre otros, de los siguientes factores: disponibilidad de tiempo,
recursos humanos y financieros, nmero de unidades que componen la
poblacin, caracteres por investigar, el grado de variabilidad, la descripcin
del objeto.
1.10.1.6 Proceso de Recoleccin: Qu tcnicas emplear para recolectar
la informacin?.
Los datos se pueden recolectar mediante encuesta realizada por correo,
entrega personal del cuestionario, entrevista, panel, observacin directa,
motivacin, telfono, otros.
1.10.1.7 Preparacin del Presupuesto: Se cuenta con los recursos
econmicos suficientes para todo el proceso de la investigacin.
Se debe analizar si los recursos econmicos son suficientes para los otros
costos requeridos en cada etapa, desde el planeamiento hasta la publicacin.
1.10.1.8 Calendario de trabajo: Qu tiempo requiere cada etapa ? Es el
ordenamiento de la diferencia inicial y final de cada etapa.
En el siguiente cuadro aparece un modelo de calendario.





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



19


ETAPAS
FECHAS
INICIAL FINAL
1. Planeamiento
a.) Fase preliminar

I - VI

10 - VI
b.) Preparacin de encuestas 8 - VI 20 - VI
c) Preparacin de personal 18 - VI 23 - VI

2. Recoleccin
a.) Pretes


25 - VI


30 - VI
b.) Trabajo de campo 5 - VII

20 - VII
3.Procesamiento y anlisis
a.) Depuracin y clasificacin

21 - VII


27 - VII
b.) Tabulacin y anlisis 26 - VII 5 - VIII
C.) Publicacin 3 - VII 20 - VIII


1.10.1.9 Preparacin del cuestionario. Qu contiene la encuesta y cmo
se resuelve?
Al elaborar un cuestionario se consideran aspectos materiales y aspectos
tcnicos.
- ASPECTOS MATERIALES: Tamao del formulario, calidad del papel,
color de la tinta, tipo de impresin.
- ASPECTOS TCNICOS: Las preguntas se ordenan gradualmente
segn su dificultad. No se deben emplear abreviaturas, las preguntas
deben ser claras, precisas y comprensibles.
Las partes que constituyen un formulario son:
ENCABEZAMIENTO : Contiene el nombre de la institucin u organismos
que realiza la investigacin, nombre o ttulo de la investigacin, el ttulo
debe llevar implcito el qu, cmo, cundo y dnde se realiza.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



20
CUERPO: Contiene las preguntas. Si se requiere identificar al informante
ser necesario iniciar preguntando nombre, direccin, estado civil, edad,
profesin etc.
INSTRUCCIONES: Son explicaciones generales sobre el sentido y forma de
responder el cuestionario, son indispensable en razn de la brevedad y
condicin de las preguntas.
Puede escribirse al final del cuestionario, al iniciarse o en separata.
OBSERVACIONES : Espacio libre al final del formulario para que el
entrevistador o el entrevistado escriban aclaraciones, opiniones u
observaciones complementarias del trabajo realizado.
1.10.1.10 Seleccin y preparacin del personal. Qu requisitos deben
reunir los entrevistadores y cul es su funcin?.
Para esta seleccin se tienen en cuenta los siguientes criterios: nmero de
personas acorde al nmero de formulario o unidades a entrevistar,
conocimiento que tenga del interrogatorio y del objetivo de la investigacin,
cualidades morales que le impidan falsear las respuestas, cualidades de
sociabilidad y cortesa, presentacin personal correcta y sencilla. El
adiestramiento del personal se realiza mediante cursos o seminarios ms o
menos breves.
1.10.1.11 Preparacin y actualizacin de Informantes. Se confirma la
unidad de investigacin; se prepara una lista de todas las unidades que
conforman la poblacin objetivo y seleccionan la muestra.
1.10.1.12 Propagandas. La labor de enunciar la investigacin, para
disponer el nimo del pblico fuente de informacin, al tiempo que se da a
conocer el inters general de los resultados esperados.
1.10.1.13 La encuesta preliminar. Se realiza con el fin de tener un mayor
conocimiento sobre la poblacin objetivo y facilitar as, la prueba del
cuestionario. Permite adems chequear el clculo del costo y tiempo y la
variabilidad de las caractersticas en estudio.
1.10.2 RECOLECCIN: Terminada la etapa de planeamiento, se procede a
distribuir y a recoger los formulario, controlando el nmero de formularios
entregados y recogidos, al mismo tiempo verificando la calidad de las
informaciones obtenidas.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



21
La organizacin del trabajo de campo de recoleccin contemplan entre otros
siguientes puntos.
- Supervisin
- Control de encuesta
- Revisin de los cuestionarios inconclusos
- calidad y consistencia de las respuestas
- Cumplimiento de los plazos prefijados
- Distribucin de los entrevistados
Algunos errores que se pueden presentar en la recoleccin de los datos se
clasifican en:
- Errores de la medicin o cuantificacin de la caracterstica.
- Errores del entrevistador o influencia negativa del mismo.
- Mal diseo del cuestionario.
- Falta de instrucciones imprecisas.
Pueden presentarse algunos que afectan la recoleccin de los datos y que
deben ser corregidos:
- El informante no quiere suministrar los datos, alegando: estar
ocupado, motivo poltico, desconfianza de la investigacin no vale la pena
etc.
- El informante no puede responder por problemas, tales como en
enfermedad, incapacidad fsica, idioma, etc.
- La direccin del informante, la familia estaba paseando, hubo
demolicin del edificio, edificacin desocupada, etc.
1.10.3 PROCESAMIENTO Y ANLISIS: La informacin obtenida debe ser
depurada, clasificada, resumida y analizada, aplicando para ello adecuadas
tcnicas estadsticas. Los puntos ms importantes en esta etapa son:
1.10.3.1 Codificacin: Ya revisadas las respuestas obtenidas, se procede a
su codificacin: especialmente si se utiliza la tabulacin mecnica.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



22
El cdigo es un nmero que sustituye la respuesta cuando se va a hacer el
recuento. Ejemplo:
Numero de piezas producidas : En buen estado ===> 1
En mal estado ====> 2
Si el nmero de constelaciones pasa de nueve, se utiliza nmeros de dos
dgitos. Ejemplo:
Los establecimientos industriales por departamento: 01 Choco
02 Caquet
1.10.3.2 Tabulacin: puede ser manual o mecnica, dependiendo de la
calidad de los formularios, del nmero de preguntas, del tiempo y de los
recursos disponibles.
En la tabulacin mecnica se utiliza tarjetas perforadoras, las cuales
alimentan el computador. La ms conocida es la llamada HOLLERTH,
utilizado en las computadoras IBM.
La tabulacin manual se realiza mediante la elaboracin de cuadros, -
grficas y esquemas que faciliten el anlisis de la informacin y la inferencia
de conclusiones y recomendaciones.
1.10.3.3 Anlisis e Interpretacin: Esta etapa encierra dos aspectos:
anlisis y evaluacin estadstica de los resultados, anlisis y evaluacin
tcnica de acuerdo con la naturaleza de la investigacin.
1.10.3.4 Publicacin: Se realiza con el fin de hacer llegar a las personas
interesadas el resultado total del estudio. Se hace esencial presentar todos
los aspectos considerados en el proceso investigativo, adems de la
correspondiente validez que merezca las conclusiones.









___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



23
EVALUACION DE LA PRIMERA UNIDAD
1.1 Qu significa generalmente la palabra Estadstica para el hombre de l a
calle?
1.2 En qu contexto se utiliza la palabra Estadstica en las finanzas, el
mercado, la contabilidad y la Administracin?
1.3 Decir brevemente cules fueron las contribuciones debidas a los
siguientes estadsticos?
a) Adolph Quelet
b) Karl Friedrich gauss
c) Florence Nigh Tingale
d) Franco Galton
e) Karl Pearson
f) William s. Cosset
g) Ronald A. Fisher
1.4 Cules son las fuentes de estudio de las estadsticas?
1.5 Explique la diferencia existente entre Estadstica deductiva o descriptiva
y la estadstica inductiva o inferencial.
1.6 Diga cuatro fenmenos que abarca la estadstica y dos que no abarcan.
1.7 Diga cuatro finalidades de la Estadstica.
1.8 El proceso de proyeccin y preparacin de la investigacin se divide en
cinco fases: recoleccin, planeamiento, anlisis e interpretacin, elaboracin.
Ordene estas fases, como crea conveniente y explique brevemente cada
fase.
1.9 Se ha hecho un estudio para determinar si las amas de casa de Quibd,
Choc prefieren una marca especial de detergente, Entre las 50 amas de
casas entrevistadas, 30 dijeron que preferan esta marca.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



24
a) Qu constituye la muestra?
b) Qu constituye la poblacin?
c)cul es el estadgrafo muestral y cul es el parmetro de la
poblacin?

1.10 Una fbrica de gaseosas, proyecta lanzar al mercado un nuevo sabor.
Se realiza un Test de aceptacin de dicho sabor en una muestra de 30 nios
utilizando una escala de 10 puntos, para medir el grado de aceptacin.
Los puntos obtenidos en los 30 nios fueron los siguientes:
2 6 8 7 4 5 10 6 6 7 6 7 3 8 7
6 8 6 5 4 7 8 5 7 6 7 2 7 2 7
La muestra obtuvo compuesta por igual nmero de nios de ambos sexos,
de 5 a 12 aos de edad residentes en el Barrio Csar Conto de la ciudad de
Quibd.
a. Cual es la poblacin
b. Cul es la muestra?
c. Es cualitativa o cuantitativa?
d. Cul es la variable?
e. De que tipo es la variable
f. Qu clase de escala se ha utilizado en la medicin de la variable?
1.11 Se realiza un estudio en la ciudad de Istmina- Choc , a 150 familias de
clase media, para conocer el tipo de aceite manteca usado en la cocina;
los resultados son los siguientes:





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



25
Maz 14 Hogares.
Soya 65 Hogares.
Ajonjol 21 Hogares.
Compran. Aceite al detal sin especificar tipo 17 hogares.
Manteca de cerdo 21 Hogares.
Grasas de origen vegetal 6 Hogares.
Oliva 13 Hogares.

a. cul es la poblacin?
b. cul es el tamao de la muestra
c. Qu carcter tiene la poblacin
d. Cmo se explica que la suma de frecuencia sea superior al
nmero de hogares?
1.12 La siguiente tabla muestra el nmero de fanegadas de trigo y maz
producidas en la Granja La Mazorca durante el decenio 1977 a 1987.
AOS NMERO DE
FANEGADAS DE TRIGO
NMERO DE
FANEGADAS DE
MAZ
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
200
185
225
250
240
195
210
225
250
230
235
75
90
100
85
80
100
100
105
95
110
100



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



26

Con los datos de la tabla, determinar el ao o aos en los que:

a. Se produjo el menor nmero de fanegas de trigo

b. Se produjo el mayor nmero de fanegas de maz

c. Se produjo el mayor decrecimiento en la produccin de trigo

d. Se produjo un decrecimiento con relacin al ao anterior

e. Se produjo el mismo nmero de fanegas de trigo

f . Se obtuvo la mxima produccin entre los dos cereales.

1.13. De tres ejemplos de poblacin finita y tres de poblacin infinita.

1.14 Anotar I o F segn sean infinitas o finitas las siguientes poblaciones.

a. Las drogas producidas por una fabrica en un da

b. Resultados obtenidos en sucesivas tiradas de una moneda

c. Estudiantes de la Universidad Tecnolgica del Choc

d. Acciones vendidas cada da en la bolsa de valores

e. Papeletas extradas de una urna, en extracciones con
reemplazamiento.

1.15 Clasificar cada variable en las siguientes distribuciones:

a. Alumnos por mes de nacimiento

b. Profesionales por estatura y peso

c. Obreros por salarios

d. Accidentes por causas

e. Fallecimiento por edades.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



27
1.16 Ubicar en estadstica descriptiva o estadstica inferial cada uno de los
siguientes aspecto motivo de estudio estadstico:

a. Describir los grupos en trmino de promedio de estatura

b. Determinar la probabilidad de que muestras de observaciones sean
slo el de variaciones de azar.

c. En contar una diferencia consistente entre dos mtodos
especficos de enseanza.

d. Determinar la vida media de lmparas producidas por determinada
Fbrica.

e. Analizar la conducta de un grupo de escolares frente a una prueba
de lectura.


1.17 Seale con C las series de variables continuas y con D las de variables
discretas.

a. Distribucin de obreros pos salarios
b. Distribucin de fallecimiento por edades
c. Distribucin de alumnos por nmeros de hermanos
d. Distribucin de alumnos por estatura.

1.19 Contestar (V) verdadero o (F) falso, segn el caso.

a. Cdigo es la representacin cualitativa de un hecho cualitativo

b. Las instrucciones permiten diligenciar mejor el formulario.

c. Un formulario se precodifica para agilizar la codificacin

d. Un formulario debe llevar una sola clase de preguntas.

e. L a recoleccin de datos se puede hace mediante la observacin.

f. Despus de elaborar el formulario se define el objetivo de la
investigacin

g. Al recolectar informacin por medio de entrevistadores se tiene la
ventaja de que stos pueden observar el sitio de la operacin que se


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



28
est llevando a cabo.

h. Se conoce como fuente primaria aquella que obtuvo inicialmente la
informacin directamente de la persona o entidad.

i. Al disear un cuestionario no es de gran importancia la forma como
se hace la pregunta, siempre que sta sea clara.

j . No hay posibilidad alguna de que en una encuesta por correo se interprete
mal las preguntas de un cuestionario, siempre y cuando que la persona
que reciba sepa leer.

k. El examen de la documentacin y metodologa se efecta despus de
tabular la informacin.


1.20 Se ha dicho que en una investigacin se consideran tres etapas, las
que a su vez se subdividen en otras fases. Cules son? podra usted
reagrupar los titulares de este captulo en un ndice de temas de acuerdo con
estas etapas?

1.21 Mencionar algunos aspectos tcnicos y materiales que deben tenerse
en cuenta en el diseo de un formulario.

1.22 En los siguientes ejemplos, identifique: poblacin, muestra, variable y
escala de medicin.

- Varias veces durante el da un ingeniero de control de calidad, en una
fbrica de textil, selecciona diferentes muestras de metros cuadrados de
telas, las examina y registra en nmero de imperfecciones que
encuentra.

- Un investigador mdico examina los efectos de un agente cancergeno en
humanos. Tres meses despus de inyectado el agente en una persona,
el investigador realiza una operacin para extraer y pesar los tumores.

- Un gerente desea conocer si aquellos empleados que recibieron 30 das
de vacaciones son ms productivos durante el ao, que los que
recibieron slo 15 das. El gerente selecciona 140 trabajadores y registra
su rendimiento.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



29


UNIDAD 2.0
REPRESENTACION DE DATOS.







OBJETIVO
DE LA UNIDAD: Representar correctamente una informacin estadstica en
forma tabular y grfica, para hacer ms fcil su comprensin y analizar una tabla
para obtener mayor provecho en su lectura.
CONTENIDOS:
2.1 Distribucin de frecuencia
2.2 Distribucin de frecuencia simple
2.3 Distribucin de frecuencia por intervalo
2.4 Grficos Estadsticos
Evaluacin de la unidad



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



30
REPRESENTACION DE DATOS.
2.1 DISTRIBUCION DE FRECUENCIA
Una distribucin de frecuencia es un mtodo para organizar y resumir datos.
Tambin se conoce con el nombre de distribucin de frecuencia a una
ordenacin, tabulacin de datos en clases y con la frecuencia
correspondiente a cada una.
La toma de datos es la obtencin de una coleccin de los mismo, los cuales
no estn ordenados numricamente.
La ordenacin es la colocacin de los datos numricos en orden creciente o
decreciente de magnitud.
La diferencia entre el mayor y el menor nmero se llama RECORRIDO o RANGO
de los datos,
La construccin de la distribucin de los datos facilita la presentacin de
ellos o de la informacin y especialmente su anlisis.
Para elaborar los cuadros o tablas de la distribucin de los datos se debe,
antes que todo Identificar las caractersticas que se investigaron, ya que esto
permite una mejor clasificacin de lo observado, estas caractersticas
pueden ser:
a) Cualitativas o Atributos: Ventas en valor o cantidad, por sucursales,
empleados de una empresa por cargo, marca de droga ms aceptada,
exportacin por puertos, etc.
b) Cuantitativas: Clasificacin de empleados por sueldo, tiempo de reaccin
de cierta droga, Kilmetros recorridos diariamente por vehculo, clasificacin
de familias por nmero de hijos etc.
2.2. DISTRIBUCIN DE FRECUENCIA SIMPLE
Antes de pasar a realizar ejercicios que nos de una claridad con respecto a la
distribucin de frecuencia simple presentaremos la siguiente sismologa:
n : Tamao de la muestra, es el nmero de observaciones.
Xi : La variable, es cada uno de los diferentes valores que se han
observando.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



31
La variable Xi, toma los X1, X2, ... , Xn valores. Tambin se le llamar marca
de clase.
Fi : la frecuencia absoluta o simplemente frecuencia, representa el nmero
de veces que se repite la observacin X
i
, F2 el nmero de X2 etc.
Fa : la frecuencia acumulada, se obtiene acumulando la frecuencia absoluta,
y siempre nos da un acumulado igual al tamao de la muestra.
Fr : frecuencia relativa, resulta de dividir cada una de las frecuencias absoluta
por el tamao de la muestra.
Fra: Frecuencia relativa acumulada, resulta de la acumulacin de las
frecuencias relativas, esta frecuencia siempre tiende a la unidad.


TABLA Nro1
1-1-2-2-2-3-3-6-4-1-2-3-4-2-7-2-1-1-4-2-0-1-2-5-1-0-1-8-2-6-2-1-3-1
2-0-1-0-0-4-2-1-4-2-3-0-1-2-2-4-0-0-1-2-0-3-2-2-2-3 -

Para hacer la respectiva distribucin de dichos datos es conveniente que
presentemos las siguientes tablas:


EJEMPLO: Los resultados obtenidos en un encuesta a 60 personas acerca del
nmero de veces que han visitado a su mdico para ver el grado de
concentracin de cierto mineral en el tejido (ppm) fueron los siguiente:



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



32

Encuesta realizada a 60 personas sobre el nmero de veces que han visitado
a su mdico para comprobar un ppm (datos ordenados).
TABLA N 2 : ORDENACIN DE LOS DATOS
0-0--0-0-0-0-0-0-0-1-1-1-1-1-1-1-1-1-1-1-1-1-1-2-2-2-2-2-2-2-2-2
2-2-2-2-2-2-2-2-2-2-3-3-3-3-3-3-3-4-4-4-4-4-4-5-6-6-7-8.

Encuesta realizadas a 60 personas sobre el nmero de veces que han
visitado a su mdico por comprobar su PPM (recuento de efectivo).
TABLA No 3 : CONTEO DE DATOS
N DE VECES N DE PERSONAS
(conteo)
VECES QUE SE REPITE
0
1
2
3
4
5
6
7
8
IIII IIII I
IIII IIII IIII II
IIII IIII IIII IIII III
IIII III
IIII II
I
II
I
I

9
14
19
7
6
1
2
1
1
SUMAS 60





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



33
Distribucin de frecuencia de la encuesta realizada a 60 personas sobre el
nmero de veces que han visitado a su mdico para comprobar su ppm.
TABLA N 4

Xi

Fi

Fa

Fr

Fra

0 9 9 = 9 9/60 = 0.15 0.15 = 0.15
1 14 9 + 14 = 23 14/60 = 0.233 0.15 + 0.233 = 0.383
2 19 23 + 19 = 42 19/60 = 0.316 0.383 + 0.316 = 0.699
3 7 42 + 7 = 49 7/60 = 0.116 0.699 + 0.116 = 0.815
4 6 49 + 6 = 55 6/60 = 0.1 0.815 + 0.1 = 0.915
5 1 55 + 1 = 56 1/60 = 0.016 0.915 + 0.016 = 0.931
6 2 56 + 2 = 58 2/60 = 0.033 0.931 + 0.033 = 0.964
7 1 58 + 1= 59 1/60 = 0.016 0.964 + 0.016 = 0.98
8 1 59 + 1 = 60 1/60 = 0.016 0.98 + 0.016 = 0.996
SUMAS 60

En la prctica, cuando se posee confianza en el ordenamiento y conteo de
los datos , no es necesario tantas tablas, se puede pasar de la tabla No 1
directamente a la tabla Nro.5.








___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



34
Distribucin de frecuencia en la encuesta realizada a 60 personas sobre el
nmero de veces que han visitado a su mdico para comprobar su ppm.

TABLA N 5

Xi
Fi Fa Fr Fra
0 9 9 0.15 0.15
1 14 23 0.233 0.383
2 19 42 0.316 0.699
3 7 49 0.116 0.815
4 6 55 0.1 0.915
5 1 56 0.016 0.931
6 2 58 0.033 0.964
7 1 598 0.016 0.98
8 1 60 0.016 0.996
SUMAS n =60


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



35
- Analizando las columnas porcentuales Fr y Fra se puede tener entre otras
las siguientes conclusiones:
- El 31.6% de los encuestados ha visitado dos veces a su mdico
- El 15% de los encuestados respondi no haber visitado a su mdico con
ese objetivo.
- Solo el 1.6% lo ha visitado 8 veces.
-El 69.9% o 70% han visitado a su medico entre 0 y 2 veces
2.3 DISTRIBUCIN DE FRECUENCIA POR INTERVALOS
Como se ha visto, un conjunto de observaciones puede hacerse ms
comprensible y adquirir mayor significado por medio de un arreglo ordenado;
puede lograrse una mayo sntesis, agrupando los datos. Para agrupar a un
conjunto de observaciones, se selecciona un conjunto de intervalos,
contiguos, que no se traslapen, tales que cada valor en el conjunto de
observacin puede colocarse en uno, de los intervalos de clase.
Unos de los primeros puntos a considerar, cuando se van agrupar ciertos
datos, es cuntos intervalos van a incluirse. Demasiado poco no es
conveniente debido a que hay perdida de informacin. Por otra parte, si se
usan demasiados intervalos, no se logra objetivo de la sntesis.
La mejor gua en relacin con lo anterior, a s como para otras decisiones
que deben tomarse al agrupar los datos, es el conocimiento que se tenga de
ellos. Pueda ser que se hayan tomado con anterioridad, los intervalos de
clase de aos anteriores con fines de comparacin. Una de las formas para
obtener el nmero de intervalos (#
i
) es aplicando la regla de STURGES, con
la cual se obtiene una aproximacin aceptable sobre el nmero de intervalos
necesarios para agruparlos:
#i = 1 + 3.3 Log n
Donde n nos representa el nmero de valores considerados, esta regla de
STURGES no se considera como final, sino slo como una gua. El nmero
de intervalos especificado por medio de esta regla debe aumentarse o
disminuirse segn convenga y el beneficio de una presentacin clara.
Otra cuestin que hay que aclarar es lo relativo a la amplitud de los
intervalos de clase.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



36
Aunque a veces es imposible, por lo general, los intervalos deben ser
amplitudes iguales. Puede determinarse esta amplitud (A) dividiendo el
recorrido ( R) entre el nmero de intervalo (#i ):
A = R / #i
Como regla, este procedimiento proporciona una amplitud que no es
conveniente usarla. Una vez ms, debe aplicarse el buen juicio y seleccionar
una amplitud (por lo comn, prxima a la dada por la ecuacin) que sea ms
conveniente.
Consideramos el siguiente Ejemplo:
En un estudio de 50 sujetos entre las edades de 20 y 60 aos sobre el valor
del rendimiento del electroencefalograma. Se dieron los siguientes datos.
98 75 95 100 64 70 75 95
63 72 82 98 58 56 70 49
55 50 61 60 70 75 71 93
98 100 62 66 50 92 70 58
66 69 73 77 120 104 119 105
99 60 70 102 120 90 71 78
65 56

Antes de elaborar una tabla o cuadro de frecuencia por intervalos se debe
tener en cuenta los siguientes pasos:

1. Se determina el valor mximo y mnimo de Xi
Xmin = 49 X mx = 120
2. Sacamos la diferencia entre el valor mximo y el mnimo que
denominaremos rango o recorrido. (R):


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



37
R = X mx - X mn = 120 - 49 = 71
3. Se hace necesario determinar el nmero de intervalo (# i) que se utilizar
para agrupar los datos:
#i = 1+3.3 Log n
#i = 1+3.3 Log 50
# i = 1+3.3 (1.69897)
# i = 1+5.60
# i = 6.6
En la prctica el #i se determina atendiendo varios factores, tales como:
finalidad del estudio, grado de variabilidad de los datos , necesidad de
efectuar comparaciones. En todo caso, se recomienda que el #i hasta donde
sea posible, no sea menos de 5, ni mayor de 16, en nuestro caso
tomaremos 7 intervalo ya que no se puede tener 6.6 intervalos.
4. Una vez determinado el nmero de intervalos se debe dividir el rango por
el este valor para obtener el valor de la amplitud de cada intervalo,
aplicando la formula
A = R / #i
A = 71/ 7 = 10.14
Para facilitar los clculos se aproximar A = 11, por lo tanto se altera el valor
del rango de 71 a 77 en 6 unidades.
Cuando ste caso sucede se tendr un quinto paso, que denominaremos
rango ampliado ( Ra ) que es igual rango( R ) ms un incremento (a).
R a = R + a
5. A = Ra / #
i
= 71 + 6 /7 = 77/ 7 = 11
6. El incremento a del rango se debe distribuir equitativamente entre
el dato mayor y el dato menor, al dato mayor se le suma a/2 y al dato menor
se le resta a/2, con esto no podemos descartar la palabra equitativo


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



38
pues es opcional para cada trabajo que se elabora; en nuestro caso el
incremento es de 6 unidades, luego:
Xmx = 120 + 3 = 123
X mn = 49 3 = 46
Por tanto se tendr un nuevo dato mayor o lmite superior de 123 y un lmite
inferior de 46.
7. Se procede a elaborar los intervalos empezando con el nuevo dato
menor y sumndole la amplitud, as:
1 46 a 57
2 57 a 68
3 68 a 79
4 79 a 90
5 90 a 101
6 101 a 112
7 112 a 123

8. Por ltimo se elabora la tabla de frecuencias con sus respectivos
punto medios ( Xi ) o marca de clase, el cual se determina sumando
el lmite superior y el limite inferior de cada intervalo dividendo por dos
esta suma.






___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



39
INTERVALOS Xi Fi Fa Fr Fra
46 - 57 51.5 6 6 0.12 0.12
57 - 68 62.5 11 17 0.22 0.34
68 - 79 73.5 15 32 0.30 0.64
79 - 90 84.5 1 33 0.02 0.66
90 - 101 95.5 11 44 0.22 0.88
101 - 112 106.5 3 47 0.06 0.94
112 - 123 117.5 3 50 0.06 1.00
SUMAS 50
Como conclusin podemos decir:
- el 30% de los sujetos poseen un rendimiento de su electroencefalograma.
entre 68 y 79, y son 15 sujetos.
- El 2 % lo poseen entre 79 y 90, y es un sujeto.
- Solo el 6% se encuentra en un rendimiento entre 112 a 123, y son 3
sujetos
- El 66 % de los sujetos posee un rendimiento entre 46 y 90 y son 33 sujetos.








___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



40
2.4 GRFICAS.
Un grfico es un mtodo de presentar datos estadsticos de forma visual.

Hay numerosos tipos de graficas, como lo veremos al utilizar los programas
estadsticos en la computadora; por lo general, se clasifican en :

a. Diagramas: de puntos, lineales(rectilneos y curvilneos),
superficiales(rectangulares-barras-, triangulares, cuadrados y
circulares-pastel-).

b. Estereometras: cbicas, prismticas y pirmides.


c. Pictogramas.

d. Cartogramas: mapas estadsticos y cartodiagramas.

2.5 GRFICAS LINEALES.
Un grfico de lnea se distingue por el hecho de que las variaciones en los
datos se indican por medio de lneas o curvas, cuyas posiciones est
determinadas por sus respectivos valores en las escalas X e Y los puntos se
unen mediante lneas rectas. Hay diferentes tipos de grficos lineales:
2.5.1 GRFICOS DE SILUETA
Son grficos de lneas que muestran las desviaciones positivas y negativas
respecto a la lnea base o cero y la lnea de evolucin de las, desviaciones,
los grficos de silueta se construyen representando los puntos que indican
las desviaciones reales respecto a la lnea base.

2.5.2 GRFICOS DE BANDAS
Muestran las variaciones de las partes componentes as como total, el grfico
se prepara representando en primer lugar las variaciones de la parte
componente mayor. Se sombrea o se raya este segmento. A ste segmento
se suma la siguiente parte componente y se representa el resultado. Este
proceso acumulativo se prosigue hasta incluir todas las partes
componentes.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



41
Las variaciones de la lnea superior representan, entonces las del total, las
variaciones en el ancho de cualquier segmento indicarn las variaciones de
ese componente particular.
2.5.3 GRFICOS DE MXIMO Y MNIMO
Presentan no solo los cambios ocurrido durante el periodo de tiempo, si no
tambin las fluctuaciones de cada periodo (das, semanas, meses etc.)
indicando valores mximo del mismo periodo. Este procedimiento se
continua hasta el fin del tiempo cubierto por el grfico.
2.5.4 EL HISTOGRAMA:
Conocido como polgono de frecuencias rectangular para una distribucin de
frecuencia; se construye de la siguiente forma: Se dibujan rectngulos cuya
base es el tamao del intervalo de clase y cuya altura es la frecuencia de
cada intervalo de clase.
2.5.5 GRFICAS LOGARTMICAS Y SEMILOGARITMICAS
2.5.5.1 CARACTERSTICAS:
a. No hay lnea base o cero.
b. Los grficos semilogartmicos presentan una escala aritmtica en el eje
horizontal. Los grficos logartmicos presentan escalas logartmicas en
ambos ejes.
c. Cuando se presenta en un papel logartmico las progresiones geomtricas
en X y en Y se disponen segn una recta, ya que los logaritmos de una
progresin geomtrica forman una progresin aritmtica.
En un papel semilogartmico, si los valores de y constituyen una progresin
geomtrica se dispondr tambin segn una recta.
d. Aumento disminuciones iguales indican cambios porcentuales iguales.
e. Iguales pendiente en un grfico logartmico revelan taza de cambios
iguales.
2.5.5.2 UTILIZACIN DE LOS GRFICOS LOGARTMICOS:
2.5.5.2.1. Para comparar tasas proporcionales de cambio.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



42
2.5.5.2.2. Mostrar la relacin entre 2 ms series cuyas cantidades difieren
ampliamente.
2.5.5.3 PRECAUCIONES AL USAR GRFICAS SEMILOGARITMICAS:
Hemos hecho notar que este tipo de presentacin grfica se adapta bien
para permitir un anlisis de cambios relativos. Existe un peligro de que las
personas, antes de adquirir experiencia con las grficas semilogartmicas,
deseen usarla en cualquier circunstancia.
Una segunda precaucin se refiere a la necesidad de comprensin especial
de una grfica semilogartmica. Algunas personas no saben como
interpretar una grficas semilogartmica; por esta razn, este tipo de
grficas, no se usan a veces, an cuando resultara ms apropiado. Sin
embargo, tal interpretacin de una grfica semilogartmica es tan simple que
la persona que debe observar una grfica puede ser entrenada para su
interpretacin en unos cuantos minutos.
2.5.6 GRFICOS CUADRATICOS.
Para la presentacin grfica de datos estadsticos, se recurre en algunos
casos a figuras geomtricas, tales como cuadros y los tringulos.
Estas grficas deben ser simples, es decir, no se deben recargar demasiado.
Hay varias formas de hacer la representacin grfica mediante la utilizacin
de cuadros. Con figuras continuas que queremos representar la distribucin
porcentual de los factores que se deben tener en cuenta en anlisis de una
empresa.
2.5.7 REGLAS PARA LA CONSTRUCION DE LOS GRFICOS.
2.5.7.1.Cada grfico debe tener un ttulo claro y conciso, que se sitan
generalmente en la parte superior central del grfico. El ttulo debe incluir
informacin sobre:
2.5.7.1.1 La naturaleza de los datos
2.5.7.1.2 La situacin geogrfica
2.5.7.1.3 El perodo de tiempo cubierto
2.5.7.2 Las lneas coordenadas deberan reducirse al mnimo y las lneas
curvas puestas de tal forma que resaltasen sobre el fondo del grfico.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



43
2.5.7.3 La fuente de los datos debera indicarse debajo del grfico a la
izquierda.
2.5.7.4 Las notas, si la hay, se deberan situar en la parte inferior izquierda
del grfico.
2.5.7.5. Para entender fcilmente el grfico, se debera reducir en la medida
de los posibles el nmero de lneas curvas, segmentos y otros detalles.
2.5.7.6 Cada escala debe presentar un titulo indicando la unidad utilizada,
2.5.7.6.1 El ttulo correspondiente al eje X debera estar centrado,
inmediatamente debajo del eje.
2.5.7.6.2. El ttulo del eje y debera situarse en la parte superior del eje.
2.5.7.7 Se debe indicar el cero de la escala ( eje y) de lo contrario se puede
realizar una comparacin errnea. La necesidad de indicar el origen se
evidencia en la comparacin de los picos de los dos grficos.

2.5.7.8 En el eje y la escala de valores debera abarcar desde cero (0)
desde el valor mas pequeo en la parte inferior del grfico, al valor mas alto
en su parte superior.
2.5.8 ESCALAS.
2.5.8.1 ESCALA ARITMTICA: El papel con escalas aritmtica presenta
distancias iguales entre las lneas coordenadas. Cantidades iguales
equivaldrn entonces, a iguales distancias. As, las distancias entre 1 y 3
ser la misma que entre 8 y 10.
2.5.8.2 Los valores de las escalas deben situarse a lo largo de los ejes x e y,
dando as una indicacin general del tamao de las variaciones que
representa el grfico. no es necesario indicar una graduacin fina en la
escala de valores , ya que no se pretende que se lean las cifras reales en el
grfico. Los valores exactos se pueden obtener de la tabla de datos original
que usualmente acompae el grfico.
2.5.8.3. Si se utiliza una longitud, en eje X, para indicar un intervalo de
tiempo el punto representativo del valor de cada perodo debera marcarse el
punto central del perodo. Pero si se desean los perodos pueden hacerse
coincidir con lneas coordenadas dadas, trazndose entonces los puntos en
ellas.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



44
2.5.8.4 ESCALA LOGARTMICA Y SEMILOGARITMICAS: Cuando se desea
comparar cambios porcentuales en lugar de absolutos, se utiliza un tipo de
escala algo diferente.
Se puede demostrar que cuando hay cambio porcentual constante entre 2
pares de cifras, las diferencias entre los logaritmos de las cifras sern
iguales. As, si el lugar de los valores originales se representan los logaritmos
de esos valores, las diferencias constantes equivaldrn a cambios
porcentuales constantes.
NUMERO LOGARITMO
2 0.30103
4 0,60206
.
Diferencia 0,30103 100% de aumento

NUMERO LOGARITMO
5 0.69897
10 1.0000
________
Diferencia 0.30103 100% de aumento

2.5.8.5 TIPOS DE ESCALAS:
2.5.8.5.1 UNIFORME: Previamente determina un valor representativo para
cada uno de los valores reales del dato que se debe representar.
2.5.8.5.2 LOGARTMICAS: Las escalas representaciones de valor se hace
aplicando el logaritmo.
Las grficas respectivas se elaboran en papel logartmico semilogartmico.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



45
2.6. GRFICAS ESTADSTICAS.
Hay numerosas grficas estadsticas, especialmente aquellas que son
consideradas como las ms usuales, teniendo en cuenta que estas deben
ser sencillas, explcita y se representa siempre de izquierda a derecha y de
abajo hacia arriba.
A continuacin daremos algunos conceptos y ejemplos de grficas ms
usuales en estadstica.
2.6.1. DIAGRAMAS DE BARRA:
Es la representacin visual mediante rectngulos de la relacin entre las
variables.
Las barras utilizadas para representar las caractersticas cualitativas y
cuantitativa por lo general, son construidas en forma vertical sobre una base
horizontal, en el cual se colocan las caractersticas o el tiempo,(aos,
meses, etc) y la altura estar dada por el valor que toma la variable o atributo
observado.
Tambin se elabora el diagrama proporcional de barras cuando se trabaja
con grupos relativamente pequeos y se desea establecer comparaciones
entre dos o ms distribuciones proporcionales.
2.6.2.HISTOGRAMA Y POLGONO DE FRECUENCIAS.
2.6.2.1 HISTOGRAMA. Son representaciones grficas de las distribuciones de
frecuencias, que consiste en una serie de rectngulos, cada uno de ellos
levantados en cada intervalo, de tal manera que la base sera igual a la
amplitud y la altura estar dada ya sea por la frecuencia absoluta o por la
relativa, si los intervalos son desiguales las alturas de los rectngulos
debern ser calculadas por procedimientos matemticos, para que en la
grfica, no nos quede una imagen engaosa de la distribucin que se quiere
presentar.
2.6.2.2 POLGONO DE FRECUENCIAS. Se puede representar con la misma
informacin del histograma, mediante la unin de los puntos medios de los
techos de los rectngulos en el histograma por medio de una lnea
prolongada en el primero y ltimo rectngulo. Los polgonos tambin se
pueden dibujar estableciendo los puntos medios del intervalo, denominados
marcas de clases, que se colocan en el eje horizontal o abscisa, para cada
valor de la variable corresponder un valor de la frecuencia, sealndose en


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



46
el plano cartesiano por un punto, luego de establecido todos los puntos se
unen mediante lneas rectas, las que en conjunto forman el polgono.
2.6.3 OJIVA. Para el trazado de esta grfica, se emplea tambin el
polgono, para presentar la frecuencia acumulada y la frecuencia acumulada
relativa, se ubican los puntos en el plano cartesiano y se unen mediante
segmentos de rectas y el grfico as obtenido se llama polgono de
frecuencia u ojiva.
La ojiva o polgono de frecuencia acumulada tiene la ventaja de que da una
manera cmoda de estimar la mediana y los percentiles de una muestra,
otra ventaja que tiene es que se puede averiguar fcilmente el nmero de
partida entre dos valores por ej. el nmero de partida entre 56.5 y 62.5 es
simple la diferencia entre las correspondientes frecuencias acumuladas; o
sea entre 3 y 20 es 17 ; Este mtodo opera bien solamente para los valores
y puntos que estn efectivamente representados.
El histograma, el polgono y la ojiva, se utilizan para representar la variable
continua, y los diagramas de frecuencias para la variable discreta.
2.6.4 DIAGRAMA CIRCULAR: Se utiliza para representar caractersticas
cualitativas, sirve para notar las diferencias en las proporciones o porcentajes
en que est dada la distribucin.
Como en total la circunferencia tiene 360, se calcula a cuantos grados
( sector circular ) equivale la parte que se va a representar. El procesos
que sigue en la confeccin de la grfica circular o pastel consiste:
En hacer la sumatoria total de las frecuencias, luego para sacar el
porcentaje se multiplica cada frecuencia por el 100% y se divide por el total
de la frecuencia, pero en este caso no es necesario; ya sacado el porcentaje
de todas las frecuencias, se llevan a grados, multiplicando 360 por cada
frecuencia en porcentaje dividindola por 100.
2.6.5 PICTOGRAMAS O PICTOGRAFOS: Se emplean cuando se trata de
llamar la atencin al pblico.
Las figuras empleadas deben explicarse por s misma. Se acostumbra que el
tamao sea uniforme, en algunos casos, se acostumbra colocar o sealar el
valor total del conjunto buscado de esta manera la eliminacin del cuadro.
Algunos autores sealan que el tamao puede variar, y ,la altura de cada
objeto estar dada por la frecuencia absoluta o relativa, pero una inmensa
mayora considera que dicha representacin puede conducir a errores


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



47
en su interpretacin, especialmente cuando los tamaos de la figuras no son
proporcionales a la cantidad que se representa.
2.6.6.CARTOGRAMA :Son croquis o mapas que contienen datos estadsticos
u otros de carcter no cartogrficos, dentro de los cuales se ubican smbolos
y en algunos casos grficas, para indicar tanto la localizacin geogrfica, as
como la importancia del valor de la variable observada en la relacin con el
conjunto.
2.6.7 DIAGRAMA DE LNEAS. Es otra de las grficas muy utilizadas, pero al
mismo tiempo, la que presenta mayores dificultades en la visualizacin de los
datos, dando lugar, algunas veces, a imgenes o conclusiones errneas,
debido a la mal confeccin de las escalas de los ejes.
A los diagramas lineales tambin se les denomina curvas de sucesin,
porque generalmente se refieren a variables observadas durante un periodo.
Se denominan series de tiempo o series cronolgicas. La variable tiempo se
coloca en el eje horizontal y los valores que toman la variable, van al eje
vertical.
2.6.8.CUADROS Y TRINGULOS. Para representacin grficas de datos
estadsticos, se recurre a la figura geomtrica como los cuadros y
rectngulos.
Estas grficas deben ser simples y es aconsejable superponer las figuras
en lugar de yuxta - ponerlas.
Hay varias formas de hacer la presentacin grfica mediante la utilizacin de
los cuadros, una la ms recomendadas es que, antes que todo, identificar
las caractersticas que se investigaron, ya que esto permite una mejor
clasificacin de lo observado, ya que estas caractersticas pueden ser
cualitativas o atributos y cuantitativas.
En la grfica mediante la utilizacin de tringulos se debe buscar una base
comn y luego localizar la altura, como tambin son utilizados tringulos
donde cada uno de ellos tiene una base diferente.
Otra forma es, determinando zonas proporcionales a las cantidades
representadas y tener una clara diferencia entre las zonas demarcadas al
igual que anexar los signos convencionales correspondientes.
2.6.9. GRFICA DE CANTT. La utilizacin de estas grfica se hace con
mayor necesidad, en la direccin de empresas, en la cual establecen las
diferentes etapas de trabajo por ejecutar y el ejecutado durante un


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



48
determinado perodo. El campo de aplicacin de esta grfica es muy vasto,
siendo imposible en esta investigacin la descripcin de todas las formas y
usos que tiene.
2.6.10 PIRMIDES. Las grficas denominadas pirmides son utilizadas con
mucha frecuencia para representar las edades de una poblacin de una
regin. Si en un tringulo se determinan zonas proporcionales a las
cantidades representadas y hay diferenciacin entre las zonas demarcadas,
al igual que anexar los signos convencionales correspondientes, la grfica
as elaborada se denomina pirmide.

EJEMPLO: Los siguientes datos representan la distribucin de los gastos en
millones de pesos, de las empresas la Mazorca y El diamante en un
determinado periodo:

EMPRESAS SALARIOS ALQUILER IMPUESTO PUBLICIDAD
LA MAZORCA 20.4 47.5 39.8 20.4
EL DIAMANTE 30.6 38.6 34.6 31.6



1.0 Grfico de barra.
Gasto en millones de pesos de las empresas la Mazorca y el Diamante
durante un periodo contable

0
10
20
30
40
50
Salario Alquiler Impuesto Publicidad
La mazorca
El Diamante

Fuente: Divisin Financiera





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



49



2.0 Grfico circular
Gasto en millones de pesos de las empresas la Mazorca y el Diamante
durante un periodo contable


16%
37%
31%
16%
Salario
Alquielr
Impuesto
Publicidad
Fuente: Divisin Financiera
















___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



50









3. Grafico de cilindro

Gasto en millones de pesos de las empresas la Mazorca y el Diamante
durante un periodo contable


0
20
40
60
80
100
Salario Alquiler Impuesto Publicidad
El Diamante
La Mazorca
Fuente: Divisin Financiera.














___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



51


4. Grafico de Lneas.

Gasto en millones de pesos de las empresas la Mazorca y el Diamante
durante un periodo contable


0
20
40
60
80
100
Salario Alquiler Impuesto Publicidad
El Diamante
La Mazorca
Fuente: Divisin Financiera.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



52

EVALUACION SOBRE LA UNIDAD N 2

2.1 Construir un diagrama circular para la siguiente distribucin.

Distribucin porcentual del numero de personas vacunadas
segn tipo de vacunas (1986 - 1987)


TIPO DE VACUNA PERSONAS
VACUNADAS
PORCENTAJE
DPT
POLIO
BCG
SARAMPIN
TOTAL
48.958
55.068
46.884
46.450
197.360
24.81
27.9
23.76
23.53
100.00


2.2 Construir un diagrama de lnea que visualice los datos de la siguiente
tabla que muestra los depsitos y prstamos de las entidades financieras de
esta ciudad.


ENTIDAD DEPOSITO (MILES DE $) PRESTAMOS (MILES DE $)
Sistema Bancario 1
Caja Agraria 2
UPAC 3
Corporaciones
Financieras 4

8699.699
2517.702
3303.211
368.218
7145.909
6609.804
2212.117
610.281


2.3 Construir un diagrama de barra con los datos que se muestran en la
tabla que representan los servicios de salud en hora aos medicas,
odontolgicas y de enfermera, segn subsectores.





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



53
SUBSECTORES
OFICIAL Y MIXTO SEGURIDAD
SOCIAL
PRIVADO TOTAL
MDICOS
ODONTOLGICOS
ENFERMERA
178.348
115.500
112.000
120.746
51.952
18.680
13.212
13.380
00
312.308
180.832
130.680


2.4 Elaborar un diagrama triangular que represente las extensiones
territoriales de los pases Bolivarianos.

PAS REA (KM)
BOLIVIA
COLOMBIA
ECUADOR
PER
VENEZUELA
1099.000
1138.000
284.000
1285.000
916.000


2.5 Los aviones agrcolas como modernas mquinas agrcolas, participan
cada vez ms en gran nmero de trabajo. Aproximadamente unos 60 pases
con unos 19.000 aviones tratan al rededor de 200.000.000 hectreas segn
la (FAO). A continuacin aparecen algunos datos referentes a diversos
pases. Elaborar un pictograma que visualice los datos presentados.

PAIS N DE AVIONES
URSS
EE. UU.
CANAD
ARGENTINA
MXICO
RDA
RFA
8.000
6.100
666
450
450
100
2.030

2.6 Para formar las curvas de calibracin para estimacin de la
concentracin de protombina, se considera arbitrariamente que el plasma de
un sujeto normal tiene una concentracin de 100%. Con suero salino se
prepara una serie de diluciones de esta muestra y se mide un tiempo que se
requiere para la coagulacin despus de agregar una mezcla de cloruro de
calcio y trasmboplastina. La tabla siguiente ilustra el tipo de dato que se
tiene.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



54


CONCENTRACIN NOMINAL DE
PROTOMBINA, X
TIEMPO EN SEGUNDOS QUE SE
REQUIERE PARA QUE
APAREZCA UN COAGULO , Y
100
50
25
15
14
18
22
24

Representar los puntos en una grfica de Y en funcin de X y trazar la curva
a mano alzada a travs de esos puntos.

2.7 En un sujeto cuyo nivel de glucosa en sangre en ayunas es de 100
mg/100ml, se inyectan por va intravenosa 50 gr de glucosa. Se miden
muestra de sangre, con intervalos de media hora, obteniendo los resultados
siguientes:



MINUTOS DESPUS DE LA INYECCIN Mg/100 ml DE GLUCOSA EN
SANGRE
30
60
90
120
161
128
119
108


Trazar la grfica del logaritmo del aumento en la concentracin de azcar en
la sangre, en funcin del tiempo.







___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



55


2.8.- Srvase registrar ( F ) dentro del parntesis en caso de que el
enunciado sea completamente falso y ( V ) verdadero en caso contrario.


El grfico circular (pastel) lo usamos para representar variables cualitativas
( )

La elaboracin del pictograma exige que sobre el eje x vaya la variable de
inters ( )

La parte inicial en la construccin de un formulario debe contener las
preguntas acerca del tema de inters. ( ).

El grfico de barras simple y el de pastel se utiliza cuando la variable es de
naturaleza cualitativa ( )

En el procesos de investigacin estadstica, la seleccin de las variables a
estudiar se realiza independientemente de los objetivos o hiptesis de
investigacin. ( )

Toda investigacin cientfica debe contar con el mtodo estadstico como su
nico auxiliar. ( )

Las tablas estadsticas son arreglos de datos expuestos en filas y columnas
para su manejo y presentacin. ( )

Para utilizar un polgono de frecuencias, la variable debe ser de naturaleza
cuantitativa continua y deber ocupar la ordenada del sistema del
coordenadas cartesianas ( )

Kilogramos, onza y libra son unidades de medida de la variable peso ( )

Toda variable cuantitativa puede ser transformada para ser manejada a un
nivel de medicin nominal u ordinal ( ).


2.9 A cada espacio en blanco que aparece en la columna A, escribir la letra
correspondiente de la columna B (respuesta) que usted crea es la respuesta
correcta. Cada expresin de la columna B, puede ser utilizada como
respuesta en A ms de una vez.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



56
COLUMNA A COLUMNA B

Elementos que permiten cuantificar A. Los porcentajes
la unidad de anlisis

Permiten visualizar el comportamiento B. El coeficiente de Asimetra
real y objetivo del objeto de estudio.

Permiten tener un conocimiento de D. El coeficiente de variacin
la variable desde el centro de la serie.


Como medida de dispersin est E. Desviacin estndar
asociada con la media.

Permiten describir el comportamiento F. El saber cotidiano
de una variable cuantitativa.

Permite comparar la variabilidad o G. Unidad de observacin
heterogeneidad que presentan dos
variables con igual unidad de medida

Utiliza los numerales como cdigos H. Grfico de lneas
para establecer una categorizacin.


Se utiliza para conocer el grado I. Medidas de tendencia
central de simetra que presenta la
Distribucin de una variable.

Permiten describir el comportamiento J. Medidas de resumen
de una variable cualitativa.
K. Histograma de frecuencias


2.10 Dentro de un estudio de clima organizacional en una unidad local de
salud que cuenta con 55 empleados, se tom una muestra de 15 empleados
en los cuales se evalu en nivel motivacional, y, la aplicacin del test arroj
los siguientes resultados calificados con una escala de 1 a 5 y 30 tem.


42 36 65 70 42 58 66 65 58 90 85 70 90 66 36




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



57
Con base en la informacin anterior precisar:


Cul es la variable de estudio? -------------------------------------------------------------
-----------------------------------------------------------------------------------------------

Cul es la naturaleza de la variable de estudio? y nivel de medicin ------------
--------------------------------------------------------------------------------------------------

Cul es la unidad de medida de la variable?.---------------------------------------

Cul es la unidad de anlisis? ----------------------------------------------------------

Cul es la muestra? ----------------------------------------------------------------------

Cuantos valores diferentes tiene la variable? ----------------------------------------

Cul es el universo? -----------------------------------------------------------------------

Cul es el puntaje mximo que se puede esperar en el test para una
persona? -------------------------------------------------------------------------------------

Cul es la frecuencia absoluta para cada valor de la variable? -------------------
-------------------------------------------------------------------------------------------------

Cul es el puntaje mnimo que se puede esperar en el test de una persona?
---------------------------------------------------------------------------------------------------


2.11 Los siguientes datos agrupados corresponden a las Estaturas de 98
estudiantes, hombres, que participaron en un estudio titulado Desarrollo de
las medidas Craneofaciales de crecimiento de poblacin X. En uno de los
objetivos de la investigacin, se requera hacer una descripcin de talla inicial
de las personas bajo estudio, para efectos comparativos posteriores.





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



58

Distribucin porcentual de las Estaturas de 98 hombres, en un estudio sobre
Desarrollo de las Medidas Craneofaciales y de Crecimiento. Medelln, 1.995

INTERVALO
S
Marcas de
clase Xi
Frecuencia
absoluta
Fi
Frecuencia
acumulada
Fa
Frecuencia
Relativa en %
Fr
Frecuencia
Relativa
Acumulada %
Fra
1.47 1.53 1.50 9 9 9.2 9.2

1.53 - 1.59 1.56 18 27 18.4 27.6


1.59 - 1.65
1.62 20 47 20.4 48.0

1.65- 1.71
1.68 16 63 16. 64.3

1.71 - 1.77
1.74 19 82 19.4 83.7

1.77 -1.83
1.80 8 90 8.2 91.9

1.83 - 1.89
1.86 5 95 5.1 97.0

1.89- 1.95
1.92 3 98 3.0 100.0


Tomando como referencia el cuadro anterior, una o unas de las siguientes
afirmaciones es o son falsa:

a.- La estatura que predomina en el estudio es 1.62 mts.

b.- A lo sumo el 48% de las estaturas est entre 1.47 mts y 1.65

c.- El 48% de las Estaturas est entre 1.59 mts y 1.65 mts

d.- El 3% de las Estaturas ms altas est entre 1.83 y 1.95 mts.










___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



59


UNIDAD 3.0

MEDIDAS DE POSICIN O DE TENDENCIA CENTRAL
OBJETIVO
DE LA UNIDAD: Proporcionar una comprensin de las caractersticas o propiedades de los
Datos numricos (tendencia central) y sus mediciones descriptivas de Resumen
correspondientes, como una ayuda para el anlisis e interpretacin de datos.

CONTENIDOS:
3.1 Media Aritmtica
3.1.1 Propiedades
3.1.2 Ventajas y desventajas
3.2 Mediana
3.2.1 Ventajas y desventajas
3.3 Moda
3.3.1 Ventajas y desventajas
3.4 Caractersticas principales de los promedios anteriores
3.5 Relacin entre la Media, Mediana y Moda
3.6 Media Geomtrica
3.6.1 Propiedades
3.6.2 Ventajas y desventajas
3.6.3 Caractersticas
3.7 Media Armnica
3.7.1 Caracterstica
3.8 Relacin entre Media Aritmtica, Geomtrica y Armnica
3.9 Cuartiles, Decles y Percentiles
Evaluacin de la unidad



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



60
MEDIDAS DE POSICIN O DE TENDENCIA CENTRAL

3.0. MEDIDAS DE POSICIN.
Son parmetros o promedios que se consideran representativos de una
distribucin de datos , los cuales tienen tendencia a concentrar los datos, o
sea , que son valores de posicin central a cuyo alrededor se distribuyen los
datos del conjunto. Los ms importantes son: Media Aritmtica, Mediana y
Moda. Se encuentran otras medidas de menos importancia que
analizaremos en ste trabajo como son: Media Geomtrica, Armnica,
Cuadrtica, Cbica, Cuartiles, Deciles y percentiles.
3.1 MEDIA ARITMTICA :
Es el promedio ms utilizado. Es la suma de los valores de la distribucin
dividida por el nmero total de datos. Es un promedio que se obtiene por
medio del clculo cuyo valor depende del que tienen los diversos datos que
entran en la distribucin.
La medida Aritmtica se representa por medio de
__
X
(que se lee X barra)
3 .1.1. CALCULO DE MEDIA ARITMTICA.
3.1.1.1 Para datos no Agrupados. La Media Aritmtica se calcula a partir de
la formula:

X
__
=
n
Xn X X X X X X X ... 7 6 5 4 3 2 1 + + + + + + +



X
__
=
Xi
n
i
n
=

1
representa la media de la muestra
Donde x Se utiliza para indicar la suma de todas las X y n es el nmero
total de datos de la muestra.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



61
EJEMPLO 1:
Las calificaciones de un alumno durante el grado 10 han sido las siguientes:
Matemticas, 8 , Estadstica 7, Ingles , 7; Fsica 6 Qumica, 9 Filosofa, 5 ,
Literatura, 6, Hallar la nota media (
__
X
).

__
X
=
X X X X X X X 1 2 3 4 5 6 7
7
+ + + + + +


__
X
=
Xi
n
i =

1
7


__
X
=
8 7 7 6 9 5 6
7
+ + + + + +
= 6.85

EJEMPLO 2.
Hallar la Media Aritmtica de la siguiente distribucin de datos:

32, 25, 29, 30, 30, 27, 24, 35, 34, 30, 29


__
X
=
32 25 29 30 30 27 24 35 34 30 29
11
+ + + + + + + + + +


__
X
= 29.54

Ejemplo 3.
La Media Aritmtica de los nmeros 8, 3, 5, 12, 10 es:


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



62
__
X
=
8 3 5 12 10
5
+ + + +
= 7.6
3.1.1.2 Para Datos Agrupados. Se puede calcular por efectivos, frecuencia y
por intervalos. Se calcula a partir de la frmula.

__
X
=
X f
n
i i
i
n
=

1
; Media aritmtica ponderada

EJEMPLO 1.
Los valores de las edades en aos obtenidas en una toma de datos en una
encuesta, son los que figuran en la tabla siguiente. Hallar la Media Aritmtica
de la distribucin de los datos.
X
i
(Edad en aos) f
i
X
I
. f
i

29 0 0
30 2 60
31 7 217
32 13 416
33 22 726
34 32 1088
35 49 1715
36 35 1260
37 23 851
38 9 342
39 5 195
40 3 120
41 0 0
N = 200 6.990.
__
X
=
X f
n
i i
i
n
=

1
=
6990
200
= 34.95 = 35 aos, edad promedio.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



63
EJEMPLO 2.
Hallar la Media Aritmtica (
__
X
) de los datos que figuran en la siguiente
tabla en la cual vamos a encontrar la estatura en centmetros de las especies
de rboles estudiados en una rea determinada.

Intervalo

X
i
F
i
X
i
F
i


6 25 15,5 4 62
26 45 35,5 3 106,5
46 65 55,5 7 388,5
66 85 75,5 9 679,5
86 105 95,5 16 1528
106 125 115,5 14 1617
126 145 135,5 20 2710
146 165 155,5 32 4796
166 185 175,5 24 4212
186 205 195,5 13 2514.5
206 225 215,5 6 1293
------------ ---------------
N = 148 19907


__
X
=
X f
n
i i
i
n
=

1
=
19907
148
= 134.50cm; estatura promedio
EJEMPLO 3.
En la siguiente tabla se encuentra unas distribuciones de los datos de la
estatura de 50 trabajadores.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



64
Estatura en
pulgada
INTERVALOS
Puntos medios
X
i

frecuencia
F
i

X
i
.F
i

50.5 - 53,5
53.5 - 56.5
56.5 - 59.5
59.5 - 62.5
62.5 - 65.5
65.5 - 68.5
68.5 - 71.5
71.5 - 74.5
52
55
58
61
64
67
70
73
1
2
6
11
16
9
4
1
52
110
3 48
6 71
1024
603
280
73
__
X
=
X f
n
i i
i
n
=

1
=
3161
50
= 63.22 pulgadas, estatura promedio.

3.1.2 PROPIEDADES DE LA MEDIA ARITMTICA
a. La suma algebraica de las desviaciones de un conjunto de nmeros
de su Medida Aritmtica es igual a 0 (cero).
As :
( Xi
j
n

1
__
X
) = O
b. La suma de los cuadros de las desviaciones de un conjunto Xi
respecto ciertos nmero a es mnima s y solo s a es igual a
__
X
.
c. Si f
1
nmero tienen la media m
1
, f
2
nmero tiene la media
m
2,
fk nmero tiene la media mk entonces la media de todos los nmeros es :


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



65

__
X
=
1
1
2
2
1 2
f
m
f
m
f
m
k
k
f f f
k
+ + +
+ + +
...
...


3.1.3 VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMTICA
3.1.3.1. ventajas
a. El promedio aritmtico es, en as, la medida ms fcil de entender y la
ms comnmente usada. Es un valor tal que si calculamos para un grupo en
el cual todos los elementos fueran iguales, cada uno de ellos sera igual a su
promedio aritmtico de n elementos es nuevo elemento formado, tomado
una parte igual a 1/n de cada uno los elementos originales.
b. Esta media se define en forma rgida por una ecuacin matemtica
muy fcil de entender y algunas veces se puede obtener cuando no es
posible calcular otros tipos de medida de tendencia central y an en el caso
de no conocer los valores individuales de las serie, por ejemplo.
S 10 filas consumen 20 litros de leche, el promedio aritmtico ser de 2
litros por fila.
c. El promedio aritmtico es extraordinariamente estable en el muestreo.
d. Es altamente sensible a cualquier cambio en los datos de la
distribucin.
e. Como una ventaja ms del promedio aritmtico, podemos anotar que
es excepcionalmente adaptable cuando se trata de hacer clculos
matemticos posteriores con l (promedio ponderado, mtodos abreviados y
promedio de promedios).
3.1.3.2. Desventajas
a. Es sensible a los valores muy grande o muy pequeos, especialmente
a los primeros, y a la inclusin de tales datos en distribucin que se est
estudiando pueden dar un promedio aritmtico que no sea realmente el
representante tpico del grupo.
b. Cuando una distribucin es marcadamente aritmtica en tal forma que
el promedio aritmtico, la mediana y la moda difieren en forma apreciable,


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



66
debe considerarse siempre la posibilidad de que el promedio aritmtico
pueda no ser el valor nico representativo de la serie.
c. Otro inconveniente o desventaja del promedio aritmtico, es cuando la
distribucin tiene forma de U, es decir parablicamente este corresponde
a los valores menos comunes en la serie y por tanto, puede dar una idea
irreal de la distribucin.
3.2. MEDIANA (Me)
La Mediana de una serie de datos ordenados es el valor central de la
distribucin de datos que divide dicho conjunto de datos de tal manera que el
nmero de partidas por encima de la Mediana sea igual al nmero de
partidas por debajo de la Mediana.
3.2.1 MEDIANA PARA DATOS NO AGRUPADOS.
Cuando el nmero de valores de la distribucin es impar, la mediana est
bien definida ser el valor que se encuentre en el medio cuando se hayan
ordenado los valores.
Si los nmeros de la distribucin son pares, se ordenan, se suman los
valores centrales y se dividen por dos(2).
EJEMPLO 1.
Calcular la Mediana para cada una de las distribuciones de datos que siguen:
4, 6, 7, 9, 15, 16, 17, (nmero de datos impares)

La Mediana es 9 ya que este es el valor central de la distribucin

EJEMPLO 2.

Calcule la mediana para: 3, 7, 9, 12, 15, 20, 21, 25
(nmero de datos par)

La mediana es = (12 +15) / 2 = 13.5

En este caso, la Mediana no corresponde a un valor real de la distribucin.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



67
EJEMPLO 3.
32 25 29 30 31 27 24 34 32 29 25
Ordenando los datos:
24 25 25 27 29 29 30 31 32 32 34
La Mediana es 29
En ste caso corresponde a un valor real de distribucin.
3.2.2 MEDIANA PARA DATOS AGRUPADOS:
Para encontrar la Mediana de datos agrupados se suele utilizar el mtodo de
interpretacin que exige la construccin de una distribucin de frecuencia
acumulada o de una distribucin de frecuencia acumulada relativa.
La Mediana se obtiene mediante la frmula:
Mediana = L
i
+
n
fmediana
i
f
/
'
2
1

|
\

|
.
|
|

A
Donde Li = Lmite real inferior de la clase mediana
n = Nmero total de datos (frecuencia total )
i
f

1
= Suma de las frecuencias de todas las clases por debajo de la
clase Mediana.
F mediana = Frecuencia de la clase Mediana.
A = Tamao del intervalo de la clase mediana.


EJEMPLO 1.
Hallar la Mediana para las cargas mximas de los cables de la siguiente
tabla.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



68

Mxima de cargas Nmero de cables
Toneladas Cortas.
9,3 - 9,7 2
9,8 - 10.2 5
10,3 - 10,7 12
10,8 - 11,2 17
11,3 - 11,7 14
11,8 - 12,2 6
12,3 - 12,7 3
12,8 - 13,2 1

TOTAL 60


Me = L
i
+
n
fmediana
i
f
/
'
2
1

|
\

|
.
|
|

A

Me = 10.8 +
60 2 19
17
/
|
\

|
.
|
0.4
Me = 10.8 +
11
17
|
\

|
.
|
0.4
Me = 10.8 + 0.258
Mediana = 11.06 Toneladas cortas
Es decir que el 50% de los cables resisten menos de 11.06 toneladas y el
otro 50% mas de 11.06 toneladas.

EJEMPLO 2.
Halle la Mediana de los dimetros de las cajas de remaches de la siguiente
tabla.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



69

DIMETRO FRECUENCIA
(PULGADAS)

0,7247 - 0,7244 2
0,7250 - 0,752 6
0,7253 - 0,755 8
0,7256 - 0,7258 15
0,7259 - 0,7261 42
0,7262--- 0,7264 68
0,7265--- 0,7267 49
0,7268--- 0,7270 25
0,7271--- 0,7273 18
0,7274--- 0,7276 12
0,7277--- 0,7279 4
0,7280--- 0,7282 1


Me = L
i
+
n
fmediana
i
f
/
'
2
1

|
\

|
.
|
|

A

Me = 0.7262 +
250 2 73
68
/
|
\

|
.
|
0.0002

Me = 0.7277




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



70
EJEMPLO 3.
Hallar la mediana de la siguiente tabla, que muestra los salarios recibidos por
algunas familias.

CLASES(salarios) FRECUENCIA(familias)

10 - Menor de 15 3
15 -Menor de 20 7
20 -Menor de 25 16
25 -Menor de 30 12
30 -Menor de 35 9
35 -Menor de 40 5
40 -Menor de 45 2

TOTAL 54

Me = L
i
+
n
fmediana
i
f
/
'
2
1

|
\

|
.
|
|

A

Me = 25 +
54 2 26
12
/
|
\

|
.
|
5
Me = 25.41 salarios; el 50% de las familias reciben menos de 25.41 salarios
y el otro 50% mas de 25.41 salarios.
3.2.3 VENTAJAS Y DESVENTAJAS DE LA MEDIANA
3.2.3.1 Ventajas
3.2.3.1.1 La Mediana tiene una definicin rgida y el concepto que envuelve
es tan claro que cualquiera puede entenderlo an no siendo familiar el
trmino.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



71
3.2.3.1.2 Si los datos estn ordenados en un cuadro de frecuencias esta
medida es fcil de calcular y por otro lado los datos extremos no tienen
ninguna influencia en ella.
3.2.3.1.3 Tiene menos estabilidad en el muestreo que el promedio
aritmtico, pero es ms aceptable en otras medidas.
3.2.3.1.4 Hay situacin en que la nica medida de tendencia central que
puede calcularse es la Mediana, tal como sucede en el uso de una
distribucin cuyos intervalos extremos no estn definidos.
3.2.3.2 Desventajas.
3.2.3.2.1 No es tan conocida como la Media Aritmtica
3.2.3.2.2 Es necesario ordenar los datos para poderla calcular
3.2.3.2.3 La mediana no se adapta a clculos posteriores aritmticos, por
cuanto que si obtenemos la mediana de diferentes grupos, no podemos
tener una mediana de los grupos reunidos.
3.2.3.2.4 La Mediana no es sensible a cambios de valores de los
elementos que componen la distribucin.

3.3 MODA ( Mo)
Se define como el valor que ocurre con mayor frecuencia en una distribucin
o sea el punto donde la concentracin es mxima, Si todos los valores son
diferentes, no existen moda, por otra parte un conjunto de valores puede
tener ms de una moda. Si la moda es nica la distribucin de datos se
denomina UNIMODAL si hay dos modas BIMODAL etc.
Por ejemplo:
Un laboratorio con 10 empleados cuyas edades son 20, 21, 20, 20, 34, 22,
24, 27, 27 y 27. Puede decirse que estos datos tienen dos modas, 20 y 27.

La muestra que consiste de los valores 10, 21, 33, 53 y 54 son diferentes.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



72
De una distribucin de frecuencia o histograma la moda puede sacarse de la
frmula:
Moda = L
i
+
1
1 2
A
A A
+
|
\

|
.
|
|
A

Li = Limite real inferior de clase modal

1
A = Exceso de la frecuencia modal sobre la frecuencia de la clase
contigua inferior.
2 A
= El exceso de la frecuencia modal sobre la frecuencia de la clase
contigua superior.
A = Tamao del intervalo de clase modal.
Para datos no agrupados la moda es el valor que ms se repite o es el valor
de ms alta frecuencia.
EJEMPLO1.

Hallar la Moda para el siguiente conjunto de datos:

7, 4, 10, 15, 12, 7, 9, 7,

Moda = 7

EJEMPLO 2.

Los tiempos de reaccin de un individuo a determinados estmulos fueron :

0,53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44 y 055 segundos

Moda = 0.53




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



73

EJEMPLO 3.

Una serie de nmeros est formada por seis 6, siete 7, ocho 8 , nueve 9, y
Diez 10.

La Moda = 10


EJEMPLO 4.

Hallar la moda para la siguiente frecuencia que demuestra el ingreso familiar
diario en pesos.



INGRESO FAMILIAR DIARIO EN $ N DE FAMILIAS

Menos de 3.000 25
3.000 - 4.999 31
5.000 - 6.999 42
7.000 - 8.999 45
9.000 - 10.999 52
11.000 - 12.000 42
13.000 - 14.999 35
15.000 - o ms 28

TOTAL 300



Mo = L
i
+
1
1 2
A
A A
+
|
\

|
.
|
| A


Mo = 9000 +
7
7 10 +
|
\

|
.
|
1999



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



74

Mo = 9000 + ( 0.411) 1999


Moda = $ 9821.58

La mayor parte de las familias ganan alrededor de $ 9,822 .


EJEMPLO 5.

Distribucin de las partculas de materia en suspensin ( microgramos por
metros cbicos ) en muestras de aires tomadas en 57 grandes ciudades.
INTERVALO DE CLASE FRECUENCIA
10 19 5
20 29 19
30 39 10
40 49 13
50 59 4
60 69 4
70 79 2


Mo = L
i
+
1
1 2
A
A A
+
|
\

|
.
|
|
A


Mo = 20 +
14
14 9 +
|
\

|
.
|
9

Mo = 20 + ( 0.608)9

Moda = 25.47 micro gramos/ metro cbico.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



75
EJEMPLO 6.

En la siguiente distribucin observamos el tiempo en minutos que demoraron
algunos atletas en recorrer una distancia.


INTERVALO DE CLASES FRECUENCIA

20 30 15
30 40 18
40 50 22
50 60 30
60 70 15
100

Mo = L
i
+
1
1 2
A
A A
+
|
\

|
.
|
|
A

Mo = 50 +
8
8 15 +
|
\

|
.
|
10

Mo = 53.47 minutos


3.3.1 VENTAJAS Y DESVENTAJAS DE LA MODA

3.3.1.1 Ventajas

3.3.1.1.1. El hecho de que la moda indique el nmero de mayor
concentracin, lo que hace tal vez la mejor medida de tendencia central,
cuando una distribucin es asimtrica. Claramente se ve que el modo es el
ms representativo del grupo, y en algunos casos si los promedios son
simplificativamente diferentes del valor es preferible usar el modo.

3.3.1.1.2 En series polimodales, el modo permite dividir la distribucin con
fines de estratificacin

3.3.1.2 Desventajas.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



76

3.3.1.2.1 El modo es difcil de calcular en una serie agrupada y las
aproximaciones de su clculo no son de mucha confianza.

3.3.1.2.2 El modo es muy inestable en el muestreo.

3.3.1.2.3 El modo puede ser usado fcilmente en procesos algebraicos
posteriores.

3.3.1.2.4. El modo no es sensible a cambios de valores en la distribucin,
a menos que tales cambios afecten a su propio valor.

3.3.1.2.5 No es recomendable, en la variable continua o cuando la
amplitud de los intervalos es diferente.

3.4 CARACTERSTICAS DE LOS PRINCIPALES PROMEDIOS VISTOS
ANTERIORMENTE.

3.4.1 Media Aritmtica.

3. 4.1.1 El valor de la media aritmtica depende de cada una de las medidas
que forman la serie, y se halla afectada excesivamente por las desviaciones
extremas con respecto al promedio, lo que habra que tener presente en
algunas de sus aplicaciones.

3.4.1.2 La media aritmtica se calcula con facilidad, y es nica para cada
caso.

3.4.1.3 La media aritmtica es un promedio calculado, susceptible de las
operaciones algebraicas.


3.4.2 MEDIANA (CARACTERES PRINCIPALES)

3.4.2.1 El valor de la mediana no est sujeto a la magnitud de las
desviaciones extremas con respecto al promedio.

3.4.2.2 La mediana puede ser localizada cuando los trminos que forman la
serie no son susceptibles de evaluacin cuantitativa.

3.4.2.3 La mediana no se presta tanto como los medios aritmticos,
geomtricos y armnicos a las operaciones algebraicas.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



77

3.4.3 MODA (CARACTERES PRINCIPALES)

3.4.3.1 El valor de la moda no est afectado por las magnitudes de las
desviaciones extremas con relacin al promedio.

3.4.3.2 Es fcil localizar la moda aproximadamente, pero, la determinacin
de su valor exacto exige prodigiosos clculos.

3.4.3.3. La moda carece de significado a menos que la distribucin
comprenda un gran nmero de datos y ofrezca marcada concentraci n.

3.4.3.4. La moda es el promedio ms tpico de toda la distribucin pues se
halla localizado en el punto de mxima concentracin.

3.4.3.5 La moda no es susceptible de operaciones algebraicas.


3.5.- RELACIN ENTRE MEDIA, MEDIANA Y MODA.

En una distribucin de frecuencias un modales que sea moderadamente
asimtricas, la mediana se encuentra entre la media aritmtica y la moda a
un tercio aproximadamente de distancia; de aqu se tiene la relacin
emprica:



MEDIA - MODA = 3 (MEDIA - MEDIANA)















___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



78
Ejemplo

Hallar la media, mediana y moda de los pesos de 40 estudiante de una
Universidad.
PESOS ( LIBRAS ) Xi Fi Xi.Fi
118 - 126 122 3 366
127 - 135 131 5 655
136 - 144 140 9 1260
145 - 153 149 12 1788
154 - 162 158 5 790
163 - 171 167 4 668
172 - 180 176 2 352

n =40 5879


__
X
=
X f
n
i i
i
n
=

1
=
5879
40
= 146.97


Me = L
i
+
n
fmediana
i
f
/
'
2
1

|
\

|
.
|
|

A

Me = 145 +
40 2 17
12
/
|
\

|
.
|
9

Me = 147.25

Mo = L
i
+
1
1 2
A
A A
+
|
\

|
.
|
| A

Mo = 145 +
3
3 7 +
|
\

|
.
|
8
Mo = 147.4


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



79
RELACIN EMPRICA = MEDIA - MODA = 3 ( MEDIA - MEDIANA )

146.97 - 147.4 = 3 ( 146.97 - 147.25 )

- 0.43 = - 0.84

Lo cual quiere decir que esta relacin es asimtrica.

En una distribucin simtrica la media aritmtica, mediana y moda
coinciden.


3.6.- MEDIA GEOMTRICA ( G)

Se define como Media Geomtrica (G) de una distribucin de datos como la
raz ensima del producto de n valores de la distribucin.

Se deduce que si uno de los valores de la serie de las medidas es cero (o),
la Media Geomtrica tambin tendr el valor cero.

existen tres (3) frmulas o maneras para encontrar la Media Geomtrica (G):

G =
n
N
X X X
... .
2 1
Esta frmula es para datos no
agrupados.

G =
1 2 3
1 2 3
f f f f
x x x xk
n
k
. . ...
Esta formula es para datos
agrupados

EJEMPLOS

1.0 Calcular la media geomtrica de los siguientes valores: 8, 16, 20


) ... . log(
1
log
2 1
x x x
n
n
G =


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



80
G =
n
N
X X X
... .
2 1



G = 8 16 20
3
x x = 13.67


2.0 Calcular la G de los siguientes valores: 5, 7, 15, 12, 11, 16.

G =
n
N
X X X
... .
2 1
=
5 7 15 12 11 16
6
x x x x x
= 10.17

3.0 Hallar la media geomtrica de las siguientes distribuciones de datos:

a.

Xi Fi
1 3
2 5
3 2
4 4
5 7
6 2
TOTAL 23

G =
1 2 3
1 2 3
f f f f
x x x xk
n
k
. . ...



G =
3 5 2 4 7 8
23
1 2 3 4 5 6
. . . . .
= 3.104




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



81


b.

Xi Fi


8 2
9 1
11 2
12 3
14 5
15 4
TOTAL 17



G =
1 2 3
1 2 3
f f f f
x x x xk
n
k
. . ...



G =
2 1 2 3 5 4
17
8 9 11 12 14 15
. . . . .
= 12.28



4.0 Hallar la G de los siguientes valores 21, 22, 15, 14, 20

Log G =
1
n
Log ( X
1
.X
2
...X
n
)

Log G =
1
5
log( 21x 22x 15x 14x 20 )

Log G =
1
5
Log (1940400 )

Log G =
1
5
(6.28)

Log G = 1.25


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



82

G = Antilogaritmo 1.25

G = 18.09


3.6.1 PROPIEDADES DE LA MEDIA GEOMTRICA.

Las propiedades o caractersticas de la media geomtrica (G) es que no
vara el producto de los valores que forman la serie de medidas cuando se
reemplazan cada una de estas por la media geomtrica de la serie.

Adems para la media geomtrica, la suma de las desviaciones de cada
trmino de la serie cuyo valor sea superior al de la media, es igual a la suma
de las desviaciones de los valores inferiores a esta abstraccin hecha de los
signos, sea que las sumas que en cada caso dan las diferencias entre las
partidas individuales y la media son iguales.

En el caso de la media geomtrica, los productos de las razones
correspondientes son iguales o sea que el producto de las razones entre la
media geomtrica y los trminos de valor de inferior a esta ser igual a la
que se obtenga multiplicando entre s las razones entre los trminos de valor
superior a la media y esta. Ejemplo : La G de los nmeros 3, 6, 8, 9, es 6 y
podemos escribir as.


3.6.2 VENTAJAS Y DESVENTAJAS DE LA MEDIA GEOMTRICA

3.6.2.1.Ventajas :

- .Se define rgidamente por una frmula matemtica.
- Se utiliza cuando se quiere dar importancia a los valores pequeos de
la variable.

- Es sensible a cualquier cambio en los valores de la distribucin.

- Es indispensable cuando se desea sacar promedio a una serie de valores
que estn en progresin geomtrica o aproximadamente geomtrica.

6
9
6
8
6
6
3
6
x x =


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



83
- Su valor no es muy influenciable por los datos extremos, como
sucede en los otros promedios.

- Su resultado puede ser usado en trabajos estadsticos posteriores puestos
que los promedios geomtricos de diferentes muestras pueden ser
combinadas para obtener el promedio geomtrico del total de las
muestras.


3.6.2.2 Desventajas

- Es la complicacin de su clculo
- Si cualquier dato de la serie original es o el promedio geomtrico toma
el valor o (usando la frmula de raz productora de los valores de la
serie.

- Si un valor de la serie es negativo, el promedio geomtrico es negativo o
imaginario y cuando el nmero de datos es par, tericamente tiene dos
valores, uno positivo y otro negativo.

3.6.3 CARACTERSTICAS PRINCIPALES DE LA MEDIA GEOMETRA (G)

- La media geomtrica da menos pero a las desviaciones extremas que la
media aritmtica.

- Queda rigurosamente determinadas cuando se hallan promedios de los
valores positivos.
- La media geomtrica es el promedio ms apropiado para las variaciones
de nmeros proporcionales, se adapta particularmente bien para
promediar relaciones de cambios de precios.

- La media geomtrica puede ser objeto de las operaciones algebraicas.


3.7. MEDIA ARMNICA.

Se representa usualmente por (H) y se define como el inverso de la media
aritmtica de los inversos de los valores dados, se obtiene calculando el valor
inverso de la media de los valores de la variable.

La media armnica viene dada por la frmula.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



84

H =
n
x
i
n
1
1 =

=
1
1 1
1
n
i
i
n
x
=





Ejemplos :


a. La media armnica de los nmeros 2, 4, 8 es:


H =
3
1
2
1
4
1
8
+ +
= 3.43


b. Calcular la media armnica de la velocidad alcanzada en un circuito de
carretera por tres automviles cuya velocidad respectiva es:

V
1
= 150 Km / h

V
2
= 175 Km / h

V
3
=165 Km / h


H =
n
x
i
n
1
1 =

=
3
1
150
1
175
1
165
+ +
= 162.67 K / h velocidad media


c. Hallar la H de la distancia media recorrida por 3 ciclistas

Ciclista 1 = 10 Km
Ciclista 2 = 20 km
Ciclista 3 = 30 km



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



85

H =
n
x
i
n
1
1 =

=
3
1
30
1
20
1
10
+ +
= 16.36 Km, distancia media



3.7.1 CARACTERSTICAS PRINCIPALES DE LA MEDIA ARMNICA

3.7.1.1 La media armnica es apropiada para promediar velocidades y otras
magnitudes anlogas. Se emplea en los trabajos de la estadstica econmica
para la elaboracin de los datos de precios.

3.7.1.2 La dificultad del clculo de la media armnica disminuye su utilidad
en la prctica del anlisis estadstico ms corriente.

3.7.1.3 La media armnica puede ser objeto de las operaciones algebraicas.


3.8 RELACIN ENTRE MEDIA ARITMTICA, GEOMTRICA Y
ARMNICA.

La media geomtrica de los nmeros X
1
, X
2
, ...X
n
es menor o igual que su
media aritmtica, pero es mayor o igual que su media armnica.

En smbolos:

H s G s X



La igualdad de los signos se presentan solamente cuando los nmeros X
1
X
2...
X
n
son idnticos.

Ejemplo: Los nmeros 2, 4, 8 tienen como media aritmtica 4.6 de media
geomtrica 4 y media armnica 3.43


3.43 Z 4 Z 4. 6






___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



86

3.9. CUARTILES. DECILES Y PERCENTILES.

3.9.1 CUARTILES

Son puntos de la Escala que dividen al nmero total de casos en 4 grupos
iguales. Es una medida asociada a la mediana puesto que se basan tambin
en su posicin en una serie de observaciones.

El primer cuartil corresponde al punto debajo del cual quedan una cuarta
parte de los casos. El segundo cuartil, tal como la mediana tiene valores
idnticos.

Para datos sin agrupar, un cuartil, tal como la mediana, o bien toma uno de
los valores de las partidas, o bien el valor intermedio entre dos partidas.

Si n es divisible por 4, el primer cuartil tienen el valor situado entre los
nmeros n/ 4 y el entero mayor que la sigue. Si n/4 no es entero el primer
cuartil tiene por valor el de mayor entero siguiente. Sustituyendo 3n/4 se
puede encontrar el valor del tercer cuartil.

Con datos agrupados, el mtodo de estimacin de los cuartiles primero y
tercero es parecido al utilizado para la mediana :



PRIMER CUARTIL SEGUNDO CUARTIL


Q
1
= L
i
+
n
fcuartilico
f
4
1

|
\

|
.
|
|
|
A Q
2
= L
i
+
2
4
2
n
fcuartilico
f

|
\

|
.
|
|
|
A


TERCER CUARTIL Q
3
= L
i
+
3
4
3
n
fcuarttilico
f

|
\

|
.
|
|
|
A




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



87
Q
i
= Abscisa de la curva comprendiente al cuartil.

L
i
= Lmite inferior del intervalo del cuartil.

A = Amplitud del intervalo (diferencia entre el lmite superior y el lmite
Inferior).

f cuartilico = Nmero de efectivos del intervalo del cuartil

n = Nmero total de los datos

f
i
= Efectivo acumulado anterior al intervalo del cuartil


3.9.2 DECILES

Son lneas lmites que separan una distribucin en 10 partes iguales, es decir
con el mismo nmero de observaciones en cada una .

El quinto decil coincide con la mediana. Para calcular el valor de los deciles
se procede en igual forma que con los cuartiles sustituyendo en n / 2 por:



n n n n
10
2
10
3
10
9
10
, , ,...,



3.9.3 PERCENTILES.

Son lmites que dividen una distribucin en 100 partes iguales. Existen 99
percentiles. Para datos sin agrupar, el percentil o bien toma el valor
intermedio entre dos observaciones, o bien el valor de una de las
observaciones segn que n sea o no divisible por 100. Si se tiene una
distribucin de frecuencia se puede utilizar una frmula parecida a las
empleadas para mediana y los cuartiles.

El 60 percentil, p
60
es el valor que separa el 60% inferior a las
observaciones del 40%.





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



88
Ejemplos Sobre Cuartiles, Deciles Y Percentiles.

En la siguiente tabla se encuentran algunas distribuciones de los datos de
estatura de 50 trabajadores. Hallar el primer y tercer cuartil, el quinto y sexto
decil y el 50 y 75 percentil.

ESTATURAS EN PULGADAS FRECUENCIA FRECUENCIA
ACUMULADA (fa)
50.5 - 53.5 1 1
53.5 - 56.5 2 3
56.5 - 59.5 6 9
59.5 - 62.5 11 20
62.5 - 65.5 16 36
65.5 - 68,5 9 45
68,5 - 71.5 4 49
71,5 - 74.5 1 50
N = 50



PRIMER CUARTIL


Q
1
= L
i
+
n
fcuartilico
f
4
1

|
\

|
.
|
|
|
A


Q
1
= 59.5 +
50
4
9
11

|
\

|
.
|
|
|
3


Q
1
= 60.45 , que representa el 25% de la distribucin.






___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



89
TERCER CUARTIL.


Q
3
= L
i
+
3
4
3
n
fcuarttilico
f

|
\

|
.
|
|
|
A


Q
3
= 65.5 +
3 50
4
36
9
( )

|
\

|
.
|
|
|
3


Q
3
= 66 , que representa el 75% de la distribucin.



QUINTO DECIL

D
5
= L
i
+
5
10
5
n
fdecil
f

|
\

|
.
|
|
|
A



D
5
= 62.5 +
5 50
10
20
16
( )

|
\

|
.
|
|
|
3


D
5
= 63.4,el cual representa el 50% de la distribucin.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



90


SEXTO DECIL

D
6
= 62.5 +
6 50
10
20
16
( )

|
\

|
.
|
|
|
3

D
6
= 64.3 , que significa el 60% de la distribucin.



PERCENTIL 50


P
50
= 62.5 +
50 50
100
20
16
( )

|
\

|
.
|
|
|
3

P
50
= 63.4, que significa el 50% de la distribucin.


PERCENTIL 75

P
75
= 65,5 +
75 50
100
36
9
( )

|
\

|
.
|
|
|
3

P
75
= 66, el cual representa el 75% de la distribucin











___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



91

EVALUACION SOBRE LA UNIDAD 3.0

3.1 Los siguientes son los niveles de glucosa en la sangre extrada a 10
nios en ayunas.



NUMERO VALOR NUMERO VALOR
1 56 6 65
2 62 7 65
3 63 8 68
4 65 9 70
5 65 10 72




Calcular : a. La media
b. La mediana
c. La moda
d. Hacer una tabla de frecuencia y sacar conclusiones.

3.2 El 31 Diciembre de 1986, nacieron 10 bebes en el Hospital, sus pesos
en kg fueron:

7, 8, 8, 6, 4, 9, 10, 11, 8, 9 Calclese:

a. La media
b. La mediana
c. Moda
d. Comprense estos valores, qu opina?
e. Media geomtrica
f. Media armnica

3.3 Los siguientes son los pesos de 10 animales que estn sometidos a
un procedimiento quirrgico experimental.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



92
NUMERO PESO (KG) NUMERO PESO (KG)
1 13,2 6 14.4
2 15.4 7 13.6
3 13.0 8 15.0
4 16.6 9 14.6
5 16.9 10 13.1

Encontrar :

a. La media
b. La mediana
c. La moda

3.4. Los pesos (kg) de 14 nios atacados por polio entre 3 a 4 meses son
los siguientes:

16.1, 15.9, 15.8, 16.3, 16.2, 16.0, 16.1, 15.9, 16.0, 16.1, 16.0, 15.9, 16.1.

Calcular :

a. Hacer una tabla de Frecuencia
b. La media
c. La mediana
d. La moda

3.5 Hallar la media geomtrica de los nmeros

a. 5,5,8,3,7,2

b. 28, 5, 73, 6, 47, 2, 31, 5, 64, 8

3.6 Hallar la media geomtrica y la media aritmtica de los nmeros

2, 4, 8, 16, 32

3.7 Hallar la media armnica de los nmeros

a. 2, 3, 6

b. 3, 4, 8, 6, 1, 4, 2



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



93

3.8 Hallar la media aritmtica, geomtrica y la media armnica de los
nmeros

0, 2, 4 y 6

3.9. Hallar la media geomtrica de los nmeros:

a. 4.2, 16.3, 5.4
b. 5.8, 4.7, 3.9, 7.7


3.10 Hallar la media armnica de los nmeros:

a. 3.4 6.8 4.7 6.5
b. 1.5 3.2 7.6 5.5 6.3 6.0

3.11 Hallar la media geomtrica por el mtodo del logaritmo a los siguientes
nmeros:

a. 1, 3, 4, 7
b 6, 7, 3, 1
c. 4, 2, 1

3.12 Calcular la media geomtrica por los dos mtodos y comparar el
resultado de los siguientes nmeros:
a. 1, 3, 4, 7
b. 1.5, 3.2, 4.5
c. 8, 9, 7, 5, 4

3.13 El salario anual pagado a todos los empleados de una compaa fue
de $ 500.000. Los salarios medios anuales pagados a hombres y mujeres de
la compaa fueron $ 520.000 y $ 420.000 respectivamente. Determinar el
porcentaje de hombres y mujeres empleados en la compaa.

3.14 Los tiempos de reaccin de un individuo a determinados estmulos
fueron 0.53, 0.50, 0.46, 0.52, 0.44, 0.55 segundos, respectivamente.
Determinar el tiempo medio de reaccin del individuo a los estmulos.

3.15 Mediante la frmula emprica: Media - Moda = 3 (Media - Mediana);
comprobar esta frmula mediante un ejercicio propuesto por usted.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



94
3.16 Hallar dos nmeros cuya media aritmtica es 9.0 y cuya media
geomtrica es 7.2

4.17 Diga cules son las relaciones existentes entre las medidas de
tendencia central?

3.18 Diga 3 ventajas y 2 desventajas de la media aritmtica.

3.19 Diga 2 ventajas y 2 desventajas de la mediana

3.20 Diga 2 ventajas y 3 desventajas de la media geomtrica

3.21 Diga 2 ventajas y 3 desventajas de la Moda la Modal

4.22 En un laboratorio existen 10 empleados cuyas edades son: 20, 21, 20

20, 34, 22, 24, 27, 27 y 27.

a. Calcular la moda
b. Calcular la mediana
c. Calcular el promedio de edades


4.23 La siguiente tabla contiene datos acerca de la contaminacin del aire,
que fueron proporcionados por 57 grandes ciudades.






___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



95
Partculas de materia en suspensin ( microgramos por metros cbico) en
muestra de aire tomadas en 57 grandes ciudades.
CIUDAD VALOR CIUDAD VALOR CIUDAD VALOR
1 68 21 36 41 16
2 63 22 42 42 24
3 42 23 28 43 69
4 27 24 31 44 47
5 30 25 28 45 23
6 36 26 25 46 22
7 28 27 45 47 43
8 32 28 12 48 27
9 79 29 57 49 49
10 27 30 51 50 28
11 22 31 12 51 23
12 23 32 32 52 19
13 24 33 49 53 46
14 25 34 38 54 30
15 44 35 42 55 43
16 65 36 27 56 49
17 43 37 31 57 12
18 25 38 50
19 74 39 38
20 51 40 21

Con dichos datos:

a. Construir una tabla de frecuencias utilizando intervalos adecuados
b. Determinar la mediana
c. Determinar la moda
d. Calcular los cuartiles e interpretar el significado de cada uno
e. Hallar el segundo y quinto decl
f. Hallar el 20, 50 y 75 percentil.
g. Hacer un histograma de los datos.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



96
3.24 Los siguientes son los niveles de glucosa en la sangre extrada 100
nios en ayunas:

55 61 57 77 62 75 63 55 64 60
50 57 61 57 67 62 69 67 68 59
65 72 65 61 68 73 65 62 75 80
66 61 69 76 72 57 75 68 81 64
69 64 66 65 65 76 65 58 65 64
68 71 72 58 73 55 73 79 81 56
65 60 65 80 66 80 68 55 66 71
72 73 73 75 75 74 66 68 73 65
73 74 68 59 69 55 67 65 67 63
67 56 67 62 65 75 62 63 63 59

Con dichos datos:

Preparar una distribucin de frecuencias utilizando intervalos adecuados y
Hallar:
a. La media
b. La mediana
c. La moda
d. El 2. y 3 Cuartil
e. El 5. y 7Decil
f. 50 y 76Percentil




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



97

4.25 Las pagas en dlares semanales de 200 estudiantes que trabajan
parte de su tiempo se distribuye as:

PAGAS NUMERO DE ESTUDIANTES
77.5 82.5 5
82.5 87.5 12
87.5 92.5 13
92.5 97.5 22
97.5 102.5 30
102.5 107.5 35
107.5 112.5 32
112.5 117.5 20
117.5 122.5 15
122.5 127.5 10
127.5 132.5 6

Determinar :

a La media
b. La Moda
c. 2 cuartil
d. 5. Decil
e. 50percentl
f. Comparar los resultados anteriores y sacar su propia conclusin.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



98

3.26 Las cantidades en miles de pesos, destinadas por un total de 40
familiar a diversiones, tales como cine, teatro y otros espectacular
pblicos durante un perodo de tiempo determinado, fueron los
siguientes:

16, 15, 14, 12, 24, 20, 17, 18, 13, 14, 16, 16, 18, 10, 9, 11, 11, 12, 19, 20,
26, 21, 17, 17, 15, 13, 14, 14, 12, 9, 13, 10, 12, 15, 11, 14, 16, 17, 15, 22

a. Agrupar dichos datos en una tabla de frecuencias en intervalos
adecuados.
b. Determinar la media
c. Determinar la moda
d. Hallar el 1o . cuartil
e. Hallar el 6o. decil
f. Hallar el 24 percentl
g. Representar los datos en un diagrama de lnea.

3.27 Las alturas de un grupo de 100 personas ordenadas en sentido
crecientes, son las siguientes.

1.61 1.63 1.65 1.66 1.67 1.67 1.67 1.67 1.67 1.67 1.67 1.67
1.68 1.68 1.68 1.68 1.68 1.68 1.68 1.68 1.68 1.68 1.69 1.69
1.69 1.69 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.71
1.71 1.71 1.72 1.72 1.72 1.72 1.72 1.72 1.72 1.72 1.72 1.72
1.72 1.72 1.72 1.72 1.74 1.75 1.75 1.75 1.75 1.75 1.75 1.76
1.76 1.76 1.76 1.77 1.77 1.77 1.77 1.78 1.78 1.78 1.80 1.80
1.80 1.80 1.81 1.81 1.81 1.82 1.82 1.82 1.83 1.83 1.85 1.85
1.86 1.86 1.87 1.87 1.88 1.88 1.90 1.90 1.90 1.91 1.92 1.93
1.93 1.94 1.94 1.96

Se pide hallar:

a. La media
b. La mediana
c. La moda
d. El 3o. Curtl
e. El 9o . decl
f. El 18o. percentl.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



99
3.28 La distribucin del sueldo mensual de 100 empleados del
Departamento de una fbrica es, por categora, la siguiente:
CATEGORAS SUELDOS No EMPLEADOS

8a. 25.000 ---- 27.999 5
7a. 28.000 ---- 30.999 12
6a 31.000 ---- 33.999 15
5a 34.000 ---- 36.999 25
4a 37.000 ---- 39.999 15
3a 40.000 ---- 42.999 14
2a 43.000 ---- 45.999 10
1a. 46.000 ---- 48.999 4

S e pide calcular:

a. La media
b. La moda
c. La mediana
d. Representar los datos en un histograma de frecuencia.

3.29 La direccin de una empresa dice, que el salario promedio de los
trabajadores es mayor de 1000 semanales y, en consecuencia, se rehus a
aumentar los salarios. El sindicato encontr que la distribucin de los salarios
es la siguiente:

CLASE INTERVALOR Fi
D 500 - 100O 120
C 1000 - 1500 50
B 1500 - 2000 20
A 2000 - 2500 10



En qu forma sugiere usted que el sindicato pueda discutir con los
Directores?





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



100

3.30 Suponga que los salarios semanales pagados por una compaa son
los siguientes:



DIRECTORES 2 10.000
SUPERVISORES 5 6.000
INGENIEROS 3 5.000
OBREROS 120 2.000



Cul de los dos: El salario promedio o el salario modal, es ms
representativo?. Calcule los salarios promedios y modal.




























___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



101
UNIDAD 4.0


MEDIDAS DE DISPERSIN

OBJETIVO
DE LA UNIDAD: Enfatizar la importancia de calcular medidas de dispersin que
complemente el clculo de la media aritmtica.

CONTENIDO:
4.1 Varianza
4.1.1 Propiedades
4.1.2 Correccin de Shepard
4.2 Rango o recorrido
4.2.1 Caractersticas
4.3 Desviacin Tpica o Estndar
4.3.1 Propiedades
4.4 Coeficiente de variacin
4.4.1 Caracterstica
4.5 Puntaje Tpico o estandarizado
4.6 Recorrido intercuartilico
4.7 Desviacin Mediana
4.8 Desviacin Media
Evaluacin de la unidad.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



102
4.0 MEDIDAS DE DISPERSIN:

Son medidas que se emplean para determinar el grado de variabilidad o de
dispersin de los datos con respecto a un promedio. Tambin se llaman
medidas de dispersin a los valores estadsticos que proporcionan una idea
acerca de como se agrupan los datos de una distribucin con respecto a los
valores centrales de la misma.

Las medidas de dispersin son:

Varianza
desviacin Tpica o Estndar
Desviacin media
Desviacin mediana
Coeficiente de variacin
Puntaje tpico o estandarizando
Recorrido intercuartilico


4.1 LA VARIANZA ( S
2
)

Es la ms importante de las medidas de dispersin y es la ms conocida y
usada.

La varianza se define como la media aritmtica de los cuadros de las
desviaciones respecto a su media.

La varianza es importante porque da origen a la desviacin tpica o estndar.

La varianza se simboliza de muchas formas pero la ms comn es S
2
.

La frmula para calcular la varianza es :


S
2
=
( )
_
X X
n
i
n

1
2
=
n
Zi
2

para datos no agrupados.







___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



103
S
2
=
( )
_
i
i
i
n
X
f
X
n

2
1
para datos agrupados.

S
2 =
n
fi
Zi
.
2

Si estas formulas de la varianza la dividimos entre n 1, en lugar


de n, estamos calculando la denominada cuasvarianza.
Para calcular la varianza de una serie de datos sin agrupar se debe proceder
as:

a. Calcular la media aritmtica del conjunto de datos.
b. Calcular la desviacin ( x - x
_
) = Z, entre cada dato y la media de la
distribucin.
c. Calcular el cuadrado ( x - x
_
)
2
de estas desviaciones.

d. Sumar ( X - x
_
)
2
estos cuadrados.

e. Dividir la suma por el nmero de datos.

En caso de que los valores estn agrupados por efectivos entre el 3 y 4
punto debe ir un nuevo paso: Multiplica los cuadros; ( x - x
_
)
2
de las
desviaciones por sus efectivos respectivos.

En caso de que los valores de la variable estn agrupados por intervalos y
efectivos, se buscan los puntos medios de cada intervalo y se procede igual
que en el anterior caso.

4.1.1 PROPIEDADES DE LA VARIANZA .

4.1.1.1 Debe ser siempre un valor positivo s
2
> 0

4.1.1.2 La varianza de una constante es igual a 0

4.1.1.3 La varianza de una constante mas una variable es igual a la
varianza de la variable.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



104
4.1.1.4 La varianza de una constante por una variable es igual al
producto de la constante al cuadrado por la varianza de la
variable.

4.1.1.5 Para el clculo de la varianza de una muestra, cuando se
trabaja con submuestras, se aplica la siguiente frmula.

S
2
= ...
2 1
2
2
2 1
2
1
+
+
+
n n
n s n s



4.1.2 CORRECCION DE SHEPPARD PARA LA VARIANZA

No obstante, al estudiar cada intervalo por el valor central del mismo, se
comete un error sistemtico que conviene corregir, especialmente cuando la
longitud de los intervalos (A) es grande en comparacin con la raz cuadrada
(s) de la varianza (s
2
).

Para curvas de frecuencia un modales (moda nica) y en la que los
efectivos disminuyen tendiendo a cero en los dos extremos del eje x
(abcisas) se puede aplicar la siguiente correccin:

S
2
(corregida) = S
2
( sin corregir ) - A
2
/ 12

Esta correccin no necesita ser efectuada cuando la longitud del intervalo es
inferior a la mitad de la raz cuadrada de la varianza.

Los estadsticos difieren en lo que se refiere a cundo y si debe aplicarse la
correccin de SHEPPARD, ciertamente no debe aplicarse sin haber hecho
un examen completo de la situacin; estos se debe a que frecuentemente se
tiende a sobre corregir y as sustituir unos errores por otro.

En este trabajo, a menos que se indique lo contrario, esta correccin no es
empleada.

4.2. RANGO O RECORRIDO ( OSCILACIN)

El rango de un conjunto de nmero es la diferencia entre el mayor y el menos
de todos ellos.
R = X
mx
- X
min




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



105
Ejemplo: El Rango de los nmeros 2,2,3,5,5,7,7,8,12, se puede enunciar
denotando sus extremos o su diferencia as:

R = X
mx
- X
min


R = 12 - 2 = 10

4.2.1 CARACTERSTICAS.

- El rango no es sensible a cambios en los datos, solamente lo es en
puntuaciones extremas, razn por la que no es una medida de dispersin
confiable.

- Es la ms fcil de calcular.

Para datos agrupados existen dos mtodos para calcular el rango:

- El rango es la diferencia entre la marca de clase de la clase superior y
la marca de clase inferior. Tiene la ventaja de eliminar los datos
extremos.

El rango es la diferencia entre el lmite real superior de la clase ms alta y
el lmite real inferior de la clase ms baja.

EJEMPLO 1:

La siguiente tabla muestra las alturas de los estudiantes de una universidad.
Hallar el rango.

Altura No. de Marca de clase
(Pulgada) Estudiantes

60 - 62 5 61
63 - 65 18 64
66 - 68 42 67
69 - 71 27 70
72 - 74 8 73
n = 100




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



106


1. Rango = marca de la clase superior - marca de la clase inferior

R = 73 - 61 = 12 pulgadas

2. Rango = Lmite real superior de la clase ms alta lmite real
inferior de la clase ms baja

R = 74.5 - 59.5 = 15 pulgadas


EJEMPLO 2


Hallar el rango de las series de nmeros: 5, 3, 8, 4, 7, 6,12, 4, 3.

Ordenando : 3 3 4 4 5 6 7 8 12

R = 12 - 3 = 9


EJEMPLO 3

Hallar el rango de: 8.772, 6.453, 10.624, 8.628, 9.434, 6.351


Ordenando : 6.351, 6.453, 8.628, 8.772 , 9.434, 10.624

R = 10.624 - 6.351 = 4.273

EJEMPLO 4

La mayor de 50 pesadas es 8.34 kg si el rango es 0.46 kg hallar la pesada
menor.

R = X
mx
- X
min


0.46 = 8.34 - X
min


X
min
= 8,34 - 0,46 = 7.88 kg.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



107

4.3 DESVIACIN TPICA O ESTNDAR (S)

Se define como la raz cuadrada de la varianza y tambin como la raz
cuadrtica de las desviaciones respecto a la media.

La desviacin tpica al igual que la varianza es tambin muy utilizada,
desempea un papel muy importante en el anlisis de los datos estadsticos.

La frmula para calcular la desviacin tpica en datos no agrupados es


S =
( )
_
i
i
n
X
X
n

2
1




Para datos agrupados la frmula es ms o menos similar


S =
( )
_
i
i
i
n
X
f
X
n

2
1



4.3.1 Propiedades de la Desviacin tpica.

4.3.1.1. Est definida por una frmula = S =
( )
i
i
n
X
a
n

2
1


donde a es un promedio que puede ser diferente a la media aritmtica.
De todas las desviaciones tpicas, la mnima es aquella para la cual a = X
_


4.3.1.2. Para distribuciones normales resulta que el valor de la
desviacin tpica est a ambos lados de la media.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



108

4.3.1.3 Suponiendo dos series de datos N
1
Y N
2
nmeros o dos
distribuciones de frecuencia con frecuencia totales N
1
y N
2
cuyas variaciones
vienen dadas por
1
2
2
2
S S
y

y que tienen las mismas medidas X
_

entonces la varianza combinadas para ambas series est dada por


S
2
=
1
2
1 2
2
2
1 2
s n s n
n n
+
+
+ ...

Esta es una media aritmtica ponderada de las varianzas.

Este resultado puede generalizares a 3 o ms series de datos

Ejemplo 1

Hallar la desviacin tpica de los siguientes nmeros.


3, 6, 2, 1, 7, 5,

Ordenando: 1, 2, 3, 5, 6, 7,

X
_
= 4
6
24
6
7 6 5 3 2 1
= =
+ + + + +

( X - X
_
)
2


(1 - 4)
2
= (- 3)
2
= 9
(2 - 4)
2
= (- 2)
2
= 4
(3 - 4)
2
= (-1)
2
= 1
(5 - 4)
2
= (-1)
2
= 1
(6 - 4)
2 = (
2)
2
= 4


(7 - 4)
2
= (3)
2
= 9

SUMAS: 28
S
2
=
( )
_
X X
n
i
n

1
2
= 28/6 = 4.6


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



109

S =
( )
_
i
i
n
X
X
n

2
1
= 4 6 216 . . =

EJEMPLO 2

La desviacin tpica de los siguientes nmeros
3.2, 4.6, 2.8, 5.2, 4.4


X
_
=
28 32 4 4 4 6 52
5
202
5
4 04
. . . . . .
.
+ + + +
= =

( X - X
_
)
2


(2.8 - 4.04 )
2
= 1.6376

(3.2 - 4.04)
2
= 0.7056

(4.4 - 4.04)
2
= 0.1296

(4.6 -4.04)
2
= 0.3136

( 5.2- 4.04)
2
= 1.3456

SUMAS: 4.032
S
2
=
( )
_
X X
n
i
n

1
2
=
4 032
5
08064
.
. =



S =
( )
_
i
i
n
X
X
n

2
1
= 08064 090 . . =


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



110
4.4 COEFICIENTES DE VARIACIN

Esta medida se obtiene dividiendo a la desviacin tpica por su media
aritmtica, expresndose el resultado en trminos porcentuales.

Este coeficiente se emplea cuando se desea comparar dos o ms
distribuciones, con el fin de determinar cules de ellas tiene mayor o menor
variabilidad relativa.

Se usa cuando las distribuciones estn dadas en unidades de medidas
diferentes, por lo tanto en estos casos, no se podr comparar las varianzas o
la desviacin estndar; puede darse el caso de que las distribuciones estn
expresadas en la misma unidad.

La frmula para calcular el coeficiente de variaciones es :

Cv =
S
X
_
.100




4.4.1 CARACTERISTICAS DEL COEFICIENTE DE VARIACION

4.4.1.1. Este coeficiente deja de ser til cuando la media est prxima a
cero.

4.4.1.2 Es independiente de las unidades?

4.4.1.3. Generalmente se expresa en porcentajes.

EJEMPLO 1
Un grupo de obreros tienen un salario promedio de $ 26.800 y varianza $
14.400.oo.

Otro grupo de obreros que trabajan en un pas diferente tienen un salario
promedio de
B
s
8.570 y una desviacin tpica de
B
s
80.

Se quiere determinar cul grupo de salarios presenta una menor
variabilidad.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



111
Solucin.

En este caso no se pueden comparar las varianzas ni las desvi aciones
tpicas, debido a que unos reciben en pesos y otros en
B
s
, la mejor forma de
comparar estas dos distribuciones es mediante el uso del coeficiente de
variacin:


CV
1
=
120
26800
00044 044% = = . .

CV
2
=
80
8570
00093 093% = = . .


En conclusin se puede decir que los salarios para el grupo de empleados
(obreros) del primer pas presentan una menor variabilidad.


EJEMPLOS 2

Dos distribuciones cuyas medias aritmtica: X
_
= 24.5 y X
_
= 30 y cuyas
desviaciones tpicas o estndar son idnticas S
1
= 2 y S
2
= 2 indicando este
hecho que tienen el mismo grado de variacin absoluta.

C
V1
=
2
245
00816 816%
.
. . = =

Cv
2
=
2
30
00666 666% = = . .

EJEMPLO 3.

Para un conjunto de datos se obtuvo $ 9.200 como promedio de ingreso
mensual y una desviacin tpica de 10.100.

Lo primero que podemos decir que la desviacin tpica es demasiado grande.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



112
Ahora si calculamos su coeficiente de variacin se tendr.

Cv =
10100
9200
10978 109 78% = = . .



4.5. PUNTAJE TPICO O STANDARIZADO (Z)

Es muy utilizado en la distribucin normal y en anlisis del coeficiente de
correlacin, mide la desviacin de una observacin con respecto a la media
aritmtica, en unidades de desviacin tpica, determinndose la posicin
relativa de una observacin dentro del conjunto.

Tambin es muy utilizado como variante estadstico, por lo general es
simbolizada por (z), sin embargo en casos especiales se puede simbolizar
por (T).

La formula utilizada para calcular el puntaje tpico es:

Z =
X X
S

_
T =
X X
S

_

CARACTERISTICA:
Sirve para comparar dos o ms datos individuales, aunque pertenezca a
diferentes distribuciones.

Ejemplo:
Un obrero realiza tres operaciones dentro del trabajo:
La primera la realiza en 72 minutos, la segunda en 85 y la tercera en 52
minutos; el promedio de duracin para realizacin de cada operacin el 85,
90 y 58 minutos respectivamente. Adems las respectivas desviaciones
Estndar fueron 7, 3 y 7; se requiere ordenar las operaciones realizadas por
el obrero, de acuerdo con su mayor capacidad para la ejecucin.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



113
Solucin:
X
1
= 72 X
_
= 85 S
1
= 7
X
2
= 85 X
_
= 90 S
2
= 3
X
3
= 52 X
_
= 58 S
3
= 7
Z =
X X
S

_


Z
1
= 72 - 85 = - 13 = -1.85
7 7


Z
2
= 85 - 90 = -5 = -1.66
3 3


Z
3
= 52 - 58 = - 6 = -0.86
7 7

Ejemplo 2.
En una encuesta sobre aceptacin de dos productos en el mercado se
obtuvieron los siguientes datos:
Producto A , X
_
= 85 s
2
= 12
Producto B, X
_
= 78 S
2
= 20

Se midieron puntajes particulares 82 y 86 para los productos A y B. Cul de
los productos tuvo mayor aceptacin.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



114
Z =
X X
S

_

Z
A
=
82 85
12
3
12
025

=

= .

Z
B
=
86 78
20
8
20
04

= = .

Lo cual nos permite decir que tuvo mayor aceptacin el producto B ya que su
puntaje tpico es mayor.
4.6 EL RECORRIDO O RANGO INTERCUARTILICO.
Se define como la diferencia entre el tercer y el primer cuartil de los cuartiles
de una distribucin.

Q
D2 =
Q
3
- Q
1

El rango intercuartlico Q
3
- Q
1
se emplea a veces pero el rango
semicuartlico es ms utilizado como medida de dispersin.
Rango Semicuartilico.
Q
D2=
2
1 3
Q Q



Se comprende que cuanto mayor sea la desviacin intercuartlico, ms
dispersos (menos concentrados) estn los valores de la distribucin.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



115
Ejemplo: En la siguiente tabla de datos agrupados, los cuales representan
el recorrido en kilmetros de 208 familias desplazadas:

INTERVALO(Km) Fi (F/lias) Fa

30 - 38 6 6

38 - 46 14 20

46 - 54 36 56

54 - 62 50 106

62 - 70 43 149

70 - 78 32 181

78 - 86 18 199

86 - 94 9 208

N = 208

se tiene:

Q
1
= 46 +
52 20
36
8

|
\

|
.
|

Q
1
= 53.11: El 25% de las familias recorrieron menos de 53 Km.

Q
3
= 70 +
156 149
32
8

|
\

|
.
|

Q
3
= 71.75 : El 75% de las familias recorrieron menos de 71 Km.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



116
Q
D 2=
3 1
2
Q Q

=
7175 5311
2
9 32
. .
.

=


4.7 DESVIACIN MEDIANA (Dm)
Se define como la media aritmtica de las diferencias en valor absoluto, entre
los valores que toma la variable y la mediana.
Es una medida de dispersin poco utilizada y su mayor uso corresponde a
aquellas distribuciones cuyos valores extremos no estn definidos o cuando
el promedio esta afectado por valores grandes de la variable que obliga a
calcular la mediana.
FORMULAS:
Dm =
i
i
n
i
X
f
Me
n

1
.
para datos agrupados.
Dm =
i
i
n
X
Me
n

1
para datos no agrupados.
Valor de la Dm

puede ser menor o igual a la desviacin media, la que a su
vez es siempre menor que la desviacin tpica.
Dm

s MD Z S

4.8 DESVIACIN MEDIA.
Tambin llamada desviacin media absoluta o promedio de desviacin.
Se denomina desviacin media aritmtica de los valores absolutos de las
desviaciones.
Para calcular la desviacin media se ha de proceder de modo siguiente:


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



117
4.8.1 Valores no agrupados.
4.8.1.1 Calcular la media ( X
_
) de la distribucin de datos
4.8.1.2 Calcular la desviacin de datos ( X - X
_
) entre cada dato y la media.
4.8.1.3 Calcular el valor absoluto de cada valor.
X X
_

4.8.1.4 Sumar Los Valores Absolutos de las desviaciones.
X X
_

4.8.1.5 Dividir esta suma por el nmero de datos.

FORMULAS:
M.D =
i
i
n
X
X
n

_
1
para datos no agrupados.
M.D =
i
i
i
n
X
f
X
n

_
.
1
para datos agrupados.
Se le considera como una de las medidas de dispersin ms fciles de
calcular, siendo utilizada en la mayora de los casos con el nico fin de
agilizar las operaciones, por ello al resultado se le considere como una
aproximacin a la cuantificacin de la dispersin.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



118
4.9 ERROR ESTNDAR: Se obtiene dividiendo la desviacin tpica por el
tamao de la muestra.


e =
n
S



4.10 ASIMETRIA: En una distribucin se tiene que:

La distribucin es simtrica si:

La media aritmtica = a la mediana = a la moda
X
_
= Me = Mo

Cuando la media es menor que la mediana y esta menor que la moda, la
distribucin es asimtrica negativa.
X
_

Z

Me Z Mo

Si la media es mayor que la mediana y esta mayor que la moda, la
distribucin es asimtrica positiva.

X
_

>

Me > Mo


Las formulas para calcular el grado de asimetra, entre otras son:

El coeficiente de Pearson:
S
Mo
X
A

=

*



La medida de Bowley:
Q Q
Q Q
Me
A
1 3
1 3
2

+
=




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



119
4.11CURTOSIS: Indica si la distribucin est ms o menos apuntada que la
distribucin normal. Un valor mayor que cero indica que est ms
apuntada(forma puntiaguda),un valor igual a cero indica mismo apuntamiento
que la normal, un valor menor que cero indica menos apuntada(aplanada).

Los trminos usados son:

Normal Mesocrtica
Aplanada Platicrtica
Puntiaguda leptocrtica.

Ejemplo:
La siguiente tabla muestra la lectura sobre el volumen de trfico y la
concentracin de monxido de carbono en un punto de muestreo de la
calidad del aire en una ciudad.

VALORES DE TRAFICO Co ( PPM)
0 - 20 30
20 - 40 25
40 - 60 15
60 - 80 13
80 - 100 12
100 - 120 5


Se pide calcular: Su media, varianza, desviacin tpica coeficiente de
variacin y desviacin media.

Solucin:
En la solucin de esta clase de ejercicios es importante que tratemos de
agrupar en una tabla los pasos necesarios para calcular cada medida de
dispersin.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



120

VOLUMEN DE TRAFICO Y CONCENTRACIN DE MONOXIDO DE CARBONO


INTERVALOS

Xi

Fi

XI . FI
X i - X
_
(Xi - X
_
)
2
F(Xi X
_
)
2


F
X X
_


0 - 20

10

30

300

-33.4

1115.56

33466.80

1002

20 - 40

30

25

750

-13.4

179.56

4489.0

335

40 - 60


50

15

750

6.6

43.56

653.4

99
60 - 80
70

13

910

26.6

707.56

9198.28

345.8
80 - 100
90

12

1080

46.6

2171.56

26058.72

559.2

100 - 120

110

5

550

66.6

4435.56

22177.8

333

Sumas
N=100 4340 96044.0 2674
1. Calculamos la media:
X
X F
n
i
n
_
.
. = = =
=

1
4340
100
434


2. La varianza: S
2

=
4 . 960
100
96044
1
2
_
= =
|
.
|

\
|

=
n
X X
f
i
n
i


3. La desviacin tpica o estndar: S =
var . . ianza = = ~ 9604 3099 31


4. El coeficiente de variacin: Cv =
S
X
_
.
.
. . 100
31
434
100 714% = =



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



121

5. La desviacin media: M.D =
X X f
n
i
n

= =
=

_
.
1
2674
100
26 74



6. Error estndar: e =
n
S
= 31/100 = 0.31

7.











___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



122
EVALUACION DE LA UNIDAD No 4

4.1 Hallar el rango de las series de nmeros:

a) 5, 3, 8, 4, 7, 6, 12, 4, 3
b.) 8.772, 6.453, 10.624, 8.628, 9.434, 6.351.

4.2 La mayor de 50 pesadas es 8.34 Kg si el rango es 0.46 kg, hallar la
pesada menor

4.3 Sumando 4 a cada uno de los nmeros de la serie: 2, 6, 5, 9, 1 se
obtiene la serie: 6, 10, 9, 5 y 13. Comprobar que ambas series tienen la
misma varianza, distintas medias y diferentes coeficientes de variacin.

4.4 Multiplicando por 4 cada uno de los valores de la variable X: 3, 2, 0, 5
se obtiene la serie Y: 12, 8, 0, 20; comprobar que ambas series tienen el
mismo coeficiente de variacin.

4.5 Sean los nmeros 1, 2 y 3 y supongamos que su varianza es S
2
1,

agregamos dos veces el nmero 2 y tendremos 1, 2, 2,,2,3, supongamos que
la varianza de este nuevo conjunto de nmeros es S
2
2
.

Es S
2
2
mayor o menor que S
2
1.

4.6 Consideremos que en el Hospital A hay 30 pacientes, y 50 en el
Hospital B. se pide calcular el coeficiente de variacin para el total de los 80
pacientes.

4.7 Hallar las desviaciones medias de las series de los nmeros:

a) 3, 7, 9, 5

b) 2, 4, 1, 6, 3, 8, 4, 1, 3, 4.

4.8 Hallar la desviacin tpica de los nmeros:

a) 3, 6, 2, 1, 7, 5

b)3, 2, 4, 6, 2, 8, 5, 2, 4, 4

c) 0, 0, 0, 0, 0 1, 1, 1,



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



123
4.9 La siguiente tabla muestra la concentracin de albmina en el suero
de 60 sujetos hospitalizados.


ALBMINA EN EL SUERO NDE SUJETOS


0 - 1.0 9
1.0 - 2.0 13
2.0 - 3.0 18
3.0 - 4.0 17
4.0 - 5.0 3


Se pide calcular el rango, la varianza, desviacin tpica y el coeficiente de
variacin, el Error estndar, la asimetra.

4.10 Se han tomado tres muestras de 50 ejemplares cada una de cachamas
macropomus hembras, con el fin de realizar una investigacin. Al efectuar el
pesaje se encontr los siguientes datos, medidos en Kilogramos:


Xi
Kilogramos
Muestra A
Fi
Muestra B

Fi
Muestra C

Fi
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2
4
10
18
10
4
2
3
3
12
14
12
3
3
5
6
9
10
9
6
5
TOTALES n = 50 n = 50

n = 50

Con los datos del cuadro anterior calcule:

1. La desviacin media y la desviacin tpica o estndar en cada muestra
2. Cual de las muestras presenta mayor porcentaje de variabilidad
3. Que opinin le ofrece la media aritmtica de las tres muestras



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



124
4.11 Los siguientes datos representan las edades de 120 Docentes de la
concentracin Escolar:



24 30 27 31 32 33 32 35 28 33 29 28

32 36 31 38 30 32 39 33 30 34 31 29

26 40 33 26 31 36 27 33 31 31 40 30

30 26 35 32 30 32 34 30 27 31 31 32

32 33 29 24 31 28 33 28 29 32 33 28

34 33 29 33 31 33 34 25 33 32 30 32

37 31 37 31 34 21 29 32 37 31 27 30

38 32 35 34 25 26 35 32 32 25 24 21

25 24 32 33 40 28 26 29 36 25 38 31

33 27 25 21 25 24 32 29 26 30 21 21



Con los datos anteriores:

1. Haga una distribucin de frecuencia usando intervalos adecuados
2. Analice e interprete los intervalos 3y 4
3. Que porcentaje de docentes tiene edad menor de 30 aos
4. Que porcentaje tiene edad mayor de 30 aos
5. Calcule y analice las medidas de dispersin vistas.










___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



125


4.12 Los datos siguientes representan el peso(kilogramos) de 110 jvenes:

56 61 57 77 62 75 63 55 64 60 60 57

57 67 62 69 67 59 59 65 72 65 61 68

65 62 75 80 66 61 69 76 72 57 75 68

64 69 64 66 65 65 76 65 58 65 64 68

71 72 58 73 55 73 79 81 56 65 60 65

66 80 68 55 66 71 72 73 73 75 75 74

73 65 73 74 68 59 69 55 67 65 67 63

56 67 62 65 75 62 63 63 59 50 57 66

56 50 66 57 80 74 81 60 62 75 64 57

68 64

Con los datos anteriores:

1. Haga una distribucin de frecuencias utilizando intervalos adecuados e
interprete el intervalo que tenga la mayor frecuencia.

2. Calcule las medidas de tendencia central(media, mediana y moda)

3. Calcule la desviacin media, varianza, desviacin tpica, el coeficiente de
variabilidad y el error estndar.











___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



126





UNIDAD N 5
REGRESIN Y CORRELACIN
OBJETIVO
DE LA UNIDAD: Desarrollar, tanto descriptiva como inferencialmente, los
modelos de regresin lineal simple y de correlacin, como un medio de
utilizar una variable para predecir otra, y medir la intensidad de la asociacin
entre dos variables.


CONTENIDOS:
5.1 Introduccin a la bidimensionalidad
5.2 Relacin entre dos variables
5.3 Regresin
5.4 Teora de la correlacin
5.5 Error tpico de la estima
5.6 Variacin explicada y no explicada
5.7 Coeficiente de correlacin
5.8 Correlacin gradual
Evaluacin de la unidad.












___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



127
5.1 INTRODUCCIN A LA BIDIMENSIONAL

En los casos anteriores venamos analizando casos en los cuales intervena
una sola variable, la cual llambamos distribuciones unidimensional, el
procesos que seguamos consista en ordenar y concentrar la informacin en
tablas elaborando grficas y aplicando una serie de medidas, buscando con
ello la mejor forma de describir ciertas caractersticas para as tener una idea
aproximada de la situacin real de un fenmeno, cumplindose, en parte una
de las finalidades de la estadstica.

En esta unidad se harn consideraciones respecto a distribuciones
bidimensionales, o sea, el estudio del comportamiento de dos variables, para
determinar si existe alguna relacin funcional entre si, causa y efecto,
adems de cuantificar dicho grado de relacin.

Estas dos variables deben ser analizadas simultneamente, no en forma
separada. Son ejemplo de distribuciones bidimensionales, variables como :
produccin y consumo, venta y utilidades, costo y venta, etc. Ambas
variables pueden ser discretas o continas, tambin una de ellas discretas y
la otra continua.


5.2. RELACIN ENTRE DOS VARIABLES

Al analizar los datos para las ciencias de la salud, con frecuencia se
encuentra que resulta conveniente saber algo acerca de la relacin entre dos
variables por ejemplo, es posible que se tenga inters en estudiar la relacin
entre la presin de la sangre y la edad, la estatura y el peso, la
concentracin de un medicamento inyectado y la rapidez de los latidos del
corazn, el nivel de consumo de algn nutriente y la ganancia en peso, la
intensidad de un estmulo y el tiempo de reaccin, o bien, el ingreso total
familiar y los gastos mdicos.

La naturaleza y la intensidad de las relaciones entre variables como stas
pueden examinar por medio del anlisis de regresin y correlacin.

5.2.1 REGRESIN Y CORRELACIN : Dos tcnicas estadsticas que aunque
relacionadas, tienen propsito diferentes.

La clase de relacin que puede existir entre dos variables puede ser



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



128
5.2.1.1 Dependencia causal unilateral : Esta relacin seda cuando una de
las variables influye en la otra pero no al contrario

5.2.1.2 Interdependencia: Se presenta cuando la influencia entre las dos
variables es reciproca. Tambin se podra decir que es un caso de
dependencia bilateral .

5.2.1.3 Dependencia Indirecta : Dos variables pueden mostrar cierta
relacin a travs de una tercera variable que influye en ellas.

5.2.1.4 Concordancia : Se presenta por lo general en dos variables
independientes a las que se les determina o cuantifica la correlacin que
podra existir.

5.2.1.5 Covariacin casual : Cuando la correlacin entre las dos variables
es casual o accidental.


5.2.2 PRESENTACIN DE LOS DATOS

Para ordenar los datos de una distribucin estadstica de dos variables,
cuando hay muchas observaciones, se construye una tabla de doble entrada.
En la primera fila se sitan los valores X
i
( donde i toma valores desde
1 hasta n, siendo n el nmero de pares de observaciones ) y con Y
i,

simbolizamos la segunda variable. Se tendr tantos valores de X
i
Y
i
, como
pares de observaciones tengamos, en tal forma que el valor de X
1
guarda
relacin con el de Y
1
, y el de X
2
y con el de Y
2
y as sucesivamente.


















___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



129



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



130


X
i

Y
i




X
1
X
2 ..............................
X
L.................................
X
K



n
J

Y
1

Y
2
.
.
.
Y
J
.
.
Y
L



n
11
n
21
n
i1
n
K1

n
12
n
22
n
i2
n
K2
.
.
.
n
1J.
n
2J
n
iJ
n
KJ
.
.
.
n
1L
n
2L
n
iL
n
KL

n.
1


n.
2
.
.
.
n.
J
.
.
.
n
L

n
i
n
1
n
2
n
i
n
K
n



X
i
Y
i

X
1
.
.
.
.
.
.
Y
1
.
.
.
.
.
.

X
n
Y
n



EJEMPLO : Se ha realizado un experimento para investigar el efecto del opio
y la marihuana en actividad alucinatoria. Ambas variables independientes
tienen dos factores o categoras : fumar y no fumar.

Se a signaron al azar 7 individuos a cada nivel, y se empleo una escala de
actividad alucinatoria de manera tal que un valor elevado indica una mayor
cantidad de alucinaciones.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



131
Los resultados obtenidos estn indicados as :

FUMARON OPIO NO FUMARON OPIO
FUMARON
MARIHUANA
NO FUMARON
MARIHUANA
FUMARON
MARIHUANA
NO
FUMARON
MARIHUANA
7
7
7
6
6
5
4
5
5
4
4
3
3
3
6
5
5
4
4
4
3
3
2
2
1
1
0
0
42 27 31 9


Elaborando una tabla de doble entrada, los datos quedaran as:


OPIO


MARIHUANA




SI



NO



TOTAL

SI

42

31

73

NO

27

9

36

TOTALES

69

40

109



5.3. REGRESIN

El trmino de regresin es un trmino poco afortunado, aunque su uso
continua como vestigio de algunas de las primeras aplicaciones del anlisis
estadstico a datos biolgicos.

Las ideas de regresin fueron aclaradas por primera vez por el cientfico
ingles, Sir FRANCISCO GALTON hacia el final del siglo XIX, para expresar


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



132
la tendencia de la descendencia a Regresar a un valor medio de los
atributos de los padres.

Actualmente el anlisis de regresin se emplea para denotar el procesos de
estimar el valor de una de las variables en funcin de la otra, cuyo valor se
considera dado. Cuando se estima el valor de X en funcin de Y, se habla de
una regresin de x en y, y estaremos estimando la primera variable en
funcin de la segunda. La regresin de y en x ser dada cuando estimamos
el valor para y, suponiendo conocido el valor de x.

La regresin exige ajustar los puntos del diagrama de dispersin a una lnea
que permita estimar los valores del PREDICTANDO ( variable que desea
estimar ) , conocidos los del PREDICTOR (variable conocida ).

Las lneas de regresin de mayor aplicabilidad es la lnea recta ; este
mtodo se denomina tambin ajuste a una recta o regresin rectilnea o
recta de mnimos cuadros.

La ecuacin de la recta es : Y = a
0
+ a
1
X

Donde a
0
es el coeficiente de posicin u origen de la ordena. Puede ser
positiva, negativa o igual a cero.

Como muestran las siguientes grficas :





+ a
0




a
o
= 0 -a
o


a
1
es el coeficiente angular . Determinar el crecimiento o aumento del
predictando ( y ) por cada centmetro del predictor ( x ); tambin suele
llamrsele pendiente de la recta. Este puede ser positivo, negativo o igual a
cero

representando grficamente as :



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



133














a
1
>0 a
1
Z 0 a
1
= 0

Ascendente Descendente Paralela


Cuando se estima y en funcin de x, la ecuacin y = a
0
+ a
1
x nos quedar
as :

Ey = a
0
N + a
1
Ex

Exy = a
0
Ex + a
1
Ex
2


X en funcin de y :


Ex = a
0
N + a
1
Ey

Exy = a
0
Ey + a
1
Ey
2



5.3.1. EL MODELO DE REGRESIN :

El problema tpico de regresin, como en la mayora de los problemas de la
estadstica aplicada, el investigador cuenta para el anlisis, con una muestra
de observaciones de una poblacin real o hipottica. Basado en los
resultados de sus anlisis de los datos de la muestra , tiene inters en llegar
a decisiones acerca de la poblacin de la cual se supone que se ha extrado


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



134
la muestra por lo tanto es importante que el investigador comprenda la
naturaleza de la poblacin en la que est interesado. Debe conocer lo
suficiente acerca de la poblacin, para ser capaz de construir un modelo
matemtico que la represente, o bien , determinar si se ajusta
razonablemente a algn modelo establecido.

Un investigador, que va a analizar un conjunto de datos por los mtodos de
la regresin lineal simple, por ejemplo, debe tener la seguridad de que el
modelo de regresin es, al menos una representacin aproximada de su
poblacin.


5.4 TEORA DE LA CORRELACIN

Se denomina correlacin al grado de relacin de interdependencias, que
existe entre dos variables, o ms, que se estudia para determinar en que
medida una ecuacin lineal o de otro tipo describe explica de una forma
adecuada la relacin entre variables.

Si todos los valores de las variables, satisfacen exactamente una ecuacin,
se dice que las variables estn correlacin perfectamente o que existe una
correlacin perfecta entre ellas.

As, la circunferencia C y los radios r de todos los crculos estn
correlacionados perfectamente, puesto que C = 2tr.

Si lanzamos simultneamente dos dados 100 veces, no hay relacin entre
los puntos correspondientes de cada dado, es decir no estn
correlacionados.

Las variables altura y peso de los individuos muestran ciertas correlacin.

Cuando se trata de dos variables solamente, se habla de correlacin
SIMPLE y de regresin SIMPLE. Cuando se trata de ms de dos variable se
habla de correlacin MLTIPLE y de regresin MLTIPLE.


5.4.1. CORRELACIN LINEAL.

Si X e Y representan las dos variables que se consideran, un diagrama de
dispersin muestra la localizacin de los puntos ( x,y ) en un sistema de
coordinadas rectangulares. Si todos los puntos en este diagrama de


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



135
dispersin parecen encontrarse cerca de una recta, se dice que existe
correlacin y es lineal ; si Y tiende a disminuir cuando se incrementa X, se
dice que existe correlacin POSITIVA o correlacin DIRECTA, si Y tiende a
disminuirse cuando se incrementa X, la correlacin se dice NEGATIVA o
correlacin INVERSA.

Si todos los puntos parecen estar cerca de una curva, la correlacin se dice
NO LINEAL y una ecuacin no lineal es apropiada para la regresin o
estimacin. Es evidente que una correlacin no lineal puede ser a veces
positiva o a veces negativa.

Si no hay ninguna correlacin o relacin entre las variables, se dice que no
hay CORRELACIN entre ellas.











Correlacin lineal Correlacin lineal No hay correlacin
Positiva Negativa


5.4.2 RECTAS DE REGRESIN DE MNIMOS CUADRADOS

Se consideran en primer lugar el problema de la bondad conque una lnea
recta explica la relacin entre dos variables.

Para ello son necesario las ecuaciones de las rectas de regresin, como se
vio, la recta de regresin de y sobre x es :

Y = a
0
+

a
1
X

Donde a
0
y a
1
de obtienen de las ecuaciones normales.

Ey = a
0
N + a
1
EX



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



136
EXY = a
o
EX + a
1
Ex
2


Las cuales las podemos reducir a:



0
2
2
2
a
X
X
Y X XY
N X
=



( )( ) ( )( )
( )




1 2
2
a
X
N XY X Y
N X
=



( )( )
( )



Anlogamente, la recta de regresin de x sobre y est dada por:

X = b
0
+

b
1
Y


Donde b
0
y b
1
se obtienen de las ecuaciones normales


Ex = b
0
N + b
1
Ey

Exy = b
0
Ey + b
1
Ey
2

.
Las que reduciremos a:




0
2
2
2
b
Y
X Y Y XY
N Y
=



( )( ) ( )( )
( )






___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



137
1 2 2 b
N XY X Y
N Y Y
=



( )( )
( )


Las ecuaciones : y = a
0 +
a
1
x y x = b
0
+ b
1
y


Pueden tambin escribirse respectivamente como :

Y
XY
X
X =
|
\

|
.
|
|

2
y X
XY
Y
Y =
|
\

|
.
|
|

2


Donde :
X x x =
_
y
Y y y =
_



Las ecuaciones de regresin son idnticas , si y solamente s, todos los
puntos del diagrama de dispersin se encuentran sobre la recta. En tal caso,
hay una correlacin lineal perfecta entre X e Y


5.5 ERROR TPICO DE LA ESTIMA

Si Y
est.
representa el valor de Y estimado, de y = a
0
+ a
1
x para los valores
de X dados, una medida de dispersin al rededor de la recta de regresin de
Y sobre X viene dada por :



yx
est
S
y
y
N
=

( )
.
2


Que se llama error tpico de la estima de y sobre x.

Si es la recta de regresin :




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



138
X = b
0
+ b
1
y


Se obtiene anlogamente el error tpico de la estima de x sobre y, que queda
definido por :

xy
est
s
x
x
N
=

( )
2




En general , S
yx
= S
xy



La ecuacin :

yx
est
S
y
y
N
=

( )
.
2




Pueden escribirse as :


sx
y y xy
N
a a
=


2
0 1


Que pueda ser ms adecuada para el clculo. Una expresin similar se
obtiene para :


xy
est
s
x
x
N
=

( )
2





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



139
xy s
b b
x x xy
N
2
2
0 1
=



El error tpico de la estima tiene anlogas propiedades a las de la desviacin
tpica, por esos algunos autores o estadsticos prefieren sustituir en las
anteriores ecuaciones a N por : N - 2


5.6 VARIACIN EXPLICADA Y NO EXPLICADA.

La variacin total de y se define como ( y - Y
_
)
2
es decir, la suma de los
cuadrados de las desviaciones de los valores de y de su media y esto puede
escribirse as :

( y - Y
_
)
2
= ( y - y
est.
)
2
+ ( y
est.
- Y
_
)
2



El primer trmino del segundo miembro se llama VARIACIN NO
EXPLICADA, mientras el segundo trmino se llama VARIACIN
EXPLICADA, y esto es as, porque las desviaciones. Yest - Y
_
tienen un
patrn definido, mientras que las desviaciones : y - y
est.
se comportan de
una forma aleatoria o no previsible. Resultado anlogo se obtiene para la
variable x.


( ) ( ) ( )
_ _
x x x x
est est x x
= +

2 2 2




5.7 COEFICIENTE DE CORRELACIN

Fue propuesto por primera vez por A. BRAVAIS y PEARSON , ste nos
da un nmero abstracto que representa una medida cuantitativa de que
tambin estn correlacionados los dos valores, y que se pueden utilizar para
estimar el significado estadstico de la correlacin aparente.
El coeficiente de correlacin se representa por la letra r y su expresin
matemtica es:



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



140
r
iacion licada
iaciontotal
=
var exp
var


r
y
y y
est
y
=

( )
( )
_
_
2
2


Utilizando :

yx
est
S
y
y
N
=

( )
.
2



( y - Y
_
)
2
= ( y - y
est.
)
2
+ ( y
est.
- Y
_
)
2



y el hecho que la desviacin tpica de y es
y s
y y
N
=

( )
_
2
,



r
yx
y
s
s
= 1
2
2
yx y
s s
r = 1
2





Sin tener en cuenta el signo ; ecuacin similar se obtiene cuando se
intercambian x e y.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



141
Para el caso de una correlacin lineal la cantidad r es la misma, tanto si es x
como y considerada como variable independiente.

La ventaja del coeficiente de correlacin radica en el hecho de que se trata
de un coeficiente adimensional, por lo que no dependen de las unidades en
que estn expresadas las dos variables correlacionadas.

En cuanto a los valores numricos que adopta el coeficiente de correlacin r,
cabe decir que cuanto ms prximo est r de +1 - 1 mayor correlacin
habr ( positiva en el primer caso y negativa en el segundo).

-1 s r s 1

El grado de correlacin se podr interpretar, evitando un poco la rigidez
mediante los siguientes limites :

1. Correlacin perfecta, cuando r = 1 r = -1 .
2. Correlacin excelente, cuando : 0,90 < r <1 ; - 1< r < 0,90
3. Correlacin aceptable, cuando : 0.80< r < 0.90 ; -0.90< r < -0.80
4. Correlacin regular, cuando : 0.60 < r<0.80 ; - 080< r < - 060
5. Correlacin mnima, cuando : 0.30 < r < 0.60 ; -60 < r < - 0,30
6. Correlacin no hay , cuando : 0 < r < 0.30 ; -030 < r < 0
Observemos el comportamiento del coeficiente de correlacin en la siguiente
figura.



r = 1 r = -1 o< r< 1










___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



142


-1< r< 0 r = 0






0 0



5.8 FORMULA PRODUCTO - MOMENTO PARA EL COEFICIENTE DE
CORRELACIN LINEAL

Si se supone una relacin lineal entre dos variables, la ecuacin :


r
y
y y
est
y
=

( )
( )
_
_
2
2



Se convierte en :

r
xy
X Y
=


( )( )
2 2





Donde
X x x =
_
y
Y y y =
_
, esta frmula que
automticamente dada el signo adecuado de r se llama frmula producto -
momento y muestra claramente la simetra entre x e y si se escribe;



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



143
xy s
xy
N
=

, x s
x
N
=

2
,
y s
y
N
=

2


entonces s
x
y s
y
se reconocern como la desviacin tpica de las variables
x e y, respectivamente, mientras que
x y s s
2 2
,
son sus varianzas La
nueva cantidad S
xy
se llama COVARIANZA de x e y. En trminos de
smbolos las anteriores ecuaciones pueden resumirse si :

5.9 COVARIANZA. Es un indicador de cul es la variacin conjunta de X e Y,
y va a permitir, de alguna manera, examinar el grado de relacin existente
entre ambas.

La forma de calcular la covarianza es mediante el producto de las dos
diferencias con respecto a sus medias para cada una de las variables, es
decir:



Para datos no agrupados:


n n
Z Z
y y
x x
S
y x
i
i
n
i
xy

=
|
|
.
|

\
|
|
.
|

\
|

=

=1





y
x
y
x
S
n
i
i
xy

.









___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



144
Para datos agrupados:


n n
f
Z Z
f y y
x x
S
i
y x
i i
i
n
i
xy

=
|
|
.
|

\
|
|
.
|

\
|

=

=1






y
x
f y
x
S
n
i i
i
xy

.



r
xy
x y
s
s s
=


Al valor
r
2
se le denomina coeficiente de determinacin, e indica el
porcentaje de la variabilidad de una variable explicable por la otra.

Ntese que r no es solamente independiente de la eleccin de las unidades
de x e y, tambin de la eleccin del origen.


5.10 FRMULAS CORTAS PARA EL CALCULO

La frmula :

r
xy
X Y
=


( )( )
2 2



Puede escribirse en la forma equivalente :




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



145



| |
| |
r
N XY X Y
N X X N Y Y
=




( )( )
( ) ( )
2 2 2 2



5.11 RECTAS DE REGRESIN Y EL COEFICIENTE DE CORRECCIN
LINEAL.

La ecuacin de la recta de los mnimos cuadrados Y = a
o
+ a
1
X

o recta
regresin de y sobre x, puede escribirse :


Y Y
r
X X
y
x
s
s
=
_ _
( )

Y
r
X
y
x
s
s
=



Anlogamente, la recta de regresin de X sobre Y , x = bo + b
1
y
puede escribirse :


X X
r
Y Y
x
y
s
s
=
_
( )
_

X
r
Y
x
y
s
s
=



Las pendientes de las rectas anteriores son iguales si , y solamente si,
r = 1. En tal caso las dos rectas son iguales o idnticas y entres las
variables. x e y hay correlacin lnea perfecta. Si r = O, las rectas forman
un ngulo recto y no hay correlacin entre las variables. As, pues , el
coeficiente de correlacin lineal mide la divergencia de las dos rectas de
regresin..

Ntese que si las ecuaciones : se escriben : Y = a
o
+ a
1
X , X = b
o
+ b
1
Y ,
respectivamente entonces : a
1
b
1
= r
2




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



146
5.12 CORRELACIN GRADUAL O POR RANGOS.

En lugar de utilizar valores precisos de las variables, o cuando tal precisin
no es ventajosa, los datos pueden ordenarse segn su tamao , importancia,
etc. Utilizando los nmeros 1,2,3, ...,N. si dos variables x e y se ordenan de
tal forma, el coeficiente de correlacin gradual est dado por




gra .
( )
d
r
D
N N
=

1
6
1
2
2



Donde D = diferencia entre las graduaciones de los valores correspondientes
de X e Y.

N = nmero de pares de valores ( x , y ) de los datos .

Dicha frmula es llamada comnmente como COEFICIENTE DE RELACIN
DE SPEARMAN, es muy utilizado en investigacin de mercado,
especialmente cuando no se pueden aplicar medidas cuantitativas para
ciertas caractersticas cualitativas tales como: preferencias, actitudes,
capacidad de direccin de personal, belleza femenina y otras caractersticas
de conductas.

El significado del valor r es el siguiente :

* Sise trata de dos clasificaciones idnticas r = 1
* Si se trata de dos clasificaciones inversa r = -1
* En los casos intermedios -1 Z r Z + 1.


5.13 REGRESIN NO LINEAL, REDUCIBLES A LINEAL.

Hay situaciones en las que el modelo lineal no es adecuado al fenmeno que
se analiza. Existen otros mtodos basados en el mismo principio de ajuste
que la regresin lineal(minimizar los cuadrados de los residuos), en muchos
casos reducibles a lineal(transformando las variables): en el caso de las
regresiones:


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



147



Exponencial:
e
bx
a Y . =



Potencial:
x
b
a Y . =



Logartmica:
) ln( . X b a Y + =



EJEMPLO 1.

En unas pruebas elsticas de rebote de un amortiguador de friccin, se
obtuvieron para distintas altura de cada del peso libre, las altura de rebote
que figuran en la siguiente tabla ; determinar la recta de regresin
correspondiente y determinar el coeficiente de correlacin r para las dos
variables,

X : altura de cada ( dm ) Y : altura de rebote ( m.m)

1.2 1.9
2.4 1.3
3.2 2.1
4.3 3.4
5.7 2.0
7.0 3.8
9.0 3.3

Evidentemente, a mayor altura de cada, mayor altura de rebote. Se trata de
dos variables dependiente, existiendo una relacin positiva entre ellas.

SOLUCIN :

Efectuemos la grfica de los puntos del ejercicio.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



148



Altura de Rebote (mm)







4


3

2

1


1 2 3 4 5 6 7 8 9
Altura de cada (dm)



Luego, dispondremos los clculos en forma de tabla

PUNTOS X Y X .Y X
2
y
2

1 1.2 1.9 2.28 1.44 3.61
2 2.4 1.3 3.12 5.76 1.69
3 3.2 2.1 6.72 10.24 4.41
4 4.3 3.4 14.62 18.49 11.56
5 5.7 2.0 11.40 32.49 4.0
6 7.0 3.8 26.60 49 14.44
7 9.0 3.3 29.70 81 10.89
E
32.8 17.8 94.44 198.42 50.6

Cmo : Y = a
o
+ a
1
X,




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



149

0
2
2
2
a
X
X
Y X XY
N X
=



( )( ) ( )( )
( )



0 2
178 19842 328 94 44
7 19842 328
434 244
31310
13869
a
=

= =
( . )( . ) ( . )) . )
( )( . ) ( . )
.
.
.




1 2
2
a
X
N XY X Y
N X
=



( )( )
( )





1 2
7 94 44 328 178
7 19842 328
77 24
31310
02466
a
=

= =
( )( . ) ( . )( . )
( )( . ) ( . )
.
.
.




Luego la recta de regresin de X sobre Y , es :

y = 1.3869 + 0, 2466X




| |
| |
r
N XY X Y
N X X N Y Y
=




( )( )
( ) ( )
2 2 2 2





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



150
|
|
|
|
r =


= =
7 94 44 32 8 17 8
7 19842 328 7 506 178
77 24
11697 416
77 24
108154
2 2
( , ) ( , )( , )
( )( . ) ( . ) ( )( . ) ( . )
.
.
.
.



r = 0.714


COMENTARIO : No es un coeficiente de correlacin demasiado alto , por lo
que es posible que la recta de la regresin antes buscada no pueda utilizarse
para efectuar previsiones. La probabilidad de asegurar una cierta altura de
rebote para una altura de cada del peso libre determinada, es bastante baja.


EJEMPLO 2

Calcular el error tpico de la estima , S
yx
; como tambin, la variacin total, la
variacin no explica y la variacin explica, para los datos del ejemplo 1.


SOLUCIN :

En la siguiente tabla aparecen los valores reales de Y, y los valores de
y estimado obtenidos con la recta de regresin : y = 1.3869 + 2466X
obtenida anteriormente.

Por ejemplo cuando X = 1.2 se obtiene que

Y
est.
= 1.3869 + 0,2466 ( 1.2) = 1.3869 + 0.29592 = 1.68













___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



151

X 1.2 2.4 3.2 4.3 5.7 7.0 9.0 32.8
Y 1.9 1.3 2.1 3.4 2.0 3.8 3.3 17.8
Y
est.

1.68 1.97 2.17 2.44 2.79 3.11 3.60 17.76
( Y -Y
est
)
2

0.04 0.44 0.004 0.92 0.62 0.47 0.09 2.58
( Y - y
_
)
2

0.40 1.53 0.19 0.73 0.29 1.58 0.57 5.29
( Y
est
- y
_
)
2

0.73 0.32 0.13 0.01 0.06 0.32 1.12 2.69

y
_
=
178
7
254
.
. =

a) error Tpico dela estima :

yx
est
S
y
y
N
=

( )
.
2

= =
2 58
7
0 60
.
.


b) Varianza total =

( )
_
Y Y
2
= 5.29

c.) Variacin no explicada = E ( Y -Y
est
)
2
= 2.58

d.) Variacin explicada =
( ) .
_
est Y
Y

=
2
2 69


Podemos tambin calcular a r por la formula:


r
V licada
V total
= = =
.exp
.
.
.
.
2 69
529
0 713



EJEMPLO 3.

Calcular el coeficiente de correlacin gradual para los datos del Ejemplo 1.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



152
SOLUCIN :

Ordenando las alturas de cada en forma ascendente tenemos :

Datos: 1.2, 2.4, 3.2, 4.3, 5.7, 7.0, 9.0

Graduacin: 1 2 3 4 5 6 7


De igual forma , las alturas del rebote ordenados en sentido creciente son :


Datos: 1.3 1.9 2.0 21 3.3 3.4 3.8

Graduacin: 1 2 3 4 5 6 7


Luego formamos una tabla que represente los datos antes dados, lo mismo
que represente sus respectivas graduaciones.



X
1.2 2.4 3.2 4.3 5.7 7.0 9.0 32.8

Y
1.9 1.3 2.1 3.4 2.0 3.8 3.3 17.8
Graduacin de x
1

2

3

4

5

6

7


Graduacin de y


2

1

4

6

3

7

5


D
-1 1 -1 -2 2 -1 -2

D
2

1 1 1 4 4 1 4 16





Entonces :


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



153
gra .
( )
d
r
D
N N
=

1
6
1
2
2




|
|
gra
( )
( )
. .
d r
=

= = = 1
6 16
7 17 1
1
96
336
1 0285 0715
2



Que concuerda con el valor de r obtenido en el ejemplo 1.


EJEMPLO 4.

En 1965, Babich, Jacobson y Bubash realizaron un experimento para
demostrar que el cido ribonucleico ( ARN) est relacionado con la memoria.

El experimento consisti en condicionar 8 ratas a aproximarse a comer
cuando se encenda una bombilla.

Una vez condicionadas se extrajo de su cerebro ARN ; estas pertenecan al
grupo A del experimento, tambin se realiz una extraccin de ARN de un
grupo de 8 ratas no sometidas a este condicionamiento. Se eligieron
posteriormente 16 ratas que fueron divididas al azar en dos grupos A Y B .

Las ratas del grupo A recibieron ARN procedente de las ratas condicionadas.
las ratas del grupo B recibieron ARN procedentes de las rata no
condicionadas Ambos grupos se colocaron en cajas de Skinner y durante el
experimento se encendi 25 veces la bombilla.

La contabilizacin del nmero de aproximaciones a la comida producidas
despus del estmulo luminoso est indicado en la siguiente tabla.







___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



154
GRUPO A GRUPO B

RATA N APROX. RATA N APROX.

1 3 9 0
2 10 10 1
3 8 11 2
4 9 12 1
5 10 13 0
6 1 14 3
7 7 15 0
8 4 16 1


Calcular el grado de relacin por rango.


SOLUCIN :

Ordenamos en sentido ascendente de magnitud, las aproximaciones del
grupo

A :

1, 3, 4, 7, 8, 9 10 ; 10


Puesto que en esta ordenacin los lugares sptimo octavo representan la
misma aproximacin ( 10) , le asignamos a estos dos lugares un orden medio
de 7.5 (7+8 = 15/ 2 =7.5 ).


Graduacin : 1, 2, 3, 4, 5, 6, 7.5, 7.5


Ordenamos de igual forma las aproximaciones de grupo

B :

0, 0, 0, 1, 1 1 2 3



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



155
Graduacin : 2 2 2 5 5 5 7 8


Formemos una tabla para el clculo .


X 3 10 8 9 10 1 7 4 52
Y 0 1 2 1 0 3 0 1 8
Graduacin de X 2 7.5 5 6 7.5 1 4 3
Graduacin de Y 2 5 7 5 2 8 2 5
D 0 2.5 -2 1 5.5 -7 2 -2
D
2
0 6.25 4 1 30.25 49 4 4 98.50





Luego:


gra .
( )
d
r
D
N N
=

1
6
1
2
2



|
|
gra
( . )
( )
.
d r
=

= = 1
6 9850
8 8 1
1
591
504
0172
2




Podemos concluir diciendo que , aunque la diferencia entre los dos grupos es
una diferencia significativa que prueba o da entender que el ARN acta como
soporte de la memorizacin, no podemos decir que dos grupos A y B se
relacionen.





___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



156
EVALUACION SOBRE LA UNIDAD Nro. 5


5.1 La siguiente tabla da las dos primeras puntuaciones, denotadas por X
e Y, respectivamente, de 10 estudiantes en dos pruebas de biologa.

Puntuacin en la primera prueba ( x):

6, 5, 8, 8 7, 6, 10, 4, 9 7


Puntuacin de la segunda prueba (y) :

8, 7, 7, 10, 5, 8, 10, 6, 8, 6,


a. Construir el diagrama de dispersin.
b. Hallar la recta de regresin de los mnimos cuadrados de y
sobre x.
c. Hallar la recta de regresin de los mnimos cuadrados de X
sobre Y.
d. Representar las dos rectas de regresin sobre el diagrama de
dispersin.

5.2 Hallar S
yx
y S
xy
para los datos del problema anterior.

5.3 Calcular la variacin total, la variacin no explica y la variacin
explicada, para los datos del problema 8.1

5.4 Utilizando los resultados del problema 8.3 Hallar el coeficiente de
correlacin.

5.5 Hallar el coeficiente de correlacin mediante la formula producto-
momento y formula de SPEARMAN.

5.6 se produjo un experimento con el fin de estudiar el efecto de un cierto
medicamento en bajar la rapidez de los latidos del corazn en los adultos. La
variable independiente es la dosis en milagro del medi camento y la variable
dependiente es la diferencia entre la rapidez ms baja siguiente a la
administracin del medicamento y un control antes de administrar el
medicamento. Se reunieron los siguientes datos.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



157

REDUCCIN EN LA RAPIDEZ
DOSIS(mg) DEL CORAZN ( Latidos / min.)
X Y
0.50 10
0.75 8
1.00 12
1.25 12
1.50 14
1.75 12
2.00 16
2.25 18
2.50 17
2.75 20
3.00 18


Construir un diagrama de dispersin, obtener las ecuaciones de regresin y
trazar su grfica en el diagrama de dispersin, calcular el coeficiente de
correlacin por todo los sistemas vistos hasta el momento.

5.7 Para medir la reaccin de un grupo de consumidores respecto a la
presentacin de un producto, se tomaron 12 personas y se integraron en
cuanto al concepto que le merecen la presentacin tradicional de este
producto, luego se les presenta el mismo articulo en su nuevo empaque. Las
mediciones se efectuaron utilizando una escala de 25 puntos y se obtuvieron
los siguientes resultados ( para cada una de las personas ).

Antes :

6 10 14 17 6 6 11 14 10 17 11 13.

Despus :

10 13 18 12 9 8 12 18 17 20 18 15

Calcular el coeficiente de correlacin de SPEARMAN.


5.8 La siguiente tabla muestra la edad X, y la presin sangunea Y de 12
mujeres.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



158


EDAD ( X)

56 42 72 36 63 47 55 49 38 42 68 60


PRESIN (Y)

147 125 160 118 149 128 150 145 115 140 152 155

a.. Hallar el coeficiente de correlacin entre X e Y.
b. Determinar la ecuacin de regresin de mnimo cuadrados de Y
sobre X.
c. Estimar la presin sangunea de una mujer de 45 aos.

5.9 Se compararon dos mtodos de medir el rendimiento cardiaco a 10
animales experimentales con los resultados siguiente.

MTODO I : 0.8, 1.0, 1.3, 1.4, 1.5, 1.4, 2.0, 2.4, 2.7, 3.0

MTODO II : 0.5, 1.2, 1.1, 1.3, 1.1, 1.8, 1.6, 2.0, 2.4, 2.8

a. Preparar un diagrama de dispersin
b. Calcular el coeficiente de correlacin , por los mtodos vistos.
c- Obtener una ecuacin de regresin adecuada.

5.10 En un acero aleado, la adicin progresiva de manganeso permite
dejando constante los de ms componentes de la aleacin, aumentar la
dureza, que se mide en este caso especifico por el mtodo de Brinell .

Se han realizado diversas coladas con sus probetas correspondientes,
relacionndose el porcentaje de manganeso. (% Mn) con la dureza obtenida
en el ensayo Brinell (DB) segn los datos que figuran en la tabla.

a. Determinar si existe relacin entre las dos variables.
b. obtener la ecuacin de regresin para el sistema.
c. Elaborar la grfica de regresin.






___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



159

X Y
%Mn DB

0.115 60
0.20 125
0.30 105
0.32 145
0.33 195
0.425 160
0.52 140
0.59 200
0.67 180
0.78 215























___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



160










UNIDAD N6

INTRODUCCIN A LAS COMPUTADORAS

OBJETIVO
DE LA UNIDAD: Identificar la algunos paquetes estadsticos( Excel,
statgraphics) como herramientas de trabajo estadstico.


CONTENIDOS:
6.1 La computadora en la Estadstica
6.2 Introduccin a Microsoft Excel
6.2.1 Grafica en Excel
6.3 Manejo del Statgraphics

















___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



161
6.1 LA COMPUTADORA EN LA ESTADSTICA

Las computadoras estn ocasionando una verdadera revolucin: la
revolucin cientfico- tcnica.

En la ltima dcada han tenido lugar cambios revolucionarios en la sociedad
debido a la rpida difusin de la tecnologa de computadoras; cambios en
nuestros negocios, nuestros hogares y nuestros salones de clases.

La necesidad de efectuar un gran nmero de clculos aritmticos como parte
del anlisis estadstico de los datos slo vive en el recuerdo de aquellos
investigadores y practicantes cuyas carreras son anteriores a la llamada
revolucin de las computadoras. Las computadoras pueden ejecutar
clculos mas rpidos y mucho mas precisos de lo que puede un ser humano.

El uso de las computadoras hace posible que los investigadores dediquen
ms tiempo a mejorar la calidad de los datos originales y a la interpretacin
de resultados.

Durante los ltimos veinte aos, el campo de la estadstica ha cambiado
dramticamente mediante el desarrollo de SOFWARE de computadoras
especialmente escrito para el anlisis estadstico. Durante los ochenta, el
SOFWARE estadstico experimento una vasta revolucin tecnolgica;
rpidamente se dispuso de programas de computacin o paquetes como
SAS, SPSS, MINITAB, MYSTAT Y STATGRAPHICS ; los que con el uso
cada vez mayor de los paquetes de hojas de clculos populares como
LOTUS Y EXCEL, llevaron a la incorporacin de peculiaridades estadsticas
en estos paquetes.

El final de la dcada de los ochenta y el principio de los noventa
representaron un periodo continuo de avances tecnolgicos; mientras que los
primeros paquetes desarrollados para las computadoras personales slo
estaban disponibles para maquinas IBM o compatibles, actualmente los
paquetes han sido adaptados al mbito de las computadoras MACKINTOSH.

Aunque el SOFTWARE estadstico ha hecho factible incluso los anlisis ms
sofisticados, los problemas surgen cuando usuarios inexpertos en
estadstica, que no comprenden las premisas que estn detrs de los
procedimientos o las limitaciones de los resultados obtenidos, son
engaados por la salida estadstica generada por la computadora.



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



162
El papel principal del experto en estadstica o del investigador, es analizar e
interpretar los resultado; el papel de la computadora es ayudar en este
proceso. La computadora es una herramienta en extremo til que puede
almacenar, organizar y procesar informacin con facilidad y rapidez y
proporcionar resultados, tablas y graficas resumidas.

Para interactuar en forma apropiada con la computadora, el investigador no
slo tiene que estar familiarizado con el paquete del programa en uso, sino
que adems tiene que seleccionar correctamente los procedimientos
estadsticos apropiados para la tarea que se trata. Por ejemplo, la grafica de
pastel y las tablas de clasificacin cruzada slo sirven como informaci n
cualitativa; es inadecuado solicitar grficos del ejemplo anterior para
variables cuantitativas continuas, a menos que antes hayan sido clasificadas,
como en una distribucin de frecuencias. por otra parte, las medias,
medianas, rango y desviacin estndar slo se deben usar para variables
cuantitativas; es totalmente ocioso ordenar a la computadora que produzca
resultados para variables cualitativas; el resultado no tendra sentido.

6.2 INTRODUCCIN AL MICROSOFT EXCEL

La plantilla electrnica Excel, se revel como una aplicacin computacional
poderosa la cual permite efectuar clculos estadsticos relativamente
complejos. Su uso en la estadstica, aunque no es lo ideal, permite resolver
la mayor parte de las situaciones comunes y economiza tiempo al acabar con
la demora en la repeticin de largos y complejos clculos estadsticos, lo cual
ocurra con los mtodos basados en el lpiz, el papel y las calculadoras.

6.2.1 INGRESO AL PROGRAMA

Para iniciar el trabajo con la hoja electrnica Microsoft Excel desplace el
mouse hasta el botn rotulado inicio que aparece en la parte inferior
izquierda de la pantalla inicial de Windows, se abre una pantalla de opciones.
Lleve el marcador del mouse a la opcin programas, cuando se abre otra
pantalla; lleve el puntero hasta la carpeta Office o al icono del Microsoft
Excel para dar ingreso a la hoja electrnica.

6.2.2 FUNCIONES ESTADSTICAS

Dentro de las funciones predefinidas de Excel se encuentran:

- DESVEST(a,b,c,...) es la desviacin estndar de los datos de la
muestra a,b,c...


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



163
- DESVPROM(a,b,c,...) calcula la media aritmtica de las desviaciones
en valor absoluto de los nmeros a, b, c,... con respecto a la media de
los mismos nmeros.

- VAR(a,b,c,...) calcula la varianza de los datos de la muestra a,b,c,..

- MAX(a,b,c,d,) determina el mximo de los nmeros a,b,c,d,...

- MEDIANA(a,b,c,...)halla la mediana de los nmeros a,b,c,...

- MIN(a,b,c,...) encuentra el mnimo de los nmeros a,b,c,...

- MODA(a,b,c,...) muestra el valor modal de los nmeros a,b,c....

- PROMEDIO( a,b,c,...) calcula la media aritmtica de los nmeros
a,b,c,...

Cuando los datos estn en bloques es decir en celdas, es importante que
usted sombree las celdas a trabajar y luego elija la funcin que desee.

6.2.3 GRFICOS EN EXCEL

Es muy fcil y rpido presentar los datos de una hoja empleando al
ASISTENTE DE GRFICO, con el cual se puede escoger a partir de muchas
variaciones predefinidas y, adems, personalizar cualquiera de esas
opciones. La vinculacin del grafico con los valores que le dieron origen
tambin es sencilla, y cada cambio hecho en la hoja es actualizado
automticamente en la figura.

Despus de colocar en las columnas de la hoja de Excel los datos, sombree
la o las columnas que desee obtener grafico; a continuacin, utilizamos el
mouse hacemos clic en el icono correspondiente al asistente para grficos
de Excel; al aparecer el cuadro de dilogo, seleccionamos el tipo de grfico
deseado y hacemos clic en el botn rotulado siguiente. Ahora escribimos los
ttulos para el grfico, los ejes (X) y (Y); luego de completar la informacin
necesaria, hacemos clic en el botn rotulado siguiente. El siguiente cuadro
de dilogo pregunta el lugar donde queremos situar el grfico( en una hoja
nueva o como objeto); luego de ubicarlo, hacemos clic en el botn rotulado
siguiente. Finalmente hacemos clic en el botn rotulado terminar y la grafica
se pega en la hoja designada.




___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



164
6.3 MANEJO DEL STATGRAPHICS

Con este paquete estadstico usted podr entrar, crear, modificar, borrar,
salvar e imprimir archivos de datos y grficas; podr obtener estadsticas
descriptivas y tablas de frecuencias, lo mismo que manejar distribuciones de
probabilidad, hacer inferencia estadstica, cruce de variables y anlisis de
regresin.
Aunque el programa est escrito en ingles su uso es muy fcil porque da
instrucciones en la parte baja de la pantalla en fondo rojo.

6.3.1 COMO ENTRAR AL PAQUETE STATGRAPHICS

Supongamos que el paquete se encuentra instalado en el disco duro en un
directorio llamado STATG. Tan pronto tenga el prompt ( C:>) escriba
CD__STATG y presione ENTER. Cuando la pantalla muestre el siguiente
prompt (que puede ser C:STATG >) escriba STATGRAF, que es el nombre
del archivo de ejecucin, y oprima la tecla ENTER. A continuacin aparece
en pantalla el nombre del paquete, los fabricantes del mismo, la versin etc.
Segundos despus aparece en pantalla el men principal.


STATGRAPHICS SATTISTICAL GRAPHICS SYSTEN


DATA MANAGENEN AND SYSTEM UTILITIES TIME SERIES PROCEDURES
A. Data manegenen L. Forecasting
B. Sysyten Environnent M. Quality
C. Report writer and Graphics Replay N. Saoothing
D. Graphics Atributes O. Time series Analysis

PLOTTING AND DESCRIPTIVE ADVANCED PRODEDURES
E. Plotting Functions P. Categorical Data Analysis
F. Descriptive Methods Q. Multivariate Methods
G. Estimation and Testing R. Nonparametric Methods
H. Distribution Functions S. Sanpling
I. Exploratory Data Analysis T. Experimental Design

ANOVA AND REGRESSION ANALYSIS MATHEMATICAL AND USER PROCEDURES
J. Analysis of variance U. Mathematical Functions
K. Regression analysis V. Macros and Functions.


Use el cursor para desplazarse en esta pantalla y al ubicarse presione enter.

Las opciones de cada submen estn precedidas por una letra mayscula;
cada opcin tiene una lista de procedimientos numerados.


___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



165



BIBLIOGRAFIA

1. WYNE.DANIEL, BIOESTADISTICA BASE PARA EL ANALISIS DE
LAS CIENCIAS DE LA SALUD. LIMUSA.MEXICO 1983
2. SNEDECOR GEORGEW.YG.COCHERAN , METODOS
ESTADISTICOS ,CONTINENTAL S.A MEXICO 1971.
3. MOOD ALEXANDER M. GRAYBILL FRANKLIN A Y BOES DUANE
C. INTRODUCTION TO THEORY OF STATISCS. THIRD EDITTION
MC GRAW-HILL 1974
4. CONOVER W. J. PRACTICAL NONPARAMETRIC STATICS JHON
WILE Y SONS INC. NEW YORK. 1971
5. CONOVOS GEORGE C. PROBABILIDAD Y ESTADISTICA
APLICACIONES Y METODOS MC.GRAW.HILL MEXICO 1988.
6. CHAO LINCOLN L. ESTADISTICA PARA LAS CIENCIAS
ADMINISTRATIVAS 2 EDICION MC GRAWL HILL. 1975.
7 WALPOLE RONALD E. RAYMOND H. MYERS.PROBABILIDAD Y
ESTADISTICA 4 EDICION MCGRAWL-HILL MEXICO 1992.
8. LEVIN RICHARD Y. ESTADISTICA PARA ADMINISTRADORES 2
EDICION PRENTICE. HALL HISPANOAMERICANA S.A MEXICO
1988.
9. BOROVKOV A. A ESTADISTICA MATEMATICA MIR MOSCU 1984.
10. SIEGEL SEDNEY ESTADISTICA NO PARAMETRICA , APLICADA A
LAS CIENCIAS DE LA CONDUCTA TRILLAS , MEXICO 1989



___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ



166