Está en la página 1de 69

ESTADSTICA APLICADA

Separata de Estadstica Descriptiva


ING. WILMER JULIO BERMDEZ PINO
Docente de la Facultad de Ing. Informtica y Sistemas.
Universidad Nacional Agraria de la Selva.
Tingo Mara
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
1
Introduccin
El trmino estadstica es utilizado frecuentemente para hacer referencia a datos
individuales, un conjunto de datos o cualquier informacin derivada de ellos; sin
embargo, la estadstica es mucho ms que l simple coleccin o tabulacin de datos pues
involucra todo un conjunto de procesos que tienen como objetivo alcanzar un mayor
conocimiento de una realidad que es desconocida y sobre la cual se desea tomar
decisiones confiable.
Cualquiera que sea la actividad que realiza una persona, siempre se enfrentar al reto de
tomar decisiones. Cada da, iniciamos un juego en decisiones que va de la mano con
nuestro trabajo diario. Del mismo modo, para la gestin diaria de una empresa, de un
sector, de un pas, etc. se requiere tomar continuamente decisiones; por ejemplo, para
dar una medida econmica sobre modificacin de aranceles a los productos importados
se pueden tener algunas interrogantes como: De qu manera afectaran las medidas a
otros sectores productivos? Generarn condiciones favorables para una mejora en la
tecnologa? Permitirn generar una mayor oferta de trabajo?, etc. Para tomar una
decisin al respecto es necesario tener informacin sobre el comportamiento de los
diferentes sectores econmicos y de la forma como se relacionan entre s. Obviamente,
para esto se requiere disponer de datos apropiados (suficientes, oportunos y de buena
calidad), de metodologas y procesos que permitan alcanzar el conocimiento deseado de
la realidad sobre la cual se tomaran decisiones. La estadstica tambin brinda apoyo a
otras ciencias mediante el desarrollo de procesos dirigidos a la aceptacin y anlisis de
datos; de esta manera, se pueden asociar ciertos niveles de confiabilidad con los
procesos de toma de decisiones.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
2
I. PRINCIPALES DEFINICIONES
1. ESTADSTICA
Ciencia que proporciona un conjunto de mtodos y tcnicas que se utilizan para
recolectar, organizar, presentar, analizar e interpretar el comportamiento de
los datos con respecto a una caracterstica materia de estudio e investigacin.
En primer lugar se encarga de obtener informacin, describirla y luego en base a
esta informacin, realizar predicciones y una ptima toma de decisiones frente a la
incertidumbre.
El objeto de estudio de la Estadstica ES EL ESTUDIO DE LOS DATOS: Hacer
una inferencia ptima a partir de los datos, para la toma de decisiones.
1.1. QUIN UTILIZA LA ESTADSTICA?
Las tcnicas estadsticas se aplican de manera muy general en mercadotecnia,
contabilidad, control de calidad, estudio de consumidores, administradores de
instituciones, en la educacin, rganos polticos, en la medicina y por
diferentes profesionales que intervienen en la toma de decisiones.
1.2. DIVISIN DE LA ESTADSTICA: El campo de la estadstica generalmente
est divido en dos grandes reas: Estadstica Descriptiva o Deductiva y
Estadstica Inferencial o Inductiva.
1.2.1. ESTADSTICA DESCRIPTIVA:
Es el conjunto de mtodos que implican la recoleccin, presentacin y
caracterizacin de un conjunto de datos a fin de describir en forma
apropiada las diversas caractersticas de estas. Es decir, un estudio
estadstico se considera descriptivo cuando slo se analiza y
describe un conjunto datos de una muestra o de una poblacin sin
sacar conclusiones de tipo general.
1.2.2. ESTADSTICA INFERENCIAL:
La inferencia estadstica es un conjunto de mtodos o tcnicas que
posibilitan la generalizacin o toma de decisiones en base a una
informacin parcial obtenida mediante tcnicas descriptivas.
En este aspecto es inferir o predecir conclusiones que ataen a toda
fuente de informacin de donde provienen los datos. Ahora bien esta
prediccin se hace con un cierto grado de confianza; este grado de
confianza se mide por la probabilidad.
2. OBJETIVOS GENERALES DE LA ESTADSTICA:
La estadstica tiene tres objetivos:
2.1 Describir colecciones de datos empricos
2.2 Inferir las propiedades de una poblacin.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
3
2.3 Realizar predicciones sobre el comportamiento de fenmenos.
2.1. DESCRIBIR COLECCIONES DE DATOS EMPRICOS: Para lograr este
objetivo general de la estadstica es necesario realizar algunos procesos bsicos,
tales como:
- Evaluar y corregir los datos.
- Clasificar los datos en categoras adecuadas.
- Tabular los datos clasificados.
- Representar los datos adecuadamente, ya sea en forma de tablas o grficos.
- Obtener medidas de resumen.
2.2. INFERIR LAS PROPIEDADES DE UNA POBLACIN: Esta ciencia
pretende inferir las propiedades de toda una poblacin en estudio a partir del
anlisis e interpretacin de los datos conocidos de una muestra de dicha
poblacin. Para lograr este segundo gran objetivo general de la estadstica se
han desarrollado conceptos, mtodos y tcnicas relacionadas con:
- El muestreo estadstico.
- La estimacin estadstica.
- El clculo de probabilidades.
- Las pruebas estadsticas.
2.3. REALIZAR PREDICCIONES SOBRE EL COMPORTAMIENTO DE
FENMENOS: El comportamiento de los fenmenos en el futuro constituye
la mxima aspiracin prctica de toda ciencia, puesto que el inters
fundamental en este caso es la toma de decisiones con vigencia y efecto en el
futuro. Esta ciencia ha desarrollado y sigue creando conceptos, mtodos y
tcnicas para tal fin; los mismos que la convierten en poderosa ciencia auxiliar
para el progreso de otras ciencias.
3. TRMINOS DE ESTADSTICA.
La estadstica usa diversos trminos con un significado especial. Para ello es
conveniente especificar el significado de algunos de los ms importantes y
frecuentes. A continuacin se incluyen algunos trminos.
ESTADSTICAS. Es cualquier conjunto sistemtico de datos estadsticos
referentes a un determinado fenmeno o asunto. Por ejemplo: estadsticas
econmicas, estadsticas policiales, nmero de enfermos segn causas en un
hospital, etc.
Estadstica: Es Ciencia, y siempre se escribe con mayscula la primera letra
Estadstico: Profesional que se dedica al estudio de la Estadstica.
Estadista: Es el hombre de estado, ejemplo el presidente de la repblica, ministros,
congresistas, etc.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
4
POBLACIN
(N)
Es el conjunto de todos los individuos, objetos u observaciones que poseen
alguna caracterstica observable en comn. Conjunto formado por todas
las unidades de anlisis (elementos) que son cobertura de la investigacin
planteada
POBLACIN
OBJETIVO
Conjunto formado por todas las unidades de anlisis para el cual
se deben hacer las extrapolaciones e inferencias a manera de
generalizacin de los hallazgos realizados.
POBLACIN
MUESTREADA
Conjunto formado por todas las unidades de anlisis (elementos) que
integran al directorio o marco de muestreo que permite ver su
identificacin y forma de acceder a ella para efectuar las mediciones
respectivas.
MUESTRA (n)
Es una parte o subconjunto representativo de la poblacin y al proceso de
obtener la muestra se le llama muestreo.
Subconjunto de elementos elegidos de la poblacin muestreada a travs
mtodos de seleccin determinados y del cual se obtendr la informacin
primaria cualitativa o cuantitativa que permitir estudiar, analizar y evaluar a
dicha poblacin
UNIDAD DE
ANLISIS
Es el elemento u objeto de la poblacin que ser analizado y sobre los
cuales se obtendrn los datos.
Eslaunidadbsicaenlaquesegeneralainformacinprimariaqueesobje
todelestudio
UNIDAD DE
MUESTREO
Agrupaciones de unidades de anlisis claramente delimitadas no solapadas o
disjuntas que cubren completamente al arco de muestreo. En ciertas
investigaciones la unidad de muestreo coincide con la unidad de anlisis, sin
embargo, con frecuencia la unidad de muestreo es un conglomerado que
comprende a un conjunto de unidades de anlisis
MARCO DE
MUESTREO
Conjunto conformado por el listado de unidades de muestreo que:
Permite su identificacin y localizacin de cada unidad de muestreo.
Dispone de informacin suficiente para su estratificacin respectiva.
Permite establecer la probabilidad de incluir cada unidad en la muestra
respectiva.
DOMINIOS
Subdivisiones de la poblacin para las cuales se prev elegir muestras
independientes y representativas con el fin de generar estimaciones de
confiabilidad predeterminada.
CENSO
Decimos que realizamos un censo cuando se observan todos los elementos
de la poblacin estadstica.
CARACTERES
La observacin del individuo la describimos mediante uno o ms
caracteres. El carcter es, por tanto una cualidad o propiedad inherente en
el individuo.
TIPOS DE CARACTERES :
Cualitativos : aquellos que son categricos, pero no son numricos.
p. ej. <Color de los ojos>, <profesin>, <marca de coche>,...
Ordinales: aquellos que pueden ordenarse, pero no son numricos.
p. ej. <Grado de instruccin: primaria, secundaria, superior>.
Cuantitativos: son numricos.
p. ej. <Peso>, <talla>, <nm. de hijos>,...
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
5
MODALIDAD
VALOR
Un carcter puede mostrar distintas modalidades o valores, es decir, son
distintas manifestaciones o situaciones posibles que puede presentar un
carcter estadstico. Las modalidades o valores son incompatibles y
exhaustivos.
Generalmente se utiliza el trmino modalidad cuando hablamos de
caracteres cualitativos y el trmino valor cuando estudiamos caracteres
cuantitativos.
p. ej. El carcter cualitativo <Estado Civil> puede adoptar las modalidades:
casado, soltero, viudo. El carcter cuantitativo <Edad> puede tomar los
valores: diez, once, doce aos,
VARIABLE
ESTADSTICA
Al conjunto de los distintos valores numricos que adopta un carcter
cuantitativo se llama variable estadstica.
TIPOS DE VARIABLES ESTADSTICAS:
Discretas: Aquellas que toman valores aislados (nmeros naturales), y que
no pueden tomar ningn valor intermedio entre dos consecutivos fijados.
p. ej. <nm. de goles marcados>, <nm. de hijos>, <nm., de discos
comprados>, <nm. de pulsaciones>,...
Continuas: Aquellas que toman infinitos valores (nmeros reales) en un
intervalo dado, de forma que pueden tomar cualquier valor intermedio, al
menos tericamente, en su rango de variacin.
p. ej. <talla>, <peso>, <presin sangunea>, <temperatura>, ...
OBSERVACIO
NES
Una observacin es el conjunto de modalidades o valores de cada variable
estadstica medidos en un mismo individuo.
p. ej. en una poblacin de 100 individuos podemos estudiar, de forma
individual, tres caracteres : <edad : 18, 19, ...>, <sexo : Hombre, Mujer> y
<si ha votado en las elecciones : Si, No>.
PARMETROS.
Son aquellas medidas que describen numricamente las caractersticas de
una poblacin. Una poblacin puede tener varias caractersticas y, por tanto,
varios parmetros.
Ejemplo: La media poblacional (), la desviacin estndar poblacional (),
la varianza poblacional ( )
Son aquellas medidas que describen numricamente las caractersticas de
una muestra. Tambin conocido como estimador puntual. Por ejemplo: La
media aritmtica, la mediana (M
e
), la moda (M
o
).
ESTADGRAFO
S.
Son aquellas medidas que describen numricamente las caractersticas de
una muestra. Tambin conocido como estimador puntual. Por ejemplo: La
media aritmtica, la mediana (M
e
), la moda (M
o
).
4. ETAPAS EN LA INVESTIGACIN ESTADSTICA
El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede
siempre mantener las mismas condiciones predeterminadas o a voluntad del
investigador, deja que acten libremente, pero se registran las diferentes
observaciones y se analizan sus variaciones.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
6
Para el planeamiento de una investigacin, por norma general, se siguen las
siguientes etapas:
4.1. Planteamiento del problema.
4.2. Fijacin de los objetivos.
4.3. Formulacin de la hiptesis.
4.4. Definicin de la unidad de observacin y de la unidad de medida
4.5. Determinacin de la poblacin y de la muestra.
4.6. La recoleccin.
4.7. Crtica, clasificacin y ordenacin.
4.8. Tabulacin.
4.9. Presentacin.
4.10. Anlisis.
4.11. Publicacin.
4.1.PLANTEAMIENTO DEL PROBLEMA
Al abordar una investigacin se debe tener bien definido qu se va a investigar
y por qu se pretende estudiar algo. Es decir, se debe establecer una
delimitacin clara, concreta e inteligible sobre el o los fenmenos que se
pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la
revisin bibliogrfica del tema, para ver su accesibilidad y consultar los
resultados obtenidos por investigaciones similares, someter nuestras
proposiciones bsicas a un anlisis lgico; es decir, se debe hacer una
ubicacin histrica y terica del problema.
4.2.FIJACIN DE LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta
dnde queremos llegar; en otras palabras, debemos fijar cules son nuestras
metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a confusiones o
ambigedades y debe, adems, establecerse diferenciacin entre lo de corto,
mediano y largo plazo, as como entre los objetivos generales y los especficos.
4.3. FORMULACIN DE LAS HIPTESIS
Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de
estudio, y su formulacin depende del conocimiento que el investigador posea
sobre la poblacin investigada. Una hiptesis estadstica debe ser susceptible
de docimar, esto es, debe poderse probar para su aceptacin o rechazo.
Una hiptesis que se formula acerca de un parmetro (media, proporcin,
varianza, etc.), con el propsito de rechazarla, se llama Hiptesis de Nulidad y
se representa por H
o
; a su hiptesis contraria se le llama Hiptesis Alternativa
(H
1
).
4.4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD
DE MEDIDA
La Unidad de Observacin, entendida como cada uno de los elementos
constituyentes de la poblacin estudiada, debe definirse previamente,
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
7
resaltando todas sus caractersticas; pues, al fin de cuentas, es a ellas a las que
se les har la medicin.
La unidad de observacin puede estar constituida por uno o varios individuos u
objetos y denominarse respectivamente simple o compleja.
El criterio sobre la unidad de medicin debe ser previamente definido y
unificado por todo el equipo de investigacin. Si se trata de medidas de
longitud, volumen, peso, etc., debe establecerse bajo qu unidad se tomarn las
observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.
Asociado a la unidad de medida, deben establecerse los criterios sobre las
condiciones en las cuales se ha de efectuar la toma de la informacin.
4.5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA.
Estadsticamente, la poblacin se define como un conjunto de individuos o de
objetos que poseen una o varias caractersticas comunes. No se refiere esta
definicin nicamente a los seres vivientes; una poblacin puede estar
constituida por los habitantes de un pas o por los peces de un estanque, as
como por los establecimientos comerciales o las unidades de vivienda de una
ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas e
infinitas.
Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin
con el fin de estudiar las propiedades del conjunto del cual es obtenida.
En la prctica, estudiar todos y cada uno de los elementos que conforman la
poblacin no es aconsejable, ya sea por la poca disponibilidad de recursos, por
la homogeneidad de sus elementos, porque a veces es necesario destruir lo que
se est midiendo, por ser demasiado grande el nmero de sus componentes o
no se pueden controlar; por eso se recurre al anlisis de los elementos de una
muestra con el fin de hacer inferencias respecto al total de la poblacin. Existen
diversos mtodos para calcular el tamao de la muestra y tambin para tomar
los elementos que la conforman, pero no es el objetivo de este curso
estudiarlos. Diremos solamente que la muestra debe ser representativa de la
poblacin y sus elementos escogidos al azar para asegurar la objetividad de la
investigacin.
4.6. LA RECOLECCIN
Una de las etapas ms importantes de la investigacin es la recoleccin de la
informacin, la cual ha de partir, a menos que se tenga experiencia con
muestras anlogas, de una o varias muestras piloto en las cuales se pondrn a
prueba los cuestionarios y se obtendr una aproximacin de la variabilidad de
la poblacin, con el fin de calcular el tamao exacto de la muestra que
conduzca a una estimacin de los parmetros con la precisin establecida.
El establecimiento de las fuentes y cauces de informacin, as como la cantidad
y complejidad de las preguntas, de acuerdo con los objetivos de la
investigacin son decisiones que se han de tomar teniendo en cuenta la
disponibilidad de los recursos financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona geogrfica, el grado de desarrollo, la
ausencia de tcnica, etc.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
8
Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se
puede conseguir; es determinar si la encuesta se debe aplicar por telfono, por
correo, o si se necesitan agentes directos que recojan la informacin; establecer
su nmero ptimo y preparar su entrenamiento y/o capacitacin adecuada.
4.7. CRITICA, CLASIFICACIN Y ORDENACIN
Despus de haber reunido toda la informacin pertinente, se necesita la
depuracin de los datos recogidos. Para hacer la crtica de una informacin, es
fundamental el conocimiento de la poblacin por parte de quien depura para
poder detectar falsedades en las respuestas, incomprensin a las preguntas,
respuestas al margen, adems de todas las posibles causas de nulidad de una
pregunta o nulidad de todo un cuestionario.
Separado el material de "desecho" con la informacin depurada se procede a
establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, en
las que se establecen los cruces necesarios entre las preguntas, se ordenan las
respuestas y se preparan los modelos de tabulacin de las diferentes variables
que intervienen en la investigacin.
El avance tecnolgico y la popularizacin de los computadores hacen que estas
tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.
4.8. LA TABULACIN.
Una tabla es un resumen de informacin respecto a una o ms variables, que
ofrece claridad al lector sobre lo que se pretende describir; para su fcil
interpretacin una tabla debe tener por lo menos: Un titulo adecuado el cual
debe ser claro y conciso. La Tabla propiamente dicha con los correspondientes
subttulos internos y la cuantificacin de los diferentes tems de las variables, y
las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la
tabla, u otorguen los crditos a la fuente de la informacin.
4.9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en la
forma adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero se
debe tener cuidado con las variables que se van a presentar y la forma de
hacerlo. No es aconsejable saturar un informe con tablas y grficos redundantes
que, antes que claridad, crean confusin.
Adems la eleccin de determinada tabla o grfico para mostrar los resultados,
debe hacerse no slo en funcin de las variables que relaciona, sino del lector a
quien va dirigido el informe.
4.10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que
convierten las especulaciones de primera mano en aseveraciones cuya
confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de
una decisin.
Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la
determinacin de los parmetros y estadsticos muestrales para las
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
9
estimaciones e inferencias respecto a la poblacin, el ajuste de modelos y las
pruebas de las hiptesis planteadas, con el fin de establecer y redactar las
conclusiones definitivas.
4.11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros
estudiosos del mismo problema a quienes se les puede aportar informacin,
conocimientos y otros puntos de vista acerca de l.
5. MTODOS PARA RECOLECTAR DATOS:
Existen tres principales mtodos con los cuales el investigador puede obtener los
datos:
5.1. El investigador puede recurrir a datos ya publicados por fuentes gubernamentales,
industrias, compaas o individuales.
5.2.El investigador puede disear un experimento para obtener los datos necesarios.
5.3.Puede efectuar una encuesta.
5.1. FUENTES DE INFORMACIN: Es el lugar, la institucin, la persona, donde
estn los datos que se necesitan para cada una de las variables o aspectos de la
investigacin. Las fuentes de datos pueden ser:
5.1.1. FUENTES DE DATOS INTERNOS. Es la informacin recopilada por la
empresa de los resultados de una propia gestin.
Ejemplo:
reportes financieros
Reportes de operaciones, que estn dadas por la informacin de la
produccin, compras, ventas, estados de prdida y ganancias.
Reportes especiales, es la informacin adicional para el anlisis
estadstico.
5.1.2. FUENTES DE DATOS EXTERNOS. Son informaciones estadsticas
elaboradas por instituciones de investigacin, que pueden ser pblicas o
privadas.
5.1.3. FUENTES PRIMARIAS. Cuando la informacin estadstica es obtenida
directamente de la unidad de observacin.
Por ejemplo: los resultados de los censos de poblacin y vivienda, la
inflacin, la tasa de inters bancaria, ndice de precios al consumidor, etc.
5.1.4. FUENTES SECUNDARIAS. Cuando la informacin estadstica es
elaborada a base de los datos de fuentes primarias.
El organismo oficial fundamental de datos estadsticos es el Instituto
Nacional de Estadstica e Informtica (INEI).
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
10
5.2. DISEO DE EXPERIMENTO: Es un segundo mtodo de recoleccin de la
informacin. Los diseos experimentales deben utilizarse siempre que sea
posible cuando se desee construir modelos explicativos.
5.3. ENCUESTAS: Proceso de recopilar la informacin a travs de una muestra.
6. PRINCIPALES PROCEDIMIENTOS PARA RECOLECTAR
INFORMACIN.
Toda informacin tiene dos aspectos fundamentales: Fuente de obtencin y mtodos
para su recoleccin.
FUENTE DE OBTENCIN. La fuente de obtencin puede ser primaria y
secundaria.
Primarios. Cuando se recogen directamente de su origen.
Secundarios. Cuando no se recogen directamente de su origen.
MTODOS DE RECOLECCIN. Cuando es utilizada una fuente primaria para
recolectar informacin se distinguen dos procedimientos fundamentales: La
observacin y el interrogatorio.
MTODOS DE INTERROGATORIOS.
El interrogatorio puede hacerse mediante dos mtodos:
Mtodo directo (se efecta por medio de entrevistas)
Mtodo indirecto (se efecta por medio de cuestionarios)
SISTEMAS DE RECOLECCIN.
Son procedimientos que se utilizan para recoger informacin.
Pueden ser:
a) Los Registros: son libros, padrones en donde se anotan en forma regular,
permanente y obligatoria los hechos ocurridos.
Ejemplo: Registros Civiles, RENIEC, Registros Pblicos, etc.
b) Las Encuestas:son procedimientos de obtencin de informacin estructurada
segn criteriosprevios de sistematizacin que se efecta con un propsito
especfico en la poblacin o en un sector de ella. Pueden ser:
b.1) Encuesta Censal:Cuando abarca toda la poblacin en estudio.
Ejemplo: censos de poblacin y vivienda en una localidad o pas
b.2) Encuesta Muestral:Cuando abarca una parte de la poblacin en estudio.
Ejemplo: llevar a cabo una encuesta de preferencia electoral.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
11
TCNICAS DE RECOLECCIN
Son procedimientos que se utilizan para recolectar informacin segn la naturaleza del
trabajo de investigacin. Pueden ser:
a) La observacin: Es la accin de mirar con rigor, en forma sistemtica y
profunda, con el inters de descubrir la importancia de aquello que se observa.
b) El cuestionario: En un instrumento constituido por un conjunto de preguntas
sistemticamente elaboradas que se formulan al encuestado o entrevistado con el
propsito de obtener datos de las variables consideras en estudio.
c) La entrevista: Es un dialogo entre personas, es una tcnica donde una persona
llamada entrevistador, encuestador o empadronador solicita al entrevistado le
proporcione algunos datos e informacin.
d) Anlisis de contenido: El fin o propsito del anlisis de contenido consiste en
determinar los puntos ms importantes de un documento para observar y
reconocer el significado de los mismos en sus elementos, como palabras, frases,
etc., y en clasificarlos adecuadamente para su anlisis y explicacin.
DATO: Es el valor que toma una variable en cada unidad de anlisis. Los datos estn
clasificados en:
SEGN EL NMERO DE VARIABLES.
1. DATOS UNIDIMENSIONALES: Cuando el registro es de una sola variable de
inters. Por ejemplo: El promedio semestral de los estudiantes del tercer ao del
FIIS-UNAS.2009 - II
2. DATOS BIDIMENSIONALES: Cuando el registro es de dos variables de
inters. Por ejemplo: La edad y el promedio semestral de los estudiantes del
tercer ao del FIIS-UNAS.2009 - II
3. DATOS TRIDIMENSIONALES: Cuando el registro es de tres variables de
inters. Por ejemplo: La edad, el ingreso mensual y el promedio semestral
de los estudiantes del tercer ao del FIIS-UNAS.2009 - II
7. TIPOS DE DATOS.
Sea cual fuere la fuente de la que obtenemos la informacin, esta puede estar
referida a caractersticas cualitativas o cuantitativas.
VARIABLE.
Es una caracterstica de la poblacin que se va investigar y que puede tomar
diferentes valores.
Ejemplo.
Las horas extras trabajadas por los trabajadores de una empresa y los valores de esta
variable vendran dadas por las diferentes horas trabajados por cada trabajador fuera
de la jornada normal: ninguna, una, dos, tres, .
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
12
Notacin. Las variables se denotaran por X, Y, etc.
Las variables se clasifican en: cualitativas y cuantitativas.
VARIABLE CUALITATIVA.
Se llama as, cuando la variable est asociada a una caracterstica cualitativa. Es
decir, son variables cuyos valores son cualidades que presenta la poblacin.
Ejemplos.
La variable profesin puede adoptar las modalidades: Ingeniero, Mdico,
Bilogo, Contador, Economista, etc.
Calidad de servicio del supermercado (Malo, Bueno, Muy Bueno, Excelente)
Estado civil o conyugal (Soltero, Casado, Viudo, Divorciado, Conviviente)
Rgimen de tenencia de la vivienda (Propia, Alquilada)
Estos datos a su vez se clasifican en: Nominales y ordinales
VARIABLE CUALITATIVA NOMINAL: Son aquellos que establecen distincin
de los elementos en las categoras sin implicar orden entre ellos.
Ejemplo:
Clasificar un grupo de individuos por sexo: masculino, femenino.
Por estado civil: soltero, casado, viudo. Etc.
VARIABLE CUALITATIVA ORDINAL.
Son aquellos datos que agrupan a los objetos, individuos, en categoras ordenadas,
para establecer relaciones comparativas. Es decir, se puede establecer un orden entre
sus atributos.
Ejemplo.
Calidad de servicio del supermercado (Malo, Bueno, Muy Bueno, Excelente)
Nivel de educacin (primaria, secundaria, superior).
VARIABLE CUANTITATIVA: Es el resultado de un proceso que cuantifica, es
decir, estas surgen cuando se puede establecer cuanto o en que cantidad se posee
una determinada caracterstica.
Ejemplo:
Ingreso por familia
Nmero de ventas diarias de cierto establecimiento.
Nmero total de habitaciones que tiene la vivienda.
Longitud, tiempo, etc.
Las variables cuantitativas se dividen en discretas y continuas.
VARIABLE CUANTITATIVA DISCRETA. Son aquellas que surgen por el
procedimiento de conteo, suelen tomar valores enteros (positivos).
Ejemplo.
El nmero de hijos por familia.
Nmero de estudiantes por colegio, universidad.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
13
VARIABLE CUANTITATIVA CONTINUA. Cuando el valor de la variable
puede tomar cualquier valor dentro de un rango dado, por tanto se expresa por
cualquier nmero real.
Ejemplo.
El peso, la estatura, la tensin arterial de las personas, los ingresos, el tiempo de
servicio, precio en soles, etc.
En general, todas las magnitudes relacionadas con el tiempo (edad, duracin de un
fenmeno,...), la masa (volumen; peso,.), el espacio (longitud, superficie,) o
una combinacin de estos (velocidad, densidad, capacidad,) son variables
continuas.
MUESTREO
Para estudiar, analizar y evaluar una poblacin con el fin de efectuar un diagnostico
requerir de contar con informacin cuantitativa y cualitativa:
Representativa,
Oportuna,
Confiable y
Suficiente
Esto se lograr a travs de observaciones y mediciones sobre una muestra de elementos
adecuadamente elegidos de la poblacin bajo en estudio.
1) Poblacin y muestra.
Poblacin.
Conjuntos formado por todas las unidades de anlisis (elementos) que son
cobertura de la investigacin planteada.
2) Muestra. Es una parte o subconjunto representativo de la poblacin y al proceso
de obtener la muestra se le llama muestreo.
Motivos para la realizacin de un muestreo. Consideraciones necesarias
Imagine que va a realizar estudios para conocer la siguiente informacin:
El porcentaje de peruanos que tiene acceso a internet.
La duracin media de una determinada marca de pilas.
Para el primer caso, la poblacin a la que debes preguntar es de ms de 30 millones de
personas. Es obvio que entrevistar a ms de 30 millones de personas supone un gran
esfuerzo en varios sentidos.
Primero, de tiempo, y segundo de dinero, puesto que es necesario contratar a muchos
encuestadores, pagarles viajes para que lleguen a todos los pueblos, etc. Adems, hay
una dificultad aadida: es difcil llegar a todos y cada uno de los ciudadanos peruanos,
ya que cuando vayamos a entrevistar, habr personas que est de viaje fuera del pas,
habr gente que est enferma en el hospital, etc. En este caso, por motivos econmicos,
de tiempo y de dificultad de acceso a toda la poblacin, sera conveniente entrevistar a
una cierta parte de la poblacin, una muestra, elegida convenientemente para poder
extraer despus conclusiones a toda la poblacin.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
14
En el segundo caso tenemos una problemtica diferente. Para poder estudiar la duracin
de una pila, debemos usarla hasta que se gaste, lo que nos impide volver a usar la pila.
Es decir, de alguna manera destruimos este elemento de la poblacin. Si quisiramos
probar todas y cada una de las pilas, nos quedaramos sin ellas. En este caso, de nuevo
sera conveniente estudiar slo un conjunto de esas pilas y luego extraer conclusiones
ms generales a partir del conjunto que hemos estudiado.
Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero
para que podamos extraer conclusiones, es importante que elijamos bien las muestras
para nuestros estudios.
Por ejemplo, para el caso del acceso a internet de los peruanos, elegir a 10 personas de
30 millones es insuficiente, no es representativo. Tampoco lo sera preguntarle, por
ejemplo a 100 personas de Lima, o elegir a todos sus amigos y su familia. Hay
cuestiones que debemos especificar a la hora de elegir una muestra:
1. El mtodo de seleccin de los individuos de la poblacin (tipo de muestreo que
se va a utilizar).
2. El tamao de la muestra.
3. El grado de fiabilidad de las conclusiones que vamos a presentar, es decir, una
estimacin del error que vamos a cometer (en trminos de probabilidad).
Como ya hemos mencionado, la seleccin no adecuada de los elementos de la muestra
provoca errores posteriores a la hora de estimar las correspondientes medidas en la
poblacin. Pero podemos encontrar ms errores: el entrevistador podra no ser
imparcial, es decir, favorecer que se den unas respuestas ms que otras. Puede ocurrir
tambin que, por ejemplo, la persona que vayamos a entrevistar no quiera contestar a
ciertas preguntas (o no sepa contestar). Clasificamos todos estos posibles errores de la
siguiente manera:
1. Error de sesgo o de seleccin: si alguno de los miembros de la poblacin tiene
ms probabilidad que otros de ser seleccionados. Imagine que queremos conocer
el grado de satisfaccin de los clientes de un gimnasio y para ello vamos a
entrevistar a algunos de 10 a 12 de la maana. Esto quiere decir que las personas
que vayan por la tarde no se vern representadas por lo que la muestra no
representar a todos los clientes del gimnasio. Una forma de evitar este tipo de
error es tomar la muestra de manera que todos los clientes tengan la misma
probabilidad de ser seleccionados.
2. Error o sesgo por no respuesta: Es posible que algunos elementos de la
poblacin no quieran o no puedan responder a determinadas cuestiones. O
tambin puede ocurrir, cuando tenemos cuestionarios de tipo personal, que
algunos miembros de la poblacin no contesten sinceramente. Estos errores son,
en general, difciles de evitar, pero en el caso de la sinceridad, se suelen
incorporar cuestiones (preguntas filtro) para detectar si se est contestando
sinceramente.
Despus de lo que se acaba de ver, podemos decir que una muestra es sesgada cuando
no es representativa de la poblacin.
MTODOS DE MUESTREO.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
15
Ya hemos hecho referencia a la importancia de la correcta eleccin de la muestra para
que sea representativa para nuestra poblacin pero cmo clasificamos las diferentes
formas de elegir una muestra? Podemos decir que hay dos tipos de muestreo:
Muestreo probabilstico: Es aquel en el que cada muestra tiene la misma
probabilidad de ser elegida de la poblacin en estudio.
Muestreo no probabilstico: Corresponden a las muestras en las cuales no hay
forma de conocer la probabilidad de los elementos de la poblacin y ser
incluidos como parte de la muestra.
Fortalezas y debilidades de los mtodos de muestreo:
MUESTREO PROBABILSTICO
FORTALEZAS DEBILIDADES
Es aceptado con facilidad Requiere de costos, marcos de muestreo
Asegura representatividad Requiere de trabajos de campo costosos
Asegura muestras insesgadas Requiere de supervisin rigurosa
Los resultados son generalizables
Permite calcular el error de muestreo
Permite hacer inferencias estadsticas
Probabilidad conocida de elegir a la
unidad como parte de la muestra
MUESTREO NO PROBABILSTICO
FORTALEZAS DEBILIDADES
Bajo costo y requiere menor tiempo No permite calcular errores de muestreo
Elige solo a las unidades queridas Sus resultados no son generalizables
Permite entrar informacin inesperada Pueden ser rechazadas por los usuarios
Diseo y cobertura flexible e informal Puede haber sesgo en la seleccin
No permite hacer inferencia estadstica
Requiere de personal muy especializado
La supervisin es difcil de realizar
Probabilidad no conocida de elegir a la
unidad como parte de la muestra.
Seleccin de muestras bajo un enfoque cuantitativo.
Ante la necesidad de generar informacin cuantitativa representativa y confiable, el
mtodo a seguir para la seleccin del subconjunto de unidades de anlisis como
muestra, deber asegurar la representatividad de los elementos elegidos a fin de permitir
al investigador efectuar inferencias, extrapolaciones y generalizaciones de los resultados
encontrados hacia toda la poblacin objetivo; en este enfoque, se deber asegurar que la
muestra ser estadsticamente representativa con el fin de permitir:
Calcular el error de muestreo que afectan a las estimaciones resultantes.
Conocer el nivel de confianza con el cual se realizan las estimaciones resultantes.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
16
Generalizar los resultados observados en la muestra a toda la poblacin.
Utilizar pruebas estadsticas para verificar hiptesis planteadas en la investigacin.
En caso que el investigador requiera de presentar resultados estadsticamente
representativos, deber asegurar selecciones de muestras imparciales e insesgadas lo
cual se lograra eligiendo las unidades con base a las leyes de la probabilidad.
Diseos de Muestreo:
Muestreo Aleatorio Simple.
Es el mtodo de muestreo que asegura que cada una de las unidades de anlisis tiene
igual probabilidad de ser incluida en la muestra, igualmente, cada una de las muestras
posibles tendr la misma probabilidad de ser elegida; esta caracterstica asegura la
representatividad e imparcialidad de la muestra elegida para el estudio.
Procedimiento:
Elabore el marco de muestreo.
Determine un tamao de muestra n.
Seleccione n nmeros aleatorios sin reemplazo de la tabla de nmeros
aleatorios o generados por un computador.
Recopile la informacin de cada una de las unidades de anlisis seleccionadas.
Estimar: Promedios, totales o porcentajes y su error estndar respectivo.
Estimacin del promedio
Estimacin del total poblacional
Estimacin de la proporcin de elementos que tienen un determinado atributo.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
17
Donde a es total de elementos de la muestra que tienen el atributo.
Ejemplo.
Poblacin de alumnos matriculados en 5to. Ao de secundaria (N). N = 7 154
alumnos
1
.
Conociendo la poblacin de alumnos matriculados en 5to. Ao de secundaria.
La muestra inicial estara dado por:
Muestra inicial:
=

( 1) +
Donde:
N = tamao de la poblacin. Entonces: N = 7 154
Z = Valor de distribucin normal estandarizado con probabilidad (1 ). Para 95% de
confianza Z = 1.96
Como se desconoce la probabilidad de xito esperada, se tendra que utilizar el
criterio conservador (p = q = 0.5), lo cual maximiza el tamao de muestra.
p = probabilidad de xito. p = 0.5
q = probabilidad de fracaso. (1 p) = (1 0.5) = 0.5
e = precisin (Error mximo admisible) = 5%
1
[Fuente: MINISTERIO DE EDUCACIN - Censo Escolar./ http://escale.minedu.gob.pe/magnitudes]
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
18
=
1.96 0.5 0.5 7 154
0.05 (7 154 1) + 1.96 0.5 0.5
= 365
Muestra final corregida a encuestar:
=
1 +
=
365
1 +
= 347 .
Se requerira encuestar a no menos de 347 estudiantes del 5to ao de secundaria para
poder tener una seguridad del 95%.
8. DISEO O ELABORACIN DE FORMULARIOS.
En toda actividad de carcter cientfico, lo que se hace en ltima instancia, es dar
repuestas a ciertas preguntas. De acuerdo con esto, necesitamos un documento donde
plantear preguntas y registrar sus respuestas, resultando as que una de las primeras y
realmente ms decisiva etapa en cualquier investigacin es la confeccin de
formularios.
Antes de elaborar un formulario debe considerarse:
1. El propsito para el cual ser utilizado.
2. Circunstancias bajo las cuales se recogern la informacin.
Lo primero tiene importancia para decidir sobre los datos que se recogern y lo segundo
para la determinacin del tamao de muestra y del material ms conveniente.
9. PRINCIPIOS BSICOS QUE SE DEBEN TENER EN CUENTA EN LA
CONFECCIN DE FORMULARIOS.
En todo formulario se debe recoger slo los datos tiles y adecuados al estudio.
Formularios muy extensos conspiran contar la exacta recoleccin de los datos. Es pues,
entonces conveniente:
a. Hacer una lista de todos los datos que sean necesario recoger de acuerdo a la
finalidad del estudio.
b. Considerar cuales datos son factibles de recoger y exacta.
c. Limitar a aquellos datos prcticos a recoger y que se usar.
DECIDIR SOBRE EL ORDEN QUE SE ACEPTARAN LOS DATOS. Las
preguntas deben hacerse de manera lgica y ordenada. Por ejemplo, preguntas sobre
ocupacin, educacin, vivienda, y otras referentes a condiciones econmicas y sociales
no deben estar separadas.
CONSIDERAR COMO SE HARN LAS PREGUNTAS.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
19
a. Considerar si hay alguna ambigedad en la pregunta como consecuencia de la
respuesta recibida.
b. Toda pregunta debe tener respuesta.
c. Debe usarse un leguaje claro y poco tcnico.
d. Evitar respuestas inducidas. Por ejemplo, Ud., nunca ha padecido de
tuberculosis? con esta pregunta estamos induciendo a la persona a que su
respuesta sea negativa.
PLANEAR COMO SE ANOTARAN LAS RESPUESTAS.
El espacio que se deja debe ser adecuado para las respuestas que se esperan y siempre
que sea posible se adoptar el sistema que exige el menor esfuerzo.
Ejemplo.
a. Sexo:; b.Sexo:..Femenino
..Masculino.
En el inciso (a), se pone nombre y en el (b), se marca con una cruz, este ltimo es de
menor esfuerzo.
Puede usarse otro mtodo que sea la utilizacin de un cdigo, por ejemplo, Debe
existir una revisin peridica de salario mnimo?
Si
No
No sabe o no opina.
ELECCIN DE VARIAS RESPUESTAS.
Debe procurarse que se puede elegir varias respuestas, evitando la ambigedad u
omisin de datos.
Ejemplo.
Enfermedades que Ud. Ha padecido?
Sarampin___________________
Bronquitis___________________
Asma ___________________
REALIZAR ESTUDIO PILOTO.
Debe realizarse un estudio piloto antes que el formulario sea impreso de manera
definitiva, con el fin de probarlo y ver la operatividad del formulario y para darse cuenta
de las fallas que pueda tener y hacer las correcciones necesarias.
Se debe redactar las instrucciones de como anotar las respuestas.
Ver la validez y confiabilidad del instrumento de medicin (Encuesta).
1
2
0
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
20
CASO PRCTICO DE DISEO DE ENCUESTA
Proyecto Gimnasio Sport Time
Un grupo de inversionistas ha formado una mediana empresa llamada Sport Time, cuyo
negocio es el servicio de preparacin y mantenimiento fsico de las personas. De
acuerdo con sus experiencias empresariales, este gimnasio ser dirigido a los integrantes
del nivel socio econmico A y B de la ciudad de Tingo Mara, teniendo como rea de
influencia a la ciudad. Sin embargo les gustara poder contar con mayor informacin del
mercado con la finalidad de crear y ofrecer un centro deportivo de calidad, incorporando
los gustos y preferencia del futuro cliente.
Frente a esta necesidad, uno de los socios propuso realizar una investigacin de
mercado, propuesta que fue aceptada por todos para tal efecto se procedi a determinar
los parmetros que definen correctivamente las caractersticas de la poblacin que
conforma su mercado:
1.- El segmento estar compuesto por hombres y mujeres con edades entre 18 y 60 aos.
2.- El gimnasio estar orientado al segmento A y B de la ciudad de Tingo Mara.
Una vez determinado estos parmetros se considero que los ms convenientes para
realizar esta investigacin era aplicar una encuesta cuyo proceso de elaboracin implica
seguir los siguientes pasos:
A.- Definir el propsito y los objetivos especficos.
B.- Disear la encuesta.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
21
Solucin
A.- Propsito y Objetivos especficos de la encuesta.
Propsito: Sera evaluar las actitudes y preferencias de las personas respecto a los
gimnasios.
Objetivo Especfico: Se desea obtener informacin sobre caractersticas del
consumidor que permitan tipificarlo, determinar sus expectativas en cuanto al servicio:
Adems identificar la competencia y los niveles de precio vigente en el mercado.
OBJETIVOS ESPECIFICOS PREGUNTAS DE INVESTIGACIN
CONSUMIDOR PREGUNTAS DE INVESTIGACIN
Identificacin de hbitos
Acudes al gimnasio?
Por qu acudes al gimnasio?
Con que frecuencia vas al gimnasio?
Qu instalaciones utilizas con ms
frecuencia en el gimnasio?
A qu gimnasio acudes?
Desde cundo acude al gimnasio?
Intencin de compra
Asistiras a un gimnasio ubicado en
el centro de la ciudad?
SERVICIO PREGUNTAS DE INVESTIGACIN
Caractersticas del servicio
Qu servicio te gustara encontrar
en el gimnasio?
Qu tipo de decoracin te
gustara encontrar?
COMPETENCIA PREGUNTAS DE INVESTIGACIN
Identificacin de competidores Qu gimnasios conoces?
PRECIO PREGUNTAS DE INVESTIGACIN
Precio mximo y mnimo
Cunto estara dispuesto a pagar
mensualmente por el servicio?
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
22
B). Diseo de Encuesta.
1. Asiste Ud. a gimnasios?
a. Si (pasar a la pregunta 3)
b. No (pasar a la pregunta 2)
2. Le gustara asistir a un gimnasio?
a. Si (pasar a la pregunta 3)
b. No (fin de la encuesta)
3. Con que frecuencia asiste y/o le
gustara asistir gimnasio?
a. Diariamente.
b. Una vez por semana.
c. Dos veces por semana.
d. Tres veces por semana.
4. Qu tipo de servicios prefieres
utilizar en el gimnasio?
a. Aerbicos.
b. Pesas.
c. Baile.
d. Masajes.
e. Otros. (Especifique).
5. Con quien acude al gimnasio?
a. Solo.
b. Amigo(a).
c. Pareja.
d. Familia.
e. Otros (Especifique).
6. A qu gimnasio asiste?
.
7. Qu gimnasio conoce?
a. Benavides
b. Universal Gym
c. Shape spa
d. Alan Wong Spa
f. Otros (Especifique).
8. Si contara con un gimnasio
ubicado en la ciudad de tingo
mara, el cual le ofreciera los
servicios que usted desea:
a. Definitivamente asistira.
b. Probablemente asistira.
c. Indeciso.
d. Probablemente no asistira.
e. No asistira.
9. A qu hora prefieres asistir?
a. 6 : 00 am a 8 : 00 am
b. 8 : 00 am a 10 : 00 am
c. 10 : 00 am a 12 : 00 am
d. 12 : 00 am a 2 : 00m
e. 12 : 00 m a 4 : 00 pm
f. 4 : 00 pm a 6 : 00 pm
g. 6 : 00 pm a 8 : 00 pm
h. 8 : 00 pm a 10 : 00 pm.
10. Cunto estara dispuesto a pagar
mensualmente por el servicio?
a. Menos de S/. 30.00
b. Entre S/. 30.00 y S/. 39.00
c. Entre S/. 40.00 y S/. 49.00
d. Mas de S/. 50.00.
DATOS DE CONTROL
11. Sexo: Femenino..
Masculino.
12. Edad.
a. 18 a 25 aos.
b. 26 a 33 aos.
c. 34 a 41 aos.
d. 42 a 49 aos.
e. 50 a 60 aos.
f.
13. Ingreso promedio mensual familiar
a. Menos de S/. 700.00.
b. Entre S/. 701.00 y S/. 1000.00
c. Entre S/. 1001.00 y S/. 1300.00
d. Mas de S/. 1301.
DATOS DE IDENTIFICACIN DEL
ENTREVISTADO
Nombre:
Direccin:.
Telfono:..
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
23
VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE MEDICIN
(ENCUESTAS):
Estos procesos se aplican en el desarrollo de una investigacin, con la finalidad de
evaluar la consistencia del diseo de la estructura de los instrumentos de recoleccin
que se usaran para el acopio y recoleccin de la informacin necesaria para la ejecucin
de una investigacin.
II.- CONFIABLIDAD DE LOS INSTRUMENTOS (Encuestas):
La confiabilidad de un instrumento de medicin, se refiere al grado en que su
aplicacin repetida al mismo sujeto u objeto produce resultados iguales.
La confiabilidad de un instrumento se refiere a la constitucin interna de las personas, a
la mayor o menor acescencia de errores de medida. Un instrumento confiable significa
que si lo aplicamos por ms de una vez a un mismo elemento entonces
obtendramos iguales resultados.
METODOS PARA CALCULAR LA CONFIABILIDAD DE UN
INSTRUMENTO DE MEDICIN:
Hay diversos mtodos para determinar la confiabilidad de un instrumento de medicin.
Todos utilizan formulas que producen coeficientes de confiabilidad estos coeficientes
pueden oscilar entre 0 y 1, donde un coeficiente de o significa nulo confiabilidad y 1
representa un mximo de confiabilidad (confiabilidad total).
CONFIABILIDAD
Muy Baja Baja Regular Aceptada Elevada
0 1
0% 100%
Confiabilidad del instrumento debe ser: Mayor al 50 %
2.1.- METODO DE LA MEDIDA DE ESTABILIDAD: METODO DE TEST RETEST.
Consiste en la aplicacin de dos veces o ms veces un mismo instrumento de medicin a un
mismo grupo de personas, despus de cierto perodo. Si la correlacin entre los resultados de
las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable.
Se determinar mediante el clculo de Coeficiente de Correlacin de Pearson (r).
=
( )( )

Donde:
n = Nmero de parejas.
Xi : valores obtenidos en el momento 1
Yi : valores obtenidos en el momento 2
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
24
2.2.- METODO DE DIVIDIR EN MITADES (Ver Ejemplo en el presente mdulo)
Consiste en calcular el coeficiente de correlacin de Pearson entre las dos mitades de
cada factor (pares o impares) de los elementos y luego corregir los resultados segn la
frmula de Sperman Brown, que es una frmula de correccin, que da como
resultado un estimulo corregido de confiabilidad. Este mtodo requiere solo una
aplicacin de la medicin. Especficamente el conjunto total de tems (o
componentes) se divide en dos mitades y se comparan las puntuaciones o los
resultados de ambas. Si el instrumento es confiable, las puntuaciones de ambas
mitades deben estas muy correlacionadas.
Procedimiento de dos mitades (divisn de items en pares e impares)
Primero : Se calcula el ndice de Correlacin (Pearson)
=
( )( )

Alumnos
Items Impar Par
I II III Xi Yi Xi*Yi Xi
2
Yi
2
Campos (1) 3 5 5 8 5 40 64 25
Gmez (2) 5 4 5 10 4 40 100 16
Linares (3) 4 4 5 9 4 36 81 16
Rodas (4) 4 5 3 7 5 35 49 25
Saavedra (5) 1 2 2 3 2 6 9 4
Tafur (6) 4 3 3 7 3 21 49 9
= 44 23 178 352 95
Reemplazando:
=
6 178 (44 23)
[6 352 (44) ] [6 95 (23) ]
= 0.66
Indice de correlacin de Pearson ( r ) = 0.66.
Segundo: Correccin de r con la ecuacin de Spearman Brown ( R ) :
Coeficiente de fiabilidad =0.79
2.3.- MTODO COEFICIENTE ALFA DE CRONBACH:
Requiere de una sola administracin del instrumento de medicin y se basa en la
medicin de la respuesta del sujeto con respecto a los tems del instrumento.
Su ventaja reside en que no es necesario dividir en dos mitades a los tems del
instrumento de medicin; simplemente se aplica la medicin y se calcula el coeficiente.
r
r
R
+
=
1
2
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
25
CLCULO DEL COEFICIENTE:
=
1
1

Donde:
K : Es el nmero de tems.
: Sumatoria de varianzas de los tems.
: Varianza de la suma de los tems.
: Coeficiente de Alfa de cronbach.
EJEMPLO:
Se tienen los resultados referidos a la opinin de 06 alumnos respecto a los tems
formulados en un cuestionario
Alumnos
Items
I II III
Campos (1) 3 5 5
Gmez (2) 5 4 5
Linares (3) 4 4 5
Rodas (4) 4 5 3
Saavedra (5) 1 2 2
Tafur (6) 4 3 3
PROCEDIMIENTO:
Paso 1: Calcular las varianzas de cada uno de los tems; en el cuadro de clculo.
Alumnos
Items
Suma de Items
I II III
Campos (1) 3 5 5 13
Gmez (2) 5 4 5 14
Linares (3) 4 4 5 13
Rodas (4) 4 5 3 12
Saavedra (5) 1 2 2 5
Tafur (6) 4 3 3 10
VAR. ( ) 1.90 1.37 1.77 = 10.97
Paso 2: Calcular la sumatoria de varianzas de los tems.
Paso 3: Calcular la varianza de la suma de los tems.
= 10.97
Paso 4: Calcular el coeficiente de Alfa de Cronbach. = 0.81
Paso 5: Interpretacin de la significancia de = 0.81; lo que significa que los resultados
de opinin de los 06 alumnos respeto a los tems considerados se encuentran
correlacionado de manera altamente confiable y muy aceptable.
= 5.03
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
26
Ejercicio 1. Con el fin de medir los niveles de actitud adversa hacia la fauna silvestre en
una comunidad rural, se propone aplicar la escala de medicin siguiente:
Asignando los puntajes de medicin a cada tem de ponderaciones iguales y partiendo
de 1 tenemos:
[1 = Nunca (N), 2 = Pocas Veces (PV), 3 = A veces (AV), 4 = Muchas Veces (MV), 5 =
Siempre (S)]
Solucin: Para probar la escala se entrevista a 10 agricultores y se obtienen las
respuestas:
Cuadro N 01: Distribucin de Agricultores entrevistados segn los niveles de actitud
2
adversa hacia la fauna silvestre en una comunidad rural Junio de 2012.
Encuesta I1 I2 I3 I4 I5 I6 Total
E1 2 1 1 1 2 1 8
E2 1 1 1 1 2 1 7
E3 1 2 2 1 2 2 10
E4 2 2 2 1 2 3 12
E5 3 3 3 3 3 3 18
E6 2 3 3 3 3 4 18
E7 4 4 4 3 5 4 24
E8 4 4 4 3 5 4 24
E9 5 5 4 5 5 5 29
E10 5 5 5 5 5 4 29
Variancia 2.322 2.222 1.878 2.489 2.044 1.878
= 70.54
= 12.833
Fuente: Elaboracin propia.
Determinacin del Coeficiente Alfa de Cronbach ( ):
=

= 1
.
.
=0.982
Donde:
n: Es el nmero items incluidos en la escala de medicin =6
S
2
j
: Variancia del j-simo item de la escala =12.833
S
2
x
: Variancia del puntaje total obtenido a travs de la escala de medicin = 70.54
Comentario:
De 10 agricultores entrevistados la fiabilidad de las respuestas de los 6 items segn el
coeficiente alfa de Cronbach ( = 0.982), indica que las respuestas o resultados de los
individuos entrevistados son muy consistentes, es decir presenta una confiabilidad
aceptable.
Salida de SPSS vs 20.0:
2
[1 = Nunca (N), 2 = Pocas Veces (PV), 3 = A veces (AV), 4 = Muchas Veces (MV), 5 = Siempre (S)]
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
27
Estadsticos de fiabilidad
Alfa de Cronbach
Alfa de Cronbach basada en
los elementos tipificados
N de elementos
,982 ,982 6
Matriz de correlaciones inter-elementos
I1 I2 I3 I4 I5 I6
I1 1,000 ,929 ,899 ,906 ,938 ,803
I2 ,929 1,000 ,979 ,945 ,938 ,925
I3 ,899 ,979 1,000 ,905 ,930 ,893
I4 ,906 ,945 ,905 1,000 ,867 ,843
I5 ,938 ,938 ,930 ,867 1,000 ,828
I6 ,803 ,925 ,893 ,843 ,828 1,000
Estadsticos de resumen de los elementos
Media Mnimo Mximo Rango Mximo/mnimo Varianza N de
elementos
Varianzas de
los elementos
2,139 1,878 2,489 ,611 1,325 ,062 6
Ejercicio 2. Estime el ndice de fiabilidad del cuestionario con base en la correlacin
par impar.
El coeficiente de fiabilidad par impar se calcula con base en la correlacin entre los
puntajes totales obtenidos con los tems pares e impares utilizando la funcin EXCEL:
Suma de puntos de Items
Impares Pares
5 3
4 3
5 5
6 6
9 9
8 10
13 11
13 11
14 15
15 14
r
PI =
0.949
COEF.DE.CORREL (Impares; Pares) = r
PI
= 0.949
Coeficiente de fiabilidad: = =
( . )
.
= 0.974
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
28
Comentario: se registra un alto ndice de fiabilidad para la alta consistencia interna que
se registra entre los tems pares e impares del instrumento.
Ejercicio 3. Encuentre los ndices de homogeneidad corregidos para cada tem.
Cuadro N 02: Distribucin de Agricultores entrevistados segn los niveles de actitud
adversa hacia la fauna silvestre en una comunidad rural Junio de 2012.
Encuesta I1 I2 I3 I4 I5 I6
E1 6 7 7 7 6 7
E2 6 6 6 6 5 6
E3 9 8 8 9 8 8
E4 10 10 10 11 10 9
E5 15 15 15 15 15 15
E6 16 15 15 15 15 14
E7 20 20 20 21 19 20
E8 20 20 20 21 19 20
E9 24 24 25 24 24 24
E10 24 24 24 24 24 25
ndices de homogeneidad
corregidos para cada tem
0.932 0.991 0.963 0.929 0.938 0.885
Fuente: Elaboracin propia.
Interpretacin: El tem 6 es el menos relacionado con la prueba general.
Ejercicio 4. Un ndice de validez del cuestionario previsto.
En base la valoracin global efectuada por los entrevistados, estime:
Entrevista
Puntaje
Total
Calificativo
Global
1 8 5
2 7 7
3 10 7
4 12 7
5 18 14
6 18 14
7 24 17
8 24 17
9 29 20
10 29 20
Correlacin entre puntajes
COEF.DE.CORREL (total; global) = r
xx
= 0.984
Interpretacin: Este coeficiente alto indica una aceptable validez de constructo
5. Calcule el coeficiente de fiabilidad de pruebas paralelas.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
29
Cuestionario A
Encuesta I1 I2 I3 I4 I5 I6 Total
E1 2 1 1 1 2 1 8
E2 1 1 1 1 2 1 7
E3 1 2 2 1 2 2 10
E4 2 2 2 1 2 3 12
E5 3 3 3 3 3 3 18
E6 2 3 3 3 3 4 18
E7 4 4 4 3 5 4 24
E8 4 4 4 3 5 4 24
E9 5 5 4 5 5 5 29
E10 5 5 5 5 5 4 29
Coeficiente de Fiabilidad = COEF.DE.CORREL (A; B) = -0.062
Interpretacin: El Coeficiente de Fiabilidad es bajo por lo tanto no indica una
aceptable validez de constructo.
Cuestionario B
Encuesta I1 I2 I3 I4 I5 I6 I7 I8 Total
E1 2 1 2 2 3 1 1 3 15
E2 4 5 5 3 4 3 1 2 27
E3 4 3 4 4 3 4 3 3 28
E4 4 4 4 4 4 4 5 4 33
E5 1 1 2 2 3 2 2 1 14
E6 3 3 4 4 4 5 5 4 32
E7 2 2 2 2 1 1 1 1 12
E8 4 4 5 4 3 5 3 1 29
E9 4 3 1 3 3 3 2 1 20
E10 4 5 4 5 4 4 3 2 31
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
30
II. ORGANIZACIN DE DATOS
1. DISTRIBUCIN DE FRECUENCIAS
Despus de recoger toda la informacin correspondiente a la investigacin, es decir, al
agotar todo el trabajo de campo, nuestro escritorio se llena de un cmulo de datos y
cifras desordenadas los cuales, al ser tomados como observaciones individuales, dicen
muy poco sobre la poblacin estudiada; es, entonces, tarea del investigador hacer
hablar las cifras, comenzando por la clasificacin y ordenacin, consignando la
informacin en tablas inteligibles que denominamos distribuciones de frecuencias.
ORDENACIN DE DATOS
CARACTERES CUALITATIVOS
Consideremos una muestra de tamao n sacada de una poblacin estadstica de la que
observamos un carcter cualitativo A que presenta las modalidades siguientes: a
1
, a
2
,
a
3
,..., a
k
, llamamos
FRECUENCIA
ABSOLUTA
SIMPLE
f
i
De la modalidad a
i
al nmero de veces que aparece
repetida dicha modalidad en el conjunto de las
observaciones realizadas.
= ; 0 ; = 1, 2, 3, .
FRECUENCIA
RELATIVA
SIMPLE
h
i
De la modalidad a
i
al cociente entre la frecuencia absoluta
y el nmero de datos (= tamao de la muestra n).
= ; = 1 ; 0 1 ; = 1, 2, 3, .
Los datos de las observaciones se pueden
recoger en la siguiente tabla de distribucin :
Modalidades
de carcter A
f
i
h
i
a
1
f
1
h
1
a
2
f
2
h
2

.
.

.
.

.
.
a
k
f
k
h
k
Total.
=
= 1
CARACTERES CUANTITATIVOS
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
31
Consideramos una variable estadstica X que, en una muestra de tamao n extrada
de una poblacin estadstica, toma los valores x
1
<x
2
<x
3
< ...<x
k
, definimos los
siguientes conceptos :
Tamao de la
muestra
n
Llamamos tamao muestral al nmero de observaciones
realizadas, es decir, al nmero total de datos.
= + ++ =
Frecuencia
Absoluta
f
i
Llamamos frecuencia absoluta de un valor x
i
de la variable
estadstica X al nmero de veces que aparece repetido dicho
valor en el conjunto de las observaciones realizadas.
= ; 0 ; = 1, 2, 3, .
Frecuencia
Absoluta
Acumulada
F
i
Llamamos frecuencia absoluta acumulada en el valor x
i
a
la suma de las frecuencias absolutas de los valores inferiores
o iguales a l.
Evidentemente, los valores x
i
han de estar ordenados de
forma creciente, como ya se ha indicado, y la frecuencia
absoluta acumulada del ltimo valor ser igual a n.
=
Frecuencia
Relativa
hi
Llamamos frecuencia relativa de un valor x
i
de la variable
estadstica X al cociente entre la frecuencia absoluta y el
nmero de observaciones realizadas.
= ; = 1 ; 0 1.
Frecuencia
Relativa
Acumulada
H
i
Llamamos frecuencia relativa acumulada en el punto x
i
al
cociente entre la frecuencia absoluta acumulada y el nmero
de observaciones realizadas.
= ; = 1
En las observaciones realizadas en una muestra o poblacin, puede ocurrir:
1. Que la variable estadstica tome pocos valores diferentes (ya sea grande o
pequeo el tamao de la muestra).
2. Que, en una muestra de gran tamao, la variable estadstica tome muchos
valores diferentes, ya se trate de variable estadstica discreta como de variable
estadstica continua (este ltimo caso es el ms habitual).
En el primer caso no es
necesario agrupar los datos, y
la tabla de distribucin presenta
el siguiente aspecto (ordenando
X
i
f
i
h
i
F
i
H
i
x
1
f
1
h
1
F
1
H
1
x
2
f
2
h
2
F
2
H
2
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
32
los datos de menor a mayor) :

.
.

.
.

.
.

.
.

.
.
x
k
F
k
h
k
F
k
=n H
k
=1
Total.
=

= 1
En el segundo caso por tratarse de variable continua o discreta pero con un nmero de
datos muy grande, es aconsejable AGRUPAR LOS DATOS EN CLASES.
Rango (R).
=
Nmero de clases (m).
Determinamosatreves de la regla de sturges.
= 1 + 3.322 Log ( )
Amplitud de clases (C).
=
Tabla de frecuencias de
una variable estadstica
agrupada en intervalos.
Intervalos
de clase
Marcas
de clase
Xi
f
i
h
i
F
i
H
i
[a
0
a
1
) x
1
f
1
h
1
F
1
H
1
[a
1
a
2
) x
2
f
2
h
2
F
2
H
2

.
.

.
.

.
.

.
.

.
.

.
.
[a
k
a
k+1
) x
k
F
k
h
k
F
k
=n H
k
=1
Total.
=

= 1
MEDIDAS DE TENDENCIA CENTRAL.
Son estadgrafos de posicin que son interpretados como valores que permiten a un
conjunto de datos dispersos, podra asumirse que estas medidas equivalen a un centro
de gravedad que adoptan un valor representativo para todo un conjunto de datos
predeterminados.
Estas medidas son:
1. Promedio Aritmtico (Media Aritmtica).
2. Mediana.
3. Moda.
4. Promedio Geomtrico.
5. Promedio Total.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
33
6. Media armnica.
MEDIDAS DE POSICIN
Percentiles.
Cuartiles
Deciles
MEDIDAS DE VARIABILIDAD (dispersin)
Son estadgrafos de dispersin que permiten evaluar el grado de homogeneidad,
dispersin o variabilidad de un conjunto de datos. Estas medidas son:
1. Amplitud o rango.
2. Varianza.
3. Desviacin estndar.
4. Coeficiente de variabilidad.
MEDIDAS DE FORMA
Evala la forma que adopta la distribucin de frecuencias respecto al grado de
distorsin (inclinacin) que registra respecto al valor promedio tomado como
centro de gravedad, el grado de apuntamiento (elevamiento) de la distribucin de
frecuencias. A mayor elevamiento de la distribucin de frecuencia significar
mayor concentracin de los datos en torno al promedio, por tanto, una menor
dispersin de los datos. Estas medidas son:
1. Asimetra o sesgo.
2. Curtosis.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
34
1. LA MEDIA ARITMTICA.
Para Datos no Agrupados.
El promedio aritmtico de un conjunto de valores (X
1
, X
2,
X
3
,.., Xn) es:
=

n
=
1 + 2 + 3 + +
Ejemplo:
Durante los ltimos 32 das el valor de las compras (soles) en peridicos fue:
5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 8.2
6.6 7.8 6.8 7.2 8.4 9.6 8.5 5.7 6.4 10.1 9.1
9.0 7.8 8.2 5.3 6.2 8.6 7.0 7.7 8.3 7.5
El promedio aritmtico del valor de las compras en peridicos es:
=

n
=
250.2
32
= 7.82
Para Datos Agrupados.
Rango (R).
= = 10.2 5.2 = 5
Nmero de clases (m).
Determinamos atreves de la regla de sturges.
= 1 + 3.3 Log( ) = 1 + 3.3 (32) = 5.97 6
Amplitud de clases (C).
= =
5
6
= 0.83
=

Donde: fi = frecuencia en la clase K sima.
X
i
= marca de clase en el intervalo K imo.
Ejemplo.
Para los gastos diarios en peridicos del hotel agrupados en una tabla de
frecuencia:
Intervalo X
i
f
i
h
i
F
i
H
i
[5.2 - 6.0) 5.62 3 0.09 3 0.09
[6.0 - 6.9) 6.45 5 0.16 8 0.25
[6.9 - 7.7) 7.28 6 0.19 14 0.44
[7.7 - 8.5) 8.12 8 0.25 22 0.69
[8.5 - 9.4) 8.95 5 0.16 27 0.84
[9.4 - 10.2] 9.78 5 0.16 32 1.00
Total 32 1
0
2
4
6
8
10
5.62 6.45 7.28 8.12 8.95 9.78
f
i
Xi
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
35
El promedio aritmtico es:
=

=
5.62 3 + 6.45 5 + + 9.78 5
32
=
251.40
32
= .
Durante los 32 das el hotel tuvo un gasto promedio en peridicos de 7.86 soles
2. LA MEDIANA.
Es al valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El
50% de las observaciones son mayores que este valor y el otro 50% son menores.
Para Datos no Agrupados.
La ubicacin de la mediana de n datos ordenados se determina por: (n+1)/2.
Ejemplos.
En los 7 datos ordenados: {4, 5, 5, 6, 7, 8, 9}.
La ubicacin de la mediana es:
( )
=4, Luego el valor de la mediana: Me = 6.
En los 8 datos ordenados: {3, 4, 5, 5, 6, 7, 8, 9}.
La mediana se ubica en el lugar
( )
=4.5, Luego el valor de la mediana es:
=
( )
=5.5
Para Datos Agrupados.
= +

L
i
: Limite inferiordel intervalo que contiene a la mediana.
F
i-1
: Frecuencia acumulada en la clase anterior i sima.
F
i
: Frecuencia en la clase que contiene a la mediana.
H
i-1
: Frecuencia relativa acumulada en la clase anteriori sima.
h
i
: Frecuencia relativa en la clase que contiene a la mediana.
C
i
: Amplitud del intervalo de clase
Ejemplo. Para los gastos diarios en peridicos del hotel en una tabla de frecuencias.
L
a mediana es: =7.7+ 0.83 =7.9
El 50% de los das el hotel gast menos de 7.9 soles en la compra de peridicos.
Intervalo
De clase
Marca
de clase
X
i
Frecuencia
Absoluta
f
i
Frecuencia
Relativa
h
i
Frec. Acum.
Absoluta
F
i
Frec. Acum.
Relativa
H
i
[5.2 - 6.0) 5.62 3 0.09 3 0.09
[6.0 - 6.9) 6.45 5 0.16 8 0.25
[6.9 - 7.7) 7.28 6 0.19 14 0.44
[7.7 - 8.5) 8.12 8 0.25 22 0.69
[8.5 - 9.4) 8.95 5 0.16 27 0.84
[9.4 - 10.2] 9.78 5 0.16 32 1.00
Total 32 1
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
36
3. LA MODA.
Es el valor; clase o categora que ocurre con mayor frecuencia y sus caractersticas son:
Puede no existir o existir ms de una moda.
Su valor no se ve afectado por los valores extremos en los datos.
Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa.
Es una medida inestable cuando en nmero de datos es reducido.
Para Datos no Agrupados.
Por ejemplo, Durante los ltimos 32 das el valor de las compras en peridicos
fue:
5.2 10.2 7 7.1 10.2 8.3 9.4 9.2
6.6 7.8 6.8 7.1 8.4 9.6 7.1 5.7
Moda =Mo= 7.1; es el valor ms frecuente, ocurre tres veces.
Ejemplo: 2, 2, 5, 5, 7, 7, 7, 7, 9, 9, 9, 10; Mo = 7 y 9 Serie bimodal
Ejemplo: 6, 5, 6, 6, 3, 4, 6, 6, 7 Mo = 6 Serie Unimodal
Ejemplo: 13, 15, 12, 11, 20, 22 No tiene Moda o se dice que
cada dato es una moda
Para Datos Agrupados.
= +
+

Donde: =( )
=( )
f
i
= valor de mayor frecuencia.
Ejemplo.
El gasto diario en peridicos del hotel *** agrupados en una tabla de
frecuencias.
=7.7+
2
2+3
0.83 =8.03
Donde:
=7.7
=(86) =2
=(85) =3
El gasto diario en peridicos ms frecuente es 8.03soles.
Intervalo X
i
f
i
h
i
F
i
H
i
[5.2 - 6.0) 5.62 3 0.09 3 0.09
[6.0 - 6.9) 6.45 5 0.16 8 0.25
[6.9 - 7.7) 7.28 6 0.19 14 0.44
[7.7 - 8.5) 8.12 8 0.25 22 0.69
[8.5 - 9.4) 8.95 5 0.16 27 0.84
[9.4 - 10.2] 9.78 5 0.16 32 1.00
Total 32 1
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
37
4. MEDIA GEOMTRICA.
La media geomtrica simple de n observaciones X
1
, X
2
, X
3
,..,X
n
positivos, esta
dado por la raz ensima del producto de los n valores observados. El promedio
geomtrico de los valores: (X
1
, X
2
, X
3
,..,X
n
) es :
Para Datos no Agrupados.
=
.
Ejemplo.
Hallar la media geomtrica de los nmeros 3, 5, 8, 3, 5, 2.
Solucin.
En este caso n = 6, entonces la media geomtrica es:
= = 3.915
Para Datos Agrupados.
Si los datos estn agrupados en clases, la media geomtrica ponderada, es la raz
ensima del producto de las marcas de clases elevadas a sus respectivas
frecuencias, es decir.
= ( ) ( ) ( )
Donde: = , X
i
= Marca de clase, f
i
= Frecuencia absoluta simple,
m = nmero de clases.
Aplicando logaritmo a ambos lados miembros de la ecuacin anterior se tiene:
Log = [ + +,,+ ]
= ; Luego.
=

=1
Ejemplo.
=
28.46
= 7.749
Intervalo X
i
f
i
log (X
i
) f
i
* log(Xi)
[5.2 - 6.0) 5.62 3 0.749 2.248
[6.0 - 6.9) 6.45 5 0.81 4.048
[6.9 - 7.7) 7.28 6 0.862 5.174
[7.7 - 8.5) 8.12 8 0.909 7.275
[8.5 - 9.4) 8.95 5 0.952 4.759
[9.4 - 10.2] 9.78 5 0.99 4.952
Total ( ): 32 28.46
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
38
Desventajas de la media geomtrica.
Est limitado para valores positivos para que pueda ser interpretado.
Si algn valor de la variable es cero, la media geomtrica ser cero.
Si aparece algn valor negativo, el estadgrafo toma un valor imaginario.
5. PROMEDIO PONDERADO
Cuando se desea encontrar el promedio de valores (X
1
, X
2
, X
3
,..,X
n
) que ocurren con
frecuencias (f
1
,f
2
,.f
n
)diferentes se debern ponderar los valores observados con pesos
diferentes:
=
Donde Wi = f
i
/n se denominan ponderaciones o pesos.
Ejemplo.
En una agencia de viajes se han vendido 200 pasajes a los precios siguientes:
Precio de venta (soles)
Xi
Numero de pasajes
f
i
Ponderacin
Wi
Xi*Wi
12 60 0.30 3.60
14 100 0.50 7.00
16 40 0.20 3.20
Total 200 1 = 13.8
El precio promedio de venta de los 200 pasajes es de 13.8 soles
6. PROMEDIO TOTAL
Corresponde al valor promedio representativo de grupos de observaciones separadas o
diferentes y que podran estar consolidadas en tablas de frecuencia independientes, por
tanto:
=
+

+ +.+
n
i
: Numero de observaciones en el grupo i-simo.
: Promedio correspondiente el grupo i-simo
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
39
Ejemplo.
Promedio del grupo A: Promedio del grupo B:
X =
4(7.5) +16(12.5) +5(17.5)
25
=12.7X
=
8(2.5) +10(7.5) +16(12.5) +6(17.5)
40
=10
X =
25(12.7) +40(10)
65
=11.04
7. MEDIA ARMNICA.
La media armnica M
h
o X de n trminos no nulos X
1
, X
2
, X
3
,..,X
n
, es el reciproco
de la media aritmtica de los recprocos de esos trminos. Es decir.
Para Datos no Agrupados.
X =
n
+ +.+
Ejemplo.Calcular el rendimiento promedio para el caso de tres automviles que
recorrieron 500 kilmetros y cada auto tuvo el rendimiento siguiente:
Auto A B C
Rendimiento(Km/galn) 50 62.4 77.6
X =
3
+
.
+
.
=
3
0.0489121
=61.334
Km
galn
Verificacin.
Auto Km Rendimiento Total de galones
X =
1500
24.4561
=61.334
A 500 50 10
B 500 62.4 8.0128
C 500 77.6 6.4433
Total 1500 24.4561
GUPO A
Nota Xi fi
5 10 7.5 4
10 15 12.5 16
15 20 17.5 5
Total 25
GUPO B
Nota Xi fi
0 5 2.5 8
5 10 2.5 10
10 15 12.5 16
15 20 17.5 6
Total 40
Promedio
Total
Grupo X f
i
A 12.7 25
B 10 40
Total 65
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
40
Para Datos Agrupados.La media armnica para datos tabulados (media
armnica ponderada) se define por:
X =Mh=
n

Donde:
m = nmero de clases, Xi = marca de clase, fi = frecuencia absoluta de cada clase.
MEDIDAS DE POSICIN.
Las medidas de posicin equivalen a los valores que puede tomar una variable
caracterizados por agrupar a cierto porcentaje de observaciones en la muestra o
poblacin.
Las medidas de posicin son ideales para obtener informacin adicional a partir de
datos resumidos, es decir, que presentan perdida de informacin por agrupamiento en
intervalos de clase.
PERCENTILES.
Son 99 valores que dividen a un conjunto de datos en 100 partes iguales.
Para Datos Agrupados.
= +

= Lmite inferior del intervalo que contiene al percentil


= Frecuencia acumulada en la clase anterior K-sima
= Frecuencia en la clase que contiene al percentil
C =Amplitud del intervalo de clase
k = 1%, 2%, 3%,..,97%, 98%, 99% Percentiles.
Ejemplo.
El percentil 80% de los gastos diarios en peridicos es.
1. Se determina 80*n/100.
Intervalo
De clase
Marca
de clase
X
i
Frecuencia
Absoluta
f
i
Frecuencia
Relativa
h
i
Frec. Acum.
Absoluta
F
i
Frec. Acum.
Relativa
H
i
[5.2 - 6.0) 5.62 3 0.09 3 0.09
[6.0 - 6.9) 6.45 5 0.16 8 0.25
[6.9 - 7.7) 7.28 6 0.19 14 0.44
[7.7 - 8.5) 8.12 8 0.25 22 0.69
[8.5 - 9.4) 8.95 5 0.16 27 0.84
[9.4 - 10.2] 9.78 5 0.16 32 1.00
Total 32 1
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
41
2. De la tabla, la frecuencia absoluta acumulada inmediatamente superior a 80*n/100 = 25.6 es
F
5
= 27, luego F
5-1
= 22. Por tanto en intervalo de clase que contienen a
%
es [8.5 9.4)
%
= +

=8.5+
( . 22)
5
0.83=9.09
El 80% de los datos analizados sern menores de 9.09 y el 20% restante sern superiores.
CUARTILES.
Son tres valores Q
1
, Q
2
, Q
3
que dividen a los datos en cuatro partes iguales.
25%Q
1
25% Q
2
25% Q
3
25%
= +

; = ; = +

Ejemplo.
Calcular el tercer cuartil (Percentil 75%) de los gastos diarios en peridicos de la tabla
anterior.
Solucin.
1. Se determina n/4.
2. De la tabla, la frecuencia absoluta acumulada inmediatamente superior a 3n/4 = 24 es F
5
= 27,
luego F
5-1
= 22. Por tanto en intervalo de clase que contienen a es [8.5 9.4)
= +

=8.5+
( 22)
5
0.83=8.8
El 75% de los datos analizados sern menores a 8.8 y el 25% restante sern superiores.
DECILES.
Son nueve valores D
1
, D
2
, D
3
, D
4
, D
5
, D
6
, D
7
, D
8
, y D
9
, que dividen a un conjunto de
datos en 10 partes iguales.
1. Se construye la tabla de frecuencias absolutas acumuladas.
2. Se determina k*n/10.
3. Se identifica a la clase que contiene a D
k
, identificado a la frecuencia absoluta
acumulada F
i
inmediatamente superior a k*n/10.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
42
Ejemplo.
Calcular el decil siete (Percentil 70%) de los gastos diarios en peridicos de la tabla de
frecuencia anterior.
= +

=8.5+
( . 17)
5
0.83=9.396
70% de los datos sern menores a 9.396 y el 30% restante sern superiores a 9.396.
Para Datos no Agrupados.
El lugar o posicin donde se encuentran los cuartiles para n datos ordenados es:
Cuartil Q
1
= P
25%
Q
2
= P
50%
Q
3
= P
75%
Posicin
25(n+1)
100
50(n+1)
100
75(n+1)
100
Ejemplo.
Supngase que los siguientes datos representan los salarios por da de 12 trabajadores
de una compaa muy grande seleccionados aleatoriamente (en soles)
9 10 12 3 5 7 15 10 9 11 13 11
Determinar el primer cuartil de la muestra.
Solucin.
1. Los datos ordenados en forma ascendente son:
3 5 7 9 9 10 10 11 11 12 13 15
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12
2. Como n = 12, = =3.25. Esto significa que el valor de Q
1
es el tercer
dato ms 25% de la diferencia entre los valores de las observaciones tercero y
cuarto. As, el valor de la tercera observacin es 7 y el del cuarto es 9, entonces
Q
1
= 7 + (9-7)*0.25 =7.5 soles.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
43
Ejemplo:
Determine los cuartiles y decil 8 de los 13 datos ordenados siguientes:
10 11 11 12 12 13 13 13 14 15 17 18 20
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12
X
13
Percentil Posicin Incremento % Valor del cuartil
Q
1
= P
25
0.25(13+1) = 3.5 50% Q
1
= 11+(12-11)*0.50 =11.5
Q
2
= P
50
0.50(13+1) = 7 0% Q
2
= 13
Q3 = P
75
0.75(13+1) = 10.5 50% Q
3
= 15+(17-15)*0.50 = 16
Q
8
= P
80
0.80(13+1) = 11.2 20% P
80
= 17+(18-17)* 0.20 = 17.2
MEDIDAS DE VARIABILIDAD.
1. AMPLITUD O RANGO
Sean los valores:x
1
, x
2
, x
3
,..,x
n
la amplitudo rango de estos datos es
R = (X
max
- X
min
).
2. VARIANZA Y DESVIACIN TPICA.
Estas medidas son las ms utilizadas en el estudio de la dispersin. La varianza
mide la dispersin de los datos con respecto a su media aritmtica y la
desviacin tpica o desviacin estndar es simplemente la raz cuadrada positiva
de la varianza.
Para Datos no Agrupados.
Definicin de de varianza poblacional. La varianza poblacional finita de N
elementos X
1
, X
2
, X
3
,..,X
n
, se define como la media aritmtica del cuadrado
de las desviaciones de las observaciones con respecto a su media , y se denota
por es decir.
N
x
n
i
i
=

=
1
2
2
) (

Definicin de de varianza de una muestra. La varianza de una muestra, x


1
, x
2
,
x
3
,..,x
n
, de una variable o una caracterstica x (que abreviadamente escribimos
V(x)), se define como la media del cuadrado de las desviaciones de las
observaciones con respecto de la media aritmtica de esos datos. Si denotamos
por S
2
.
Es fcil verificar que:
= =
=
n
i
i
n
i
i
x n x x x
1
2
2
1
2
) (
n
x
s
n
i
i
=

=
1
2
_
2
) X (
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
44
Por lo tanto,
2
1
2
2
x
n
x
s
n
i
i
=

=
La diferencia entre
( ) ( )
es grande para muestras pequeas, y
es mnima para muestras grande, prcticamente son iguales. Entonces, para
muestras grandes 60, puede usarse cualquiera de las formulas. Para
muestras pequeas se usa
( )
, lo cual es llamada varianza muestral o
tambin varianza corregida, y se acostumbra denotar por . Es decir la varianza
muestral estar definida por:
=
( )
1
=

1
Ejemplo.
Calcular la varianza de los cuatro datos siguientes: (Xi: 3, 4, 6 y 7)
=

n
=
3+4+6+7
4
=
20
4
=5

1
=
3 +4 +6 +7
41
=
10
3
=3.333
Para datos Agrupados.
n
f X x
s
n
i
i i
=

=
1
2
2
* ) (
=
( )
1
=

1
Ejemplo.
Los gastos diarios en peridicos del hotel agrupados en la tabla de frecuencias.
= .
Intervalo
De clase
Marca
de clase
X
i
Frecuencia
Absoluta
f
i
X
i
*F
i
( X
i
- )
2
*f
i
[5.2 - 6.0) 5.62 3 16.85 15.10
[6.0 - 6.9) 6.45 5 32.25 9.94
[6.9 - 7.7) 7.28 6 43.70 2.00
[7.7 - 8.5) 8.12 8 64.93 0.53
[8.5 - 9.4) 8.95 5 44.75 5.94
[9.4 - 10.2] 9.78 5 48.92 18.50
Total = 32 = 251.40 = 52.00
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
45
=
( )
1
=
52
31
=1.68
3. DESVIACIN ESTNDAR.
Es una medida de variabilidad que corresponde a la raz cuadrada de la varianza.
Este indicador tiene la misma unidad de medida en la que se expresa el
promedio.
= =
( )
1
Entonces, =1.68 =1.3soles.
Propiedades dela varianza.
La varianza de un conjunto de observaciones x
1
, x
2
, x
3
,..,x
n
,
siempre es un nmero no negativo. Esto es
( ) 0
La varianza de una constante es cero.
( ) =0
Si a cada observacin x
1
, x
2
, x
3
,..,x
n
, se adiciona o resta una
constante k>0, la varianza del nuevo conjunto de valores y
1
, y
2
,
y
3
,..,y
n
, donde y
i
=x
i
K, i=1, 2,.,n, coincide con la varianza del
conjunto original. Es decir
( ) = ( ).
( ) = ( ) = ( ) ( ) = ( ), donde a y b son
constantes.
4. COEFICIENTE DE VARIACIN.
Es una medida de variabilidad de los datos que se expresa en porcentaje en la
cual se compara la desviacin estndar con el respectivo valor del promedio de
los datos.
. .=
Grado de variabilidad de los datos Coeficiente de variabilidad
Con variabilidad baja Menos de 10%
Con variabilidad moderada De 10% a 30%
Con variabilidad alta Ms de 30%
En el ejemplo anterior el coeficiente de variabilidad es:
. .=
.
.
= . %
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
46
MEDIDAS DE FORMA.
1. ASIMETRA O SEGO.
Evala el grado de distorsin o inclinacin que adopta la distribucin de los
datos respecto a su valor promedio tomando como centro de gravedad. El
coeficiente de asimetra de pearson es:
=
3( )
Grado de asimetra Valor del sesgo
Simetra perfecta Cero: El promedio es igual a la mediana
Sesgo positivo Positivo: Promedio mayor que la mediana
Sesgo negativo Negativo: Promedio menor que la mediana
Asimetra Positiva Simtrica Asimetra Negativa
(Promedio > Mediana) Promedio = Mediana Promedio < Mediana
En el ejemplo anterior losgastos diarios en peridicos el promedio es 7.8, la
mediana es 7.90 y la desviacin estndar 1.3, por lo tanto es sesgoes
ligeramente negativo -0.23.
CURTOSIS.
Evala el grado de apuntamiento de la distribucin, el coeficiente es:
=
( )
Grado de Apuntamiento Valor de Curtosis
Mesocrtica (distribucin normal) 0.263
Leptocrtica (Elevada) Mayor a 0.263 se aproxima a 0.5
Platicrtica (Aplanada) Menor a 0.263 se aproxima a 0.
K
u
=0.263 K
u
> 0.263 K
u
< 0.263 MesocurticaLeptocrticaPlaticrtica
(Normal)
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
46
MEDIDAS DE FORMA.
1. ASIMETRA O SEGO.
Evala el grado de distorsin o inclinacin que adopta la distribucin de los
datos respecto a su valor promedio tomando como centro de gravedad. El
coeficiente de asimetra de pearson es:
=
3( )
Grado de asimetra Valor del sesgo
Simetra perfecta Cero: El promedio es igual a la mediana
Sesgo positivo Positivo: Promedio mayor que la mediana
Sesgo negativo Negativo: Promedio menor que la mediana
Asimetra Positiva Simtrica Asimetra Negativa
(Promedio > Mediana) Promedio = Mediana Promedio < Mediana
En el ejemplo anterior losgastos diarios en peridicos el promedio es 7.8, la
mediana es 7.90 y la desviacin estndar 1.3, por lo tanto es sesgoes
ligeramente negativo -0.23.
CURTOSIS.
Evala el grado de apuntamiento de la distribucin, el coeficiente es:
=
( )
Grado de Apuntamiento Valor de Curtosis
Mesocrtica (distribucin normal) 0.263
Leptocrtica (Elevada) Mayor a 0.263 se aproxima a 0.5
Platicrtica (Aplanada) Menor a 0.263 se aproxima a 0.
K
u
=0.263 K
u
> 0.263 K
u
< 0.263 MesocurticaLeptocrticaPlaticrtica
(Normal)
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
46
MEDIDAS DE FORMA.
1. ASIMETRA O SEGO.
Evala el grado de distorsin o inclinacin que adopta la distribucin de los
datos respecto a su valor promedio tomando como centro de gravedad. El
coeficiente de asimetra de pearson es:
=
3( )
Grado de asimetra Valor del sesgo
Simetra perfecta Cero: El promedio es igual a la mediana
Sesgo positivo Positivo: Promedio mayor que la mediana
Sesgo negativo Negativo: Promedio menor que la mediana
Asimetra Positiva Simtrica Asimetra Negativa
(Promedio > Mediana) Promedio = Mediana Promedio < Mediana
En el ejemplo anterior losgastos diarios en peridicos el promedio es 7.8, la
mediana es 7.90 y la desviacin estndar 1.3, por lo tanto es sesgoes
ligeramente negativo -0.23.
CURTOSIS.
Evala el grado de apuntamiento de la distribucin, el coeficiente es:
=
( )
Grado de Apuntamiento Valor de Curtosis
Mesocrtica (distribucin normal) 0.263
Leptocrtica (Elevada) Mayor a 0.263 se aproxima a 0.5
Platicrtica (Aplanada) Menor a 0.263 se aproxima a 0.
K
u
=0.263 K
u
> 0.263 K
u
< 0.263 MesocurticaLeptocrticaPlaticrtica
(Normal)
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
47
REPRESENTACIN GRFICA.
GRFICOS DE CAJAS.
Existe una gran variedad de graficas estadsticas para extraer informacin acerca de las
propiedades de un conjunto de datos.
Una grafica til para reflejar propiedades de los datos es la grafica de caja (box
plots) que se basa en la medida(o en la media), los cuartiles y valores extremos. La
caja representa el rango intercuartil que encierra el 50% de los valores y tiene la
mediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil
75, P
75
(cuartil superior) y el percentil 25, P
25
(cuartil inferior).
Adems de la caja se incluya la extensin de los datos mediante segmentos que se
extienden de la caja hacia el valor mximo (U) y hacia el valor mnimo (L) de los datos.
Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como se
indica en la figura que sigue.
De un grafico de caja, se obtiene informacin de los datos acerca de:
La centralizacin (observado la ubicacin de la mediana)
La dispersin o variabilidad (mediante en rango intercuartil: RI=P
75
-P
25
)
La asimetra (comparado: Me - P
25
con P
75
- Me)
Las colas (por la longitud de los segmentos que salen de los lados de la caja)
Los datos atpicos o discordantes o raros llamados outliers (aislados) son aquellos
que se ubican fuera del intervalo.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
47
REPRESENTACIN GRFICA.
GRFICOS DE CAJAS.
Existe una gran variedad de graficas estadsticas para extraer informacin acerca de las
propiedades de un conjunto de datos.
Una grafica til para reflejar propiedades de los datos es la grafica de caja (box
plots) que se basa en la medida(o en la media), los cuartiles y valores extremos. La
caja representa el rango intercuartil que encierra el 50% de los valores y tiene la
mediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil
75, P
75
(cuartil superior) y el percentil 25, P
25
(cuartil inferior).
Adems de la caja se incluya la extensin de los datos mediante segmentos que se
extienden de la caja hacia el valor mximo (U) y hacia el valor mnimo (L) de los datos.
Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como se
indica en la figura que sigue.
De un grafico de caja, se obtiene informacin de los datos acerca de:
La centralizacin (observado la ubicacin de la mediana)
La dispersin o variabilidad (mediante en rango intercuartil: RI=P
75
-P
25
)
La asimetra (comparado: Me - P
25
con P
75
- Me)
Las colas (por la longitud de los segmentos que salen de los lados de la caja)
Los datos atpicos o discordantes o raros llamados outliers (aislados) son aquellos
que se ubican fuera del intervalo.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
47
REPRESENTACIN GRFICA.
GRFICOS DE CAJAS.
Existe una gran variedad de graficas estadsticas para extraer informacin acerca de las
propiedades de un conjunto de datos.
Una grafica til para reflejar propiedades de los datos es la grafica de caja (box
plots) que se basa en la medida(o en la media), los cuartiles y valores extremos. La
caja representa el rango intercuartil que encierra el 50% de los valores y tiene la
mediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil
75, P
75
(cuartil superior) y el percentil 25, P
25
(cuartil inferior).
Adems de la caja se incluya la extensin de los datos mediante segmentos que se
extienden de la caja hacia el valor mximo (U) y hacia el valor mnimo (L) de los datos.
Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como se
indica en la figura que sigue.
De un grafico de caja, se obtiene informacin de los datos acerca de:
La centralizacin (observado la ubicacin de la mediana)
La dispersin o variabilidad (mediante en rango intercuartil: RI=P
75
-P
25
)
La asimetra (comparado: Me - P
25
con P
75
- Me)
Las colas (por la longitud de los segmentos que salen de los lados de la caja)
Los datos atpicos o discordantes o raros llamados outliers (aislados) son aquellos
que se ubican fuera del intervalo.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
48
Diagrama de Causa-Efecto
1.- El espesor de recubrimiento de un material de acero es evaluado en una sesin de
tormenta de ideas. El problema de variacin del espesor (la cual es del 10%) que se seala
es por una serie de causas, que fueron clasificadas en: equipos sin calibracin, personal sin
entrenamiento, especificaciones mal estructuradas, mal diseo de la maquina, variacin del
material, antigedad de la maquina, personal mal seleccionado, sin procedimientos,
velocidad sin control, alta temperatura, ambiente de trabajo contaminado, material
defectuoso, personal sin experiencia, sin instrumentos de control.
Las causas fueron clasificadas segn se muestra en el cuadro 1:
CUADRO 1
Material Variacin del material
Material defectuoso Materia prima de mala calidad
Proveedores no adecuados
Maquinaria Antigedad de la maquinaria
Mal diseo de la maquina
Equipos sin calibracin
Mtodo Sin procedimientos
Especificaciones mal estructuradas
Medio Ambiente Alta temperatura
Ambiente de trabajo contaminado
Mano de Obra Personal sin entrenamiento
Personal sin experiencia
Personal mal seleccionado
Medicin Sin instrumentos de control
Velocidad sin control
10%
espesor en
Variacion del
Entorno
Mediciones
Mtodos
Material
Mquinas
Personal
Personal mal seleccionado
Personal sin experiencia
Personal sin entrenamiento
Equipos sin calibracin
Mal diseo de la maquina
Antigedad de la maquinaria
Material defectuoso
material
Variacin del
estructuradas
Especificaciones mal
Sin procedimientos
Velocidad sin control
control
Sin instrumentos de
contaminado
Ambiente de trabajo
Alta temperatura
P
r
o
v
e
e
d
o
r
e
s
n
o
a
d
e
c
u
a
d
o
s
M
a
te
r
i a
p
r
im
a
d
e
m
a
la
c
a
l
id
a
d
diagrama de causa efecto
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
49
Diagrama de Pareto
1.- En la empresa Las Malvinas el ensamblaje de mangueras ha sido criticado debido a que
presenta muchos defectos. De 14993 ensamblajes inspeccionados en un ao, un total de
1509, el 10.1% estaban defectuosos. El reporte de inspeccin se muestra en el cuadro 2:
CUADRO 2
Defectos Turno 1 Turno 2 Turno 3 Total
Muy corto 30 35 26 91
Muy largo 44 44 44 132
Sin roscas 70 69 70 209
Fugas 330 321 347 998
Daadas 8 11 5 24
Retrabajado 22 20 13 55
Total 504 500 505 1509
La gerencia expres su preocupacin por que los tres turnos no cuentan con igual supervisin,
lo que puede contribuir al problema. Desarrolle un Diagrama de Pareto para el total de
defectos en los tres turnos y un Diagrama de Pareto para cada turno.
Diagrama de Pareto para el total de defectos en los tres turnos.
Total 998 209 132 91 55 24
Porcentaje 66.1 13.9 8.7 6.0 3.6 1.6
% acumulado 66.1 80.0 88.7 94.8 98.4 100.0
Defectos Otro Retrabajado Muy corto Muy largo Sin roscas Fugas
1600
1400
1200
1000
800
600
400
200
0
100
80
60
40
20
0
T
o
t
a
l
P
o
r
c
e
n
t
a
j
e
Diagrama de Pareto de Defectos
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
50
Diagrama de Pareto para cada turno.
Turno 1 330 70 44 30 22 8
Porcentaje 65.5 13.9 8.7 6.0 4.4 1.6
% acumulado 65.5 79.4 88.1 94.0 98.4 100.0
Defectos Otro Retrabajado Muy corto Muy largo Sin roscas Fugas
500
400
300
200
100
0
100
80
60
40
20
0
T
u
r
n
o
1
P
o
r
c
e
n
t
a
j
e
Diagrama de Pareto de Defectos
Diagrama de Dispersin
1.- En un equipo de mejora se obtienen los siguientes datos, que recogen el nmero de
defectos por lote e conjuntos de 10 000 piezas en funcin del tiempo de
tratamiento al que se someten:
Obs #
Defectos
Tiempo
(Seg)
Materia
Prima
Obs #
Defectos
Tiempo
(seg)
Materia
Prima
1 48 809 B 26 47 837 A
2 52 834 B 27 53 840 A
3 54 838 B 28 58 850 B
4 50 854 A 29 54 843 A
5 48 822 A 30 43 819 A
6 51 842 A 31 54 856 A
7 52 851 A 32 52 862 A
8 59 868 B 33 56 835 B
9 54 841 B 34 55 844 B
10 54 844 B 35 55 852 A
11 44 811 A 36 58 858 B
12 54 819 B 37 57 843 B
13 48 830 A 38 52 825 B
14 47 836 A 39 58 867 B
15 58 850 B 40 57 851 B
16 57 857 B 41 51 812 B
17 54 863 A 42 51 821 B
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
51
18 49 811 B 43 50 831 B
19 49 820 A 44 56 841 B
20 48 826 A 45 50 843 A
21 52 832 B 46 49 850 A
22 50 837 A 47 52 841 B
23 49 839 A 48 50 855 A
24 54 839 B 49 46 829 A
25 56 842 B 50 49 838 A
a) Realice un diagrama de dispersin entre la variable nmero de defectos por lote y la
variable tiempo de tratamiento al que se someten. Que comentarios puede hacer al
respecto.
2.- Fiber Borrad fabrica forros interiores de techo para la industria automotriz. La
gerente de manufactura est preocupada por la calidad de este producto. Sospecha
que un defecto en particular, las rasgaduras de la tela, est relacionado con el
tamao de las actuales partidas de produccin. Un asistente ha recopilado los datos
que se encuentran en la tabla, basndose en los registros de produccin:
Partida Tamao Defecto (%) Partida Tamao Defecto (%)
1 1000 3.5 1 6500 1.5
2 4100 3.8 2 1000 5.5
3 2000 5.5 3 7000 1.0
4 6000 1.9 4 3000 4.5
5 6800 2.0 5 2200 4.2
6 3000 3.2 6 1800 6.0
7 2000 3.8 7 5400 2.0
8 1200 4.2 8 5800 2.0
9 5000 3.8 9 1000 6.2
10 3800 3.0 10 1500 7.0
y = 0.164x - 85.57
R = 0.399
40
42
44
46
48
50
52
54
56
58
60
800 810 820 830 840 850 860 870 880
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
52
a) Dibuje un diagrama de dispersin para estos datos
b) Existe alguna relacin entre el tamao de la partida y el porcentaje de defectos?
Qu consecuencias tiene esto para los negocios de Fiber Borrad?
7000 6000 5000 4000 3000 2000 1000
7
6
5
4
3
2
1
Tamao
D
e
f
e
c
t
o
(
%
)
Grfica de dispersinde Defecto (%) vs. Tamao
GRFICO DE BARRAS
Cuadro N 01: Distribucin de plntulas de tornillo segn su altura (en milmetros).
Brunas-UNAS/Tingo Mara. Mayo 2011
mi Li Ls
Marca de Clase
(Xi)
Grupos
Frecuencia
(fi)
(Fi) (hi) (Hi) (hi%) (Hi%)
1 14 18.0 16 17.0 29 29 0.121 0.121 12.1% 12.1%
2 18.0 22.0 20 21.0 24 53 0.100 0.221 10.0% 22.1%
3 22.0 26.0 24 25.0 27 80 0.113 0.333 11.3% 33.3%
4 26.0 30.0 28 29.0
30
110 0.125 0.458 12.5% 45.8%
5 30.0 34.0 32 33.0 34 144 0.142 0.600 14.2% 60.0%
6 34.0 38.0 36 37.0 24 168 0.100 0.700 10.0% 70.0%
7 38.0 42.0 40 41.0 24 192 0.100 0.800 10.0% 80.0%
8 42.0 46.0 44 45.0 26 218 0.108 0.908 10.8% 90.8%
9 46.0 50.0 48 50.0 22 240 0.092 1.000 9.2% 100.0%
Total 240 1.000 100%
Fuente: Facultad de Recursos de la UNAS.
Del cuadro anterior realice el grafico de barras.
Grfico N 01. Distribucin porcentual de plntulas de tornillo segn su altura
(en milmetros). Brunas-UNAS/Tingo Mara. Mayo 2011
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
53
Fuente: Facultad de Recursos de la UNAS.
GRFICO DE SECTORES.
1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de
Tingo Mara en Julio Agosto del 2012 para analizar su opinin sobre la
calidad de una nueva conserva que se desea introducir en el mercado. Los
resultados observados fueron los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo
Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
Fuente: Elaboracin Propia
0.0%
2.0%
4.0%
6.0%
8.0%
10.0%
12.0%
14.0%
16.0%
[14 - 18>
12.1%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
53
Fuente: Facultad de Recursos de la UNAS.
GRFICO DE SECTORES.
1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de
Tingo Mara en Julio Agosto del 2012 para analizar su opinin sobre la
calidad de una nueva conserva que se desea introducir en el mercado. Los
resultados observados fueron los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo
Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
Fuente: Elaboracin Propia
[14 - 18> [18- 22> [22 - 26> [26 - 30> [30 - 34> [34 - 38> [38 - 42>
12.1%
10.0%
11.3%
12.5%
14.2%
10.0% 10.0%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
53
Fuente: Facultad de Recursos de la UNAS.
GRFICO DE SECTORES.
1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de
Tingo Mara en Julio Agosto del 2012 para analizar su opinin sobre la
calidad de una nueva conserva que se desea introducir en el mercado. Los
resultados observados fueron los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo
Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
Fuente: Elaboracin Propia
[38 - 42> [42 - 46> [46 - 50]
10.0%
10.8%
9.2%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
54
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
HISTOGRAMA.
1. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009
se da en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
a) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Malo
39%
Excelente
29%
0
1000
2000
3000
4000
5000
6000
7000
2005
JUREL ANCHOVETA
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
54
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
HISTOGRAMA.
1. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009
se da en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
a) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Bueno
15%
Regular
17%
Malo
39%
2008 2009
ANCHOVETA SARDINA CABALLA
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
54
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
HISTOGRAMA.
1. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009
se da en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
a) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Regular
17%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
55
GRFICO DE LINEAS.
PROBLEMAS RESUELTOS.
1. Los siguientes datos corresponden a un muestra aleatoria de la altura en milmetros
(mm) de plantulas de tornillo (cedrelingacatenaeformis) perteneciente a la familia de
las Fabaceae en una parcela de 50x10 mts
2
, realizada en el Brunas-UNAS de la
ciudad de Tingo Mara en mayo 2011.
32 26 26 44 32 15 48 22 22 39 15 26 21 45 16 23
46 26 44 42 36 43 19 29 35 42 37 44 32 41 33 21
17 29 32 29 50 14 24 14 49 35 17 32 33 26 30 16
32 32 26 35 32 41 20 32 47 18 28 17 29 50 26 28
21 28 44 14 39 27 17 15 28 14 37 32 34 27 40 32
17 45 28 31 17 33 41 18 36 26 17 31 38 31 44 36
22 26 33 39 19 49 50 33 22 33 50 31 42 27 21 23
38 48 34 22 48 36 29 23 33 41 32 17 20 18 24 25
43 15 17 31 27 22 39 28 31 19 23 37 32 19 39 43
33 40 22 44 23 15 14 44 23 25 14 35 41 50 21 20
35 41 38 30 29 40 22 39 41 18 42 37 34 46 39 30
50 46 35 44 42 27 18 15 37 39 16 50 20 50 34 29
41 20 36 25 42 19 36 39 21 17 43 44 36 23 30 23
41 23 45 15 37 27 18 23 14 22 35 33 15 30 49 49
33 45 45 22 15 46 49 45 29 24 19 25 45 27 49 21
La informacin fue obtenida de la Facultad de Recursos de la UNAS.
a) Construya un cuadro de distribucin de frecuencias adecuado. (3pts)
b) Determine las medidas de tendencia central e interprete. (6pts)
c) Determine las medidas de dispersin e interprete. (4pts)
d) Construya su grfico correspondiente e interprete. (3pts)
Solucin
PASOS PARA AGRUPAR DATOS Funcin en Excel
Del
Ejemplo
Tamao de muestra: ( n ) = CONTAR(Seleccionar BD
3
) 240
Valor Mximo = MAX() 50
Valor Mnimo = MIN() 14
Rango (R)= Valor Mximo - Valor Mnimo 36
Aplicando la regla de STURGES:
N de intervalos (m) = 1+3.3*log (n) 8.855
m redondeado = REDONDEAR() 9
Amplitud (C ) = R/[m = redondeado] 4
3
BD: base de datos.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
56
Cuadro N 01: Distribucin de plntulas de tornillo segn su altura (en milmetros).
Brunas-UNAS/Tingo Mara. Mayo 2011
mi Li Ls
Marca de Clase
(Xi)
Grupos
Frecuencia
(fi)
(Fi) (hi) (Hi) (hi%) (Hi%)
1 14 18.0 16 17.0 29 29 0.121 0.121 12.1% 12.1%
2 18.0 22.0 20 21.0 24 53 0.100 0.221 10.0% 22.1%
3 22.0 26.0 24 25.0 27 80 0.113 0.333 11.3% 33.3%
4 26.0 30.0 28 29.0
30
110 0.125 0.458 12.5% 45.8%
5 30.0 34.0 32 33.0 34 144 0.142 0.600 14.2% 60.0%
6 34.0 38.0 36 37.0 24 168 0.100 0.700 10.0% 70.0%
7 38.0 42.0 40 41.0 24 192 0.100 0.800 10.0% 80.0%
8 42.0 46.0 44 45.0 26 218 0.108 0.908 10.8% 90.8%
9 46.0 50.0 48 50.0 22 240 0.092 1.000 9.2% 100.0%
Total 240 1.000 100%
Fuente: Facultad de Recursos de la UNAS.
~ Promedio muestral (X).
=
( )
Promedio muestral = 31.4333333
Mediana muestral (Me).
= +

Mediana muestral = 31.1764706


Moda muestral (Mo).
= +
+

Donde: =( )
=( )
Moda muestral = 31.1428571
Varianza muestral ( )
=
( )
Varianza muestral = 101.70265
Desviacin estndar.
= =
( )
1
Desviacin estndar muestral =10.0847732
Marca de Clase (Xi) Frecuencia (fi) Xi*fi
16 29 464
20 24 480
24 27 648
28 30 840
32 34 1088
36 24 864
40 24 960
44 26 1144
48 22 1056
( ) = 7544
( )
6907.446
3137.307
1491.870
353.633
10.918
500.507
1761.307
4105.949
6037.998
( ) =24306.933
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
57
Coeficiente de Variacin muestral porcentual:
. .=
Coeficiente de Variacin muestral = 32.083%
Grfico N 01. Distribucin porcentual de plntulas de tornillo segn su altura (en
milmetros). Brunas-UNAS/Tingo Mara. Mayo 2011
Fuente: Facultad de Recursos de la UNAS.
2. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de Tingo
Mara en Julio Agosto del 2012 para analizar su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Los resultados observados fueron
los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular
Excelent
e
Excelent
e Regular Regular
Excelent
e
Excelent
e Regular
Excelent
e
Excelent
e Regular
Excelent
e
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelent
e Malo Regular
Excelent
e
Excelent
e Malo Regular
Excelent
e Malo Regular
Excelent
e Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelent
e Malo
Excelent
e
Excelent
e
Excelent
e Malo
Excelent
e
Excelent
e Malo
Excelent
e
Excelent
e Malo
Malo
Excelent
e Bueno Regular Malo
Excelent
e Bueno Regular Malo
Excelent
e Malo
Excelent
e
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
0.0%
2.0%
4.0%
6.0%
8.0%
10.0%
12.0%
14.0%
16.0%
[14 - 18> [18- 22>
12.1%
10.0%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
57
Coeficiente de Variacin muestral porcentual:
. .=
Coeficiente de Variacin muestral = 32.083%
Grfico N 01. Distribucin porcentual de plntulas de tornillo segn su altura (en
milmetros). Brunas-UNAS/Tingo Mara. Mayo 2011
Fuente: Facultad de Recursos de la UNAS.
2. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de Tingo
Mara en Julio Agosto del 2012 para analizar su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Los resultados observados fueron
los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular
Excelent
e
Excelent
e Regular Regular
Excelent
e
Excelent
e Regular
Excelent
e
Excelent
e Regular
Excelent
e
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelent
e Malo Regular
Excelent
e
Excelent
e Malo Regular
Excelent
e Malo Regular
Excelent
e Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelent
e Malo
Excelent
e
Excelent
e
Excelent
e Malo
Excelent
e
Excelent
e Malo
Excelent
e
Excelent
e Malo
Malo
Excelent
e Bueno Regular Malo
Excelent
e Bueno Regular Malo
Excelent
e Malo
Excelent
e
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
[18- 22> [22 - 26> [26 - 30> [30 - 34> [34 - 38> [38 - 42> [42 - 46>
10.0%
11.3%
12.5%
14.2%
10.0% 10.0%
10.8%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
57
Coeficiente de Variacin muestral porcentual:
. .=
Coeficiente de Variacin muestral = 32.083%
Grfico N 01. Distribucin porcentual de plntulas de tornillo segn su altura (en
milmetros). Brunas-UNAS/Tingo Mara. Mayo 2011
Fuente: Facultad de Recursos de la UNAS.
2. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de Tingo
Mara en Julio Agosto del 2012 para analizar su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Los resultados observados fueron
los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular
Excelent
e
Excelent
e Regular Regular
Excelent
e
Excelent
e Regular
Excelent
e
Excelent
e Regular
Excelent
e
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelent
e Malo Regular
Excelent
e
Excelent
e Malo Regular
Excelent
e Malo Regular
Excelent
e Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelent
e Malo
Excelent
e
Excelent
e
Excelent
e Malo
Excelent
e
Excelent
e Malo
Excelent
e
Excelent
e Malo
Malo
Excelent
e Bueno Regular Malo
Excelent
e Bueno Regular Malo
Excelent
e Malo
Excelent
e
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
[42 - 46> [46 - 50]
10.8%
9.2%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
58
Fuente: Elaboracin Propia
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
3. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009 se da
en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
b) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Malo
39%
Excelente
29%
0
1000
2000
3000
4000
5000
6000
7000
2005
JUREL ANCHOVETA
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
58
Fuente: Elaboracin Propia
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
3. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009 se da
en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
b) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Bueno
15%
Regular
17%
Malo
39%
2008 2009
ANCHOVETA SARDINA CABALLA
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
58
Fuente: Elaboracin Propia
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
3. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009 se da
en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
b) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Regular
17%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
59
Problemas Propuestos
1. Identifique las siguientes variables segn su clasificacin, ya sea cuantitativa (discreta o
continua) y cualitativa (nominal u ordinal).
a) Ficha de productos que elabora una fbrica:
Nombre del producto: ...............................................................................................
Tipo de envase: .................................... ....................................................................
Peso por unidad: ................................... ....................................................................
Tiempo de procesamiento: ................... ....................................................................
Costo por unidad: ................................. ....................................................................
Precio de venta por unidad: ................... ..................................................................
b) Ficha del personal que entra a trabajar en una empresa:
Nombre y Apellido: .................................... .............................................................
Edad (en aos): .......................................... ...............................................................
Estado Civil: ............................................... ..............................................................
Estudios: ................................................... ................................................................
Seccin en la que ingresa: .......................... ..............................................................
Sueldo bsico: ............................................ ..............................................................
Estatura: ................................................... .................................................................
Peso: .......................................................... ...............................................................
2. El tiempo diario (en horas) de permanencia en la Universidad Nacional Agraria
de la Selva de la ciudad de Tingo Mara de 200 estudiantes matriculados en el
semestre acadmico en estudio.
Identifique:
a) Poblacin, muestra, parmetro, estimador, unidad de anlisis, variable, tipo
de variable.
3. En cada uno de los siguientes enunciados identifique la unidad de anlisis, la
variable y su tipo.
a) Desde hace dos aos las compaas gastan en proteccin de la informacin.
Estos gastos incluyen los costos de personal, hardware, software, servicios
externos y seguridad fsica. Se eligieron dos empresas transnacionales y se
registraron sus gatos mensuales, en miles de dlares, correspondientes a la
proteccin de la informacin de los ltimos seis meses.
b) La oficina de gestin de calidad de la UNAS est realizando un estudio para
conocer, segn el criterio de los profesores, que tan importante es la
aplicacin de un modelo de planeamiento de largo plazo en la mejora de la
calidad en las instituciones de educacin superior. De los 200 profesores
consultados, el 30% lo consider poco importante, el 50% importante y el
20% muy importante.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
60
4. Los siguientes datos corresponden a una muestra aleatoria de 20 trabajadores del
banco de crdito del Per segn sus retenciones al sistema privado de pensiones
en febrero del 2011.
100 200 150 160 179 130 135 150 155 158
180 190 170 175 120 115 140 139 145 144
Los datos fueron brindados por el departamento de personal de dicha
institucin.
Se pide:
a) Identificar la unidad de anlisis y la variable en estudio.
b) Construya un cuadro de distribucin de frecuencias en intervalos de clase o
datos agrupados. Utilice la regla de Sturges.
c) Interprete f3, h3%, F3 y H3%.
d) Determinar qu porcentaje de trabajadores tienen una retencin de 140 soles
o ms, pero menos de 180 soles.
e) Determinar cuntos trabajadores tienen una retencin de 160 a 200 soles.
f) Construir un histograma de frecuencias porcentuales y comente.
5. La siguiente tabla muestra la cantidad de clientes que entran en el horario de 14
a 15 horas en 60 importantes locales de ventas de automviles de cierta ciudad:
0 2 5 0 1 4 1 0 2 1 5 0 1 3 0 0 2 1 3 1
1 4 0 2 4 1 2 4 0 4 3 5 0 1 3 6 4 2 0 2
0 2 3 0 4 2 5 1 1 2 2 1 6 5 0 3 3 0 0 4
a) Determinar la variable a analizar e indicar cul es su tipo.
b) Construir una distribucin de frecuencias absolutas y representarla mediante
un diagrama de lneas.
c) Construir una distribucin de frecuencias relativas y relativas porcentuales e
interpretar el significado de la cuarta frecuencia.
d) Construir una distribucin de frecuencias acumuladas crecientes y
decrecientes, representarlas grficamente e interpretar el significado de la
segunda y quinta frecuencia.
e) Si en el 80% o ms de los locales entran como mximo 4 personas, se
decidir no atender al pblico en ese horario (de 14 a 15 horas) y comenzar
a atender a partir de las 15 horas. En base a los datos, qu decisin se
tomar? Justificar.
6. A fin de decidir cuntos mostradores de servicio se necesitarn en tiendas que
sern construidas en el futuro, una cadena de supermercados quiso obtener
informacin acerca del tiempo (en minutos) requerido para atender a los clientes.
Se registr la duracin de 60 casos:
3,6 1,9 2,1 0,3 0,8 0,2 1,0 1,4 1,8 1,6
1,1 1,8 0,3 1,1 0,5 1,2 0,6 1,1 0,8 1,7
1,4 0,2 1,3 3,1 0,4 2,3 1,8 4,5 0,9 0,7
0,6 2,8 2,5 1,1 0,4 1,2 0,4 1,3 0,8 1,3
1,1 1,2 0,8 1,0 0,9 0,7 3,1 1,7 1,1 2,2
1,6 1,9 5,2 0,5 1,8 0,3 1,1 0,6 0,7 0,6
a) Cul es la variable a analizar? Es cuantitativa o cualitativa?
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
61
b) Elaborar un diagrama de tallos y hojas con esos datos.
c) Organizarlos de la manera que le resulte ms conveniente (de forma simple
o en intervalos) y justificar la organizacin elegida.
d) Construir una distribucin de frecuencias absolutas y relativas.
e) Representar grficamente las frecuencias anteriores mediante un histograma
y un polgono de frecuencias.
f) Construir las frecuencias acumuladas crecientes y decrecientes y graficarlas
mediante una ojiva.
g) Interpretar en cada caso el significado de la cuarta frecuencia.
h) Qu proporcin de los tiempos de servicio es menor a un minuto?
7. Una empresa consultora ha entrevistado un grupo de 50 personas a las cuales les
han preguntado la edad. Se obtuvieron los siguientes datos:
23 34 21 41 42 35 32 36 27 20
19 31 39 38 41 26 24 27 30 33
23 32 40 34 25 28 29 30 22 24
26 36 38 21 39 22 33 35 32 28
27 26 24 32 37 39 32 24 35 26
Se ha decidido organizar los datos en intervalos de tal manera que las marcas de
clase de los mismos sean: 20, 24, 28, etc.
a) Construir una distribucin de frecuencias absolutas, porcentuales y
acumuladas.
b) Representar grficamente las frecuencias porcentuales y las acumuladas.
c) Obtener conclusiones.
8. Un ingeniero agrnomo visita 25 cooperativas agrarias de naranjas en la ciudad
de Tingo Mara y en cada uno anot el nmero de plantas atacadas por cierto
hongo de la cual resultaron los siguientes datos:
15 20 25 15 16 18 18 18 16 19 17 17 18
19 18 15 18 17 20 18 19 17 16 17 19
a) Identifique la variable en estudio y el tipo de variable.
b) Construya un cuadro de distribucin de frecuencia adecuada a este conjunto
de datos.
c) Cuntas cooperativas agrarias tiene a lo ms 20 plantas atacadas por
hongos?
d) Cuntas cooperativas agrarias tienen por lo menos 17 plantas atacadas por
hongos?
e) Qu proporcin de cooperativas bajo estudio tienen 18 plantas atacadas por
hongos?
f) Qu proporcin de cooperativas tienen 18 o menos plantas atacadas por
hongos?
g) Qu porcentaje de cooperativas tienen 18 o menos plantas atacadas por
hongos?
9. El ministerio de educacin realiz un estudio para determinar los indicadores
sobre las condiciones en las que operan los institutos dedicados a la enseanza
de carreras profesionales en computacin. El estudio se realizo en todo el pas
con la seleccin al azar de 40 de estos institutos. Los directores o promotores de
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
62
los institutos seleccionados fueron entrevistados, encontrndose la siguiente
informacin:
El nmero promedio de computadoras para la enseanza es 40.
En promedio, el pago mensual por enseanza es de 120 nuevos soles.
El 60% de los institutos utiliza el software pirata.
Utilice esta informacin para identificar: poblacin, muestra, unidad de
anlisis, variables y tipos de variables.
10. El consumo mensual de agua de 150 hogares, se tabularon en una distribucin
de frecuencias simtrica de 6 intervalos, siendo las frecuencias: f
2
= 25, F
3
= 75,
F
5
= 130. Si el lmite inferior del sexto intervalo igual a 60, y si el 75% de los
consumos son mayores de 43.5m
3
, completar la distribucin de frecuencias.
11. En una investigacin agrcola en Tulumayo- Tingo Mara, en Julio de 2011, se
determin la produccin total (en kilogramos) de un cierto cultivo, el cual fue
sembrado en parcelas experimentales. Los datos se tabularon en una distribucin
de frecuencias simtrica de cinco intervalos de igual amplitud, siendo las
frecuencias: f4 f5 = 10, f4 f3 f1 = 0, el lmite superior en el cuarto intervalo
por f4 es igual a 975, el lmite inferior en el primer intervalo es igual a 12.5 y n
= 110.
a) Reconstruir el cuadro de frecuencias.
b) Calcular e interpretar la mediana (Me), moda (Mo).
12. Las notas de 50 alumnos de la UNAS Tingo Mara, se clasifican en una tabla
de distribucin de frecuencias con cuatro intervalos de clase de igual amplitud.
Sabiendo adems que: X2 = 50, f1 =4, F2 = 20, f3 = 25, = 62.4.
a) Calcular e interpretar la mediana (Me).
b) Determine la proporcin de estudiantes cuyos puntajes se encuentran por lo
menos de 35 puntos pero a lo ms 65 puntos.
13. Sabiendo que la siguiente tabla de frecuencias, es simtrica, completar con los
datos, dados. Si adems se sabe que la mediana es igual a 27.5. Reconstruir la
tabla de frecuencias y calcular la media aritmtica.
[Li Ls> Xi fi Fi hi Hi
0.2
0.65
50 0.95
Total 60
14. En base a la siguiente informacin que corresponde a la visita de cooperativas
agrarias en la ciudad de Tingo Mara en mayo de 2010 y en cada una de ellas se
anoto el nmero de rboles atacadas por cierto hongo.
X
2
= 550; X
5
= 850; h6 = 2/50 = H1; m = 6; h2 = 0.14; H4 = 0.76; h5 =
0.20; H3 h2 = 0.26 y C = constante.
a) Reconstruir la tabla de frecuencias e intrprete los puntos ms importantes.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
63
b) Calcule e interprete la desviacin estndar, mediana y moda.
15. Al agrupar 400 datos en intervalos, la mediana resulta 58.833 y el lmite inferior
del intervalo que la contiene es 50.5. Si el intervalo tiene por encima al 47.5%
de los datos y por debajo al 37.5% de los datos.
a) Qu amplitud tienen los intervalos de la distribucin sabiendo que esta es
constante?
b) Cul es lmite superior del intervalo que contiene a la mediana?
16. Los intervalos y las frecuencias absolutas de los salarios quincenales de 45
empleados desarrollan en el cuadro siguiente:
Intervalos
de salarios ($)
[Li - Ls>
Frecuencias
Absolutas
fi
Relativas
Hi
Porcentual
Hi%
[26 - 34> 1 0.022 2.2%
[34 - 42> 2 0.044 4.4%
[42 - 50> 4 0.089 8.9%
[50 - 58> 10 0.222 22.2%
[58 - 66> 16 0.356 35.6%
[66 - 74> 8 0.178 17.8%
[74 - 82] 4 0.089 8.9%
Total: 45 1.000 100.0%
a) Calcule el porcentaje de empleados que tienen salarios entre $52 y $75.
b) Obtenga el salario que divide en dos partes iguales.
17. La altura de dimetro de pecho de capirona se organizaron en una distribucin
de frecuencia, cuyos resultados incompletos se dan en la siguiente tabla:
[Li Ls>
Marca de clase
Xi
Frecuencia relativa simple
Hi
Frecuencia relativa
acumulada Hi
0.15
6 0.45
0.70
13.5
0.10
Total
18. Los siguientes datos corresponden a la inversin real anual en miles de dlares
de un grupo de pequeas empresas. Completar la siguiente tabla de distribucin
de frecuencia. (4 Ptos)
[ Li - Ls > Xi fi Fi hi Hi
[20 - 24 > 0.10
[24 - 28 > 0.25
[ - 32 > 11 0.55
[32 - > 0.85
[ - 40] 1
Total
a) Identificar la unidad de anlisis y la variable en estudio.
b) Interpretar el f4 y el h4%.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
64
19. En una tabla de distribucin simtrica con siete intervalos de clase de igual
longitud, se conocen los datos siguientes: C =10, f
1
=8 y X
3
*f
3
=1260; f
2
+ f
5
= 62; h
3
=0.21, H
6
= 0.96.
Reconstruir la tabla de frecuencias y determinar la media geomtrica.
20. En base a la siguiente informacin que corresponden a la inversin real anual en
miles de dlares de un grupo de pequeas empresas. Construir la tabla de
distribucin de frecuencia.
X
2
=550; X
5
=850; h
6
=2/50 = H
1
; m=6; h
2
=0.14; H
4
= 0.76; h
5
=0.20; H
3
-h
2
=0.26
y c = constante
a) Interpretar el f4 y el h4%.
21. De las edades de cuatro personas, se sabe que la media es igual a 24 aos, la
mediana es 23, y la moda es 22. Encuentre las edades de las cuatro personas.
22. La inversin real en miles de dlares anual de un grupo de pequeas empresas
en el banco de Crdito de la ciudad de Tingo Mara fueron:
807 811 620 650 817 732 747
900 753 1050 918 857 867 675
500 872 869 841 847 833 829
766 787 923 792 803 933 947
1056 1076 958 970 776 828 831
La informacin fue obtenida por el Instituto nacional de Estadstica e
Informtica en mayo de 2010.
Se pide:
a) Construir una tabla de distribucin de frecuencias, con intervalos (datos
agrupados) y hacer grfico correspondiente e interpretar.
b) Calcular e interpretar: La media, desviacin estndar, mediana y la moda.
23. A continuacin se muestra una tabla con los datos acerca de la distribucin de
exportaciones e importaciones de diferentes pases (en millones de euros).
Pas Exportaciones Importaciones
EEUU 512 690
Alemania 425 380
Japn 390 275
Francia 235 230
Reino Unido 205 220
Italia 190 170
Canad 160 150
Holanda 155 140
Hong Kong 150 165
Blgica-Luxem 140 130
China 120 115
Singapur 95 100
Corea Sur 95 105
Taiwn 90 85
Espaa 75 90
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
65
a) Cules son las variables que intervienen en este anlisis? Cul es el tipo
de las mismas?
b) Realizar un diagrama de dispersin considerando las exportaciones como
variable dependiente. Puede observarse algn tipo de relacin entre ambas
variables? En tal caso, qu tipo de relacin se observa?
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
66
TRABAJO PRCTICO: ESTADSTICA DESCRIPTIVA
(trabajo prctico a entregar de manera individual para ser calificado)
Ejercicio: (Se recomienda el uso del Software Estadstico Minitab 16 o SPSS 20.0)
Estudio sobre nutricin en el comedor de una Empresa
Fuente: Estadstica bsica en Administracin. Conceptos y Aplicaciones. Sexta
Edicin. Berenson, Mark L., Levine, David M. Prentice Hall Hispanoamericana, S. A.
Pginas 166 - 168.
La vicepresidenta de los servicios al personal obrero de una empresa en las
afueras de la ciudad, sostuvo una reunin con la recin nombrada directora de los
servicios de comida, y con la profesora de nutricin, sobre una serie de quejas de los
empleados relacionadas con el men ofrecido en la cafetera de la empresa. Puesto que
los obreros transcurran la mayor parte del da dentro de la empresa, se vean obligados
a comprar el men que all se serva y que no siempre ofreca una comida barata, rpida
y saludable.
Cuando la vicepresidenta pidi una respuesta sobre estos comentarios, la
directora de los servicios de comida asever que slo llevaba 3 semanas en la empresa y
que haba seguido preferentemente el men establecido por su predecesor, al mismo
tiempo que experimentaba con una seleccin de comida gastronmica cada da.
Estableci, adems, que a partir del llamado de atencin respecto a estas inquietudes,
seguira otra pauta. Considerando el hecho de que la empresa est situada en un rea
rural y que, en particular, se requiere el almacenamiento de productos alimenticios
enlatados para los meses de invierno en que las provisiones de la ciudad ms cercana
pueden retrasarse, estudiara el contenido nutricional de la sopa enlatada porque podra
disponerse fcilmente de este artculo en todos los almuerzos, e incluso podra
proporcionar los nutrientes de la comida saludable, barata y rpida que se solicita.
La profesora de nutricin estuvo de acuerdo en que tal estudio sera de utilidad y
proporcionara la informacin necesaria para tomar una decisin respecto a la
instrumentacin.
Los datos obtenidos fueron los siguientes:
M MA AR RC C
A A
P PR RO OD DU UC CT T
O O
T TI IP PO O C CO OS ST TO O
C CA AL LO OR R A A
S S
G GR RA AS SA A
C CA AL LO OR R A AS S
D DE E G GR RA AS SA A
S SO OD DI I
O O
1 CN CC 0,35 60 2 30 880
2 CN CR 0,66 75 2 24 730
3 CN CC 0,18 60 2 30 870
4 CN DI 0,33 170 8 42 970
5 CN CR 0,77 80 2 23 460
6 CN DC 0,21 80 2 23 700
7 CN DC 0,09 190 8 38 970
8 CN DC 0,11 200 9 41 960
9 CN DC 0,26 100 2 18 700
10 CN CC 0,17 60 2 30 840
11 CN CC 0,19 60 2 30 840
12 CN DC 0,09 190 9 43 780
13 CN CC 0,19 60 2 30 840
14 CN CR 0,76 60 1 15 790
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
67
15 CN DC 0,54 110 2 16 800
16 CN CR 0,74 105 3 26 860
17 CN CR 0,96 110 4 33 800
18 CN DC 0,12 70 2 26 900
19 CN DI 0,48 105 3 26 1190
20 CN DI 0,36 65 1 14 890
21 CN CR 0,74 120 4 30 810
22 CN CR 0,70 80 2 23 470
23 CN CR 0,97 80 1 11 180
24 CN CR 0,80 125 4 29 65
25 CN CR 0,78 95 2 19 580
26 V CR 0,53 125 3 22 670
27 V CR 0,83 110 2 16 680
28 V CR 0,73 120 3 23 800
29 V CR 0,51 105 1 9 600
30 V CR 0,46 75 2 24 940
31 V CR 0,44 75 1 12 680
32 V CR 0,73 140 3 19 540
33 V CC 0,34 60 2 30 880
34 V CR 0,53 110 1 8 640
35 V CC 0,23 90 2 20 830
36 V CR 0,92 55 1 6 280
37 V CR 0,55 90 1 10 480
38 V CR 0,94 90 1 10 160
39 T CC 0,15 90 2 20 670
40 T CC 0,20 90 2 20 410
41 T CC 0,13 100 1 9 710
42 T CC 0,14 100 1 9 630
43 T CC 0,16 80 0 0 700
44 T CC 0,15 100 1 9 630
45 T CC 0,18 100 1 9 710
46 T CR 0,87 75 1 12 300
47 T CC 0,28 90 0 0 740
Donde:
Producto: CN = Pollo. - V = Vegetales. - T = Tomate.
Tipo: CC = enlatada / condensada. - CR = enlatada / lista para servirse.
DC = deshidratada / cocinada. - DI = deshidratada / instantnea.
Costo en centavos.
Caloras por racin de 8 onzas.
Grasa en gramos por racin de 8 onzas.
Caloras de grasa como porcentaje de grasa por racin de 8 onzas.
Nivel de sodio en miligramos por racin de 8 onzas.
Se pide:
1.- En base a los datos de la tabla, indicar cules fueron las variables relevadas. Para
cada una de ellas indicar si es cualitativa o cuantitativa y especificar las categoras o
valores.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
68
2.- Realizar una tabla de distribucin de frecuencias (absolutas, relativas y porcentuales)
para las variables Producto y Tipo. Representar grficamente las frecuencias
porcentuales y obtener conclusiones.
3.- Realizar una tabla de distribucin de frecuencias (absolutas, relativas y acumuladas)
para las variables Costo y Sodio - en cada caso, decidir si es conveniente organizar los
datos de forma simple o en intervalos.
4.- Construir todos los grficos posibles para las distribuciones del tem anterior.
5.- Realizar un anlisis exploratorio para Caloras. Qu puede decirse de la
distribucin? Se observan outliers?