Está en la página 1de 98

APUNTES sobre:

ESTADISTICA
DESCRIPTIVA
DOCENTE RESPONSABLE:
Ing. REMIGIO CESAR CONDORI PALOMINO

2014
El
pensamiento estadstico
algn da ser tan necesario
para la ciudadana como la
capacidad de leer y escribir...
H.G.Wells hace ms de 100
aos

CAPITULO 1:
1. Introduccion
1.1 Breves datos histricos relacionados con la
estadistica
1.2 Etimologia del trmino estadstica
1.3 Definiciones de estadistica
1.4 Clasificacion de la estadistica
1.4.1
La estadstica descriptiva o deductiva:
1.4.2
La estadistica inductiva o inferencial
1.5 Indicador estadistico
1.6 Importancia de la estadistica
1.7 Usos de la estadstica
1.8 Malos usos de la estadstica
CAPITULO 2:
2. La estadistica y la investigacin cientfica
2.1 Etapas de una investigacion estadistica
2.1.1
La planificacin
2.1.2
Recoleccin de datos.
2.1.3
Organizacin de datos.
2.1.4
Anlisis e interpretacin de resultados.
2.1.5
Resultados y conclusiones.
2.2 El pensamiento estadistico
CAPITULO 3:
3. Poblacin muestra y muestreo.
3.1. Poblacin
3.1.1.
Censo:
3.2. Muestra
3.2.1.
El tamao de la muestra
3.2.1.1. Para datos continuos.
3.2.1.2. Para proporciones: utilizando la formula
3.2.1.3. Metodo fisher-arkin-colton
3.3. El muestreo
3.4. Tipos de muestreo
3.4.1.
Muestreo no probabilistico
3.4.2.
Muestreo probabilistico
3.4.2.1. Muestreo aleatorio simple.3.4.2.2. Muestreo aleatorio sistemtico
3.4.2.3. Muestreo aleatorio estratificado.3.4.2.4. Muestreo aleatorio por conglomerados.3.5. Error muestral
3.6. El error estndar
CAPITULO 4
4. Variable
4.1 Variable estadstica
4.2 Variables cuantitativas
4.2.1
Variables continuas
4.2.2
Variables discretas.
4.3 Variables cualitativas
4.4 Medicin
4.4.1
Escalas de medicin
4.4.1.1 Escala nominal
4.4.1.2 Escala ordinal
4.4.1.3 Escala de intervalo
4.4.1.4 Escala de razon
CAPITULO 5:
5. Los datos o elementos
5.1 Dato:
5.2 Los datos estadsticos
5.3 Clasificacin de los datos
5.4 Herramientas comunes para recopilar y analizar
datos
5.5 El metodo de recoleccion
5.6 Considerando las fuentes de informacin:
5.6.1
Las fuentes primarias
5.6.1.1 La observacin directa
5.6.1.2 La observacin es indirecta
5.6.2
Las fuentes secundarias
5.6.2.1 Las fichas
5.6.2.2 El cuestionario o formulario
5.7 Considerando el metodo de recoleccion
5.7.1
Metodos directos
5.7.2
La observacin
5.7.2.1 Formas de observar la poblacin:
5.7.3
La experimentacin:
5.7.4
Metodos indirectos
5.7.4.1 La encuesta:
5.7.4.2 La entrevista:
5.8 Tipos de preguntas
5.8.1
Preguntas abiertas.5.8.2
Preguntas cerradas.-

5.9 Elementos a considerar para


datos
5.10 La ficha tcnica

la recoleccion de

CAPITULO 6
6.
Organizacin de los datos.
6.1. Aproximacion y redondeo de datos
6.2. Organizacin de datos
6.2.1.
Codificacin y tabulacion de los datos
6.3. Tablas de frecuencia
6.3.1.
Pasos para la elaboracion de una tabla de
frecuencias
CAPITULO 7:
7. Presentacion de datos
7.1.
Grficos estadsticos
7.2.
Tipos de grficos estadsticos
7.2.1.
El diagrama de barras
7.2.2.
Grficos de barras verticales
7.2.3.
Grficos de barras horizontales
7.2.4.
Grficos de barras proporcionales
7.2.5.
Grficos de barras comparativas
7.2.6.
Histogramas
7.2.7.
Grficos de lneas
7.2.8.
Grficos circulares
7.2.9.
Grficos de reas
7.2.10. Cartogramas
7.2.11. Grficos mixtos
7.2.12. Otros grficos
7.2.12.1. Los dispersogramas
7.2.12.2. Pictogramas
7.3.
Cuadro estadistico
7.3.1.
Estructura de un cuadro estadistico
CAPITULO 8
1.1 Sumatorias
1.2 Medidas de tendencia central
1.2.1
La media aritmetica
1.2.1.1 Propiedades de la media aritmtica
1.2.1.2 Ventajas y desventajas de la
aritmtica
1.2.1.3 Calculo de la media aritmetica
1.2.2
Media aritmtica ponderada
1.2.2.1 Media geomtrica
1.2.2.2 Media armnica
1.2.3
La mediana
1.2.3.1 Caracteristicas de la mediana
1.2.3.2 Calculo de la mediana:
1.2.4
La moda
1.2.4.1 Caracteristicas
1.2.4.2 Calculo de la moda

media

CAPITULO 9
9.1 La dispersin.
9.2 Medidas de dispersion
9.2.1
El rango
9.2.2
La desviacion media
9.2.2.1 Caracteristicas
9.2.2.2 Calculo de la desviacion media
9.2.2.3 Calculo de la desviacion media para datos
agrupados
9.2.3
La varianza
9.2.3.1 Propiedad de la varianza
9.2.3.2 Varianza corregida
9.2.4
La desviacion estandar
9.2.4.1 Calculo de la desviacion estandar
9.2.4.2 Calculo de la desviacion estandar para datos
agrupados
9.2.5
El coeficiente de variabilidad
9.2.6
Coeficiente de asimetria
9.2.7
Coeficiente de curtosis:
CAPITULO 10
10. Medidas de posicin no central (cuantiles)
10.1. Cuartiles ( q )
10.2. Quintiles
10.3. Deciles ( di)
10.4. Centiles o percentiles ( pi )
CAPITULO 11:
11. Numeros indice
11.1. Definicion
11.2. porqu usar nmeros indices?
11.3. Tipos de numeros indices

11.4.
11.5.
11.6.
11.7.

Precios relativos
ndice de agregados no pesados.
ndice de agregados pesados.
Problemas en la construccin y en el uso de
nmeros ndice.

CAPITULO 12:
12. Regresin lineal simple
12.1. El coeficiente de correlacin lineal

CAPITULO 1:
2. INTRODUCCION
Hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc, no
nos aborde diariamente con cualquier tipo de informacin estadstica sobre accidentes de
trfico, ndices de crecimiento de poblacin, turismo, tendencias polticas. Esta idea es la
consecuencia del concepto popular que existe sobre el trmino y que cada vez est ms
extendido debido a la influencia de nuestro entorno. La estadstica se suele pensar en una
relacin de datos numricos presentada de forma ordenada y sistemtica.
La estadstica es un instrumento de investigacin. Puede ser en gentica, mercadeo, nutricin,
agronoma, etc. Es el campo de la investigacin no el instrumento el que debe proporcionar los
"porqu" del problema de investigacin. A veces este hecho se pasa por alto y los usuarios
olvidan que tienen que pensar, que la estadstica no puede pensar por ellos
La estadstica generalmente se ocupa de reunir, organizar y analizar datos numricos y as
mismo ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones.
El planeamiento estadstico y la evaluacin de la investigacin contribuyen a los avances
tecnolgicos en el cultivo y procesamiento de alimentos; el control estadstico de calidad de los
productos manufacturados; hace confiables los equipos automticos y elctricos.
Ayuda
a los encuestadores a recolectar datos para determinar las preferencias de
esparcimiento del pblico. Proporciona informacin para el estudio del impacto ambiental y
ayuda a las exigencias gubernamentales como por ejemplo para que la industria farmacutica
demuestre que un producto es benfico y no solo inofensivo.

1.9 BREVES DATOS HISTRICOS RELACIONADOS CON LA ESTADISTICA


La estadstica, se podra decir que se realiza desde tiempo atrs, por ejemplo desde 3.000 aos
antes de Cristo, se tienen noticias de los primeros censos hechos a la poblacin, en la antigua
Babilonia, Persia, Egipto y China, se elaboraban censos de las propiedades de los habitantes
con fines impositivos.
El mismo Moiss, que existi en
los siglos XV XIV antes de
Cristo, y que era profeta y
legislador hebreo, levant un
censo de su pueblo en el desierto,
segn lo seala la Biblia. Y en
Grecia, el censo era algo muy
usual en sus principales ciudades
democrticas. Tambin Servio
Tulio, que se supone vivi entre
578 y 534 antes de Cristo, y fue el
sexto Rey de Roma, orden que
se llevara a acabo un censo cada
5 aos, y el fin era el de planificar
los impuestos, preparar elecciones y la conscripcin militar. Como ha de recordarse, San Jos y
la Virgen Mara iban a Beln a inscribirse en el segundo de estos censos, cuando naci Jess,
segn sus discpulos Lucas, y Mateo, ya en la poca del Emperador Augusto.
El primer censo en Amrica fue llevado a cabo por los Incas, y lo ms probable es que haya
sido en la poca de Pachactec Yupanqui, Inca que fue llamado El Reformador del Mundo
quien organiz el Imperio Incaico econmica y socialmente.
El matemtico y filsofo italiano Girolano Cardano, que vivi entre los aos 1510 y 1576,
realiz los primeros estudios sobre probabilidades, y fueron publicados en su trabajo Iber de
Ludo Alea que quiere decir Manual para tirar los dados.
Felipe II (1575 1578) fue el Rey de Espaa, e hizo levantar un censo en el Nuevo Mundo de
sus dominios, en el ao de 1576.
Gottfried Achenwall (Desde 1719 hasta 1772), un reconocido economista y profesor
universitario, de origen alemn, profundiz en estudios que dieron origen a la Estadstica
Inductiva.
Juan Pedro Sussmilchi, que vivi desde 1707 hasta 1767, y fue un brillante matemtico,
estadstico y telogo alemn, perfeccion los estudios demogrficos, al mismo tiempo que
Antonio Deparcioux, que vivi entre 1703 y 1768 y fue un gran matemtico francs, aplic la
Estadstica para obtener las primeras Tablas de Mortalidad, con lo cual se dio inicio el
prspero negocio del seguro de vida.
Bernoulli (1654-1705) matemtico suizo, escribi Ars Cojetandi que quiere decir en espaol,
el Arte de Conjeturar, publicado pstumamente en 1713 y formula la Ley de los Grandes
Nmeros, primer paso hacia la Estadstica Matemtica.
El Marqus Pedro Simn de Laplace que vivi desde 1749 hasta 1827, matemtico y
astrnomo francs, anuncia su Teora Analtica de las Probabilidades en 1812, y este fue otro
gran impulso a la Estadstica Matemtica.
Lambert Jacques Quetelet (1796-1874), gran astrnomo y matemtico de origen belga, aplic
el mtodo estadstico al estudio de la Economa Social (Caractersticas fsicas, intelectuales y
morales de los humanos); creando as la Sociometra.
Pafnuti Lvovich Chevyshev (1821-1884) crea la Desigualdad de Chevyshev, que es de gran
utilidad como herramienta terica, aplicable a las distribuciones de medias y varianzas finitas.
Gregor Johann Mendel, (1822-1884), conocido botnico austraco, que experiment con 34
variedades de arvejas, durante un lapso de 2 aos, descubre y enuncia, en el ao de 1865, las
Leyes de Mendel; leyes estadsticas que rigen la herencia y la hibridacin de los vegetales, lo
cual es considerado el punto de partida de la biometra.

El cientfico ingls, Francis Galton


(1822-1911), primo de Darwin y
creador de la Eugenesia, de nuevos
mtodos antropomtricos, de la
moderna teora de la Estadstica y su
aplicacin a la Sociometra y a la
Biometra. Ide los deciles y centiles.
Karl
Pearson
(1857-1936),
matemtico ingls, crea el mtodo de
los momentos, la Prueba de chi
cuadrada, los conceptos de Curva
normal, y de Desviacin normal.
Publica sus trabajos bajo el epgrafe
de Contribucin a la teora matemtica
de la evolucin, y en total, da un gran
impulso a las tcnicas usadas en estudios de fenmenos sociales (Sociometra) y biolgicos
(Biometra).
Hoy en da la Estadstica ha llegado a tal grado de perfeccionamiento y especializacin, que casi
no existe disciplina cientfica, o tcnica, de investigacin, control o planificacin, en la cual no se
apliquen los mtodos estadsticos como una herramienta de trabajo valiossima e insustituible.
1.10

ETIMOLOGIA DEL TRMINO ESTADSTICA

En sus comienzos, la Estadstica slo era aplicada al estudio y valuacin numrica de


manifestaciones inherentes al ESTADO: De all sale nombre, del vocablo latino status, que fue
utilizado por primera vez en Alemania, en el siglo XVII especficamente., sin embargo algunos
autores indican que proviene de la voz griega STATERA (balanza), del Latn STATUS
(situacin) o del Alemn STAAT (estado).
1.11

DEFINICIONES DE ESTADISTICA

La ESTADISTICA es la ciencia que le facilita al hombre el estudio de datos masivos, para de


esa manera sacar conclusiones valederas y efectuar predicciones razonables de ellos; y as
mostrar una visin de conjunto clara y de ms fcil apreciacin, as como para describirlos y
compararlos. Veamos algunas definiciones:
MENDOZA & MENDOZA
Es La Ciencia de la toma de decisiones, basndose en una informacin que es consecuencia
de la aplicacin de Mtodos Estadsticos..
GERARDGALOT
La Estadstica es un mtodo de descripcin cuantitativa que utiliza el nmero como soporte
objetivo
WILLIAM STEVENSON
La estadstica consiste en organizar, resumir y simplificar, en trminos generales informacin
que a menudo es bastante compleja.
YA-LUN-CHOU
La estadstica es un mtodo de toma de decisiones frente a la incertidumbre.
STHEDEN SHAO
La estadstica est desarrollada para tratar con datos numricos o cuantitativos
SOKAL/ROLHF
La estadstica es un estudio cientfico de datos numricos basados en fenmenos naturales.
STELL/TORRIE
La estadstica es la ciencia que crea, desarrolla y aplica tcnicas de modo que pueda evaluarse
la incertidumbre de inferencias inductivas.
KENDALL Y BUCKLAND
(citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica como un valor
resumido, calculado, como base en una muestra de observaciones que generalmente, aunque
no por necesidad, se considera como una estimacin de parmetro de determinada poblacin;

es decir, una funcin de valores de muestra. "La estadstica es una tcnica especial apta para el
estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa
de observaciones de otros fenmenos ms simples llamados individuales o particulares". (Gini,
1953.
MURRAY R. SPIEGEL
(1991) dice: "La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y
analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables
basadas en tal anlisis. "La estadstica es la ciencia que trata de la recoleccin, clasificacin y
presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin,
descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954).
1.12

CLASIFICACION DE LA ESTADISTICA

En atencin a su metodologa, por sus procedimientos y alcances bien definidos, la Estadstica


la se podra clasificar brevemente en:
Estadstica Paramtrica: Es la ms poderosa siempre que se cumplan estos 3 supuestos:
a. Que los estadsticos que se estudian existan en la poblacin.
b. Que en ella estn distribuidas normalmente y
c. que el estadstico muestral da una estimacin del parmetro.
Estadstica No Paramtrica: Es aquella cuyo modelo estadstico no parte de supuestos acerca
de la poblacin, o estos son muy dbiles y operan con datos ordinales y hasta nominales.

Asimismo podemos clasificar la estadstica como


1.12.1 LA ESTADSTICA DESCRIPTIVA O DEDUCTIVA:
La estadstica descriptiva describe, analiza y representa un grupo de datos utilizando mtodos
numricos y grficos que resumen y presentan la informacin contenida en ellos. El anlisis se
limita en si a los datos organizados y no se realiza inferencia alguna o generalizacin acerca de
la poblacin de donde provienen estas observaciones.
Analiza metdicamente los datos, simplificndolos y presentndolos en forma clara; eliminando
la confusin caracterstica de los datos preliminares. Permite la elaboracin de cuadros, grficos
e ndices bien calculados; suficientemente claros, como para disipar las dudas y la oscuridad de
los datos masivos.
Ejemplo:
Estudio sobre las caractersticas socioeconmicas de los trabajadores de un Hospital, Clnica,
Empresa Minera, Empresa de Construccin, Colegio,
Universidad, Ministerio, Regin,
Municipio, etc. Donde se puede considerar los siguientes indicadores estadsticos:
Edad Promedio
Ingreso Promedio
Gasto Promedio per. cpita
Ingreso mximo e Ingreso mnimo.

Nmero promedio de personas por hogar.


% de Trab. con estudios superiores.
% de trabajadores con ms de 3 hijos.
1.12.2 LA ESTADISTICA INDUCTIVA O INFERENCIAL
Sirve extrapolar los resultados obtenidos en el anlisis de los datos y a partir de ello predecir
acerca de la poblacin, con un margen de confianza conocido. La estadstica Inferencial
apoyndose en el clculo de probabilidades y a partir de datos muestrales, efecta
estimaciones, decisiones o predicciones. Comprende aquellas tcnicas por medio de las cuales
se toman decisiones sobre una poblacin estadstica, basadas solo en una muestra observada;
se realiza a travs de muestras obtenidas previamente en un tamao adecuado y
representativo.
Provee conclusiones o inferencias, basndose en los datos simplificados y analizados;
detectando las interrelaciones que pueden unirlos, las leyes que los rigen y eliminando las
influencias del azar; llegando ms all de las verificaciones fsicas posibles.
Ejemplo:
El INEI mediante una Encuesta Nacional de Hogares muestra los siguientes resultados:
a. el 63,6% de mujeres cuentan con seguro de salud Los resultados de la Encuesta
Nacional de Hogares (ENAHO) correspondiente al segundo trimestre de 2010 muestran
que el 63,6% de la poblacin femenina y el 59,5% de la poblacin masculina se encuentran
afiliados a algn tipo de seguro de salud.
b. Disminuye poblacin masculina y femenina con problemas de salud no crnicos En
el periodo de anlisis, el 37,3% de la poblacin masculina y el 40,1% de la poblacin
femenina report padecer problemas de salud no crnicos (sntoma, malestar, enfermedad
o accidente) en las ltimas cuatro semanas anteriores a la ejecucin de la encuesta; este
resultado represent una disminucin de -0,4 y -0,8 puntos porcentuales respectivamente,
con relacin a similar periodo de 2009.
1.13

INDICADOR ESTADISTICO

Es el dato numrico, resultado de un proceso que cuantifica una caracterstica de la Poblacin o


una muestra. Un indicador es una herramienta para clarificar y definir, de forma ms precisa,
objetivos e impactos, son medidas verificables de cambio o resultado, diseadas para contar
con un estndar contra el cual evaluar, estimar o demostrar el progreso con respecto a metas
establecidas, facilitan el reparto de insumos, produciendo productos y alcanzando objetivos.1
Pueden ser cualitativos o cuantitativos, Ejemplos: Promedios, porcentajes, razones, tasas,
ndices, variaciones, etc.
1.14

IMPORTANCIA DE LA ESTADISTICA

Es tan importante que casi no existe actividad humana en que no est involucrada la
Estadstica. Las decisiones ms importantes de nuestra vida se toman con base en la aplicacin
de la Estadstica. Pongamos algunos ejemplos.
La estadstica es de gran importancia en la investigacin cientfica debido a que:
1. Permite una descripcin ms exacta.
2. Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar.
3. Permite resumir los resultados de manera significativa y cmoda.
4. Nos permite deducir conclusiones generales.
La evolucin de la estadstica ha llegado al punto en que su proyeccin se percibe en casi todas
las reas de trabajo. La estadstica es parte esencial de la forma profesional, es hasta cierto
punto una parte necesaria para toda profesin.
1.15

USOS DE LA ESTADSTICA

La Estadstica se usa en casi todas las ciencias y reas del conocimiento


Es una ciencia de aplicacin prctica casi universal en todos los campos cientficos:

Organizacin de las Naciones Unidas (ONU). Integrated and coordinated implementation and follow-up of major. United Nations
conferences and summits. Nueva York, Estados Unidos de Amrica, 10 y 11 de mayo de 1999, p. 18.

En las Ciencias naturales, en la Mecnica estadstica, en Fsica cuntica, en mecnica de


fluidos o en la teora cintica de los gases, entre muchos otros campos.
En las Ciencias Sociales y Econmicas es un pilar bsico en el desarrollo de la demografa y
la sociologa aplicada
En Economa suministra los valores que ayuda a descubrir las interrelaciones entre mltiples
parmetros macro y micro econmicos.
En las Ciencias Mdicas permite establecer pautas sobre la evolucin de las enfermedades y
los enfermos, los ndices de mortalidad asociados a procesos morbosos, el grado de eficacia de
un medicamento, etc.
1.16

MALOS USOS DE LA ESTADSTICA

Se hace un mal uso de la estadstica cuando:


Se emplea datos inadecuados en los cuestionarios.
Cuando existe sesgo del usuario al no proporcionar una informacin veraz, o del
investigador cuando influye en algn resultado.
El uso de supuestos falsos, o hiptesis mal formuladas.
El uso de comparaciones impropias, respecto a porcentajes, empleando diferente base.
Los errores matemticos, generalmente los errores de clculo y redondeo, ante lo cual es
importante trabajar con la mayor cantidad posible de cifras o decimales.

CAPITULO 2:
5. LA ESTADISTICA Y LA INVESTIGACIN CIENTFICA
La investigacin es la bsqueda sistematizada y objetiva de nuevos conocimientos. Investigar es
un proceso de buscar, indagar o pesquisar. El mtodo cientfico, comprende la realizar a
investigacin en forma sistematizada y objetiva, organizada y coherente.
La estadstica permite probar hiptesis planteadas por el experimentador, determina
procedimientos prcticos para estimar parmetros que intervienen en modelos matemticos y de
esa manera construir ecuaciones empricas.
No existe investigacin, proceso o trabajo encaminado a obtener informacin cuantitativa en la
que la estadstica no tenga una aplicacin. La estadstica no puede ser ignorada ningn
investigador, an cuando no tenga ocasin de emplear la estadstica aplicada en todos sus
detalles y ramificaciones.

5.1 ETAPAS DE UNA INVESTIGACION ESTADISTICA


5.1.1

LA PLANIFICACIN

La
planificacin
no
se
realizar
adecuadamente si antes no se ha definido
claramente la naturaleza y objetivos de la
investigacin as como la evaluacin de los
conocimientos que se tienen sobre el
problema y de las hiptesis que se han
formulado para explicarlo.
1 Paso: Planteamiento del problema.
Equivale a preguntarse: Qu necesidades
o inconvenientes hay?
2 Paso: Determinar los objetivos de la
investigacin. Equivale a preguntarse: :
Qu se va realizar en el estudio?
2-a) Paso: Formulacin de Hiptesis.
Las hiptesis son afirmaciones que se
verificaran o rechazaran en el transcurso
del desarrollo de la investigacin. Su
formulacin debe ser clara puesto que el
diseo, planificacin y desarrollo de la
investigacin dependern de las hiptesis
que se van a probar.
3 Paso: Fundamento e importancia de la investigacin. Equivale a preguntarse: : Para
que servir la investigacin?
4 Paso: Unidad de anlisis y variables. A quin o qu voy a analizar? (mnima unidad de
investigacin) Qu datos se debe obtener de ellos?.
5 Paso: Identificacin de las Fuentes de Informacin. Si se necesitara realizar encuestas o
entrevistas, recurrir a archivos (registros continuos) o ambos.
5.1.2

RECOLECCIN DE DATOS.

En segundo lugar, se considera la ejecucin de la investigacin, la misma que implica la


recoleccin, clasificacin y anlisis de la informacin recogida segn lo planificado.
Los principales puntos que deben considerarse al recoger la informacin son:
Los errores que pueden cometerse en la recoleccin de los datos.
Las ventajas y limitaciones de los diversos mtodos empleados en la recoleccin de la
informacin.
Las condiciones que deben reunir los individuos que se estudian y los procedimientos ms
pertinentes para su eleccin.

5.1.3

ORGANIZACIN DE DATOS.

Etapa que implica la revisin cuidadosa de la informacin recogida para resumirla y presentarla
convenientemente.
Se consideran los siguientes aspectos:
Revisin y correccin de la informacin recogida etapa labor es llamada: Consistencia.
Presentacin de la informacin mediante cuadros, tablas y grficos.
5.1.4

ANLISIS E INTERPRETACIN DE RESULTADOS.

Se interpreta y compara los resultados de los indicadores estadsticos o estadgrafos.


Si el estudio fue realizado conforme a lo que se haba planificado y con los resultados a la vista
se concluir si las hiptesis ha sido verificadas o no, proponindose las recomendaciones
pertinentes.
5.1.5

RESULTADOS Y CONCLUSIONES.

Finalmente exponer los principales resultados de acuerdo a los objetivos.


importante, si se acepta o se rechaza las hiptesis.

Indicar lo ms

5.2 EL PENSAMIENTO ESTADISTICO


El profesional relacionado con la Estadstica debe de preocuparse permanentemente en
registrar informacin sobre las caractersticas que le permitan conocer los factores que se
relacionan o inciden en la variabilidad del servicio y as estar en condiciones de implementar
acciones dirigidas a mejorar la calidad del servicio que ofrece.
RECUERDE: Ningn mtodo estadstico puede corregir los defectos por una inadecuada
seleccin del problema que se investiga, o por una mala recoleccin de Datos. Una
investigacin que empieza mal, con seguridad termina mal.
CON DATOS DE MALA CALIDAD NO SERA POSIBLE DAR RESPUESTA ADECUADA A UN
PROBLEMA CIENTIFICO
EJERCICIOS
1.

2.

3.

4.

Proponer un tema de investigacin. Luego


formular el problema a investigar considerando
las variables a considerar, los indicadores para
cada variable
Las fuentes de ideas para una investigacin
pueden provenir de:
a. Peridicos, conversaciones personales,
presentimientos.
b. Clculos matemticos.
c. Al establecer probabilidades.
d. Al aplicar una formula para lograr los
resultados de un proyecto.
Al realizar una investigacin se revisan las
investigaciones, estudios y trabajos anteriores
sobre el tema, estos aspectos reciben el nombre
de :
a. El problema.
b. La justificacin.
c. Marco terico.
d. Antecedentes.
Al plantear el problema de investigacin se
estructura formalmente la idea de investigacin
para este propsito se necesita desarrollar ciertos
elementos como:

a.
b.
c.
d.

5.

Los objetivos y preguntas de investigacin se


deben caracterizar por:
a.
b.
c.
d.

6.

Los objetivos, las preguntas de investigacin


y la justificacin de sta.
El marco terico La metodologa
La metodologa y los antecedentes
El ttulo de la investigacin, y los parmetros
para el anlisis de los resultados.

Ser congruentes entre si e ir en la misma


direccin.
Plantearse en tiempo presente.
Ser cortos, precisos
La influencia del modelo psicolgico que
maneja el investigador

Los objetivos en una investigacin tienen el


propsito de:
a. Establecer las pretensiones en una
investigacin y sirven de gua durante todo el
proceso.
b. Hablan sobre la importancia del estudio.
c. Definir la metodologa del trabajo
d. Delimitar el estudio.

CAPITULO 3:
6. POBLACIN MUESTRA Y MUESTREO.
Imagina por ejemplo que tu clase ha sido seleccionada como la muestra de una poblacin. El
estudio que se vaya a realizar podra ser de diferentes temas, como los siguientes:
La opinin sobre la posibilidad de organizar movidas alternativas en tu ciudad, y sobre
las propuestas de actividades a realizar en dicha movida.
Un sondeo sobre la valoracin de los diferentes lderes polticos.
La opinin sobre el destino de un posible viaje de fin de curso de los alumnos de tu nivel.
Crees que tu clase sera una buena muestra para cualquiera de estos casos?
La respuesta es que, por
ejemplo, para el segundo
caso, los alumnos de una
clase no son la muestra
adecuada. Para el primer
caso, es razonable pensar
que pueden
aportar
informacin
interesante,
aunque la muestra puede
resultarpequea y podra
faltarle
informacin
(chicos de otras edades,
de otros barrios...), mientras que para el tercer caso, la muestra puede ser muy adecuada. Es
por tanto muy importante la eleccin de una tcnica de muestreo que nos asegure que la
muestra escogida es adecuada para el estudio que queremos realizar.
3.7. POBLACIN
El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal,
es un agregado de datos individuales, personas, objetos, cosas, etc. acerca de las cuales se
desea informacin. Se relaciona con el censo. Una poblacin se precisa como un conjunto finito
o infinito de personas u objetos que presentan caractersticas comunes acerca de los cuales
intentamos sacar conclusiones.
La caracterstica de los datos poblacionales se les denomina "PARAMETROS".
La poblacin, o el universo, est formado por la totalidad de los elementos que se desean
estudiar, ejemplos podran ser: La poblacin total del Per, los alumnos cursantes en las
universidades del pas, la produccin de toda una industria, a cosecha de un ao dado, el
rendimiento de una raza de ganado, entre otros.
Ejemplo:
Las edades de todos los habitantes del Per.
El nivel de ingresos de las personas de la provincia de Ilo.
La cantidad de cobre extrado en el mundo.
El nmero de microbios existentes en Ocano Pacfico.
Los miembros del Colegio de Ingenieros de La regin Moquegua

Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se
dificulte en cuanto al trabajo, tiempo y costo necesario para hacerlo. Si el nmero de elementos
que integra la poblacin es muy grande, se puede considerar a esta como una poblacin
infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es
aquella que est formada por un limitado nmero de elementos.
3.1.2.

CENSO:

Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres
componentes de una poblacin. Para Levin & Rubin (1996) "Algunas veces es posible y prctico
examinar a cada persona o elemento de la poblacin que deseamos describir. A esto lo
llamamos una numeracin completa o censo. Utilizamos el muestre cuando no es posible contar
o medir todos los elementos de la poblacin.
Si es posible listar (o enumerar) y observar cada elemento de la poblacin, los censos se utilizan
rara vez porque a menudo su compilacin es bastante difcil, consume mucho tiempo por lo que

resulta demasiado costoso.

3.8. MUESTRA
Una muestra representativa contiene las caractersticas relevantes de la poblacin en las
mismas proporciones que estn incluidas en tal poblacin. Los expertos en estadstica
recogen datos de una muestra utilizan esta informacin para hacer referencias sobre la
poblacin que est representada por la muestra. En consecuencia muestra y poblacin son
conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de
ese todo
El estudio de muestras es ms
sencillo que el estudio de la
poblacin completa; cuesta menos
y lleva menos tiempo. Por ltimo se
aprobado que el examen de una
poblacin entera todava permite la
aceptacin
de
elementos
defectuosos, por tanto, en algunos
casos, el muestreo puede elevar el
nivel de calidad.
La caracterstica de los datos
muestrales vienen a ser los
"ESTADIGRAFOS".
Existen 3 razones principales para extraer una muestra:
1. lleva menos tiempo que un censo completo
2. es menos costoso
3. es ms gil y eficiente que obtener el completo de la poblacin objeto.
Ejemplo:
Las edades de los habitantes del Departamento de Lima.
El nivel de ingresos de los trabajadores del sector salud.
La cantidad de cobre extrado en el Departamento de Moquegua.
El estudio realizado a 50 miembros del Colegio de Ingenieros de la Regin Moquegua
Adems las muestras pueden ser:
Muestras grandes:
Son consideradas aquellas cuyo nmero de sujetos (N) es superior a 30. Cuando ms
grande sea una muestra ms significativos sern los resultados obtenidos de ella en relacin
con la poblacin.
Muestras pequeas:
Son consideradas aquellas cuyo nmero de sujetos (N) es inferior a 30. El problema de las
muestras pequeas es que debido a su escaso nmero de representantes de la poblacin a
estudiar, puede ofrecer unos datos menos representativos de dicha poblacin.
3.8.1.

EL TAMAO DE LA MUESTRA

El tamao de la muestra depende de la precisin que se


quiera conseguir en la estimacin que se realice a partir
de ella., resulta sorprendente cmo, con muestras
notablemente
pequeas,
se pueden conseguir
resultados suficientemente precisos. Por ejemplo, con
muestras de unos pocos miles de personas se pueden
estimar con muchsima precisin los resultados de unas
votaciones en las que participarn decenas de millones
de votantes
El tamao de la muestra est relacionado con:
El tipo de muestreo empleado: cada tipo tiene una expresin para calcular el tamao de la
muestra que debe emplearse para obtener estimaciones con un determinado grado de error.

La dispersin o varianza del fenmeno investigado: a menor variabilidad menor tamao


de la muestra, al extremo que si la variabilidad es nula, es decir, todo el fenmeno es
homogneo (anlisis de sangre, potabilidad del agua) basta con una muestra unitaria.
Con la fiabilidad mnima que se pretenda conseguir (error de muestreo y nivel o coeficiente
de confianza).
Algunos autores manifiestan que la muestra debe ser proporcional a la poblacin, otros
estadsticos mencionan cantidades o porcentajes mnimos o mximos, criterios que son
relativos ya que la decisin del tamao de muestra depende de otros elementos cientficos,
motivo por el cual se sugiere tres formas bsicas para hallar el tamao de muestra de una
Poblacin:
3.8.1.1. PARA DATOS CONTINUOS.

utilizando la formula:

Donde:
z = Valor de la tabla de la distribucin normal de acuerdo al nivel de
alfa (significancia)
S = Desviacin estndar de las observaciones de referencia
d = Error de muestreo
Si no se cumple, pasamos a una tercera fase: Obtener el tamao de la muestra segn la
siguiente frmula:
Para la aplicacin de esta frmula se necesita tener datos de referencia.
Puede ser retrospectivo (sucesos ocurridos anteriormente).
Ejemplo.: si se quiere realizar un estudio en alumnos repitentes. Para
hallar el tamao de muestra, se necesita conocer el nmero de alumnos
repitentes de los aos pasados.
Ejemplo: La Consejera de Trabajo planea un estudio con el inters de conocer el promedio de
horas semanales trabajadas por las mujeres del servicio domstico. La muestra ser extrada de
una poblacin de 10000 mujeres que figuran en los registros de la Seguridad Social y de las
cuales se conoce a travs de un estudio piloto que su varianza es de 9.648. Trabajando con un
nivel de confianza de 0.95 y estando dispuestos a admitir un error mximo de 0,1 (10%), cul
debe ser el tamao muestral que empleemos?.
Buscamos en las tablas de la curva normal el valor de
confianza elegido:
1.-

que corresponde con el nivel de

= 1.96 y seguimos los pasos propuestos arriba.

2.- Comprobamos que no se cumple


(3706 - 1); 10000 < 13730730

, pues en este caso 10000 < 3706

3.-

3.8.1.2. PARA PROPORCIONES: Utilizando la formula


Dnde:
z =
de alfa
P=
q=
d=

Valor de la tabla de la distribucin normal de acuerdo al nivel


Proporcin de inters del estudio
Complemento de la proporcin del inters
Error de muestreo

q=1-p

Para la aplicacin de esta frmula se necesita conocer la proporcin de inters, este dato
generalmente se obtiene realizando una encuesta piloto. En el caso de que no se proporcionara

se asume el mismo valor de p y de q; es decir 0.5


Para calcular el tamao de muestra para la estimacin de
proporciones poblacionales hemos de tener en cuenta los
mismos factores que en el caso de la media. La frmula
que nos permitir determinar el tamao muestral es la
siguiente:
donde
: z correspondiente al nivel de confianza elegido
P: proporcin de una categora de la variable
e: error mximo
N: tamao de la poblacin
Ejemplo: Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de
estimar la proporcin de mujeres que trabajan diariamente 10 horas o ms. De un estudio piloto
se dedujo que P=0.30, fijamos el nivel de confianza en 0.95 y el error mximo 0.02.

3.8.1.3. METODO FISHER-ARKIN-COLTON


Si no tenemos datos de referencia para obtener "S' o una proporcin, podemos utilizar la tabla
de tamao de muestra que plantean FISHER-ARKIN-COLTON (Anexo No 01). Si La poblacin
de estudio N es menor de 500 se recomienda utilizar el 40% de la poblacin.

N (poblacion)
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
6000
7000
8000
9000
10000
15000
20000
25000
50000
100000
mas de 100000

NIVEL DE SIGNIFICANCIA( error de


muestreo)
1%
2%
3% 4% 5% 10%
222 83
385 286 91
638 441 316 94
714 476 333 95
1250 769 500 345 96
1364 811 520 353 97
1458 843 530 359 98
1538 870 541 364 98
1607 891 546 367 98
1667 909 556 370 98
1765 938 566 375 99
1842 959 574 378 99
1905 976 580 381 99
1957 989 584 383 99
5000 2000 1000 588 385 99
6000 2143 1034 600 390 100
6667 2222 1053 606 392 100
7143 2273 1064 610 394 100
8333 2381 1087 617 397 100
9091 2439 1099 621 398 100
10000 2500 1111 625 400 100

Si N < 500 considerar 40% de la poblacion

INTERPOLACION
Cuando la poblacin es por ejemplo 1800 es decir no existe este valor entonces se procede
a interpolar de la siguiente manera:
A =
1500
a
=
316
N =
1800
n
=
No conocemos

2000

333

A y B son valores de la poblacin inferior y superior de la tabla de FISHER-ARKINCOLTON, en relacin a n= 1800, A UN NIVEL DE SIGNIFICANCIA DE 5%.
a y b son valores de la muestra inferior y superior de la tabla de FISHER -ARKIN-COLTON
en relacin a "n" que no conocemos a un nivel de significancia de 5%.
A
B
a
b
----------------------=
--------------------N
B
n
b
Remplazando
1500 - 2000
316
333
-------------------------=
------------------------1800 - 2000
n
333
Despejando "n" tenemos

326.2

326.

EJEMPLO
Clculo del tamao de la muestra en el muestreo aleatorio simple
Factores de la muestra:
El error absoluto que se est dispuesto a admitir en las estimaciones:
error = Kestimador (1).
(estimador) es la desviacin tpica del estimador.
(K) depende de la distribucin de los elementos de la poblacin y del grado de confianza
requerido; en una distribucin normal, (K) es 1,96 para un nivel de confianza del 95% y de
1,64 para el 90%.
La varianza o la desviacin tpica de los parmetros a estimar.
El nivel de confianza de las estimaciones.
Los lmites de confianza vienen dados por la expresin del estimador Kestimador, quedando
definidos los lmites de confianza: estimador error.
Dependiendo de la variable objetivo de la investigacin, el tamao de la muestra se determina
sustituyendo en (1) la varianza del estimador para la media, la proporcin y el total
As, el tamao de la muestra (n) ser:
NK2S2
n=
Para estimar una media:
Ne2 + K2S2
K2PQN
n=
Para estimar una proporcin:
2
e (N - 1) + K2PQ
N2K2S2
n=
Para estimar un total:
e2 + NK2S2
(e) es el error absoluto fijado de antemano.
Ejemplo:
En una empresa con 3000 clientes, se quiere saber:
1. El porcentaje de clientes que est satisfecho con las relaciones comerciales, admitiendo un
error del 3%.
2. Las compras medias de una determinada ruta en un mes, admitiendo un error de 1 dlar.
3. El total de compras realizadas en un mes, admitiendo un error de 5000 dolares.
De investigaciones anteriores se cree que el porcentaje de clientes satisfecho es del 10%, y que
la desviacin tpica de la ruta analizada es de 10 dlares y la de las compras totales de 20
dlares.
Suponiendo que los valores se distribuyen normalmente en la poblacin, para un nivel de
confianza del 95%, el tamao muestral ser:
1,962 10 90 3000
Para la proporcin:
n=
= 341
32(3000 - 1) + 1,962 10 90
3000 1,962 102
Para la media:
n=
= 341
3000 12 + 1,962 102
2
2
2
3000 1,96 20
Para el total:
n=
=468
50002 + 3000 1,962 202

EJERCICIOS
Determine la poblacin y la muestra en cada uno de
los siguientes casos.

1.

Se desea estudiar la opinin del estudiante del


Colegio MCC sobre la calidad del servicio de
fotocopiado en este ao.

2.

Se desea obtener la evolucin de las


exportaciones globales de Per a los pases de
Centroamrica durante la ltima dcada.
3. Se desea investigar la relacin entre los
estudiantes becados y su rendimiento acadmico.
4. Se desea conocer la opinin de los ciudadanos del
pas ante el aumento en la canasta bsica de los
alimentos del 2013.
5. Se quiere conocer el volumen de trnsito en la
avenida Andrs Avelino Cceres los sbados por
la noche.
6. Se quiere obtener informacin sobre los hbitos de
compra de los turistas en el periodo de verano.
7. Se quiere obtener informacin sobre los hbitos de
compra de los residentes de la Pampa Inalmbrica
en el mes de diciembre.
8. El Seguro Social necesita conocer la proporcin de
nios que ocupan una segunda dosis de vacunas
durante el curso lectivo del 2013, para preparar
una campaa masiva por todo el pas.
9. Una empresa farmacutica desea conocer los
efectos secundarios que produce en los adultos
que padecen alergia nasal, el uso de una pldora
que pretender lanzar al mercado. Para tal efecto
realizo un estudio en los hospitales del centro de la
ciudad capital durante el ao 2013.
10. Se desea investigar los hbitos de alimentacin y
su relacin con el nivel socioeconmico de las
personas que trabajan en ambos lado de la
frontera.
11. Se desea conocer la opinin de las personas que
consumen pan marca shiavatta, durante el mes
pasado.
12. En una fabrica de envases, se desea estimar que
porcentaje de estos salen defectuosos. Para esto

13.

14.

15.

16.

17.

18.

19.

20.

se analizaron los envases producidos por la


fbrica en una hora.
Un colegio de la Provincia de Ilo desea conocer la
condicin socioeconmica de todos sus alumnos,
para lo cual se decidi pasar una encuesta a
estos.
El Ministerio de Transporte, para estimar en qu
medida es utilizada una autopista recin
construida, decidi estudiar la cantidad de
automviles que transitan por ella en una semana.
Una compaa aseguradora desea saber qu
cantidad dinero recibe anualmente por concepto
de seguros, para lo cual utiliza el monto anual que
pagan todos sus asegurados y los suma.
En una lechera se desea conocer la produccin
de leche, para ello estudia la cantidad de leche
producida por la vacas en una semana.
Una empresa quiere conocer la audiencia
televisiva en la programacin nocturno (horario de
6 a 11pm) de los adultos en la Zona de Ciudad
Nueva, llamando por telfono a cada casa
habitacin.
Una empresa de consultora desea hacer un
estudio sobre las enfermedades de transmisin
sexual (ETS) a los jvenes del Colegio Daniel
Becerra Ocampo entre 12 y 18 anos.
El Ministerio de Educacin quiere conocer el tipo
de msica que ms escuchan los alumnos de la
zona central del pas. Se concentra en los jvenes
entre 13 y 17 aos de algunos colegios de la zona
geogrfica escogida.
Una empresa tabacalera quiere saber el hbito de
consumo de los nios entre 7 y 13 aos, para
dirigir su prxima campaa de sus productos en
determinado pas.

TAMAO DE MUESTRA
1.

2.

3.

4.

5.

Se desea realizar una investigacin para estimar


el peso medio de los hijos de madres fumadoras.
Se admite un error mximo de 50 gr, con una
confianza del 95% . Si por estudios se sabe que
la desviacin tpica es de 400 gr Qu tamao
mnimo de muestra se necesita en la
investigacin?
La Gerencia de una empresa manufacturera
desea determinar el tiempo promedio requerido
para realizar una determinada operacin manual.
Se precisa tener una confianza de 0.95 de que el
error en la estimacin no exceda en dos minutos.
a. Que tamao de muestra se necesita si la
desviacin del tiempo necesario para realizar
la operacin ha sido estimada por un experto
en estudios de tiempos y movimientos en 10
minutos.
b. Que tamao de muestra se necesita si la
desviacin estndar del tiempo necesario
para realizar la operacin ha sido estimada
por un experto en tiempos y movimientos en
16 minutos?
Queremos ajustar una mquina de refrescos de
modo que el promedio del lquido dispensado
quede dentro de cierto rango. La cantidad de
liquido vertido por la mquina sigue una
distribucin normal con desviacin estndar 015
decilitros. Deseamos que el valor estimado que se
vaya a obtener comparado con el verdadero no
sea superior a 02 decilitros con una confianza del
95%.De qu tamao debemos escoger la
muestra?(Sol.
N=217).
Es necesario estimar entre 10.000 establos, el
nmero de vacas lecheras por establo con un error
de estimacin de 4 y un nivel de confianza del
95%. Sabemos que la varianza es 1.000.
Cuntos establos deben visitarse para satisfacer
estos requerimientos? (Sol. Como sabemos que
hay 10.000 establos, tendremos que usar la
frmula en la que interviene el tamao de la
poblacin y obtenemos n=235).
Una mquina llena cajas con cierto cereal. El
supervisor desea conocer con un error de

estimacin de mximo 01 y un nivel de confianza


del 90%, una media estimada del peso. Como la
varianza era desconocida se procedi a escoger
una muestra piloto. Los resultados fueron los
siguientes: 1102, 1114, 1078, 1159, 1158,
1119, 1171, 1127, 1093, 1094. Cuntas cajas
debe escoger para que se cumplan los requisitos
propuestos?(Sol. Debemos tomar la varianza
estimada y al ser n<30 el valor de t, al sustituir en
la frmula obtenemos n=34).
6.

Se desea conocer el peso promedio de una


determinada clase de pescado con un error de
estimacin de 002 y con un nivel de confianza del
99%. Por datos anteriores se sabe que el peso
mnimo es 148 libras y el mximo es de 247
libras.De qu tamao debe escoger la muestra?
Suponga que los pesos de estos pescados se
distribuyen normalmente.(Sol. No conocemos la
varianza pero la podemos estimar a partirde la
frmula A/4. Al sustituir en la frmula obtenemos
n=1015)

7.

Se desea hacer una encuesta para determinar la


proporcin de familias que carecen de medios
econmicos para atender los problemas de salud.
Existe la impresin de que esta proporcin est
prxima a 035. Se desea determinar un intervalo
de confianza del 95% con un error de estimacin
de 005. De qu tamao debe tomarse la
muestra?(Sol.
N=350 ).

8.

Un productor de semillas desea saber con un error


de estimacin del 1% el porcentaje de semillas
que germinan en la granja de su competidor. Qu
tamao de muestra debe tomarse para obtener un
nivel de confianza del 95%?(Sol. Como no
tenemos ninguna estimacin de la proporcin,
tomaremos 05 y as obtenemos n=9.604)

9.

Se desea realizar una encuesta entre la poblacin


juvenil de una determinada localidad para
determinar la proporcin de jvenes que estara a
favor de una nueva zona de ocio. El nmero de
jvenes de dicha poblacin es N=2.000.

Determinar el tamao de muestra necesario para


estimar la proporcin de estudiantes que estn a
favor con un error de estimacin de 005 y un nivel
de confianza del 95%.(Sol. Como no nos dan
ninguna estimacin de la proporcin, tomaremos
05. El valor de n es 322).
10. Luego de obtener una encuesta piloto la
proporcin de personas que tienen un auto es de
1/10
a. Que tamao muestral se requiere si se
trabaja con una nivel de significancia del 5%
y un error de estimacin del mismo valor?
b. Que pasa si no se hubiera encuestado, ni
obtenido ninguna proporcin?
11. La agencia de Publicidad C&C desea estudiar la
proporcin de estudiantes de la Ciudad de Ilo que
ven el programa Cuarto Poder.
Determnese el tamao muestral requerido para
asegurar con confianza 0.95 de que el error de
estimacin no sobrepase 0.02.
Una encuesta
realizada el mes pasado indic que el 20% de los
estudiantes de Ilo vean Cuarto Poder.
a. Cul debera ser el tamao de muestra si no
se hubiera hecho ninguna encuesta.
b. En cuanto vara n si la confianza se asume
como 99% y 90%?
12. En una isla se requiere realizar un estudio sobre
grupos
sanguneos,
se
ha
determinado
anteriormente que el porcentaje de personas del
grupo sanguneo A es del 40%. Determine el
tamao de muestra con una confianza del 95 % y
una precisin (error) del 6 %.
13. Cual debe ser el tamao de muestra si se quiere
estimar el gasto medio por familia en tiles
escolares con un error de 2 soles y el 95% de
confianza; sabiendo que la desviacin tpica en
una encuesta piloto era de 3 soles.

Consume
No consume
Total

Nios
226
471

Se solicita:
a) Complete el cuadro y determine el tamao de
la muestra.
b) Calcule la proporcin de mujeres en el total
alumnos.
c) El porcentaje de alumnos que consumen
fruta.
d) El porcentaje de mujeres que consumen fruta
sobre el total de la poblacin.

14. En una muestra preliminar de 60 personas


seleccionadas de 4300 se encuentran que 25
beben. Que tamao tendr la muestra con un
nivel de significancia del 1% para que la precisin
de estimacin de
P sea del 5%.
15. Ud. est interesado en el rendimiento acadmico
de su aula. Cul sera la Poblacin? Y cual su
muestra?
16. Se desea realizar una encuesta entre la poblacin
juvenil de una determinada localidad para
determinar la proporcin de jvenes que estara a
favor de una nueva zona de ocio. El nmero de
jvenes de dicha poblacin es N=2.000.
Determinar el tamao de muestra necesario para
estimar la proporcin de estudiantes que estn a
favor con un error de estimacin de 005 y un nivel
de confianza del 95%.(Sol. Como no nos dan
ninguna estimacin de la proporcin, tomaremos
05.
17. En una muestra preliminar de 60 personas
seleccionadas de 4300 se encuentran que 25
beben. Que tamao tendr la muestra con un
nivel de significancia del 1% para que la precisin
de estimacin de
P sea del 5%.
18. Para realizar una encuesta sobre el consumo de
un producto en una ciudad, se tom una muestra
de forma que de cada barrio se consultaba a un
nmero de personas proporcional a la superficie
ocupada por el barrio. Te parece un mtodo
fiable?. Escribe un comentario.
19. El siguiente cuadro resume los datos obtenidos a
travs de una encuesta a los alumnos de una
escuela donde asisten nios de bajos recursos,
sobre el consumo de al menos una fruta por da.

Nias
203
300

e)
f)
g)
h)
i)

Total

El porcentaje de mujeres que consumen fruta


sobre el total de mujeres.
El porcentaje de varones que fruta sobre el
total de la poblacin.
El porcentaje de varones que fruta sobre el
total de varones.
La razn de masculinidad.
Cuntos nios consumen fruta en cada 10
nios.

3.9. EL MUESTREO
El muestreo es una herramienta
de la investigacin cientfica. Su
funcin bsica es determinar
que parte de una realidad en
estudio (poblacin o universo)
debe
examinarse
con
la
finalidad de hacer inferencias
sobre dicha poblacin. El error
que se comete debido a hecho
de
que
se
obtienen
conclusiones
sobre
cierta
realidad
a
partir
de
la
observacin de slo una parte
de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una
versin simplificada de la poblacin, que reproduzca de algn modo sus rasgos bsicos.
Al elegir una muestra se espera que sus propiedades sean extrapolables a la poblacin. Este
proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un
estudio de toda la poblacin. Cabe mencionar que para que el muestreo sea vlido y se pueda
realizar un estudio fiable (que represente a la poblacin), debe cumplir ciertos requisitos, lo que
lo convertira en una muestra representativa.
El muestreo puede ser:
3.10.

TIPOS DE MUESTREO

Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de


juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos los elementos de la
poblacin tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por
muestreo de juicio se basa en la experiencia de alguien con la poblacin. Algunas veces una
muestra de juicio se usa como gua o muestra tentativa para decidir como tomar una muestra
aleatoria ms adelante. Las muestras de juicio evitan el anlisis estadstico necesario para
hacer muestras de probabilidad.
3.10.1. MUESTREO NO PROBABILISTICO
En este tipo de muestreo no se usa el azar, sino el criterio del investigador, suele presentar
grandes sesgos y es poco fiable. A veces, para estudios exploratorios, el muestreo probabilstico
resulta excesivamente costoso y se acude a mtodos no probabilsticos, an siendo conscientes
de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra
extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma
probabilidad de ser elegidos.
As tenemos:
a. Por voluntarios.- P.e. en ensayos clnicos
b. Muestreo por cuotas.- Tambin denominado en ocasiones accidental. Se asienta
generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de
los individuos ms representativos o adecuados para los fines de la investigacin.
Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el
carcter de aleatoriedad de aqul. Este mtodo se utiliza mucho en las encuestas de
opinin.
c.

Muestreo opintico o intencional.- Este tipo de muestreo se caracteriza por un esfuerzo


deliberado de obtener muestras representativas mediante la inclusin en la muestra de
grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de
zonas que en anteriores votaciones han marcado tendencias en voto.

d. Muestreo casual o incidental.- Se trata de un proceso en el que el investigador selecciona


directa e intencionalmente los individuos de la poblacin. El caso ms frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene fcil acceso (los
profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso
particular es el de los voluntarios.
e. Bola de nieve.- Se localiza a algunos individuos, los cuales conducen a otros, y estos a
otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy

frecuentemente cuando se hacen estudios con poblaciones marginales, delincuentes,


sectas, determinados tipos de enfermos, etc.
3.10.2. MUESTREO PROBABILISTICO
Se utilizan las leyes del azar. Los mtodos de muestreo probabilsticas son aqullos que se
basan en el principio de equiprobabilidad. Slo estos mtodos de muestreo probabilsticas nos
aseguran la representatividad de la muestra extrada y son, por tanto, los ms recomendables.
Hay los siguientes tipos:
3.10.2.1.

MUESTREO ALEATORIO SIMPLE.-

Para
seleccionar
los
individuos de la muestra es
fundamental
proceder
aleatoriamente.
Si
se
procede como si de un
sorteo se tratara, eligiendo
directamente
de
la
poblacin sin ningn otro
condicionante, el muestreo
se llama aleatorio simple o
irrestrictamente aleatorio.
Cada elemento de la
poblacin
tiene
igual
probabilidad de ser incluida
en la muestra. Se requiere
tener una lista detalladas de los elementos (mtodo de la rifa). Una de las desventajas es que
es posible adems cometer sesgo como por ejemplo de hombres y mujeres obtener mas
hombres. p.e.
Procedimiento.- se asigna un nmero a cada individuo de la poblacin y a travs de algn
medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios
generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario
para completar el tamao de muestra requerido. Este procedimiento, atractivo por su simpleza,
tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande.
3.10.2.2.

MUESTREO ALEATORIO SISTEMTICO

Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero
en lugar de extraer n nmeros aleatorios solo se extrae uno. Se parte de ese nmero aleatorio i,
que es un nmero elegido al azar, y los elementos que integran la muestras son los que ocupan
los lugares i,i+k,i+2k,i+3k,,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k=N/n. el nmero i
que empleamos como punto de partida ser un nmero al azar entre 1 y k.
El riesgo de este tipo de muestreo est en los casos en que se dan periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones
y los ltimos 5 son mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre
seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los
dos sexos.
Por ejemplo de N=38 alumnos se toma una muestra nFAC= 15.2 Ahora l= 38 / 15 = 2.5 = 3 .
Luego, se elige aleatoriamente el primero numero, a continuacin se escoge 15 alumnos
"saltando" a intervalos de tres nmeros hasta completar los 15.
3.10.2.3.

MUESTREO ALEATORIO ESTRATIFICADO.-

Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran
homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la
profesin, el municipio de residencia, el sexo, el estado civil, etc.).
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de
inters estarn representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarn parte de la muestra. En

ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento
detallado de la poblacin. (Tamao geogrfico, sexos, edades).
Cuando la poblacin se puede
subdividir en clases (estratos) con
caractersticas especiales, se puede
mostrar de modo que el nmero de
individuos de cada estrato en la
muestra mantenga la proporcin que
exista en la poblacin. Una vez fijado
el nmero que corresponde a cada
estrato, los individuos se designan
aleatoriamente. Este tipo de muestreo
se denomina aleatorio estratificado con
asignacin proporcional.
Procedimiento.- Primero se divide a
la poblacin en N subpoblaciones N1,
N2, Nk, a estas subpoblaciones se
llaman
Estratos.
Una
vez
determinados los estratos se extrae
una muestra de cada uno, las
extracciones deben hacerse independientemente en los diferentes estratos. As por ejemplo:
Dado una poblacin "N" con N1, N2, N3, ..Nk estratos y n1, n2, n3 .nk se halla con la
siguiente formula:
ni
=
Tamao de la muestra del estrato "i"
Ni
=
Poblacin del estrato "i"
nFAC =
Tamao de la muestra de la Poblacin en estudio
segn la tabla FAC
N
=
Poblacin en estudio.
La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y
puede ser de diferentes tipos:
Afijacin simple A cada estrato le corresponde igual nmero de elementos muestrales.
Afijacin proporcional La distribucin se hace de acuerdo con el peso (tamao) de la
poblacin en cada estrato.
Afijacin Optima Se tiene en cuenta la previsible dispersin de los resultados, de modo que se
considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no suele conocer la
desviacin.
3.10.2.4.

MUESTREO ALEATORIO POR CONGLOMERADOS.-

Es un tipo de muestreo aleatorio en el que los elementos de la poblacin se dividen en forma


natural en subgrupos. En ste muestreo, la unidad muestral no son los individuos sino un
conjunto de individuos o un grupo de elementos de la poblacin que forman una unidad, a la
que llamamos conglomerado que, bajo determinados aspectos, se puede considerar que forman
una unidad o conglomerado.
En vez de censar toda la poblacin, es necesario censar slo los conglomerados. El mtodo
consiste en seleccionar aleatoriamente un nmero de conglomerados cuya suma total de
elementos proporcione el tamao muestral buscado.
Ejemplo: Las unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales como, por ejemplo, las urnas electorales. Cuando
los conglomerados son reas geogrficas suele hablarse de muestreo por reas.

3.11.

ERROR MUESTRAL

De estimacin o estndar. Es la diferencia entre un estadstico y su parmetro correspondiente.


Es una medida de al variabilidad de las estimaciones de muestras repetidas en torno al valor de
la poblacin, nos da una nocin clara de hasta donde y con qu probabilidad una estimacin
basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo
completo.
Siempre se comete un error, pero la naturaleza de la investigacin nos indicar hasta qu

medida podemos cometerlo (los resultados se someten a error muestral e intervalos de


confianza que varan muestra a muestra). Vara segn se calcule al principio o al final. Un
estadstico ser ms preciso en cuanto y tanto su error es ms pequeo. Podramos decir que
es la desviacin de la distribucin muestral de un estadstico y su fiabilidad.
3.12.

EL ERROR ESTNDAR

Para calcular el tamao de muestra, podemos utilizar la frmula del


error estndar de la media:
Donde:
= desviacin estndar de la distribucin. n= tamao muestra x= valor esperado de la
desviacin estndar
Para determinar el tamao que debe alcanzar una muestra tenemos que tener en cuenta varios
factores: el tipo de muestreo, el parmetro a estimar, el error muestral admisible, la varianza
poblacional y el nivel de confianza.
EJERCICIOS
1.
2.
3.
4.
5.
6.

7.

Que estudia el muestreo?


Cuando decimos que el muestreo es con
reemplazamiento y sin reemplazamiento?
Explique en que consiste
el muestreo no
probabilstico de un ejemplo para cada caso
Explique en que consiste
el muestreo
probabilstico de un ejemplo para cada tipo
Que es un estrato? De un ejemplo de un estrato
de una poblacin
Di de qu forma elegiras una muestra de 20
alumnos de un aula, por muestreo aleatorio
simple, sistemtico y estratificado (cada estrato
una clase, o un nivel).
Establece un mtodo para elegir una muestra de
vecinos de una calle.

No

8.

9.

Un hospital dispone de un listado de los pacientes,


organizados por reas de atencin (neurologa,
traumatologa,....). Di que tipos de muestreo
podran realizarse, y como los haras.
Para realizar una encuesta sobre el consumo de
un producto en una ciudad, se tom una muestra
de forma que de cada barrio se consultaba a un
nmero de personas proporcional a la superficie
ocupada por el barrio. Te parece un mtodo
fiable?. Escribe un comentario.

10. Suponga que la poblacin es de 46 unidades de


observacin; determine el tamao de muestra y
seleccione las observaciones correspondientes
utilizando el muestreo adecuado. Fundamente
cada paso realizado.

SEXO

EDAD

PESO

TALLA

No

SEXO

EDAD

PESO

TALLA

16.8

51

1.62

24

17.8

60

1.7

16.7

60

1.65

25

17.8

60

1.73

16.6

60

1.68

26

17.8

56

1.68

16.6

61

1.72

27

17.8

65

1.7

16.6

53

1.63

28

17.8

54

1.63

16.6

63

1.69

29

17.8

58

1.66

16.6

49

1.67

30

17.7

54

1.7

16.6

49

1.68

31

17.7

64

1.7

16.5

58

1.69

32

17.7

47

1.65

10

16.5

51

1.64

33

17.6

51

1.66

11

16.5

47

1.63

34

17.6

55

1.71

12

16.4

53

1.64

35

17.6

56

1.67

13

16.4

64

1.73

36

17.1

55

1.64

14

16.4

62

1.72

37

18.6

70

1.7

15

16.4

56

1.65

38

18.6

55

1.67

16

16.4

52

1.68

39

18.5

60

1.63

17

16.3

53

1.64

40

18.5

56

1.72

18

16.3

62

1.72

41

18.5

65

1.63

19

16.3

54

1.67

42

18.4

57

1.72

20

16.3

55

1.65

43

18.4

56

1.72

21

16.3

54

1.63

44

18.4

51

1.67

22

16.2

52

1.66

45

18.4

55

1.71

23

16.1

48

1.6

46

18.4

54

1.7

11. Dados los siguientes datos


15
20
20
10
15
45
50
10

40
25

15
25
35

25
50

25
40
30

20
10
10

15
30
45

10
25
10

15
30
25

40
55
70
25
30
45
40
50
55
10
43
25
Seleccione una muestra de esta poblacin utilizando alguna tcnica de muestreo.
Seleccione el tamao de una muestra de esta poblacin mediante un muestreo aleatorio sistemtico.

60

12. El Censo del ao 2009 del INE muestra que en ILO el 10,5% de los residentes tienen ms de 60 aos. Para
verificar un sistema de muestreo por telfono se llaman a 200 residencias elegidas al azar. De los residentes
contactados, 9,2% tenan ms de 60 aos.
a. 10,5% es un Parmetro una Estadstica?
b. 9,2% es un Parmetro una Estadstica?
13. El ao 2010 la Universidad tiene 5453 estudiantes, en la tabla se muestra un detalle de la composicin.
Necesitamos una muestra de tamao 20 de la poblacin de estudiantes:
MUJERES

HOMBRES

TOTAL

PREGRADO

2461

2848

5309

POSTGRADO

67

77

TOTAL
2528
2925
Elija muestras de tamao 20 para 2 tipos de muestreo:
a. Muestreo Aleatorio Simple.
b. Muestreo Aleatorio Estratificado.

144
5453

14. Una compaa de marketing saca una muestra aleatoria de la gua de telfonos tomando 10 personas cuyos
apellidos comiencen con letra A, 10 personas cuyos apellidos comiencen con la letra B, y as sucesivamente con
cada letra del alfabeto, para una muestra total de 260 personas.
a. Qu clase de diseo muestral se us aqu?
b. Tienen todos los que estn en la gua de telfonos igual posibilidad de ser elegidos en la muestra?
c. No todos los residentes de la ciudad tiene telfono, Qu clase de sesgo va a provocar este hecho?

CAPITULO 4
7. VARIABLE
Al hacer un estudio de una determinada poblacin, observamos una caracterstica o propiedad
de sus elementos o individuos. Por ejemplo, con los alumnos y alumnas de nuestra clase,
podemos estudiar el lugar donde viven, el nmero de hermanos, la estatura, etc. Cada una de
estas caractersticas estudiadas se llama variable estadstica.
La correspondencia entre los anlisis
aplicados y datos recabados permite
construir juicios concluyentes sobre el
colectivo en estudio. Los datos que
precisamos deben ser generados de
alguna forma, la cual siempre est
asociada a la definicin de variables,
que constituyen los conceptos de referencia ms importantes en los inicios de una investigacin.
7.1 VARIABLE ESTADSTICA
Es la caracterstica de la muestra o poblacin que se est estudiando. Los datos son el producto
de su medicin sobre los elementos o sujetos de estudio. Por ejemplo en un estudio sobre la
cantidad mensual devengada por los trabajadores de una empresa, la variable es ingreso y est
medida en nuevos soles.
Tambin diramos que es una caracterstica que puede tomar diferentes valores por ejemplo. La
estatura de adultos de sexo masculino, el peso de nios en edad preescolar, la edad de los
pacientes que se ven en una clnica, etc.

7.2 VARIABLES CUANTITATIVAS


Cuando el valor de una variable se expresa por una cantidad, valor que resulta de la operacin
de contar o medir, stas pueden ser de dos clases:
7.2.1

VARIABLES CONTINUAS

Se caracterizan por el hecho de que para todo para de valores siempre se puede encontrar en
valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.). Una
variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores
consecutivos. Por ejemplo, la estatura, el peso, la temperatura.
Expectativa de vida, peso, produccin de leche, kg alfalfa/hectarea, altura, etc
Ejemplo:
Persona: Edad, talla, peso, Ingreso, gastos, .....
Hogar: Ingresos por hogar. Gastos por hogar en alimentacin, Monto de alquiler por hogar,.....
Establecimiento comercial: Valor de las ventas por establecimiento, Valor de las compras por
establecimiento, Gastos (electricidad, agua, telf.,..)
En el preescolar, ubicado en la urbanizacin Nueva de esta ciudad se procedi a recoger las
medidas de talla y peso de los nios que a este asisten.
NIO
PESO
TALLA
Cesar
18.300
1.15
Augusto
20.500
1.20
Alvaro
19.000
1.10

Carlos

7.2.2

18.750

1.18

VARIABLES DISCRETAS.

Cuando el valor puede estar representado por nmeros ENTEROS: sern aquellas que pueden
tomar solo un nmero limitado de valores separados y no continuos; son aquellas que solo
toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden
tomar ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable discreta
ya que solo tomar los valores 1, 2, 3, 4... Ntese que no encontramos valor como 1,5
estudiantes
Ejemplo:
Nmero de clientes por da de un Banco.
Nmero de ventas darias de una Empresa.
Nmero de Vuelos por da en el Aeropuerto
Nmero de accidentes por da.
Nmero de personas por hogar.
Nmero de pacientes por hospital
Nmero de Hijos por mujer
Nmero de Cuartos por vivienda
Nmero de Nacimientos por da Maternidad
Nmero de alumnos desaprobados por curso
el nmero de hijos, No de pacientes, No de partos, El No de vehculos vendidos por la
Toyota, El No de viviendas, etc.
7.3 VARIABLES CUALITATIVAS
Son las que expresan cualidad, caracterstica o atributo. Por ejemplo: sexo de un individuo,
lugar de nacimiento, el grado de instruccin, El idioma , la nacionalidad, etc. Ejemplo:
Los estudiantes de enfermera tienen un alto porcentaje de rendimiento. La asignacin de
valores tiene sentido cuando se usa una escala nominal u ordinal para medir la variable
Lugar de Residencia, Idioma, Sexo, Religin, Categora Ocupacional, Nivel de Educacin de las
PERSONAS.
Actividad Econmica, Condicin Jurdica, Ao de Inicio Actividades de EMPRESAS.
Materiales de Techo, piso y paredes; Rgimen de Tenencia, Estado de Conservacin y Tipo de
las VIVIENDAS
Pueden ser de dos tipos: nominales y ordinales (cuando existe un orden o jerarqua)
Ejemplo
En el siguiente enunciado identifique: Poblacin, Muestra, Unidad elemental, Variable(s), Tipo(s), Observacin. Adems
defina los parmetros y valores estadsticos correspondientes.
Las tiendas dedicadas a la comercializacin de artefactos elctricos nacionales han encargado realizar un estudio con la
finalidad de obtener algunos indicadores. El estudio se realiz con una muestra de 60 tiendas obtenindose los
siguientes resultados:

El 60% de los artculos suministrados trimestralmente por los proveedores son vendidos en ese periodo.
La utilidad neta promedio por artefacto vendido es de 15% del costo.
El 80% de los artculos vendidos corresponden a la denominacin "lnea blanca".
Promedio de devolucin: 2 artculos trimestralmente debido a fallas tcnicas.

Solucin:
Poblacin: Tiendas dedicadas a la comercializacin de artculos elctricos nacionales. Muestra: 60 tiendas elegidas en
el estudio.
Unidad: una tienda de la poblacin definida. Variables:
1.
% de artculos vendidos respecto al total suministrado.
Tipo: cuantitativa discreta. Observacin: 50%
Parmetro: % promedio de ventas trimestrales de artculos vendidos respecto al total suministrado.
Valor del parmetro: desconocido.
Valor estadstico: % promedio de ventas trimestrales de artculos vendidos respecto de la muestra. Valor: 60%.
2.
Utilidad neta.
Tipo: cuantitativa continua. Observacin: 10%
Parmetro: % promedio correspondiente a la utilidad neta por artefacto respecto al costo de compra del total de
artculos vendidos.
Valor del parmetro: desconocido.
Valor estadstico: % promedio correspondiente a la utilidad neta por artefacto respecto al costo de compra del total de
artculos vendidos seleccionados en la muestra. valor: 15%.
Completar con las otras variables del estudio.

Dirjase a la biblioteca y tome al azar 5 ttulos diferentes de tesis de grado. Identifique en cada una de ellas por lo
menos una de las variables usadas en la investigacin y defina en qu escala est medida. Finalmente anote la prueba
estadstica usada para su anlisis y comente si fue correctamente aplicada en funcin de la escala de medicin
definida

EJERCICIO
Indica si cada una de las siguientes variables estadsticas es cuantitativa o cualitativa:
1) Deporte preferido
2) Nmero de calzado
3) Estatura
4) Estudios que desea realizar
5) Puntaje en la ltima prueba

7.4 MEDICIN
Existen diversas definiciones del trmino "medicin", pero estas dependen de los diferentes
puntos de vista que se puedan tener al abordar el problema de la cuantificacin y el proceso
mismo de la construccin de una escala o instrumento de medicin.
En general, se entiende por medicin la asignacin de nmeros a elementos u objetos para
representar o cuantificar una propiedad. El problema bsico est dado por la asignacin un
numeral que represente la magnitud de la caracterstica que queremos medir y que dicho
nmeros pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la
medicin, los atributos de nuestras percepciones se transforman en entidades conocidas y
manejables llamadas "nmeros". Es evidente que el mundo resultara catico si no pudiramos
medir nada. En este caso cabra preguntarse de que le servira la fsico saber que el hierro
tiene una alta temperatura de fusin.
7.4.1

ESCALAS DE MEDICIN

Para la medir los datos


se
emplean diversas escalas de
medicin, asi se cuenta: De
acuerdo a la clasificacin de
Stevens, las variables pueden
clasificarse en: a. Nominales, b.
Ordinales c. De Intervalo d. De
razn
7.4.1.1 ESCALA NOMINAL
Una variable est medida en escala nominal cuando se utilizan nombres para establecer
categoras. Para distinguir los agrupamientos se emplean smbolos, letras e incluso nmeros,
aunque estos ltimos solo cumplen una funcin de carcter simblico y no numrico. Los
clculos matemticos con estos nmeros no tendran sentido.
Ejemplo: el estado de una persona para determinada enfermedad se puede clasificar como
sano o enfermo, o bien como 1 o 2. Adicionalmente debemos mencionar que ninguna de
las categoras definidas tiene mayor jerarqua que las otras. Ellas nicamente reflejan
diferencias en la variable. en otras palabras Cuando simplemente se denominan a alguna
observacin u observacin.
La escala de medida nominal, puede considerarse la escala de nivel ms bajo, y consiste en la
asignacin, puramente arbitraria de nmeros o smbolos a cada una de las diferentes
categoras en las cuales podemos dividir el carcter que observamos, sin que puedan
establecerse relaciones entre dichas categoras, a no ser el de que cada elemento pueda
pertenecer a una y solo una de estas categoras.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma
sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se asignan
nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le
atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como "medidas
nominales".

Responsable : Ing. R. CESAR CONDORI PALOMINO

26

Ejemplo: podemos estar interesados en clasificar los estudiantes de la universidad de acuerdo


a la carrera que cursan.
CARRERA PROFESIONAL NMERO ASIGNADA A LA CATEGORA
Educacin
Administracin

1
2

Se ha de tener presente que los nmeros asignados a cada categora sirven nica y
exclusivamente par identificar la categora y no poseen propiedades cuantitativas. Los valores
son nominativos, sirven para designar. Slo se puede realizar un conteo (frecuencias). No es
factible las operaciones aritmticas. Se analizan a travs de la comparacin: igualdad y no
igualdad ( = y ).
Ejemplo
SEXO DEL PACIENTE

1: Masculino

GRUPO SANGUNEO
SERVICIO MDICO

1: Emergencia

AB

2: Femenino
O

2: Ginecologa

3: Traumatologa

4: Pediatra

7.4.1.2 ESCALA ORDINAL


En este nivel tambin se definen varias categoras, pero adems de mostrar un ordenamiento
existe una relacin de mayor o menor que entre ellas. Las etiquetas, smbolos o nmeros
asignados si indican jerarqua, aunque no es posible conocer la magnitud de la diferencia entre
cada una de las categoras.

En el grfico, el presidente es ms que


el
director
general
y
as
sucesivamente, aunque no puede
precisarse en cada caso cunto ms.
En caso de que puedan detectarse
diversos grados de un atributo o
propiedad de un objeto, la medida
ordinal es la indicada, puesto que
entonces puede recurrirse a la
propiedad de "orden" de los nmeros
asignndolo a los objetos en estudio
de modo que, si la cifra asignada al
objeto A es mayor que la de B, puede
inferirse que A posee un mayor grado de atributo que B.

La asignacin de nmeros a las distintas categoras


no puede ser completamente arbitraria, debe
hacerse atendiendo al orden existente entre stas.
Por ejemplo el grado de instruccin
Los caracteres que posee una escala de medida
ordinal permiten, por el hecho mismo de poder
ordenar todas sus categoras, el clculo de las
medidas estadsticas de posicin, como por
ejemplo la mediana.
Los valores representan un orden. No son
cuantitativos, slo simbolizan una posicin. Se analizan a travs de la desigualdad: mayor que
o menor que (> y <).
Responsable : Ing. R. CESAR CONDORI PALOMINO

27

Ejemplo:
CALIFICACIN

LUGAR (ORDEN)
DOLOR

leve

moderado

A>B
1 > 2
intenso

insoportable

7.4.1.3 ESCALA DE INTERVALO


Esta escala mide las variables de manera numrica. Los nmeros de esta escala permiten
establecer distancias entre dos individuos, y las operaciones aritmticas de suma y resta
son perfectamente realizables y significativas, no as la multiplicacin y divisin.
La escala de intervalos iguales, est caracterizada por una unidad de medida comn y
constante que asigna un nmero igual al nmero de unidades equivalentes a la de la magnitud
que posea el elemento observado.
Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningn momento ausencia de la magnitud que estamos midiendo.
Esta escala, adems de poseer las caractersticas de la escala ordinal, encontramos que la
asignacin de los nmeros a los elemento es tan precisa que podemos determinar la magnitud
de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos
decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los
caracteres que posean esta escala de medida pueden calculrsele todas las medidas
estadsticas a excepcin del coeficiente de variacin.
Se utilizan nmeros cardinales. El cero es relativo o diferencial, es decir no indica ausencia de
la propiedad. Se pueden realizar operaciones aritmticas.(+ y -). Es una escala creada por el
hombre.
Ejemplo:
Hora
00:00
Temperatura ambiental
0 C
El ao en que vivimos
2011
Ejemplo:
El lapso transcurrido entre 1998-1999 es
igual al que transcurri entre 2009-2010.
En la escala de intervalo el cero es un
valor que no indica ausencia de la
caracterstica o variable medida, y es
colocado arbitrariamente en algn lugar de
la escala.
Ejemplo
Un tpico es la temperatura (medida en
grados centesimales, Fahrenheit o Kelvin)
donde un valor de cero no implica que
exista ausencia de temperatura.

7.4.1.4 ESCALA DE RAZON

Responsable : Ing. R. CESAR CONDORI PALOMINO

28

Es la escala ms fuerte, dado que usa un sistema numrico en el que el cero es un valor que
indica ausencia de la caracterstica que se est midiendo. Las operaciones aritmticas de
multiplicacin y divisin adquieren significacin.
Ejemplo:
La diferencia entre dos valores es importante y de magnitud definida. As por ejemplo, el valor
de cero nuevos soles en ingresos de una tienda, puede interpretarse de manera lgica que no
se han producido ventas. De la misma manera un artculo con un peso de 6 Kg. tiene el doble
de peso de otro que registra 3 Kg.
El nivel de medida ms elevado es el de cocientes o razones, y se
diferencia de las escalas de intervalos iguales nicamente por
poseer un punto cero propio como origen; es decir que el valor cero
de esta escala significa ausencia de la magnitud que estamos
midiendo. Si se observa una carencia total de propiedad, se dispone
de una unidad de medida para el efecto.
A iguales diferencias entre los nmeros asignados corresponden
iguales diferencias en el grado de atributo presente en el objeto de
estudio. Adems, siendo que cero ya no es arbitrario, sino un valor
absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
Se utilizan nmeros cardinales. Tienen unidad de medida (cms,
pulgadas). El cero es absoluto, indica ausencia de la propiedad. Se
pueden realizar operaciones aritmticas (+,-,x ,),
Ejemplo:
Pacientes no atendidos hoy
0
N de hijos en edad de vacunacin
0
Procesos deficientes
0
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observ que hay familias que no
tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen
3 hijos.

Responsable : Ing. R. CESAR CONDORI PALOMINO

29

Responsable : Ing. R. CESAR CONDORI PALOMINO

30

EJERCICIO
1.
2.
3.
4.

5.

Elabore un resumen sobre los aspectos ms


importantes de la historia de la estadstica
Mencione algunas aplicaciones sobre
la
clasificacin de la estadstica
Plantee al menos 10 indicadores estadsticos
Dirjase a la biblioteca y tome al azar 5 ttulos
diferentes de tesis de grado. Identifique en cada
una de ellas por lo menos una de las variables
usadas en la investigacin y defina en qu escala
est medida. Finalmente anote la prueba
estadstica usada para su anlisis y comente si
fue correctamente aplicada en funcin de la
escala de medicin definida
Indica que variables son cualitativas y cuales
cuantitativas:
a. Comida Favorita. Cualitativa.
b. Profesin que te gusta. Cualitativa.
c. Nmero de goles marcados por tu equipo
favorito en la ltima temporada. Cuantitativa.
d. Nmero de alumnos de tu Instituto.
Cuantitativa.
e. El color de los ojos de tus compaeros de
clase. Cualitativa.
f.
Coeficiente intelectual de tus compaeros de
clase. Cuantitativa

6.

De las siguientes variables indica cules son


discretas y cuales continuas.
a. Nmero de acciones vendidas cada da en la
Bolsa. Discreta
b. Temperaturas registradas cada hora en un
observatorio. Continua
c. Perodo de duracin de un automvil.
Continua
d. El dimetro de las ruedas de varios coches.
Continua
e. Nmero de hijos de 50 familias. Discreta
f.
Censo anual de los peruanos. Discreta

7.

Clasificar las siguientes variables en cualitativas y


cuantitativas discretas o continuas.
a. La nacionalidad de una persona. Cualitativa
b. Nmero de litros de agua contenidos en un
depsito. Cuantitativa continua.
c. Nmero de libro en un estante de librera.
Cuantitativa discreta.
d. Suma de puntos tenidos en el lanzamiento
de un par de dados. Cuantitativa discreta.
e. La profesin de una persona. Cualitativa.
f.
El rea de las distintas baldosas de un
edificio. Cuantitativa continua.

Responsable : Ing. R. CESAR CONDORI PALOMINO

31

CAPITULO 5: EL MTODO DE RECOLECCIN.


Los datos no se recopilan como
un fin en s mismos, sino como
un medio para describir los
hechos
que estn tras los
datos
7. LOS DATOS O ELEMENTOS
Por lo general, el dato es una representacin simblica o
un atributo de una entidad.
Son cada uno de los trminos que componen la muestra y,
de acuerdo a la funcin existente entre ellos, tambin
pueden ser discretos o continuos. En general, los discretos
son los que pueden contar y los continuos, los que se
pueden medir.
Del latn datum (lo que se da), un dato es un documento, una informacin o un testimonio
que permite llegar al conocimiento de algo o deducir las consecuencias legtimas de un hecho.
Por ejemplo: Hemos descubierto al asesino gracias a los datos aportados por un testigo.
5.11

DATO:

Valor que toma una variable asociado a un elemento de la poblacin o de la muestra:


Ejemplo:
Jos Arias, es un jefe de hogar que vive en Tacna, tiene 43 aos, tiene Secundaria
completa, es casado, su categora ocupacional empleado y su nivel de ingresos es 980
nuevos soles.
Mara Martnez, es una mujer, de 35 aos, casada, present una enfermedad, se atendi
en ESSALUD, fue atendida por un mdico.
Pedro Prez, hijo de un jefe de hogar matriculado en 3ro de primaria.
5.12

LOS DATOS ESTADSTICOS

Los datos estadsticos son el producto de las observaciones efectuadas en las personas y
objetos en los cuales se produce el fenmeno que queremos estudiar. Los datos estadsticos
se pueden encontrar de forma no ordenada, por lo que es muy difcil en general, obtener
conclusiones de los datos presentados de esta manera.
Para poder obtener una precisa y rpida informacin con propsitos de descripcin o anlisis,
estos deben organizarse de una manera sistemtica; es decir, se requiere que los datos sean
clasificados. Esta clasificacin u organizacin puede muy bien hacerse antes de la recopilacin
de los datos.
Los datos estadsticos han sido generalmente
usados por los gobiernos organizados como forma
de ayudar a la toma de decisiones en la
administracin del estado. Los datos estadsticos
son concisos, especficos y capaces de ser
analizados
objetivamente
por
diferentes
procedimientos.
Ejemplo: Si se quiere conocer las caractersticas de
los estudiantes de la Carrera Profesional de
Ingeniera Comercial, que solicitan prstamo a la
biblioteca de dicha Universidad, la recoleccin de la informacin debe clasificar a cada
estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc.
5.13

CLASIFICACIN DE LOS DATOS


Responsable : Ing. R. CESAR CONDORI PALOMINO

32

Los datos estadsticos pueden ser clasificados en cualitativos, cuantitativos, cronolgicos y


geogrficos.
Datos Cualitativos: Cuando los datos son cuantitativos, la diferencia entre ellos es de clase y
no de cantidad. Ejemplo: Si deseamos clasificar los estudiantes que cursan la materia de
estadstica I por su estado civil, observamos que pueden existir solteros, casados, divorciados,
viudos.
Datos cuantitativos Cuando los valores de los datos representan diferentes magnitudes,
decimos que son datos cuantitativos. Ejemplo: Se clasifican los estudiantes de la Carrera
Profesional de Comercio de acuerdo a sus notas, observamos que los valores (nota)
representan diferentes magnitudes.
Datos cronolgicos: Cuando los valores de los datos varan en diferentes instantes o
perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los
promedios de notas de los Alumnos de Ingenieria Comercial en los diferentes semestres.
Datos geogrficos: Cuando los datos estn referidos a una localidad geogrfica se dicen que
son datos geogrficos. Ejemplo El nmero de estudiantes de educacin superior en las
distintas regiones del pas.
5.14

HERRAMIENTAS COMUNES PARA RECOPILAR Y ANALIZAR DATOS

Aqu una lista de las ms usadas:


Base de datos. Una base de datos almacena informacin como los registros tal como un
archivo de ndice de tarjetas digitales. Cada registro puede contener mucha informacin o muy
poca. Una base de datos puede ser personalizada, como una base de datos de donantes o una
base de datos de clientes.
Gestin de las relaciones con los clientes (CRM). Es una aplicacin de base de datos que
se centra en las relaciones y actividades de los individuos registrados en ese sistema. Le da al
usuario una interfaz para ver y comprender las actividades y acciones de un donante, cliente o
empresa. Mediante el seguimiento de llamadas telefnicas, correos electrnicos y reuniones
con los individuos, los usuarios pueden entender y relacionarse de forma proactiva con los
clientes .
Business Intelligence Software o Software de Inteligencia Empresarial. Es un tipo de
software permite analizar datos de diferentes fuentes, incluyendo datos de fuentes en lnea,
dando una visin global de la organizacin. Lo mejor es usarlo cuando ya tiene datos
recopilados y organizados, y estn dispuestos a organizar para el intercambio y el anlisis.
5.15

EL METODO DE RECOLECCION

El mtodo de recoleccin depende fundamentalmente del propsito del estudio, de la


naturaleza de la informacin y de la forma en que sta se recoja la cual puede ser:
Mtodo censal, (peridica) Cuando se realizan mediante la ejecucin de Censos estos
comprenden a toda la Poblacin.
Mtodo de encuestas y experimentos (ocasional) Las cuales consideran a una parte
representativa de la poblacin
Mtodo de registros (Continua) Aquellos que se obtienen a travs del registro en el tiempo de
alguna variable o fenmeno.
5.16

CONSIDERANDO LAS FUENTES DE INFORMACIN:

Son todos aquellos medios de los cuales procede la informacin, que satisfacen las
necesidades de conocimiento de una situacin o problema presentado, que posteriormente
ser utilizado para lograr los objetivos esperados. De acuerdo a su origen se clasifican en:
Responsable : Ing. R. CESAR CONDORI PALOMINO

33

Fuentes primarias.
Fuentes secundarias.
5.16.1 LAS FUENTES PRIMARIAS
Son aquellas en las que los datos provienen directamente de la poblacin o muestra de la
poblacin, mientras que las fuentes secundarias son aquellas que parten de datos preelaborados, como pueden ser datos obtenidos de anuarios estadsticos, de Internet, de
medios de comunicacin.
Las Fuentes Primarias para su recopilacin se obtienen por medio de una investigacin
directa al objeto de estudio, a travs de mtodos establecidos. Para reunir datos primarios,
lo ideal es recurrir a un plan que exige tomar varias decisiones: los mtodos e instrumentos de
investigacin,
el plan de muestreo, y las tcnicas para establecer contacto con el
pblico.
Planeacin de la recoleccin de informacin primaria
ENFOQUES DE
INVESTIGACION
Observacin
Encuesta
Experimento

METODOS DE
CONTACTO
Correo
Telfono
Personal

PLAN DE MUESTREO
Unidad de Muestreo
Tamao de la Muestra
Mtodo de Muestreo

INSTRUMENTOS DE
INVESTIGACION
Cuestionario
Instrumentos Mecnicos
Instrumentos

A su vez las Fuentes primarias pueden subdividirse en:


Observacin directa.
Observacin indirecta.
5.16.1.1 LA OBSERVACIN DIRECTA
Es cuando el investigador toma directamente los datos de la poblacin, sin necesidad de
cuestionarios, entrevistadores. Por ejemplo cuando un profesor realiza un estudio estadstico
sobre el rendimiento de sus alumnos.
5.16.1.2 LA OBSERVACIN ES INDIRECTA
Cuando los datos no son obtenidos directamente por el investigador, ya que precisa de un
cuestionario, entrevistador u otros medios para obtener los datos del estudio. Para lo que es
preciso realizar una encuesta.
5.16.2 LAS FUENTES SECUNDARIAS
Las Fuentes Secundarias para ser utilizadas deben ser analizadas bajo 4 preguntas bsicas
que son:
Es pertinente? cuando la informacin se adapta a los objetivos
Es obsoleta? cuando ha perdido actualidad
Es Fidedigna cuando la veracidad de la fuente de origen no es cuestionada
y Es digna de Confianza? si la informacin ha sido obtenida con la metodologa
adecuada y honestidad necesaria, con objetividad, naturaleza continuada y exactitud
La fase de recopilacin de datos se considera que es la etapa de ms alto costo, tanto en
recursos humanos como materiales, as como tambin de tiempo. Es la ms susceptible de
error.
5.16.2.1 LAS FICHAS
La tcnica ms utilizada son las fichas. Constituye la primera fuente que se debe analizar.
Ejemplo: Datos publicados (en papel o en forma electrnica) en revistas especializadas, tesis,
censos y en las hojas de registro anteriores.
De donde provienen los datos?
Responsable : Ing. R. CESAR CONDORI PALOMINO

34

La fuente es imparcial?
Los datos comprueban o contradicen otras evidencias que se disponen?
Hace falta una evidencia cuya ausencia conduzca a otra conclusin?
Cuantas observaciones se tienen?
La conclusin que obtengo es lgica?
5.16.2.2 EL CUESTIONARIO O FORMULARIO
Es el mtodo que utiliza un instrumento o formulario impreso, destinado a obtener respuestas
sobre el problema en estudio y que el investigado o consultado llena por s mismo. Son los
cuestionarios; que en muchos casos pueden ser viciados. Las entrevistas personales, por email, servicio postal, telfono, fax, etc.
Aqu podemos incluir el formulario, el cual no brinda mayor seguridad en los datos ms si
economizar. Cualquiera que sea el mtodo por el que se decida el investigador para recabar
informacin, es necesario elaborar un estudio de preguntas.
Los cuestionarios en general, constan de las siguientes partes:

La identificacin del cuestionario: nombre del patrocinante de la encuesta, (oficial o


privada), nombre de la encuesta, nmero del cuestionario, nombre del encuestador, lugar y
fecha de la entrevista.

Datos de identificacin y de carcter social del encuestado: apellidos, nombres, cdula de


identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de
instruccin, ocupacin actual, ingresos, etc.

Datos propios de la investigacin, son los datos que interesa conocer para construir el
propsito de la investigacin.

Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de
la encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es
eliminada por no tener ningn tipo de inters para el estudio.

CONSIDERACIONES QUE DEBEMOS TOMAR EN CUENTA:


El cuestionario debe ser conciso; tratar en lo posible de que con el menor nmero de
preguntas, se obtenga la mejor informacin.
Claridad de la redaccin; evitar preguntas ambiguas o que sugieran respuestas
incorrectas, por lo que deben estar formuladas las preguntas de la forma ms sencilla.
Discrecin: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o
curiosas, sobre datos personales que puedan ofender al entrevistado.
Facilidad de contestacin: se deben evitar, en lo posible, las preguntas de respuestas
libres o abiertas y tambin la formulacin de preguntas que requieran clculos
numricos por parte del entrevistado.
Orden de las preguntas: estas deben tener una secuencia y un orden lgico, agruparlas
procurando que se relacionen unas con otras.
5.17

CONSIDERANDO EL METODO DE RECOLECCION

5.17.1 METODOS DIRECTOS


Cuando los datos son obtenidos directamente de su fuente de origen, Por ejemplo:
Nacimientos, Defunciones, Casamientos, Ventas registradas en notas de una empresa. En
tales casos hay dos procedimientos para recolectar la informacin: La observacin y el
interrogatorio. El responsable registra personalmente los valores de la caracterstica. Ejemplo:
registro del tiempo que demora un mdico durante una consulta.
Es uno de los mtodos ms confiados porque se obtiene informacin ms exacta en la
recopilacin de datos. Aqu podemos considerar la entrevista como tcnica de observacin

Responsable : Ing. R. CESAR CONDORI PALOMINO

35

Comprende 2 tcnicas. La observacin y la experimentacin


5.17.2 LA OBSERVACIN
Es el registro visual de lo que ocurre en una situacin real,
clasificando
y consignando
los
acontecimientos
pertinentes de acuerdo con algn esquema previsto y
segn el problema que se estudia. Para Ernesto Rivas
Gonzlez (1997) "Investigacin directa, es aquella en que
el investigador observa directamente los casos o
individuos en los cuales se produce el fenmeno,
entrando en contacto con ellos; sus resultados se
consideran datos estadsticos originales, por esto se llama
tambin a esta investigacin primaria".
Ejemplo; el seguimiento de la poblacin agrcola por
ao, llevado en una determinada granja
1. Se registra el dato bajo condiciones normales
2. Cuando se mide el desempeo, la persona observada no debe saber que es sujeta de
observacin
3. Se utiliza una hoja de registro.
Ejemplo: La observacin del desempeo de una enfermera durante sus labores en el Servicio
de Emergencia.
5.17.2.1 FORMAS DE OBSERVAR LA POBLACIN:
A. ATENDIENDO A LA FUENTE SE CLASIFICAN EN DIRECTA O INDIRECTA.
Observacin directa: Es aquella donde se tienen un contacto directo con los elementos o
caracteres en los cuales se presenta el fenmeno que se pretende investigar, y los resultados
obtenidos se consideran datos estadsticos originales.
Observacin Indirecta: Atendiendo a la periodicidad, puede ser continua, peridica o
circunstancial.
Una observacin continua; como su nombre lo indica es aquella que se lleva acabo de un
modo permanente.
Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones
que se van registrando a medida que van producindose.
Una observacin peridica; es aqulla que se lleva a cabo a travs de perodos de tiempo
constantes. Estos perodos de tiempos pueden ser semanas, trimestres, semestres, aos, etc.
Lo que debemos destacar es que los perodos de tiempo tomados como unidad deben
tomarse constantes en lo posible.
Ejemplo; el registro llevado por la Oficinas de Control de Estudios de la UJCM, en cuanto a la
inscripcin de los estudiantes por semestre.
La observacin circunstancial, es aquella que se efecta en forma ocasional o espordica,
esta observacin hecha ms por una necesidad momentnea, que de carcter regular o
permanente.
Ejemplo; la obtencin de nmeros de aulas utilizadas y no utilizadas en los colegios
pertenecientes a la Provincia de Ilo
B. ATENDIENDO A LA COBERTURA; PUEDEN SER EXHAUSTIVA, PARCIAL O MIXTA
Observacin Exhaustiva. Cuando la observacin es efectuada sobre la totalidad de los
elementos de la poblacin se habla de una observacin exhaustiva.

Responsable : Ing. R. CESAR CONDORI PALOMINO

36

Observacin Parcial. Dados que las poblaciones en general son grandes, la observacin de
todos sus elementos se ve imposibilitada. La solucin para superar este inconveniente es
observar una parte de esta poblacin.
Observacin Mixta. En este tipo de observacin se combinan adecuadamente la observacin
exhaustiva con la observacin parcial. Por lo general, este tipo de observaciones se lleva a
cabo de tal manera que los caracteres que se consideran bsicos se observan
exhaustivamente y los otros mediante una muestra; o bien cuando la poblacin es muy
grande, parte de ella se observa parcialmente.
5.17.3 LA EXPERIMENTACIN:
Se registra un dato bajo condiciones provocadas simulando el proceso lo ms real posible.
Ejemplo: Un mercado prueba para introducir un tipo jabn de antisptico con fragancia.
5.17.4 METODOS INDIRECTOS
Cuando los datos son obtenidos provienen de los datos previamente recogidos por otras
personas y en este caso se esta hablando de fuentes secundarias p.e publicaciones, revistas
textos etc. Es aquella donde la persona que investiga hace uso de datos estadsticos ya
conocidos en una investigacin anterior, o de datos observados por un tercero (persona o
entidad). Con el fin de deducir otros hechos o fenmenos.
Ejemplo; si un investigador pretende estudiar la produccin por aos de una granja avcola, en
sus ltimos cinco aos de produccin, tendra que hacer un seguimiento, a tal fin recurrira a las
observaciones que posee la oficina administrativa de la granja durante estos cinco aos, o
dirigirse a la oficina de estadstica,
Es de notar que el investigador se vale de observaciones realizadas por terceros.
Se registra la caracterstica a travs de preguntas
No se realiza medicin
Ejemplo: Se pregunta a un paciente el tiempo que esper antes que sea atendido en el
consultorio externo.
Comprende 2 tcnicas: la encuesta y la entrevista.
5.17.4.1

LA ENCUESTA:

Es un mtodo para recoger informacin sobre una poblacin


humana, en el que el contacto directo se hace con unidades
de estudio (individuos, organizaciones, comunidades, etc.) a
travs de medios tan sistemticos como cuestionarios y
programas de entrevistas. Se entiende por encuesta las
observaciones realizadas por muestreo, es decir son
observaciones parciales.
Segn Antonio Napolitano "La encuesta, es un mtodo
mediante el cual se quiere averiguar. Se efecta a travs de
cuestionarios verbales o escritos que son aplicados a un
gran nmero de personas".
Consiste en obtener informacin de los sujetos en estudio,
proporcionada por ellos mismos, sobre opiniones, actitudes
o sugerencias. Responde a preguntas del tipo: Quin hace qu? Por qu? Cmo? Hasta
qu punto?
Al disearla se debe:
Elegir lo temas generales de la encuesta
Decidir forma de aplicarlo: correo, telfono o personal
Plantear preguntas
Realizar una prueba piloto y hacer revisiones finales
Ejemplos:
Responsable : Ing. R. CESAR CONDORI PALOMINO

37

Encuesta para conocer el grado de satisfaccin de los asegurados a una clnica.


Encuesta Nacional de Hogares (Salud, Educacin, Violencia, Empleo, Ingresos,
Gastos, Programas Sociales)
Encuesta Demogrfica y Salud Familiar
Encuesta Econmica anual
Encuestas de Opinin Pblica
Estudios de mercado a consumidores reales o potenciales de las empresas.
Estudios de imagen.
Estudios de estimacin del grado de satisfaccin que tienen los clientes de los
productos o servicios ofertados por la misma.
Diseo de campaas publicitarias sobre imagen general o sobre productos concretos.
Valoracin a posteriori de los resultados o efectos de las campaas publicitarias.
Estudio de la demanda potencial de un determinado producto en una cierta zona
(plazas hoteleras, etc.).
Estudio de calidad o del grado de satisfaccin de los clientes usuarios de un
determinado servicio (gua de viaje, recepcin de hotel, etc.).
Estimacin del impacto de un determinado acontecimiento pasado o futuro sobre
ciertas variables de inters turstico (Olimpiadas, acontecimiento deportivo o cultural,
una infraestructura de transporte, etc.).

Responsable : Ing. R. CESAR CONDORI PALOMINO

38

Es una modalidad de investigacin en el que las preguntas, eso s, pueden incidir directa o
indirectamente en el tema investigado.
LOS PASOS QUE SE DEBEN SEGUIR A LA HORA DE HACER UNA ENCUESTA son:
2.
3.
4.
5.

6.

7.

8.

9.

Determinacin de los objetivos


Determinacin del tipo de encuesta:
Diseo del cuestionario: Es un instrumento que contiene varias preguntas y que trata de
una diversidad de fenmenos o caractersticas.
Codificacin del cuestionario: Una vez diseado y testado el cuestionario, conviene
codificarlo antes de realizar el trabajo de campo. Con el objeto de evitar posibles errores
de diseo. La codificacin del cuestionario facilita la tabulacin de los datos resultantes
y su anlisis posterior a travs de un programa informtico de anlisis estadstico.
Muestreo: En vez de hacer un censo completo, los procedimientos de muestro
estadstico se han convertido en la herramienta preferida en la mayora de las
situaciones de investigacin.
Trabajo de campo: Una vez desarrolladas las fases anteriores, se realiza el trabajo de
campo entrevistando a todos los integrantes de la muestra seleccionada. El trabajo de
campo es controlado y revisado por el investigador para evitar distorsiones de la
informacin resultante.
Tabulacin de Datos: Construir tablas. Al finalizar el trabajo de campo, y una vez
revisados y depurados los cuestionarios, se tabulan estadsticamente los datos
obtenidos.
Anlisis de Resultados y Elaboracin del Informe: Por ltimo, se analizan los datos
tabulados, y en base a los resultados y las conclusiones se redacta el informe final de la
investigacin.

ENCUESTA NACIONAL DE HOGARES 2001


IV TRIMESTRE

ENCUESTA DE OPINION
MODULO : COYUNTURA ECONOMICA

MECOVI - Per
Programa de
Mejoramiento de las
Encuestas de Condiciones
de Vida en el Per

CONGLOMERADO
N

CUESTIONARIO CONFIDENCIAL
AMPARADO POR EL DECRETO SUPREMO N 018-91-PCM: SECRETO ESTADISTICO

N DE SELECCION
DE LA VIVIENDA

CUESTIONARIO
N

TIPO DE
SELECCION

Cuestionario
Adicional
1

UBICACION MUESTRAL

UBICACION GEOGRAFICA
1. DEPARTAMENTO

5. ZONA N

2. PROVINCIA

6. MANZANA N

3. DISTRITO

7. AER N

4. CENTRO POBLADO

8. VIVIENDA N

5.17.4.2

9. TOTAL DE HOGARES QUE


OCUPAN LA VIVIENDA
10. HOGAR N

LA ENTREVISTA:

Es la comunicacin interpersonal establecida entre el


investigador y el sujeto a fin de obtener respuestas
verbales a las interrogantes planteadas sobre el
problema propuesto. Permite recolectar datos o partir de
un dialogo. Puede se estructurada o no estructurada
Ejemplo: Entrevista al Director de una Clnica sobre la
aplicacin de norma de calidad.
A. ENTREVISTA ESTRUCTURADA
Se caracteriza por estar rgidamente estandarizada:
se plantean idnticas preguntas y en el mismo orden
a cada uno de los participantes.
VENTAJAS:
La informacin es ms fcil de procesar, simplificando el anlisis comparativo.
El entrevistador no necesita ser entrenado arduamente en la tcnica.
Hay uniformidad en el tipo de informacin obtenida.
Responsable : Ing. R. CESAR CONDORI PALOMINO

39

DESVENTAJAS
Es difcil obtener informacin confidencial
Se limita la posibilidad de profundizar en un tema que emerja de la entrevista.
B. LA ENTREVISTA NO ESTRUCTURADA
Es ms flexible y abierta, aunque el objetivo de la investigacin rigen a las preguntas, su
contenido, orden, profundidad y formulacin se encuentran por entero en las manos del
entrevistador.
Finalmente resumiendo tenemos:
FUENTE

METODO
DIRECTO

PRIMARIA
INDIRECTO
SECUNDARIA

5.18

TECNICA
OBSERVACION
EXPERIMENTACION
ENCUESTA
ENTREVISTA
FICHA

TIPOS DE PREGUNTAS

En La elaboracin del formulario de preguntas de una encuesta o un censo se pueden plantear


preguntas de dos tipos: Abiertas y cerradas
5.18.1 PREGUNTAS ABIERTAS.Son aquellas que se emplean para estudios preliminares para conocer ms del tema o
profundizaren aspectos poco conocidos, lo cual conlleva a obtener bastante informacin
Ejemplo
Fundamentalmente, qu factores afectan el desarrollo de tu aprendizaje?

Tiene La desventaja de dificultar el procesamiento debido a La variedad de opiniones. Se


utiliza cuando se hace estudios exploratorios y cuando se conoce poco sobre el tema.
5.18.2 PREGUNTAS CERRADAS.Son aquellas que contienen alternativas para marcar, las cuales han sido previamente
elaboradas y en muchos casos son el resultado de preguntas abiertas. Permite el rpido
procesamiento.
Son de dos tipos:
a. DE ALTERNATIVA MLTIPLE.Cuando La pregunta menciona varias alternativas se recomienda no mas de cuatro por
ejemplo:
Cual es su estado civil actual? (Marque sobre el nmero segn corresponda)
1. Soltero
2. Casado
3. Divorciado
4. Viudo
b. DICTOMAS.Cuando Posee estricta y nicamente dos opciones Si o no. Ejemplo.
Ha realizado estudios de Post-grado?
1. Si
2. No

Responsable : Ing. R. CESAR CONDORI PALOMINO

40

5.19

ELEMENTOS A CONSIDERAR PARA LA RECOLECCION DE DATOS

Los elementos que con mayor frecuencia se consideran son:


a. Tiempo.- Relacionado al periodo de tiempo destinado a esta actividad de recolectar los
datos, el cual se debe prever con antelacin a fin de tener imponderables o retrasos en el
cumplimiento de los objetivos trazados.
b. Recursos.- Se debe contar con recursos humanos y financieros o materiales para La
recoleccin de los datos.
c. Proceso.- Este elemento debe agilizar y viabilizar los tramites administrativos que sean
necesarios para La realizacin del mismo.
d. Adiestramiento.- Prev La capacitacin del personal a cargo de La aplicacin del
instrumento de recoleccin, el cual debe conocer los objetivos del estudio a fin de contribuir
con La obtencin de informacin real.
e. Coordinacin.- Es el investigador quien debe tener el control de todas las actividades a
desarrollarse, convirtindose en este caso un coordinador o delegando esta actividad de
trabajo que probablemente sea en equipo.
f. Supervisin.- El equipo de investigacin cuenta con personas que realizan el trabajo de
campo, pero se debe contar con una organizacin que prevea el control y supervisin del
mismo.
5.20

LA FICHA TCNICA

Es el documento resumen que se debe presentar antes de iniciar el trabajo de campo de una
encuesta.
Ejemplo:
FICHA TCNICA
UNIVERSIDAD DE LIMA
GRUPO DE OPININ PUBLICA ESTUDIO 217
BARMETRO MARZO 2010 LIMA METROPOLITANA Y CALLAO
SBADO 13 Y DOMINGO 14
OBJETIVO
Obtener informacin sobre la opinin de la poblacin de Lima Metropolitana y Callao, de 18
a 70 aos, acerca de temas polticos, econmicos y sociales de inters pblico.
DISEO MUESTRAL
Universo: Hombres y mujeres residentes en Lima Metropolitana y Callao, de 18 a 70 aos,
de todos los niveles socioeconmicos.
Muestra: 512 personas elegidas en forma aleatoria en base a una distribucin
demogrfica, con afijacin y ponderacin proporcionales. Error permitido: 4,42%. Nivel de
confianza: 95%.
Cobertura: Distritos de Lima Metropolitana y Callao.
Representatividad: 92,14%.
Responsable : Ing. R. CESAR CONDORI PALOMINO

41

Segmentacin: Por nivel socioeconmico, sexo y edad. Procedimiento de muestreo:


Polietpico, con seleccin de las unidades primarias (manzanas) y de las unidades
secundarias (hogares) de manera aleatoria, y de las unidades finales (individuos) por
cuotas de sexo y edad.
TRABAJO DE CAMPO
Aplicacin del cuestionario: Sbado 15 y domingo 16 de marzo de 2010, por
encuestadores del tercio superior de la Universidad de Lima.
Supervisin: 36% de la muestra, personalmente y por telfono.
FINANCIAMIENTO: Universidad de Lima.

EJERCICIO APLICATIVO
El Director de Personal de la Empresa Santa Luca desea estimar la tardanza mensual
promedio del personal que labora en esta Empresa. Con este fin elige al azar la Tarjeta de
Control de Asistencia del ltimo mes de 10 trabajadores. En uno de las tarjetas seleccionadas
se registr 140 minutos de tardanza
La caracterstica
: Tiempo de tardanza mensual
La unidad elemental
: Un trabajador de la empresa
(o unidad de anlisis)
El marco poblacional
: Todo el personal que labora en esa empresa
La poblacin
: Registro de tiempo de tardanza mensual de todo el
personal que labora en esta empresa
El marco muestral
: Diez trabajadores
La muestra
: Registro del tiempo de tardanza de cada uno de los
trabajadores seleccionado
Tipo de dato
: Variable cuantitativa continua
Un dato registrado
: 140
La unidad de medida
: minutos
El estimador
: El tiempo medio de tardanza de los 10 trabajadores:
El parmetro
: El tiempo medio de tardanza de todos los
trabajadores de la empresa ()
EJERCICIO
1. El Director de un Hospital sabe que en lo que va del ao, fueron dados de alta 1000
pacientes hospitalizados y desea conocer el tiempo medio de permanencia en el hospital.
Para ello selecciona al azar la historia clnica de 100 pacientes. Una de las historias permiti
conocer que cierto paciente haba permanecido 6 das hospitalizado. En esta situacin
identifique los siguientes trminos (no se pide la definicin): Caracterstica. Unidad
elemental. Marco poblacional Poblacin. Marco muestral. Tipo de muestreo. Un dato.
Unidad de medida. Un estimador. Un parmetro
2. En que consiste el mtodo de la entrevista ? Cuales son sus ventajas y desventajas?
3. En que consiste el mtodo del Cuestionario? Cuales son sus ventajas y desventajas?
4. Describa las partes que contiene un formulario utilizado para la recoleccin de datos?

Responsable : Ing. R. CESAR CONDORI PALOMINO

42

CAPITULO 6
8. ORGANIZACIN DE LOS DATOS.

6.4. APROXIMACION Y REDONDEO DE DATOS


Con el objeto de hacer ms operativo el manejo de estos datos se redondean. Para cortar o
redondear, se siguen las siguientes reglas. Veamos a continuacin Los cuatro casos que se
presentan cuando trabajamos con nmeros y queremos aproximar a algn decimal:
1. Si al nmero que queremos redondear le sigue un No mayor que cinco (6,7,8,9)
entonces automticamente se incrementa una unidad a ste. Ej. Redondear al milsimo
el siguiente nmero.3,1316
Rpta. 3,132
2. Si al numero que queremos redondear le sigue un No menor que cinco (1,2,3,4)
entonces el nmero queda igual
Ej. Redondear al milsimo el siguiente nmero.7,316376 Rpta. 7,316
3. Si al numero que queremos redondear le sigue un El nmero cinco entonces se prev
dos casos:
a)
Si al nmero a aproximar es PAR entonces el nmero queda igual.
Ej. Redondear al milsimo el siguiente nmero.4,3165376
Rpta 4,316.
b)
Si al nmero a aproximar es IMPAR entonces el nmero es incrementado en
una unidad.
Ej. Redondear al milsimo el siguiente nmero.2,3175376
Rpta 2,318.
6.5. ORGANIZACIN DE DATOS
Un trabajo estadstico siempre dispone de
muchos datos. Estos datos tienen que ser
organizados, ordenados
y presentados
adecuadamente para facilitar la comprensin,
descripcin y anlisis, mediante una serie de
tcnicas y con el uso del computador y un
software estndar, para luego resumirla en
tablas cuadros y grficos adecuadamente
elaborados.
La organizacin y presentacin de
datos estadsticos, supone realizar
siguientes
pasos:

los
los

1. Evaluacin y Crtica: consiste en inspeccionar la validez y confiabilidad de los datos,


para corregir los errores y omisiones de acuerdo a ciertas reglas fijas.
2. Codificacin: tcnica mediante la cual los datos (numrica o verbal) se convierte en un
nmero, que permite su procesamiento electrnico.
3. Clasificacin: consiste en establecer las categoras de las variables
4. Procesamiento o tabulacin de los datos: que es la contabilizacin o registro del nmero
de casos en cada una de las categoras de la variable. El plan de tabulacin es el
primer ordenamiento de los datos, son para construir las llamadas tablas estadsticas.
5. Presentacin de los datos: donde los resultados de la tabulacin, una vez evaluados,
se presentan en cuadros y grficos estadsticos. La presentacin implica tener la
informacin estadstica organizada para proceder al anlisis e interpretacin de los
resultados y de los aspectos considerados de la poblacin en estudio.
Por ejemplo: para ingresar a un equipo de natacin los aspirantes deben diligenciar un formato.
En el formato se debe escribir la edad y el sexo. En un da se diligenciaron 25 solicitudes y se
registraron los siguientes datos. Algunas veces, si los datos son muy complicados, se
codifican, esto quiere decir que se le coloca una palabra clave que identifica un ttulo muy
largo. Cuando ya est elaborada la base de datos se parece a una tabla
EDAD: 16,17,16,17,16,18,16,17,15,16,16,17,17,17,16,16,16,17,16,18,17,15,15,16,17
SEXO: H,M,M,M,H,M,M,H,H,H,H,M,M,M,M,M,H,H,H,H,M,M,M,M,M

Responsable : Ing. R. CESAR CONDORI PALOMINO

43

En los datos obtenidos se identifican dos variables: edad y sexo. La variable edad es
cuantitativa y discreta; y la variable sexo es cualitativa.
6.5.1.

CODIFICACIN Y TABULACION DE LOS DATOS

La codificacin facilita la tabulacin y el conteo. (Obtencin de una buena informacin) La


codificacin de las respuestas da lugar a categoras o modalidades. Es recomendable que los
cuestionarios tengan las alternativas de respuesta precodificadas. Si el cuestionario tiene
preguntas abiertas (respuesta libre), estas previamente debe ser clasificada en categoras.
Ejemplo
Supongamos que hemos preguntado, por medio de entrevistas estructuradas hechas a una
muestra, la opinin que tienen las personas respecto a las Naciones Unidas. Si la pregunta ha
sido abierta, cada responderte habr expuesto sus opiniones en algunas breves frases. La
codificacin nos permitir agrupar sus respuestas, para poder evaluar cules son las opiniones
ms salientes al respecto.
Nuestros cdigos, por ejemplo, pondrn ser:
1. Es una institucin que garantiza (o protege) la paz mundial.
2. Es una institucin que debera ser reformada.
3. Es til por los servicios que presta a los pases menos desarrollados.
4. Es inoperante, ineficiente, etc.
5. No sabe o no opina al respecto
y bueno, as con este ejemplo nos damos cuenta de la importancia de codificar, ya que facilita
el trabajo, y ahora solo trabajamos con cinco nmeros ...
6.6. TABLAS DE FRECUENCIA
Una tabla de frecuencias, son cuadros que indican la distribucin de un conjunto de datos en
clases o categoras y muestran el nmero de elementos y la proporcin de cada uno de los
valores de la variable, permite una buena ayuda para formularse interrogantes acerca de los
datos.
6.6.1.

PASOS PARA LA ELABORACION DE UNA TABLA DE FRECUENCIAS

1. Recoleccin: La primera etapa es la generacin y/o recopilacin de los datos; esto se


obtiene a travs de censos encuestas, boletines, revistas, peridicos, etc. que emitan las
instituciones.
Ejemplo: Supongamos que en una entrevista a pacientes del lo que se busca evaluar son
2 aspectos:
- La opinin sobre la calidad de atencin

Primero, se identifican las categoras:


Muy bueno
Responsable : Ing. R. CESAR CONDORI PALOMINO

44

Bueno
Aceptable
Malo
Muy malo
Segundo, se realiza el conteo de las frecuencias
Tercero, se presenta la tabla, considerando el ttulo y la fuente
CUADRO 1: CALIDAD DEL SERVICIO DE EMERGENCIA

CATEGORIA
MUY BUENO
BUENO
ACEPTABLE
MALO
MUY MALO
TOTAL

No DE
PACIENTES
5
16
12
8
4
45

TASA
PORCENTUAL
11,11
35,55
26,67
17,78
8,89
100

EJEMPLO Nivel de instruccin de la paciente


PARA DATOS CATEGRICOS
OPININ
NIVEL DE
INSTRUCCIN Favorable Desfavorable TOTAL
Analfabeta
Primaria
Secundaria
Superior
TOTAL

EJEMPLO PARA DATOS CUANTITATIVOS


EDAD (en aos)

N de pacientes

Tasa porcentual :%

(fi)

(hi)

39 - 46
47 - 54
55 - 62
63 - 70
71 - 78
Total

Ejemplo
COSTO DE MANTENIMIENTO en soles

91
71
104
85
62

78
69
74
97
82

93
72
62
88
98

57
89
68
68
101

75
66
97
83
79

52
75
105
68
105

99
79
77
71
79

80
75
65
69
69

97
72
80
67
62

62
76
109
74
73

2. Organizacin: Consiste en ordenar las observaciones o dato , ya sea en forma ascendente

Responsable : Ing. R. CESAR CONDORI PALOMINO

45

o en forma descendente.
3. Rango: El Rango de un conjunto de datos est determinado por la diferencia del nmero
ms alto menos el nmero menor del conjunto de datos.
R = No Mayor - No Menor
4. Numero de Intervalos: En algunos caso para un mejor estudio el investigador puede influir
en la determinacin del nmero de intervalos, por ejemplo en un estudio de edades de
nio (podra tener inters en las edades de 0 a 2 nicamente o periodos de cada dos
aos). Sin embargo es frecuente el uso de la LEY DE STURGES Nmero de Intervalos
= 1 + 3,3 * log (No total de datos)
Para nuestro ejemplo: NI = 1 + 3,3 * log (50)
NI = 6,6066 lo cual se aproxima a 7
intervalos.
Tambin es posible definir intervalos dentro de los siguientes limites
5 <= Nmero de Intervalos <= 15
6. Tamao del Intervalo: El tamao del intervalo es la amplitud de cada clase,
o grupo, se obtiene dividiendo el Rango entre el nmero de intervalos.
En nuestro caso
Ancho de clase aproximado = (109 -52)/
6

Cuadro de Frecuencias

a. Intervalos o Clases: La primera columna de la distribucin de frecuencias contiene a las


clases o intervalos cada uno con sus lmites inferior y superior.
El primer intervalo se construye tomando como lmite inferior a la observacin menor, es
decir al menor de los nmeros; a este nmero le adicionamos el tamao del intervalo

COSTO (SOLES)
50
59
60
69
70
79
80
89
90
99
100
109

Frecuencia
2
13
16
7
7
5
50

b. La Frecuencia: Es el nmero de datos o elementos de la muestra, que caen en un


mismo intervalo de clase. Es decir, que sus valores quedan totalmente comprendidos
dentro de los linderos de ese mismo intervalo. La frecuencia puede ser:
c.

Frecuencias Absolutas.- El nmero de veces que se observa un mismo tem (Los


datos de una misma magnitud o clase), o la cantidad d datos que caen en un mismo
intervalo.
Una vez construidos los intervalos, se inicia con el vaciado de todos los datos en los
intervalos correspondientes, esto es conocidos como "paloteo" o conteo". Si se tuviera
ordenados los datos el vaciado de dichos datos se hara mucho ms fcil.

d. Frecuencias Absolutas Acumuladas.- Es la suma de las frecuencias de un intervalo


de clase, con todas las frecuencias de los intervalos que le preceden. De modo que
tambin habr frecuencias acumuladas absolutas y frecuencias acumuladas relativas.
Permite mostrar en trminos numricos la cantidad de observaciones hasta la n-sima
clase o intervalo. Finalmente el ltimo valor de las frecuencias acumuladas coincide con
el total de observaciones.
e. Frecuencias Relativas.- Es la relacin geomtrica entre la frecuencia absoluta y el total
de datos. O sea, el cociente de dividir el nmero de veces que aparece un dato de un
intervalo, entre la totalidad de los datos que conforman la muestra de que se trate.
Responsable : Ing. R. CESAR CONDORI PALOMINO

46

Representan cantidades porcentuales; se obtienen de la divisin de cada frecuencia


absoluta y el nmero total de datos. La suma total de frecuencias relativas se aproxima
a la unidad. De forma similar que en las frecuencias absolutas acumuladas es posible
acumular las frecuencias relativas
f.

Marcas De Clase.- Llamados tambin puntos medios representan el promedio de las


observaciones contenidas en un determinado intervalo. Es un valor central, se
encuentran exactamente en el centro de cada intervalo por tanto su clculo es el
promedio de los lmites superior e inferior de cada clase. Suelen escogerse siempre
intervalos de extensiones iguales.

g. Limites Reales.- O fronteras, indican con claridad el lugar de la separacin entre


clases; se obtienen sumando los lmites superiores de un intervalo ms el lmite inferior
del siguiente intervalo y luego dividiendo por dos.
Para el costo de mantenimiento
Costo
(soles)
limite
inferior

de

mantto
limite
superior

50
60
70
80
90
100

frecuencia
frecuencia
frecuencia
absoluta
absoluta
relativa
acumulada

59
69
79
89
99
109

2
13
16
7
7
5
50

2
15
31
38
45
50

frecuenci
a relativa marca de LIMITES REALES
acumula clase
limite
limite
da
inferior
superior

0,04
0,26
0,32
0,14
0,14
0,1

0,04
0,3
0,62
0,76
0,9
1

54,5
64,5
74,5
84,5
94,5
104,5

59,5
69,5
79,5
89,5
99,5

59,5
69,5
79,5
89,5
99,5

EJEMPLO
Se desea hacer un estudio sobre las calificaciones de 50 estudiantes evaluados en el curso de
Estadstica. Las calificaciones estn en base Centesimal y se muestran a continuacin: 60 33
85 52 65 77 84 65 57 74 71 81 35 50 35 64 74 47 68 54 80 41 61 91 55 73 59 53 45 77 41 78
55 48 69 85 67 39 76 60 94 66 98 66 73 42 65 94 89 88

Para las notas del curso de estadstica


INTERVALOS

frecuencia
frecuencia
frecuencia
absoluta
absoluta
relativa
acumulada

frecuenci
LIMITES REALES
a relativa marca de
acumula clase
limite
limite
da
inferior
superior

limite
inferior

limite
superior

33

42

0,14

0,14

37,5

43

52

12

0,1

0,24

47,5

42,5

52,5

53

62

21

0,18

0,42

57,5

52,5

62,5

63

72

10

31

0,2

0,62

67,5

62,5

72,5

73

82

10

41

0,2

0,82

77,5

72,5

82,5

83

92

47

0,12

0,94

87,5

82,5

92,5

93

100

50

0,06

97,5

92,5

42,5

INTERPRETACIONES
La interpretacin de una tabla de frecuencias se realiza de acuerdo a los objetivos del estudio
en ejecucin. Generalmente se resaltan lo que interesa al usuario, los extremos, los promedios,
etc. es decir las cifras que son de inters y que permitan la demostracin de los objetivos de
todo trabajo estadstico.
Ej. En la tabla anterior:
Se tiene un 24% y un 76% de alumnos desaprobados y aprobados respectivamente en el
curso de estadstica.
Responsable : Ing. R. CESAR CONDORI PALOMINO

47

El 6% de los estudiantes tienen promedio elevado de calificaciones equivalente a 97,5


El 40% de los estudiantes poseen un promedio de nota que flucta entre 63 y 72 ptos.
El 24% de los estudiantes que tienen nota desaprobatoria tienen como nota promedio de
42,5 etc.

DIAGRAMA DE HOJAS Y TALLO


Para el costo de mantenimiento

Actividad
Busque datos de desercin escolar, de analfabetismo, desnutricin de la provincia en
diferentes perodos de tiempos y elabore un informe con textos, cuadros, grficos y
conclusiones. Pueden ser datos de su institucin.
EJERCICIOS
Considrense los siguientes datos, los cuales representan la razn de precio - ganancia de una emisin de acciones,
de certificados de valores vendidos muy por arriba del precio promedio del mercado:
5,26

6,90

8,64

5,47

6,07

6,48

8,72

9,16

5,85

8,51

8,96

7,44

8,82

5,88

7,62

5,67

9,00

5,60

7,64

8,82

5,64

10,08

3,81

6,81

7,49

4,56

7,16

8,61

3,86

6,78

9,02

8,65

6,72

8,26

7,90

6,65

7,25

6,26

6,43

7,71

7,52

6,68

7,98

10,27

7,64

7,17

8,06

6,66

8,26

6,67

6,25

7,63

6,73

7,60

8,14

6,91

7,82

6,76

7,75

7,36

8,52

7,23

7,63

6,95

7,78

10,34

6,86

7,74

6,67

7,10

4,00

1.

A 20 de los asistentes a un teatro se les pregunt por el nmero de hermanos que tienen. Estos fueron los
resultados: 2, 1, 0, 1, 1, 3, 2, 2, 4, 3, 2, 1, 1, 1, 0, 2, 1, 2, 3, 5. Organizar los datos anteriores en una tabla de
frecuencias.

2.

En un saln de belleza se lleva el registro de las tinturas aplicadas a sus clientas. El siguiente es el registro del da
anterior: negro, rubio, castao, negro, negro, negro, negro, rubio, rubio, castao, castao, negro, negro, negro,
negro, negro, negro, castao, rubio, rubio, rubio, castao, negro, negro, negro, negro, rubio, negro, negro, castao.
a. A cuantas personas se les aplic tinte de color rubio?
b. Cul es la frecuencia relativa de las personas a quienes se les aplic tinte castao?
c. A que porcentaje de personas se les aplic tinte negro?
d. Cul es el color de tinte que menos se aplic? A que porcentaje equivale?

3.

Los resultados de un test de inteligencia que midi el cociente intelectual de 25 personas, fueron los siguientes:
121, 100, 92, 100, 75, 75, 121, 92, 75, 92, 100, 121, 150, 97, 92, 75, 121, 150, 150, 100, 97, 92, 97, 121, 100.
Elaborar una tabla de frecuencias.
Cuntas personas tienen un coeficiente intelectual por debajo de 100?
Si se consideran personas superdotadas aquellas que tienen un coeficiente intelectual superior a 130, cuntas
personas superdotadas hay en el grupo? A qu porcentaje equivalen?
Qu porcentaje de personas tiene coeficiente intelectual mayor o igual 100?
Cul es la frecuencia relativa de las personas con coeficiente intelectual 75?
En una encuesta realizada a 25 estudiantes del grado sptimo, acerca del nmero de libros que leen en el ao, se

4.

Responsable : Ing. R. CESAR CONDORI PALOMINO

48

5.

6.

obtuvieron los siguientes resultados: 6, 6, 7, 6, 7, 5, 5, 6, 7, 5, 4, 5, 4, 9, 3, 3, 9, 5, 5, 9, 5, 4, 5, 4, 8.


a. Identifica la variable a estudiar y elabora la respectiva tabla de frecuencias.
Responde:
b. Cuntos alumnos leen tres libros al ao?
c. Cuntos alumnos leen un libro al ao?
d. Cuntos alumnos leen la menor cantidad de libros al ao y cul es su frecuencia relativa?
e. Cuntos alumnos leen la mayor cantidad de libros al ao y a qu porcentaje equivalen?
f. Cuntos alumnos leen entre siete y nueve libros al ao?Cuntos alumnos leen entre tres y cinco libros al ao,
y a cunto equivalen sus frecuencias relativas?
La informacin recogida sobre el medio de transporte escolar utilizado por 150 estudiantes de secundaria, es la
siguiente: 60 estudiantes viajan en el bus escolar, 45 en bus ejecutivo, 18 en buseta, 15 en microbs y 12 en
bicicleta.
a. Elabora la tabla de frecuencias
b. Cul es el medio de transporte ms utilizado?
c. Qu porcentaje representa?
d. Cul fue el nmero de estudiantes encuestados?
e. Cuanto es la suma total de los porcentajes? Cul es la caracterstica de la poblacin que se estudia?
Los sueldos mensuales (en dlares) de 60 empleados de una empresa del Grupo KIRIBAY en el ao 2013 son los
siguientes:
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
Construya la tabla de frecuencia.
Identifique la poblacin, muestra y la variable

7.

8.

9.

Se distribuye el nmero de empresas segn sus inversiones en millones de soles.

Li Ls

fi

4 10
1
10 16
3
16 22
6
22 28
12
28 34
11
34 40
5
40 46
2
Cuntas empresas intervienen en menos de 25 millones de soles?
Se tiene las temperaturas observadas en la zona altoandina sur durante 24 das en C.

Li Ls

fi

hi

-19 - -17
-17 -15
2
-15 -13
8
-13 -11
0.125
-11 -9
4
-9 -7
0.2083
Durante cuntos das se obtuvo una temperatura de 16 a 10?
La tabla muestra la distribucin del ingreso familiar correspondiente a 80 familias.

Li Ls

fi

Fi

hi

160 170
170 180
48
60
180 190
0.125
190 200
0.075
200 210
Determinar el nmero de familias que ganan menos de 200 nuevos soles.
10. Se revisaron 20 lotes de 48 artculos cada uno y se encontr el siguiente nmero de artculos defectuosos por lote: 3, 2, 5,
0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 4, 3, 3, 2, 3
Construir el cuadro de distribucin de frecuencias y qu porcentaje de lotes tienen 2 o ms pero menos de 4 artculos
defectuosos?
11. Dado el siguiente cuadro estadstico referente a los pesos de cierto nmero de pacientes en un hospital.

Li Ls

0 12
12 24
24 36

fi
5
24
18

Responsable : Ing. R. CESAR CONDORI PALOMINO

49

36 48
36
48 - 60
17
Cuntos pacientes pesan mas de 19 y menos de 38 kilos?
12. Los tiempos de vida til (en das) de un tipo de bacteria, se tabul en una distribucin de frecuencias de 5 intervalos de
igual amplitud con frecuencias relativas acumuladas: 0.10; 0.25; 0.55; 0.80; 1.00. Determine la distribucin de frecuencias
absolutas, si la tercera frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si el lmite inferior del
cuarto intervalo es 12.
13. Los datos corresponden a las respuestas de los pobladores de la provincia de Ilo sobre la opinin de la gestin del actual
alcalde categorizado en ( MB = muy bueno, B= bueno , R = regular , D= deficiente):
MB

MB

MB

MB

MB

MB

MB

B
B

D
D
D
a. Presente esta informacin mediante una tabla de frecuencias, luego realice su interpretacin
b. Elabore un grafico adecuado para este tipo de datos

Responsable : Ing. R. CESAR CONDORI PALOMINO

50

APUNTES SOBRE ESTADISTICA

CAPITULO 7:
7. PRESENTACION DE DATOS
Cada vez es ms habitual el uso de grficos o
imgenes para representar la informacin
obtenida. No obstante, la confeccin de dichos
grficos debe hacerse con mucho cuidado, y
hemos de ser muy prudentes ya que un mnimo
error en la representacin de una tabla de
frecuencia puede cambiar por completo la
perspectiva de lo que en realidad desea
mostrarse. Se dice que debe hacerse con
prudencia porque una misma informacin
puede tener muchas formas de representarse,
y no todas son correctas, como debe
suponerse.
En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin De
sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema De referencia
(coordenadas), permiten presentar informacin cuantitativa. La utilidad De los grficos es
doble, ya que pueden servir no slo como sustituto a las tablas, sino que tambin constituyen
por s mismos una poderosa herramienta para el anlisis De los datos, siendo en ocasiones el
medio ms efectivo no slo para describir y resumir la informacin, sino tambin para
analizarla.
7.4.

GRFICOS ESTADSTICOS

Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos,
se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos
estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir
fcilmente los hechos esenciales y compararlos con otros. Los grficos constituyen una forma
muy efectiva de presentar informacin. Su utilizacin ayuda a una mejor comprensin.
Todo grfico tiene tres partes:
El ttulo: especfico, pero completo.
El cuerpo: es el grfico en si mismo.
La fuente: especificar el origen de la informacin.
7.5.

TIPOS DE GRFICOS ESTADSTICOS

Barras
Lneas
Circulares
reas
Cartogramas

7.5.1.

Mixtos
Histogramas
Dispersograma
Pictogramas

EL DIAGRAMA DE BARRAS

Se utiliza para representar datos cuantitativos discretos o datos cualitativos.


Las barras son de igual ancho.
La longitud es proporcional a la frecuencia de la categora.
El espacio entre barras debe ser homogneo, para evitar efecto visual.
GRFICO 2: NMERO DE HIJOS EN EDAD ESCOLAR POR MDICO DEL HOSPITAL CENTRAL
30
25
20

Responsable: Ing. R. CESAR CONDORI PALOMINO

15
10
5
0
0

51

7.5.2.

GRFICOS DE BARRAS VERTICALES

Representan valores usando trazos verticales, aislados o no unos de otros, segn la variable a
graficar sea discreta o continua. Pueden usarse para representar:
o una serie
o dos o ms series (tambin llamado de barras comparativas)

45,0
40,0
35,0
30,0
25,0
20,0
15,0
10,0
5,0
0,0

28,6

12,7
7,8

7,1
1,3
Pago en dinero que
se entrega al
estado.

7.5.3.

QU SON LOS TRIBUTOS

42,5

Prestacin de
contribuciones.

Declaracion jurada
de bienes.

Declaracin jurada
de ganancias.

Prestaciones
pecuniarias.

No indica

GRFICOS DE BARRAS HORIZONTALES


Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se
utilizan cuando los textos correspondientes a cada categora son muy extensos.
o para una serie
o para dos o ms series

La potestad de creacin y administracin de los tributos municipales


es regulada
La potestad de crear y administrar los
tributos municipales no esta regulada

6,3
9,4

No indica

11,1

Todas las anteriores


La Constitucin Poltica del Per y el Cdigo
Tributario

19,7

La ley de tributacin municipal y la ley


orgnica de municipalidades

53,4
0,0

7.5.4.

20,0

40,0

60,0

GRFICOS DE BARRAS PROPORCIONALES

Responsable : Ing. R. CESAR CONDORI PALOMINO

52

Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los


datos que componen un total. Las barras pueden ser:
o Verticales
o Horizontales

7.5.5.

GRFICOS DE BARRAS COMPARATIVAS

Se utilizan para comparar dos o ms series, para comparar valores entre categoras. Las
barras pueden ser:
o Verticales
o Horizontales
RENDIMIENTO ACADEMICO-GRUPO DE CONTROL

14,14

11,03

11,38

PROMEDIO

10,69

14,48

12,41

ENTRADA
SALIDA

COMUNICACIN

PRODUCCION

EVALUACION

DIMENSION
7.5.6.

HISTOGRAMAS
Estos tipos de grficos se utilizan para representa distribuciones de frecuencias. Algn
software especfico para estadstica grafican la curva de gauss superpuesta con el
histograma.

Responsable : Ing. R. CESAR CONDORI PALOMINO

53

CMO LEER HISTOGRAMAS


Tipo general: El valor medio Tipo
multimodal:
Hay
est al centro, que tiene la varios valores mayores.
mayor frecuencia. Es el ms
frecuente tiene forma simtrica

Tipo precipicio a la izquierda:


Forma asimtrica la frecuencia
disminuye bruscamente a la
izquierda

Tipo planicie: Las clases


tienen ms o menos la
misma frecuencia

Tipo sesgo positivo:


Forma asimtrica la
media est localizada a
la izquierda

Tipo
bimodal:
Se
observa claramente dos
valores mximos

Tipo pico aislado: Presenta un pico aislado, adems de un histograma general

7.5.7.

GRFICOS DE LNEAS
En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos
ortogonales entre s. Se pueden usar para representar:
Responsable : Ing. R. CESAR CONDORI PALOMINO

54

o
o

una serie
dos o ms series

NUMERO DE ESTUDIANTES

NIVEL DE LOGRO PROCESO


15
10
5

PRE

M1

M2

M3

M4

M5

M6

M7

M8

M9

M10

M11

M12

POST

INSTRUMENTO

Estos grficos se utilizan para representar valores con grandes incrementos entre s.
7.5.8.

GRFICOS CIRCULARES
Estos grficos nos permiten ver la distribucin interna de los datos que representan un
hecho, en forma de porcentajes sobre un total. Se suele separar el sector
correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden
ser: En dos dimensiones o en tres dimensiones

PRE test

0,00

0,31

0,38

INICIO
PROCESO

0,31

7.5.9.

LOGRO
PREVISTO
DESTACADO

GRFICOS DE REAS
En estos tipos de grficos se busca mostrar la tendencia de la informacin
generalmente en un perodo de tiempo. Pueden ser:
o Para representar una serie
o para representar dos o ms series
o en dos dimensiones
o en tres dimensiones.

Responsable : Ing. R. CESAR CONDORI PALOMINO

55

7.5.10. CARTOGRAMAS
Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La
densidad de datos se puede marcar por crculos, sombreado, rayado o color.

7.5.11. GRFICOS MIXTOS


En estos tipos de grficos se representan dos o ms series de datos, cada una con un
tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar las
diferencias entre las series. Pueden ser:
o en dos dimensiones
o en tres dimensiones.

Responsable : Ing. R. CESAR CONDORI PALOMINO

56

7.5.12. OTROS GRFICOS


En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se
los complementa con un dibujo que est relacionado con el origen de la informacin a
mostrar. Son grficos llamativos, atraen la atencin del lector.
7.5.12.1.

LOS DISPERSOGRAMAS

Son grficos que se construyen sobre dos ejes ortogonales de coordenadas,


llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de
un mismo elemento suceso.

7.5.12.2.

PICTOGRAMAS

Los pictogramas son grficos similares a los grficos de barras, pero empleando un
dibujo en una determinada escala para expresar la unidad de medida de los datos.
Generalmente este dibujo debe cortarse para representar los datos. Es comn ver
grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con
el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un
pictograma.
Pueden ser:

Responsable : Ing. R. CESAR CONDORI PALOMINO

57

o
o

En dos dimensiones
En tres dimensiones.

El motivo de que haya tantos tipos de grficos diferentes no es solamente esttico.


Cada uno de los tipos de grficos est especialmente indicado para representar los
datos de una manera distinta. Por lo tanto, si quieres obtener la mxima eficacia al crear
tus grficos y presentar tus datos de la mejor manera posible debes tener esto muy en
cuenta; que cada tipo de grafico esta destinado para una labor especifica.

7.6.

CUADRO ESTADISTICO

Segn Mendoza & Mendoza "Es el conjunto de datos estadsticos ordenados en columnas y
filas que permite leer compara e interpretar las caractersticas de una o mas variables. Dichos
datos son el resultado de La ejecucin de una investigacin estadstica o el aprovechamiento
con fines estadsticos de un registro administrativo; el mismo que responde a los
requerimientos de los usuarios de La informacin. La adecuada elaboracin de un cuadro
estadstico permite que su contenido sea comprendido sin recurrir a leer el ttulo, y que este a
su vez sea interpretado sin necesidad de observar el contenido.
7.6.1.

ESTRUCTURA DE UN CUADRO ESTADISTICO

1. CODIGO O NUMERO DEL CUADRO: Permite identificar el cuadro de otros por lo que es
necesario asignarle un numero el cual puede ser ascendente y segn el rea o sector al
que pertenece
2. TITULO.: El titulo de un cuadro estadstico debe responder a cuatro preguntas en lo que sea
posible las cuales son:
QUE?
COMO?
CUANDO?
investigacin.
DONDE?

: que es lo que representa


: De que manera esta presentado
: El periodo o fecha en La que se ha realizado el trabajo de
: El lugar en el que se ha realizado La investigacin.

3. COLUMNA MATRIZ: Generalmente contiene al como del titulo


4. ENCABEZAMIENTO.- El conjunto de columnas que contiene informacin
5. CUERPO DEL CUADRO.- Lugar donde se colocan los datos
6. CASILLA.- Son las celdas interseccin de cada columna y fila que contiene a un dato
especficamente. No debe quedar vaca o en blanco.
7. NOTA.- Permite hacer aclaraciones de carcter general del contenido o La metodologa
utilizada en La investigacin
8. LLAMADA.- Permite hacer aclaraciones de carcter especifica.
Responsable : Ing. R. CESAR CONDORI PALOMINO

58

9. FUENTE.- Aqu se seala La entidad responsable de La elaboracin de los datos o el


nombre del documento utilizado.
10. ELABORACION.Aqu se especifica el nombre de La institucin y de la oficina
responsable de dicha utilizacin sealada en La fuente.
EJEMPLO
CUADRO N 01

Hbito de Fumar segn Sexo de los clientes atendidos en el autoservicio


Metro . Ilo Junio - Agosto 2013
Qu: clientes atendidos
Cmo: por hbito de fumar, segn sexo.
Dnde: autoservicio Metro- Chiclayo
Cundo: Junio-Agosto 2012.

UGEL Ilo: MATRCULA EN EL SISTEMA EDUCATIVO POR TIPO DE GESTIN Y REA


GEOGRFICA, SEGN ETAPA, MODALIDAD Y NIVEL EDUCATIVO, 2009

Etapa, modalidad y

Total

Gestin

rea

Sexo

Responsable : Ing. R. CESAR CONDORI PALOMINO

59

nivel
educativo

Pblica

Privada

Urbana

Rural Masculino Femenino

Total

19 175

15 427

3 748

18 963

212

9 856

9 319

Bsica Regular

17 439

13 979

3 460

17 227

212

8 813

8 626

Inicial

3 589

2 846

743

3 377

212

1 844

1 745

Primaria

7 752

6 134

1 618

7 752

3 896

3 856

Secundaria

6 098

4 999

1 099

6 098

3 073

3 025

645

433

212

645

382

263

96

96

96

49

47

995

919

76

995

612

383

Superior No
Universitaria

Pedaggica

Tecnolgica

Artstica

Bsica Alternativa 1/
Bsica Especial
Tcnico-Productiva 2/

1/ Incluye Educacin de Adultos.


2/ Incluye Educacin Ocupacional.
Fuente: MINISTERIO DE EDUCACIN - Censo Escolar.

EJERCICIOS
1.

Dado el cuadro siguiente : complete el cuadro de acuerdo a las normas estadstica de presentacin.
CATEGORIA

HOMBRES

MUJERES

TOTAL

DOCENTES

25

15

40

ADMINISTRATIVOS

SERVICIO

2. El PBI para la actividad extractiva fue como sigue: Agricultura 16.8 en 1970 y 7.6 en 1995 . Pesca 2.2 en 1970 y
0.5 en 1995. Minera 25.2 en 1970 y 6.4 en 1995. Con los datos dados y de acuerdo a las normas de presentacin
y diseo de cuadros estadisticos Elabore dicho cuadro.

3. Dado el siguiente cuadro


ESTADO CIVIL

SOLTEROS

CASADOS

VIUDOS

DIVORCIADOS

HOMBRE

12

18

MUJER

18

16

De acuerdo a las reglas de diseo y presentacin de cuadros estadsticos complete las partes del cuadro dado y
de ser posible seale sus partes.

Responsable : Ing. R. CESAR CONDORI PALOMINO

60

CAPITULO 8

9.1 SUMATORIAS
El smbolo "" "sigma" significa sumando o sumatoria, tomado del alfabeto griego denota la
suma de la variable X desde el lmite inferior "i" hasta el lmite superior "n".

i es el valor inical llamado lmite inferior.


n es el valor final llamado limite superior.

X1 + X2 + X3 + ....+Xn

n
Xj
j=1

PROPIEDADES BASICAS DE LA SUMATORIA


TEOREMA 1.

La sumatoria de una constante es igual a producto del lmite superior por la


constante.
n
a=nxa
i

Ejm:

5
3= 5+5+5=3x5
j=1
TEOREMA 2. La sumatoria de una variable multiplicada por una constante o la sumatoria de
una constante por una variable es igual a la constante multiplicada por la
sumatoria de la variable.
Ejm:
n
n
Xi * a = a Xi
i=1
i=1
TEOREMA 3. La sumatoria de la suma algebraica de 2 o ms variables es igual a la suma
algebraica de la sumatoria individual de las variables.
n
n
n
n
(Xj + Yj + Zj) =
Xj +
Yj + Zj
i
i
i
i
TEOREMA 4. Si ha de efectuarse alguna operacin sobre los valores individuales de una
variable antes de la adicin se indica esto por notacin, se indica esto por
notacin matemtica a menos que se incluya el signo de adicin; la adicin se
hace despus de la otra operacin. Se efecta en orden de operaciones.

EJERCICIOS
SUMATORIAS
1.

Desarrollar:
3
(Xi - 2)
i

n
2
(Xi + c)
i

n
(Xi - a) (Yi + b)
i

n
( aXj + bYj + cZj)
j

4
3
(Yj - 3)
j

Responsable : Ing. R. CESAR CONDORI PALOMINO

61

2.

Si X1 = 1 ;
Y1 = 2 ;
Hallar:
3
3
a) (Xi) (Yi)
i
i

X2 = 3 ;
Y2 = 5 ;

X3 = 4
Y3 = 7
3
b) Xi Yi
i

2 3
c) XiYj
i j

9.2 MEDIDAS DE TENDENCIA CENTRAL


Una medida de tendencia central o medida de centralizacin es un valor representativo de
un conjunto de observaciones, denominado tambin promedio; se localizan en el centro de
un conjunto de datos ordenados debidamente en forma creciente o decreciente o en una
distribucin de frecuencias. Entre ellas tenemos:
La media Aritmtica
La mediana
La moda
La media geomtrica
La media armnica
Cada una de las MTC tienen sus ventajas e inconvenientes segn su aplicacin.
9.2.1

LA MEDIA ARITMETICA

La media aritmtica es una MTC que nos indica


el centro de una distribucin de frecuencias, se
le denota por para datos muestrales y
para datos poblacionales,
viene a ser el
cociente de dividir la sumatoria de los
elementos entre el nmero de ellos.
Es decir, que la media aritmtica es igual a la
suma de todos los elementos o datos que
componen la muestra, dividida entre el nmero
de ellos mismos.
9.2.1.1 PROPIEDADES DE LA MEDIA ARITMTICA
Al evaluar la media se incluyen todos los valores
Un conjunto de datos solo tiene una media. Esta es nica.
La media es una medida muy til para comparar dos o ms poblaciones
La media aritmtica es la nica medida de tendencia central en donde la suma de cualquier
valor con respecto a la media siempre ser cero.
9.2.1.2 VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMTICA
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no estn
agrupados, su clculo
tedioso
Si los datos estn agrupados en clases con
extremos abiertos, no
posible calcular la
media.
9.2.1.3 CALCULO DE LA MEDIA ARITMETICA

es
es

1. PARA DATOS NO AGRUPADOS.Es decir cuando no se han agrupado en una tabla de distribucin de frecuencias.
Responsable : Ing. R. CESAR CONDORI PALOMINO

62

Si se tiene el nmero de datos y los datos X1, X2, X3, .....Xn entonces:

Dnde:
= Designa la media aritmtica
xi
n

= Valores que toma la variable en la poblacin o en la muestra.


= Es el nmero total de observaciones o datos

Ejemplo:
Calcular la Media Aritmtica de las edades de 6 voluntarios que se presentan a la compaa de
bomberos del Puerto de Ilo : 14, 20, 24, 29, 26, 17
=

14 + 20 + 24 + 29 + 26 + 17
------------------------------------- =
6

130
--=

21.67
6

Luego la edad promedio de los voluntarios del cuerpo de bomberos es de 21,67 aos o 22
aos.
Ejemplo:
Supngase que un almacn tiene 12 empleados, y sus sueldos mensuales son: $385.000 391.000 - 363.800 - 421.300 - 423.000 - 791.000 - 323.000 - 356.000 - 456.000 - 550.000 320.000
346.200
Se quiere determinar la media aritmtica o promedio de los sueldos de los 12 Vendedores
Solucin:

El promedio del sueldo mensual, ser de $427.191,67

2. PARA DATOS AGRUPADOS.Se denomina datos agrupados a los que se encuentran contenidos en una distribucin de
frecuencias.

= Designa la media aritmtica


xi
fi
n

= Es el punto medio de cada clase o marca de clase.


= Es la frecuencia absoluta de cada clase.
= Es el nmero total de frecuencias o datos.

Ejemplo
De la tabla de distribucin de frecuencias anterior, tenemos:

El promedio de las ventas de los almacenes es de $11.430.000

Ejemplo: El nmero de glbulos rojos obtenidos por muestra en 20 pacientes estudiados, se


muestran en la siguiente distribucin de frecuencias (expresados en miles)

Responsable : Ing. R. CESAR CONDORI PALOMINO

63

No de Glbulos
rojos (miles)

No de
pacientes

Marcas de
clase

fi * mi

0-2

3-5

20

6-8

28

9 - 11

10

80

12-14

13

13
143

Luego fi x mi = 143

fi = 20

Reemplazando los valores en la formula:


fi x mi 143
X = ----------- =
fi

-----20

= 7.15

Concluimos que hay un promedio de 7150 glbulos rojos por muestra el conjunto de 20
personas que entran al presente estudio.
Existen otros tipos de medidas de medias aritmticas cuyo uso no es muy frecuente. Estas son:
9.2.2

MEDIA ARITMTICA PONDERADA

Es un caso especial de la Media Aritmtica. Se presenta cuando hay varias observaciones,


parmetros o caractersticas que tienen el mismo valor y se presenta en los datos agrupados
en una tabla de distribucin de frecuencia.

Ejemplo:
En el caso de los pescados, si se capturan 5 de 6 kg., pero entre ellos hay 2 que por su calidad
especial o su mayor precio en el mercado, como decir: 2 lenguados y los dems jureles, no
conviene considerarlos iguales a los otros 3. En estos casos, tales datos han de ser
ponderados, multiplicndolos por algn factor escogido convencionalmente.
Ejemplo:
En el curso de Estadstica se obtiene la nota final tomando el 50% del promedio
exmenes, 20 % de los trabajos encargados y 30% de las practicas calificadas.

de los

Sabiendo que las notas de un estudiante son : 15, 14 y 12 respectivamente, entonces:


El promedio final ser
(0.50) ( 15) + (0.20) (14) + (0.30) (12)
X = ------------------------------------------------------ =
0.50
+
0.20
+
0.30

13.9

Ejemplo:
Cinco grupos de estudiantes de 43, 31, 35, 40 y 27 registraron una media de pesos de 72,
67,69,y 75 Kilogramos respectivamente. Calcular el peso medio del conjunto de estudiantes.
fi X
X = ------- fi
43 (72) + 31 (67) + 35 (69) + 40 (63) + 27 (75)
Responsable : Ing. R. CESAR CONDORI PALOMINO

64

X =

------------------------------------------------------------------43
+
31
+
35
+ 40
+ 27

= 68.938

Luego el peso promedio del conjunto de estudiantes (176) es de 38.938 o 69 Kilogramos


Ejemplo:
Una tienda deportiva vendi 16 balones. 4 balones rojos, 8 balones blancos 4 balones azules.
Los balones rojos a $250.000.oo, los azules $300000.oo y blancos a $350.000.oo. Se quiere
hallar
el
promedio
de
las
ventas
de
globos.
Solucin

El promedio ponderado de las ventas de balones es de $312.500

9.2.2.1 MEDIA GEOMTRICA


Esta medida es til para encontrar el promedio de porcentajes, razones, ndices o tasas de
crecimiento.
Se utiliza cuando se quiere dar importancia a valores pequeos de la variable o cuando se
desea obtener el promedio de una serie de valores que estn dados en progresin geomtrica.
La
Media
Geomtrica,
se
simboliza
por
[Mg].
Se define como la raz ensima del producto de los (n) valores de la variable.

Solo se puede calcular si no hay observaciones negativas. Es una medida estadstica poco
usual.
Ejemplo:
Supngase que las utilidades obtenidas por una compaa constructora en 4 proyecto fueron
de 3, 2, 4 y 6%, respectivamente. Cul es la media geomtrica de las ganancias?
Solucin:

La media geomtrica de las utilidades es de 3.46%


9.2.2.2 MEDIA ARMNICA
La media armnica de n observaciones es la inversa de la media de las inversas de las
observaciones y la denotaremos por H.

Al igual que en el caso de la media geomtrica su utilizacin es bastante poco frecuente


Ejemplo:
Se sabe que 2 operarios, A y B, gastan 50 y 40 minutos respectivamente en reparar una
aspiradora. Cul es el tiempo promedio requerido de reparacin de una aspiradora?
Solucin:

Responsable : Ing. R. CESAR CONDORI PALOMINO

65

El tiempo promedio requerido para reparar una aspiradora es de 44.44 minutos.


EJERCICIOS
Problema 1.
El problema de las tasas de delito.
Al evaluar, durante seis meses, las tasas de delito
entre dos ciudades (Ciudad A y Ciudad B), un
investigador encontr que en la Ciudad A, el promedio
(media aritmtica) de automviles robados fue de 25,
la mediana de 20 y la moda de 15 automviles. En la
Ciudad B tambin el promedio de automviles robados
por da fue de 25, pero la mediana fue de 30 y la moda
de 35. Sobre la base de la informacin anterior en
qu ciudad te sentiras ms seguro para estacionar su
automvil en la calle? Justifica tu respuesta.
Problema 2. El problema de la edad de las personas.
Si la edad promedio (media aritmtica) de un grupo de
15 personas, que asistieron a una reunin, es de 18

9.2.3

aos:
a) Cul cree Usted que sea el rango de edad de las
personas?
b) Proponga la edad de cada persona, de tal forma
que cumpla con el promedio dado.
c) Despus de haber realizado el inciso b, sigue
Usted sosteniendo la respuesta dada en a)?
Problema 3. El problema de las ventas.
Un dependiente de un centro comercial realiz diez
ventas en la ltima hora. El promedio de dichas ventas
fue de $720. Las ventas de nueve de ellas fueron:
$480, $710, $790, $955, $445,$572, $754, $834 y
$970. Si uno de los clientes regres la mercanca A
cunto equivala la venta de dicha mercanca?.

LA MEDIANA

Es la medida que divide en dos


subconjuntos iguales a datos, de tal
manera que 50% de los datos es menor a
la mediana y el otro 50% es mayor a la
mediana. Es aquella medida de tendencia
Central que divide a una distribucin de
frecuencias en dos partes iguales . Se
denota por X (MED), (MD).
9.2.3.1 CARACTERISTICAS
DE
LA
MEDIANA
Las principales propiedades de la mediana son:

Es menos sensible que la media a oscilaciones de los valores de la variable. Un error


de transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo
nmero, deja a la mediana inalterada.

Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso


cuando alguno de ellos no est acotado.

No se ve afectada por la dispersin. De hecho, es ms representativa que la media


aritmtica cuando la poblacin es bastante heterognea. Suele darse esta circunstancia
cuando se resume la informacin sobre los salarios de un pas o una empresa. Hay
unos pocos salarios muy altos que elevan la media aritmtica haciendo que pierda
representatividad respecto al grueso de la poblacin. Sin embargo, alguien con el
salario "mediano" sabra que hay tanta gente que gana ms dinero que l, como que
gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor
vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos algebraicos tan
bien como
9.2.3.2 CALCULO DE LA MEDIANA:

1. DATOS NO AGRUPADOS
Responsable : Ing. R. CESAR CONDORI PALOMINO

66

CUANDO EL NUMERO DE DATOS ES IMPAR


Ejemplo:
Dados los siguientes datos: 2, 5, 11, 9, 11, Calcular la mediana
a. Ordenar los datos en forma ascendente o descendente:
2, 5, 9, 11, 11
b. Hallamos el dato que divide un nmero igual de datos a cada lado ; en este caso la
mediana de los cinco datos es 9.
CUANDO EL NUMERO DE DATOS ES PAR
Ejemplo: Encontrar la mediana de los siguientes datos 9, 6 2, 5, 18, 12.
Sol.
a. Ordenamos en forma ascendente.
2
5
6
9
12
18
b. Luego calculamos la media aritmtica de los dos valores centrales
6+9
X = ------- =
7.5
Luego la mediana es 7.5
2
2. DATOS AGRUPADOS
Para el clculo de la mediana en datos agrupados en una distribucin de frecuencias se
emplea la frmula siguiente:
fi / 2 - Fa
X = F + ---------------- x J
Fcm
Donde:
F
fi / 2
fi
Fa
Fcm
J

=
=
=
=
=
=

Frontera inferior de la clase mediana


Centro de la distribucin
Frecuencias Absolutas
Frecuencias absoluta acumulada anterior a la clase mediana
Frecuencia de la clase mediana
Tamao del intervalo

Ejemplo :
El nmero de glbulos rojos obtenidos por muestra en 20 pacientes estudiados, se muestran
en la siguiente distribucin de frecuencias (expresados en miles)
No de G.R.
en miles
0-2
3-5
6-8
9 - 11
12 - 14

No de Pacientes
fi
2
5
4
8
1
20

marcas de
clase mi
1
4
7
10
13

fi x mi
2
20
28
80
13
143

Sol.
Calculamos el centro de la distribucin
fi / 2 = 20 / 2 = 10
Este nmero 10 se compara con las frecuencias absolutas acumuladas y vemos que se
encuentra entre 7 y 11; donde se puede tomar el valor menor, en este caso 7, considerando en
este caso esta fila como clase mediana.
No de G.R.
L.i
0

Ls.
2

Nmero de
persona
2

Frecuencias
Abs. Acum.
2

Fronteras
L.i.

L.s.
2.5

Responsable : Ing. R. CESAR CONDORI PALOMINO

67

3
6
9
12

5
8
11
14

5
4
8
1

7
11
19
20

2.5
5.5
8.5
11.5

5.5
8.5
11.5

Con los datos de la clase mediana (1ra) y utilizando la frmula clave calculamos la mediana .

X = 2.5

(10 - 2)
------------------ x 3
5

= 7.3

Pero este valor 7.3 como ver el lector no est contenido en la 1ra clase mediana, se
encuentra fuera del intervalo (3-5), por lo tanto ste valor no se considera como la mediana de
la distribucin de frecuencias.
Entonces en el problema planteado, aproximamos a 11 obtenndo as la 2da clase mediana.
Luego:
(10 - 7)
X = 5.5
+ ------------------ x 3 = 7.75
4
La mediana hallada necesariamente debe estar dentro del intervalo en el que se encuentra la
clase mediana.
INTERPRETACION: Existen 7.75 o 7750 glbulos rojos por unidad de muestra por cada
persona.
9.2.4

LA MODA

La moda representa a aquel dato que se


presenta u ocurre con mayor frecuencia
en grupo de observaciones se le denota
por X
9.2.4.1 CARACTERISTICAS
Sus principales propiedades son:
Clculo sencillo.
Interpretacin muy clara.
Al depender slo de las frecuencias,
puede
calcularse
para
variables
cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una poblacin no es
posible realizar otros clculos, por ejemplo, cuando se enumeran en medios periodsticos
las caractersticas ms frecuentes de determinado sector social. Esto se conoce
informalmente como "retrato robot".
INCONVENIENTES
Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a
variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor
depende excesivamente del nmero de intervalos y de su amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de
la moda, no afectan en modo alguno a su valor.
No siempre se sita hacia el centro de la distribucin.
Puede haber ms de una moda en el caso en que dos o ms valores de la variable
presenten la misma frecuencia (distribuciones bimodales o multimodales).

Responsable : Ing. R. CESAR CONDORI PALOMINO

68

9.2.4.2 CALCULO DE LA MODA


1. PARA DATOS NO AGRUPADOS
La Moda es el dato o los datos que mayormente se presentan. Se ilustrar los diferentes
casos a travs de ejemplos
Ejemplo 1
Dados los datos 3, 4, 6, 6, 2, 3 En este caso hay dos modas X1 = 6 y X2 = 3
Ejemplo 2
Con los datos 4, 5, 4, 5, 6, 7

De la misma forma hay dos modas X1 = 4 y X2 = 5

Ejemplo 3
Dados los datos 8, 2, 1, 8, 2 8

En esta caso hay una sol amoda X = 8

Ejemplo 4
Dados los datos 2, 4, 5, 8, 13

Aqu no hay moda.

2. DATOS AGRUPADOS
Para el clculo de la moda en datos agrupados en una distribucin de frecuencias se usa la
frmula siguiente:
D1
X = FI +
-------------------J
D 1 + D2
Donde :
FI
=
Frontera inferior donde se encuentra localizada la clase modal
D1
=
Fm - F1
Fm
=
La frecuencia absoluta correspondiente a la clase modal
FI
=
Frecuencia absoluta anterior a la clase modal
D2
=
Fm - F2
F2
=
La frecuencia absoluta posterior a la clase modal
=
Amplitud o tamao del intervalo.
J
NOTA: La clase modal est determinada por la frecuencia absoluta ms alta.
EJEMPLO:
Tomando la distribucin de frecuencias del problema de los 20 pacientes en un estudio de
muestras de glbulos rojos.
LA CLASE MODAL para esta distribucin lo determina la frecuencia absoluta ms alta, en este
caso 8 y queda en el cuarto intervalo o cuarta clase.
No de G.R.
L.i
Ls.
0
3
6
9
12
F1 = 4

Nmero de
Personas

2
5
8
11
14
F2 =

2
5
4
8 Cmodal
1
1

Fm = 8

Frecuencias
Abs. Acum.
2
7
11
19
20
J = 3

L.i.
2.5
5.5
8.5
11.5

Fronteras
L.s.
2.5
5.5
8.5
11.5

FI = 8.5

Reemplazando los valores dados en la formula para el calculo de la moda en datos agrupados
en una distribucin de frecuencias.
(8 - 4)
X = 8.5 + ------------------------- x 3
= 9.591
( 8 - 4) + (8 - 1)
(9.591 esta contenido en el intervalo de la clase modal)

Responsable : Ing. R. CESAR CONDORI PALOMINO

69

Luego: La moda es de 9.591 G.R. por mm3 .


En conclusin las Medidas de tendencia central, nos permiten identificar los valores ms
representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media
nos indica el promedio de los datos; es decir, nos informa el valor que obtendra cada uno de
los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos
informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con
el cincuenta porciento de los datos. Por ltimo la Moda nos indica el valor que ms se repite
dentro de los datos.
EJERCICIOS
1.

Las calificaciones de un estudiante en cinco asignaturas fueron 17, 15.2, 18.6, 16.4, y 19.2.
a. Hallar la media aritmtica, la mediana y la moda de dichas calificaciones.
b. Cual de las siguientes medidas utilizaria Ud. Por qu?

2.

Los tiempos de reaccin de un individuo a determinados estmulos fueron 0.53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44,
0.55 segundos respectivamente.
a. Determinar el tiempo medio de reaccin del individuo a los estmulos.
b. Calcular la mediana y contrastar con la media aritmetica.

3.

Una serie de nmeros est formada por Seis 6, siete 7, ocho 8, nueve 9, y diez 10.
a. Cul es la media aritmtica?
b. Cual es la mediana
c. Cual es la moda?

4.

Las calificaciones de un estudiante en los tres objetivos de la Unidad formativa fueron 14.2, 15.6, y 17.8 . Si los
pesos asignados a cada calificacin son de 2, 4 y 5 respectivamente.
a. Cual es el promedio adecuado para sus calificaciones?.
b. Cul sera el promedio del ejercicio anterior si todos los pesos fuesen iguales?

5.

Tres secciones que desarrollaban el curso de Estadstica registraron una clasificacin media en sus exmenes de
12.8, 13.4, 13.8. Dichas secciones estaban formadas por 27, 25, y 21 estudiantes respectivamente. Determinar la
calificacin media para todas las secciones

6.

La siguiente tabla muestra la distribucin de la carga mxima en toneladas cortas (una tonelada corta = 2000
libras) que soportan ciertos cables producidos por una compaa. Determinar las medidas de centralizacin de la
carga mxima.

MAX. DE CARGA
Ton. Cortas
9.3
9.8
10.3
10.8
11.3
11.8
12.3
12.8

7.

No de cables
fi

9.7
10.2
10.7
11.2
11.7
12.2
12.7
13.2

2
5
12
17
14
6
3
1

Los sueldos mensuales (en dlares) de 60 empleados de la empresa Gustos y Sabores es en el ao 2008 son los
siguientes:

440
453
570
440
450
574
o
o

560
650
430
340
530
500

335
407
618
558
501
462

587
376
537
460
471
380

613
470
409
560
660
518

400
560
600
607
470
480

424
321
550
382
364
625

466
500
432
667
634
507

565
528
591
512
580
645

393
526
428
492
450
382

Calcular las medidas de tendencia central


Interprete sus resultados
Responsable : Ing. R. CESAR CONDORI PALOMINO

70

8.

En un centro hospitalario de la provincia de Ilo se ha tratado, con un nuevo medicamento llamado SINDO, durante
5 das a un grupo de pacientes, todos ellos padecen de jaqueca crnica (se despiertan todos los das con dolor de
cabeza). Se realiza un estudio sobre el n de das que un paciente sufre mejora con el anterior medicamento
obteniendo la tabla:

Valores
xi

a.
b.
c.

9.

Frecuencias
ni

100

250

300

500

450

2000

Realizando el grfico adecuado y hallando los promedios (Media aritmtica, , Moda, y Mediana), indicar cul
sera el que mejor representara los datos, (Contesta razonadamente y con el mayor detalle posible)
Calcula tambin el porcentaje de pacientes que sienten mejora con el medicamento en todos los das del
tratamiento.
Por qu no calculamos el coeficiente de variacin para ver la representatividad de la media? Habra que
hallarlo?.

Se ha realizado una estadstica en el centro comercial CONTINENT sobre los gastos (en miles de soles) que una
familia tiene cuando realiza sus compras un da cualquiera de la semana. Este estudio nos aporta la siguiente
tabla:

Intervalos Frecuencias
0-5

1000

5-10

1100

10-20

1600

20-50

1000

50-100

300

a. Halla los ingresos que en ese da tuvo el centro comercial y el gasto medio, modal y mediano de cada familia.
b. Estudiar la representatividad del gasto medio. Es representativa? Por qu?
10. Se realiza una estadstica en dos centros de enseanza, uno pblico y otro privado, referente a la nota global del
bachillerato de cada uno de los alumnos que van a acudir a los exmenes de selectividad. Las distribuciones de
frecuencias son las siguientes:

Centro privado
Nota global
cada alumno.

de

Frecuencias

5,5

10

6.5

15

7.5

20

8.5

30

9.5

15
Centro pblico

Nota global
cada alumno.
[5 , 6]

de

Frecuencias
250

Responsable : Ing. R. CESAR CONDORI PALOMINO

71

(6 , 7]

150

(7 , 9]

100

(9, 10]

20

a.

A la vista de la tabla, te sugiere algn comentario de especial importancia. Cul es el motivo de que los
datos se presente en dos tablas de diferente tipo ?
b. Estudiar las diferentes medidas de tendencia central (promedios) en las dos distribuciones. En cada
distribucin cul te parece ms representativo? por qu?
c. Hallar el porcentaje de alumnos que en cada centro tiene una nota global superior al 7.
d. Estudiar la representatividad de las medias obtenidas en las distribuciones por separado. En cul de las
dos es ms representativa?
11. A la finalizacin del curso "Informtica e Internet" se realiz un examen tipo test a los 300 alumnos obtenindose la
siguiente tabla relativa al nmero de preguntas acertadas:

N preguntas acertadas N de alumnos


0-10

10

10-15

20

15-20

60

20-23

100

23-25

70

25-30

30

30-40

10

a.
b.
c.
d.

Representa grficamente la distribucin de frecuencias anterior


Hallar la media
Cul es el nmero de preguntas que ms se repite? Contesta con todo detalle.
Para la realizacin de la segunda parte del curso se convocan sesenta plazas. Hallar el nmero de preguntas
mnima que ha debido acertar un alumno para poder realizar la continuacin del curso.
12. Una vez finalizado este segundo curso, se realiza un examen a los alumnos obtenindose las siguientes notas:

Notas N Alumnos

e.
f.
g.

12

5.5

15

14

6.5

Por qu no se agrupan los datos en intervalos, como anteriormente?


Halla la mediana, la moda
Hallar y estudiar la media y su representatividad.

13. Se revisaron 20 lotes de 48 artculos cada uno y se encontr el siguiente nmero de artculos defectuosos por lote:
3, 2, 5, 0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 4, 3, 3, 2, 3
a. Calcular las medidas de tendencia central
b. Interprete sus resultados

14. Hallar la moda de los siguientes datos:


20.0, 18.8, 19.7, 20.0

18.3, 20.6, 19.3, 22.4, 20.2, 18.8, 19.7, 20.0, 22.4, 20.2, 18.8, 19.7,

15. Dado el cuadro siguiente:

ING. SEMANALES

50 - 89
No TRABAJADORES 7

90 - 129 130 - 169 170 - 209 210 - 249 250 - 289


12

19

Responsable : Ing. R. CESAR CONDORI PALOMINO

72

a) calcular la media aritmtica de los ingresos.


b) Si Ud. tuviera que sustentar con gerente los ingresos semanales de la empresa que MTC utilizara? Porque?
c) Interprete todos sus resultados
16. Los siguientes datos indican ventas diarias en nuevos soles de una almacn: 45 95 110 120 135 85 76 59 68 71 en
sus primeros dias. Elabore un informe que indique graficamente el comportamiento de las ventas, el promedio de
ventas
17. Los siguientes son notas de inteligencia rapida aplicada a un grupo de 101 estudiantes:

CALIFICACIONES

84.5 - 87 87 - 89.5 89.5 -92


No DE ESTUDIANTES 13
14
21
a.
b.

92 - 94.5

94.5 - 97

97 - 100

29

14

10

Calcula el promedio de calificaciones y efecte su correcta interpretacin.


Es la mediana una buena MTC para interpretar los datos? Porqu?

18. Se ha recibido una muestra compuesta de 100 probetas de concreto con el objeto de ser analizadas. Una de las
pruebas consisti en determinar la carga de rotura en (Kgr/cm2 )de dichas probetas, encontrndose los siguientes
resultados.)
Intervalo de rotura
120-125 125-130 130-135 135-140
140-145
No de probetas 10
20
33
25
1
a. Calcular la Media aritmtica e interprete

Responsable : Ing. R. CESAR CONDORI PALOMINO

73

CAPITULO 9
9.3 LA DISPERSIN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo nos
revelan una parte de la informacin que necesitamos acerca de las caractersticas de los datos.
Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin su
dispersin, extensin o variabilidad.
La dispersin es importante porque:
Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es
menos representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser
capaces de distinguir que
presentan esa dispersin
antes de abordar esos
problemas.
Quiz se desee comparar
las
dispersiones
de
diferentes muestras. Si no
se desea tener una amplia
dispersin de valores con
respecto al centro de
distribucin o esto presenta
riesgos
inaceptables,
necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las
dispersiones ms grandes.
Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad de describirla.
Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es importante, cmo
medimos la variabilidad de una distribucin emprica?. Vamos a considerar slo algunas
medidas de dispersin absolutas: el rango, la varianza, la desviacin estndar y el coeficiente
de variacin

9.4 MEDIDAS DE DISPERSION


Cuando se tiene un conjunto de observaciones tomadas de una poblacin, cuyos valores son
cercanos o distantes de un valor promedio; se dice que existe mucha o poca variacin o
dispersin. Esta medicin de la variabilidad existente en los datos estadsticos se llama una
medida de variacin.
Por ejemplo: Cuando estudiamos el tiempo que emplean los alumnos para llegar al centro de
estudios y relacionar con el problema de transporte, algunos emplean casi una hora mientras
que otros tardan un tiempo menor y as varan de acuerdo a muchos factores.
Si promediamos los tiempos obtendremos un valor representativo (una MTC) alrededor de la
cual estn los tiempos de los estudiantes, algunos cerca otros distantes de dicho promedio,
entonces. Cmo mostrar esta poca o mucha variacin de los tiempos que demoran los
alumnos en llegar a su centro educativo? A travs de una Medida de Variabilidad.
Entre las medidas que muestran la variabilidad de un conjunto de datos con que cuenta la
Estadstica se tiene:
El Rango
La Desviacin Media
La desviacin Cuartlica
La Varianza
La desviacin estndar
El coeficiente de variabilidad

Responsable : Ing. R. CESAR CONDORI PALOMINO

74

9.4.1

EL RANGO

Es la variabilidad que presenta un conjunto de datos en relacin con el menor y el mayor de


stos.
Es la diferencia entre el mayor valor y el menor . Depende mucho de los valores extremos por
que se suele utilizar el rango intercuartlico =
Q3 - Q1 o el rango entre percentiles = P90 - P10
Ejemplo: Para el caso de las notas sera 9 - 0 = 9
CARACTERISTICAS
No se encuentra influenciado por el conjunto de datos.
No es susceptible de operaciones Algebraicas
Es una medida de dispersin burda.
Cuando es ancha no es aceptable
Para el clculo no es necesario una MTC
CALCULO DEL RANGO:
1. DATOS NO AGRUPADOS
Ejemplo:
Dados los datos 4, 10, 5, 7, 11
El Rango es 11 - 4 = 7
La MTC es en este caso:
existe

media aritmtica = 7.4 ; mediana = 7

moda

CONCLUSION:
La mejor manera de concluir es que mientras ms alejado se encuentra un valor es
mala medida.

no

una

2. DATOS AGRUPADOS
Cuando se encuentran contenidos en una tabla de frecuencias el rango se calcula en las
columnas de Clases e intervalos y la columna de Marcas de Clase.
METODO 1 :
Rango = limite superior de la ultima clase - limite inferior de la primera clase
METODO 2:
Rango = punto medio del la primera clase - punto medio de la ultima clase

9.4.2

LA DESVIACION MEDIA

Hace referencia a la media aritmtica de las desviaciones tomadas en valor absoluto, respecto
de un promedio. Dicho promedio puede ser la media aritmtica, la mediana o la moda, es una
medida poco utilizada, sobre todo porque existen otras que permiten un superior desarrollo
estadstico a partir de su valor.
Llamado tambin promedio de desviacin es la media aritmtica de las desviaciones de los
valores individuales con respecto al promedio o medida de tendencia central de las
observaciones

9.4.2.1 CARACTERISTICAS
La desviacin media est menos influenciada por los valores extremos de un grupo de
observaciones que se toman en consideracin.
Es menos burda respecto al rango, es decir, se tiene ms precisin con respecto al Rango.

Responsable : Ing. R. CESAR CONDORI PALOMINO

75

Es menos lgica que la desviacin estndar, pues representa ms exactitud en referencia


al rango.

9.4.2.2 CALCULO DE LA DESVIACION MEDIA


1. PARA DATOS NO AGRUPADOS

N
Xi
MTC
/ /

Donde:
= Nmero de observaciones
= Observaciones
= Cualquier medida de
Centralizacin
= Valor absoluto.

NOTA.- Cuando se trabaja con valor absoluto, todo valor contenido entre barras, resulta
siendo positivo, an teniendo valores con signo negativo.
Ejemplo: / - 2 /

= 2;

/3 /

/ 0 /

= 0

/ - 0.25 /

= 0.25

Ejemplo:
En una parcela de experimentacin, luego de aplicar abono a cinco variedades de girasol
; despus de 30 das se tom las medidas del tallo de cada planta obtenindose los
siguientes valores: 0.65, 0.92, 0.77, 0.58, 0.44 metros respectivamente. Hallar la desviacin
media de las alturas de las plantas.
Solucin:
Calculamos la media aritmtica
X
X = -------n
0.65 + 0.92 + 0.77 + 0.58 + 0.44
X = -------------------------------------------------5

3.36
------- =
5

.672

.65 - .672 + 0.92 - .672 + 0.77 - 0.672 + 0.58 - 0.672 + 0.48 0.672
DM = -----------------------------------------------------------------------------------------------------------------5
DM = 0.1384 metros
En consecuencia:
La desviacin de las longitudes de las plantas en estudio es de 0.14 m. o 14 centmetros.

M.A.

Responsable : Ing. R. CESAR CONDORI PALOMINO

76

V1

V2

V3

V4

V5

9.4.2.3 CALCULO DE LA DESVIACION MEDIA PARA DATOS AGRUPADOS


Fi mi - MTC
DM. = ------------------------Fi
Donde :

MTC
mi
fi

=
=
=

puede se la media , mediana o moda


Marcas de clase o puntos medios
Frecuencias Absolutas

Ejemplo:
La siguiente tabla muestra las calificaciones de 50 estudiantes en el Curso de Estadstica.
Determine la desviacin media de las calificaciones.
CALIFICACIONES
Nota mnima Nota mxima

33
43
53
63
73
83
93

42
52
62
72
82
92
100

No
Marcas
estudiantes clase
fi
mi

7
5
9
10
10
6
3
50

X = fi * mi / fi

37.5
47.5
57.5
67.5
77.5
87.5
96.5

262.5
237.5
517.5
675
775
525
289.5
3282

/ mi - X /

fi * / mi - X /

28.14
18.14
8.14
1.86
11.86
21.86
30.86

196.98
90.7
73.26
18.6
118.6
131.16
92.58
721.88

65.64

= 3282/50 =

fi / mi - X /
------------------------------fi

DM =

de fI * MI

721.88
-------- = 14.4376
50

Luego, existe una variabilidad de 14.43 puntos entre las calificaciones de los 50 estudiantes
con respecto a la media aritmtica (65.64)

9.4.3

LA VARIANZA

Es la media aritmtica de los cuadrados de las desviaciones respecto a la media (desviacin


respecto a la media d = xi - x ) .

x1 x 2 x 2 x 2 ....... = x i x

s2

s2

f x x f 2 x 2 x ....... f i x i x
= 1 1
=
N
f1 f 2 ....

Al igual que la media en el caso de que los datos estn agrupados en clases, se tomar la
marca de clase como xi .
Otra forma de calcular s2 es :
s2

f x
=
i

f x
=
i

2
i

x 2 2x i x
N

f x
i

2
i

x 2x
2

f x
=
i

2
i

x2

Responsable : Ing. R. CESAR CONDORI PALOMINO

77

9.4.3.1 PROPIEDAD DE LA VARIANZA


Si se tiene dos conjuntos de datos ( o dos distribuciones de frecuencias totales N1 y N2) y
cuyas varianzas estn dadas por 1 y 2 respectivamente y que ambos tienen la misma
media aritmtica. Entonces La varianza combinada para las dos poblaciones o conjuntos de
datos es:
=

N1 * 1 + N2 * 2
----------------------------N1
+ N2

9.4.3.2 VARIANZA CORREGIDA


Debido a la agrupacin de los datos en clases o intervalos, el clculo de la desviacin
estndar tiene algo de error, para evitar ello se utiliza la varianza corregida; as:
VARIANZA CORREGIDA

VARIANZA DE LOS DATOS

J2 / 12

Donde J es el tamao del intervalo y J2 se llama correccin de SHEPARD y se usa en


distribuciones contnuas donde las colas van gradualmente a cero en ambas direcciones.
Se llama desviacin tpica s a la raz cuadrada de la varianza. Es ms til que la varianza ya
que tiene las mismas dimensiones que la media

9.4.4

LA DESVIACION ESTANDAR

Es una de las medidas ms importantes de dispersin y variabilidad, se utiliza ms en el mbito


de la estadstica descriptiva, en la caracterizacin de las muestras y permite un alto desarrollo
estadstico sobre la base de la misma. Es la raz cuadrada de la varianza.
En las aplicaciones estadsticas, la medida de centralizacin ms empleada es la media
aritmtica y como medida de dispersin la ms empleada es la Desviacin estndar. Llamada
tambin desviacin tpica es la raz cuadrada de la media aritmtica de las desviaciones
individuales elevadas al cuadrado. Se denota por n cuando es poblacional y n - 1 cuando es
desviacin muestral.
Veamos algunas caractersticas:
Por estar estrechamente relacionada con la media aritmtica est influenciada por todos los
valores que se presentan en un conjunto de datos.
Mide la variabilidad alrededor de una medida de tendencia central, por tanto es susceptible
de operaciones algebraicas.
Es la mejor medida de dispersin con que cuenta la Estadstica.

9.4.4.1 CALCULO DE LA DESVIACION ESTANDAR


DATOS NO AGRUPADOS
POBLACIONAL
n =

( Xi - X) 2
---------------n

MUESTRAL
n - 1 =

( Xi - X) 2
---------------n-1

Ejemplo:
Calcular la Desviacin estndar de las longitudes de los tallos de un grupo de girasoles en
Responsable : Ing. R. CESAR CONDORI PALOMINO

78

estudio (del problema anterior ): 65, 92, 77, 58, 44.


SOL.
La media aritmtica es X =
X / n = 336 / 5 = 67.2 centmetros
luego la desviacin estndar poblacional es:
( 65 - 67.2) 2 + ( 92 - 67.2) 2 + ( 77 - 67.2) 2 + ( 58 - 67.2) 2 + ( 44 - 67.2) 2
-----------------------------------------------------------------------------------------------5
16.363 cm.

n =
n =

La desviacin estndar muestral es:


( 65 - 67.2) 2 + ( 92 - 67.2) 2 + ( 77 - 67.2) 2 + ( 58 - 67.2) 2 + ( 44 - 67.2) 2
-----------------------------------------------------------------------------------------------5-1
18.2948 cm.

n =
n =

9.4.4.2 CALCULO DE LA DESVIACION ESTANDAR PARA DATOS AGRUPADOS


Para el clculo de la desviacin estndar en distribucin de frecuencias la frmula es:
n =

fi ( mi - X) 2
------------------ fi

mi = Puntos medios
X = Media aritmtica
fi = Frecuencias absolutas
fi = No total de datos

Ejemplo:
Considerando el cuadro de frecuencias de las calificaciones de los 50 estudiantes
en el curso de Estadstica. Calcule Ud. la Desviacin estndar.
Calificaciones
No
Marca
de fI * MI
( mi - X)2
estudiantes clase
Nota mnima Nota mxima fi
Mi
33
42
7
37.5
262.5
791.8596
43
52
5
47.5
237.5
329.0596
53
62
9
57.5
517.5
66.2596
63
72
10
67.5
675
3.4596
73
82
10
77.5
775
140.6596
83
92
6
87.5
525
477.8596
93
100
3
96.5
289.5
952.3396
50
3282
X = 3282/ 50 = 65.64 puntos

9.4.5

299.0004
50

examinados
fi *( mi - X)2

5543.0172
1645.298
596.3364
34.596
1406.596
2867.1576
2857.0188
14950.02

17.29 puntos

EL COEFICIENTE DE VARIABILIDAD

Es el cociente entre la desviacin tpica y la media aritmtica. Valores muy bajos indican
muestras muy concentradas.
C.V. =

Responsable : Ing. R. CESAR CONDORI PALOMINO

79

C.V = Coeficiente de Variabilidad


= Desviacin estndar
X = Media aritmtica

C.V ---------- * 100


X

El coeficiente de Variabilidad es muy til para medir y comprobar la alta heterogeneidad de los
datos (probablemente la falta de relacin de algunos datos con los dems)
En experimentos de Agronoma, Veterinaria, etc. y en general se admite un C.V. hasta el 30%;
en caso de superar este porcentaje es necesario revisar los datos, por que se puede concluir
que los datos y por ende los resultados no son confiables.
En Experimentos de Laboratorio, se es ms exigente, con los datos y se admite un coeficiente
de Variabilidad mximo hasta el 7% .
EJEMPLO:
Supngase que se tiene dos distribuciones de frecuencia en las cuales se estudia las
calificaciones de los estudiantes en dos secciones distintas que llevan el curso de estadstica.
DISTRIBUCION 1
X = 65.7
= 17.4
A que conclusin llegara usted.

DISTRIBUCION 2
X = 62.3
= 13.9

Calculando el C.V. para cada una de las distribuciones se obtiene:


C.V. 1 = 17.4 / 65.7 *100 = 26.48%
C.V. 2 = 13.9 / 62.3 *100 = 22.31%
Concluimos que el segundo grupo de estudiantes que llevan y han sido evaluados en el curso
de estadstica tiene un C.V. Menor, lo que muestra una mejor representatividad en lo referente
a las calificaciones (datos).

Curva normal: Conocida como campana o Curva de Gauss, es un modelo terico de curva en
el caso de que se de una distribucin normal. Es la curva a la que toda distribucin normal
tiende a dibujar cuando es representada grficamente.

9.4.6

COEFICIENTE DE ASIMETRIA

El coeficiente de asimetra, ideado por Karl Pearson, nos ayuda a mostrar la lejana o cercana
de la moda con la media aritmtica. En trminos de porcentaje se denota por QA. Asi

QA

X - X
= -----------

X = media aritmtica
X =moda
= desviacin estndar

EJEMPLO
Considerando la distribucin de glbulos rojos en muestras obtenidas a 20 personas
(expresados en miles)

Responsable : Ing. R. CESAR CONDORI PALOMINO

80

GLOBULOS ROJOS

EN MILES
0
2
3
5
6
8
9
11
12
14

No
PERSONA
S
fi
2
5
4
8
1
20

X =
X =
=

7.150
9.591
6.351

Que se puede decir acerca de est distribucin de frecuencia?


QA = (7.150 - 9.591) / 3.351 = - 0.7284 = - 72. 84 %
En este caso nos indica que la moda es ms grande que la media aritmtica en 72.8% Por lo
tanto est distribucin tiene una simetra bastante marcada y decimos que debemos trabajar
con ojivas regulares.
Un coeficiente de Asimetra es mejor cuando se acerca a cero de tal manera que sta curva se
aproxima a la normal.
Mide las desviaciones de las MTC., Ya que el sesgo es el grado de asimetra o falta de
asimetra, de una distribucion, si el poligono de frecuencias visualizado de una distribucion
tiene una cola ms larga a la derecha del mximo central que a la izquierda, se dice que la
distribucion esta sesgada a la derecha o que tiene sesgo positivo(asimetra positiva) y si al
contrario se dice que tiene sesgo (asimetra negativa) en la asimetria encontramos si es:

9.4.7

COEFICIENTE DE CURTOSIS:

Es la agudeza de la curva normal , esta agudeza puede ser alta , baja, o intermedia dando
lugar a diferentes tipos de curvas como: plato, meso, leptocrtica,
Curva Platicrtica: Presenta una curva ms aplastada, con una elevacin de la distribucin
inferior a la curva normal.
Curva Leptocrtica: Presenta una distribucin ms apuntada, con una elevacin superior a la
curva normal.
Curva Mesocrtica: Es el que corresponde a la curva normal y presenta un nivel de
apuntamiento considerado como ideal. k<0.263>
k=0.263 = mesocutica.
Responsable : Ing. R. CESAR CONDORI PALOMINO

81

k>0.263 = leptocurtica.
la frmula a utilizar el la siguiente:
1/2 (Q3-Q1)
K= __________
P90-P10
curtosis igual a un medio entre cuartil 3 menos cualtil 1 dividido percentil de 90 menos percentil
de 10

EJERCICIOS
1.

Se hizo una prueba sobre la duracin de bateras de diferentes marcas ( en horas ) probando todas ellas en un
equipo de arranque. Los resultados fueron: 5, 3, 8, 4, 7, 6, 12, 4, 3 horas respectivamente.
a. Calcular la desviacin media de los tiempos de duracin de las bateras.
b. Calcular la varianza
c. Calcular el coeficiente de variabilidad

2.

Calcular la Desviacin estndar de los tiempos que demoran en llegar un grupo de estudiantes a su Centro de
estudio: 15, 48, 30, 45, 52, 10, 13, 40, 29, 28, 15, 10, 18 y 25 minutos respectivamente. Luego efecte un
comentario sobre dicha desviacin.

3.

Dado el cuadro siguiente:

ING. SEMANALES

50 - 89
No TRABAJADORES 7

90 - 129 130 - 169 170 - 209 210 - 249 250 - 289


12

19

a)
b)
c)
d)
e)

Calcular el rango de los ingresos semanales de los trabajadores


Calcular la desviacin media de los ingresos semanales de los trabajadores
La desviacin estndar de los ingresos semanales
Calcular el coeficiente de variabilidad
Interprete sus resultados

4.

Los siguientes datos indican ventas diarias en nuevos soles de una almacn: 45 95 110 120 135 85 76 59 68
71 en sus primeros das. Elabore un informe que indique grficamente el comportamiento de las ventas, el
promedio de ventas, la variabilidad existente y la confiabilidad de sus datos.

5.

Los siguientes son notas de inteligencia rpida aplicada a un grupo de 101 estudiantes:

CALIFICACIONES

84.5 - 87 87 - 89.5 89.5 -92 92 - 94.5 94.5 - 97 97 - 100

No DE ESTUDIANTES

13

14

21

a.
b.
c.
d.
e.

Calcular el rango de las calificaciones de los estudiantes


Calcular la desviacin media de las calificaciones de los estudiantes
La desviacin estndar de las calificaciones de los estudiantes
Calcular el coeficiente de variabilidad
Interprete sus resultados

6.

Dada la siguiente tabla:

No de Glbulos rojos
(en miles)
0
2
3
5
6
8

29

14

10

No de
pacientes
1
4
7
Responsable : Ing. R. CESAR CONDORI PALOMINO

82

9
12
a)
b)
c)
d)

11
14

10
13

Graficar un diagrama de dispersin


Calcular La desviacion media
Calcular La varianza
Calcular el coeficiente de variabilidad

7.

Se ha recibido una muestra compuesta de 100 probetas de concreto con el objeto de ser analizadas. Una
de las pruebas consisti en determinar la carga de rotura en (Kgr/cm2 )de dichas probetas, encontrndose
los siguientes resultados
Intervalo de rotura
120-125
125-130
130-135
135-140
140-145
No de probetas 10
20
33
25
1
a. Elaborar un diagrama de dispersin
b. Calcular La desviacion media
c. Calcular La varianza
d. Calcular el coeficiente de variabilidad

8.

Dada la siguiente tabla:


PESOS
(en libras)
118
126
127

No de
personas
4
7
10
14
6
6
3

163
171
172
180
a) Elaborar un diagrama de dispersin
b) Cual es la desviacin estndar
c) Interprete sus resultados
9.

a.
b.
c.

Suponemos que los datos pagados en un sector X es como sigue:

CARGO

Fi

SUELDO

550

260

128

310

200

150

Calcular la dsviacion media para los datos


Calcule La desviacion estandar
Que indica el coeficiente de variacion

Responsable : Ing. R. CESAR CONDORI PALOMINO

83

CAPITULO 10
10. MEDIDAS DE POSICIN NO CENTRAL (CUANTILES)
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen a
la distribucin en partes, de tal manera que cada una de ellas contiene el mismo nmero de
frecuencias.
Las medidas de posicin no central permiten conocer otros puntos caractersticos de la
distribucin que no son los valores centrales. Entre las medidas de posicin central ms
importantes estn los cuantiles que son aquellos valores de la variable, que ordenados de
menor a mayor, dividen a la distribucin en partes, de tal manera que cada una de ellas
contiene el mismo nmero de frecuencias.
Los tipos ms importantes de cuantiles son:
Los cuartiles, que dividen a la distribucin en cuatro partes;
Los quintiles, que dividen a la distribucin en cinco partes;
Los deciles, que dividen a la distribucin en diez partes;
Los percentiles, que dividen a la distribucin en cien partes.
Los cuantiles ms conocidos son:
A) CUARTILES ( Q )
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales. Son valores de la variable que dividen a la distribucin en 4 partes,
cada una de las cuales engloba el 25 % de las mismas
Se denotan de la siguiente forma:
Q1 es el primer cuartil que deja a su izquierda el 25 % de los datos;
Q2 es el segundo cuartil que deja a su izquierda el 50% de los datos, y
Q3 es el tercer cuartil que deja a su izquierda el 75% de los datos. (Q2 = Me)
Dados una serie de valores X1,X2,X3...Xn ordenados en forma creciente, Definimos:
Primer cuartil (Q1) como la mediana de la primera mitad de valores.
Segundo cuartil (Q2) como la propia mediana de la serie.
Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:
EL PRIMER CUARTIL:
Cuando n es par: 1*n/4
Cuando n es impar: 1(n+1)/4
PARA EL TERCER CUARTIL
Cuando n es par: 3*n/4
Cuando n es impar: 3(n+1)/4
CLCULO DE LOS CUARTILES PARA DATOS NO AGRUPADOS
1.
2.

O r d e n a m o s l o s d a t o s d e m e n o r a m a yo r .
Buscamos el lugar que ocupa cada cuartil mediante la expresin.

.
Nmero impar de datos
2, 5, 3, 6, 7, 4, 9

Responsable : Ing. R. CESAR CONDORI PALOMINO

84

Nmero par de datos


2, 5, 3, 4, 6, 7, 1, 9

CLCULO DE LOS CUARTILES PARA DATOS AGRUPADOS


En primer lugar buscamos la clase donde se encuentra
,
en la tabla de las frecuencias acumuladas.

Ejercicio de cuartiles
Calcular los cuartiles de la distribucin de la tabla:
fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65
Clculo del primer cuartil

Clculo del segundo cuartil

Responsable : Ing. R. CESAR CONDORI PALOMINO

85

Clculo del tercer cuartil

B) QUINTILES
Se representan con la letra K.
Es el primer quintil. Separa a la muestra dejando el 20% de los datos a su izquierda.
Es el segundo quintil. Es el valor que indica que el 40% de los datos son menores.
Es el tercer quintil. Indica que el 60% de los datos son menores que l.
Es el cuarto quintil. Separa al 80% de los datos del otro 20%.
C) DECILES ( DI)
Son los valores de la variable que dividen a la distribucin en las partes iguales, cada una de
las cuales engloba el 10 % de los datos. En total habr 9 deciles. (Q2 = D5 = Me ).
D) CENTILES O PERCENTILES ( PI )
Son los valores que dividen a la distribucin en 100 partes iguales, cada una de las cuales
engloba el 1 % de las observaciones. En total habr 99 percentiles. (Q2 = D5 = Me = P50)
Clculo de los cuantiles en distribuciones no agrupadas en intervalos - Se calculan a travs de
la siguiente expresin: q rN , siendo : r = el orden del cuantil correspondiente q = el nmero de
intervalos con iguales frecuencias u observaciones ( q = 4, 10, 100 ).
N = nmero total de observaciones - La anterior expresin nos indica que valor de la variable
estudiada es el cuantil que nos piden, que se corresponder con el primer valor cuya
frecuencia acumulada sea mayor o igual a q rN Ejemplo: DISTRIBUCIONES NO AGRUPADAS:
Se representan con la letra C.
Es el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la muestra son valores
menores que l y el 100-i % restante son mayores.
Cuando los datos no estn agrupados en intervalos, los cuartiles, as como el resto de las
medidas de posicin, tienen un valor claro. Sin embargo, cuando tenemos una agrupacin de
los datos ya no es tan sencillo realizar el clculo. S que resulta claro ver en cul de los
intervalos est el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto
necesitaremos usar una frmula.

Responsable : Ing. R. CESAR CONDORI PALOMINO

86

CAPITULO 11:
11. NUMEROS INDICE
Un nmero ndice es
una
medida
estadstica diseada
para
mostrar
los
cambios
en
una
variable o grupo de
variables
relacionadas
con
respecto al tiempo,
situacin geogrfica u
otra
caracterstica.
ndice
mide qu
tanto una variable ha
cambiado con el tiempo. Mide la variacin relativa entre las variables econmicas: Variaciones
en los precios, en los salarios, en los ingresos, etc. Se calculan para 2 perodos de una serie
de tiempo o para todos los perodos de una serie de tiempo con respecto a un perodo fijo
llamado perodo base.
12.2.

DEFINICION

Es una herramienta adecuada para describir la evolucin en el tiempo de una caracterstica


de la poblacin. Son especialmente tiles cuando queremos comparar como evolucionan dos
poblaciones en relacin a una misma caracterstica, o cmo evolucionan dos caractersticas de
una poblacin
12.3.

PORQU USAR NMEROS INDICES?

Pueden utilizarse en diferentes contextos. Un ndice es una forma conveniente de expresar un


cambio en un grupo heterogneo de elementos. Por ejemplo, el IPC comprende mas de 50
artculos. El usar el IPC permite conocer el cambio global de precios al consumidor. La
conversin de los datos a ndices tambin facilita la estimacin de la tendencia en una serie
compuesta por nmeros muy grandes.
Permite comparar dos o mas series de tiempo que tienen diferentes unidades de medida.
Se pueden reducir nmeros de magnitud considerable a cantidades manejables.
Permiten comparar cambios en la produccin de un conjunto de artculos, los que no
pueden expresarse en una misma unidad de medida.
Comparar costes de alimentos u otros costes de vida en una ciudad durante una ao con
los del ao anterior, o se puede comparar la produccin de acero, etc. durante una ao
determinado en el lugar X con Y.
En la enseanza para comparar la inteligencia de estudiantes de diversos puntos o de
diferentes edades
Los nmeros de ndice pueden utilizarse de diferentes maneras. Es ms comn usarlos por s
mismos, como un resultado final. En la administracin se utilizan como parte de un clculo
intermedio para entender mejor otra informacin.

Responsable : Ing. R. CESAR CONDORI PALOMINO

87

12.4.

TIPOS DE NUMEROS INDICES

ndice de precios : IPC, IPP o IPM


ndice de cantidad (o volumen) : ndice de volumen de exportacin
ndice de Valor : IGB, ISB, Dow Jones (Cotizacin de acciones en la Bolsa de Valores de NY)
ndices Especiales : ndice de Precio de las Principales exportaciones tradicionales,
ndice de productividad, ndice del comercio, etc.

El ndice de precios
compara niveles de precios de un perodo a otro. El ndice de precios al consumidor (IPC) mide
los cambios globales de precios de una variedad de bienes de consumo y de servicios, y se le
utiliza para definir el costo de vida.
El ndice de cantidad
mide qu tanto cambia el nmero o la cantidad de una variable en el tiempo.
El ndice de valor
Mide los cambios en el valor monetario total. Esto es, mide los cambios en el valor en pesos de
una variable. Combina los cambios en precio y cantidad para presentar un ndice con ms
Responsable : Ing. R. CESAR CONDORI PALOMINO

88

informacin.
Por lo general, un ndice mide el cambio en una variable durante un cierto perodo, como en
una serie temporal. Sin embargo, tambin se le puede utilizar para medir diferencias en una
variable dada en diferentes lugares. Esto se lleva a cabo recolectando datos de manera
simultnea en los diferentes lugares y luego comprndolos.
Un solo nmero ndice puede reflejar a una variable compuesta o a un grupo de stas. El IPC
mide el nivel general de precios para bienes y servicios especficos en la economa. Combina
los precios individuales de bienes y servicios para conformar un nmero de ndice de precios
compuestos.
12.5.

PROBLEMAS RELACIONADOS CON LOS NMEROS NDICE.

Existen varias cosas que pueden distorsionar los nmeros ndice:


En ocasiones, hay dificultad para hallar datos adecuados para calcular un ndice.
La incomparabilidad de ndices se presenta cuando se hacen intentos para comparar un
ndice con otro despus de que ha habido un cambio bsico en lo que se ha estado
midiendo.
La ponderacin no apropiada de factores puede distorsionar un ndice. Al desarrollar un
ndice compuesto, como el IPC, debemos tomar en cuenta que los cambios en ciertas
variables son ms importantes que en otras.

La distorsin de los nmeros ndice tambin se puede presentar cuando se selecciona una
base no apropiada. Siempre debemos considerar cmo y por qu el perodo base fue
seleccionado antes de aceptar una aseveracin basada en el resultado de comparar nmeros
ndice.
12.6.

PRECIOS RELATIVOS

La razn del precio es un bien determinado en un periodo dado a su precio en otro periodo
llamado base o periodo de referencia.
Po = precio del bien durante el periodo base
Pn = Precio del bien durante el periodo considerado
Precio relativo = Pn / Po * 100
Pa y Pb son los precios de un bien durante l os periodos a y b respectivamente, El precio
relativo del periodo b con respecto al periodo se define como Pb/Pa y se denota por Pa/Pb
notacin que ser de utilidad.
Ejemplo:
Los precios de los pasajes en enero de 2005 y 2010 fue de 0.30 y 0.60 cntimos de sol
respectivamente. Tomando como ao base a 2005 y el 2010 como el ao dado se tiene.
Precio en 2013
0.60
Precio relativo = P2013/2009 = ------------------=
-------------- = 2 200%
Precio en 2009
0.30
Es decir en 2013 el precio es de 200% que el que fue en 2009 es decir se incremento en un
100 %
Si trabajamos al revs:
Precio en 2009
0.30
Precio relativo = P2009/2013 = ------------------=
-------------- = 0.50 50%
Precio en 2013
0.60
Es decir el precio de los pasajes en 2009 significaba el 50 % de lo que es hoy en el 2013
PROPIEDADES
Si Pa, Pb, Pc, denotan los precios en los periodos a, b, y c, respectivamente, existe las
siguientes propiedades para los precios relativos, deducidos directamente de las definiciones.

Responsable : Ing. R. CESAR CONDORI PALOMINO

89

PROPIEDAD DE IDENTIDAD
Pa/a = 1
El precio relativo para un periodo dado con respecto al mismo periodo es 1 o 100%
PROPIEDAD DEL TIEMPO INVERSO
Pa/b Pb/a = 1
Esto declara que cuando 2 periodos se intercambian, sus correspondientes precios relativos
son recprocos entre si
PROPIEDAD CICLICA O CIRCULAR
Pa/b Pb/c Pc/a = 1
CANTIDAD O VOLUMEN RELATIVOS
Se puede comparar volumen de produccin, consumo, exportacin, cantidad o volumen

qn / qo * 100
qo = cantidad de un bien producido, consumido, exportado etc. durante un periodo base
qn = cantidad producida, consumida exportada durante un periodo dado.
VALOR RELATIVO
Si Po y qo denotan el precio y la cantidad de un bien durante un periodo base, mientras que
Pn y qn denotan el precio y la cantidad correspondiente durante un periodo dado. Los valores
totales durante estos perodos vienen dados por Vo y Vn respectivamente.
Valor Relativo = Vn/Vo = (Pnqn) / (Poqo) = (Pn / Po) (qn / qo)
12.7.

NDICE DE AGREGADOS NO PESADOS.

No pesados quiere decir que todos los valores considerados son de igual importancia.
Agregado significa que agregamos o sumamos todos los valores. La principal ventaja es su
simplicidad.
Se calcula mediante la suma de todos los elementos del compuesto, para el perodo dado, y
luego dividiendo este resultado entre la suma de los mismos elementos durante el perodo
base.
( Q1/ Q0) x 100
Como el cociente es multiplicado por 100, tcnicamente, el ndice resultante es un porcentaje.
Sin embargo, se acostumbra referirse solamente al valor y omitir el signo del porcentaje cuando
se analizan nmeros ndice.
La principal desventaja de un ndice no pesado es que no le da mayor importancia o peso al
cambio de precio de un producto de uso comn que el que le da a uno de uso poco comn. Un
cambio sustantivo en el precio de productos de lento movimiento puede distorsionar por
completo un ndice. Por esta razn, no es prctica comn utilizar un ndice simple no pesado en
anlisis importantes. Un ndice no pesado puede verse distorsionado por un cambio en unos
cuantos productos, lo cual puede no ser representativo de la situacin que se est estudiando.
12.8.

NDICE DE AGREGADOS PESADOS.

A menudo tenemos que asignar una importancia mayor a los cambios que se dan en algunas
variables que a los que se presentan en otras cuando calculamos un ndice. Esta ponderacin
nos permite incluir ms informacin, aparte del mero cambio de los precios en el tiempo. Nos
permite mejorar la precisin de la estimacin. El problema est en decidir cunto peso asignar
a cada una de las variables en la muestra
Existen tres formas de pesar un ndice:
Mtodo Laspeyres:
Responsable : Ing. R. CESAR CONDORI PALOMINO

90

Utiliza las cantidades consumidas durante el perodo base, es el ms usado, debido a que
requiere medidas de cantidades de nicamente un perodo. Como cada nmero ndice
depende de los mismos precios y cantidad base, la administracin puede comparar el ndice de
un perodo directamente con el ndice de otro. Una ventaja de este mtodo es la
comparabilidad de un ndice con otro. El uso de la misma cantidad de perodo base nos permite
hacer comparaciones de manera directa. Otra ventaja es que muchas medidas de cantidad de
uso comn no son tabuladas cada ao. La principal desventaja es que no toma en cuenta los
cambios de los patrones de consumo.
Indice de Precio de Laspeyres

Pondera con las cantidades del ao base (o). Supone que no cambia los hbitos de consumo.
Slo flucta el precio
Mtodo de Paasche:
Es un proceso parecido al seguido para encontrar un ndice de Laspeyres. La diferencia
consiste en que los pesos utilizados en el mtodo Paasche son las medidas de cantidad
correspondientes al perodo actual. Es particularmente til porque combina los efectos de los
cambios de precio y de los patrones de consumo, as, es un mejor indicador de los cambios
generales de la economa que el mtodo Laspeyres.
Una de las principales desventajas es la necesidad de tabular medidas de cantidad para cada
perodo examinado. Cada valor de un ndice de precios Paasche es el resultado tanto de
cambios en el precio como en la cantidad consumida correspondiente al perodo base. Como
las medidas de cantidad utilizadas por un perodo de ndice, por lo general son diferentes de
las medidas de cantidad de otro perodo de ndice, resulta imposible atribuir la diferencia entre
los dos ndices solamente a cambios de precio. En consecuencia, es difcil comparar ndices de
diferentes perodos con el mtodo Paasche.
Indice de Precio de Paasche

Usa ponderaciones de los aos actuales. Osea pondera con las cantidades del ao dado (t)
Necesita actualizarse el consumo cada ao; por lo que el de Laspeyres se usa es el ms usado
ndice de Fisher
Un tercer ndice, el ndice de Fisher (del economista estadounidense Irving Fisher), intenta
mitigar este problema, siendo una especie de resultado intermedio de los dos anteriores;
calcula el Promedio Geomtrico de los dos anteriores:

12.9.

PROBLEMAS EN LA CONSTRUCCIN Y EN EL USO DE NMEROS NDICE.

Problemas en la construccin.
Seleccin de un elemento para ser incluido en un compuesto:
Casi todos los ndices se construyen para responder a una cierta pregunta en particular. Los
elementos incluidos en el compuesto dependen de la pregunta en cuestin.
Seleccin de los pesos apropiados:
Los pesos seleccionados deberan representar la importancia relativa de los diferentes
elementos. Desafortunadamente lo que resulta apropiado en un perodo puede volverse
inapropiado en un lapso muy corto.
Seleccin de un perodo base:
El perodo base seleccionado debe ser un perodo normal, preferentemente un perodo
bastante reciente. Normal significa que el perodo no debe estar en un pico o en una depresin
Responsable : Ing. R. CESAR CONDORI PALOMINO

91

de una fluctuacin. Una tcnica para evitar la eleccin de un perodo irregular consiste en
promediar los valores de varios perodos consecutivos.
12.10. ADVERTENCIA EN LA INTERPRETACIN DE UN NDICE.
Generalizacin a partir de un ndice especfico: generalizacin de los resultados.
Falta de conocimiento general con respecto a ndices publicados:
Es la falta de conocimiento de qu es lo que miden los diferentes ndices.
Efecto del paso del tiempo en un ndice:
Los factores relacionados con un ndice tienden a cambiar con el tiempo, en particular, los
pesos apropiados. A menos que se cambien los pesos de acuerdo a las circunstancias, el
ndice se vuelve cada vez menos confiable.

EJERCICIOS
1.

Dados los datos siguientes:

Mes

ENE

FEB

MAR

ABR

MAY

JUN

JUL

AGO

SET

OCT

NOV

Venta

185

852

195

542

621

436

520

652

345

258

621

a.
b.
c.
2.

Estimar el ndice de ventas para cada mes tomado como base el primer mes interpretar los datos mas relevantes.
Estimar el ndice de ventas para el periodo marzo-diciembre tomado como base el periodo ene-feb. Efecte una
interpretacin de los datos mas relevantes
Estimar el ndice de ventas para Diciembre tomado como base el primer mes. Interprete su respuesta.
La tabla muestra los precios y cantidades consumidas en los aos 1999, 2009 y 2010 tomando como base el ao
1999 calcular:
PRECIOS

CANTIDADES

AO

1999

2009

2010

1999

2009

2010

ALUMINIO

17.00

26.01

27.00

1357.00

3707.00

3698.00

COBRE

19.36

41.88

29.00

2144.00

2734.00

2478.00

PLOMO

15.18

15.00

14.00

1916.00

2420.00

2276.00

ESTAO

99.32

10.10

96.00

161.00

202.00

186.00

CINC

12.15

13.00

11.00

1872.00

2018.00

1424.00

a.
b.
c.
d.
e.
f.
g.
h.

Calcular el ndice de precios por el mtodo de agregacin simple para el ao 2009 interprete su resultado
Calcular el ndice de precios por el mtodo de agregacin simple para el ao 2010 interprete su resultado
Calcular el ndice de Laspayres para2009 tomando como ao base 1999 interprete su resultado
Calcular el ndice de Laspayres para 2010 tomando como ao base 1999 interprete su resultado
Calcular el ndice de Paasch para2009 tomando como ao base 1999 interprete su resultado
Calcular el ndice de Paasch para 2010 tomando como ao base 1999 interprete su resultado
Calcular el ndice ideal de Fisher para 2009 tomando como ao base 1999 interprete su resultado
Calcular el ndice ideal de Fisher para 2010 tomando como ao base 1999 interprete su resultado

3. Dada la siguiente tabla que muestra los precios al por mayor y las producciones de leche mantequilla y queso para
los aos 1999 2009 y 2010 .

a.
b.
c.
d.
e.
f.

PRECIOS

Pn

CANT.PRODUCIDAS qn

AO

1999

2009

2010

1999

2009

2010

LECHE

3.97

3.89

4.13

9.675

9.117

10.436

MANTEQUILLA

61.5

64.2

59.7

117.4

115.5

115.5

QUESO

34.8

35.4

38.9

75.93

74.93

82.79

calcular un ndice de precios al por mayor por agregacin simple para 2010 tomando como base el ao 1999
calcular un ndice de precios al por mayor por agregacin simple para 2010 tomando como base el ao 2009
calcular un ndice de precios al por mayor por agregacin simple para 2010 tomando como base el periodo 19992009.
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Laspayres para 2010 tomando
como base el ao 1999
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Laspayres para 2010 tomando
como base el ao el ao 2009
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Laspayres para 2010 tomando
como base el periodo 1999-2009.

Responsable : Ing. R. CESAR CONDORI PALOMINO

92

g.
h.
i.
j.
k.
l.
m.
3.

calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Paasche para 2010
como base el ao1999
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Paasche para 2010
como base el ao el ao 2009
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Paasche para 2010
como base el periodo 1999-2009
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Fisher para 2010
como base el ao 1999
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Fisher para 2010
como base el ao el ao 2009
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Fisher para 2010
como base el periodo 1999-2009.
Efecte una interpretacin para cada caso. Comente su resultado.

tomando
tomando
tomando
tomando
tomando
tomando

La tabla muestra los precios y la produccin, en promedios de algodn y trigo durante los aos 1999 y 2004.
Explicar porque un ndice de precios por agregacin simple para 2004 con 1999 como base es inapropiado como
medida de cambio de precios en esos dos productos.
PRECIO

ALGODN

TRIGO

CANTIDAD

1999

2004

1999

2004

74.4

56.8

11.122

13.432

Ctvs. por libra

Ctvs. por libra

mills. De balas

mills. de balas

3.91

3.16

511.4

487.1

$ por bushel

$ por bushel

mlls. De bushels

mlls. de bushels

1 bala es 480 libras


1 bushel es 60 libras
4.

Dados los datos siguientes que muestran los precios al por menor y producciones medias de combustible en la
planta de PetroPeru durante los aos 1986-1990
AO

PRECIO
RELAT.
1986=100

VALOR RELAT.

CANT. RELATIVA

1987-1989 = 100

V.R / P.R.

CANTIDAD. RELATIVA

1986

100

150

150

100

1987

125

180

144

96

1988

150

207

138

92

1989

175

231

132

88

1990

200

252

126

84

Explicar porqu un indice de precios de agregacin simple para 1999 con base en 1989 es una medida inadecuada en
los cambios de precio en los bienes dados.

Responsable : Ing. R. CESAR CONDORI PALOMINO

93

13. REGRESIN LINEAL SIMPLE


Uno de los aspectos
ms
relevantes de la Estadstica es el
anlisis
de
la
relacin
o
dependencia
entre
variables.
Frecuentemente resulta de inters
conocer el efecto que una o varias
variables pueden causar sobre
otra, e incluso predecir en mayor o
menor grado valores en una
variable a partir de otra.
Por ejemplo, supongamos que la
altura de los padres
influyen
significativamente en la de los hijos.
Podramos estar interesados en
estimar la altura media de los hijos
cuyos padres
presentan una
determinada estatura.
Los mtodos de regresin estudian la construccin de modelos para explicar o representar la
dependencia entre una variable respuesta o dependiente (Y ) y la(s) variable(s) explicativa(s)
o dependiente(s), X .
En este Tema abordaremos el modelo de regresin lineal, que tiene lugar
dependencia es de tipo lineal, y daremos respuesta a dos cuestiones bsicas:

cuando

la

Es significativo el efecto que una variable X causa sobre otra Y ? Es significativa la


dependencia lineal entre esas dos variables?.
De ser as, utilizaremos el modelo de regresin lineal simple para explicar y predecir la
variable dependiente (Y ) a partir de valores observados en la independiente (X ).
Ejemplo
El inventor de un nuevo material aislante quiere determinar la magnitud de la compresin (Y )
que se producir en una pieza de 2 pulgadas de espesor cuando se somete a diferentes
cantidades de presin (X ). Para ello prueba 5 piezas de material bajo diferentes presiones.
Los pares de valores observados (x, y) se muestran en la siguiente tabla:
Pieza
1
2
3
4
5

Presin (x) Compresin (y)


1
1
2
1
3
2
4
2
5
4

En principio no sabemos si las variables en cuestin estn relacionadas o no, o si en


caso de haber dependencia es significativa o no. De haber entre ellas una dependencia
lineal significativa, podramos expresar la Compresin (Y ) a partir de la Presin (X )
mediante una recta, y a partir de ella predecir la compresin que se dara para un
determinado nivel de presin.
Una forma de determinar si puede existir o no
dependencia entre variables, y en caso de haberla
deducir de qu tipo puede ser, es grficamente
representando los pares de valores observados. A
dicho grfico se le llama nube de puntos o diagrama
Responsable : Ing. R. CESAR CONDORI PALOMINO

94

de dispersin.
Representamos en un grfico los pares de valores de una distribucin bidimensional: la variable
"x" en el eje horizontal o eje de abscisa, y la variable "y" en el eje vertical, o eje de ordenada.
Vemos que la nube de puntos sigue una tendencia lineal:

Una recta viene definida por la siguiente frmula:


y = a + bx
Donde "y" sera la variable dependiente, es decir, aquella que viene definida a partir de la otra
variable "x" (variable independiente). Para definir la recta hay que determinar los valores de los
parmetros "a" y "b":
El parmetro "a" es el valor que toma la variable dependiente "y", cuando la variable
independiente "x" vale 0, y es el punto donde la recta cruza el eje vertical.
El parmetro "b" determina la pendiente de la recta, su grado de inclinacin.
La regresin lineal nos permite calcular el valor de estos dos parmetros, definiendo la recta
que mejor se ajusta a esta nube de puntos.
El parmetro "b" viene determinado por la siguiente frmula:

Es la covarianza de las dos variables, dividida por la varianza de la variable "x".


El parmetro "a" viene determinado por:
a = ym - (b * xm)
Es la media de la variable "y", menos la media de la variable "x" multiplicada por el parmetro
"b" que hemos calculado.
Ejemplo: vamos a calcular la recta de regresin de la siguiente serie de datos de altura y peso
de los alumnos de una clase. Vamos a considerar que la altura es la variable independiente "x"
y que el peso es la variable dependiente "y" (podamos hacerlo tambin al contrario):

Responsable : Ing. R. CESAR CONDORI PALOMINO

95

Alumno

Estatura

Peso

Alumno

Estatura

Peso

Alumno

Estatura

Peso

Alumno 1

1,25

32

Alumno 11

1,25

33

Alumno 21

1,25

33

Alumno 2

1,28

33

Alumno 12

1,28

35

Alumno 22

1,28

34

Alumno 3

1,27

34

Alumno 13

1,27

34

Alumno 23

1,27

34

Alumno 4

1,21

30

Alumno 14

1,21

30

Alumno 24

1,21

31

Alumno 5

1,22

32

Alumno 15

1,22

33

Alumno 25

1,22

32

Alumno 6

1,29

35

Alumno 16

1,29

34

Alumno 26

1,29

34

Alumno 7

1,30

34

Alumno 17

1,30

35

Alumno 27

1,30

34

Alumno 8

1,24

32

Alumno 18

1,24

32

Alumno 28

1,24

31

Alumno 9

1,27

32

Alumno 19

1,27

33

Alumno 29

1,27

35

Alumno 10

1,29

35

Alumno 20

1,29

33

Alumno 30

1,29

34

El parmetro "b" viene determinado por:


(1/30) * 1,034
b = ----------------------------------------- = 40,265
(1/30) * 0,00856
Y el parmetro "a" por:
a = 33,1 - (40,265 * 1,262) = -17,714
Por lo tanto, la recta que mejor se ajusta a esta serie de datos es:
y = -17,714 + (40,265 * x)
Esta recta define un valor de la variable dependiente (peso), para cada valor de la variable
independiente (estatura):
Estatura

Peso

1,20

30,6

1,21

31,0

1,22

31,4

1,23

31,8

1,24

32,2

1,25

32,6

1,26

33,0

1,27

33,4

1,28

33,8

1,29

34,2

1,30

34,6

13.1.

EL COEFICIENTE DE CORRELACIN LINEAL

Responsable : Ing. R. CESAR CONDORI PALOMINO

96

El coeficiente de correlacin lineal nos permite determinar si, efectivamente, existe relacin
entre las dos variables. Una vez que se concluye que s existe relacin, la regresin nos
permite definir la recta que mejor se ajusta a esta nube de puntos. Mide el grado de intensidad
de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que
puede existir entre las varables es lineal (es decir, si representaramos en un gfico los pares de
valores de las dos variables la nube de puntos se aproximara a una recta).

No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc.
En estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las
variables, por lo que convendra utilizar otro tipo de coeficiente ms apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es
representar los pares de valores en un grfico y ver que forma describen.
El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:

Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra).
La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la
otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1.
Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de
correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere decir
obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que este
resultado podra haberse debido al puro azar.
Ejemplo: vamos a calcular el coeficiente de correlacin de la siguiente serie de datos de altura
y peso de los alumnos de una clase:
Alumno

Estatura

Peso

Alumno

Estatura

Peso

Alumno

Estatura

Responsable : Ing. R. CESAR CONDORI PALOMINO

Peso

97

Alumno 1

1,25

32

Alumno 11

1,25

33

Alumno 21

1,25

33

Alumno 2

1,28

33

Alumno 12

1,28

35

Alumno 22

1,28

34

Alumno 3

1,27

34

Alumno 13

1,27

34

Alumno 23

1,27

34

Alumno 4

1,21

30

Alumno 14

1,21

30

Alumno 24

1,21

31

Alumno 5

1,22

32

Alumno 15

1,22

33

Alumno 25

1,22

32

Alumno 6

1,29

35

Alumno 16

1,29

34

Alumno 26

1,29

34

Alumno 7

1,30

34

Alumno 17

1,30

35

Alumno 27

1,30

34

Alumno 8

1,24

32

Alumno 18

1,24

32

Alumno 28

1,24

31

Alumno 9

1,27

32

Alumno 19

1,27

33

Alumno 29

1,27

35

Alumno 10

1,29

35

Alumno 20

1,29

33

Alumno 30

1,29

34

Aplicamos la frmula:

r=

(1/30) * (0,826)
---------------------------------------------------------(((1/30)*(0,02568)) * ((1/30)*(51,366)))^(1/2)

Luego,
r=

0,719

Por lo tanto, la correlacin existente entre estas dos variables es elevada (0,7) y de signo
postivo.

Responsable : Ing. R. CESAR CONDORI PALOMINO

98

También podría gustarte