Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA
DESCRIPTIVA
DOCENTE RESPONSABLE:
Ing. REMIGIO CESAR CONDORI PALOMINO
2014
El
pensamiento estadstico
algn da ser tan necesario
para la ciudadana como la
capacidad de leer y escribir...
H.G.Wells hace ms de 100
aos
CAPITULO 1:
1. Introduccion
1.1 Breves datos histricos relacionados con la
estadistica
1.2 Etimologia del trmino estadstica
1.3 Definiciones de estadistica
1.4 Clasificacion de la estadistica
1.4.1
La estadstica descriptiva o deductiva:
1.4.2
La estadistica inductiva o inferencial
1.5 Indicador estadistico
1.6 Importancia de la estadistica
1.7 Usos de la estadstica
1.8 Malos usos de la estadstica
CAPITULO 2:
2. La estadistica y la investigacin cientfica
2.1 Etapas de una investigacion estadistica
2.1.1
La planificacin
2.1.2
Recoleccin de datos.
2.1.3
Organizacin de datos.
2.1.4
Anlisis e interpretacin de resultados.
2.1.5
Resultados y conclusiones.
2.2 El pensamiento estadistico
CAPITULO 3:
3. Poblacin muestra y muestreo.
3.1. Poblacin
3.1.1.
Censo:
3.2. Muestra
3.2.1.
El tamao de la muestra
3.2.1.1. Para datos continuos.
3.2.1.2. Para proporciones: utilizando la formula
3.2.1.3. Metodo fisher-arkin-colton
3.3. El muestreo
3.4. Tipos de muestreo
3.4.1.
Muestreo no probabilistico
3.4.2.
Muestreo probabilistico
3.4.2.1. Muestreo aleatorio simple.3.4.2.2. Muestreo aleatorio sistemtico
3.4.2.3. Muestreo aleatorio estratificado.3.4.2.4. Muestreo aleatorio por conglomerados.3.5. Error muestral
3.6. El error estndar
CAPITULO 4
4. Variable
4.1 Variable estadstica
4.2 Variables cuantitativas
4.2.1
Variables continuas
4.2.2
Variables discretas.
4.3 Variables cualitativas
4.4 Medicin
4.4.1
Escalas de medicin
4.4.1.1 Escala nominal
4.4.1.2 Escala ordinal
4.4.1.3 Escala de intervalo
4.4.1.4 Escala de razon
CAPITULO 5:
5. Los datos o elementos
5.1 Dato:
5.2 Los datos estadsticos
5.3 Clasificacin de los datos
5.4 Herramientas comunes para recopilar y analizar
datos
5.5 El metodo de recoleccion
5.6 Considerando las fuentes de informacin:
5.6.1
Las fuentes primarias
5.6.1.1 La observacin directa
5.6.1.2 La observacin es indirecta
5.6.2
Las fuentes secundarias
5.6.2.1 Las fichas
5.6.2.2 El cuestionario o formulario
5.7 Considerando el metodo de recoleccion
5.7.1
Metodos directos
5.7.2
La observacin
5.7.2.1 Formas de observar la poblacin:
5.7.3
La experimentacin:
5.7.4
Metodos indirectos
5.7.4.1 La encuesta:
5.7.4.2 La entrevista:
5.8 Tipos de preguntas
5.8.1
Preguntas abiertas.5.8.2
Preguntas cerradas.-
la recoleccion de
CAPITULO 6
6.
Organizacin de los datos.
6.1. Aproximacion y redondeo de datos
6.2. Organizacin de datos
6.2.1.
Codificacin y tabulacion de los datos
6.3. Tablas de frecuencia
6.3.1.
Pasos para la elaboracion de una tabla de
frecuencias
CAPITULO 7:
7. Presentacion de datos
7.1.
Grficos estadsticos
7.2.
Tipos de grficos estadsticos
7.2.1.
El diagrama de barras
7.2.2.
Grficos de barras verticales
7.2.3.
Grficos de barras horizontales
7.2.4.
Grficos de barras proporcionales
7.2.5.
Grficos de barras comparativas
7.2.6.
Histogramas
7.2.7.
Grficos de lneas
7.2.8.
Grficos circulares
7.2.9.
Grficos de reas
7.2.10. Cartogramas
7.2.11. Grficos mixtos
7.2.12. Otros grficos
7.2.12.1. Los dispersogramas
7.2.12.2. Pictogramas
7.3.
Cuadro estadistico
7.3.1.
Estructura de un cuadro estadistico
CAPITULO 8
1.1 Sumatorias
1.2 Medidas de tendencia central
1.2.1
La media aritmetica
1.2.1.1 Propiedades de la media aritmtica
1.2.1.2 Ventajas y desventajas de la
aritmtica
1.2.1.3 Calculo de la media aritmetica
1.2.2
Media aritmtica ponderada
1.2.2.1 Media geomtrica
1.2.2.2 Media armnica
1.2.3
La mediana
1.2.3.1 Caracteristicas de la mediana
1.2.3.2 Calculo de la mediana:
1.2.4
La moda
1.2.4.1 Caracteristicas
1.2.4.2 Calculo de la moda
media
CAPITULO 9
9.1 La dispersin.
9.2 Medidas de dispersion
9.2.1
El rango
9.2.2
La desviacion media
9.2.2.1 Caracteristicas
9.2.2.2 Calculo de la desviacion media
9.2.2.3 Calculo de la desviacion media para datos
agrupados
9.2.3
La varianza
9.2.3.1 Propiedad de la varianza
9.2.3.2 Varianza corregida
9.2.4
La desviacion estandar
9.2.4.1 Calculo de la desviacion estandar
9.2.4.2 Calculo de la desviacion estandar para datos
agrupados
9.2.5
El coeficiente de variabilidad
9.2.6
Coeficiente de asimetria
9.2.7
Coeficiente de curtosis:
CAPITULO 10
10. Medidas de posicin no central (cuantiles)
10.1. Cuartiles ( q )
10.2. Quintiles
10.3. Deciles ( di)
10.4. Centiles o percentiles ( pi )
CAPITULO 11:
11. Numeros indice
11.1. Definicion
11.2. porqu usar nmeros indices?
11.3. Tipos de numeros indices
11.4.
11.5.
11.6.
11.7.
Precios relativos
ndice de agregados no pesados.
ndice de agregados pesados.
Problemas en la construccin y en el uso de
nmeros ndice.
CAPITULO 12:
12. Regresin lineal simple
12.1. El coeficiente de correlacin lineal
CAPITULO 1:
2. INTRODUCCION
Hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc, no
nos aborde diariamente con cualquier tipo de informacin estadstica sobre accidentes de
trfico, ndices de crecimiento de poblacin, turismo, tendencias polticas. Esta idea es la
consecuencia del concepto popular que existe sobre el trmino y que cada vez est ms
extendido debido a la influencia de nuestro entorno. La estadstica se suele pensar en una
relacin de datos numricos presentada de forma ordenada y sistemtica.
La estadstica es un instrumento de investigacin. Puede ser en gentica, mercadeo, nutricin,
agronoma, etc. Es el campo de la investigacin no el instrumento el que debe proporcionar los
"porqu" del problema de investigacin. A veces este hecho se pasa por alto y los usuarios
olvidan que tienen que pensar, que la estadstica no puede pensar por ellos
La estadstica generalmente se ocupa de reunir, organizar y analizar datos numricos y as
mismo ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones.
El planeamiento estadstico y la evaluacin de la investigacin contribuyen a los avances
tecnolgicos en el cultivo y procesamiento de alimentos; el control estadstico de calidad de los
productos manufacturados; hace confiables los equipos automticos y elctricos.
Ayuda
a los encuestadores a recolectar datos para determinar las preferencias de
esparcimiento del pblico. Proporciona informacin para el estudio del impacto ambiental y
ayuda a las exigencias gubernamentales como por ejemplo para que la industria farmacutica
demuestre que un producto es benfico y no solo inofensivo.
DEFINICIONES DE ESTADISTICA
es decir, una funcin de valores de muestra. "La estadstica es una tcnica especial apta para el
estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa
de observaciones de otros fenmenos ms simples llamados individuales o particulares". (Gini,
1953.
MURRAY R. SPIEGEL
(1991) dice: "La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y
analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables
basadas en tal anlisis. "La estadstica es la ciencia que trata de la recoleccin, clasificacin y
presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin,
descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954).
1.12
CLASIFICACION DE LA ESTADISTICA
INDICADOR ESTADISTICO
IMPORTANCIA DE LA ESTADISTICA
Es tan importante que casi no existe actividad humana en que no est involucrada la
Estadstica. Las decisiones ms importantes de nuestra vida se toman con base en la aplicacin
de la Estadstica. Pongamos algunos ejemplos.
La estadstica es de gran importancia en la investigacin cientfica debido a que:
1. Permite una descripcin ms exacta.
2. Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar.
3. Permite resumir los resultados de manera significativa y cmoda.
4. Nos permite deducir conclusiones generales.
La evolucin de la estadstica ha llegado al punto en que su proyeccin se percibe en casi todas
las reas de trabajo. La estadstica es parte esencial de la forma profesional, es hasta cierto
punto una parte necesaria para toda profesin.
1.15
USOS DE LA ESTADSTICA
Organizacin de las Naciones Unidas (ONU). Integrated and coordinated implementation and follow-up of major. United Nations
conferences and summits. Nueva York, Estados Unidos de Amrica, 10 y 11 de mayo de 1999, p. 18.
CAPITULO 2:
5. LA ESTADISTICA Y LA INVESTIGACIN CIENTFICA
La investigacin es la bsqueda sistematizada y objetiva de nuevos conocimientos. Investigar es
un proceso de buscar, indagar o pesquisar. El mtodo cientfico, comprende la realizar a
investigacin en forma sistematizada y objetiva, organizada y coherente.
La estadstica permite probar hiptesis planteadas por el experimentador, determina
procedimientos prcticos para estimar parmetros que intervienen en modelos matemticos y de
esa manera construir ecuaciones empricas.
No existe investigacin, proceso o trabajo encaminado a obtener informacin cuantitativa en la
que la estadstica no tenga una aplicacin. La estadstica no puede ser ignorada ningn
investigador, an cuando no tenga ocasin de emplear la estadstica aplicada en todos sus
detalles y ramificaciones.
LA PLANIFICACIN
La
planificacin
no
se
realizar
adecuadamente si antes no se ha definido
claramente la naturaleza y objetivos de la
investigacin as como la evaluacin de los
conocimientos que se tienen sobre el
problema y de las hiptesis que se han
formulado para explicarlo.
1 Paso: Planteamiento del problema.
Equivale a preguntarse: Qu necesidades
o inconvenientes hay?
2 Paso: Determinar los objetivos de la
investigacin. Equivale a preguntarse: :
Qu se va realizar en el estudio?
2-a) Paso: Formulacin de Hiptesis.
Las hiptesis son afirmaciones que se
verificaran o rechazaran en el transcurso
del desarrollo de la investigacin. Su
formulacin debe ser clara puesto que el
diseo, planificacin y desarrollo de la
investigacin dependern de las hiptesis
que se van a probar.
3 Paso: Fundamento e importancia de la investigacin. Equivale a preguntarse: : Para
que servir la investigacin?
4 Paso: Unidad de anlisis y variables. A quin o qu voy a analizar? (mnima unidad de
investigacin) Qu datos se debe obtener de ellos?.
5 Paso: Identificacin de las Fuentes de Informacin. Si se necesitara realizar encuestas o
entrevistas, recurrir a archivos (registros continuos) o ambos.
5.1.2
RECOLECCIN DE DATOS.
5.1.3
ORGANIZACIN DE DATOS.
Etapa que implica la revisin cuidadosa de la informacin recogida para resumirla y presentarla
convenientemente.
Se consideran los siguientes aspectos:
Revisin y correccin de la informacin recogida etapa labor es llamada: Consistencia.
Presentacin de la informacin mediante cuadros, tablas y grficos.
5.1.4
RESULTADOS Y CONCLUSIONES.
Indicar lo ms
2.
3.
4.
a.
b.
c.
d.
5.
6.
CAPITULO 3:
6. POBLACIN MUESTRA Y MUESTREO.
Imagina por ejemplo que tu clase ha sido seleccionada como la muestra de una poblacin. El
estudio que se vaya a realizar podra ser de diferentes temas, como los siguientes:
La opinin sobre la posibilidad de organizar movidas alternativas en tu ciudad, y sobre
las propuestas de actividades a realizar en dicha movida.
Un sondeo sobre la valoracin de los diferentes lderes polticos.
La opinin sobre el destino de un posible viaje de fin de curso de los alumnos de tu nivel.
Crees que tu clase sera una buena muestra para cualquiera de estos casos?
La respuesta es que, por
ejemplo, para el segundo
caso, los alumnos de una
clase no son la muestra
adecuada. Para el primer
caso, es razonable pensar
que pueden
aportar
informacin
interesante,
aunque la muestra puede
resultarpequea y podra
faltarle
informacin
(chicos de otras edades,
de otros barrios...), mientras que para el tercer caso, la muestra puede ser muy adecuada. Es
por tanto muy importante la eleccin de una tcnica de muestreo que nos asegure que la
muestra escogida es adecuada para el estudio que queremos realizar.
3.7. POBLACIN
El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal,
es un agregado de datos individuales, personas, objetos, cosas, etc. acerca de las cuales se
desea informacin. Se relaciona con el censo. Una poblacin se precisa como un conjunto finito
o infinito de personas u objetos que presentan caractersticas comunes acerca de los cuales
intentamos sacar conclusiones.
La caracterstica de los datos poblacionales se les denomina "PARAMETROS".
La poblacin, o el universo, est formado por la totalidad de los elementos que se desean
estudiar, ejemplos podran ser: La poblacin total del Per, los alumnos cursantes en las
universidades del pas, la produccin de toda una industria, a cosecha de un ao dado, el
rendimiento de una raza de ganado, entre otros.
Ejemplo:
Las edades de todos los habitantes del Per.
El nivel de ingresos de las personas de la provincia de Ilo.
La cantidad de cobre extrado en el mundo.
El nmero de microbios existentes en Ocano Pacfico.
Los miembros del Colegio de Ingenieros de La regin Moquegua
Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se
dificulte en cuanto al trabajo, tiempo y costo necesario para hacerlo. Si el nmero de elementos
que integra la poblacin es muy grande, se puede considerar a esta como una poblacin
infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es
aquella que est formada por un limitado nmero de elementos.
3.1.2.
CENSO:
Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres
componentes de una poblacin. Para Levin & Rubin (1996) "Algunas veces es posible y prctico
examinar a cada persona o elemento de la poblacin que deseamos describir. A esto lo
llamamos una numeracin completa o censo. Utilizamos el muestre cuando no es posible contar
o medir todos los elementos de la poblacin.
Si es posible listar (o enumerar) y observar cada elemento de la poblacin, los censos se utilizan
rara vez porque a menudo su compilacin es bastante difcil, consume mucho tiempo por lo que
3.8. MUESTRA
Una muestra representativa contiene las caractersticas relevantes de la poblacin en las
mismas proporciones que estn incluidas en tal poblacin. Los expertos en estadstica
recogen datos de una muestra utilizan esta informacin para hacer referencias sobre la
poblacin que est representada por la muestra. En consecuencia muestra y poblacin son
conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de
ese todo
El estudio de muestras es ms
sencillo que el estudio de la
poblacin completa; cuesta menos
y lleva menos tiempo. Por ltimo se
aprobado que el examen de una
poblacin entera todava permite la
aceptacin
de
elementos
defectuosos, por tanto, en algunos
casos, el muestreo puede elevar el
nivel de calidad.
La caracterstica de los datos
muestrales vienen a ser los
"ESTADIGRAFOS".
Existen 3 razones principales para extraer una muestra:
1. lleva menos tiempo que un censo completo
2. es menos costoso
3. es ms gil y eficiente que obtener el completo de la poblacin objeto.
Ejemplo:
Las edades de los habitantes del Departamento de Lima.
El nivel de ingresos de los trabajadores del sector salud.
La cantidad de cobre extrado en el Departamento de Moquegua.
El estudio realizado a 50 miembros del Colegio de Ingenieros de la Regin Moquegua
Adems las muestras pueden ser:
Muestras grandes:
Son consideradas aquellas cuyo nmero de sujetos (N) es superior a 30. Cuando ms
grande sea una muestra ms significativos sern los resultados obtenidos de ella en relacin
con la poblacin.
Muestras pequeas:
Son consideradas aquellas cuyo nmero de sujetos (N) es inferior a 30. El problema de las
muestras pequeas es que debido a su escaso nmero de representantes de la poblacin a
estudiar, puede ofrecer unos datos menos representativos de dicha poblacin.
3.8.1.
EL TAMAO DE LA MUESTRA
utilizando la formula:
Donde:
z = Valor de la tabla de la distribucin normal de acuerdo al nivel de
alfa (significancia)
S = Desviacin estndar de las observaciones de referencia
d = Error de muestreo
Si no se cumple, pasamos a una tercera fase: Obtener el tamao de la muestra segn la
siguiente frmula:
Para la aplicacin de esta frmula se necesita tener datos de referencia.
Puede ser retrospectivo (sucesos ocurridos anteriormente).
Ejemplo.: si se quiere realizar un estudio en alumnos repitentes. Para
hallar el tamao de muestra, se necesita conocer el nmero de alumnos
repitentes de los aos pasados.
Ejemplo: La Consejera de Trabajo planea un estudio con el inters de conocer el promedio de
horas semanales trabajadas por las mujeres del servicio domstico. La muestra ser extrada de
una poblacin de 10000 mujeres que figuran en los registros de la Seguridad Social y de las
cuales se conoce a travs de un estudio piloto que su varianza es de 9.648. Trabajando con un
nivel de confianza de 0.95 y estando dispuestos a admitir un error mximo de 0,1 (10%), cul
debe ser el tamao muestral que empleemos?.
Buscamos en las tablas de la curva normal el valor de
confianza elegido:
1.-
3.-
q=1-p
Para la aplicacin de esta frmula se necesita conocer la proporcin de inters, este dato
generalmente se obtiene realizando una encuesta piloto. En el caso de que no se proporcionara
N (poblacion)
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
6000
7000
8000
9000
10000
15000
20000
25000
50000
100000
mas de 100000
INTERPOLACION
Cuando la poblacin es por ejemplo 1800 es decir no existe este valor entonces se procede
a interpolar de la siguiente manera:
A =
1500
a
=
316
N =
1800
n
=
No conocemos
2000
333
A y B son valores de la poblacin inferior y superior de la tabla de FISHER-ARKINCOLTON, en relacin a n= 1800, A UN NIVEL DE SIGNIFICANCIA DE 5%.
a y b son valores de la muestra inferior y superior de la tabla de FISHER -ARKIN-COLTON
en relacin a "n" que no conocemos a un nivel de significancia de 5%.
A
B
a
b
----------------------=
--------------------N
B
n
b
Remplazando
1500 - 2000
316
333
-------------------------=
------------------------1800 - 2000
n
333
Despejando "n" tenemos
326.2
326.
EJEMPLO
Clculo del tamao de la muestra en el muestreo aleatorio simple
Factores de la muestra:
El error absoluto que se est dispuesto a admitir en las estimaciones:
error = Kestimador (1).
(estimador) es la desviacin tpica del estimador.
(K) depende de la distribucin de los elementos de la poblacin y del grado de confianza
requerido; en una distribucin normal, (K) es 1,96 para un nivel de confianza del 95% y de
1,64 para el 90%.
La varianza o la desviacin tpica de los parmetros a estimar.
El nivel de confianza de las estimaciones.
Los lmites de confianza vienen dados por la expresin del estimador Kestimador, quedando
definidos los lmites de confianza: estimador error.
Dependiendo de la variable objetivo de la investigacin, el tamao de la muestra se determina
sustituyendo en (1) la varianza del estimador para la media, la proporcin y el total
As, el tamao de la muestra (n) ser:
NK2S2
n=
Para estimar una media:
Ne2 + K2S2
K2PQN
n=
Para estimar una proporcin:
2
e (N - 1) + K2PQ
N2K2S2
n=
Para estimar un total:
e2 + NK2S2
(e) es el error absoluto fijado de antemano.
Ejemplo:
En una empresa con 3000 clientes, se quiere saber:
1. El porcentaje de clientes que est satisfecho con las relaciones comerciales, admitiendo un
error del 3%.
2. Las compras medias de una determinada ruta en un mes, admitiendo un error de 1 dlar.
3. El total de compras realizadas en un mes, admitiendo un error de 5000 dolares.
De investigaciones anteriores se cree que el porcentaje de clientes satisfecho es del 10%, y que
la desviacin tpica de la ruta analizada es de 10 dlares y la de las compras totales de 20
dlares.
Suponiendo que los valores se distribuyen normalmente en la poblacin, para un nivel de
confianza del 95%, el tamao muestral ser:
1,962 10 90 3000
Para la proporcin:
n=
= 341
32(3000 - 1) + 1,962 10 90
3000 1,962 102
Para la media:
n=
= 341
3000 12 + 1,962 102
2
2
2
3000 1,96 20
Para el total:
n=
=468
50002 + 3000 1,962 202
EJERCICIOS
Determine la poblacin y la muestra en cada uno de
los siguientes casos.
1.
2.
13.
14.
15.
16.
17.
18.
19.
20.
TAMAO DE MUESTRA
1.
2.
3.
4.
5.
7.
8.
9.
Consume
No consume
Total
Nios
226
471
Se solicita:
a) Complete el cuadro y determine el tamao de
la muestra.
b) Calcule la proporcin de mujeres en el total
alumnos.
c) El porcentaje de alumnos que consumen
fruta.
d) El porcentaje de mujeres que consumen fruta
sobre el total de la poblacin.
Nias
203
300
e)
f)
g)
h)
i)
Total
3.9. EL MUESTREO
El muestreo es una herramienta
de la investigacin cientfica. Su
funcin bsica es determinar
que parte de una realidad en
estudio (poblacin o universo)
debe
examinarse
con
la
finalidad de hacer inferencias
sobre dicha poblacin. El error
que se comete debido a hecho
de
que
se
obtienen
conclusiones
sobre
cierta
realidad
a
partir
de
la
observacin de slo una parte
de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una
versin simplificada de la poblacin, que reproduzca de algn modo sus rasgos bsicos.
Al elegir una muestra se espera que sus propiedades sean extrapolables a la poblacin. Este
proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un
estudio de toda la poblacin. Cabe mencionar que para que el muestreo sea vlido y se pueda
realizar un estudio fiable (que represente a la poblacin), debe cumplir ciertos requisitos, lo que
lo convertira en una muestra representativa.
El muestreo puede ser:
3.10.
TIPOS DE MUESTREO
Para
seleccionar
los
individuos de la muestra es
fundamental
proceder
aleatoriamente.
Si
se
procede como si de un
sorteo se tratara, eligiendo
directamente
de
la
poblacin sin ningn otro
condicionante, el muestreo
se llama aleatorio simple o
irrestrictamente aleatorio.
Cada elemento de la
poblacin
tiene
igual
probabilidad de ser incluida
en la muestra. Se requiere
tener una lista detalladas de los elementos (mtodo de la rifa). Una de las desventajas es que
es posible adems cometer sesgo como por ejemplo de hombres y mujeres obtener mas
hombres. p.e.
Procedimiento.- se asigna un nmero a cada individuo de la poblacin y a travs de algn
medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios
generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario
para completar el tamao de muestra requerido. Este procedimiento, atractivo por su simpleza,
tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande.
3.10.2.2.
Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero
en lugar de extraer n nmeros aleatorios solo se extrae uno. Se parte de ese nmero aleatorio i,
que es un nmero elegido al azar, y los elementos que integran la muestras son los que ocupan
los lugares i,i+k,i+2k,i+3k,,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k=N/n. el nmero i
que empleamos como punto de partida ser un nmero al azar entre 1 y k.
El riesgo de este tipo de muestreo est en los casos en que se dan periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones
y los ltimos 5 son mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre
seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los
dos sexos.
Por ejemplo de N=38 alumnos se toma una muestra nFAC= 15.2 Ahora l= 38 / 15 = 2.5 = 3 .
Luego, se elige aleatoriamente el primero numero, a continuacin se escoge 15 alumnos
"saltando" a intervalos de tres nmeros hasta completar los 15.
3.10.2.3.
Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran
homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la
profesin, el municipio de residencia, el sexo, el estado civil, etc.).
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de
inters estarn representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarn parte de la muestra. En
ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento
detallado de la poblacin. (Tamao geogrfico, sexos, edades).
Cuando la poblacin se puede
subdividir en clases (estratos) con
caractersticas especiales, se puede
mostrar de modo que el nmero de
individuos de cada estrato en la
muestra mantenga la proporcin que
exista en la poblacin. Una vez fijado
el nmero que corresponde a cada
estrato, los individuos se designan
aleatoriamente. Este tipo de muestreo
se denomina aleatorio estratificado con
asignacin proporcional.
Procedimiento.- Primero se divide a
la poblacin en N subpoblaciones N1,
N2, Nk, a estas subpoblaciones se
llaman
Estratos.
Una
vez
determinados los estratos se extrae
una muestra de cada uno, las
extracciones deben hacerse independientemente en los diferentes estratos. As por ejemplo:
Dado una poblacin "N" con N1, N2, N3, ..Nk estratos y n1, n2, n3 .nk se halla con la
siguiente formula:
ni
=
Tamao de la muestra del estrato "i"
Ni
=
Poblacin del estrato "i"
nFAC =
Tamao de la muestra de la Poblacin en estudio
segn la tabla FAC
N
=
Poblacin en estudio.
La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y
puede ser de diferentes tipos:
Afijacin simple A cada estrato le corresponde igual nmero de elementos muestrales.
Afijacin proporcional La distribucin se hace de acuerdo con el peso (tamao) de la
poblacin en cada estrato.
Afijacin Optima Se tiene en cuenta la previsible dispersin de los resultados, de modo que se
considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no suele conocer la
desviacin.
3.10.2.4.
3.11.
ERROR MUESTRAL
EL ERROR ESTNDAR
7.
No
8.
9.
SEXO
EDAD
PESO
TALLA
No
SEXO
EDAD
PESO
TALLA
16.8
51
1.62
24
17.8
60
1.7
16.7
60
1.65
25
17.8
60
1.73
16.6
60
1.68
26
17.8
56
1.68
16.6
61
1.72
27
17.8
65
1.7
16.6
53
1.63
28
17.8
54
1.63
16.6
63
1.69
29
17.8
58
1.66
16.6
49
1.67
30
17.7
54
1.7
16.6
49
1.68
31
17.7
64
1.7
16.5
58
1.69
32
17.7
47
1.65
10
16.5
51
1.64
33
17.6
51
1.66
11
16.5
47
1.63
34
17.6
55
1.71
12
16.4
53
1.64
35
17.6
56
1.67
13
16.4
64
1.73
36
17.1
55
1.64
14
16.4
62
1.72
37
18.6
70
1.7
15
16.4
56
1.65
38
18.6
55
1.67
16
16.4
52
1.68
39
18.5
60
1.63
17
16.3
53
1.64
40
18.5
56
1.72
18
16.3
62
1.72
41
18.5
65
1.63
19
16.3
54
1.67
42
18.4
57
1.72
20
16.3
55
1.65
43
18.4
56
1.72
21
16.3
54
1.63
44
18.4
51
1.67
22
16.2
52
1.66
45
18.4
55
1.71
23
16.1
48
1.6
46
18.4
54
1.7
40
25
15
25
35
25
50
25
40
30
20
10
10
15
30
45
10
25
10
15
30
25
40
55
70
25
30
45
40
50
55
10
43
25
Seleccione una muestra de esta poblacin utilizando alguna tcnica de muestreo.
Seleccione el tamao de una muestra de esta poblacin mediante un muestreo aleatorio sistemtico.
60
12. El Censo del ao 2009 del INE muestra que en ILO el 10,5% de los residentes tienen ms de 60 aos. Para
verificar un sistema de muestreo por telfono se llaman a 200 residencias elegidas al azar. De los residentes
contactados, 9,2% tenan ms de 60 aos.
a. 10,5% es un Parmetro una Estadstica?
b. 9,2% es un Parmetro una Estadstica?
13. El ao 2010 la Universidad tiene 5453 estudiantes, en la tabla se muestra un detalle de la composicin.
Necesitamos una muestra de tamao 20 de la poblacin de estudiantes:
MUJERES
HOMBRES
TOTAL
PREGRADO
2461
2848
5309
POSTGRADO
67
77
TOTAL
2528
2925
Elija muestras de tamao 20 para 2 tipos de muestreo:
a. Muestreo Aleatorio Simple.
b. Muestreo Aleatorio Estratificado.
144
5453
14. Una compaa de marketing saca una muestra aleatoria de la gua de telfonos tomando 10 personas cuyos
apellidos comiencen con letra A, 10 personas cuyos apellidos comiencen con la letra B, y as sucesivamente con
cada letra del alfabeto, para una muestra total de 260 personas.
a. Qu clase de diseo muestral se us aqu?
b. Tienen todos los que estn en la gua de telfonos igual posibilidad de ser elegidos en la muestra?
c. No todos los residentes de la ciudad tiene telfono, Qu clase de sesgo va a provocar este hecho?
CAPITULO 4
7. VARIABLE
Al hacer un estudio de una determinada poblacin, observamos una caracterstica o propiedad
de sus elementos o individuos. Por ejemplo, con los alumnos y alumnas de nuestra clase,
podemos estudiar el lugar donde viven, el nmero de hermanos, la estatura, etc. Cada una de
estas caractersticas estudiadas se llama variable estadstica.
La correspondencia entre los anlisis
aplicados y datos recabados permite
construir juicios concluyentes sobre el
colectivo en estudio. Los datos que
precisamos deben ser generados de
alguna forma, la cual siempre est
asociada a la definicin de variables,
que constituyen los conceptos de referencia ms importantes en los inicios de una investigacin.
7.1 VARIABLE ESTADSTICA
Es la caracterstica de la muestra o poblacin que se est estudiando. Los datos son el producto
de su medicin sobre los elementos o sujetos de estudio. Por ejemplo en un estudio sobre la
cantidad mensual devengada por los trabajadores de una empresa, la variable es ingreso y est
medida en nuevos soles.
Tambin diramos que es una caracterstica que puede tomar diferentes valores por ejemplo. La
estatura de adultos de sexo masculino, el peso de nios en edad preescolar, la edad de los
pacientes que se ven en una clnica, etc.
VARIABLES CONTINUAS
Se caracterizan por el hecho de que para todo para de valores siempre se puede encontrar en
valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.). Una
variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores
consecutivos. Por ejemplo, la estatura, el peso, la temperatura.
Expectativa de vida, peso, produccin de leche, kg alfalfa/hectarea, altura, etc
Ejemplo:
Persona: Edad, talla, peso, Ingreso, gastos, .....
Hogar: Ingresos por hogar. Gastos por hogar en alimentacin, Monto de alquiler por hogar,.....
Establecimiento comercial: Valor de las ventas por establecimiento, Valor de las compras por
establecimiento, Gastos (electricidad, agua, telf.,..)
En el preescolar, ubicado en la urbanizacin Nueva de esta ciudad se procedi a recoger las
medidas de talla y peso de los nios que a este asisten.
NIO
PESO
TALLA
Cesar
18.300
1.15
Augusto
20.500
1.20
Alvaro
19.000
1.10
Carlos
7.2.2
18.750
1.18
VARIABLES DISCRETAS.
Cuando el valor puede estar representado por nmeros ENTEROS: sern aquellas que pueden
tomar solo un nmero limitado de valores separados y no continuos; son aquellas que solo
toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden
tomar ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable discreta
ya que solo tomar los valores 1, 2, 3, 4... Ntese que no encontramos valor como 1,5
estudiantes
Ejemplo:
Nmero de clientes por da de un Banco.
Nmero de ventas darias de una Empresa.
Nmero de Vuelos por da en el Aeropuerto
Nmero de accidentes por da.
Nmero de personas por hogar.
Nmero de pacientes por hospital
Nmero de Hijos por mujer
Nmero de Cuartos por vivienda
Nmero de Nacimientos por da Maternidad
Nmero de alumnos desaprobados por curso
el nmero de hijos, No de pacientes, No de partos, El No de vehculos vendidos por la
Toyota, El No de viviendas, etc.
7.3 VARIABLES CUALITATIVAS
Son las que expresan cualidad, caracterstica o atributo. Por ejemplo: sexo de un individuo,
lugar de nacimiento, el grado de instruccin, El idioma , la nacionalidad, etc. Ejemplo:
Los estudiantes de enfermera tienen un alto porcentaje de rendimiento. La asignacin de
valores tiene sentido cuando se usa una escala nominal u ordinal para medir la variable
Lugar de Residencia, Idioma, Sexo, Religin, Categora Ocupacional, Nivel de Educacin de las
PERSONAS.
Actividad Econmica, Condicin Jurdica, Ao de Inicio Actividades de EMPRESAS.
Materiales de Techo, piso y paredes; Rgimen de Tenencia, Estado de Conservacin y Tipo de
las VIVIENDAS
Pueden ser de dos tipos: nominales y ordinales (cuando existe un orden o jerarqua)
Ejemplo
En el siguiente enunciado identifique: Poblacin, Muestra, Unidad elemental, Variable(s), Tipo(s), Observacin. Adems
defina los parmetros y valores estadsticos correspondientes.
Las tiendas dedicadas a la comercializacin de artefactos elctricos nacionales han encargado realizar un estudio con la
finalidad de obtener algunos indicadores. El estudio se realiz con una muestra de 60 tiendas obtenindose los
siguientes resultados:
El 60% de los artculos suministrados trimestralmente por los proveedores son vendidos en ese periodo.
La utilidad neta promedio por artefacto vendido es de 15% del costo.
El 80% de los artculos vendidos corresponden a la denominacin "lnea blanca".
Promedio de devolucin: 2 artculos trimestralmente debido a fallas tcnicas.
Solucin:
Poblacin: Tiendas dedicadas a la comercializacin de artculos elctricos nacionales. Muestra: 60 tiendas elegidas en
el estudio.
Unidad: una tienda de la poblacin definida. Variables:
1.
% de artculos vendidos respecto al total suministrado.
Tipo: cuantitativa discreta. Observacin: 50%
Parmetro: % promedio de ventas trimestrales de artculos vendidos respecto al total suministrado.
Valor del parmetro: desconocido.
Valor estadstico: % promedio de ventas trimestrales de artculos vendidos respecto de la muestra. Valor: 60%.
2.
Utilidad neta.
Tipo: cuantitativa continua. Observacin: 10%
Parmetro: % promedio correspondiente a la utilidad neta por artefacto respecto al costo de compra del total de
artculos vendidos.
Valor del parmetro: desconocido.
Valor estadstico: % promedio correspondiente a la utilidad neta por artefacto respecto al costo de compra del total de
artculos vendidos seleccionados en la muestra. valor: 15%.
Completar con las otras variables del estudio.
Dirjase a la biblioteca y tome al azar 5 ttulos diferentes de tesis de grado. Identifique en cada una de ellas por lo
menos una de las variables usadas en la investigacin y defina en qu escala est medida. Finalmente anote la prueba
estadstica usada para su anlisis y comente si fue correctamente aplicada en funcin de la escala de medicin
definida
EJERCICIO
Indica si cada una de las siguientes variables estadsticas es cuantitativa o cualitativa:
1) Deporte preferido
2) Nmero de calzado
3) Estatura
4) Estudios que desea realizar
5) Puntaje en la ltima prueba
7.4 MEDICIN
Existen diversas definiciones del trmino "medicin", pero estas dependen de los diferentes
puntos de vista que se puedan tener al abordar el problema de la cuantificacin y el proceso
mismo de la construccin de una escala o instrumento de medicin.
En general, se entiende por medicin la asignacin de nmeros a elementos u objetos para
representar o cuantificar una propiedad. El problema bsico est dado por la asignacin un
numeral que represente la magnitud de la caracterstica que queremos medir y que dicho
nmeros pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la
medicin, los atributos de nuestras percepciones se transforman en entidades conocidas y
manejables llamadas "nmeros". Es evidente que el mundo resultara catico si no pudiramos
medir nada. En este caso cabra preguntarse de que le servira la fsico saber que el hierro
tiene una alta temperatura de fusin.
7.4.1
ESCALAS DE MEDICIN
26
1
2
Se ha de tener presente que los nmeros asignados a cada categora sirven nica y
exclusivamente par identificar la categora y no poseen propiedades cuantitativas. Los valores
son nominativos, sirven para designar. Slo se puede realizar un conteo (frecuencias). No es
factible las operaciones aritmticas. Se analizan a travs de la comparacin: igualdad y no
igualdad ( = y ).
Ejemplo
SEXO DEL PACIENTE
1: Masculino
GRUPO SANGUNEO
SERVICIO MDICO
1: Emergencia
AB
2: Femenino
O
2: Ginecologa
3: Traumatologa
4: Pediatra
27
Ejemplo:
CALIFICACIN
LUGAR (ORDEN)
DOLOR
leve
moderado
A>B
1 > 2
intenso
insoportable
28
Es la escala ms fuerte, dado que usa un sistema numrico en el que el cero es un valor que
indica ausencia de la caracterstica que se est midiendo. Las operaciones aritmticas de
multiplicacin y divisin adquieren significacin.
Ejemplo:
La diferencia entre dos valores es importante y de magnitud definida. As por ejemplo, el valor
de cero nuevos soles en ingresos de una tienda, puede interpretarse de manera lgica que no
se han producido ventas. De la misma manera un artculo con un peso de 6 Kg. tiene el doble
de peso de otro que registra 3 Kg.
El nivel de medida ms elevado es el de cocientes o razones, y se
diferencia de las escalas de intervalos iguales nicamente por
poseer un punto cero propio como origen; es decir que el valor cero
de esta escala significa ausencia de la magnitud que estamos
midiendo. Si se observa una carencia total de propiedad, se dispone
de una unidad de medida para el efecto.
A iguales diferencias entre los nmeros asignados corresponden
iguales diferencias en el grado de atributo presente en el objeto de
estudio. Adems, siendo que cero ya no es arbitrario, sino un valor
absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
Se utilizan nmeros cardinales. Tienen unidad de medida (cms,
pulgadas). El cero es absoluto, indica ausencia de la propiedad. Se
pueden realizar operaciones aritmticas (+,-,x ,),
Ejemplo:
Pacientes no atendidos hoy
0
N de hijos en edad de vacunacin
0
Procesos deficientes
0
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observ que hay familias que no
tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen
3 hijos.
29
30
EJERCICIO
1.
2.
3.
4.
5.
6.
7.
31
DATO:
Los datos estadsticos son el producto de las observaciones efectuadas en las personas y
objetos en los cuales se produce el fenmeno que queremos estudiar. Los datos estadsticos
se pueden encontrar de forma no ordenada, por lo que es muy difcil en general, obtener
conclusiones de los datos presentados de esta manera.
Para poder obtener una precisa y rpida informacin con propsitos de descripcin o anlisis,
estos deben organizarse de una manera sistemtica; es decir, se requiere que los datos sean
clasificados. Esta clasificacin u organizacin puede muy bien hacerse antes de la recopilacin
de los datos.
Los datos estadsticos han sido generalmente
usados por los gobiernos organizados como forma
de ayudar a la toma de decisiones en la
administracin del estado. Los datos estadsticos
son concisos, especficos y capaces de ser
analizados
objetivamente
por
diferentes
procedimientos.
Ejemplo: Si se quiere conocer las caractersticas de
los estudiantes de la Carrera Profesional de
Ingeniera Comercial, que solicitan prstamo a la
biblioteca de dicha Universidad, la recoleccin de la informacin debe clasificar a cada
estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc.
5.13
32
EL METODO DE RECOLECCION
Son todos aquellos medios de los cuales procede la informacin, que satisfacen las
necesidades de conocimiento de una situacin o problema presentado, que posteriormente
ser utilizado para lograr los objetivos esperados. De acuerdo a su origen se clasifican en:
Responsable : Ing. R. CESAR CONDORI PALOMINO
33
Fuentes primarias.
Fuentes secundarias.
5.16.1 LAS FUENTES PRIMARIAS
Son aquellas en las que los datos provienen directamente de la poblacin o muestra de la
poblacin, mientras que las fuentes secundarias son aquellas que parten de datos preelaborados, como pueden ser datos obtenidos de anuarios estadsticos, de Internet, de
medios de comunicacin.
Las Fuentes Primarias para su recopilacin se obtienen por medio de una investigacin
directa al objeto de estudio, a travs de mtodos establecidos. Para reunir datos primarios,
lo ideal es recurrir a un plan que exige tomar varias decisiones: los mtodos e instrumentos de
investigacin,
el plan de muestreo, y las tcnicas para establecer contacto con el
pblico.
Planeacin de la recoleccin de informacin primaria
ENFOQUES DE
INVESTIGACION
Observacin
Encuesta
Experimento
METODOS DE
CONTACTO
Correo
Telfono
Personal
PLAN DE MUESTREO
Unidad de Muestreo
Tamao de la Muestra
Mtodo de Muestreo
INSTRUMENTOS DE
INVESTIGACION
Cuestionario
Instrumentos Mecnicos
Instrumentos
34
La fuente es imparcial?
Los datos comprueban o contradicen otras evidencias que se disponen?
Hace falta una evidencia cuya ausencia conduzca a otra conclusin?
Cuantas observaciones se tienen?
La conclusin que obtengo es lgica?
5.16.2.2 EL CUESTIONARIO O FORMULARIO
Es el mtodo que utiliza un instrumento o formulario impreso, destinado a obtener respuestas
sobre el problema en estudio y que el investigado o consultado llena por s mismo. Son los
cuestionarios; que en muchos casos pueden ser viciados. Las entrevistas personales, por email, servicio postal, telfono, fax, etc.
Aqu podemos incluir el formulario, el cual no brinda mayor seguridad en los datos ms si
economizar. Cualquiera que sea el mtodo por el que se decida el investigador para recabar
informacin, es necesario elaborar un estudio de preguntas.
Los cuestionarios en general, constan de las siguientes partes:
Datos propios de la investigacin, son los datos que interesa conocer para construir el
propsito de la investigacin.
Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de
la encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es
eliminada por no tener ningn tipo de inters para el estudio.
35
36
Observacin Parcial. Dados que las poblaciones en general son grandes, la observacin de
todos sus elementos se ve imposibilitada. La solucin para superar este inconveniente es
observar una parte de esta poblacin.
Observacin Mixta. En este tipo de observacin se combinan adecuadamente la observacin
exhaustiva con la observacin parcial. Por lo general, este tipo de observaciones se lleva a
cabo de tal manera que los caracteres que se consideran bsicos se observan
exhaustivamente y los otros mediante una muestra; o bien cuando la poblacin es muy
grande, parte de ella se observa parcialmente.
5.17.3 LA EXPERIMENTACIN:
Se registra un dato bajo condiciones provocadas simulando el proceso lo ms real posible.
Ejemplo: Un mercado prueba para introducir un tipo jabn de antisptico con fragancia.
5.17.4 METODOS INDIRECTOS
Cuando los datos son obtenidos provienen de los datos previamente recogidos por otras
personas y en este caso se esta hablando de fuentes secundarias p.e publicaciones, revistas
textos etc. Es aquella donde la persona que investiga hace uso de datos estadsticos ya
conocidos en una investigacin anterior, o de datos observados por un tercero (persona o
entidad). Con el fin de deducir otros hechos o fenmenos.
Ejemplo; si un investigador pretende estudiar la produccin por aos de una granja avcola, en
sus ltimos cinco aos de produccin, tendra que hacer un seguimiento, a tal fin recurrira a las
observaciones que posee la oficina administrativa de la granja durante estos cinco aos, o
dirigirse a la oficina de estadstica,
Es de notar que el investigador se vale de observaciones realizadas por terceros.
Se registra la caracterstica a travs de preguntas
No se realiza medicin
Ejemplo: Se pregunta a un paciente el tiempo que esper antes que sea atendido en el
consultorio externo.
Comprende 2 tcnicas: la encuesta y la entrevista.
5.17.4.1
LA ENCUESTA:
37
38
Es una modalidad de investigacin en el que las preguntas, eso s, pueden incidir directa o
indirectamente en el tema investigado.
LOS PASOS QUE SE DEBEN SEGUIR A LA HORA DE HACER UNA ENCUESTA son:
2.
3.
4.
5.
6.
7.
8.
9.
ENCUESTA DE OPINION
MODULO : COYUNTURA ECONOMICA
MECOVI - Per
Programa de
Mejoramiento de las
Encuestas de Condiciones
de Vida en el Per
CONGLOMERADO
N
CUESTIONARIO CONFIDENCIAL
AMPARADO POR EL DECRETO SUPREMO N 018-91-PCM: SECRETO ESTADISTICO
N DE SELECCION
DE LA VIVIENDA
CUESTIONARIO
N
TIPO DE
SELECCION
Cuestionario
Adicional
1
UBICACION MUESTRAL
UBICACION GEOGRAFICA
1. DEPARTAMENTO
5. ZONA N
2. PROVINCIA
6. MANZANA N
3. DISTRITO
7. AER N
4. CENTRO POBLADO
8. VIVIENDA N
5.17.4.2
LA ENTREVISTA:
39
DESVENTAJAS
Es difcil obtener informacin confidencial
Se limita la posibilidad de profundizar en un tema que emerja de la entrevista.
B. LA ENTREVISTA NO ESTRUCTURADA
Es ms flexible y abierta, aunque el objetivo de la investigacin rigen a las preguntas, su
contenido, orden, profundidad y formulacin se encuentran por entero en las manos del
entrevistador.
Finalmente resumiendo tenemos:
FUENTE
METODO
DIRECTO
PRIMARIA
INDIRECTO
SECUNDARIA
5.18
TECNICA
OBSERVACION
EXPERIMENTACION
ENCUESTA
ENTREVISTA
FICHA
TIPOS DE PREGUNTAS
40
5.19
LA FICHA TCNICA
Es el documento resumen que se debe presentar antes de iniciar el trabajo de campo de una
encuesta.
Ejemplo:
FICHA TCNICA
UNIVERSIDAD DE LIMA
GRUPO DE OPININ PUBLICA ESTUDIO 217
BARMETRO MARZO 2010 LIMA METROPOLITANA Y CALLAO
SBADO 13 Y DOMINGO 14
OBJETIVO
Obtener informacin sobre la opinin de la poblacin de Lima Metropolitana y Callao, de 18
a 70 aos, acerca de temas polticos, econmicos y sociales de inters pblico.
DISEO MUESTRAL
Universo: Hombres y mujeres residentes en Lima Metropolitana y Callao, de 18 a 70 aos,
de todos los niveles socioeconmicos.
Muestra: 512 personas elegidas en forma aleatoria en base a una distribucin
demogrfica, con afijacin y ponderacin proporcionales. Error permitido: 4,42%. Nivel de
confianza: 95%.
Cobertura: Distritos de Lima Metropolitana y Callao.
Representatividad: 92,14%.
Responsable : Ing. R. CESAR CONDORI PALOMINO
41
EJERCICIO APLICATIVO
El Director de Personal de la Empresa Santa Luca desea estimar la tardanza mensual
promedio del personal que labora en esta Empresa. Con este fin elige al azar la Tarjeta de
Control de Asistencia del ltimo mes de 10 trabajadores. En uno de las tarjetas seleccionadas
se registr 140 minutos de tardanza
La caracterstica
: Tiempo de tardanza mensual
La unidad elemental
: Un trabajador de la empresa
(o unidad de anlisis)
El marco poblacional
: Todo el personal que labora en esa empresa
La poblacin
: Registro de tiempo de tardanza mensual de todo el
personal que labora en esta empresa
El marco muestral
: Diez trabajadores
La muestra
: Registro del tiempo de tardanza de cada uno de los
trabajadores seleccionado
Tipo de dato
: Variable cuantitativa continua
Un dato registrado
: 140
La unidad de medida
: minutos
El estimador
: El tiempo medio de tardanza de los 10 trabajadores:
El parmetro
: El tiempo medio de tardanza de todos los
trabajadores de la empresa ()
EJERCICIO
1. El Director de un Hospital sabe que en lo que va del ao, fueron dados de alta 1000
pacientes hospitalizados y desea conocer el tiempo medio de permanencia en el hospital.
Para ello selecciona al azar la historia clnica de 100 pacientes. Una de las historias permiti
conocer que cierto paciente haba permanecido 6 das hospitalizado. En esta situacin
identifique los siguientes trminos (no se pide la definicin): Caracterstica. Unidad
elemental. Marco poblacional Poblacin. Marco muestral. Tipo de muestreo. Un dato.
Unidad de medida. Un estimador. Un parmetro
2. En que consiste el mtodo de la entrevista ? Cuales son sus ventajas y desventajas?
3. En que consiste el mtodo del Cuestionario? Cuales son sus ventajas y desventajas?
4. Describa las partes que contiene un formulario utilizado para la recoleccin de datos?
42
CAPITULO 6
8. ORGANIZACIN DE LOS DATOS.
los
los
43
En los datos obtenidos se identifican dos variables: edad y sexo. La variable edad es
cuantitativa y discreta; y la variable sexo es cualitativa.
6.5.1.
44
Bueno
Aceptable
Malo
Muy malo
Segundo, se realiza el conteo de las frecuencias
Tercero, se presenta la tabla, considerando el ttulo y la fuente
CUADRO 1: CALIDAD DEL SERVICIO DE EMERGENCIA
CATEGORIA
MUY BUENO
BUENO
ACEPTABLE
MALO
MUY MALO
TOTAL
No DE
PACIENTES
5
16
12
8
4
45
TASA
PORCENTUAL
11,11
35,55
26,67
17,78
8,89
100
N de pacientes
Tasa porcentual :%
(fi)
(hi)
39 - 46
47 - 54
55 - 62
63 - 70
71 - 78
Total
Ejemplo
COSTO DE MANTENIMIENTO en soles
91
71
104
85
62
78
69
74
97
82
93
72
62
88
98
57
89
68
68
101
75
66
97
83
79
52
75
105
68
105
99
79
77
71
79
80
75
65
69
69
97
72
80
67
62
62
76
109
74
73
45
o en forma descendente.
3. Rango: El Rango de un conjunto de datos est determinado por la diferencia del nmero
ms alto menos el nmero menor del conjunto de datos.
R = No Mayor - No Menor
4. Numero de Intervalos: En algunos caso para un mejor estudio el investigador puede influir
en la determinacin del nmero de intervalos, por ejemplo en un estudio de edades de
nio (podra tener inters en las edades de 0 a 2 nicamente o periodos de cada dos
aos). Sin embargo es frecuente el uso de la LEY DE STURGES Nmero de Intervalos
= 1 + 3,3 * log (No total de datos)
Para nuestro ejemplo: NI = 1 + 3,3 * log (50)
NI = 6,6066 lo cual se aproxima a 7
intervalos.
Tambin es posible definir intervalos dentro de los siguientes limites
5 <= Nmero de Intervalos <= 15
6. Tamao del Intervalo: El tamao del intervalo es la amplitud de cada clase,
o grupo, se obtiene dividiendo el Rango entre el nmero de intervalos.
En nuestro caso
Ancho de clase aproximado = (109 -52)/
6
Cuadro de Frecuencias
COSTO (SOLES)
50
59
60
69
70
79
80
89
90
99
100
109
Frecuencia
2
13
16
7
7
5
50
46
de
mantto
limite
superior
50
60
70
80
90
100
frecuencia
frecuencia
frecuencia
absoluta
absoluta
relativa
acumulada
59
69
79
89
99
109
2
13
16
7
7
5
50
2
15
31
38
45
50
frecuenci
a relativa marca de LIMITES REALES
acumula clase
limite
limite
da
inferior
superior
0,04
0,26
0,32
0,14
0,14
0,1
0,04
0,3
0,62
0,76
0,9
1
54,5
64,5
74,5
84,5
94,5
104,5
59,5
69,5
79,5
89,5
99,5
59,5
69,5
79,5
89,5
99,5
EJEMPLO
Se desea hacer un estudio sobre las calificaciones de 50 estudiantes evaluados en el curso de
Estadstica. Las calificaciones estn en base Centesimal y se muestran a continuacin: 60 33
85 52 65 77 84 65 57 74 71 81 35 50 35 64 74 47 68 54 80 41 61 91 55 73 59 53 45 77 41 78
55 48 69 85 67 39 76 60 94 66 98 66 73 42 65 94 89 88
frecuencia
frecuencia
frecuencia
absoluta
absoluta
relativa
acumulada
frecuenci
LIMITES REALES
a relativa marca de
acumula clase
limite
limite
da
inferior
superior
limite
inferior
limite
superior
33
42
0,14
0,14
37,5
43
52
12
0,1
0,24
47,5
42,5
52,5
53
62
21
0,18
0,42
57,5
52,5
62,5
63
72
10
31
0,2
0,62
67,5
62,5
72,5
73
82
10
41
0,2
0,82
77,5
72,5
82,5
83
92
47
0,12
0,94
87,5
82,5
92,5
93
100
50
0,06
97,5
92,5
42,5
INTERPRETACIONES
La interpretacin de una tabla de frecuencias se realiza de acuerdo a los objetivos del estudio
en ejecucin. Generalmente se resaltan lo que interesa al usuario, los extremos, los promedios,
etc. es decir las cifras que son de inters y que permitan la demostracin de los objetivos de
todo trabajo estadstico.
Ej. En la tabla anterior:
Se tiene un 24% y un 76% de alumnos desaprobados y aprobados respectivamente en el
curso de estadstica.
Responsable : Ing. R. CESAR CONDORI PALOMINO
47
Actividad
Busque datos de desercin escolar, de analfabetismo, desnutricin de la provincia en
diferentes perodos de tiempos y elabore un informe con textos, cuadros, grficos y
conclusiones. Pueden ser datos de su institucin.
EJERCICIOS
Considrense los siguientes datos, los cuales representan la razn de precio - ganancia de una emisin de acciones,
de certificados de valores vendidos muy por arriba del precio promedio del mercado:
5,26
6,90
8,64
5,47
6,07
6,48
8,72
9,16
5,85
8,51
8,96
7,44
8,82
5,88
7,62
5,67
9,00
5,60
7,64
8,82
5,64
10,08
3,81
6,81
7,49
4,56
7,16
8,61
3,86
6,78
9,02
8,65
6,72
8,26
7,90
6,65
7,25
6,26
6,43
7,71
7,52
6,68
7,98
10,27
7,64
7,17
8,06
6,66
8,26
6,67
6,25
7,63
6,73
7,60
8,14
6,91
7,82
6,76
7,75
7,36
8,52
7,23
7,63
6,95
7,78
10,34
6,86
7,74
6,67
7,10
4,00
1.
A 20 de los asistentes a un teatro se les pregunt por el nmero de hermanos que tienen. Estos fueron los
resultados: 2, 1, 0, 1, 1, 3, 2, 2, 4, 3, 2, 1, 1, 1, 0, 2, 1, 2, 3, 5. Organizar los datos anteriores en una tabla de
frecuencias.
2.
En un saln de belleza se lleva el registro de las tinturas aplicadas a sus clientas. El siguiente es el registro del da
anterior: negro, rubio, castao, negro, negro, negro, negro, rubio, rubio, castao, castao, negro, negro, negro,
negro, negro, negro, castao, rubio, rubio, rubio, castao, negro, negro, negro, negro, rubio, negro, negro, castao.
a. A cuantas personas se les aplic tinte de color rubio?
b. Cul es la frecuencia relativa de las personas a quienes se les aplic tinte castao?
c. A que porcentaje de personas se les aplic tinte negro?
d. Cul es el color de tinte que menos se aplic? A que porcentaje equivale?
3.
Los resultados de un test de inteligencia que midi el cociente intelectual de 25 personas, fueron los siguientes:
121, 100, 92, 100, 75, 75, 121, 92, 75, 92, 100, 121, 150, 97, 92, 75, 121, 150, 150, 100, 97, 92, 97, 121, 100.
Elaborar una tabla de frecuencias.
Cuntas personas tienen un coeficiente intelectual por debajo de 100?
Si se consideran personas superdotadas aquellas que tienen un coeficiente intelectual superior a 130, cuntas
personas superdotadas hay en el grupo? A qu porcentaje equivalen?
Qu porcentaje de personas tiene coeficiente intelectual mayor o igual 100?
Cul es la frecuencia relativa de las personas con coeficiente intelectual 75?
En una encuesta realizada a 25 estudiantes del grado sptimo, acerca del nmero de libros que leen en el ao, se
4.
48
5.
6.
7.
8.
9.
Li Ls
fi
4 10
1
10 16
3
16 22
6
22 28
12
28 34
11
34 40
5
40 46
2
Cuntas empresas intervienen en menos de 25 millones de soles?
Se tiene las temperaturas observadas en la zona altoandina sur durante 24 das en C.
Li Ls
fi
hi
-19 - -17
-17 -15
2
-15 -13
8
-13 -11
0.125
-11 -9
4
-9 -7
0.2083
Durante cuntos das se obtuvo una temperatura de 16 a 10?
La tabla muestra la distribucin del ingreso familiar correspondiente a 80 familias.
Li Ls
fi
Fi
hi
160 170
170 180
48
60
180 190
0.125
190 200
0.075
200 210
Determinar el nmero de familias que ganan menos de 200 nuevos soles.
10. Se revisaron 20 lotes de 48 artculos cada uno y se encontr el siguiente nmero de artculos defectuosos por lote: 3, 2, 5,
0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 4, 3, 3, 2, 3
Construir el cuadro de distribucin de frecuencias y qu porcentaje de lotes tienen 2 o ms pero menos de 4 artculos
defectuosos?
11. Dado el siguiente cuadro estadstico referente a los pesos de cierto nmero de pacientes en un hospital.
Li Ls
0 12
12 24
24 36
fi
5
24
18
49
36 48
36
48 - 60
17
Cuntos pacientes pesan mas de 19 y menos de 38 kilos?
12. Los tiempos de vida til (en das) de un tipo de bacteria, se tabul en una distribucin de frecuencias de 5 intervalos de
igual amplitud con frecuencias relativas acumuladas: 0.10; 0.25; 0.55; 0.80; 1.00. Determine la distribucin de frecuencias
absolutas, si la tercera frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si el lmite inferior del
cuarto intervalo es 12.
13. Los datos corresponden a las respuestas de los pobladores de la provincia de Ilo sobre la opinin de la gestin del actual
alcalde categorizado en ( MB = muy bueno, B= bueno , R = regular , D= deficiente):
MB
MB
MB
MB
MB
MB
MB
B
B
D
D
D
a. Presente esta informacin mediante una tabla de frecuencias, luego realice su interpretacin
b. Elabore un grafico adecuado para este tipo de datos
50
CAPITULO 7:
7. PRESENTACION DE DATOS
Cada vez es ms habitual el uso de grficos o
imgenes para representar la informacin
obtenida. No obstante, la confeccin de dichos
grficos debe hacerse con mucho cuidado, y
hemos de ser muy prudentes ya que un mnimo
error en la representacin de una tabla de
frecuencia puede cambiar por completo la
perspectiva de lo que en realidad desea
mostrarse. Se dice que debe hacerse con
prudencia porque una misma informacin
puede tener muchas formas de representarse,
y no todas son correctas, como debe
suponerse.
En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin De
sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema De referencia
(coordenadas), permiten presentar informacin cuantitativa. La utilidad De los grficos es
doble, ya que pueden servir no slo como sustituto a las tablas, sino que tambin constituyen
por s mismos una poderosa herramienta para el anlisis De los datos, siendo en ocasiones el
medio ms efectivo no slo para describir y resumir la informacin, sino tambin para
analizarla.
7.4.
GRFICOS ESTADSTICOS
Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos,
se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos
estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir
fcilmente los hechos esenciales y compararlos con otros. Los grficos constituyen una forma
muy efectiva de presentar informacin. Su utilizacin ayuda a una mejor comprensin.
Todo grfico tiene tres partes:
El ttulo: especfico, pero completo.
El cuerpo: es el grfico en si mismo.
La fuente: especificar el origen de la informacin.
7.5.
Barras
Lneas
Circulares
reas
Cartogramas
7.5.1.
Mixtos
Histogramas
Dispersograma
Pictogramas
EL DIAGRAMA DE BARRAS
15
10
5
0
0
51
7.5.2.
Representan valores usando trazos verticales, aislados o no unos de otros, segn la variable a
graficar sea discreta o continua. Pueden usarse para representar:
o una serie
o dos o ms series (tambin llamado de barras comparativas)
45,0
40,0
35,0
30,0
25,0
20,0
15,0
10,0
5,0
0,0
28,6
12,7
7,8
7,1
1,3
Pago en dinero que
se entrega al
estado.
7.5.3.
42,5
Prestacin de
contribuciones.
Declaracion jurada
de bienes.
Declaracin jurada
de ganancias.
Prestaciones
pecuniarias.
No indica
6,3
9,4
No indica
11,1
19,7
53,4
0,0
7.5.4.
20,0
40,0
60,0
52
7.5.5.
Se utilizan para comparar dos o ms series, para comparar valores entre categoras. Las
barras pueden ser:
o Verticales
o Horizontales
RENDIMIENTO ACADEMICO-GRUPO DE CONTROL
14,14
11,03
11,38
PROMEDIO
10,69
14,48
12,41
ENTRADA
SALIDA
COMUNICACIN
PRODUCCION
EVALUACION
DIMENSION
7.5.6.
HISTOGRAMAS
Estos tipos de grficos se utilizan para representa distribuciones de frecuencias. Algn
software especfico para estadstica grafican la curva de gauss superpuesta con el
histograma.
53
Tipo
bimodal:
Se
observa claramente dos
valores mximos
7.5.7.
GRFICOS DE LNEAS
En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos
ortogonales entre s. Se pueden usar para representar:
Responsable : Ing. R. CESAR CONDORI PALOMINO
54
o
o
una serie
dos o ms series
NUMERO DE ESTUDIANTES
PRE
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
POST
INSTRUMENTO
Estos grficos se utilizan para representar valores con grandes incrementos entre s.
7.5.8.
GRFICOS CIRCULARES
Estos grficos nos permiten ver la distribucin interna de los datos que representan un
hecho, en forma de porcentajes sobre un total. Se suele separar el sector
correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden
ser: En dos dimensiones o en tres dimensiones
PRE test
0,00
0,31
0,38
INICIO
PROCESO
0,31
7.5.9.
LOGRO
PREVISTO
DESTACADO
GRFICOS DE REAS
En estos tipos de grficos se busca mostrar la tendencia de la informacin
generalmente en un perodo de tiempo. Pueden ser:
o Para representar una serie
o para representar dos o ms series
o en dos dimensiones
o en tres dimensiones.
55
7.5.10. CARTOGRAMAS
Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La
densidad de datos se puede marcar por crculos, sombreado, rayado o color.
56
LOS DISPERSOGRAMAS
7.5.12.2.
PICTOGRAMAS
Los pictogramas son grficos similares a los grficos de barras, pero empleando un
dibujo en una determinada escala para expresar la unidad de medida de los datos.
Generalmente este dibujo debe cortarse para representar los datos. Es comn ver
grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con
el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un
pictograma.
Pueden ser:
57
o
o
En dos dimensiones
En tres dimensiones.
7.6.
CUADRO ESTADISTICO
Segn Mendoza & Mendoza "Es el conjunto de datos estadsticos ordenados en columnas y
filas que permite leer compara e interpretar las caractersticas de una o mas variables. Dichos
datos son el resultado de La ejecucin de una investigacin estadstica o el aprovechamiento
con fines estadsticos de un registro administrativo; el mismo que responde a los
requerimientos de los usuarios de La informacin. La adecuada elaboracin de un cuadro
estadstico permite que su contenido sea comprendido sin recurrir a leer el ttulo, y que este a
su vez sea interpretado sin necesidad de observar el contenido.
7.6.1.
1. CODIGO O NUMERO DEL CUADRO: Permite identificar el cuadro de otros por lo que es
necesario asignarle un numero el cual puede ser ascendente y segn el rea o sector al
que pertenece
2. TITULO.: El titulo de un cuadro estadstico debe responder a cuatro preguntas en lo que sea
posible las cuales son:
QUE?
COMO?
CUANDO?
investigacin.
DONDE?
58
Etapa, modalidad y
Total
Gestin
rea
Sexo
59
nivel
educativo
Pblica
Privada
Urbana
Total
19 175
15 427
3 748
18 963
212
9 856
9 319
Bsica Regular
17 439
13 979
3 460
17 227
212
8 813
8 626
Inicial
3 589
2 846
743
3 377
212
1 844
1 745
Primaria
7 752
6 134
1 618
7 752
3 896
3 856
Secundaria
6 098
4 999
1 099
6 098
3 073
3 025
645
433
212
645
382
263
96
96
96
49
47
995
919
76
995
612
383
Superior No
Universitaria
Pedaggica
Tecnolgica
Artstica
Bsica Alternativa 1/
Bsica Especial
Tcnico-Productiva 2/
EJERCICIOS
1.
Dado el cuadro siguiente : complete el cuadro de acuerdo a las normas estadstica de presentacin.
CATEGORIA
HOMBRES
MUJERES
TOTAL
DOCENTES
25
15
40
ADMINISTRATIVOS
SERVICIO
2. El PBI para la actividad extractiva fue como sigue: Agricultura 16.8 en 1970 y 7.6 en 1995 . Pesca 2.2 en 1970 y
0.5 en 1995. Minera 25.2 en 1970 y 6.4 en 1995. Con los datos dados y de acuerdo a las normas de presentacin
y diseo de cuadros estadisticos Elabore dicho cuadro.
SOLTEROS
CASADOS
VIUDOS
DIVORCIADOS
HOMBRE
12
18
MUJER
18
16
De acuerdo a las reglas de diseo y presentacin de cuadros estadsticos complete las partes del cuadro dado y
de ser posible seale sus partes.
60
CAPITULO 8
9.1 SUMATORIAS
El smbolo "" "sigma" significa sumando o sumatoria, tomado del alfabeto griego denota la
suma de la variable X desde el lmite inferior "i" hasta el lmite superior "n".
X1 + X2 + X3 + ....+Xn
n
Xj
j=1
Ejm:
5
3= 5+5+5=3x5
j=1
TEOREMA 2. La sumatoria de una variable multiplicada por una constante o la sumatoria de
una constante por una variable es igual a la constante multiplicada por la
sumatoria de la variable.
Ejm:
n
n
Xi * a = a Xi
i=1
i=1
TEOREMA 3. La sumatoria de la suma algebraica de 2 o ms variables es igual a la suma
algebraica de la sumatoria individual de las variables.
n
n
n
n
(Xj + Yj + Zj) =
Xj +
Yj + Zj
i
i
i
i
TEOREMA 4. Si ha de efectuarse alguna operacin sobre los valores individuales de una
variable antes de la adicin se indica esto por notacin, se indica esto por
notacin matemtica a menos que se incluya el signo de adicin; la adicin se
hace despus de la otra operacin. Se efecta en orden de operaciones.
EJERCICIOS
SUMATORIAS
1.
Desarrollar:
3
(Xi - 2)
i
n
2
(Xi + c)
i
n
(Xi - a) (Yi + b)
i
n
( aXj + bYj + cZj)
j
4
3
(Yj - 3)
j
61
2.
Si X1 = 1 ;
Y1 = 2 ;
Hallar:
3
3
a) (Xi) (Yi)
i
i
X2 = 3 ;
Y2 = 5 ;
X3 = 4
Y3 = 7
3
b) Xi Yi
i
2 3
c) XiYj
i j
LA MEDIA ARITMETICA
es
es
1. PARA DATOS NO AGRUPADOS.Es decir cuando no se han agrupado en una tabla de distribucin de frecuencias.
Responsable : Ing. R. CESAR CONDORI PALOMINO
62
Si se tiene el nmero de datos y los datos X1, X2, X3, .....Xn entonces:
Dnde:
= Designa la media aritmtica
xi
n
Ejemplo:
Calcular la Media Aritmtica de las edades de 6 voluntarios que se presentan a la compaa de
bomberos del Puerto de Ilo : 14, 20, 24, 29, 26, 17
=
14 + 20 + 24 + 29 + 26 + 17
------------------------------------- =
6
130
--=
21.67
6
Luego la edad promedio de los voluntarios del cuerpo de bomberos es de 21,67 aos o 22
aos.
Ejemplo:
Supngase que un almacn tiene 12 empleados, y sus sueldos mensuales son: $385.000 391.000 - 363.800 - 421.300 - 423.000 - 791.000 - 323.000 - 356.000 - 456.000 - 550.000 320.000
346.200
Se quiere determinar la media aritmtica o promedio de los sueldos de los 12 Vendedores
Solucin:
2. PARA DATOS AGRUPADOS.Se denomina datos agrupados a los que se encuentran contenidos en una distribucin de
frecuencias.
Ejemplo
De la tabla de distribucin de frecuencias anterior, tenemos:
63
No de Glbulos
rojos (miles)
No de
pacientes
Marcas de
clase
fi * mi
0-2
3-5
20
6-8
28
9 - 11
10
80
12-14
13
13
143
Luego fi x mi = 143
fi = 20
-----20
= 7.15
Concluimos que hay un promedio de 7150 glbulos rojos por muestra el conjunto de 20
personas que entran al presente estudio.
Existen otros tipos de medidas de medias aritmticas cuyo uso no es muy frecuente. Estas son:
9.2.2
Ejemplo:
En el caso de los pescados, si se capturan 5 de 6 kg., pero entre ellos hay 2 que por su calidad
especial o su mayor precio en el mercado, como decir: 2 lenguados y los dems jureles, no
conviene considerarlos iguales a los otros 3. En estos casos, tales datos han de ser
ponderados, multiplicndolos por algn factor escogido convencionalmente.
Ejemplo:
En el curso de Estadstica se obtiene la nota final tomando el 50% del promedio
exmenes, 20 % de los trabajos encargados y 30% de las practicas calificadas.
de los
13.9
Ejemplo:
Cinco grupos de estudiantes de 43, 31, 35, 40 y 27 registraron una media de pesos de 72,
67,69,y 75 Kilogramos respectivamente. Calcular el peso medio del conjunto de estudiantes.
fi X
X = ------- fi
43 (72) + 31 (67) + 35 (69) + 40 (63) + 27 (75)
Responsable : Ing. R. CESAR CONDORI PALOMINO
64
X =
------------------------------------------------------------------43
+
31
+
35
+ 40
+ 27
= 68.938
Solo se puede calcular si no hay observaciones negativas. Es una medida estadstica poco
usual.
Ejemplo:
Supngase que las utilidades obtenidas por una compaa constructora en 4 proyecto fueron
de 3, 2, 4 y 6%, respectivamente. Cul es la media geomtrica de las ganancias?
Solucin:
65
9.2.3
aos:
a) Cul cree Usted que sea el rango de edad de las
personas?
b) Proponga la edad de cada persona, de tal forma
que cumpla con el promedio dado.
c) Despus de haber realizado el inciso b, sigue
Usted sosteniendo la respuesta dada en a)?
Problema 3. El problema de las ventas.
Un dependiente de un centro comercial realiz diez
ventas en la ltima hora. El promedio de dichas ventas
fue de $720. Las ventas de nueve de ellas fueron:
$480, $710, $790, $955, $445,$572, $754, $834 y
$970. Si uno de los clientes regres la mercanca A
cunto equivala la venta de dicha mercanca?.
LA MEDIANA
Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor
vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos algebraicos tan
bien como
9.2.3.2 CALCULO DE LA MEDIANA:
1. DATOS NO AGRUPADOS
Responsable : Ing. R. CESAR CONDORI PALOMINO
66
=
=
=
=
=
=
Ejemplo :
El nmero de glbulos rojos obtenidos por muestra en 20 pacientes estudiados, se muestran
en la siguiente distribucin de frecuencias (expresados en miles)
No de G.R.
en miles
0-2
3-5
6-8
9 - 11
12 - 14
No de Pacientes
fi
2
5
4
8
1
20
marcas de
clase mi
1
4
7
10
13
fi x mi
2
20
28
80
13
143
Sol.
Calculamos el centro de la distribucin
fi / 2 = 20 / 2 = 10
Este nmero 10 se compara con las frecuencias absolutas acumuladas y vemos que se
encuentra entre 7 y 11; donde se puede tomar el valor menor, en este caso 7, considerando en
este caso esta fila como clase mediana.
No de G.R.
L.i
0
Ls.
2
Nmero de
persona
2
Frecuencias
Abs. Acum.
2
Fronteras
L.i.
L.s.
2.5
67
3
6
9
12
5
8
11
14
5
4
8
1
7
11
19
20
2.5
5.5
8.5
11.5
5.5
8.5
11.5
Con los datos de la clase mediana (1ra) y utilizando la frmula clave calculamos la mediana .
X = 2.5
(10 - 2)
------------------ x 3
5
= 7.3
Pero este valor 7.3 como ver el lector no est contenido en la 1ra clase mediana, se
encuentra fuera del intervalo (3-5), por lo tanto ste valor no se considera como la mediana de
la distribucin de frecuencias.
Entonces en el problema planteado, aproximamos a 11 obtenndo as la 2da clase mediana.
Luego:
(10 - 7)
X = 5.5
+ ------------------ x 3 = 7.75
4
La mediana hallada necesariamente debe estar dentro del intervalo en el que se encuentra la
clase mediana.
INTERPRETACION: Existen 7.75 o 7750 glbulos rojos por unidad de muestra por cada
persona.
9.2.4
LA MODA
68
Ejemplo 3
Dados los datos 8, 2, 1, 8, 2 8
Ejemplo 4
Dados los datos 2, 4, 5, 8, 13
2. DATOS AGRUPADOS
Para el clculo de la moda en datos agrupados en una distribucin de frecuencias se usa la
frmula siguiente:
D1
X = FI +
-------------------J
D 1 + D2
Donde :
FI
=
Frontera inferior donde se encuentra localizada la clase modal
D1
=
Fm - F1
Fm
=
La frecuencia absoluta correspondiente a la clase modal
FI
=
Frecuencia absoluta anterior a la clase modal
D2
=
Fm - F2
F2
=
La frecuencia absoluta posterior a la clase modal
=
Amplitud o tamao del intervalo.
J
NOTA: La clase modal est determinada por la frecuencia absoluta ms alta.
EJEMPLO:
Tomando la distribucin de frecuencias del problema de los 20 pacientes en un estudio de
muestras de glbulos rojos.
LA CLASE MODAL para esta distribucin lo determina la frecuencia absoluta ms alta, en este
caso 8 y queda en el cuarto intervalo o cuarta clase.
No de G.R.
L.i
Ls.
0
3
6
9
12
F1 = 4
Nmero de
Personas
2
5
8
11
14
F2 =
2
5
4
8 Cmodal
1
1
Fm = 8
Frecuencias
Abs. Acum.
2
7
11
19
20
J = 3
L.i.
2.5
5.5
8.5
11.5
Fronteras
L.s.
2.5
5.5
8.5
11.5
FI = 8.5
Reemplazando los valores dados en la formula para el calculo de la moda en datos agrupados
en una distribucin de frecuencias.
(8 - 4)
X = 8.5 + ------------------------- x 3
= 9.591
( 8 - 4) + (8 - 1)
(9.591 esta contenido en el intervalo de la clase modal)
69
Las calificaciones de un estudiante en cinco asignaturas fueron 17, 15.2, 18.6, 16.4, y 19.2.
a. Hallar la media aritmtica, la mediana y la moda de dichas calificaciones.
b. Cual de las siguientes medidas utilizaria Ud. Por qu?
2.
Los tiempos de reaccin de un individuo a determinados estmulos fueron 0.53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44,
0.55 segundos respectivamente.
a. Determinar el tiempo medio de reaccin del individuo a los estmulos.
b. Calcular la mediana y contrastar con la media aritmetica.
3.
Una serie de nmeros est formada por Seis 6, siete 7, ocho 8, nueve 9, y diez 10.
a. Cul es la media aritmtica?
b. Cual es la mediana
c. Cual es la moda?
4.
Las calificaciones de un estudiante en los tres objetivos de la Unidad formativa fueron 14.2, 15.6, y 17.8 . Si los
pesos asignados a cada calificacin son de 2, 4 y 5 respectivamente.
a. Cual es el promedio adecuado para sus calificaciones?.
b. Cul sera el promedio del ejercicio anterior si todos los pesos fuesen iguales?
5.
Tres secciones que desarrollaban el curso de Estadstica registraron una clasificacin media en sus exmenes de
12.8, 13.4, 13.8. Dichas secciones estaban formadas por 27, 25, y 21 estudiantes respectivamente. Determinar la
calificacin media para todas las secciones
6.
La siguiente tabla muestra la distribucin de la carga mxima en toneladas cortas (una tonelada corta = 2000
libras) que soportan ciertos cables producidos por una compaa. Determinar las medidas de centralizacin de la
carga mxima.
MAX. DE CARGA
Ton. Cortas
9.3
9.8
10.3
10.8
11.3
11.8
12.3
12.8
7.
No de cables
fi
9.7
10.2
10.7
11.2
11.7
12.2
12.7
13.2
2
5
12
17
14
6
3
1
Los sueldos mensuales (en dlares) de 60 empleados de la empresa Gustos y Sabores es en el ao 2008 son los
siguientes:
440
453
570
440
450
574
o
o
560
650
430
340
530
500
335
407
618
558
501
462
587
376
537
460
471
380
613
470
409
560
660
518
400
560
600
607
470
480
424
321
550
382
364
625
466
500
432
667
634
507
565
528
591
512
580
645
393
526
428
492
450
382
70
8.
En un centro hospitalario de la provincia de Ilo se ha tratado, con un nuevo medicamento llamado SINDO, durante
5 das a un grupo de pacientes, todos ellos padecen de jaqueca crnica (se despiertan todos los das con dolor de
cabeza). Se realiza un estudio sobre el n de das que un paciente sufre mejora con el anterior medicamento
obteniendo la tabla:
Valores
xi
a.
b.
c.
9.
Frecuencias
ni
100
250
300
500
450
2000
Realizando el grfico adecuado y hallando los promedios (Media aritmtica, , Moda, y Mediana), indicar cul
sera el que mejor representara los datos, (Contesta razonadamente y con el mayor detalle posible)
Calcula tambin el porcentaje de pacientes que sienten mejora con el medicamento en todos los das del
tratamiento.
Por qu no calculamos el coeficiente de variacin para ver la representatividad de la media? Habra que
hallarlo?.
Se ha realizado una estadstica en el centro comercial CONTINENT sobre los gastos (en miles de soles) que una
familia tiene cuando realiza sus compras un da cualquiera de la semana. Este estudio nos aporta la siguiente
tabla:
Intervalos Frecuencias
0-5
1000
5-10
1100
10-20
1600
20-50
1000
50-100
300
a. Halla los ingresos que en ese da tuvo el centro comercial y el gasto medio, modal y mediano de cada familia.
b. Estudiar la representatividad del gasto medio. Es representativa? Por qu?
10. Se realiza una estadstica en dos centros de enseanza, uno pblico y otro privado, referente a la nota global del
bachillerato de cada uno de los alumnos que van a acudir a los exmenes de selectividad. Las distribuciones de
frecuencias son las siguientes:
Centro privado
Nota global
cada alumno.
de
Frecuencias
5,5
10
6.5
15
7.5
20
8.5
30
9.5
15
Centro pblico
Nota global
cada alumno.
[5 , 6]
de
Frecuencias
250
71
(6 , 7]
150
(7 , 9]
100
(9, 10]
20
a.
A la vista de la tabla, te sugiere algn comentario de especial importancia. Cul es el motivo de que los
datos se presente en dos tablas de diferente tipo ?
b. Estudiar las diferentes medidas de tendencia central (promedios) en las dos distribuciones. En cada
distribucin cul te parece ms representativo? por qu?
c. Hallar el porcentaje de alumnos que en cada centro tiene una nota global superior al 7.
d. Estudiar la representatividad de las medias obtenidas en las distribuciones por separado. En cul de las
dos es ms representativa?
11. A la finalizacin del curso "Informtica e Internet" se realiz un examen tipo test a los 300 alumnos obtenindose la
siguiente tabla relativa al nmero de preguntas acertadas:
10
10-15
20
15-20
60
20-23
100
23-25
70
25-30
30
30-40
10
a.
b.
c.
d.
Notas N Alumnos
e.
f.
g.
12
5.5
15
14
6.5
13. Se revisaron 20 lotes de 48 artculos cada uno y se encontr el siguiente nmero de artculos defectuosos por lote:
3, 2, 5, 0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 4, 3, 3, 2, 3
a. Calcular las medidas de tendencia central
b. Interprete sus resultados
18.3, 20.6, 19.3, 22.4, 20.2, 18.8, 19.7, 20.0, 22.4, 20.2, 18.8, 19.7,
ING. SEMANALES
50 - 89
No TRABAJADORES 7
19
72
CALIFICACIONES
92 - 94.5
94.5 - 97
97 - 100
29
14
10
18. Se ha recibido una muestra compuesta de 100 probetas de concreto con el objeto de ser analizadas. Una de las
pruebas consisti en determinar la carga de rotura en (Kgr/cm2 )de dichas probetas, encontrndose los siguientes
resultados.)
Intervalo de rotura
120-125 125-130 130-135 135-140
140-145
No de probetas 10
20
33
25
1
a. Calcular la Media aritmtica e interprete
73
CAPITULO 9
9.3 LA DISPERSIN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo nos
revelan una parte de la informacin que necesitamos acerca de las caractersticas de los datos.
Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin su
dispersin, extensin o variabilidad.
La dispersin es importante porque:
Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es
menos representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser
capaces de distinguir que
presentan esa dispersin
antes de abordar esos
problemas.
Quiz se desee comparar
las
dispersiones
de
diferentes muestras. Si no
se desea tener una amplia
dispersin de valores con
respecto al centro de
distribucin o esto presenta
riesgos
inaceptables,
necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las
dispersiones ms grandes.
Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad de describirla.
Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es importante, cmo
medimos la variabilidad de una distribucin emprica?. Vamos a considerar slo algunas
medidas de dispersin absolutas: el rango, la varianza, la desviacin estndar y el coeficiente
de variacin
74
9.4.1
EL RANGO
moda
CONCLUSION:
La mejor manera de concluir es que mientras ms alejado se encuentra un valor es
mala medida.
no
una
2. DATOS AGRUPADOS
Cuando se encuentran contenidos en una tabla de frecuencias el rango se calcula en las
columnas de Clases e intervalos y la columna de Marcas de Clase.
METODO 1 :
Rango = limite superior de la ultima clase - limite inferior de la primera clase
METODO 2:
Rango = punto medio del la primera clase - punto medio de la ultima clase
9.4.2
LA DESVIACION MEDIA
Hace referencia a la media aritmtica de las desviaciones tomadas en valor absoluto, respecto
de un promedio. Dicho promedio puede ser la media aritmtica, la mediana o la moda, es una
medida poco utilizada, sobre todo porque existen otras que permiten un superior desarrollo
estadstico a partir de su valor.
Llamado tambin promedio de desviacin es la media aritmtica de las desviaciones de los
valores individuales con respecto al promedio o medida de tendencia central de las
observaciones
9.4.2.1 CARACTERISTICAS
La desviacin media est menos influenciada por los valores extremos de un grupo de
observaciones que se toman en consideracin.
Es menos burda respecto al rango, es decir, se tiene ms precisin con respecto al Rango.
75
N
Xi
MTC
/ /
Donde:
= Nmero de observaciones
= Observaciones
= Cualquier medida de
Centralizacin
= Valor absoluto.
NOTA.- Cuando se trabaja con valor absoluto, todo valor contenido entre barras, resulta
siendo positivo, an teniendo valores con signo negativo.
Ejemplo: / - 2 /
= 2;
/3 /
/ 0 /
= 0
/ - 0.25 /
= 0.25
Ejemplo:
En una parcela de experimentacin, luego de aplicar abono a cinco variedades de girasol
; despus de 30 das se tom las medidas del tallo de cada planta obtenindose los
siguientes valores: 0.65, 0.92, 0.77, 0.58, 0.44 metros respectivamente. Hallar la desviacin
media de las alturas de las plantas.
Solucin:
Calculamos la media aritmtica
X
X = -------n
0.65 + 0.92 + 0.77 + 0.58 + 0.44
X = -------------------------------------------------5
3.36
------- =
5
.672
.65 - .672 + 0.92 - .672 + 0.77 - 0.672 + 0.58 - 0.672 + 0.48 0.672
DM = -----------------------------------------------------------------------------------------------------------------5
DM = 0.1384 metros
En consecuencia:
La desviacin de las longitudes de las plantas en estudio es de 0.14 m. o 14 centmetros.
M.A.
76
V1
V2
V3
V4
V5
MTC
mi
fi
=
=
=
Ejemplo:
La siguiente tabla muestra las calificaciones de 50 estudiantes en el Curso de Estadstica.
Determine la desviacin media de las calificaciones.
CALIFICACIONES
Nota mnima Nota mxima
33
43
53
63
73
83
93
42
52
62
72
82
92
100
No
Marcas
estudiantes clase
fi
mi
7
5
9
10
10
6
3
50
X = fi * mi / fi
37.5
47.5
57.5
67.5
77.5
87.5
96.5
262.5
237.5
517.5
675
775
525
289.5
3282
/ mi - X /
fi * / mi - X /
28.14
18.14
8.14
1.86
11.86
21.86
30.86
196.98
90.7
73.26
18.6
118.6
131.16
92.58
721.88
65.64
= 3282/50 =
fi / mi - X /
------------------------------fi
DM =
de fI * MI
721.88
-------- = 14.4376
50
Luego, existe una variabilidad de 14.43 puntos entre las calificaciones de los 50 estudiantes
con respecto a la media aritmtica (65.64)
9.4.3
LA VARIANZA
x1 x 2 x 2 x 2 ....... = x i x
s2
s2
f x x f 2 x 2 x ....... f i x i x
= 1 1
=
N
f1 f 2 ....
Al igual que la media en el caso de que los datos estn agrupados en clases, se tomar la
marca de clase como xi .
Otra forma de calcular s2 es :
s2
f x
=
i
f x
=
i
2
i
x 2 2x i x
N
f x
i
2
i
x 2x
2
f x
=
i
2
i
x2
77
N1 * 1 + N2 * 2
----------------------------N1
+ N2
J2 / 12
9.4.4
LA DESVIACION ESTANDAR
( Xi - X) 2
---------------n
MUESTRAL
n - 1 =
( Xi - X) 2
---------------n-1
Ejemplo:
Calcular la Desviacin estndar de las longitudes de los tallos de un grupo de girasoles en
Responsable : Ing. R. CESAR CONDORI PALOMINO
78
n =
n =
n =
n =
fi ( mi - X) 2
------------------ fi
mi = Puntos medios
X = Media aritmtica
fi = Frecuencias absolutas
fi = No total de datos
Ejemplo:
Considerando el cuadro de frecuencias de las calificaciones de los 50 estudiantes
en el curso de Estadstica. Calcule Ud. la Desviacin estndar.
Calificaciones
No
Marca
de fI * MI
( mi - X)2
estudiantes clase
Nota mnima Nota mxima fi
Mi
33
42
7
37.5
262.5
791.8596
43
52
5
47.5
237.5
329.0596
53
62
9
57.5
517.5
66.2596
63
72
10
67.5
675
3.4596
73
82
10
77.5
775
140.6596
83
92
6
87.5
525
477.8596
93
100
3
96.5
289.5
952.3396
50
3282
X = 3282/ 50 = 65.64 puntos
9.4.5
299.0004
50
examinados
fi *( mi - X)2
5543.0172
1645.298
596.3364
34.596
1406.596
2867.1576
2857.0188
14950.02
17.29 puntos
EL COEFICIENTE DE VARIABILIDAD
Es el cociente entre la desviacin tpica y la media aritmtica. Valores muy bajos indican
muestras muy concentradas.
C.V. =
79
El coeficiente de Variabilidad es muy til para medir y comprobar la alta heterogeneidad de los
datos (probablemente la falta de relacin de algunos datos con los dems)
En experimentos de Agronoma, Veterinaria, etc. y en general se admite un C.V. hasta el 30%;
en caso de superar este porcentaje es necesario revisar los datos, por que se puede concluir
que los datos y por ende los resultados no son confiables.
En Experimentos de Laboratorio, se es ms exigente, con los datos y se admite un coeficiente
de Variabilidad mximo hasta el 7% .
EJEMPLO:
Supngase que se tiene dos distribuciones de frecuencia en las cuales se estudia las
calificaciones de los estudiantes en dos secciones distintas que llevan el curso de estadstica.
DISTRIBUCION 1
X = 65.7
= 17.4
A que conclusin llegara usted.
DISTRIBUCION 2
X = 62.3
= 13.9
Curva normal: Conocida como campana o Curva de Gauss, es un modelo terico de curva en
el caso de que se de una distribucin normal. Es la curva a la que toda distribucin normal
tiende a dibujar cuando es representada grficamente.
9.4.6
COEFICIENTE DE ASIMETRIA
El coeficiente de asimetra, ideado por Karl Pearson, nos ayuda a mostrar la lejana o cercana
de la moda con la media aritmtica. En trminos de porcentaje se denota por QA. Asi
QA
X - X
= -----------
X = media aritmtica
X =moda
= desviacin estndar
EJEMPLO
Considerando la distribucin de glbulos rojos en muestras obtenidas a 20 personas
(expresados en miles)
80
GLOBULOS ROJOS
EN MILES
0
2
3
5
6
8
9
11
12
14
No
PERSONA
S
fi
2
5
4
8
1
20
X =
X =
=
7.150
9.591
6.351
9.4.7
COEFICIENTE DE CURTOSIS:
Es la agudeza de la curva normal , esta agudeza puede ser alta , baja, o intermedia dando
lugar a diferentes tipos de curvas como: plato, meso, leptocrtica,
Curva Platicrtica: Presenta una curva ms aplastada, con una elevacin de la distribucin
inferior a la curva normal.
Curva Leptocrtica: Presenta una distribucin ms apuntada, con una elevacin superior a la
curva normal.
Curva Mesocrtica: Es el que corresponde a la curva normal y presenta un nivel de
apuntamiento considerado como ideal. k<0.263>
k=0.263 = mesocutica.
Responsable : Ing. R. CESAR CONDORI PALOMINO
81
k>0.263 = leptocurtica.
la frmula a utilizar el la siguiente:
1/2 (Q3-Q1)
K= __________
P90-P10
curtosis igual a un medio entre cuartil 3 menos cualtil 1 dividido percentil de 90 menos percentil
de 10
EJERCICIOS
1.
Se hizo una prueba sobre la duracin de bateras de diferentes marcas ( en horas ) probando todas ellas en un
equipo de arranque. Los resultados fueron: 5, 3, 8, 4, 7, 6, 12, 4, 3 horas respectivamente.
a. Calcular la desviacin media de los tiempos de duracin de las bateras.
b. Calcular la varianza
c. Calcular el coeficiente de variabilidad
2.
Calcular la Desviacin estndar de los tiempos que demoran en llegar un grupo de estudiantes a su Centro de
estudio: 15, 48, 30, 45, 52, 10, 13, 40, 29, 28, 15, 10, 18 y 25 minutos respectivamente. Luego efecte un
comentario sobre dicha desviacin.
3.
ING. SEMANALES
50 - 89
No TRABAJADORES 7
19
a)
b)
c)
d)
e)
4.
Los siguientes datos indican ventas diarias en nuevos soles de una almacn: 45 95 110 120 135 85 76 59 68
71 en sus primeros das. Elabore un informe que indique grficamente el comportamiento de las ventas, el
promedio de ventas, la variabilidad existente y la confiabilidad de sus datos.
5.
Los siguientes son notas de inteligencia rpida aplicada a un grupo de 101 estudiantes:
CALIFICACIONES
No DE ESTUDIANTES
13
14
21
a.
b.
c.
d.
e.
6.
No de Glbulos rojos
(en miles)
0
2
3
5
6
8
29
14
10
No de
pacientes
1
4
7
Responsable : Ing. R. CESAR CONDORI PALOMINO
82
9
12
a)
b)
c)
d)
11
14
10
13
7.
Se ha recibido una muestra compuesta de 100 probetas de concreto con el objeto de ser analizadas. Una
de las pruebas consisti en determinar la carga de rotura en (Kgr/cm2 )de dichas probetas, encontrndose
los siguientes resultados
Intervalo de rotura
120-125
125-130
130-135
135-140
140-145
No de probetas 10
20
33
25
1
a. Elaborar un diagrama de dispersin
b. Calcular La desviacion media
c. Calcular La varianza
d. Calcular el coeficiente de variabilidad
8.
No de
personas
4
7
10
14
6
6
3
163
171
172
180
a) Elaborar un diagrama de dispersin
b) Cual es la desviacin estndar
c) Interprete sus resultados
9.
a.
b.
c.
CARGO
Fi
SUELDO
550
260
128
310
200
150
83
CAPITULO 10
10. MEDIDAS DE POSICIN NO CENTRAL (CUANTILES)
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen a
la distribucin en partes, de tal manera que cada una de ellas contiene el mismo nmero de
frecuencias.
Las medidas de posicin no central permiten conocer otros puntos caractersticos de la
distribucin que no son los valores centrales. Entre las medidas de posicin central ms
importantes estn los cuantiles que son aquellos valores de la variable, que ordenados de
menor a mayor, dividen a la distribucin en partes, de tal manera que cada una de ellas
contiene el mismo nmero de frecuencias.
Los tipos ms importantes de cuantiles son:
Los cuartiles, que dividen a la distribucin en cuatro partes;
Los quintiles, que dividen a la distribucin en cinco partes;
Los deciles, que dividen a la distribucin en diez partes;
Los percentiles, que dividen a la distribucin en cien partes.
Los cuantiles ms conocidos son:
A) CUARTILES ( Q )
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales. Son valores de la variable que dividen a la distribucin en 4 partes,
cada una de las cuales engloba el 25 % de las mismas
Se denotan de la siguiente forma:
Q1 es el primer cuartil que deja a su izquierda el 25 % de los datos;
Q2 es el segundo cuartil que deja a su izquierda el 50% de los datos, y
Q3 es el tercer cuartil que deja a su izquierda el 75% de los datos. (Q2 = Me)
Dados una serie de valores X1,X2,X3...Xn ordenados en forma creciente, Definimos:
Primer cuartil (Q1) como la mediana de la primera mitad de valores.
Segundo cuartil (Q2) como la propia mediana de la serie.
Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:
EL PRIMER CUARTIL:
Cuando n es par: 1*n/4
Cuando n es impar: 1(n+1)/4
PARA EL TERCER CUARTIL
Cuando n es par: 3*n/4
Cuando n es impar: 3(n+1)/4
CLCULO DE LOS CUARTILES PARA DATOS NO AGRUPADOS
1.
2.
O r d e n a m o s l o s d a t o s d e m e n o r a m a yo r .
Buscamos el lugar que ocupa cada cuartil mediante la expresin.
.
Nmero impar de datos
2, 5, 3, 6, 7, 4, 9
84
Ejercicio de cuartiles
Calcular los cuartiles de la distribucin de la tabla:
fi
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
Clculo del primer cuartil
85
B) QUINTILES
Se representan con la letra K.
Es el primer quintil. Separa a la muestra dejando el 20% de los datos a su izquierda.
Es el segundo quintil. Es el valor que indica que el 40% de los datos son menores.
Es el tercer quintil. Indica que el 60% de los datos son menores que l.
Es el cuarto quintil. Separa al 80% de los datos del otro 20%.
C) DECILES ( DI)
Son los valores de la variable que dividen a la distribucin en las partes iguales, cada una de
las cuales engloba el 10 % de los datos. En total habr 9 deciles. (Q2 = D5 = Me ).
D) CENTILES O PERCENTILES ( PI )
Son los valores que dividen a la distribucin en 100 partes iguales, cada una de las cuales
engloba el 1 % de las observaciones. En total habr 99 percentiles. (Q2 = D5 = Me = P50)
Clculo de los cuantiles en distribuciones no agrupadas en intervalos - Se calculan a travs de
la siguiente expresin: q rN , siendo : r = el orden del cuantil correspondiente q = el nmero de
intervalos con iguales frecuencias u observaciones ( q = 4, 10, 100 ).
N = nmero total de observaciones - La anterior expresin nos indica que valor de la variable
estudiada es el cuantil que nos piden, que se corresponder con el primer valor cuya
frecuencia acumulada sea mayor o igual a q rN Ejemplo: DISTRIBUCIONES NO AGRUPADAS:
Se representan con la letra C.
Es el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la muestra son valores
menores que l y el 100-i % restante son mayores.
Cuando los datos no estn agrupados en intervalos, los cuartiles, as como el resto de las
medidas de posicin, tienen un valor claro. Sin embargo, cuando tenemos una agrupacin de
los datos ya no es tan sencillo realizar el clculo. S que resulta claro ver en cul de los
intervalos est el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto
necesitaremos usar una frmula.
86
CAPITULO 11:
11. NUMEROS INDICE
Un nmero ndice es
una
medida
estadstica diseada
para
mostrar
los
cambios
en
una
variable o grupo de
variables
relacionadas
con
respecto al tiempo,
situacin geogrfica u
otra
caracterstica.
ndice
mide qu
tanto una variable ha
cambiado con el tiempo. Mide la variacin relativa entre las variables econmicas: Variaciones
en los precios, en los salarios, en los ingresos, etc. Se calculan para 2 perodos de una serie
de tiempo o para todos los perodos de una serie de tiempo con respecto a un perodo fijo
llamado perodo base.
12.2.
DEFINICION
87
12.4.
El ndice de precios
compara niveles de precios de un perodo a otro. El ndice de precios al consumidor (IPC) mide
los cambios globales de precios de una variedad de bienes de consumo y de servicios, y se le
utiliza para definir el costo de vida.
El ndice de cantidad
mide qu tanto cambia el nmero o la cantidad de una variable en el tiempo.
El ndice de valor
Mide los cambios en el valor monetario total. Esto es, mide los cambios en el valor en pesos de
una variable. Combina los cambios en precio y cantidad para presentar un ndice con ms
Responsable : Ing. R. CESAR CONDORI PALOMINO
88
informacin.
Por lo general, un ndice mide el cambio en una variable durante un cierto perodo, como en
una serie temporal. Sin embargo, tambin se le puede utilizar para medir diferencias en una
variable dada en diferentes lugares. Esto se lleva a cabo recolectando datos de manera
simultnea en los diferentes lugares y luego comprndolos.
Un solo nmero ndice puede reflejar a una variable compuesta o a un grupo de stas. El IPC
mide el nivel general de precios para bienes y servicios especficos en la economa. Combina
los precios individuales de bienes y servicios para conformar un nmero de ndice de precios
compuestos.
12.5.
La distorsin de los nmeros ndice tambin se puede presentar cuando se selecciona una
base no apropiada. Siempre debemos considerar cmo y por qu el perodo base fue
seleccionado antes de aceptar una aseveracin basada en el resultado de comparar nmeros
ndice.
12.6.
PRECIOS RELATIVOS
La razn del precio es un bien determinado en un periodo dado a su precio en otro periodo
llamado base o periodo de referencia.
Po = precio del bien durante el periodo base
Pn = Precio del bien durante el periodo considerado
Precio relativo = Pn / Po * 100
Pa y Pb son los precios de un bien durante l os periodos a y b respectivamente, El precio
relativo del periodo b con respecto al periodo se define como Pb/Pa y se denota por Pa/Pb
notacin que ser de utilidad.
Ejemplo:
Los precios de los pasajes en enero de 2005 y 2010 fue de 0.30 y 0.60 cntimos de sol
respectivamente. Tomando como ao base a 2005 y el 2010 como el ao dado se tiene.
Precio en 2013
0.60
Precio relativo = P2013/2009 = ------------------=
-------------- = 2 200%
Precio en 2009
0.30
Es decir en 2013 el precio es de 200% que el que fue en 2009 es decir se incremento en un
100 %
Si trabajamos al revs:
Precio en 2009
0.30
Precio relativo = P2009/2013 = ------------------=
-------------- = 0.50 50%
Precio en 2013
0.60
Es decir el precio de los pasajes en 2009 significaba el 50 % de lo que es hoy en el 2013
PROPIEDADES
Si Pa, Pb, Pc, denotan los precios en los periodos a, b, y c, respectivamente, existe las
siguientes propiedades para los precios relativos, deducidos directamente de las definiciones.
89
PROPIEDAD DE IDENTIDAD
Pa/a = 1
El precio relativo para un periodo dado con respecto al mismo periodo es 1 o 100%
PROPIEDAD DEL TIEMPO INVERSO
Pa/b Pb/a = 1
Esto declara que cuando 2 periodos se intercambian, sus correspondientes precios relativos
son recprocos entre si
PROPIEDAD CICLICA O CIRCULAR
Pa/b Pb/c Pc/a = 1
CANTIDAD O VOLUMEN RELATIVOS
Se puede comparar volumen de produccin, consumo, exportacin, cantidad o volumen
qn / qo * 100
qo = cantidad de un bien producido, consumido, exportado etc. durante un periodo base
qn = cantidad producida, consumida exportada durante un periodo dado.
VALOR RELATIVO
Si Po y qo denotan el precio y la cantidad de un bien durante un periodo base, mientras que
Pn y qn denotan el precio y la cantidad correspondiente durante un periodo dado. Los valores
totales durante estos perodos vienen dados por Vo y Vn respectivamente.
Valor Relativo = Vn/Vo = (Pnqn) / (Poqo) = (Pn / Po) (qn / qo)
12.7.
No pesados quiere decir que todos los valores considerados son de igual importancia.
Agregado significa que agregamos o sumamos todos los valores. La principal ventaja es su
simplicidad.
Se calcula mediante la suma de todos los elementos del compuesto, para el perodo dado, y
luego dividiendo este resultado entre la suma de los mismos elementos durante el perodo
base.
( Q1/ Q0) x 100
Como el cociente es multiplicado por 100, tcnicamente, el ndice resultante es un porcentaje.
Sin embargo, se acostumbra referirse solamente al valor y omitir el signo del porcentaje cuando
se analizan nmeros ndice.
La principal desventaja de un ndice no pesado es que no le da mayor importancia o peso al
cambio de precio de un producto de uso comn que el que le da a uno de uso poco comn. Un
cambio sustantivo en el precio de productos de lento movimiento puede distorsionar por
completo un ndice. Por esta razn, no es prctica comn utilizar un ndice simple no pesado en
anlisis importantes. Un ndice no pesado puede verse distorsionado por un cambio en unos
cuantos productos, lo cual puede no ser representativo de la situacin que se est estudiando.
12.8.
A menudo tenemos que asignar una importancia mayor a los cambios que se dan en algunas
variables que a los que se presentan en otras cuando calculamos un ndice. Esta ponderacin
nos permite incluir ms informacin, aparte del mero cambio de los precios en el tiempo. Nos
permite mejorar la precisin de la estimacin. El problema est en decidir cunto peso asignar
a cada una de las variables en la muestra
Existen tres formas de pesar un ndice:
Mtodo Laspeyres:
Responsable : Ing. R. CESAR CONDORI PALOMINO
90
Utiliza las cantidades consumidas durante el perodo base, es el ms usado, debido a que
requiere medidas de cantidades de nicamente un perodo. Como cada nmero ndice
depende de los mismos precios y cantidad base, la administracin puede comparar el ndice de
un perodo directamente con el ndice de otro. Una ventaja de este mtodo es la
comparabilidad de un ndice con otro. El uso de la misma cantidad de perodo base nos permite
hacer comparaciones de manera directa. Otra ventaja es que muchas medidas de cantidad de
uso comn no son tabuladas cada ao. La principal desventaja es que no toma en cuenta los
cambios de los patrones de consumo.
Indice de Precio de Laspeyres
Pondera con las cantidades del ao base (o). Supone que no cambia los hbitos de consumo.
Slo flucta el precio
Mtodo de Paasche:
Es un proceso parecido al seguido para encontrar un ndice de Laspeyres. La diferencia
consiste en que los pesos utilizados en el mtodo Paasche son las medidas de cantidad
correspondientes al perodo actual. Es particularmente til porque combina los efectos de los
cambios de precio y de los patrones de consumo, as, es un mejor indicador de los cambios
generales de la economa que el mtodo Laspeyres.
Una de las principales desventajas es la necesidad de tabular medidas de cantidad para cada
perodo examinado. Cada valor de un ndice de precios Paasche es el resultado tanto de
cambios en el precio como en la cantidad consumida correspondiente al perodo base. Como
las medidas de cantidad utilizadas por un perodo de ndice, por lo general son diferentes de
las medidas de cantidad de otro perodo de ndice, resulta imposible atribuir la diferencia entre
los dos ndices solamente a cambios de precio. En consecuencia, es difcil comparar ndices de
diferentes perodos con el mtodo Paasche.
Indice de Precio de Paasche
Usa ponderaciones de los aos actuales. Osea pondera con las cantidades del ao dado (t)
Necesita actualizarse el consumo cada ao; por lo que el de Laspeyres se usa es el ms usado
ndice de Fisher
Un tercer ndice, el ndice de Fisher (del economista estadounidense Irving Fisher), intenta
mitigar este problema, siendo una especie de resultado intermedio de los dos anteriores;
calcula el Promedio Geomtrico de los dos anteriores:
12.9.
Problemas en la construccin.
Seleccin de un elemento para ser incluido en un compuesto:
Casi todos los ndices se construyen para responder a una cierta pregunta en particular. Los
elementos incluidos en el compuesto dependen de la pregunta en cuestin.
Seleccin de los pesos apropiados:
Los pesos seleccionados deberan representar la importancia relativa de los diferentes
elementos. Desafortunadamente lo que resulta apropiado en un perodo puede volverse
inapropiado en un lapso muy corto.
Seleccin de un perodo base:
El perodo base seleccionado debe ser un perodo normal, preferentemente un perodo
bastante reciente. Normal significa que el perodo no debe estar en un pico o en una depresin
Responsable : Ing. R. CESAR CONDORI PALOMINO
91
de una fluctuacin. Una tcnica para evitar la eleccin de un perodo irregular consiste en
promediar los valores de varios perodos consecutivos.
12.10. ADVERTENCIA EN LA INTERPRETACIN DE UN NDICE.
Generalizacin a partir de un ndice especfico: generalizacin de los resultados.
Falta de conocimiento general con respecto a ndices publicados:
Es la falta de conocimiento de qu es lo que miden los diferentes ndices.
Efecto del paso del tiempo en un ndice:
Los factores relacionados con un ndice tienden a cambiar con el tiempo, en particular, los
pesos apropiados. A menos que se cambien los pesos de acuerdo a las circunstancias, el
ndice se vuelve cada vez menos confiable.
EJERCICIOS
1.
Mes
ENE
FEB
MAR
ABR
MAY
JUN
JUL
AGO
SET
OCT
NOV
Venta
185
852
195
542
621
436
520
652
345
258
621
a.
b.
c.
2.
Estimar el ndice de ventas para cada mes tomado como base el primer mes interpretar los datos mas relevantes.
Estimar el ndice de ventas para el periodo marzo-diciembre tomado como base el periodo ene-feb. Efecte una
interpretacin de los datos mas relevantes
Estimar el ndice de ventas para Diciembre tomado como base el primer mes. Interprete su respuesta.
La tabla muestra los precios y cantidades consumidas en los aos 1999, 2009 y 2010 tomando como base el ao
1999 calcular:
PRECIOS
CANTIDADES
AO
1999
2009
2010
1999
2009
2010
ALUMINIO
17.00
26.01
27.00
1357.00
3707.00
3698.00
COBRE
19.36
41.88
29.00
2144.00
2734.00
2478.00
PLOMO
15.18
15.00
14.00
1916.00
2420.00
2276.00
ESTAO
99.32
10.10
96.00
161.00
202.00
186.00
CINC
12.15
13.00
11.00
1872.00
2018.00
1424.00
a.
b.
c.
d.
e.
f.
g.
h.
Calcular el ndice de precios por el mtodo de agregacin simple para el ao 2009 interprete su resultado
Calcular el ndice de precios por el mtodo de agregacin simple para el ao 2010 interprete su resultado
Calcular el ndice de Laspayres para2009 tomando como ao base 1999 interprete su resultado
Calcular el ndice de Laspayres para 2010 tomando como ao base 1999 interprete su resultado
Calcular el ndice de Paasch para2009 tomando como ao base 1999 interprete su resultado
Calcular el ndice de Paasch para 2010 tomando como ao base 1999 interprete su resultado
Calcular el ndice ideal de Fisher para 2009 tomando como ao base 1999 interprete su resultado
Calcular el ndice ideal de Fisher para 2010 tomando como ao base 1999 interprete su resultado
3. Dada la siguiente tabla que muestra los precios al por mayor y las producciones de leche mantequilla y queso para
los aos 1999 2009 y 2010 .
a.
b.
c.
d.
e.
f.
PRECIOS
Pn
CANT.PRODUCIDAS qn
AO
1999
2009
2010
1999
2009
2010
LECHE
3.97
3.89
4.13
9.675
9.117
10.436
MANTEQUILLA
61.5
64.2
59.7
117.4
115.5
115.5
QUESO
34.8
35.4
38.9
75.93
74.93
82.79
calcular un ndice de precios al por mayor por agregacin simple para 2010 tomando como base el ao 1999
calcular un ndice de precios al por mayor por agregacin simple para 2010 tomando como base el ao 2009
calcular un ndice de precios al por mayor por agregacin simple para 2010 tomando como base el periodo 19992009.
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Laspayres para 2010 tomando
como base el ao 1999
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Laspayres para 2010 tomando
como base el ao el ao 2009
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Laspayres para 2010 tomando
como base el periodo 1999-2009.
92
g.
h.
i.
j.
k.
l.
m.
3.
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Paasche para 2010
como base el ao1999
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Paasche para 2010
como base el ao el ao 2009
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Paasche para 2010
como base el periodo 1999-2009
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Fisher para 2010
como base el ao 1999
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Fisher para 2010
como base el ao el ao 2009
calcular un ndice de precios al por mayor por agregacin ponderada Mtodo de Fisher para 2010
como base el periodo 1999-2009.
Efecte una interpretacin para cada caso. Comente su resultado.
tomando
tomando
tomando
tomando
tomando
tomando
La tabla muestra los precios y la produccin, en promedios de algodn y trigo durante los aos 1999 y 2004.
Explicar porque un ndice de precios por agregacin simple para 2004 con 1999 como base es inapropiado como
medida de cambio de precios en esos dos productos.
PRECIO
ALGODN
TRIGO
CANTIDAD
1999
2004
1999
2004
74.4
56.8
11.122
13.432
mills. De balas
mills. de balas
3.91
3.16
511.4
487.1
$ por bushel
$ por bushel
mlls. De bushels
mlls. de bushels
Dados los datos siguientes que muestran los precios al por menor y producciones medias de combustible en la
planta de PetroPeru durante los aos 1986-1990
AO
PRECIO
RELAT.
1986=100
VALOR RELAT.
CANT. RELATIVA
1987-1989 = 100
V.R / P.R.
CANTIDAD. RELATIVA
1986
100
150
150
100
1987
125
180
144
96
1988
150
207
138
92
1989
175
231
132
88
1990
200
252
126
84
Explicar porqu un indice de precios de agregacin simple para 1999 con base en 1989 es una medida inadecuada en
los cambios de precio en los bienes dados.
93
cuando
la
94
de dispersin.
Representamos en un grfico los pares de valores de una distribucin bidimensional: la variable
"x" en el eje horizontal o eje de abscisa, y la variable "y" en el eje vertical, o eje de ordenada.
Vemos que la nube de puntos sigue una tendencia lineal:
95
Alumno
Estatura
Peso
Alumno
Estatura
Peso
Alumno
Estatura
Peso
Alumno 1
1,25
32
Alumno 11
1,25
33
Alumno 21
1,25
33
Alumno 2
1,28
33
Alumno 12
1,28
35
Alumno 22
1,28
34
Alumno 3
1,27
34
Alumno 13
1,27
34
Alumno 23
1,27
34
Alumno 4
1,21
30
Alumno 14
1,21
30
Alumno 24
1,21
31
Alumno 5
1,22
32
Alumno 15
1,22
33
Alumno 25
1,22
32
Alumno 6
1,29
35
Alumno 16
1,29
34
Alumno 26
1,29
34
Alumno 7
1,30
34
Alumno 17
1,30
35
Alumno 27
1,30
34
Alumno 8
1,24
32
Alumno 18
1,24
32
Alumno 28
1,24
31
Alumno 9
1,27
32
Alumno 19
1,27
33
Alumno 29
1,27
35
Alumno 10
1,29
35
Alumno 20
1,29
33
Alumno 30
1,29
34
Peso
1,20
30,6
1,21
31,0
1,22
31,4
1,23
31,8
1,24
32,2
1,25
32,6
1,26
33,0
1,27
33,4
1,28
33,8
1,29
34,2
1,30
34,6
13.1.
96
El coeficiente de correlacin lineal nos permite determinar si, efectivamente, existe relacin
entre las dos variables. Una vez que se concluye que s existe relacin, la regresin nos
permite definir la recta que mejor se ajusta a esta nube de puntos. Mide el grado de intensidad
de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que
puede existir entre las varables es lineal (es decir, si representaramos en un gfico los pares de
valores de las dos variables la nube de puntos se aproximara a una recta).
No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc.
En estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las
variables, por lo que convendra utilizar otro tipo de coeficiente ms apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es
representar los pares de valores en un grfico y ver que forma describen.
El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra).
La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la
otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1.
Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de
correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere decir
obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que este
resultado podra haberse debido al puro azar.
Ejemplo: vamos a calcular el coeficiente de correlacin de la siguiente serie de datos de altura
y peso de los alumnos de una clase:
Alumno
Estatura
Peso
Alumno
Estatura
Peso
Alumno
Estatura
Peso
97
Alumno 1
1,25
32
Alumno 11
1,25
33
Alumno 21
1,25
33
Alumno 2
1,28
33
Alumno 12
1,28
35
Alumno 22
1,28
34
Alumno 3
1,27
34
Alumno 13
1,27
34
Alumno 23
1,27
34
Alumno 4
1,21
30
Alumno 14
1,21
30
Alumno 24
1,21
31
Alumno 5
1,22
32
Alumno 15
1,22
33
Alumno 25
1,22
32
Alumno 6
1,29
35
Alumno 16
1,29
34
Alumno 26
1,29
34
Alumno 7
1,30
34
Alumno 17
1,30
35
Alumno 27
1,30
34
Alumno 8
1,24
32
Alumno 18
1,24
32
Alumno 28
1,24
31
Alumno 9
1,27
32
Alumno 19
1,27
33
Alumno 29
1,27
35
Alumno 10
1,29
35
Alumno 20
1,29
33
Alumno 30
1,29
34
Aplicamos la frmula:
r=
(1/30) * (0,826)
---------------------------------------------------------(((1/30)*(0,02568)) * ((1/30)*(51,366)))^(1/2)
Luego,
r=
0,719
Por lo tanto, la correlacin existente entre estas dos variables es elevada (0,7) y de signo
postivo.
98