Está en la página 1de 55

á

h l{A\t ñ U I/AVñ\l G¿ I r:+


¡t1 ¡I ¡t -/l¡I ta t¡ N\ I¡t
^\! il f
'Lü'L=
U'§lLi- U'\Arel
fñ\f-#Rñ:fñfiñ'nTfFv7frr
L9L*^9tJ\\U[r U U\yIñ]
VFR@BABIMDAD

n,lÁxrruro nilTAcc MEZA

L¡MA - PERU ,J
fióFrcosDE PRÓLOGO

Con Ia cqpcricncia obtenírda en la primera edicién, Tópicos rle Estadística


Descriptiva y Probabiliúa.d, sale totaltnente corregido y con una nueva
V d iagramac,i,ón.

Tópicos dq Estadística Denirriptiva, ha sido diseñado como texto para cursos de


Estadístia,a, General y cursms elementales de introducción a la probabilidad. El
MAXIMO MITACC MEZA ohjetivo del libro es preserntar los conccptos básicos de Esladística descriptiva y
pnobabilidad. que sirva dle base para acompañar disciplinas mas especializadas
lmpreso en el Perú Printed in Peru dentro de il,a carrera de Estdlística. Economía, lngenieria, Administación, etc.

SLrs caracflcrísticas princi¡wles son: la forma clara y sencilla pero rigurosa de


prssentar lmr teoría acompaffiüda con una gran cantidad de ejemplos prácticos y urr
gran númumo de gráficos, l,s,s g¡u¡tt permiten una meior comprensión de los temas
e,xpueslos.. Para entenden el contenido del libro no cs necesario tener un
conoci¡'niemto avanzado d,e matemática. basta saber los conceptos básicos dcl
Calculo diifierencial e integral.

El libro cnmsta de nueve capítulos: en los tres primeros capítulos se presentan lás
tecnicas drnscriptivas parfi agrupar los datos, enfatizando el concepto de
distribucióm de frecuencias", medidas de tendencia cenlral. rnedidas de dispersión.
rnedidas d.e asimetría y nnedidas de cunosis. En los capítulos siguicntcs (capitulo
,cuatro al nru¡eve) se desarnn,llla los conceptos irásicos de la teoría de probabilidad.
variables aneatorias y se presentan los principales modelos de distribución de
probabilidad discreta y conninua.
Pa,ra la snlLución de los rejemplos y ejercicios del capítulo nueve. el lector
encontrará. en las páginas fimales las principales Tablas Estadísticas.

En esra seg¡unda ediciór¡ se'ha hccho una revisión exhaustiva del texto y se ha
co,rregido algunos errores ,qpte aparecen en la pritnera edición.

QUiero expuesar mi agratlecimiento a los lectores por la acogida que brindan a la


presente ohra.

A,¡í mis¡uu,. expresg mi prmrfundo agradecimiento a todas aquellas personas que


direc¡a o iindirectamente cornrtribuyeron a la realización de este texto. en especial a
nri hijo iErdward, quién diedicó su valioso tiempo ,)ara corregit y mejorar
si gni fi cati *lamente Ia d iagrarnnación de texto.

prohibida su reproducciÓn total o parcial, por todos los medios gráficos.


El Auror
Segunda edición

Tiraje: 1000 ejemPlares Noviembre del 2011


INDICE

CAPITULO I: LA TSTADiSTICN Y ETAPAS DEL


METODO ESTADiSTICO
t.l Intrnducción I
1.2 Ramas de la Estadística I

r.3 La población y La Muesrra 2


t.4 Variables estad ísticas J
1.5 Parámetro estadígrafo 5
1.6 Las Etapas del Método Estadístico 5
1.6.I La Etapa de la Planificación 6
1.6.2 Etapa de la recolección de información 8
t.6.2.1 Errores en las observaciones 9
1.6.2.2 Métodos en la Recolección de la Información l0
t.6.2.3 La Elección de los individuos a esrudiar t2
|.6.2.4 Diseño de Formularios aa
t.6.3 Etapas de Organización de la Informacién 23
r .6.3. I Revisión y Corrección de datos Recopilados LJ
1.6.3.2 Presentación de la Información mediante Cuadros o Tablas 24
I .b.J -J Presentación de la Información mediante gráficos JJ

CAPITULO 2: MEDIDAS DE TENDENCIA CENTRAL Y DE


DTSPERSIÓN DE VARIABLES CUANTITATIVAS
2.1 Sumatorias 5l
2.1 .l Propiedades de la Sumatoria §,
2.2 Medidas de Tendencia Central 54
2.2.1 Caracterfsticas del Valor Central 54
2.2.2 Tipos de Promedio 54
2.2.3 Media Aritmética - Datos no agrupados 54
2.2.4 Media Aritméfica - Datos agrupados 54
2.2.5 Propiedades de la Media Aritmética 56
2.2.6 Media Ponderada 60
2.2.7 Mediana 62
2.2.i.i Fropieciades de ia Mediana OJ 3:2.2 Propiedades de las Frecuencias t40
2.2.8 Cuartiles 67 j.2.3 Medias y Varianzas Marginales
l4r
2.2.9 Dee iies '71 3"3 Distribuciones Condicionadas 144
2.2.1A Percentiles t¿ 3.4 Medidas de Dependencia enrre dos Varimbles Nominales t47
2.2.11 La Moda 75 i.4.1 Independencia de Variables t47
2.2.11.1 Propiedades de La Moda /o 3.5 Diagrama de Dispersión 152
2.2.11.2 Cáiculo de [.a Moda 76 3-6 Nociones de regresión y Correlación Lineal 154
2.2.12 Relación entre La Media, Medidna y Moda \
78 i,6. I Correlación 155
2.2.13 Selección entre la Media, la Mediina y la Moda 78 3.6.2 Cálculo del Coeficienre de Correlacién 156
2.2.14 MediaGeométrica 79 3 "6.3 R egresión
r60
2.2.14.1 Propiedades de la Media Geométrica 81 i.6.3.1 Regresión Lineal Siimp[e t6l
2.2.15 Media Arménica 82 3.6'3-2 Método de Mínimos cuadrados para estirnar los coeficientes
2.2.15.1 Propiedades de la Media Armónica De Regresión Lineal
83 I6l
2.2.16 Me<iia Cuadrática 83
V3) Medidas de Dispersión o Concentración 99
2.3.1 Recorrido de Ia Variable 100 CAPITULO 4: ANALTSIS COMETNATORIO
2.3.2 R^ecorridolntercuartílico 100
4.I lnlroducción r8l
2.3.3 RecorridoSemi;lntercuartílico 100
4.2 Principios Básicos del proceso de Conta¡ l8l
2.3.4 Desviación Mediana o Promedio
4.3 Arreglos 184
l0l 4.3.1 Arreglos Simples
2.3.4.1 Propiedades de la desviación Media t84
l0i 4.3.2 Arreglos con Repetición
2.3.5 Yarianza y Desviación Estándra 142 4.4 Perrnutaciones
r85
t85
2.3.5.1 Propiedades de Ia Varianza y Desviación Estándar 103 4.4.1 PermutacionesSimples r85
2.3 .5.2 Métodos abreviados para ei cáiculo cie la varianza y 4.4"2 PermutacionesCinculares t87
Desviación Estándar 105 4.4"3 Permutacionescon.Repetición r88
2.3.6 Medidas de Dispersión Relativa r11
,1.5 Combinaciones r88
?.3.? Momentos I l3
2.3.8 Medidas de Asimetría r 15
2"3.8.1 Coeficientes de Asimetria 115 CAPITULO 5: PROBAB¡LIDADES
2.3.9 Medidas de Cunosis I l8 5.¡ In¡roducción 197
5.2 ExperimentoAleatorio t97
CAPITUI,O 3: VARTABLE E§TADÍSTICA BIDIMENSTOÑAL 5.2.1 Caracterización de urn Experimenm Aleatorio 198
5.3 Espacio Muestral 199
3.1 Introducción 135
5.4 Evcnlos 199
3.2 R.epresentación de la Información medianre Tablas
5.4.1 Operaciones con Eve.ntos 20t
5.4.2 Propiedades de las Operaciones con EvenÍos 204
Bidimensionales r35 5.4.3 Algebra de Eventos 205
3.2.1 Distribuciones Marg inales t37
5.5 Probaiiiiiria¡i ¡ie r¡n Evenrcr 7.6 Independencia de Variables Aleatorias JóJ
5.5. i Propiedades de la Probabiiidad de Eventos ;;;
LLN Covarianza y Coeficiente de Correlación de dos variables
5.5.2 Espacios Muestrales Finitos Equiprobables 217 Aleatorias 389
5.6 Probabilidad Ccndicional 1"' A
7.8 EsperanzaCondicional 392
5.6.1 Regla de Multiplicación 238 7,9 Ejemplos y más ejemplos 395
5.6.2 Independencia Estadística de Evenros 244
5.ó.3 Teorema de Probabilidad Total y Teorema de Bayes 246
CAPITULO 8: MODELOS DE DISTRIBUCIÓN DISCRETA
5.6.4 Ejernplos y más ejemplos 257
\ 8. I lntroducción 4t3
8.2 DisfribuciónUniformeDiscrera 4t3
CAPITULO 6: V,{RIABLES ALEATORIAS Y MEDIDAS DE
8.1 Distribuciones de Bernoulli y Binomial 4t5
POSICIÓN Y DI§PERSIÓX NS VARIABLES 8.4 Distribución Multinomial 126
ALEATORIAS 8.5 Distribución Hipergeométrica 128
6.1 Introducción 287 8.6 Distribución de Poisson 431
6,2 Concepto de Variable Aleatoria 28i 8.7 Distribución Binomial Negativa y Ceométrica 438
6,3 Función de Probabilidad de una Variable Aleatoria 288
6.4 Distribución Acumulada de Probabilidad 293 CAPITULO 9: MODELOS DE DISTRIBUCIÓN CONTINUA
6.5 Variables Aleatorias Discretas 299 9.1 Modelo l-iniforme .t47
6.6 Variables Aleatorias Continuas 316 9.2 Modelo Normal 454
O.r Medidas de Posición de una Variable Aleatoria 331 9.2,1 Propiedades de la Curva Normal 456
6.7 .\ Esperanza Matemática de una Variable Aleatoria 331 9.2.2 Distribución Normal Estándar 457
6.7.1.1 Prcpiedades de La Esperanza matemática 335 9.2.3 Teorema del Limite Central 472
6,7.2 Mediana de una Variable Aieatoria 337 9.2-4 ,A,proxirnación de la Distribución Binomial a una Niormal 476
6.7.3 Moda de una Variable Aleatoria 338 9.3 Modelo Expoqencial y Gamma 488
6.8 Medidas de Dispersión de una Variable Aleatoria 339 9.3. 1 Distribución Exponencial 488
6 8"1 Varianza de una Variable Alearoria 339 9.3.2 La Función Carnrna 491
6.8.2 Desviación Estándar de una variable Alearoria 340 9.3.3 DistribuciónCamma 49i
6 8.3 Propiedades de la varianza 340
69 Desigualdad de Chebyshev 348
610 N{ornentos y Función Generatriz de Momentos 352

CAPITULO 7: VARIABLES ALEATORIAS BIDIMENSIONALES


V,\ Introducción 36s
7.2 VariableAleatoriaBidimensionalDiscreta JOi
7.3 VariableAleatoriaBidimensionalContinua 374
7.4 DistribucionesMarginaies 3?8
7,5 DistribucionesCondicionales 380
§.8 E§TAD§STñC& Y
ETApAS BEL nnÉrmmo
E§TADísr¡cry
t.r INTllo,DuccróN
La palabra "estadística" deriva del vocablo latín "status". que significa
cstado. Esto se explica porque una función tradicional de los gobiernos centrales
es y ha sido llevar Ia cuenta de la cantidad de habitantes, nacimientos.
defirnciones. empleo y desempleo" cantidad de ernprcsas, costo de vida y muchas
otras caractcrÍsticas de nuestra sociedad. Contar y medir estos hechos genera
rnuchas clascs de datos nu¡néricos. A pesar del hecho de que tenernos nluchos
años de experiencia en la recoleccién de este tipo de información, se contini¡an
presentando complicaciones y oportunidades para la contribución científica en lo
quc rcspccta a rccolectar, procesar e interpretar eficientemente tales datos. Hoy en
día, muchas actividades están relacionadas con la estadística y muchas
ocupaciones implican el uso del método estadístico.

I.2 RAMA§ DE LA ESTADÍSTICA

Se han planteado múltiples definiciones de la estadÍstica. algunas


caractcrizandlo la cstadística conro ciencia, y otras conro rnef,odología. Con fines
estrictarnen]le instrt¡ctivos darenros Ia siguiente definición.

Definición y'. Estadística cs la ciencia quc nos proporciona un coniunto dc


nlétodos v pnoccdimientos para recolccción, clasificaciórr-(organización), análisis
c intcrprclación de dalos cn lbrrna ¿¡clccuada para lonrar dccisioncs cuando
prevalecen c,cndicioncs dc incertidurnbre. De acuerdo a esta definición podernos
cl¡sillcar la estadística en:
l. Estadística Descriptiva v
2. ['-stadistica Inferencial

Estadística Descriptiva.- Es la parte de la estadística que se encarga de la


recolecció¡r" clasificación, presentación. descripción y simplificación de los datos.
En otras palabras, podernos expresar que un estudio estadístico se considera
"descriptivn' cuando sólo se pretende analizar y rlescribir los datos.
I"OPiCÜS IfÉ ES IAI.)iS'i'iCÁ i)ESC RIPI'IVI\ Y I)ROi]Ai]JLIDADES
ETAPAS »Er- uÉtooo ESTADisrrco
Faiiiciilai¡iiciitc. podctnos icsitn.)ii !a csÍariísiica dcsci'iptiva eil ei ]igu¡ctittr
&Iuestra.
diagrama:
Al conjuntc de medidas o conteos que se obtienen de alguna población

i-"";; i-.---;l l;;


con el propósito de ubtener información acerca de ella se le da el nombre de
muestra. Se suelen torl-lar muestras cuando es difícil o costosa la observación de
oeoatos ro'orto' todos los elementos de la población estadistica. Al número de elementos de la
I i-.1' l* L.::: muestra se le lla¡;ra tamaño de la muestra.

Estadística Inferencial .- Es lo que llos proporciona la teoría necesaria para Obscryaciótt 1.- La dirstinción entre una muestra y una población de la que se
inferir o estimar las leyes de una población partiendo de los resultados o extrae la muestra €s rrllportante err el análisis estadístico. Que un conjunto de
conclusiones del análisis de una muestra. Es decir, podemos considerar que un datos conrprenda una filuestra o una población depende de cómo ha de scr usado.
estudio estadístico es inferencial cuando se pretende inferir conclusiones que Si, por elemplo, deseamos estudiar el cociente intelectual de los niños de la
atañen a una población de donde procede la muestra y como estas conclusiones Escuela 3006 de la qiudad de Arcquipa, entonces las mediciones del cociente
nunca pueden ser absolutamente ciertas, ellas estarán ligadas a cierto grado de Intelectual (cl) de iodos los niños de dicha escuela constituye una población.
incertidumbre o probabilidad. Pero si queremos estudiar el cl de todos los niños escolares del Departamento de
,4requipa, la nredición del Cl de los niños cscolares de la Escuela j006 se
I.3 LA POBLACIÓN Y t,A MUESTRA convierte en una mue§lra.

Población. Dato estadístico.- S,on números o nredidas que han sido recopilados conro
Se entiende por población o universo a la totalidad de individuos o resultado de observaciones. que pueden ser comparados. analizados e
elementos en lcs cuales puede presentarse determinacla c¿iracterÍstica susceptibie interpretados. LJn núrmero aislado que no puede compararse o que flo muestra
de ser estudiada. Ceneralmente, este conjunto viene defi¡liclo por conlprensión., es relación significativa con otros rrúmeros no es un dato estadístico.
decir, citando la propiedad que caracteriza a sus eleirrentos. Los ilatos inclividuales
de r-rna población se llaman unidades elementales u observa,:iones. I.4 VAI{IAtsLES EST'ADiSTICAS
Drfinición 2.- []rra variable estadística cs urla característica de la población quc
Ejernplo l: intcrcsa al irrvcstigado r y quc puedc tomar dif'ercntes valores. Las variable s
a) Foblación de ventas anuales de los supermercados de Lirna Iv{etropolitana cstadísticas .u,cneralllrcnúe se dcnotan ccin las lelras x, y ,2, cfc.
b) Población de todos los posibles resultados cara o sello que se obtcnga al Así. pcso. cocienre intelectL¡al ((il) y sexo son variables, dado que pueden romar
erro-iar una moneda un número indefrnido de veces. distintos valores cL¡¡nrdo se obscrvan dilerentes individr¡os. Si los valorcs
c) Población de puntajes de rendimiento en la lectura de todos los ah¡lnnos del nLlr¡léricos qt¡e Ioma una variable provienen de factores fortuitos y si un
nivel ptimario en un sistema escolar. determinado valor no se puede predecir exactanrente con allticipación. esa
variable se de'nonrir¡¡ "¡'ot'ictblc ul¿Lttorin "
La pcblación puede ser finita o inñnita, dependiendo del nú¡nero de eletnentos
que la cont-orman. 1.4. I Cllasificacirin rlr r'¿ariatrles

Las variables se clasifioan de la siguiente forma:


Población finita.- Es aquélla que tiene un número determinado de elementos.
l. Variablc Cualitatir,"a,- Son variables cuyos valr:rcs consisten en categorías de
Población inñnita.- Es aquélla que tiene un número infinito de eiementos. En la
clasificación. es decir. s,e refieren a la cualidad que presenta la población (nr¡ lleva
práctlca, una población finit¿ con un número grande de elernentos se consiclcra
clasificación nr,rmérica) Por ejernplo. la variable "estado civil'' puede adoptar las
una población iniinita.
rnodalidades: soltóro, casado, divorciado. viudo, etc.
TOP]COS DE ESTADiSTIC,^. DESCRI PTI\,¡A Y PI10ITA Ri L; DA DES
§TAPAS DEL I\,{EI DDO ESTADISTICO
Á c¡t rrez acfa r¡qriahia ñ,,a;-
Irsevvv,gu¡¡¡v^i..i+i^
E!ernplo 5;
ii i{ominai y ii) urdinai a) Número de nTonedas que una persom& lleva en su bolsillo
variable cualitativa Nominal.- son aquéllas que surgen cuando se define'l b) Número de admisiones en un hospitall durante un dia determinado
uaiegorías y se cuenia ei número rie observaciones pertenecientes a cada categoria
c) Número de mccidentEs autornovilísticos que se producen dentro de los límites
y no lleva ninguna ordenación en las posibles modalidades.
de una ciudad duraila un mss.
d) Número de aolonias de bacterias en ulna placa de agar.
Fiemnln ?.
a) La variable cualitativa "orientación en el tiempo,' con las posibles Variable comtinua.- Son aquéllas qrue pueden tomar infinitos valores entre
modalidades (presente, pasado y futuro) es una variable cualitativa nominal. dos números, por muy próxímos que los lljemos.
b) La variable cualitativa "color de ojos" con las posibles modalidades (castaño,
azul, etc.) es una variable cualitativa nominal. Ejemplo 6:
c) La variable cualitariva "partidos politicos" con las posibles rnodalidades a) Estatura de lns estud,lantes de la U,trl.M.S.M.
(conservador, Iiberal, independiente, socialista) es una variable cualitativa h) Nivel de colesterol de ciertos pacientc:s del hospital Laayza.
ilullrillat.
-^---:-^^l

I.5 PARÁMETR.O Y EISTADÍCRAFÜ


variable cualitativa ordinal.- cuando el investigador va más al!á del nivel
Definición 3.- Farámetru es una medida usada para describir alguna característica
de ciasificación y busca orcienar sus casos en términos del grado que posee una
de una poblaciót¡. Para determinar su vallor, es necesario utilizar la información de
deterrninada característica, entonces está trabajando con una variable.cualitativa
la población completay. por lo tanto. lasi decisiones se tomarán con certidumbre
ord inal,
total.
Los rnás ¡:sados son:
Ejemplo 3:
a) La variable cualítativa "clase social" con las posibles modalidades (bajo,
i) Media poblacional (¡r) ii) Varianza poblacional (o2)
medio, alto) es una variable cualitativa ordinal.
iii) Proporción poblacional (p)
h) I a variehle c¡ralitrf ir¡a ''ecfr¡rlin)' ¡nn lac yvJrur!J m^.¡ál;..1.J^"
¡r¡vusr¡uqu!J t tr ^- r-.^A^
^^cihl." \ !¡, utduu"
Definición 4,- Estadigrafo es una medida usada para describir alguna
2do. Grado, etc.) es una variable cualitativa ordirral.
característica de' una mnuestra. La torm.n de decisiones contiene un grado de
incertidr¡nlbre. L»s más usadas son:
II Variable Cuantitativa.- Son aquellas variables que se obtienen como
resultados de mediciones o conteos.
i) Media muestral (X) ii) Varianza rnuestral (Sz)
iii) Proporción nnuestnal ip)
Ejernplo 4: Son variables cuantitativas: el peso de personas, la ternperatura, el
coeficiente intelectual de personas, la presión sanguínea. el número de esrudianres
I.6 LAS ETAPAS DEI- MÉTODO ESTADÍSTICO
De acuerdo ,ron el r¡rden rie aplic,auiones de Ia estadistica a un problerna
del primer año. el número de accidentes que se producen en un período dado en
determinado. los métodos estadísticos se,Cividen en 4 erapas:
una región geográfica.
I-as variables cuantitativas se clasifican en:
l. Planiflanción deI estudio.

i) Discretas y ii) Continuas


2. Recolec:ción de, Ila inior¡nación-
3. Organriieación o clasificación cle los datos recogidos,

Variable Discreta.- Son aquéllas que toman valores numéricos aislados y no


4. Análisiis e inter;pretación de los resultados.
Existen bue nms mzotws que justificanr este proceder. Las técnicas estadísticas
pueden tomar ningún valor,entre dos consecutivos frjados.
son muy numer,osas y aquéllas que §on más apropiadas para detcrminados
TOPICOS DE ESTI.DíSTICA DESCRIPl'I\,'A Y I'ROBABILIDADES ETAPAS DEL METODO ESTADiSTICO

t'luhici:i¡s nued.!! n{):f!- crrn'-,en!enieS paia tii¡s. En cainbi.¡. !,:: ¡l:nclplc,s Determinar los objetivos inmediatos es explicar cómo se va a hacer la
gti.ieiaies dcl nrétoijc, estadístico son universales er1 su utilización, no importa cuái invcstigación, es decir, señalar la estrategia que se utilizará y los pr-ocedimientos
sea la investigación oue se !"ealice o !a rama del conocimientg hu,nano en la que generales que se usarán en el desarrollo de la misma.
se aplique. Parece muclio Inás conveniente. por lo fanio. conocer ias posi'nilidaries Segundo paso.- Búsqueda y evaluación de la información existente
y limitaciones de una técnica, aún cuando no se tenga ninguna destreza en su La cvaluación tiene 2 partes:
rnanejc, en lLrgar de dominar los nrás intrincados secretos de su cálcr¡lo cuando no a) Evaluación de los trabajos individuales.- Para la evaluación de Ios diferentes
se tiene una versión acertada cie su apiicación. trabajos, no pueden desde luego darse reglas fi.jas, esto depende en gran parre
de la preparación dc la persona que avalúa. Debe darse especial importancia,
1.6.I Etapa de la planificación. cn primer lugar, a la manera como fueron recogidos los datos, pues los
Básicamente ia etapa dc planificación tiene por finalidad estudiar los detalles procedimientos y métodos empleados en su recolección servirán de euía para
conce!"nientes a !a reeclección. clasificación y análisis de !a infcrnlación. en base .juzgar sobre su precisión y liinitación. En segundo lugar, es necesario anafizar
a los cuales se describirán las características de una determinada población o se cuidadosamente si las conclusiones fueron derivadas del material estudiado.
confirmará o negará determinada hipótesis de trabaio. Es obvio, sin embargo, que b) Evaluación conjunta del materiai estudiado.- l.as conclusiones que fueron
ninguna planificacién podrá hacerse adecuadamente si antes no se ha definido aceptadas como corrcctas en a) dcbcn analizarse ahora en su corijunto para ver
claramente Ia naturaleza v objetivos de la investigación y si no se ha hecho una :;i son consistcntes cntrc si o si cxisten algunas quc son contradictorias.
conveniente evaluación de los conocimientos que sobre el problema se ooseen y Justanrente Ia prcscncia de tales contradicciones glrría al investigador a
de las hipótesis que se han forrnulado para explicarlo. tbrnrular hipótesis quc deben verillcarse.
Podernos esquemaiizar Ia planificación en los sigtrie ntes 5 pasos:
'I'erce r paso.- Formulación de la hipótesis
Primer paso.- Planteamiento del problema En to«l¿r investigación, salvo aquéllas esencialmente descriptivas. irnplícita o
Al plantear el probiema que se va a investigar, debe darse cspccial consideraciórr explícitarncnte sc trata de probar una hipótesis de trabajo. "l.a hipórcsis c,s
a los siguientes puntcs: I
srnrplenrente una afirnración que está su.icta a vcriflcación". su tbrmulación dcbe
a) Definir la naturaleza e importancia del problema que :se cstudia. h¿lccrsc claramente, )'a que el discño. planificación y dcsarrollcl tlc la
b) Determinacrón dei objetivo flnal y de los objetivos inmediatos de ia investtgación rlcpcndcrltn tlr la hiptitcsis (lLrc sc trata de probar.
investigación.
('rranto paso.- Vcrif rcación dr i:r hipótesis
Nslttralezu importanrio del problema
e
l.a veriilcación dc la hipótc'sis constituve la investigación propiarlente dicha. cn
Definir ia naiuraleza ciel problema que se estudia es explicar qué varlcs a Ia cual sc consider¿rr 2 aspcctos
estudiar. No basta, por .jcmpic, decir que se va a estudiar ei cáncer. pues
a) Diseño de la Invcstigaciiln.- Al diseñar la invcstigación sc debe estudiar por
probabiernente ningún investigador esté en capacrdad de cubrir todtts Ios aspecros
adelantado cada una de Ias difi,rcntcs ctapas. es decir. todos los dctalles
de esta enf'ennedad.
relacionados cr¡n la recolecció¡1. organización y análisis de [os datos. Es
Defirrir la importancia del problema es cuantificar su exrensión y equivale a nccesario determirrar cie antemano todo io concerniente a las obsenaciones
expiicar por qué se va a estudiar. Un investigadc,r puede abocarse al estudio de un que se harán. cl número de individuos qLre se estudiará y el procedintiento a
probiema por razones éticas. estéticas o nte¡afÍsicas" pero la mayoría cie las veces
uLili¿ar crr su selccción. investigando cuidadosanlente si existen factorcs éticos
es ei deseo utilitarista el que lo guía.
que pueden oponcrse a la realización <jel estudio en la fbrrna proyectada. Sc
D ele r minació n de O bj etivas considerará la época en que se hará cl estudio, el tiempo que durará y los
Determinar el objetivo final significa explicar ias posibilidades de aplicacitin gastos que dctenninará. También se hará Ia selccción y entrenamiento del
práctica cie la investigación..es decir. explicar para qué se realiza. personal que va a colaborar.
Es importantc sobre lodo:
TT}P!I,:'-)§ DE ES'!'A DÍ S TIT-)A. DF,S( R PTI V AY PR ()BAB [, DAT) L]§
] I I I t]TAPAS DEL ME'I'ODO T]S1'ADISI'ICO

ij Defir¡ir !a unidad ilue se ohserva. e:on ei ñn rie ineiuir ia tr-riaiida-d de ios 1.6.2.1 Los Errores en las Observaciones
i¡lrlividucs que preserita¡i las üaracterísticas que se estudia¡r y excluir Los integrantes de toda población. a la vez que poseen caraclerísticas
aquélios gue no ias presentan. comunes, presentan algunas diferencias que sirven para individualizarlos. Es
ii) Definir lo que se va a observar, para que todos lcs indi';iducs sean justanrente por Ia existencia de tales diferencias que se justillca el empleo de la
estudiados uniformemente. l estadística. pues si todos los elementos de una determinada población fueran
Finahnente, debe hacerse un balance de los recursos que se dispone y los que exactamente iguales, bastará describir una de ellas para tener una descripción
se necesitarán para ejecutar la investigación conforme io planeado. acertada del con_junto.

b) Ejecución de ia Investigación.- Es la recolección, clasificaciÓn y análisis de la ,¡ I iado de esta variación reai, inherente a los individuos que se estudian, hay

inf,ormación recogida, etapas que deben realizarse de acu€rdo a lo planificado. t¡ue considerar una variación sobreañadida que sólo es, en realidad, errores
deternrinados por los factores quc intervienen en cada observación, dependientes
Quint+ paso.- Análisis y presentación de los resultadcs de:
F,iecutado el estudio, se considerará si fue realizado conforme se había planificado a)
el observador b) el método dc observación y
y con los resultadcs a la vista se concluirá si la hipótesis ha sido verificada o no. c)
el objetos o individuos observados
haciéndose las recomendaciones pertinentes. La presencia de tales errores determina. por lo tanto, que ninguna medición es
absolutamcnte exacta.
L6.2 Etapa de la r"ccolección de la información a) Errores dependientes del Observador

Esia eiapa. ian a menudo olvidada, tiene para el investigador tnucha lnás
Las principales causas son: el grado dif'erente de preparación o
entrenamiento de los observadores, su estado fÍsico, el exceso de traba-io y
importancia que cualquier otra, pues tiene que ser vigilada constantemente por el
las condiciones ambientales bajo las.cuales trabajan.
investigador para que se realice conforme a los planes trazados. Pues si la
b) Errores dependientes dcl Método rie Observación
información ha sido recogida de manera correcta, poclrán tener vaiidez las
Todos los métodos de observación tienen errores más o menos
conclusicnes de que ella se deriven. En caso contrario, no se justifica siquiera el
importantes, y de ahí la continua preocupación científica de meiorarlas o
empleo iie la estadistica, ya que ninguna técnica podrá correuir Ios errores
cambiarlas por otras más convenientes.
presentes en los datos básicos recogidos.
van a recogerse )' scbre la precisiÓn c(\n qtle Por ejemplo, a[ estudiar las condiciones pulrnonares de un paciente puede
L.a elecisión sobre los datos que
prirnordialniente del propósito de ia investigación y utilizarse la radioscopia, la fluorofotografía o la radiografia estándar de l4
deben ser obtenidos depende
x l7 pulgadas, pero la eficiencia de estos métodos son diferentes. collo se
del maierial estudiado. siendo conveniente liinitarse a recogel" tan sóio aqrrella
observa en el siguiente cuadro.
información que va a utiiizarse.
Los principales puntos que deben considerarse al recoger la infornlación son:
EFICIENCIA DE DIVERSOS NTÉTODOS EN EL DIAG\ÓSTICO DE L.\
a) Los errores que pueden cometelse en la recolección de los datos y Ia TTIBERCTJLOSIS Pt]L IONAR
manera de controlarlos.
b1 l-as venta-ias y iirnitaciones de Ios cliversos nletocios:rnpieados er.i la Método Eficiencia
lecolección dc ia infcrmación. 70Y"

c) L,as condiciones que deben reunir los individuos que 5e estudian 1 ios Fluorofotografía de Abreu
procedimientos tnás convenientes para su elccción.
d) El diseño de los formularios que servirán para registrar la inforrnaciÓn que
se recoja. En el cuadro se observa una marcada variación entre los diferenles
métodos, siendo la radioscopia el menos conveniente" Se debe tener en
cuenta, además, que para un método en particular hay una serie de factores
TÜPiCOS DE ESTADiSTICA DESCRIPTiVA Y PROI]AB'i,IDADF-S
ETAPAS DEL MÉToDo Ls fADts rrco
-,.-.-..^J^..
Liutr ^-.^J..-:.-
iiuliuuLlt
ljucu§lt d- Í-lalsü¿1i
t---.- t--
ios itr.suil"¿úús. A5t por ei(:t!IiFio, iln'Dalo La recoleccíón de datos es indirecta cuando los datos obtenidos provienen de los
.,^i+^:^ J^ ¡^ ^^--:^---
vcrriJe ce la ccrriente eléctrica
^t!-1.:--
o una pércida de pctencia de los líquldos datos previamente recogidos por otros individuos, y en estc caso sc habla de
revelaciores pueden dar radiografias de mala caiiciad que causan errores en f,uentes secundarias. A veces se halla publicado en textos o revistas y en otros
cr¡ lp..t¡¡ra
casos no está publicado, por Io que su obtención se hará dificil a causa del
carácter confidencial con que ha sido recogida,
De existir varias fuentes con Ia misma información, la recolección de una de ellas
c) Erlores depenciientes de ios indíviduos Observacios en relación a las otras debe basarse en 2 criterios:
i)
l
Fuera de la variabílidad real que presentan los individuos que se observan, Calidad de la información
il
hav también una variabilidad sobreañadida dependiente de ellos mismos. ii) Accesibilídad administrativa
debido a ias conciiciones y tiempo en que se estudian. En cuanto al tiempo, la recolección de datos puede ser clasificada en:
a) Continuos: cuando los everitos (datos) son registrados a medida que ocurren.
Obseryació¡t 2,- Cantrol de los errores en lus observuciones
Ejemplo 7: Registro Civil de los hechos vitales (nacimientos, defunciones y
cualquiera que sea la causa de ios crrores anteriores, su control se puecle hacer
casamientos). Regístros de enfcrrnedades como cáncer o tuberculosis con la
por reducción o por medición.
flnalidad tlcl control.
a) Reduccion de Errores
La reducción de ios errores se loqrará de acuerdo a las causas que los b) Periódicas: cuando es hecha en intervalos de tiempo en forma cíclica.
determinan. Ejemplo 8: Censos hechos en el Perú cada l0 años.
Los dependientes de los observadores pueden reducirse aumentando la
c) Ocasionales: cuando se efectúan en cualquier época.
preparación y entrenamiento de los observadores. vigilando las condiciones
Ejemplo 9: Investigación nacional por muestreo de domicilios hecho por el
fisicas ¡' poniendo en las mas óptimas condiciones de trabajo
Instituto Nacional de E,stadistica (lNE) en el año 1979.
Los dependientes del rnétodo de observación pueden reducirse seleccionando
Ias rrejores técnicas conocidas, estandarizando los métoclos a enrplear 1,
PRENCIPAI-ES MÉTODOS DE RECOLECCIÓN
controiando constantemente el funcionamiento de los aparatos rrtilizados.
La selección del método de recolección depende lundalnentahnente del propósito
Los dependientes de ios individuos observados se pueden reducir procurrrndo
del estudio, de la ¡l¡rturalcza dc la in[orrnacii¡rr y de la lor¡na en que ésta se recoia
que los individuos estudiaijos se investiguen en las más favorables y sinriiares
(ocasional. pcriód icl, conlinua ).
circunstancias con el fin de disminuir los errores que dependen de ellbs.
Entre los niétodos nrhs usados tel)ctn0s:
b) Medición de Errores
a) Méfotlos de Encuestas y Ex¡leríurentos (corrro tipo de infonnación rect¡sida
Es el proceso de evaluación de l¿s diferentes técnicas v inétocios di: estL¡dio.
ocas iona lrnente)
Generalmente se piensa que encuesta y experimento difieren porque en la
1.6.2"2 Métodos de la Recolección de la Información prirnera la inlorrnación se recogc rlediante el interrogatorio y en las segunda.
La recolección cie Catos puede ser de manera directa o indirecta.
r¡ediante la observación. La verdadera diferencia está en la naturaleza de los
La recolección de ciatos es directa cuando los datos son obtenidos directamente cie
datos recogidos. En la encuesta los datos ya existen y sólo es necesario
su fuente de origen (o fuente prirnaria), es decir, de los indrviduos en donde puede
recoger.los. nrientras que en el experimento los datos no existen v es necesario
ocurrir el fenórneno o la caracteristica en clue estamos interesados. como por provocar su aparición. Por ejemplo, cuando una nueva droga se introduce o un
ejemplo: nacirnienios, deiunciones. casarnientos. ventas registradas en notas nuevo tratamicnto se recomienda. no hay al respecto ninguna inforrnación
fiscales de ia empresa" etc. En tales ocasiones sólo hay dos procedimieritos para
registrada, v es necesario realizar un experimento.
recolectar la información.
b) Mótodo Cens*l {como tipo de información recogida periódicamente)
i\ lanhcorrieciÁn {/
J ii) el interrogatorío

tn lt
iurtcÚs L-rL i:5 i ADls I 1ü,\ IJI-sL RI P i i vA Y i'iiuil.\ll i LI D,^rli:-i ETAPAS DEL METODO ESTADíSTICO
I pnso 9s iln f nnit!nf n alp ñnerqc!^nFs nilc qp r¿2li"A cn trn rn^mefl!n ¡¡dn Ie ¡4¡
Iimitadas pero muy extensas, pues ningún investigador sería capaz «Ie estudiarlo
5 ó i0 años) -v
en un área geográfica bien defirrida. con [a flnalidad de conocer en su totalidad. Lo mismo es valedero para aquellas investigaciones en tas cuales
Ias caracterisiicas dernográficas, económicas y sücialcs de ia pobiación. ; el proceso de investigación destruye al individuo que se estudia, como en el caso
menudo, se cree que el censo y la encuesta difleren en cuanto a la noblación en que se prucba la acción de ciertos venenos en aninlales de experimentación.
que cubren, pues niientras que el priniero se refiere a ia totalidad de ia Pero aún en el .caso en que se quiera estudiar una población perfectamente
población estadÍstica, el segundo sólo estudiará una muestra de dicha li¡nilada. debemos decidirnos por 1a muestra, pues su utilización tiene la.s
pobiación. Tai coircepio cs cn'óireo. fJr¡es Icr)ro ei uno corrio c¡ utro pueduir siguicntes ventajas:
cubrir a rocia ia po'olación o sólo un segmento cie elia. l,a ciiierencia esencial l. Ahorra tiempo, dinero y trabajo.
radica en la naturaleza de ia información que se busca. En el censo. 2. Permite una mayor exactitud en el estudio. pues los errores debido al
habitualrnente se busca dalos generales de la población. En la encr,resta, por el observador. al objeto observado y al método de observaciórr, puetien
contrario, se trata de obtener inforrlación sobre un tema en concreto, disminuir y controlarse rnás efectivamente. En efecto. como será menor
procurando profundizar en sus diierentes aspectos. el nú¡lero de personas que intervcngan en el estudio, será mucho ntás
c) Método de registros (corno tipo de información recogida continuamente a fáci! conseguir buenos especialistas y entrenarlos unilblurenrentc,
n:cdida que se plodLrcen los eventos) adem¿is, conto se nccesitarán mcnos instrur¡entos de investigación, éstos
Los daios suministrados por ios registros son dinámicos. mediante Ios cuales podrán vigilarse v calibrarse más cuidadosamente.
se conocen los cambios que ocurren en ella. Los princioios generales sobre la
oi'ganización dc estos siste¡¡as de registros se estudian en las estadísticas f
f)esventaja rlel empleo de muestras
vitales. [.a única desventaja ciel uso de muestras es el llamado error de mueslreo. cl
cual sumado a los tres tipos de error antes nrencionados, podria invalidar nuestro
1.6.2.3 La Eleee ión de los Individuos a Estudiar estud io
Y'a dijirnos que cuando la rnfon¡ación nc está registrada. hatrrá c;ue ¡cc¡,gcrla I
Este error de ¡nuestreo es una consecuencia de la variabilidad de las
directamenie de su fuente de origen, es decir', de las personas cn clonrie el poblacioncs. como los individuos dc i¡na población son nrly variables. los
,i
f'enómeno que nos interesa puede aconlecer. El problerna que se prescnta e!r tales dif-crentes r,.rupos o rnuestras que podernos l'crrrnar con ellas <liferirán también unas
ocasiones es ia acertada selección de las personas que vamos a estudiar. EsIe de otras v col¡o nosotros estudiarnos urla rrueslra para qeneralizar Iuego a toda la
prob!er1ra se presenta porque rnuchas veces resulta imposible y otras irrrpráctico población, los rcsr¡ltados scr¿in algo distintos segirn la rnucstra c¡uc hal arnos
estuiiar ia totalidad de personas en donde puede encontrarse la caracteristicr en cscogido. Esta difcrcncia entrc tl valor dado por Ia muestra y el verdadero valor
que estalnos interesados y, en tales casos, nuestro estudio tiene que Iimitarse a un de la poblacion conslituye el error por nluestreo.
grupc de diciros individuos. es decir. a una muestra. No hay que oividar. sin i Ejemplo l0: Suponga que L-n una población de 4 personas cada una ruvo
enrbargo, que aunque es la nruestra la que observarros. es la poblaciirn Ia qt:c respectivanrente 5000.7000,6000 ¡- 100000 soies El capitai promedio rje esra
(luerernos conocer, pues el estudio no tendrá ninguna irasccndenc i,r i s ltrt
población es.
pudiéramos generalizar a la población los hechos observados en la nruestra. Sin 5000-7000=6000-10000
embargo" para que esta generalización sea posible. los indiviiiuos integrantes de ia 11 = = S/. 7000
muestra deben ser escogidos adecuadamente, y esto piantea una serie Ce
Si no se coltociera dicho prttrnedio y para averigLiarlo se tor¡larui una rnuestra de
ciificultades que trataremos de estudiar en las páginas siguientes.
dos personas. digamos los 2 primeros (5000 y 7000). concluiríarnos que e I capital
prornedio cle cada persorla de la población es S/. 6000. cuando en realidad vinros
Ventaja del empleo de muestras quefues/.7000.Estadifcrenciadesi. l000entrcel valordelamuestrayel valor
Hay nruchas razones por las cuales el estudio de una lnuestra es pref'erible al
de la población constituye el error por muestreo.
de la totaiidad de la población. Ant€ todo, es evidente que el estudio de muestras
es el único practicable cuando se trata de poblaciones infinitas o de pot"-laciones

12 li
f r-) PI Ll { )§ l-l E E -qT/.-D iS TICA. D ESC RI PTI VA Y PP.O fl,\ Il I i- i DA DES
ETAPAS DEL MÉTODO ESTADiST¡CO
i a prest¡'¡cia-,iei ei'rsr p0r rnuestr.o parecerla indicar riuc ci astudiai una iiiiiestra
3. Ercoger l,as va¡iafiles que deben ser obsrrvadas en cada unidad de análisis.
!-n \.'cz dü ia poi,iacióii rs iicsiavcrabie y no veniajosa corno hemos inriicado. Srn A menuo{o, extisse una tendencia, particularmente con las po,blacionesr
embargo, conviene tener presente ,u*, an prirner lugar, el error por muestr-eo suele hrumanas, de pnqgunkr demasiadas cosas, algunas de las cualles nunca
*,.^L^ -------- r--- --. L---^
ser
^^- iiii_¡ciio meilos iiripüalaiiic cluc ios errores oeoloo at oDservaoor, al metodo de serán analizadar ¡posteriorrnente.
obser.,,ación ¡,a los individuos estudiadosl en segiindo lugar, que ei error por 4. Eqpécificar el grado de precisión deseada. El grado de incertidurnbre puede,
lxuestreo puede medirse estadÍsticanrente y, en cierto lnodo, puede disrninuirse a snr reducído tc,mlLmndo muestras más grandes y empleando mejores técnicas,
.,,oluntacl ta.n sólo con ar-tmentar el tamaño de la rnuestra
d,e: rnedición-
Por io tanto, como una mr-¡estra bien tomada permite el control de los errores 5. Sdlecciún de los iinstrumentos de medida.
debidos al observador, al método de observación y a los individuos estudiados, y 6" lieiecc.iór¡ del rnrzurco muestral. Consiste en seleccionar en forrxna ordenadn
como, por otra parte, el error por muestreo puede rnedirse y disrninuirse: se na unidacl mue,stlral, qL¡€ es definida como la menor parte distinta a
comprende fácilmente que los resultados a partir de una ¡nuestra son rnucho rnás idlentificable d,e lh poblacíón para propósitos de enumeración y sorteo de ts
exactcs clrrc acluéiios obtenicios cie tocia ia pobiación. flr'luestr&. Algun;ats vebes. la unidad apropiada es obvia, conno en la
p,olbiacimm const,ifuida por bombillas de luz, en donde la unidad es ia
CCF]DICIÜNES DE UNA BUENA MUESTR.A h,oirmbilla. En otrnrs ocasiornes, existe la posibilidad de escoger lo,que será na

Las condiciones que una rnuestra debe tener para que sea "buena" (es decir., para umiidad de rnue§flúto.
que rinda la inayor utilidad posible) son dos- La rnuestra debe ser adecuada en: 't. Eliacucior, de lla prueba Piloto o Pre Test. En esta etapa s€ hace un
a) Cariiiiud y 'u) Calidad v,erdadero €nsaIrD del trabajo a ser desarro[[ado, siendo prolbados [osr
a) Cantidad de individuos en la muestra.- Una muestra es buena en cantidad ñn*trumemtos de rnedida. ,iuestionarios, personal de carnpo, la reacción sie,
cuando inciuye un número óptírno cie individuos. El núlnero de individuos que [n población, et.tr.. Esta prueba piloto nos orienta para hacer los a.justes
deben incluirse en la lnuestra depende de dos faciores a saber: me,re sari¡ls.
i) Lá frecuencia con la cual ei fenónreno que se estudi¿r sc cncuenrlii cr) l¿ 8. S,sleccir¡nr de la rmluestra después cle haber decidido cuál debe ser el tamaño,
poblaciór:, pues es evidente que si una cnfermedad sc presenra tan sóIo en rcspectir,rc.
el l% de la pobiación, habrá la necesidad de estudiar por lo nienos i00
caqoq nara Jener la noiihilirlad de hrllar '!na nFrqñlr? enferrnr rriF.r... ^,,-
trr,Lrrrrq ¡ rlr¡L l'l POS llllE 14 [.]lES]IRrÁrS
si su presencia I'ue¡a de 509'0. al menos teóricamenie de cada 2 prrsonas A. lVlluesilras nlle conrenicncia o tle juicio.- [;ntran en ar,o g¡1sg{-)ría [odas
que se estudian se enccnrrará una persona enferma. aquellas nruüs[rirs cn Lln,o cualu's los individuos se cscogen en base a la opinió,nr
ii) La variabilidad rie ia población que se estudia: pues sc comprendc qrrc si personall" La perrsona qure selccciona los elementos de la lnuestra usualmente es u¡r¡
todos los individLlos que lo forrnan lueran exactamente iguales, hastarh con experto ern [a maleria daxla.
estudiar uno solo para conocer a toda la población. [Jna l¡lrle:stra dr, opiniim es lla¡tada una nruestra no probabilística. pLtcst,ut que esiL]
b) Calidad cte !a muestra.- Una truestra es buena en calidad cr-ranclo rclic.ja método restír basado em lils puntos de visla subjetivos de una persont{ y la teoría d*
fieimente las características de la población de la cuai procedc y difiere de ctla probabilruJad no,puede sier usada para rnedir el error de tnuestreo.
sólo en el nümero de unidades incluidas.
Ejemplor ll: Sluponganrros que queremos averisuar el porcentaje de a!Lemnos del
ETAPAS DEL MUESTR.EO sexo femcnina !.' massuilino de la Univcrsidad de San Marcos. En vez dle obtencn
Los pasos principaies en una encuesta por nluestrco son: una mue:ltra qje las diilerfl,entes Facultades que la integran. podríamos limritarnos ail
i. Definir explícitantente ios objetivos. a fin de evitar ducias posreriores. estudio de r¡;l grupo ,dle alumnos de alguna Facultad clue nos parezca rnás
debiendo quedar bien definida la unidad de análisis. represen[intiva en re].ar:i ¡n al sexo de sus integranles. Sir] ernbargo. ia r,¡aliriez de

2. Definir en forma clara la población a ser muestreada. los ¡esurllttados +:btemichn,s dependerá exclusivarnente del criterio que hayarno!
tcnido all seleccn¡nar c*fiflo típica dicha Facultad.

14
TOPICC]S DE ESTADISTICA DESCRIPTIVA Y PROBABiLiDADES ETAPAS DEL ]\,IÉTODO ESTADÍSTICO

Las i¡uesiras no probaiii!ísiicas puedeii ¡rerjrrdicar sensib!er¡¡er¡tr: ia vaiirjr:z Ejemplo al ensayar uná nueva droga sólo se tiene 5 ó 6
{.,1: Supongamos que
exteÍna de un estudia, pues muchos factores pueden inlluir en la reiació¡ de una dosis, entortces eni vez de escoger los individuos al azar, pueden seleccionarse
uniciad muestrai para que pertenezca a ia muestra, per_iudicando su solamente casos graves, ya que se presume que si la droga es efectiva en ellos,
representatividad en relación a la población. con mayor razón la será en los casos corrientes de la enfermedad.
A pesar de todo esto, existen situaciones en que ella es usada, lo cual nos obliga a
b) Por de umra lista completa de la población que se va a estudiar, siendo
taN[a
conoeer algunas formas de muestreo por conveniencia. imposrhle aplicar al azar.
c) Por loc.alizar llos individuos cofl una determinada caracteristica de interés,
Forrnas de muestreo por conveniencia;
digamos los emfermos tubcrculosos de una colectividad. En tales casos, es
a) Por voluntarios.- la cual es bastante usada en ensayos clínicos para probar prelerihle con,centrarnos en el estudio de aquellos grupos en los cuales la
nuevos medicanrenios.
experlencia sefrala que ha), um probabilidad de encontrar a los individuos
b) Intencional.- es aquélla en la que ias unidades que componen la mt¡estra
b risca drr's-
son escogidas por el investigaclor.
c) Por acceso más fácil.- es aqué[a en la que las unidades son €scogidas por
estar en mejores condiciones de accesibilidad. Por ejemplo, en el caso en
MÉToDoS PAR.A OB"I.ENER UNA MUESTRA PROBABILÍSTICA
que se defina para el estudio de todo el conjunto de habitantes de un área
rural, teniendo e[ domiciiio como unidad muestral, si el entrevistador Básicamente son dos los métodos para seleccionar una buena muestra

selecciona los 10 prirreros donlicilios en su camino, tendremos este tipo de l. Método de lotería.
muestreo. Consiste en colocar en um recipiente fichas con los nombres de todos los
intcgrantes dc la p,oblación que se va a estudiar y después de removerlo bien. se
B. Muestras probabilístieas. extraerán tan[as fichas como individuos se quieran obtener,
Son aquéllas en que cada individuo de la población tiene una probabilidad
perfectamente conocida de ser incluido en la muestra. No es ni siquiera necesario 2. Métodotle núrneros aleatorios.
que los diferentes individuos tengan un igual chance de pertenecer a la muestra, Consiste eri úbtener los elementos de la nruestra a través de la tabla de números
basia coi¡ que tei-rga cuaiquiei'posiiriiidarl (diferenie de cero) de íormar parte de aleatorios. La tabla de números alealorios está formado por una serie de digitos
elia y que esta probabiiiciaci sea conocida. generados em forrna aleatoria y en listados en la sucesión en que se generan los
La elección de una r"¡ruestra probabiiística requiere 2 condiciones fundamentaies: dígitos. Ya que cada digito o sucesión de ellos en.!a tabla es aleatorio. se puede
Primero: Es esencial que la
probabilidad de elegir cada individt¡o sea usar la tabla y leerlLa en sentido horizontal o vertical. Los dígitos en sÍ están
perfectamente cr¡nocida, pues si no lo es, no será posible calcular errores que agrupados er¡ s,ucesiioncs de cincc¡ dígitos con la única finalidad de facilitar la
puedan co,reterse ai hacer st¡ seiección. observació¡¡ de Ia tahla.
Segundo: Es indispensable que los individuos se elijan al azar, sin permitir la Para seleccinnar u]]r& muestra a través de la tabla de números aleatorios. orirnero
intervención de ningún factor que favorezca la elección de ¡:nos en detrimento de es necesario enuft¡€Íiar los mrembros individuaies de ia pobiacion en estuciio. Los
los otros. núrneros asig,nados a cada lniembro de ia población deben tener iguai numero de
dígitos que rll tarnafrLo de la poblacién IV. Por ejemplo. si N
= 5 740. cacia número
Elección entre Muestras probatrilísticas y de conveniencia' asignado tarnbidr¡ debe ser de 4 dígitos, a I'in de que cacia sujeto tenga una
Las situaclones en ias que es necesario recurrir a muestras de conveniencia son: oportunidad igual de selección. Por tanto, se asigna el núrnero 000 I al primer
a) Por limitaciones de recursos, pues tenemos que estudiar un número tnenor <ie sujeto en la Ilista d'e' la pobiación. e[ número 0002 al segundo sujeto en la lista. el
individuos que el que fuera cieseable y enlonces ia opinión de un experto número 095S, al 95fivo sujeto, y así sucesivarnente hasta que se asigne el número
nuede ser cr¡nven iente'. 5740 al su,!eno n-ésiurrro.

ld t7
TOPICOS DE ES 1-ADiSTIC.A. DESCF-IPTIVA Y PROBABILIDADES ETA¡AS DEL MÉTODO ESTADISTICO
t
.-,,-,.!
r)n {'i rl!-nDosilo
--^^Á^:r^ l^ ^^'
{€ selecclonal'í¿ lllut:l!':4;ri
dtbe esi'lilleeci un ¡ri:tl:i rli
:rzir.!"- se El muestreo aleatorio simple es ciertamente un procedimiento práctico si la
partida al .n
la tabla de númcios aleaiorios. un ¡nétodo es cerrar ios ojos y población no es grandc y si es relativamente facil y barato encontrar las unidades
"r*,
iievar un lápiz sobre la tabla de números aleatorios v elnDeTar desde ese !ugar. I:r de muestreo. Tambíén podría ser un procedimiento práctico para pobiaciones
grandes cuyos elementos están concentrados dentro de un área pequeña.
Dado que lv = 5 740 es el rnáxilno valor, se deben descartar todas las sucesioncs
de 4 ciígitos rlayores que N. si durante el proceso cie selección se repite cuaiquier- II. Muestreo aleatorio sistemático
sucesión de 4 <iígiios. el sujeto correspondiente a esta sucesión se volverá a incluir Es una prirnera modificación del muestreo aleatorio simple en la que la elección
como parte de Ia muestl'a si el rnuestreo es con reemplazo: sin erlbargo, la es sistemática. Este método consiste en seleccionar las unidades muestrales
sucesión repeticla se descarta si el muestreo es sin reemplazo. aplicando un intervalo de selección / que se define por
N
Tlpr)§ rtF MIIFs.rp^( Dp^Ir,rnr¡
¡\u u.,EUlLtJ Ícr¡rrr
I r._,4.) n
Entre !os ¡nodelos más utilizados, se tiene donde N es el tamaño de la población muestreada y n es el tamaño de la muestra.
1. Muestreo aleatorio sirnple. Este número / indrcará si cada décimo. onceavo. etc. elemento de la población va
2 Muestreo aleatorio sistemático. a ser incluido en la muestra.
3, Muestreoaleatorioestratificado. El primer elemento dc la mucstra cs clegida al azar entre los 1 primeros elementos
4. Muestreo de conglomerados. poblacionales y luego, el resto de los elementos se elegirán cada /-avo elemento
5 Muestreo por procedimientos combinados. de la lisra.
En el cjemplo, tenemos ff = 20000 y n = 2 000. Enronces
Ejemplo 13: con el fin de señalar las diferencias, ventajas y clesventajas de csl6s /V
procedirnientos consideramos el siguienie ejeinplo teérico. Suponganros que .Jn /=-=10
n
icada una de las 4 regiones geográficas del país (norte. centro,
sur y orienfe) hay Esto quiere decir que de cada l0 se esrudiará uno. para obtener una muestra
100 colegios técnicos con 50 alunrlos en cada colegio y que con el fin cle estudiar
sisternática es necesario, cn primer lugar, obtener la lista de todos los alumnos dei
deter¡ninada característica, resolvernos extraer una rruestra de 2 000 alurrnos.
país. Luego, se numera del I al 20 000. En segLrida. se escogerá al azar un número
Hay un total de 400 colegios con 20 000 alumnos ¡r la elección de ios 2 000 c¡ue
entre el I y 10, el cual
indicar¿i el prinrer alumno que se va a estudiar y
vamos a estudia¡ podrá hacerse por cualquiera de los siguientes procedimienros.
conlpletaremos la lista cada dócimo alurnno. Si el núrnero escogido ft¡e 5. los
otros serán I 5. 25. ctc.
I. Muestreo aleatorio sirnple Este procedirliento tiene Ios ¡llisllros inconvenientes que el anterior, pero da¿a la
Es aquel en el que cada elemento cle la población tiene igual probalriliilail de scr
sencillcz dc su aplicación suele utilizarsc en todos aquellos casos en los cuales
incluido en la inuestra, existen ficheros o iaúeteros c-spcciales con los nombres de cada uno de los
En el ejemplo, a partir de una lista con los nornbres de los 2() 000 cslLrctrianles. srr individuos de la población que se investi.qa.
elegirán los 2 000 que deben estudiarse. El proceclirnicnto tienc J inc(rnvenicnrcs:
' a) se necesita una iista detaiiada con los alumnos dcl país, lo cual no es fácil lll. Muestreo aleatorio estratilicado
de obtener. El proceso dc estratiflcacióri consisrc cn dividir ia ponlacion un sub-rr upos o
b) La muestra quedará tan dispersa que prclbablemente haya necesidad de csrratos r'lue son rrrás honrogéneos que ia po'oiación como un rod(r. es dectr.
trasladarse a una apartada región para estudiar uno o dos alumnos. cstratificar
.una
poblaciiln es dividir en k subgrupos denominados estratos dc
c) No hay garantía de que las 4 regiones estén adecuaclamentc rcprcsontaclas manera que de cada subgrupo se selecciona una muestra aleatoria de ramaño
en la muestra, pr:ede.ser posible que de una región se cscojan g00 y clc orr. tt¡,í,:1,,2,...,k, por el método de rnuestreo aleatorio simple o sisiemáiico de
sc obiengan soiamenre i00 ó 2ú0 rnodo que

t¿l
rÁñr^^ñ ETAPAS oe¡- ¡uÉrooo esrtnisrlco,
I UTIL.LI) UE b5I i IUA T]ESCRIP'IIVA Y T,ROBABILiDADES
^U¡5
n1 +nz+."+n¡r=n Evidentemente, estos requisitos son muy dificiles de cutmplir, pues en muchas
Existen dos razones importantes para utitizar la estratificación: poblaciones las unidades elementales similares tienden a ñg$uparse.
controlar la Por ejemplo, las personas de mayor ingreso tiendhn a vivir en el nrismo barrio de
representaiiviriarj de la muestra y permitir Ia aplicación de procedirnientos
de r¡na ciudad. mientras que las familias pobres s€ concentr.an en ofiro lugar. Esta
seleccíón diferentes en los distintos estratos.
dlificultad hace que el muestreo por conglomerados rsnga un mayor error de
El número cie elementos seleccionados de cada estrato puede ser proporcional
o muestreo que el muestrao estratificado para el mismo númerú de unidades
desproporcional al tamaño del estrato en relación con la población.
elemeniales de la muestra.
En un plan rie muestreo estrariflcado proporcional, el número de unidades I-as ventajas que nos ofrece el muestreo aleatorio por corqlomerados con respecto
extraídas cie cada estrato es proporcionar ar tamaño de éste, por ejempro,
si ra al muestreo aleatorio son: r.
población es dividida en 4 estratos, siendo sus tamaños respectivos
l0%, z0%, a) Los elementos de lo's conglomerados están próximonrunos de otros.
3a% y 40% de la población y ha de extraerse una muestra de 500, Ia rnuestra
prr:porcional deseada puede obtenerse de !a siguiente manera. ii
b) No es necesario una lista completa de todos los elementos de la pohlación.
Basta tener una lista de los conglomerados.
Del estrato uno: 500 (10olo) = 50 lr.

Del estrato dos: 500 (20%) = 100 ( En el ejemplo 13, como cada colegio tiene 50 alurnnos, ml escoger 40 colegios
Del estrato tres: 500 (300/o) = 150 r,endremos los 2 000 alumnos que se quiere estudiar.
Del estrato cuatro: 500 (40%) = 200
Es evidente de lo anterior que la estratificación proporcional da una V. Muestreo por procedimiento combinado
muestra que
representa el conjunto con respecto a la proporción de cada estrato de la Como las muestras de conglomerados evitan lla necesidlad de fener una lista
población. Este procedimiento es satisfactorio si no hay gran diferencia deiallada de la totalidad de la población que se estudia y evita la dispersién de la
en
hornogeneidad de un estrato a otro. pero no es el procedimiento más eficiente rnuestra y como, a su vez, las muestras estratificadas assgt¡rhn la rcpresentatividad
die los diferentes sectores de la población, se entiende g§,urna combinación de los
cuando las variabilidades entre sus elementos difieren substancialmente
en los
distintod estratos" pues la consideración más importante para el tamaflo de dos sistemas eliminan los 3 grandes inconvenientes del rnuestreo aleatorio simple.
la
rnuestra no es el tamaño, sino la variación de la población, o sea que para En nuestro ejemplo, una muestra estratificada por conglormerado.s se obtendria
obtener
rnayor eficiencia en la estratificación debemos asignar mayor reprcsentación
f1
escogiendo separadamente l0 colegios de cada unr de las 4 'regiones
a un
(4x10x50=2000).
estrato con una gran variabilidad de sus elementos y rxenor representatividad il
a
uno con pequeña variación. Err nuestro ejernplo 13, ias cuatro regiones
11
Habitualmente, una yez que se esccijan los conglomerardos no se es{udia la
las t\ totalidad de las unidades que la forman, sino que se escou,e¡r al azar algunas de
consideramos conlo estratos diferentes, de cada uno de los cuales escogerelnos
t't estas unidades. En nuestro ejemplo, para elegir los 2 000 alumnos, cualquiera de
500 alu¡nnos para completar los 2 000.
Ias combinaciones siguientes serán posibles.

IV. Mues¡reo de congtomerado


consiste en dividir la población en subgrupos heterogéneos represenrativos cie
I Tipo de Número de Alumnos estudiados .Total de alu¡nnos
la I combinación los estudiados
población global. Idealmente. cada congiomerario debe ser consicieracio
como una A 400 5 i 2000
rninipoblación. B 200 l0 2 000
Los principios básicos que dictan mayor eficiencia en er muestreo por C 100 2ü | 2000
conglomerados son opuestos a los usados en la estratificación. En el muestreo por D 50 40 t 2000
conglomerados es eficiente tener: E 40 50 [ 2000
a) Diferencia entre las unidades elementales dei mismo grupo lo más grande
posible.
' b) Diferencia entre grup'os Io más pequeño posible.

2A
TÓPICCS DE EsTA:}is.iiCA DESCR}PTiVÁ Y PE.oE}siLiDÁDE§
ETA.PAS DEI- MÉTODO ESTANISTICO
Á -;¡:^:- i^ ¡^^ -^^..¡¿-i^-
nr¡4rrJtJ u! ru§ t ltu¡tAuvt La distribuciün debe llacerse cn fornra lógica y ordenada,. por ejenrplo.
ii¡a vez obteniria ia muestra y convenientemente reunicios lcs haliazgos, el paso datos sobre ocupación, vivienda, educación y otros reflerentes a las
sisuiente es la geneialzación de los iesuliados a !a pohlacién de !a cuai se condiciones económicas y sociales no deben estar separador
procecie. Dicha generaiización exige 2 requisitos: En general. lla parte superior del fonmulario debc rcscrvñtrse para datos
a) Estimar Ins parámetros de la pobla,-,ión. clasificatorios de iden[ficación (nombre, dirección, área geográfica, etc.)
b) Juzgar sobre la precisión de tales estimadores Considerar couno se ülarán las preguntas. Utilizar el lengeraje simple, sin
arnbigüedades, evitando las preguntas insinuantes, poco explícitas o
I 6 ? á fliseñn ¡lo Enrmrrlarinc i nsu !lc i ente ¡rrr nte esp,ec ífi cas-
Bajo Ia denominación genérica de "formulario" se incluye toda forma impresa Planear córno. se anotarán las respueslas. El espacio que se deje debe ser
destinacla a la recolección de datos, tal como la historia clínica, las fichas adecuado para las respuestas que se esperen, utilizando,el sistema de
epiderniológicas o tarjetas especiaies que a la vez permiten recoger los datos y menor esfuer¿rD.
sirven uara ser computacias. 5. Deter¡ninar Bas caractsrísticas del forrnulario. Para esto vale la pena
Los formuiarios deben ser planeados cuidadosamente, de tal manera que sean considerar:
,ir:l^^ -. que a^^:l:r^-, /-- ,- - )tc
-^^l*^-.^
íea;menlc i¡iirrs y ^..^ Íacii¡tcn (y no dltrcuiterr) la otrtcrrcicn de Ios cialos. Ellos ¿Quién recogerá la información?
deben ayudar a. reüoger la información de manera compieta y eficiente, ¿,De quién scrrri recogido'.)
permitiendo uniformidad en las diferentes observaciones y evitando la recolección ¿Dónde y cuátndo se r.egistrar:á?
ü[ údi0s l¡ ¡citr\'¿1rli(s ¿i esiudio. ¿Cómo se pr'rcesarán l,os datos?
De acuerdo a Éstas preguntas se decidirá sobre la forma, tannaño. ¡naterial.
El formulario debe permitir recoger 2 classs de datos: color, etc. del formulario.
a) Daros aclminisrrativos o de identificación 6. Probar la,rperatividad dei formulario. Antes de que el formulario sea
b) Daros sobre el oroblema que se estudia, irnpreso de manera definitiva, es conveniente probarlo en el terreno
mediante unr estudio piioto para darse cuenta de las fallas que pueda
Los prinreros ayudan a identificar Ías unidades cie observación e incluyen el presentar y trracer las correcciones necesarias.
nombre de la persona. su edad, sexo, resideneia y fecha de estudio. A trar,és de 7. Redactar la¡r instrucciones necesarias. Estas pucden irnp,rirnirse en el
¡lloq n,:eJe ¡ne,.lír<e el renrlimipntn,{pl
v uL. na'c^-"1 j., ¡ü
l^.¡;.r-;k,,^;Á- r^ iliIUti.tj
uiJa¡ rUUL¡Uji UU ^r,......,- mismo formulario cuando no son múy extensas o en ho-ia aparte en caso
t/!¡ru¡¡oi
característisas en el tierrpo y el espacio. En cuanto a los segundos, deben tener un contrario,
propósito perfectamen{e cief inido y ser pertinente al estudio.
I.ó.3 Etapas de Orgnnizacióm de la Información
Elaboreción de! formulario Una vez recogida la irnformación, r-s necesario revisarla cuidadosarncntc 1. lucgcl
Aunque es imposible dar reglas iijas para la correcfa elaboración de un resur¡rirla y presentar:la conveniententente. anÍes de que sea analiz-arla.
formulario, ios siguientes pasos serán de utiiidacl: En Ia etapa de organi.lación se consideran los 3 pasos siguientes:
l. Decidir sobre lcs datos que se recogerán. En esta decisión. es convenienre: l.- Revisión y corre,r:,ción de la información r:acogida.
- Hacer una lista de todos los datos "deseaLlles" de recoger. <ie acuerrio a ia 2.- Presentación de lla infbrrnación mediante cuadros-
finalidad del estudio. 3.- Prcsentación de la información n¡ediante gráficas.
- consitlerar que datos son "lacribles'' dc recoger de manera riciedrgna 1
exacta. 1.6.3.1 Revisión y Cmrrección dc Datos Recr:rpilados
- Limitar los datos a aquéllos "prácticos a recoger,,. [,s rtecesario hacer fiiecuenleIlrente la corrección 0n ¡a orcanizacion de los daros.
- Limitar la información a aqueilo que se usará. Lin corrcctor prre<1e,r:ncOntrar una o vanas cie las Sicr¡ientes co¡a5..¡uC dctrcrran
zi. u€Ciüii
a ñ^^:l:-
soDre el úrden
^^L-^ ^l
--¡:-- - -
elr que
-
se asErriarán ios daios en el lornruiailo. ser corregidas o tratauiias.

22 ¿J
EI'APA5 D[ L I"I ÉTOPCI ISTA DiSTICO
TOPTCOS DE ESTADjSTICÁ DESCRIPTIVA Y PRORARII,IT.}AnFs
4' IL4.¡Lirlu¡q
^ ^^^-:... -^ É] )^--^-i-J-
^^ ucr¡ra§t4uu ---l---- --
¡itsil¿i () !a- flaICa no esta coloc3da
F-recucncia absoluta db un drÍ,): (/¡)
^\ uuu,r üarü
aciecuactamente. Llanraremos frecuenci.a absolL¡t¡a de un valor x¡ de la variabie esladistica X al
'o) Las respuesfas son inconsistentes. cuando una respuesta está en conflicto núrnero de veces quÉ apar€üÉ repetido dicho valor en cl ,conjurrto de las
con otra, \a razón para las inconsistencias debería ser descubierta. puede obscrvac ioncs rca I izadlas.
ser necesario volver al informante. En el cjenrplo 14. Ia lnercuencia lbsoiuta de 68 es 5.
c) Las respuestas son incompletas. cuando se descubre una respuesta sin
contestar, deberá hacerse un esfuerzo para obtener una respuesta. Frccucncia absoluta u,rumulnda de un dato: (F¡)
<i) se necesitan cálculos. si las ciñas son reportadas en detalle, ros cárculos
I-a frecuencia absolulfr acumulada de un valor x¿ de Ia variahle estadística X es
deberían ser completados por el corrector. Por ejemplo, si los informantes
iguai a Ia surna de las; fiecuencías absolutas dc ios valorcs inlbriores o iguales a
reportaran consumo de cigarros en varias unidades de tiempo, tales como
dicho valor. Evidenteffrente, pma hallar la fiecuencia absoluta acurnulada de x¡.
cinco Daquetes por semana, dos paquetes por día, etc.; el consumo Ceberia
los valores x¡, -.. , xn deberán estar ordenados en forma creciente. AsÍ, la
ser calculado en las mismas bases.
fiecuencia absoluta acu¡nuiada dcl último valor será n (dondc it: núnrero de
i"6,3.2 Presentación de la Información mediante Cuadros o Tablas observ¡rc iones realizadlas).
En el e.ienrplo 14, la fnercuenc:a ¡bsoluta acunlulada de 68 es l-1.
Después de la revisión y corrección de los datos recopilados, conviene estructurar
y ordenar estos ciatos rie acuercio a algún sistema de clasificación. a fin cie Freruencia relativa di,e'un daf,o: (h¡)
describirlos o a¡ralizarlos. Esto requiere establecer el sistema de clasificación, así Se clenornina frecuenciia relaiil"a de un valor observado x¡ de la variable X al
como el número de casos o el valor de los elementos que se consideran dentro de cociente entre su frecuerncia abs;oluta y el núrnero de observaciones realizadas (n).
cada clase. A continuación, presentamos'algunos conceptos y procedirnientos y se denota por:
comunes para la presentación de los datos en cuadios.o tablas.
.f,
h
,n --

Rango o amolitud de los datos En el ejernplo 14, la fi'reruencia relativa de 68 es 5/2A = 0,25.
sea x una caraiterística cle la población en estudio que tcma distintos valores
Frecuencia relafiva ar:urnulada de un dato: (H¡)
X1, ... , X¡-
Se llarna fiecuencia relintiva acu¡nulada de un valor x¡ de la variable X al cociente
El rango, ilamado también "recorrido de los datos". es Ia diferencia enrre ei mayor
entre su irecuencia abrsioluta acumulada y el número de observaciones realízadas
y el menor de Ios vaiores que forman la va,-iable esradística X. 1,- se denora por:
(n). y se denota por:

Rango = R = máx{f¡ / i = 1,2.,ic}--rnÍn{x¡ / i = L,2,..^,k}


Ejemplo I4: Supongarnos que las alruras de las plarrras cn una ciase de botánrca
son las siguientes
En ei ejenrpln 14. ia l'recuencia relativa acumulada de 68 es i3i20 = 0,o5.
64 73 68 68 76 70 62 67 1t 69
68 60 65 68 66 68 67 7t 66 72 Propiedades de las frucucncias
Sea n el número tolal rde obse:rvaciones realizadas de la variable X, que toma los
Luego, el rango de estos datos es valores xt, ...,x*. Entr¡nces se rtiene las siguientes propiedades:

R=76-70=X6

25
-q
TÓPICCS DE ESTADISTICA DESCRIPTIYA Y PRCBABiLIDADIS ETAPA§ ÜEL MÉTODo EST.ADÍSTICO

k Asi, la distriburión para eJ ejernplo l4 será:


§1 -
1. f;+ fz+...* fx :)f. =n Tabla l.l: Frecuencias y porcentajes de plantas sn una clase de botánica según
sus alturas.

k
Altura de thlmero
2. ht+hz*...*h¡=In,=, plantas en Conteo de plantas F. hi Hi
Porcen.taje
I'=1 cm. (x¡) r,fi) 100. h¡
60 I I 0,05 0,05 5%
3. F*=n 62 I L 0,05 0,10 5Ta
64 I I 3 0,05 0,l s 5%
4. Hr=7
65 I l' 4 0,05 0,20 sala
r 0<hi<1, Vi=7,2,.'.,k 66 il 2 6 0,l0 0,30 l0%
67 il ) I 0,1 0 0,40 t0%
6. 0<l < n, Vi=1,2,...,k 68 lilt 5 13 a.25 0.65 25%
69 I l4 0,05 0.70 50/§
7. ft = F¡t * f¡, cie donde fi = Ft - F*, 70 I t5 0,05 0,75 So/s

x 7t 2 t1 0,r0 0,85 l0?á


g. Et porcen taje {%) correspondiente a un valor observado x¿ de la variable se
72 I I ¡8 0,05 0,90 5'/o
obtiene multiplicando la frecuencia relativa por 100' esto es,
73 I I l9 0,05 0,95 sYt
''(o/o)x¡=h¿i1oo 76 I I 2ü 0.05 I 5o/o
TOTAL 2A t00

) Observucitít¡ 3.- En una observación re,alizada en una muestra o poblacién se


Distribuciones de frecuencias o tablas de frecuencias de una variable discreta pueden presenllar. los siguientes casos;
a) Que se hayan hecho pocas *¡,ss¡y¿6io,nes y. por lanto. la variable
cuando se esturlia una caraclerística x de ta población, el n-layor interés del estadísf]ica toma pocos valores.
investigador es conocer la distribución de esta característica a través cie ios b) Que se hayan hecho rnurchas observaciones y. sin embargo. la variable
posibles vaiores del mismo.
toma fifluy pocos valores distintos, incidiendo de una manera consrderable
Una distribución de fiecuencias es un arreglo de los valores observados x7,
..',xv
en el estudio de las repeticiones de cada valor,
de la variable X con sus respectivas írecuencias en una tabla de la forma: c)
Que se hayan hecho mu,chas observaciornes 3 ia variable {oma muchos
valores distintos, por lo quue ei campo de variabilidad es muy grande
Valor de X
Los dos primeros casos caerán dentro del estudi.o de variable discreta, mientras
que en el te rcer caso trataremos de agrupar los valores de Ia variable en intervalos
adeci¡adarnenle elegidos frara r'¡o perder mucha información.
.t .:

'l
xpif- F, =n hh Hot= ! I Estructura de una tabla estadística
,(

Yh,=l En toda tatrla rr cuadro estadistico debe cnnsidcrarsc:


Total
Ir.=
i=1
" /-t l.- El titulo 2 - El cuaeiro propiamente dicho
l.- Las indicaaiones complementiarias

26
TO PIC OS DE ES TA D 1 S Ti C é. D E S C F. I PT I V,^. W.'
P R C B AB I L I D A IJ F] S
ETAPAS DEL METODO ESTADISTICO

i.' Tituio.- Es ia inciicación que prececie a ia ia'oia y es colocacia en la parte País I 968 t977
superior de la rnisma (Tabla 1.1). Debe ser preciso, claro y conciso, indicando la 750 850
China
? .
il¡rLutdlcta ucl
-t-l
tEflomeno esruolaoo t¿que/J, las vartaotes escogloas en el analtsts lndia 537 622
Cel fenómeno (¿cómo?), el local (¿dónde?) y la época (¿cuándo?) en que el UR.RS 241 259
fenómeno fue observado Estados Unidos 202 2t6
Pakistán t30 t 5'1
Ejemplo 15: Indoresia I 15 137
Título no recomendable: Japón 103 ll4
"Cuadro que muestra la distribución de las defunciones habidas en el Hospital Brasil 90 I t2
Loayza de L,irna. durante el año 1985, clasificado de acuerdo con la edad v el sexo Nigeria 55 66
cie los fallecidos". Repúrhdica F ederal Alemana 58 6l
Titulo recomendable: Reino Unido 55 56
"Defunciones por edad y sexo. Hospital Loayzalima, 1985"
F'uente: Datos tomados de diferentes documentos e informes de la ONU.
2,- Cuadro propiamente dicho,- Sus elementos esenciales son; el cuerpo. el Nota: [.as cifras están expresadas en millones de habitantes-
encabezamiento y la column a matriz.
a) EI.cuerpo de la tabla está formado por un conjunto de filas y columnas que Tabtasd,c frecucncia para datos agrupados en intervalos de clase
contienen, respectivamente, las series horizontales y verticales cie información.
Es una tiabla en donde los datos originales se clasifican en intervalos de clase. Las
b) EI encabezamiento (referente a la primera fila) es la parte de ta tabla en ra que
razonLx ¡¡ara hacer este t'ipo de agrupamientos son:
se indica la naturaleza ([as categorías, las modalidades de la variable) dei
contenido de cada columna. Éstos, al igual que los títulos; deben ser breves,
a) lEs antieconómico y poco práctico tratar con un número grande de
ü,ttservaciones distribuidas en muchos puntajes.
' pero suficientemente explícitos. Así, por ejemplo, en vcz de poner
b) ,4Jguno de los valores observados tienen asociados una frecuencia tan baja
sirnplernente "Edad" es preferible poner "Edad en años".
r1ue no se justifica mantenerlos como entidades distintas y separadas. No
c) La columnamafriz es la parte de la tabla en la que es designada la naturaleza
rc¡rbc duda de que al totnar como unidad de estudio el intervalo de clase y
(las categorÍas, las rnocjaliciades de la variable) del conrenido de cada fila.
inrr¡ cada. uno de los valores de la variable. nos va a suponer una
:siurrpiificación en nuestro trabajo. pero a la vez una perdida de
3.- Indicaciones complementarias.- con ei fin de que no hayan dudas sobrc el
rrrrformación. Herlros de elegir un núrnero de intervalos que equilibre esros
contenitjo del cuadro, éstas se anotarán en la parte inferior de la rabla. L,as
dns aspectos. esto cs. tlue evite ei cetalie innecesario- perct que nc
indicaciones complemenmrias son: la fuente de inforrnación. comentarios y noras
;:ondu¿ca a la pérdida de mas inlonnacion ia r.¡ue puecia ser
'le
explie ativas.
c.)nvcn ientemente ignoracia.
- Fuente: es el indicador de la entidad responsable cie cioncie se obrrrvieron ios
datos. Elecció,n dc los intervalos de tlase
- l\iotas: son colocadas al pie del cuadro para esclarecimienros de oroen general.
Es acons,ejablc que en cada intervalo de clase se incluyan solamente datos más o
- comentarios: también colocacios al pie dei cuadro. sirven para aclarar minucias
mencs [trolnogéneos. Los intervalos pueden ser:
en relación a las celdas, columnas, filas. rminada arnplitud para
a\ Inlnpt ulos Semiubiertos. F rjando una dete cada
interryalo, se tollarárr tantos intervalos traslapados como sean necesarios para
Ejemplo l6:
recrurbrir todo el rango de la variable, Los intervalos serán semiabiertos (de la
Tal¡la I.2: Fobtación de lo§ paíbes más poblados del niundo, años 1968 y 1917. formp fc; b)). es decir, contendrán siempre el valor inferior. pero no ai

28 29
TOPICOS DE ESTADiSTICA DESCRIPTIVA Y PROb,AI'ILIDADES ETAPAS DEL MÉTODO ESIE»iSTICO
supefior. Por esta razÓn. et extreíno süpeÍici del úitimo i¡-¡tervalo de'oe
Tabla 1.4: Individuos de acuerdo asu
E:enor s igual que el último de los valores de la variable Peso en kilos f¡
149,s;s+,51 4
Ejemplo t7: se ha medido el peso en kilogramos de 30 niños, obteniéndose: [sa,5;59,5) I
24 ; 23 : 22; 28 : 35; 2 1 ; 23 ; 23 ; 3 4 ; 24 ; 21 ; 25 ; 20 ; 26 ; 27 [59,5;64,5) t2
30; 32; 25 ; 26',3 3 ; 34 I 2l ; 3 I ; 25, 3 | ; 26; 25 ; 25 ; 22; 22 [6+,5; 69,5) 4
en 5 intervaios, se tiene 169,5;74,5't 2
Ái agrupar estos ciatos ¡
l TOTAL 30
Valores que caen dentro del Frecuencia (fi) I
Intervalos intervalo I Si Ia unidad de medida que se utiliza en la recolección de los datos es 0,01,
23;22;21;23;2l;22121 7 entonces para determinar los límites reales de clase debemos restar o sumar 0,005
127 24)
la A - Lt
an\, 24; 24; 25; 26; 25; 26; 25 ; 26; 25 9 (mitad de Ia unidad de medida 0,01) a los límites aparentes.
iLa; i
28;28:'29;27 4 Por ejemplo, si el intervalo de clase con límite aparente es 55,57*59,59, entonces
127;301 I
30;32;31;31 4
[30; 33) el intervalo de clase con limites reales será [55,565; 59,595).
351 33: 34; 33; 34;35 6
[33;36)
Marca de clase: Es el punto medio del intervalo de clase. Se obtiene sumando los
b)' InÍervalos con Límites Reules tle Clase. A veces, los intervalos de cl¿se
1
límites inferior y superior de la clase y dividiéndolo entre dos. Así, la marca de
vienen dados de una fortna que no se traslapan, como en el siguiente caso:
clase del intervalo 50 - 54 es

Tabla 1.3: Individuos de acuerdo a su peso' 50+54


_ =.52 fr

Peso en kilos Número de personas (fi)


La marca es. en definitiva. el valor que representa a Ia información con¡enida en
50-54 4
el intervalo de clase.
55*59 8

60-64 t) Regla general para la construcción de una distribucién de frecuencias de una


65-69 4
variable agrupada en intervalos de clase
1^ "1 A
1

Total l.- Determinación del Rango.- Es conveniente primcro determinar el rango de


los datos obtenidos, los cuales se han deñnido por
Generalmente. osre tipo de distribuciones se utiliza cuando los
<iatos tornan
R - mín{x} (para construir intervalos traslapados) ó
= máx[X]
valores numéricos enteros.
R = máx{X} - mfn{X} + unidad de medida (para construir intervalos
Para transformar este tipo de distribuciones a distribuciones de frecuencias
con
sus límites de clase no traslapados)
intervalos de clase traslapados, es conveniente elegir adecuadamente
2.- Determinatién del número de interv'alos de c!ase.- Consiste en dividir ei
de clase, sin modificar sus frecuencias. Estos nuevos límites se llaman límites
rango en un númerc conveniente de intervalos de ciase. generaimente dei
reales de clase'y se definen de la siguiente manera:
mismo tamaño. Es conveniente lener entre 5 ;" 20 intervaios cie clase. Lntrg
Dellnición 5.- El límite real de un intervaio de clase es igual a su valor aparente
rlás datos se tengan. rnás intervalos de clase deben consicierarse. No hay una
(valor que se muestra a la vista) más o rnenos una mitad de la unidad de rnedida
fórmula exacta para calcular el número de intervalos de clase"
uriiizada.
Este número es determinado por tentativas y aproximaciones- Aquí
Ejemplo 18: Los límites reales de los intervalos de clase de ta iabla tr.3 se
al lírnite presentamos dos soluciones para el que se inicia en la construcción de
o"oiendrán restando y sumando 0.5 (mitad de la unidati de rnedida = 1)
distribuciones de frecuencias. Sin embargo, este procedimiento tiende a dar un
inferior y superior, re§pectivamente. Así, lertemos la tabla 1'4'

30 3I
T{IPIC(IS DIi ESTAI)ISTICA DESI]R I}TTIV A Y PROBABI I,iDADI.:S ETAPAS DEL MÉTODO ESTADISTICO
rtúinüío rje ciases úíl fl(jc(i rÍieii()r riel r¡ue se i¡iiliz¡r eri ia ¡iriici icii. i .irs
ií) K=lSO=g'
sni¡ ¡ni¡,nec en refarencia enn'
R 480
a) Nirmer'ocleslases: I( = 5,si ¿ =tanañoele lami¡estra <25y iii)C=K:l-:60
..-
K =.Jn, sin > 25. iv) Tabla 1.5: Remuneraciones de 50 obreros en soles:
b) Fórmula de Sturges:
K=1*3,221a8^n{n) Remuneraciones Frecuencia
Conteo Fi h¡ H¡
(soles) absoluta (f )
Ci¡arrdo ios resuliados para obt€ner f( en a) y b) son núrneros reales con ')
[460; s20) 2 0,04 0,04
decimales, entonces se redondeará al enisro inmediato mayor.
[520;580) lilt 5 0,1 0 0,14
[580;6a0) l»t-tt 7 l4 0,14 0,28
3"- Determinac!ón del tamaño de los intervalos.- Como regla general para
encontrar ta longitud de los intervalos (del mismo tamaño), divídase el rango [640;7oo) tt-nl-tt l2 26 0,24 0,52

de Ias observaciones entre el número de intervalos de clase. esto es, 170a;760) tnt-lw-t lt 37 0,22 4,74

[760;820) lilt-l 6 43 0,12 0,86


R
Amplituti de Clase = C = 4 47 0,08 0.94
Í. [820;880)
J 50 0,06 I
lBB0;9a01
En este caso, todas las clases deben tener la misma longitud, con posible
TOTAL 50 !
excepción del primqr y último intervalo. Esto es para permitir uniformidad en
la comparación de frecuencias de clase.
t.6.3.3 Fresentación de la lnformacién mediante Gráficos
4.- Determinación de los Iímites de clase.- Se debe tomar el resultado numérico
más ba.jo <le los datos originates como el límite inferior del primer intervalo de Los gráficos dan una idea mucho más sintética que los cuadros estadísticos.
'clase. Agregar C para abtener el limite superior de dicha clase cuando se r¡sa Algunas veces su finalidad es simplemente tratar de mostrar a otras personas la
ran[o=n=máx{X}-mín{Xi (agregar C-1 para obtener el línritc evolución de determinado fenómeno, pues mientras que la interpretación de Un
superior de clase, caso que se usa intervalos no traslapados).Luego. se añaden cuadro estadistico requiere ciertos conocimienlos, cualquiera puede comprender
ios ciemás intervalos de clase. fácilmente que una línea ascendente indica un aumento del fenómeno estudiado.
5"- Determinacióu de la frecuencia de clase.- Consiste en determinar el núrnero Al igual que en los cuadros estadisticos, en los gráficos se considera:
de observacii:n€s que caen en cada intervalo de clase. l. El título
2. El gráfico propiamente dicho
Ejemplo l9: Los siguientes datos proporcionan las remuneraciones (en soles) de -1. Las notas explicativas
50 obreros. Escala usada en el trazado de un gráfico
730 47A 67A 820 674 700 600 670 ó10 800
650 700 570 85CI 590 100 570 734 770 580 La mayoría de los gráficos se representan en el "Sisterna de Coordenadas

690 580 760 610 520 680 690 660 72A 860 Reclangulares", aquél formado por la intersección de dos reclas en ángulo reclo-
760 79ü 77A 88r) 940 610 "77fJ 540 930 560 De estas dos rectas, la horizontal o la abscisa se destinará para las diferentes
TA 640 700 460' 680 630 720 840 630 744 clascs dc la variable quc sc utiliza y la vcrtical u ordcnada, para anotar la
l'recuencia.
Agrupar estos datos en una tabla de frecuencias cuyos intervalos sean cie amplitud
Las escalas de medida que se usan deben ser de la I¡isma longitud o algo
constante.
rnayor la horizontal que la vertical. En general, las 2 cscalas guardan ttna
Solución; Tenemos: proporción fle I a I o I a 2. es decir- que si la rlrdenada mide l0 centímetros. la
i) Rango= R = 940.-460 =480
TOPICOS L\5 ESTADI§TIC,T DESCP.IPT'IVA Y i)RÜI]A[JiLii)Ai][:-; ETAPéS DEL MÉTODO ESTADÍSTICO
¿t'sc!s¿ ,ie'i-,e lnrdir- ¿nl!.e iir ,", lri. Fsia *xi:-¡ei:c!a s.c !.iacc uc¡-r e I il¡ rir rii; rectringulo que habrá que levantar sobre el eje de ondenadas será el cociente entre
iislcrsionar el fenómeno c¡ue se esiudia. la frenn¡encia relativadel misrno y la arnplitud del intervalo (Fig. 1.3). El único
cuidadn que debet€nrrse es,queall áreatota[ del histograma sea igual a I, siendo
Represeniación gráfica de variables cuantitativas éste Ia suma total de las áreas de cada rectá¡¡sulo.

I-os gráficos lrás usados son:

i) Diagrarna de Barras
1) Histograrna
j) Polígono de tiecuencias
4) Poiígono iie frecuencias acunruladas u ojiva

I. Diagrama de barras
Esia fcrma .1e represeniacion gráfica es propia cie las disrribucit.rnes i¡ue rienen x
muchas t¡bservaciones pero pocos valores distintos de la variable. lntervalos
Dici.rc, diagrarrra se eiabora cniocancio en ei eje ae ias aoscisas ios iisiinti_,s 1,ai._,rcs Frg 1.3 Frg. 1.4
.
¡e ia.¡ariai:ie. ) sobi"e laüe une ce eiias se ievanta;rna;inea perperidi;utar riir,z.
3. Polígono de frecuencias
aiiura es ja iiecriencia iabsoiura r.¡ reraiiva) de ¡ichi¡ r,,ator iirigura:; i.i -r 1.1;.
a) Si lla variable es drscrera. el polígono dle frecuencias se obtiene uniendo los
ex¡remos superiores de las barras en el ,diagrama de barras (Fig i "5 t,

lntervalos de clase
Fig. 1 1 Fig 12
15
Fig. 1 5 Fig'1'6
?. LXistograma
b, ¡; il¡ variabic csta +jruparir ¡n intcrvak'r ilc clasu. e I pultrunr, d€ trcüutsr)ü!&¡
3s ¡na represenraoión graiicz oe 'Jna iist;ibricron ¡r ..recuen:ias ¡::..::;.1.:¿r :;: se {)bliene uniendu los ounlos rnedíos, ae ias bases superiores te ¿aoe
intervaios cie ciase rnediante una serie iie reciánguios contigr.ius qire IiÉnÉn: rcff,ángulo err el irisrograma ( F¡9. Lti,.
a) Sus bases sobre un eje horizonlat teie rie ias.Y¡ con cenrros en ias ;i:arcas oe +. Polfgono de frecutncias acumuladas u,0]jivas
ciase y' iongirud iguai ai tamaño rÍe ios intervaios de ciase. Esta :-eprcienlacion ¿s .;alida pare variaores Js;adl$icas agrupacas .n ;nl3iralcs
bi Las alturas proporcionales a la frecuencia rabsoiura a reiarivariomacos s0nre ¡e ;lalt.
ei eje de ias l'. l:l e: ¡ir- ¡t las abscisas Írprssenlamc,s .tr irstintt,s inten,aios oe.:lase..¡uy.'l¿i: üs
A veces, conviene más gnficar en el hisiograma ias fiecuencias reiativas en iugar :srar'iiturairtr*nle:ra.siapaiios. Ir: ei íxtr'ünt( sr.lperio:'ie;ad¿.ntslr3,c 'c
de las frecuencias abso,utas. En este üase. la altura correspondiente a cada levanre una verlical Jon altura ;gual a la írecuencia ' absoiut¿r ..; ;cl¡Iira;

j*5
J+
' Toptcos pp esreoisficA DEscRipnvA y pRoBABILIDADES ETAPAS DEL METOOL} ESTADü§TICO
acuúuti¿a, luegc se unen los exr€filcs superiores de las verticales con segmenÍos
rectilíneos. Así, el polígano de frecuencias acumuladas absolutas alcanzará su
máxima altura en ei último intervaio.

x¡-t x, lntervalo§ x
Frg i7
.
Representacién gráfica de variables cualitaiivas obse¡vaciótt r'.- otra modalidad del diagrarnra de rectángulos o de barras es eI
a) Diagrama de rectángulos diagrama de barras dobles. Este diagrama se empka para representar daros de
Se representan en el eje de las abscisas los distintos caracleres cualitativos .v'se asociacién cuyas dos escalas son cualitativas (defunciones por sexo y causa, etc).
levantan sobre ellos rectángulos de bases iguales (que no tienen por qué cslar También se emplea cuando se quiere comparar dos distribuciones de frecuencias
raslapados) cuyas alturas son iguales a las frecuencias absolutas correspondienres en relación al tiempo.
(véase Fig. i.8).
Ejemplo 20: Represente gráficamente el siguiente cuadro esradístico. Ejemplo 2l; construya el gráfico de Ia siguiente distribución de frecuencias
Tabla 1.6: Número de alumnos de la Universidad de Lima en el añcr 1985.

Facultai : Nümero rÍe atumnos Tabla 1-7: I)efunciones por causa de accider¡les y se:¡ro! Lima, I 96 l.
tngenieria Metaiúrgica !0t.r
Sitxo
Causa del Accidente TOTAL
Economia I 5{J(, llombres lbfujeres
Ingeniaria Inciusrrial J I]UU Accídentes de Transporte r r45 232 1377
Ahogamiento accidental 346 q, 438
Contabilidai 8üii
'ia0 Caídas 242 43 347
Derecho
Envenenamientos 58 ñ53 r0t
Ciencias de ia Comunicación 9ilir
ütros accidentes 653 3rl 964
ingeniería «ie Sistemas 40t¡ TOTAL '779
2 444 3 223
Ciencias Administrativas ri0ii
Solucién:
La representación gráfica de este cuadro se ih¡stra en Ia Fig, 1.9.
Solución:
., ,i
La representación gráfica se ilustra en la Fig. 1.8.

36 37
TCFiCOS D; E§TÁDiS?iCÁ DESCRiPTJVÁ Y Pfi.OBABiLiDADES
ETAPAS DEL METCJDO ESTADISTIC('
D-l rrtAgPArna Uc §Cr:rü!-e§"--tr§ UEa ICDrS§§lllaClUll grAllc¿ U§ UII gult!UIILU utr uatu§ il Rango: R=97 -33=64.
esiadísticos en un círcuic. por rne dic de sectorss circt¡lares. Es utilizado
pri::cipaimu:te e'.¡anda se prelende ccmparar cada va-!+r de ia'¡arlable ccn *l ¿otal.
Redondeando al entero inmedia¡o mayor. se tiene k= 7.
Para construirlo. se divide el círculo en seclores cuyas áreas sean proporcionales a
(Si se usa K = r,tn.setiene K = V50 7)
ios valcres ie !a .,,ariable. Esta división es obtenida a ¡ra'¡és de la regia de 3 =
simpie. Total 3600 R64
: :
----+ iii) Amplitud de clase = C =
I ; 9,14
Pane .L
Al aproxirnar l4
9. a un entero mayor. se obtiene C = 10.
Ejemplo 22: Construir el diagrama de sectores para la siguiente disribución de

irecuencias. Para tbcilitar el conteo de ias frecuencias. se loma como el límite inf-erior de la
prirncra clase a 30. Así. la tabla de distribución de l-recuencias es:
Tabla 1.8: Presupuesto del Municipio X de 2005 a2407.
Tabla 1.9: Distribución de frecuencias de la variable: punta-ie de estudiantes en un
Años i Presupuesto (en millones de soles) examen de Estadística general
/tru) \
i ,,,r
luu
006 I Marcas de
i f,
Densidad
2 120
Clases Ft i ir, H,
:00? i I80 I
( h¡
/c) Clase x,
TOTAI- ^10rj [30;40r 4 4i 0.08 0.008(l j_5 r.t.08

[40:50) 6 lo t,

i).12 ü.ü l2(i -15 r)"2(,

Soiución: [50;60) E IE :
().i6 u.0 t 60 ,<5 t,r,-ló

Usanric la regia de :res simpie. se tiene Presupuesto de¡ Muncip¡o X [60;70i i_l il t 0.2ó 0.0260
I
65 t).62

[70:801 1) .1() 0.rI 0.0180 75 0.80


Para2 ot)5: 133 :'f"o'[ ==" ro = eo"
''KH*fftzoos [80;90]
[90;100)
j
J?I
i0
0.14
0.06
0.0 r 40
0.0060
! 8s
95
r)"94
-

Para2t){t6:
i!3 : ?] == x" = ro8'
L*rilffid Izooe
: I OIAL 5(t

?arazt)t)l:
ilfl :'.f.0'j == xo = 1"62' \lüHj{.,. ffi,*, 3i histograrna -,'
poiigono oe irecuencias rsia ir¡ .a .lyura ...(,.
ii polígonr; oe ir':c'¡en:ias ¿ia'.llr:'.¡¡acas ¡e iius'lta *l .a:1i';ra :-L
Su representacion gráfica es:

Ejemplo 23: Los siguientes datos son los punta-ies obrenidos por -\0 esrudiantes
00,io
én un examen rie Estadística {encral.
00..,
tü:c
13 35 -r5 l9' .41 41 !t2 45 41
+., 1ú
+o
iC 52 i3 i4 i: i-' -i7 :9 6(¡ 6C

ti 'n1 'd5 65 65 ro6 66 bG Éi 6E


0) ic
0: _i
69 1i 73 V3 7¿. i/. 76 li Mó 00 D

80 8l 84 85 85 S8 89 9i 94 97 0

O
frrro
GáO
Clasificar estos datos convenientemenl€ eri inrervaios de clase de ia misma oFo
amplituci y construir los gráficos respectivos. o@ro

Solución: Se Íiene: ¡¡sgé!,ae


F{ Lro

l8 39
I"ÓPICOS DE ESTADÍSTICA DESCRIPTIVA Y PROBABILIDADES ETAPA§ DEL METODO ESTADiSTICO

{Intervalos de ciase de tamaños desigilaies)


Obser¡¡¡.eié¡s 5. No Annplitud Densidad 100 x h.
f¡ hi
Es rnuy ccmún e! uso de inier*yalos de clases ccn tamaños desiguales en el empleatios ti th¡lc¡) {o/o)

agrupamienro de Ios datos cie frecuencias, En esios casos, se deberá tomar aigunos [0; 10) 5 t0 0,02 0,0020 Za/o

cuidados especiales en cuanto al análisis y la construcción de! histograma. [10;20) 2ú t0 0,08 0,0080 8o/o

Para construir ia tabla, un primer cuidado es construir una columna que indique [20;30) 35 [0 0,14 ü,0140 74o/o

las amplitudes C¿ de cada clase. [30;a0) 40 t0 0,16 0,0160 760/o

Un segundo paso es construcción de la cclumna de las densidades de


la [a0;60) 50 20 0,20 0,0100 204/o

irecuencias en cada clase, que es obtenida dividiendo las frecuencias relativas h¡ 30 20 A,LZ 0.0060 lZala
[60;80)
entre las amplitudes C¡, esto es. una medida que indique cuál es la concentración 2A 20 0,08 n oo40
0,0040 Bo/n
[80;100]
por unidad de variable. 20 .{0 0,08 0,0020 Bo/c
[100;1a0)
[1a0: 180) 15 40 0,06 0,0015 60/o

Ejemplo 24: Dada la siguiente distribución de empresas según el número de


[180;260) 15 s0 0,06 0,0008 60/o

empleados. sc pide: TOTAL 100%

a) Dibujar el histograma y el pollgono de frecuencias'


b) Dererminar el porcentaje de empresas clue tienen un número de empleacios al El histograma y el pofigono de frecuencia de estos datos se ilustra en la iigura
enue 50 y 90. I .12.
c) Determinar el porcentaje de empresas con número de empleados inferior a 35.
Densidades

Tabla 1.10; Distribución de 3-s0 empre§as según ei número de empleados.

i Número de ernpleados Frecuencia q


fi1
[0;10]
[1ü; 20] 20
[20;30) 35

[30; a0) 40
[a0;60) 50

[60;80) 3ü
?n
[80; 1oo]
[100; 1a0] 2A
nl
AJ
[140:180)
ri
[180;260i
?t( Fig. 1.12

b, ;}ara ,'btene:' Jna .-rr3-lor ¿píox;iriaciori Je; Ji-rrccntaje i3 i'ir¡pr3sa"\


.iüi iicncf'
i'lurfler(r de emp,eaao§. inire it' ; 9L" se JSa ,a ;n;ernr:ta:ior ¡e'
;i. siguien;e
Soluciónl
manera:
Compleiando la disribución de frecuencias^ §e tiene


40
Tcprcos DE rsr,cnisr¡c¿ oEscRrprrvA y pRoBAETLIDADEs ETAI'jAS DEL METODO ESTADIIiITIC(D

[jernp!,o 25r Una determinada especie de anirnal]krt tnamíferc¡s Irene en sada


hembra un número variable de hijos. Se observa d;uttan¡s ,Lin año a i5 támilias.
anotándose el nümero de hijos obtenido por las familfias.

Tabla l.ll: Frecuencias -v Porcentajes del No ¡llr:r farmlillias de los hijos 'Je
mtrn iferos
r

; N" de hijos i No de
2ü% l7Vo 8úlo
(i) h, i rmBxh, Hi
Sea P el porcentaje de empresas que tienen un núrnero de empleados en¡re 50
,_ tn,,_ I familias
i0 0.0571 5l?l ü¡h (_1.057l
y 90, entonces :!
i¡ J 0.085? $1.579; ü. I 428
160-50r r90-80r . l1
ü..4285
F = [\UV
* l' 20o/o * l2o/o + { _ 8olo
10 0.285? li&i,57%,
- ?U/ \IUU _ OU/) ',J 10 0"285? It&i,57q.u ql.7142
P = 1090 * l2ú/o * 4o/o = 260/o .1 5 0.t 429 ildl,l99,o, ,ü.8571

Por tanto, ei 26% rie empresas tienen un número de empleados entre 50 y 90. t, 5 0.1429 X.{1.19t}o

TOTAL j-r lilr )()o,r

c) De igual forma que en b), se tiene


ii ialle ia funció¡¡ de distribucion acumulada de esta naifu:,la r. [Tiflce su uráfica

§olución: Se tiene
r0,0000
I
, x(0
sr
i 0,0571 , 0<x <:
si
i o.i+zs , si Llx
2% \Yo l4o/,, l6a/o
.ri;:.,:=.1i.4285, sillx <3
U,, t*-, s:3lr <+
' c,85;-^ si + 5;l <6
&= Porcenmje de empresas con número de empleados inferior a 35 .
'.';,ü00t .si x>é
-t-\o/a *
,,35 - 30r
'760/¡ = 240/a * lSrr gr'áf rcir rt lt¡ticslra ,:n lA ll,.rura I .l i
= Zq/a 1.40/o
" l+o _ ¡ol
SDia = 32D/n

Luego. el 32Yo de empresas tienen un número de empleados inferiar a 3 5.

Observuciótt 6. Paru un tratarniento estadísiica más rigurosc, de las variat'les


cuantitativas, se acosturrbra usar una definición rnás precisa para la disrribuciór,
de las frecuencias acumuladas. En capítuios posteriores será tratada s¡.1 utlIizacion.

Definieión 6. Dacias tras n observaciones de una variabie ;uantitativa ) un


número real cualquiera. Si ff(r) es el núrnero de observacion€s menores o
x
iguales a x . se llama función de riistribución acumulada (FDAi a la función
iltxl
&(x) = -il

42
TOPICO§ I,)E ESTADiSTI(-:A- DESCF.IFTIVA Y PB.OBABILIDA.DES
ETAPAS nrl MÉrono usrn»lsltco

E-IERCiCICiS a) Después de observar arentamente cada variable. y con la intención de


resumirlas. ¿,córno {-ld. identificaría (cualitativa ordinal o nominal y
'I- deseando me-icrar e! nivel ce sus funcionarios en
Ei Minisrerio de Economia. cr¡aniitativa discreta o tontin,ua) cad,a una de las 9 variables listadas?
uargos iie jciatUra. dio un sursc, experimenui para un grupo de 25 íuncionarios. (Tabla 1.13)
Los da¡os íeferenfes al cursü están en ta Tabla f.iz. Como l¡abía dudas en b) Compare e indique diferencias exjstentes entre las distribuciones de las
las.
cuanro a la adopción de un ünico criierio de evaluación. cada profesor adoptó 3 variables: Derecho. Politica y Estadístíca.
su propio criterio. Usaudo los datos de !a tabla. responda las siguientes. c) Cnnstruya el histograma para las notasde la variable Redacción-
preguntas" d) Construya la distribución de frecuencins de la variable Metodología, y
haga un gráfico para indícar csa disrrjbución.
Tabla l.l3 e) ¿Cómo es el aprovechmmiento de lo,s funcionarios en la disciplina de
Estadística" según la sección a la que etrlios penenecen?

2. Para cada una de las siguiientes variables. indique el tipo de variable que
t -t F ilt-, il8 ';l? ;18 rB iA ,i8 usualrnente es adoptado parñ resurmir los danos en una tabla de frecuencias.
2 1[, i16 ,tX i14":i8 ts C ri] 1
a) Número de botellas de otrveza,cons,un¡idas sn cl verano del 2006.
: ip it6 rl8 :16 ió D B ,lE :, l'i if
b) Valor total de ac,ciones vendidas cada dÍa en el mercado de valores-
4 ,,p llz ,lt in ,16 :D iC ;12 17 c) Nacionalidad de las pers,onas que asisten al congreso.
5 iP llo ;tt,io il8 :A ,A ¡li il8 d) Coeficiente de [ntetigeurcia de los funcionarios de una sección.
; l; iio iit ir? i:o iB ie i,, rrs
tl

i
,^=Lls io
ir i'u--fL1
itit--i lrs ilo- is i:
18 lr1-il!_i? ic i::
i12 rl:
iti
e) liúmero de re spuestas vrrdacieras de aiumnos en una prueba de i 0 items-
fl Porcenta-ie.oei presupuelto municipai apiicado err eriucación-
a ia 0iniversidac ¡e l-ima
g) Estudiantes que han rngresad,o durante ;cs

't'.*l,u l=o ils:ló'¡:i ito B 'c


últimos :§ años.
il lE 15

'"' 'l,l i; rÍ: ;is -".2(t c 'B ,l(' "'i


h)
i)
Provincias del Perú de a,iüerdo a su densidad de poblacion.
rfpinión de los emplead¡os del MinisceriL' de Economía sobre la realizaciÓn
¡o=i.112
i¿ ir
i i ¡16
l,O iiu;io
:¡o ru ', 'Ii
'Ti 14
tr D
;D ;:3 ir,
o no de cursos obligmorios de enrenamiento.
13 iT il: :lBii+ .i4 ts ,c '.',2 ,i? j) Personas enferrnas con sarampión de ac:uerdo a su edad.
11 ir i20 .lf ii8 A '9 :21, l1:; ki Porcenta-ie <ie flallecimiernlos por edades,"
I ,. ;:,--1-ta --1;¿ I;*
",i , 18. :c ,E
:
lu i/*
ii:= i:o l+-
:\4 :.1 i,-A 'itlb .(:i': ;e;ompañt?. Centra; ilectric¿;nctule una,ar.iet¿, ie garantii, JdiL i,
-, -:lliir6
-ilo ,- i:6
1.. 'iE
;i9
,iE;iq.'----'
ii ;r i ,u- i,t I rz I i6
1.. i,^ ',n.
:.{
;D lc i.r,
:^
iro i;: compraoor Jon ;aoa apan'a[ú que proiiucc. .roemás dc valioar ií¡ daÍantia,\
suminisrrar a la comparir¿. ei nornOre y la ,iiirección ciei comprador-'td
::arl'-t?.
lrs il ilz" ils lls llt rc ic ',tz ::7 lamnitn .;uete 18n(i,¡Ira ¡nr'nrmacicn.lu': sr, utiii¿¡.3!i islLlíilí':i.ls mErcaoc'
-lrí i, lr, 'c s 'iz -Ii6"
lÜ_ i,,
i,tt- l: rt
';i
3: ] ñ l, -i i,u
I l¿
,, )i;+
ii i,, !i,s :-fi,
;L

)i ro ¡ ;;e
i ¡) r:
s---*Iri
,,,
i{ {¡--__=___ta
Nombre Estado Civif............(?l

- ,lzz ;i iiz
ii.z ils
itt iil
ii7 li,a
litu rc
!c A
iA ',t2
\,iz iiu
i,o lrx lr¿li:-a ic ic ils Dirección ¿Dónde compro el aparato?.... ...Í1.)..

24 ll lto lls ttr lts lA In l13 118 Ciudad

li.l='izs lr iro lrt i,o l,s le !n l,t iro zona


lndicativo de la ."..¿Porrqué compro el aparato?..... {!l ..

: y Edad (1) lngrresos anuales


el
(*) (P sección Personai" T =,sección Técnico I = sección de Impuestos)

,.:^_ .1-<

i 44'
róp¡cos »e gsrADisncA DEscRiPTtvA Y PRoBABIL¡DADES ETAPAS DEL METoDO ESTADISTICI-I

Se pide detern.rinar:
para cada uno de los espacios numerados de !a rarjeta. derermine las a) E,l rango de los datos b) Númercr de clases
cara*erísticasmásprobablesdelascategoríasqueseránusadasporla c) Ampliturl de las clases d) Disribución dc las frecuencias
e) Histograma y poligono frecuencias de los datos y
compañía para registrar la información' En panicular' ellas
serían; de

a) ¿Cualitativas o cuantitativas? /# tol,gono de liecuencias acumuladas'


b) ¿Continuas o discretas? 6. El gerenre de una compañía registrael nitmero de unidacies de cier¡o rrabajo
ft.espuesta. crtmpleradas por los empleados. cincuenta empleados realizan
el mismo
(l)Cuantitativa y discreta. pues la gente informó la edad de su último
trabajo'divididosendosgruposde25yensaloncsdifcrentes.EnelsalÓnA.
por día:
cumpleaños. el gerente registra el siguienre número de unidades completadas
'
(2) Cuantitativa Y continua
(3) Cualitativa nominal . (4) y (5) Cualitativas
]l 72 20 15 :s
-i t) :8 le lE i0
4" Supongaquesetieneunarelaciónde200alquileresdeinmueblesurbanosy :4 t9 2i i4 iE
iina relación de 100 alquileres rurales' l4 i5 ió il li
, JL r 43 , .14 5i '5('
a) Consrruya los hisrogramas de las dos disrribuciones
/ h, tn base a los histogramas discuta y cornpare las dos distribuciones Én sl salón ts los datos s()n ios slculentes:

Clases de aiquileres Zona urbana Zona rural -:ó


'(
i6

i(r i(, :/, 'li


lz;3i :6 16 -it
40 50
[3; s¡ :6 +-< jl
f <.7r 80 i5 +(r i('
[7;10] ic 5
flecuencias con
at cornbinar todos los punrales ¡- obrener la disrribución de
Uo; ts) 20 0
tamaño de clase C = '1.
To¡al 200 100
br Obrcner la disrribucion dc frecuencias acumulad¿5
r'la distribucion
porcentual acumulada

considere fos daros obtenidos por las medidas de ias alturas


de l0(l inciiviciuos ,flSR.pr"r"nrar gráficamenre las disrribuciones iie fiecuenctas i)blenroas en hi
ídados en cm.) Ccm(, :cnrroi Oc la etica public:laria- se ret¡uiere que tl renJ;r:':lcnlí'
cl' ;illas
por gaión je gasclinz. t]ue :o5 :.abricantes
j,; ¡sai: :or, Íilrs
i5i -152 154 155 158 r i59
'164
i59 r60 i6i 161 auicmóvjle§
::l :iltrsa:
iól \62 163 163 \63 / 165 165 :65 166 ¡uoiicitarios rsie Dasaoo in un Jucn lúmerc ce Druebas er'ecluacas
x66 1ó6 i66 '^67 \61 161 i6i t^6i 68r 168 .:on<iici.lnes. .\]
,lomar .Jna inuesira je :( autollror iies. sE ;cgi5'.:a¡. .as

i68 r6E :69 ':69 gaior: .


168 i68 168 i68 168 i68
jltr 'iiü
siguienres observaciones en milias por

169 1ú9 ló9 169 :69 ?(i i 7ü' : l7(j


:<A r7() 29"3 i 1.8 ¿2.5 34"2 -14.2' 32"i :6.5 26..f j

170 \i{t¿ lit. 1ni


.i i '11 i 111. 111 ",i2 ":72
t8.0 13.7 32.0 28.5 27,5¡ 79.8
\n¡
^l
';i1 :71 \75 iis ! i\ 1','<,
,iu l t.0 i i.6 3i"2 28.1
l/l )tJ itq
i0.0 z&;t 33.2 10.5 27.9 }',^,2 29.5 2E.; 23,0 30.1^/
176 176 71-I :11 i'?1 f ii , l?E 178 t7E
i 1. j
t"
176 1: t¡/
i0.5 24.9 16.8 2e.9 2S.?_l 30.4 I 1.3 32.7 30.3
i79 179 i80 l&ij l8c 181 181 18r i8l 182
i0.6 35.i 28.6 i0.i 10.3 29.6 3i.4 ) L^+
33.5 30.5
182 i82 183 184. 185 i86 187 l8E i9(i :9ü

47
Ád
ETAPAS DEL MEIUI]O ESTADI§-TICO

a) Consttr¡l¡a un hlstOgiama dc frecuencias relaiivas usaii.jo 5 i¡itervair;s tie a) Obtenga una tabla de frecuencias.
'' clase de la misma longitud. b) Trace un histograma y un polígono de frecuencias.
b) I-os fabricanies afirm¿n que su au¡omóvil está diseñado para rendir al c) Calcule Ia cantidad de vigas que tendrá una üonstanle menor que
menos 30 millas por galón. ¿Qué porcentaje de autos en la muestra tiene 6,7lxl00lv1lrl/m. Evalúe también la constante elástica. que nc) debe ser
ese rendimiento? excedída por el de las vigas sornetidas a prueba.
80ozo

I l. Se tiene na siguiente tabla de frecuencias relativas de 30() empleados según su


ó. Comptetar los datos que faltan en la siguiente tabia )i rae€ la gráfiea de la-
eciad.
función de dis¡ribución acumulada.
Edades I 19-ll 22-24 : l-5-17 i zl**:o t 3'l*33
I 4 0,08
hí I o.rs 0,25 0,40 0,10 0.10

1 4
L
ffi.
Hf*
,'.Cuántos empleados tienen edades entre22 y 32 años?
., 16 0,16
Á. 24tl { considerar intervalotltusBpu1!o:L
t 7 CI.14
br i()ue porcentaje de empleados tienen 25 años r: más'l
no
LA
5 5
ñ. h()o.,o
6 38
cl ¿.Qué porcenta-ie de empleados tienen 34 o menos','
45
7 /t l0úozr,
I 12. tJna empresa que se dedica a preparar dietas proyectalanzar Bl mercado una
diera rigunosa. Los en.rpleados de la cornpañia se presentaron como voluntarios
9. La siguiente disrihución muestra e[ peso en gralnos rie 3tl paquetes de un para ,Jicha dieta" Se realízo un muestreü de 80 de díchos empieados eiegidos
determinado producto. aieaioriamente. Los resuhacios dei ;hcqucc, dc los pesas ier, i<g' .*-ucrr-'r"('§
',,§-
i)
.L i rs-re | :o-:¿
'¿x
l. zs-zs | :o-: ; igu ientes

i o,tz i I r( i o,rs 80.6 ó5.§ .19.6 79.'I §9.1 :r.1 ::.9 71.6

r\--
*i3.: 6A.2 , qi.: l4.E 78.6 'b.Z
S L4 56-6 o8.l ¡i .c i 5.6
r'1 ai
a) Trace una ojiva menor que .-5.q :1 ./4 6,1 .9 6j.7 49.e J6.4 66.8 rrl.3 ,¿.-'' .-"(rü
1-, b) ¿Cuántos paquetes tienen pesos comprendidos entre 12 3i 26 grarnos'/ ,88.3 .e4.ó . i7.i 87.i 74"3 73.; 9['.4 7ó.i il i 111

75.6 4 f .8 73.6 7l:.1 óJ"- 6i.4 '99.i 62.3 89"2 86.6


ci) ¿.Cuántos paquetes tienen 27.8 grarnos o niénos? 65"2 6i.t .14.8 82.9 8l .7 1A"4 t'4"6 76-9 85.7 ,10.9

Ce eiasticidad de 35 vigas formadas por lárninas unidas CÜN


j4.2 i:.i 50, i 6 i.; .tz.j 68.ú 56.2 :Ü.8 "i7.3 ób.9
iü.En una prueba
8{J.: 60.2 ? I .6 ;i ,". 91.9 6',.1 8:.; l8.l 5i"; 79"3
adhesivc. se obruvióron ios siguientes yalores de su consranre eiástica (en
MNimt" los cuales se pres€ntan en la siguiente tabla: 5e proe:
a) Elabonar r¡na distribucion de Íre:uencias'
Constante Elástica I i00
. l¡ -Üuantr.rs eiltpleados
iisnen pesos dnre 4: ) oU i(g-'
6,72 6.77 6.82 6.7{t ó.78 6"'.l0 6.67
c; porcenraje cie empieacios tiene pesds mallores que 75.5 kg:i
;Qué
6.75 6,66" 6,66 {r.64 6-76 ó.73 ó.8(,
d) I-a emrpresa promolora c-Usequia uniforrnes ie :raba,ic a los empieaocs
6.72 6.76 6.76 6.68 6.66
voiuntarios. Supol,ientio que ios pesos rie ios srnpieacios voiuntarias ueben
6;76' 6.70 6-78 6"'.',t6 6.67 6.70 6"i2
ser menores o iguaies a 80 kg ¿C¡ántos uniformes deben ser devuettos?
B, /4 §,O r 6,79 6.78 6"66 6"76 6;!2

49
+o
ToPICos ne ssrADistlc"A DEscfi.lPTlvA Y PR.0B'a§ILIDADES

i3. urc ccmpaii: fabricenre de ..,estiios registró ei ti=::':pc en minutcs empleedc


para proáu"i, un vestido «ie mujer. Los riatos' aproximados a ia ciécima cie
MED¡DA§ DE TEñ¡DEñICIA
minuto más cercano. se regisiraron en una disuibución con los límites reales
rie ciase: i5.25; i5,85: ió.ó5; i6.85; |i.35;ii,95 v i8'55' GENTRAL Y DE DISPER§IÓH DE
de la
Derermine los límites aparentes y las marca§ de clase para cada intervalo VAR¡AB LE S G UANT ITAT ;lfAS
dis¡ribución de frecuencias'

14.Las velocidades de los rayos x pararrammiento médico en un Hospital local


2.I:§UMATORIAS
fueronregistradasenmilisegundos(I/l000deunsegundo)yfueron:
La surna de los valores de la variable X: xr,x2,...,x,r se detlne medimrnte ia
tli ú9 l.i 1.7 i,5 Ú.8 0.7 l.i notación "'I" e indica que han de sumarse los elementos de la sucesiÓn ctesde el
0.8 1.0 1.3 0.2 1.6 0.1 0.5 0.7
subíndice i = L hasta el subindice n. esio es.
1.2 l,5 0.8 0,9 0.7 0.5 1.1 1,5
il. i i.4 iJ.7 0.8 ü.6 1.3 1.2 i.4 ¿
l.? 1.8 1,0 L) *,:x1ix2i"'rrn
i.8 0.7 0.9 1.0 0.3 t=1

a)Conslruyaunadistribucióndefrecuenciasu§and(¡intervaiosjeiamañc Ejemplo l;
iJ-25 milisegundos.
§-1
b¡Consrruyaunhisrogramayunpblígonocefrecuetciasapartircielosiiatos. ) t¿ i) =(1 - 1)+(2 - 1)+(3- 1) +(4-1)
Í-¿
=6
Construya una ojiva de frecuencia rei¿'tiva "ma,vor que" a
partir de ios r=l
c)
datos.
.dl Ejemplo 2:
Trace la gráf,ca de la funciÓn de distribución acumuiada' i

15. He aqui una


i, r-^ l:-'
distribución rle frecuencias absoluras y reiativas de los diviciencios
T
L e¡ - 6(2) - 6(3) - 6(4i - 6t5i = 84
i-?
pagarios por acción por 20 compañias escogidas ai azar ce ia iista i€ l¿ 3o;5¿
Nótese que el elemenlo tipico de la sumatoria es una función r-unicatlr,ente del
de Vaiores de Lima. Halle ios datos ilue iaimn'
lndice de !a sumatoria. Si algun otro símbolo aparece en la fórrnulia deI elultlenlt¡
Clases típico. debe considerarse constante.
n a')(
10,00;0,10)
Ejemplo 3:
lo,1o; ü,20) 3
§-
[0,20;0,30)
lo,3o;0,40)
) f,
l-¿
- 3¿+3) =lx- 2+3)+{x-4+3)+{x-6+3)=3x-3
i,.15
[0,a0;0,50) our*.* lu* i es el indice v -r es consmnte.
$,2ü
[0,50:0,60)
[ü,60;0,70) Ejemplo 4: Suponga que se seleccionan n = 5 compariías cervecer¿s rjel tm'tal er¡
ü,00
[0,7ü;0,80) el pars. §us tasas de ganancia. como porcentaje de precio de venüi. som
[0,80; ü,90) respectivamente 12.2. 10.8: 10.4' l2.l -v I1.3. Al rcpresentar simbófiicamerüü esIrls
0,0c
I0,90;1,oot cantidades como
\=12,2, r¿=10,8. 4*10,4, x+=12'7 y rs=11'3

; sÚ,
I
TOPICOS DE ES'TADI§TII]A DESCRIPTIVA Y PR.OBABILIDADES MED!DAS. TENDENCIA CENTRAL'Y DISPEM}-IÓN

555 E.IERCICIÚS
a) Encuentr* b) Halle c) Halle xf !.. Halle el valor de las siguientes sumatorias:
I*,
l=1
;Ir,
i='¡
f
[=1 o6 5
I-
ai fQ'z
';?
+ 3) u¡ cr'
'Ytz'+ 12
Solución:
a
Se tiene fli+z¡'
i=1
,{r-
{-1
a) ) *,=L2,2+ 10,8+1a,4+L2,L+ L1,3=56,8 7 n

i=1 Tsx
al L
"l'L'Yrr'- 3r + s) n .A-J
Trr. ^:l'
5
1r-- 56.8
b) ;)
5/¿
x, =-='--= 11,36
5
i=1 a y.
Suponga que se tiene dos series. x e apareados cormo =igue;
;
c) ¿-¿
\ *? = (L2,42 + (10,8)'z + (10,4)2 -r (12,1)2 + (11,3)2 = 647J4 .r:123.15
yt I 4 6 E l0

2.1.1 Propiedades de la §unratoria Halle los valores de las siguientes expresiones:

1. )
\-.
C = C + C + C+...+C = nC,dondeCesunaconstante ^¡ Zt* - v¡ s1
f¡zx-:y¡ .) {8,)(I,)
i=i
fin
n veces
d) (I,')-(I,)' e1
f(r++¡ o E,--E')(I,)
, §"-
L,
u¿ -"T-
/
*¿
e.nr-u _/ nt
;
\-
3. Si ) x,=28
r§-
n. v
l-) x.2 = 200 . calcule
,L (xi'I¿)=Ir,*ir,
:.alT I=1

b) .\-. +
L\
++
fU,-,
i=l
y¡ * ,) =
r=i
+
Ly¡
í=i
- l_zi
l=l
.at
'
§-
) rx,-2t
/-"
;=i
u)' ftx,-t)2
/¿'
:='l
c) 'tr-
) (x,-1J5)

df'L'f(ox¡-9x,=7)
u.
Éo, * cy¡),=
i,r + ?c
É *,y, - c'ffi
i=1 4. C;;; las'siguientes cantidades para los daros presentaclos.

a)
\- b) \r- - c)Ilx¡
Ejempto 5: Lr,f, Lí,x: +i
4
!l 56
--)
iJ 5q l0 2I 110
n

= (1 .t- 4 * 9'r 16) + C(1 + 2 + 3 Í 4) + LZ


ilO 1l 15 19 2t 26 :8

=10C*47

5l
52
TC)PICOS DE ESTADiSTICA DESCRIPTIVA Y PROBABILIDAI]ES MEDIDAS TENDENC IA CEN'IINAL Y I,}ISFEITSI{}I{

-:.? ivlEtllllA-S DE TENí}ENCIA CF;NTRAr. Ejempto ó: Encuentre la media aritnrética de lars obs*rvaciones: i. 1. ;- 8. 2
Solución: Al sustituin las obsenvaciones en ia f,Jrmula' se tiene
Una,vez ciasificados ios daros originales. cuyas caracieristicas niás esenciales se
desracan. será necesario calcular un üonjunto de indicadores que caractericen en
., f,l'=, x, 3-r4+7-rB+2
= 4,8
n )
forma aigo más precisa la distribución que se está estudiando. lnteresa. en primer
lugar. disponer de estadÍgrafos que represenfen valores cenlraie§ en Iorno a los 1.2..$ Media Ari(nrética - []alos agru¡radns
cuales se agrupen las observaciones. Estos usuaimente se liaman promeciios. y Oefinicióu J: Seatl 11,.{3,.-. xA valores de la variable X ponderados por sus
son de exrraordinaria utiiidad tanto en el análisis de una clistribucién como en la respdctivasfiecuenciasabsoEr.rtras: fr...,,f*.[-al¡rediadelavariableXcsdadapor
colnparación de disribuciones. La medida de tendencia central Se define como k
_ 1r,
MlXl=X=-)
tr
_§:
,Y = ) h,r,
sigue:
- n/-) f¡ro ó
/,_/
Orfi¡¡ición l: l-lna mertida de tendencia central es el índice de localización cen¡rai i=1
empleado en la d€scripción de las distribuciones de frecuencias. También sirve
como una base para medir y evaluar valores anormalmente altos o anormallnenle
donden=I¿
/-" Y hr,.., fo¡ son
las frecu,etncias relativas respectivas

bajos ir, valores extremosi.


Eiemplo 7" Dada la sigrrierrre distribución
1.2.1 Carac¡eristicas del Valor Central
' i¡ Debe ésiar ciefinicio cn forlna objeriva.
x.
a
2) Debe riepender de iorÍa ia inlormación obtenicia en lc' pclsibie.
3) Debe ser fácil de cnmprender tno debe rener un aspeclo absrraclo] ) de
Detennine la media aritmetica
interpretar.
Sotución: l-.;na tnanera practiaa de este cálcunA es la;onstruccion de la siguiente
4) Debe ser fácil de calcular.
tabla:
5) Deber ser estable {no debe ser sensible a fluctuaciones}.
Í
6) Debe ser adecuado a cálculos algebraicos posteriores- Lueg,o, la rnedia arilmét¡ca de estos
1 datos será
1
2.2.2 Tipos de Fromedios 2 b I /, a'l
x
Los promedios más usuales son: 12 ,n 12
a) La rnedia aritmética o media d) La media geométrica 4 I
c¡ i-a rnediana e) La media cuadrática 5 5

tJ La moria g) I-a media armónica rOTAL


Recurerdeque Z¡,=n=12
,=l

2.2.3 ilIedia Aritmética - Da¡os no agrupadcs


iie la variable X- ta media ariimetica Ejenrplo 8: Deternline ia n¡ecira ie ie ciistri-nu;lcn
Definicién ?: Sean K1,x2,...,r,, valores
simple de X. represenmda por i. está riada por
ingresri iamiliar
n t2',4) 18; .0)
1r- s¡t
Lí'=tx¿ miles <ie soles)
X=MlXi=-)
NL
x¿ ósimplernente x=
rL
No cie familias t0 i4
i=L
Solución: Al represenrar los in¡tervalos de ciasr por sus marcas de clase. se tiene
donde n es el tamaño db la muestra o número de e.lernentos del conjunto de
observacrones.

<t 55
J*
-rÓpIcOS MED]DA$. TENT}ÉNCIA CEMTRAL Y DISPERS¡ON
NS TsrepÍSTiCA DESCRIPTIVA Y PROBABII"IDADE§

Marcas de ciases Pruel¡a. .{l usar [as pro¡piedadet de sumatoria. se tiene


)t I ixi

!5
- II=' Iv¡ EL,i(x, t C) _
&f=r /¿x¡ t ILdf
Lz;al 5 _1
m.

[+; s) t0
t4
5 50
98 - Il'.1l,x,'n.1nc - XI=,.[x¿ ,t -
*t-=X=C
[6; B) tl n
[8; 10) I s 11

1l tj) Si fucralr rl.urltiplicadc,s tr dirididos Ios valorcs dc ur¡a varie/hlc.{ por una
[10; 12i J
.i()rlsrarlte 1-'- ,fntonccs B;n ¡lledin de .Y t.[ I t¡uedará rnuttiplicarla r¡ dividida pttr
TOTAL 40 268
esla constantei" esto es.
si y = üx - 7 = nfly'J - /'.fllcxl - cvLxl =
- Ifx, : 268 cN
v --"'
*- - l- A'l
atL hrr
1V
-vt, Pnueba. Se tiene
--
Como el ingreso familiar fue dado en miles de soles, podernos afirmar que el ,, Zl=r[,t, Xi]=,I(cx:) cL;!=rftx, ¡t
ingreso prorriedio deI grupo de 40 fumilias es de S/.6 700. 'ru.nn
7) = hX =C "',
2.2.5 Propiedades de la Media Aritmética
['.n seneral.si, Y
-Y = bN C.
Obserwtcitltt /.- lla media auitr¡eti,ca tiene ias siguienres desvenrajas;
l) La suma de las desviaciones (diferencias) entre los valores de la variable X y al La rnedia aritlnrética quueda fuerternenre af'ectada por 1a preseracia de valores
su rnedia arrtmética i es cero, esto es,
ixtretnos.
k
\_r bi La niedia aniitmética nrr.r puedle calcularse en las disrribuclo,mes que tienen
/fi?i -x) = o inrervalos de clase de e:xtremor abiertos en la primera _u- en la r¡itrtirna clase. es
i=1 ciecir. cuandn los datrys se har¡ ;lgrupado en intervalos de clase '.menor Que" ti
Prueba. Al aplicar las propiedades de la'sumatoria, s€ liene
"maYor qu€'".
trkk ú
, _§-
T/,(r,-i)=FIr,-frL=
L'"' L" .L
nx-x lfi Ejemplo 9: En urna cntpresia donde los salarios tienen una ruedia d,i: S,'. itl .t)0t1. ei
¿=r. i=1 sindicatc, soiicifia¡ que cadar salaric. ,rJ se rnansforme en y- uredianue ra sruuienre
=17X-Xn:0 relación: !' = 2,5X -r- 10ü..
El Cune,ctorio acoge oarcialmenre ta petiii:ion reba-tandt,
?\ Para urr conjunto dado de observaciones, la media es Única, los salarios Proprugtlrt pon el siru,rJlicato en un lQouc" io que es acgptadc. Se picie
La media es sensible (o afectada) por los valores del conjunto. Así, si un valor :alcuiar la media aritrnritisar de la ru¡eva dismrbución de sala¡ios"
.1 )
se rnodifica. la rnedia aritrnética i tarnbién se modifica. Solución.

1) La sulna de los cuadraclos de las desviaciones entre los valores de la variable X


Segun ei dato deii probtrema. se tienr: X = I0 000.
y de su rnedia aritmética X es Ininima. esto es, Corno f =25X -r100===,Y=2,5X r10[' =2,5(10000J, -r101-l =25 100
kk Por tan¡o. el salanio que solliicita el sindicaro es P = 25 100

IL"'It*,' - i)' . Y lt*, -


/-/"'' B)' ,para cualquier constante B El salario propuesto pon el'#irectnriio es
*
Z=y X6q,6f = f,!r'lr. :- Z = Q,gY = (0,9XZS 1001 = ZZ S90

5) Si a los valores de una variable X se le suma o se le resta una constante C. Luego" la media de la nr¡e
'nrm
distrihución rie salarios es 22 59ü.

entonces ia media aritmetica i quedara aulnenlada o disminuicla en ta

constant€ C, esto es.


Si Y:XtC ='+ V=MLYJ=MLX tCl = IvllxliC=X:C
(.,

ÍCFICCS DE ESÍADiSTICA »ESCÑiFTiVA Y PRÜBABiLiD^Dɧ \'lEI)lIIAS.'lllNI)UNC-I ¿\ tl i:Nl'lt AI' Y I )l SPUItSI( )N

B) Segurrdo proceso ¡rhreriarlr¡ para c! ciilculo de la nredi¿¡


A) Primer pro€eso abreviado para el cálcuío de la media
Es¡e nrr.,cedimientc, cs Farficularmenre util para ser aplicad¡ üL[iúlllltlr' Lo§ !¡.nores

Sea Ü, tei origen eie rrabaju) ci vaior más írccuerilc r.ie ia


variabie x tlue cstá
üe .Y Son grandes v la amplituCt de clase eS conslanle. (lrll¡r¡ r,'Cre¡nos- ci ru:§ú) dc

hacia el üenrro de la disrribución eie frecuencias. y' sean


üsle proceso nos oliece rapidcz r" facilidad crl los cálculos'
tít = x,"- Ú, (V i = 1.2,.",k) tas desviaciones de x¿ respeclo a At' enfonces
primer paso. Se efectúa el c¿rntbio cle variable {dc.Y a U}utilizando ia sigtriente
- - Á, -ti
tiirntu la:
Luegc. (),
KN x'. -
nl- = iI
¡ =Lf='-f¡x¡ f¡(di+r,r = ilm dí+ 0¡i7 ",=?"'(1)
dr:nde: x¿ = valores de ia variahle 0, = origen de trahajo '
i{, = v¿10r., transformados. C = alnplitud del intervalo de rtlase
Segun<io Paso. Cálculo de la lnedia ,\ '

De r I ¡. se liene '^ x. = U. i Ctt'


ls-
Ejernpit lu. caicuie ia meriia de ia siguiente distribución de irecuencias:
,tL" i,x,=-n
Hntonces.V=-)
I
f ito, * úu¡ ) =
; tI f¡07 - cE r,,]
I66;6?:68 7t)i71 i12"73"16
r;ffi
.q.lturas;rri i60 |62t,64 65

'
Por tanto.

x = o:-. (L*) et
Solucién: Tomando e I origen de trabajo 0r = 68' se tiene

Ejernplo I l: La tarifa por línea de publicidaci en Jzlg periódicos en prtlbiaciorres iie


f, di f,d, :5 00() a 5(¡ 000 habitantes en los E.stados {,nidos es:

o -8 Tanía por ltnea e¡¡ ¡ióia;es


60 1
,1
-6 :tt.01:ü.ú2
62
I -4
"o
-4
d,=x,-68 ¡0,02;ú,ü3
64 10,03; 0,04

X =O,** t
65 -3 -J [0,04; ú,05;
1
f ,d, +()
bo 2 -2 -4 [0,05r0,06r
-1 -2
n io,o6; o.ozr +5
67 2
JJ
68 6 0 -27126 /-r\ [0,08r 0,09r
25
69 1 1 I =68+l-fl=67,95
\- 20 / i0,09: ü,10;
70 1 2 ¿ i0.10: ü.11:
71 2 J 6 [ü,rt:Q.rz,
72 1 4 4 i0,i2;0,13,
5 5
[0.13:o,i4i
73 1

76 1 I I
TOT 2A "1

58
róncos DE EsrADisrleA DEscRrPrlvA Y PRoBABILIDADES }I I]I)I DAS I't]NDI:NCI iN CI]NI'[{AL Y DISPE ITS I()N

Fialle ia iarift Fronredio por lí¡iea ,ie puhiicidari []efinición .[: scan x,,N",...,x, Iui nleciias :rritllrr{ticas de r subc.rr-junios
n'rlenores. cada un«r corl ..., 10 rlbservaci0nes. respcctivanlcntc. La nledia
7¿r ,17¿,
Soiución:
ponderada dcl conjunto fbnnado por lci térrninos de los r subcon-ir.rnros
En es¡e eas§, !a amplitud de clase es C = 0,01. Para e! valor de O. nrrprlp
car
es dada
por Ia tiirnrLrla
t¡iilizada ccrrvenierrtemente eualquier marca de clase: 0.015: 0,025; 0,035" e¡c.
Para nuesro caso elegirnos or = 0,065' Entonces se tiene nr.[, + nrñ, + ... + n,.X,- Li=rn¡x'
xt,
nt+n2*...r11.r. n
íiut

[0,01; ü,02]
.,
0,015 -5 -10 d unclc ,, : LIY,,.
[0,0?;0,03i 4 0,025 -4 -16

[0,03;0,04]
)? 0,035 -.1 -69 En general. si pr,r'r,,..,pr son los pesos asociados a los valores de ia variable
JU ') -60 "f :: r,, x2. ... , rr" respectiva¡nenle: entonñes la nledia ponderada es
[8,04;ü,C5i
40 0,055 -1" r'"1 -40
[0,05;0,06i -
..p E',1=tPtx,
[0,06; o,ú 7] 4q 0,065 n I res¡:rs i
Ii=, P,
35 0,075 L 35 Eliemplo l2:
§u.rpongaruos que en una cliudad en parricular hay dos precios de pan:
[0,07;0,08i
')c, 0,085 2 tü.'08soles en lcrs supennercados que venden l0 000 unidacles,v 0. I0 soles en las
[0,08;0,09]
fAnñ.nan\ u/ LL u,uvJ J ir'nnaderías qure venden tr000 unidades. l-llalle el promedio ponderado del precio
i u,u7,
u, r
del
v +
[0,i0; 0,11i CI,105 F,An-

[0,11; 0,12] 6 0,115 §olurión. Al aplicar la lórmula de la media ponderada. se riene


[0,12; ü,13i 0,125 6
r.0
ú _ l(10 000.i t
(0.0E (0 1ü,f (1000,1 900
" [0,I3;0,14i 'J 0,135 '{, =ffi= tiooc=S¡/' 0,082
[0,14; 0,15)
f 0,1.45 I
9 Feir tanto. el precio prom,edio del pan es dle Sl^ 0.092.
[0,15; 0,16] l 0,15 5
? n tÁ( 1n Eje mplo l3l Si los porcenrajes de mujer,us en 3 escuelas son:
[0,16; 0,i 7]
t¿u
lEscuela i N" de alumnos ] u, .t. mrtrjeres

Portanto, R = o," ?
_ tI ñu,\
Cl2:::L I = 0,065 + 0,o1lZ%J
r120r A .48 5ü
B
\n¡ 6ü 7fl

Ü,065 + 0,0Ü41 = 0,0691 C - i(l 4ti


=
2.2.6 :}ledia Fonderada Flalle el porcenmje global de rnr.tjeres e,il las tres escuelas.
ri-lay ocasiones en que se quiere cxpresar ¡lt un¿r soia ciira los rtsui"aocs ie varics §olución. Ai aplicar [a fórmula del pronnedio ponderado" se riene
grupos iie datos" caria uno cie los cuales ha sirio resumidc' previarnente rneciianro un (500/o)a8+ (70%u)(60) + (40%)(30) 7800
'tas
promeciio. Tai es ei caso de muestras estratificarias" en ias cuaies se caicuia uri .rp =
promedio para cada sslrato. En dichas ocasiones- ei promedio generai para ios
48 -r 6o + rü l:g- = 56'5'/o
diferentes grupos no se obtiene promediando los promedios parciales. sino que es Luego. el porcerrra,ie global de mujeres erlt las lres escuelas es de 56.5ya.
-
necesario lener en cuenta el número de observaciones en que se basa ;ada
promedio. Tai promedio recibe el nombre de media ponderada -v es deftnida comc'
sigue:

6{¡ 6l
ToPico§ i¡e r'sra»is'licA DESCRIPTIvA Y PRoBABILIDADES MEDIifAS. TENDENClA CENTRAL Y IJTSPIERSION

2.2.? l,,!*diana E.iemplo [6r Dadas las distribuciones de fiecue¡ucias


Definirión 5: La mediana es un valor que ciivide a utr conjunto de observacioncs
a) hr
ordenaclas en forrna ascendente o descendente en dos grupos de igua! nÚrnero
de
5
observaciones. La ¡io¡ación que se emplea es
l0
X : MedlX): mediana l5
8
En el cálculo de !a mediana. se ccnsidera lcs 3 ce'sos siguientes:
2
Caso I. La variable en estudio es discrera yn (número de c,.¡servaciones) es
impar. En esre caso. ia mediana es el valor cie variable que ocupa la posición
la

media (rango de orden T) Halle sus med|iianas respect:iv,as.


Ejemplo 14: Supongamos que el'número de casos de ciena motestia eh I os meses Solución
de julio de los últimos 7 años fueron: 52;41 37;82;24:, 63;68 {n = ¡'
7
a)
Ordenarrdo estos valores de acuerdo a su magnitud' se tiene
n= !1(númeroin,lpar).
,N¡
Lue¡glo, i se¡á el val.or clue
?4; 3'l ; 41; 52 63; 68: 82 I i oLurpar Ia posición
n+L *n*\ 7 +!
il valor que ocupa el rango .t Z = = 4to
1
n -t.lr 11 + 1
? J- ccntiene el -T-=--=6to'
J 5 ** I
óto elermento
Luego. la mediana de las observaciones es X = Med(X) = 52 casgs ) i,
I
4 Parm. iidentificarlo, se calc,lja
caso 2. La variabie es discreU y n lnrimero de observaciones) es par. En este la c,;ol¡lumna de frecr¡ancias
ac,ur-uruladas.
caso. no existe en la ordenación un v¡lor de [a variable que ocupe la posicíÓn

ceniral. esro es. la mediana es indeterminada, pues cualquier valor cornprendido Por medi.m, de estas ÍÍecucncias acumula.das sÉ ,&ncuentra eI valor ixi)
correspor'ud irente a [a mediana. En esi,e caso, dir;ho val]rrrr es
enrre ios valores que ocupen ia posición 1 puede ser considerado colno ei
2, i* .i=,tr¡cd(X)=3
ceniro de ia ordenación.

El problerna es resuelto por una convenCión que cOnsiste en tomar como mediana b)
X¿ f, Fi
de la ordenacién la ntedia aritmética de los valores q.ue ocupan las .losiciones
87 5 5
ña
v . -j- 1.esto es
-2',¿ 85 l0 15
o/ l5 '30 { ronf iene, los elementos 21"'o
,,, i¿4rávoj
XniXn 89 8 38
[
. ,
/t-
v_
z 90 4 42

Ejenrplo 15: Considere las observaciones muestraies 24:37:41: 82; 681 t53. TOTA[- 42

Arreglando estos valores en orcien creciente. se tiene: 24 3'l 41:63;68;32'


n: 42 (nrnrmero par)" Luego, la mediana es, pmr[' convetrciór¡. la media
Los valores que ocupatr las posicionet I y I + l" son aritmética ,ítrh los valores que ocupan lars posiciiones

n6rt6 _ ,Z n42 n
-l=.1 =3rO v =¡1=:*L=4tO = ill:lavo y -+ I - rra\ro
2 Z 2 )') 2

En este caso la mediana es e[ valor enrre 41 y 63, esto es. i = 1{g = SZ

62 bJ
TÓPICOS DE ESTAD¡§TI{]A DESCR.IPI,IVA Y PR-OBAB¡ I.IDADES I!,1 [.DI DAS,, TENDEN.¡C IA CE NlIRAL Y DI5 P[RS IÓN

Cü¡l.iü €r-i ia parte a), se irientifit:a ios eiemenios dei orden 2i *y 22 por iz Clases
fieci;eticia acuinulada (F, ¡.
[35; a5] 5 5
Así: 2l corresponde al valor 87
[a5; 55] t2 t)
22 corresponde al valor 87
I8 1r clase qrue contiene a la
Luego, [5s;65i JJ

+87 ¡nediana (29vo elemento)


- 87
u-ñt
-2 [6s;75] tá 49

[75; 85i 6 55
Caso 3. La variable es contin¡.ta. En este caso, el problema con§iste en determinar
un punto dentro del intervaio en el que está comprendida la mediana. [8s; 95] 3 5E

ler. Paso; Calcular la posición de ordetr Como la variable es coniinua, no se TOT,AL


|.
debe preocuparse si n es par o llnpar.
2do. Faso: Por las frecuencias acumuladas se identifica la clase que contiene a la n58
mediana, esto es. la clase para la cual se cuniple
Paso 1,
i= Z - ?'g'a posición

Paso 2; Se identific;a la clase que contiene a la ¡nediana por la frecuencia


n
Fr-., S;¿ _ Fr acurnuiada. eE[o es, a lravés de [a desigualdad:

Co¡ lo euai ia lnediana estalá en ia clase que tiene como írecuencia acumuiada F¿' Fz = 1.V <29vo < Fs = 35

3er. Paso: Litilizar ia fórn:ula: En este caso" Ia clase que contiene a la ¡ned[ana es la tercera.
/1 Paso 3: Se ap[ica la fl}nmula:
^-
--J ,
Lrned
l¡ '(-i\
, tru*rr;j 'cmed.... (3) . donde
/\_o 'k-n \
,
a Lmed. 12
límite inferior de la clase que contiene a la mediana - I f_ - Il'Lr,rd
= ^=
lmed
n = iar¡año de la muestra \' 'o''/
Cmed = arnplitud de la clase que contiene a la mediana Al reernplazar los da[os en la fórrnu[a, se o'b'ltiene

Fr = frecuencia acurnulada de la clase que contiene a la mediana tZ9 - l7."


Fk_r = frec¡-¡encia acurnuiada de Ia clase inmediatamenle anlerior a la ciase que
i = 55 " lr= ,r¡',a =
61,67

conliene a ia nlediana
2.2.7.1 Propicrdades de la &,Iediana
Ejemplo 17: Dada ia disrribución: k¡(

all rei,ésr i) I Ii*, * Xi < E f;lr¿ - .4[ para au;alquier observación A del coniunto'
i

\ f, i 5 , tz i 18 ¡. i4 | a 3 ,
2) La fórmuLa (3) em uérminos dc las frecL¡'encias relativas acumuiadas es
- lr
- lT-ñt-r, \i
Halle la Ilrediana R=tu,o¿+l*lC^ra
t*-'/ -
\fn
Soluciónt
3) Como [a nnediama depende del número de valores observados, entonces está
Se tiene
afectada por las obsena,Ciones y ilo por el tamaño de los valores extremos.
4) La mediana es 'u.n val,or muy atlecuado cuando se utiliza para describir
distribucio.nes cury,os valores c€nlrales estiín muy próximos.

65
' róp¡cos or esrADisrtcA DEscRrprrvA y pR0BABTLIDADES
M EDI I]AS, T[ NDENCI,\ C[]N1'RAL Y DI §T¡ERS IOI\J

e ft, + ñs = 0,60 ... (4)


5) Algunas veces es un valor nrás represen¡ativti dc urr r;orrjunto de datos que k
§-
otros promedios, gracias a su independencla de sus valores extremos.
Lh,*, = 7,9 e 0,03 + 0,35 + 5,5h3 + 1,20 -t i,5h5 + 1,15 + 0,27 : 7,9
6) La mediana se puede calcular aún cuando los intervalos de clase de la ¿=1

distribución de frecuencias son de límites abiertos. e+ 5,5h3 + 9,5hs : 4,9 ... (s)
7) La mediana no es adecuada para manipulaciones algebraicas posteriores, o sea,
Al resolver las ccuaciones (a) y (5). se obtiene
si z¡ = x¡ + yr , entonces no siempre se cumple = * i i i.
hs=A,Z Y hs=0,4
-
B) La suma Xilrlr¡ Cl es mínima cuando C es Ia mediana de xr, ..., rn,§sto es,
r-G Al reenrplazar los daros en la fórmula de la mediana

Ejemplo 18: Una distribución de frecuencias sobre notas de estudiantes


Matemática I presenra las frecuencias relativas l.6yhs borrosas. Si se sabe que la
de
i=t,n"d_(*#;r^,,
media fue de7,9; determine la media¡ra de la distribución.
se tiene

Notas del estudiante


Ns de estudiantes
Frecuencia relativa (h;) x = 8,5 -
I +-0,48 \ e,s r- 0,10 :
[ Oás _ oa' lz =
8,6
Í0,5;?.,sJ 0,02 \/
i2,5;a.5) 0,10
la,5;6,5) 2.2.8 Cuartiles
[6,s;8,5) 0,16
[8,5; 10,5) Definicién 6: Los cuartiles son valores que dividen a un conjunro de daros
[10,5;12,5) 0,10 ordenatJos en forma ascendente o descendente en cuatro partes iguales (Fig. 2.1
),
[12,5;1a,5) 0,02
[t+,5 o más 0
0% zs% s0%
t
Solución¡ Al usar la formula para la media íX) en rérminos de ias frecuencias
relativas. se tiene
kk
f = Lh¡x¡ = 7,9, donde Ln,
-§a§-
Q, : ler cuartil, deja el 25% de las observaciones menores o iguales a él y el
= 7

t=1 í=1 75Yo superiores a é1.

Al completar la distribución de frecuencias. se tiene Q7 = 2do cuartil, coincide con ia mediana.

h¡x¡ Q¡ = 3er cuartil, deja el 75Yo de las observaciones inferiores o iguales a el y el


[0,5;2,5] 0,02 1,5 0,03 0.02 257o superiores a é1.
12,5; a,S) 0,10 1§ 0,35 0, l2
Ía,5;6,5) h3 {< s,5ft3 0,32
(Fig. 2.1)
[6,s;8,si c,76 r.20 0,48 i

18,5r 10,5) hs o§ 9,5hs o,s8+- ciase que contiene


a ia rnediana
Los cuartiles solamente se utilizan para datos agrupados en intena¡os de
[10,5;12,5) 0,10 i t,5 t,l:§ o.e8 i clase. Las fórmulas para la determinación de los cuartiles Q, y Q, son
[12,5;&,s) 0,02 0,27 I
semejantes a Ia usada para el cálculo de la mediana.
[14,5 o más 0

Luego, Determinación de Q1
\-r
) h¡= 1 (- 0,02 + 0,10+h3 +0,16+h5 + 0,10 + O,aZ
67
66
TOPICOS DE ESTADISTI('A DESCRIPTIVA Y PROIJABILIDADES M E Dl DAS, Tf:N DI:-NC I A CENTR l- Y t)lS PIIRSION
^
Io, = líntite inferior de la clase que contiene a Q3
br Paso: Se caicula -.
+ ¡r = ta¡laño de la mues¡ra
2do Paso: Se identifica la clase que contiene a Q, por medio de las frecuencias Ce, = orplitud de la clase que contiene a Q,
acumuladas, esto es, por la desigualdad
4 = frecuencia acumulada de la clase que contiene a Q3
Fr-,. I
IL
1F¡, F)-r = frecuencia acumulada de la clase inmediatamente anterior a la clase que
+^
conliene a Q3
3er Paso: Se apiica ia fórmula
ln \ Ejemplo I9: Dada la siguiente distribución, determine los cuartiles $ y Qz.
Q,=!e,.(ffi)rr, ó
lntervalos de clase I [6;16) [16;26) Í26;36) [36; a6) la6; 56)
'/!-, f
\ lt B 2A 2S 10 5

n --t "Qr -l' 4 "r-t 1"


vt
(Cuandoseusafrecuencias acumuladas
\ ¡l* - Hr-, l"Q, relativas) Solución: Al calcular las frecuencias acumuladas. se tiene
\/
donde: scs
le, = Iimite inferior de la clase que contiene a Q1
n = tamaño de la muesrra
Cla

*)T I

o
Fi

I
28* clase que contiene a Q1
fr6;26) 2A
F¡, = frecuencia acumulada de la clase que contiene al primer cuartil
Fr-i = frecuencia acumulada de la clase inmediatamente anterior a la clase que
126;36) 25 si._ clase que contiene a Q.

contiene a Ql [36; a6) 10 63

Coi = u*plitud de la clase que contiene a Q, Ia6;56) 5 68

Dererminación de Q3
n68
3n ler Paso.-
44 ,r" tl=61vo
1er Paso: Se calcula
7.
2do Paso.
2do Paso: Se identifica la clase que contiene a Q. por medio de las frecuencias
acumuladas, eslo es, por Ia desigualdad: Corno F, = 8 a A = 17 1 ZB = Fz,entonces el intervalo declaseque contiene

3n a Q, es íto:2il.
F¡-rS (J>k) ll
+<F¡ 3n
: 51( 53 = Fr, entonceslaclasequecontienea
ComoF, = 28 < Q3 es
3er Paso; Se aplica la fórmula T
/3n r\ 126;36i.
Qt=tQ,-{=rj-ir* i- o
I
3er Paso: AI usar las fórmulas dadas para calcular Qr Y Qs, se tiene
\'/ )Lo' \
/L_
/1-u \ Q, = te,. =16+ (**)'o = 16+ 4's = 20,5
Qt=iQ,.¡ffi)rr, (cuando se usa frecuencias acumulacias
reiativas )
(á=H)'0,
donde:

69
68
ToPICos rE esrADisrlcA DESCRIPTIvA Y PRoBABILIDADES MEDIDAS, TENDENCIA CENTRAL Y DISPERS]ON
/'1r,
¡-'" f
\I -?t añ.
H+ = 0,96?5. Luego, 96.25% de ros esudiantes tienen menos dc 27 ailo,s.
'_--¡¡.-i ¡ /Ja-¿o\
Qt = iQ,-¡ { ffi }to, = ze * (ffi) ro = ?6 + s'2 = 35'2 c) En este caso, se debe carcular el primer cuartil (01). Ar aprican ra flér¡nura" se
\ " "'/ tienc

De acuerdo a esios rcsultados, podemos afirmar que en e§ta distribución se tiene


Q,=te,"(k)*,=ra+(ffi)s
35'2 = L8 * A;957 = 18,957
6 Qr = 20,5 Qz = 28,4 0s = 56
Por tanro, la edad que es excedida por el 7s% de los estudiantes
es lg.g57-
E.iemplo 20: Suponga que la distribución de las edades de 80 alumnos de la d) La edad que supera a ras edades de 75g'o de estudiantes corresponde
ar varor
Facultad de trngeniería Industrial de la Universidad de Lima es dada por del tcrcer cuartil. Al aplicar la fórmula, se tiene

13n'\
: n. (ffi)t
Clases fi Fi hi H¿

[rs; rat 5
.0,5875
Qz = tQ,. (
f¡#
\'/ ,-, /)ro,
'

[18; 21)
a,s25 = 2'J. + 1,091 = ZZ,O91
121,;2a)
Luego, Ia edad que supera a las edades del 75yode esrucliantes es22,}gi-
L2+;2vI
lzt;lol 0,0375
?.2.9 Deciles
TOTAL BO

Deñnición ?: Los deciles son valores que dividen a un conjunro de datos


Se pide:
ordenados en forma ascendente o descendenre en r 0 panes
a) Completar la tabla. iguaies {iFig. 2.2}.

b) Interpretar ft,F+,hzY H+.


c) Estime la edad que es excedida por el 7Sck de los estudianfes' 0% l\a/o 20o/, 30yo 40y§ 5}o/o 6A% 80Yo 9}o/a [0091o
d) Fialle la sdad que supera a las edades delTSYa de estudiantes'
Solución: Di D2 D3 D+ Ds D6 D7 Ds üe
a) Ai completar la disiribución de frecuencias. se Iiene
Dr : ler decil, deja el r0% de ras observaciones rnenores o igualesa éi"
Dz = Zdo decil" deja el 20§/o de ras observaciones menores o iguales a é!
r 0,062 5 0,0625
[15; 1Bi 5 J

[18;21]
A1 52 0,5875 0,65 -+ ciase que contiene a Qt Ds = 9no decil, deja el90yo de ras observaciones menores o iguarcs
a ér y er
121,;241 22 t+ 0,275 0,925 -+ ciase que contiene a Qt l07o superiorcs a é[.
3
'1'l 0,0375
LZa;27)
.)
127;3ü1 J 80 0,0375 i Fis.2.2
Para determinar los deciles, se siguen los siguientes pasos;

ft = 2?: Hay 22 estudiantes en la muestra que tienen entre 2l años y 24 años.


;
F+= 77'. Hay 77 estudiantes que tiene menos de 27 años 1er Paso: Se caicula *10 , dond" i= !,2, ....9
hz= A,5875: 58,75% de esrudian¡es tienen edades mayore§ o iguales a 18

años y menores a 2l años.

7t
l
TÓPIco§ DE ESIADI§TICA DESCRIPTIVA Y PROBABILIDADES MEDIDAS, TENDENCIA CIN'TRAL Y DISPERSION

2dc Fasa: Se identifica la ciase qiie cor¡iie¡ie a fr¡ prtr medio de ia frecuencia 3er Paso: Se usa la fórmula:
acumulada, esto es, a través de la desigualdad /i.n ^ \
Éi_rS to<Fu
i.n P¡'t,¡-[ff-¿.
ñ ¡ /fO6-1ur-rl
u-r,/f
c',
\
3er Paso: Se aplica Ia fórmula: donde:
/í'n - \ lp¡ = límite inf'erior dc Ia clasc que contiene a P¡, i: 1"2,3, .",95
r)¿ = ra,"
Ip=p
' I r*-r*-t ic,,
I '
n = Iamaño de la muestra
\/ Cp¿ = a¡nplitud de Ia clase que contiene a ft
donde: Fr = frecuencia acurnulada de la clase que contiene a fl
Ir, = límite inf,erior de la clase que contiene a D¡, i= !,2, ...,9 F¡,"_t = frecuencia acumulada de la clase anterior a la clase que contiene a ft
n = tamaño de la muestra
Ejemplo 2l: Determine el 4to decil y el 7Z"o percentil de la siguiente distribuciÓn
Cp, = amplitud de la clase que contiene a D¡
de fiecuencias.
F¡. = frecuencia acumulada de Ia clase que contiene al i-ésimo decil
Fk-r = frecuencia acumulada de la clase an¡erior a la clase que contiene a D¿

2.2.10 Percentiles [a0;50) B I


[s0;60) 20 28
Deiinición 8: Los percentiles son valores que di'riden a la muestra ordenada en [60;70) 30 58 +- Clase de D¿
forma ascendente o descendente en 100 partes iguales lFig.2.3). 4A 98 e- Clase de P:z
[70;80)
[80;90) 10 108

[e0;100) 2 110

Pr percentil. deja el i% de las observaciones menores o iguales a él Solución:


= i er
el 99ok superiores a é1. Cálculo de Dn: Cálculo de P72:
,v
ler Paso: ler Paso:
i.n 4xi10 i .n 721100)
99'vo percentil, deja el99o/o de las observaciones menores o iguaies _=_-:__-_-:=79,2
10
----44 10 100 100
a él y el i7o superiores a é1.

2do Paso: Se identifica la clase iie Dn y P, por medio de ia columna cie ias
Fig. 2.3
irecuencias acumuladas, esto es.
Para caicular ios percentiles se siguen ios siguientes pasos: Fz : 28 < 44 <58 = F: Y Fz = SB <79'z( 98 = F¿

i.n 3er Paso: Para Dn, se tiene


Ler Paso: Se calcula ;:^,donde
. i = 1,2,...,98,99
100
2do Paso: Se identifica la clase que contiene los
sea, por rnedio cie la siguiente desigualdad:
fl por [a frecuencia acumuiacia. o
D+ = tor*
(##) con = 60. (##),0
;^
Fr-rSlOO<F* = 60 * 5,33 = 65,33
t7
72
TOPICO§ DE ESTADISTICA DESCRIPTIVA Y PROBABILIDADES MEDIDAS, TENDENCIA CENTRAL Y DISPERSIÓN
Dara /D , cafiané
t .¿^$ Clases Fi
J¿,

/72n F.t-' \ 0; 94
i #- \ t79.2 --F¡t
P-"=l^ +l^'"*.¡, _ b.x_t lC.
. ¡¿ _,.r, ,r, =70*l-+110
\ 9g _ SB )
[30; so) ?.34
\\/ I [s0;70) 394 <- clase de Prs
[70;90] 492, e- clase de Ps5 y Pr5
= 70 * 5,3 = 75,3
[90;100) 500
Pcr tanto, en esla distrib¿:ción el valcr 65,33 divide la muestra en dos partes; una TOTAL
parte con el 4ü% de los e lernentos y la otra son el 6A0A de elementos.
El valor 75,3 indica que el 72Yo de la distribución está debajo de él y el 28% es ler Faso:
superior a é1. i.n *iOOj
65(500)
Para Fur'
i¡T= = gZS
Ejempio 22 üna empresa
decide hacer un reajusre €ntre sus empleados. La
i.n 85f500)
clasificación se lleva a cabo mediante la aplicación de un test que arroja las Para Pss, = -IOOJ = +ZS
100
siguientes puniuaciones
Para Pe5'
i .n 951500)
Puntuaciones No de empleados
100
= -i0-: 475

[o;30) 94
3er Paso:
[30; s0) i40
[s0;70) 160
P^n
[70;90) 98

[90; 100] 8

/85(500) _ aoo\
La planificación óptima de la empresa exige que el 65Ya sean administrativos., el Pes = 5o.{-l* izo = zo+6,33 = 76,33
20%jefes de sección, ei 10%jefes de depafiamenlo y el 57o inspectores, según sea \ '-- /
ia puntuación obienida (siendo ios inspectares los que obtuvieron las puntuaciones
/es(s00) _ ,o,\
más altas). Se pide calcu lar la puntuación rnáxima para ser administrativo, jefe de Pr, = 5o - { _]-!!_.uf lzo = zo+ 16,s3 = 86,s3
sección v jefe de depanamento.
\"- I
Solución: Según ios daios, se tiene Por tanto, la puntuación máxima para ser adminisrrativo es 61,j7, para jefe de
sección es 7ó,33 y parajefe de departamenro es 86,53^
Porcentaje acumuiado

2.2.1I La Moda
Jefes de ciepartamento Definicién 9. l)ada una distribución de frecuencias. [a moda, denotada por
X = Mo, es un valor de la variable que tiene la más alta frecuencia, esro es. es el
valor más frecuenre de la distribución. La moda no siempre existe y no siempre es
Por tanto, tendremos que hallar los percentiles 65, 85 y 95" única.
La tabla con frecuencias acumuladas es
Ejemplo 23. Considere los pesos (en kilos) de 9 adultos:
82, 65, 59" 74" 60, 67, 71, ?3 y 7ü

74 75
MEDIDAS. TENDENCIA CENTRAL Y DISPERSION
TÜPÍCOS DE ESTAD,STICA DESCRIPTIVA Y PROBAI]ILIDADES

I inedidas na definen una iiroda, ¡¡r¡es todas iier¡en ia misma frecuencia


tntervalos de clase it
Es¡as

Eiernplo 24. Considere la distribución de las pesos de l5 adultas'


[t;21
63, 67,70, 69,87,57, 63,73, 68, 63,71,71" 7L, 83
Los valores 63 y 7 I ocurren 3 veces, y el resto ocurre una vez cada uno ' i-uego, Ia t2;31
moda de estas observaciones es
X -* Pta = 63 kiios y X = Mo = 71 kilos
En este caso, la distribución se liama birnodal' la; s)

En general, se tiene [a siguiente clasificación'


i) La disrribución que tiene una sola moda se llama unimodal'
ii) La distribución que tiene dos modas'se llama bimodal' Solución:
iii) La distribución que tiene más de dos ¡nodas.se [lama multimodal. ler Paso: El intervalo de clase de mayor frecuencia absoluta (17) es el tercero
([2; 3) ).
2.2.11.1 ProPiedades de la Moda 2do. Paso: Al aplicar la fórrnula de Czuber' se tiene
.tA,\/7r
l) El valor de la rnoda es totalmente independiente de los valores extremos. X = Mo = lMo- (,¡;, Cuo=? * .r =2,44
&] lz rsJ
2) La rnoda es una medida inestable porque varía si se cambia el intervalo de A.t=L7 -10=7, A,r=17-8=9, Cuo--1
clase.
3) Su significación es limiiada cuando no se dispone de un gran número de
2do Proceso: I)eterminacién gráfica de la moda
valores.
En este caso. es necesario construir el histograma de la distribución con Ia
4) Es el valor típico y, por ello, el promedio más descriptivo' flnalidaci de identiflcar ia clase modai (aquella ciase con mayor aitura) y nacer ia
5) La moda no se presta a manipulaciones algebraicas posteriores' construcción que a continuación se indica (figura 2.4).
de clase
2.2.11,.2 Cálculo de la Moda: caso de datos agrupados en intervalos
para el
Para datos agrupados en intervalos de clase. se tiene diversas fórmulas
cálculo de la moda. Aquí se presenta dos de ellas:
Ier Proceso: Fórmula de Czuber
Ier Paso: se identifica ia clase modal (la clase de mayor frecuencia)
2do Paso: sc aPlica la formula:
f A1 \-
X- = iuo * [;:-;;-JLro
\41 -l- Arl
donde:
= límite inferior de la clase modal
J¡,¿,

- f, (f, = frecusncia de la clase inmediatamente anterior a Ia clase modal)


Lt= fuo Fig.2.4
fuo = frecuencia de la clase modal
Lr= fu, - h {f, = frecuencia de la clase inmediatamente posterior a ia clase modal)
Cu, = amplitud de la clase modal
Ejemplo 25: Detsrmine lá rnoda de la siguiente distribución'

77
76
l
TÓPICOS DE ESTADISTICA DE§CRIPTIVA Y PI(OBABILIDADES MED¡DAS, TENDENC¡A CENTRAL Y DISPERStÓN

z.Z.lz ll.lelstión entre la lVledia, Mediana y Moda o menos simétrica, el promedio debe ser preferido en lugar de cualqurcr otra
medida de rest¡men.
b) La mediana, por su parte, debe ser utilizada cuando enlrre los valores qL¡e se
1. Distribueioles Sinnétricas estudian hay alguno muy diferente de los orros. Si por qiernplo, ,ei liarnpo de
Se dice que una distribución de
hospitalización de 5 niños con gastroenteritis fuera respec:tivamente Z¡i 4; {t;
frecuencias es simétrica cuando los
y 30 días; el valor último, debido tal vez a alguna cornplicacidn de la
valores de la variable equidistantes
enferrnedad, hace parecer la permanencia en el hospital mucho más larg¿ de Io
de un valor central tienen las que generalmente es. El promedio
mismas frecueneias. En este caso.
se tiene x- 2+3+4+6+30=T=9dÍ"
45

x=x=x x
es engañoso, pero, en cambio, la mediana, que es .i = 4 días , tiene [a $entaja
i=Í=X. Fig.2.5
Fig. 2.5 de no tomar en cuenta los valores extremos, dando una irmpresióm rnás acorde
con la realidad.
2.- Para una distribución sesgada hacia la derecha (si Ia cola lnayor se presenta a la Hay, además, ocasiones en que debe usarse la mediana por no ser posible et
derecha de ia curva) como en la Fig' 2'6' se tiene
cálculo del promedio, tal como sucede en aquellas distribuciones en l¿s euales
la prirnera o la última clase no tienen límites precisos.
x>N>N. Exceptuando estas aplicaciones, la rnediana no tiene ninguna ve.ntaja snrbre la
Para una distribución sesgada hacia la"izquierda (Fig. 2'7), se tiene
media aritmética, pues su valor dependé solamente del núurero de términros sin
x <N <N. Iomar en cuenta los valores numóricos de éstos,
c) La moda no es una medida de tendencia cenrral muy us,rual. pero se. enrplea
cuando el in¡erés se centra en conocer el valor quÉ se presenm más
frecuentemente. Por ejemplo, en los negocios sirve para derernün« qué
Iamaño del producto es el de mayor demanda. Similarmen¡e, para progr,amar la
producción de un medicamento el fabricante estará interesado en sabel cuál es
la dosis más comúnmente recetada por ios médicos.

2.2.14 Media Geométrica


Definición l0: Sean x1,..,tx¡ valores de la variableX asociadas a lm frecuencias
Fig 26 Fig 27 /¡ , respectivamente. I-a media geométrica de X es dada pror
absolutas ñ, f ,, ...,

2.2.13 Selección entre la Media, la Mediana y la Moda


xo=6:\
k
De las tres medidas de posición central. la media arítmética suele ser más
rioncie n =
§a

frecuentemenie utilizada, quizás por la facilidaci de su cálcuio. a pesar de que en Lf,.


r=1
muchas ocasiones la mediana o la rnoda resultan de mayor interés- Al aplicar logaritmo de base l0 a la fórmula, se obtiene
a) La media aritmética como medida de resumen tiene la ventaja de tomar en
cuenra la totalidad de los valores de la serie, aumen¡ando o disminuyendo de logro(Ío) = logro(G) = .ñ
logro xt * fzlogle 12 -r- ... * fuloqux*
acuerdo con ellos, pero a causa de esta propiedad puede ser desventajosamente
afectada por la existencia de valores anormalmente altos o anormalmente Lti=rfilogro t¡
bajos. Por regla general, sin embargo, puede decirse que cuando la serie es más

78 79
TÓP I C OS D E ES TA Di S T iC A DES C F. íPT ¡ V.^. V P R.I-^i B A- E i L i D A,IJE S MEDtDAS, TENDENCIA cENTRAL y uspEnsróN

,^^ . =-27--rf¡logrrx¡ 103,8500=


Luega, Ía = 0 = Antilog {¿r=t/¿iutsto¡¿ ).
rogloL -----;-- -
--6-- r,o:
t.BS45
\ '" ;
iijemplo 2b: Caicule la medra geomeürca cle las observactones muestrales: Luego, la rnedia geométrica es 6 = Antilog(1,8545) = 71,5.
3; 6: 12;24; 48 c) La rnoda para esta distribución es .{ = Mo = 82,4.
Sol ución
.Ar¡I r-li^o'
{ri¡ú¡i
I. fÁrm"la rla mprliq opnmétrins
rv¡r "p"¡'lra
!*!rL,¡!c 2.2.14.1 Propiedades de Ia Media Geométrica
Dvú,¡¡vr¡

Xc :'"",lTi 6AtZ xZq x +8 =


s,{fffi/ = 72
1. Si se define una variable ,, = L - C, = !uy .
lt
Ejemplo 27: Las cifras en la tabla adjunta corresponden a miligramos de 2. La media geométrica toma en cuenta todas las observaciones, por lo gue está
hidtoriprolina absorl:idos por un gramo de masa intestinal analizados en distintos afectada por todos los valores de la variable. Sin embargo, da menos peso a los
paGtentes. valores extremadamente grandes que el que les da Ia media aritmética.
La media geométrica es Ia medida que se debe utilizar cuando Io que se va a
n:rg cie h idroxiproiina / t.J 61,2 82,4 75,9 6i 74,2 65
promediar son tasas de cambio o proporciones.
número de pacientes J l0 t5 13 I 5 2
4. Se presta a manipulaciones algebraicas posteriores.
Se yide:
5. La media geométrica es de cálculo relativamente dificil.
a) ¿Cuántos pacientes fueron examinados?
6. La media geometrica no puede determinarse cuando hay valores negativos
entre los datos.
b) Calcule la media geométrica de la distribución.
7. La media geométrica presenta el inconvenicntc de que si uno de los valores de
c) ¿Cuál es la moda?
la variable es igual a cero. la media resulta igualmente cero.
Sol ucién
é, Observaciótt 2.- En dernografía, para estimar la población de una detcrminada
a) El número de pacientes examinados es: n= Lfi=56. localidad en un año r, cuando se supone un crecimiento geométrico enlre dos
censos. se usa la fórmula
b) Para obtener la media geornétrica, conviene hacer los cáiculos en Ia siguiente P- tx'to
- to
iabla:
P, = Po i=;tr
¡0

X¡ fi log., r¡ f¿ logr6 x¡ doncie P6 es la población en el primer censo realizado en la fecha ro, P, es ia


6l 8 r,785 i 4,2800 población en el segundo censo realizado en Ia fecha f, y Pr es la población que se
61,2 1.787 17,8700 quiere determinar en la fecha t, .
65 2 1,813 3,6264
70,2 5 1,846 9.2300 Observación"1.- Si se quiere determinar [a población en el centro de un período de
75,9 13 1,880 24,4440 t. = to ai = tT,esto es, para

I l,J 5 tr,888 5,6640 f,+f^ f1+¿o fr-fo Lx*La


82,4 i"5 1.916 28740A t*=-:Z-:-ür-¿o- 2 -üo= z Lt-Lo
TOTAL 56 t2.915 I03,8500
se tiene

AI aplicar la formuia respectiva, se obtiene


Pr= oo
ÉJ"' = bx&

80
8l
+Á¡r¡no
lui_iLvJ nr rcrrnicrr^a¡rL^ uE-Lhrf lrtn
EJ¡&¡o r,t fnD^ñ lnrt rñ¡ñF.
NvD&tLrúAúEs
u-E ^Dc^DtffirtrÁ MEDIDAS, TENDENCIA CENTRAL Y DISFERSIÓN
c--^ ^^ n ^^ l^ ^^^*.(ki^^,¡^ Í, .. Í) Este resultado puede ser obtenido directamente calculando la media armónica
.lv$¡E.uJ.l. -^,¡:^
entre las dos velocidades. Asi, se tiene

u-- ? - 2
Ripmnln ?-§. IIn ncís ticnp en ?On6 una nnhlacirln rle 6 § millo¡eq v en ?00? sr¡he 1.2A
a I
miilones. ¿Cuál es la pobiación media del período? "- 1 r 3 ^:40knr/h
.r
Solución: Al aplicar la última fórmula para Px, resulta 30'60 60
-f-

^ : i r-É---ll--i-
rx
t-77G a
rg A 11 : vio,D/ó : t,át
^{ 2.2.15.1 Propiedades de la Media Armónica

Por tanto, la población media del periodo es 7,21millones. r) La media armónica se basa en todas las observaciones, por Io que está afectada
por todos los valores de la variable, Da a los valores extremadamente grandes
2.2.15 Media Armónica un peso menor que el que las da la medía geométrica, mientras que a los
valores pequeños les da un peso mucho mayor que el que les da la media
Definición 1l: Sean xyx¡,...,r,¿ valores de la variable X asociados a las
aritmética como la media geométrica.
frecuencias absolutas fr,fz, ...,fx, respectivamente. La media armónica de X es 2) La media armónica es indeterminada si alguno de los valores de la variable es
dada por: cero.
V..: "tl 3) La media armónica se presta a manipulaciones algebraicas posteriores.
"tl fr,fr" ""r,h = -:-
sk fi 4) H < G < i , siempre que se trate de la misma serie y cuando ios términos no
l't o'o xk zi=t7;¡
son iguales.
k

donde n=Yn
!-t " Ohsertwciótt 4.- La media armónica es particularmente recomendable para series
, i=1
de valores que son inversamente proporcionales, como por ejenrplo para calcular
Esta media, como la media geométrica, solo es aplicable a cierros tipos de
la velocidad media o costo medis de bienes comprados con una cantidad fúa.
problernas.

Eiernplo 29: Un auiomóvil recorre los primeros 1C kilórnetros arazónde 30 km/h


2.2.I6 Media Cuadrática
y ios l0 kilónietros siguierrtes arazófi de 60 kmih. Determinar ia velocidad media
Delinición 12.- Sean x1,x2,...,x¡ valores de la variable X asociados a las
durante todo el trayecto.
frecuencias absolutas ft, fz , ,.,, h, respectivamente.
Solucién
La media cuadrática de X es dada por:
A primera vista. muchos pensarían que la velocidad media es igual a
30+60_,"hkm
Y----14<- frxl + fzxl+.. lI;!=,f,*!1'/'
2 I

Sin embargo. al recordar que la distancia total recorrida es definida como la


-I
Inl
velocidad media multiplicada por ei tiempo gastado en el trayecto, es fácil percibir
que el recorririo total que se obtiene es incorrecto. donde n :f ,,
A la razon de 30 km/h, el automóvil gastó 20 minutos para recorrer los primeros i=1
I0 kilómetros, y a razón de 60 km/h gastó 10 minutos. Por io tanto. el carro
recorrió un totai de 20 km en 20 * 10 = 30 minutos = 0,5 horas, a una Observaciótt 5.- La relación entre las diferentes medias es

velocidad media de H<GSÍ


_2A - 4ü km/h
0,s

82
MEDIDAS, TENI)EI$CIA CENTRAL Y MISPERSION
TÓPICOS DE ESTADiSTIC.A DESCF.II]TIVA Y PF.OBABILID.A^DES

Ejempio 3ü: En una distribuc!ón de frecuencias se multiplican ios vaiores de ia calcule la media, la mediana y fin§uentre el ni¡nnero rnsdal de interrupciones
!

variable por 3 y se obtiene una media áritmétiüa Ce 54; si se suma 5 a los vaiores diarias.
de la,variable. se obtiene una rnedia cuadrática de 24' Calcule la media cuadrática 2. La media mínima para aprobar uma asignatura e5
11. §i un estudiante obtiene
de la variable original. I
las notas 13,5; 14; g,5; lzi 8,5; ffi; 11,5; l0
en nos tnabajos mensuales c1e la
asignatura en cuestión, ¿el estudiamte fue aprobad'o?
soiución: sean f1,r2,...,f¡i valores de la variable original x. De acuerdo al R. No fue aprobado; i = 10,875'
enunciado del problema, se tiene cada uno de
J. Diga ustcd qué medidas de tendemcia central senjan más útiles en
i) Si 3x¡ =liái=3i=5+ái=18 los siguientes casos:
gerente de producción d,e urna fáb¡:ica de vasos de vidrio
quiere saber
a) ni
Él tiene a Ia
cuál es el tamaño de vaso que debe fabricar en mayof'cantidad.
ii) si x¿ * s = zr -Zc - ..lllf:z?
n
= 2a mano un buen nÚmero de dates de los tamañ.o,s de vasos
ordenados por los
clientes.
Elevando al cuadrado, se obtiene b) El gerente de ventas de una compafiía que produce ntuebles de lujo desea
seleccionar regiones para est'ablecer salas de 'exhihisión' ¿En qué medida

7, -L!=rfizi'- Ef=tfi(', !21- ,ru esrarámásinteresadodelirlgresofarniliarponregión?¿enlamediaoenla


"nn
Lf
-
mediana?
de la bolsa de valores está interesado en describir Gl cambio
Lf=rlf.x,' + Lof¡x¡ + 25f¡l
é-:Jr-(j - =-.
c) una analista
diarioenel.precioeneimerradodeunaac,gióndelBancodeVivienda.
ocasiones en que el
Rara vez el precio cambia rn.ás de un punto, pero hay
*4!ti.'o (*) + zs (14) = szo precio cambia hasta cinco purutos' ¿Qué mediida debe usar el analisB
para
media. la
describir el cambio de prec,lo de la acción. en cuestión? ¿[a
fix? + mediana o la moda de los canrhios de precio ern e[ mercado?
oZ 1ox * 2s = s76
n 4. A continuación, se da la distribuciión de los alquiifieres de65 casas. Ddermtne
f\ c -.2
su media empleando el proccso ahreviado'
' éLJirí +10(18) +25=576
n
Alquiler (miles [3,5r5,5) [5.5; 7,5] [7,5;9,5i [9,5; 11,5)
§ f.v? Ir,5;3,5)
L) ) l*t de S/.)
-) =1-:--:-
n
- 371
No <ie casas t2 ló 2flt 10

Por unto, la media cuadrática de X es i. 5.8231

continuación, se tiene Ia disrribución del núrnero de


accidcntcs Por día
5. A
n,= ciuranre 53 días en ciena autopista'
W=istT=1e,26 0 I
n
¿ +
No de nccidentes
EJERCICIOS N' de días l0 l5 10 5

1. Los siguientes datos replesentan el núrnero de interrupciones por día de trabajc Se pide:
debido a fallas rnecánicas en una planta procesadora de alimentos a) Determinar la rnedia b) Determinar la mediana
3;4; i; 3;6;5;3;2;i c) Calcular la moda

85
TÓPICOS DE ESTADISTiCA DESCRIPTIVA Y PROBABILIDADES MEDIDAS, TENDENCIA CEhJTRAL Y MISPE§.STüN
d) ¿r-luál es e! porcenraie de días en que se ¡uvo dos o mas accidentes uor día?

6. A continuación, se dan las notas rie 50.alumnos.


a) Determíne la media y Ia mediana de esta distribr¡ción.
ó(i 65 33 52 65 77 84 65 74 57 R.Í=61,,fr=59,7826
7t 35 81 50 35 64 ?4 47 54 oó
b) Halle el porcentaje de datos contenidos en el intervalo
80 61 4t 9t 55 73 59 53 77 45
41 5-§ 78 48 69 85 67 39 1A (il
60 t = lx E R / 'lX -Xl < =l R. 77,655'a/a
94 98 66 66 73 42 65 94 88 ao {. '¡ 3)
Se pide: 9. El jefe de control de calidad de una empresa Fua clasiiicado i¡n llote de 80
a) Número de clases por la fórrnula de Sturges y amplitud de las clases. artículos en una distribución de 6 clases y con intervalos de 5 uni,rnades. Si las
b) ¿Cuáles son los intervalos de clase? (inicie en 30) frecuencias correspondientes son 6: l2',24; l8l1 ¡3 , 7; y siendo la cuarta
c) Trazar el histograrna y el poilgono de frecuencias. marca de clase igual a 35 gr, determine la moda y rnediana de la dis¡iribucion.

d) Deterrninar la media, mediana y moda. R.Í = 65,6 10. Una fábrica de botones tiene 3 máquinas. La máqr"rina B produre la ¡nitad de lo
e) Dererminar el 3er cuartil, 7mo decii y 55'o percentil. que produce la máquina A y la producción de la rnáquina C es infurior en un
.R. D, g 76, Put + 67 200á respecto a lo que produce la máquina B. Lns costps de prodrucción por
son:20:30 y 50 centavos de sol pana las máquinas A, B y C,
I

7. Los díámetros en centímetros de 50 unidaci


eojincres fabricados por una cierta
- respect¡vamente- Si se desea ganar el 20% por docer¡& se pide calcular el
compañía se muestran en la siguiente tabla:
precio medio cie venta.
4,529 0.538 0,532 0,529 0,535 0,536 0.534 ü,542 .4. S/. 0.358
0.537 0,53G 0,538 0.536) 0;536 0.5i6 0,526 ü,525
I l.De diez familias con teléfono, con radio y aom auto se obtr.¡vo lla sigui,ente
0,524 0.534 ü,530 0,51il 0,542 0,528 A,546 A,537 información relativa al mes de febrero de 2005:
0.534 0,535 0,539 $,52i ¡0,544 0,527 0,fi5/ 0,534 Costo promedio de manrenimiento de I auto: 600 soles.
0,540 0"540 0,536,: 0,532 0.535 0.5-?5 0,535 0,528¡ Costo del teléfono: 32:35:34:29:29,5:31,5;33.,5;34,25; i2.75: 31.5 solles.
c,sr0/ c,s32 (g5i) 0,s33 0,s35 ü,53,1 respectivarnente,
:,:1:
4.537 1,:11
0,545 Disrribución rie costos de mantenimiento de la rad,io:

a) Forme una tabla de frecuencias. Cos¡o en soles N'dc familias


b) Trace un histograma, un polígono de frecuencias y un polígono de lo; roi
frecuencias acurnuladas [10;2oi
c) Calcuie el diámetro rnedio e indique Ia media en ei histograma. [20;a0]
d) Obtenga ia mediana y ia moda. lao;70)
[70; 100)
8. Dada la siguiente tabla de frecuencias:
Caicuie ei costo total pronredio por familia rie los ures servicios considerarios.

l2.Los siguienres dalos son los haberes básicos del mes Ce ahril de 2ü,empleados
de un Ministerio (en soles):

210 200 22A t50 190 100 160 r,50 ?0 n r 9ü


!5fr 180 23t) 2l(, i60 I40 180 1'20 200 t 9ü

87
86
MEDIDAS. TENDENCiA CENTRAL Y DISPERSiON
TOPICO§ DE ESTADiSTICA DESCRIPTiVA Y PROBABILIDADES
R. Deficientes: [0; 10), Nornrales: [10; 13) y Excelentes: Ir¡; zo)'
i(;ies'
a) Calcuie la media. meCia¡-'a ¡. moda de los daios aliiei
y calcule la rnedia 'v Ia
b) Clasifrque en 5 intervalos de clase de iguai iai¡añc l5.Se ha medido mediante pruebas adecuadas los coeficiente§ inleleCtuales de un
meciiana cie los datos así agrupados' grupo de 20 alumnos, y se agruparon los resultados en 6 intervalos de anlplitud
R.X=1.74,L,i=L8i,774 variable.
10% sobre los haberes
c) Para e[ mes de mayo se decrera un aumento del Esras amplitudes son:
básicosdelmesdeabrilyundescuen:rcde|2oAdeloshaberesbásiccscel Q: 72, Cz - 72, Cz = 4, C+: 4, Cs = 12' Co - 2A
mesdemayoprofondosdereccnstrucciÓn.Sepidecaicularlamediayla Las frccucncias rclativas aculnttladas correspondienfes a cada r¡no de los
mediana de los nuevos haberes' intcrvalos son:
R. Media = 1.87,6798, Mediana = 195'888 Hr = 0,15, Hz=0,15, Hs = 0,55, H¿ = 0,8, Hs = 0'95' Ho= |
13. Dada la tabla siguiente Se pide:
a) Forinar la tabla de clistribución de frecuenctas (absolutas, relativas,
Frecuencias relativas
lntervalos de clase absolutas acumuladas. relativas acumuladas), si se sabe que el extremo
inferior ciel primer intervalo es 70'
bl Dibr¡-iar el histograrna y el polígono de lrecuencias absolutas. Calcular la
moda.
[0,60;0,80)
intelectual de
0,1ü c) ¿Enrre qué dos percentiles está comprendido un coeficiente
[0,s0; 1,00)
98.4? Encuentre el valor de ambos percentiles.

Deterlntne: Al rnisrro grupo de alumnos se les hace una prueba de rendimientD. I-os
0'61' resuitarios son ciacios en el gráfico siguiente:
a) Los datos que faltan si se sabe que la media aritmética es

b) La mediana Y la moda-
y de la Facultad de
i+.g,n ,nu sección de la asignatura de Probabilidad Estadística
,Ingenieríalndustrial,ladistribuciÓndelascalificacionesde50aiumnosresultó:

Calificacicnes No de estudiantes
2
Io; 5)
a
[5;10)
2A
hü;12)
[12; 1§)
115;20)
d) Formar la rabla de distribuciÓn de frecuencias ¡,' calcular la mediana.
e) ¿Que rnedidas están más dispersas? ¿los coeficientes
inteiectuaies o las
Sedeseaagruparalosestudiantesdeesiasecciónen3categorías,to:'andoen puntuaci0nes de rendimiento?
(los que tienen las peores nota§) eslará
cuenta las notas ob¡enidas. El peor 20%
estarán en la categoría l6.La Universidad de I-ima tiene 100 empleados. Para los nombracios, el haber
en la categoría de Deficientes; ei 60% de los siguientes
básico máximo es de 4 500 soles mensuales y ei minimo es de 6Ü0 soies
deNormalesyelmejor20%(losquetienenlasmejoresnoias)esraráenia
de califi,caciones entre las mensuales. Hay un 5Yo de evenruaies, que trabajarr ad-honoren c perciben
caregoría de Excelentes. ¿cuáles son lós limites i5 trabajadores nombrad¡s perciben
compensaciones inferiores a 600 soles;
categorías?
89
88
TOFTCOS ESTADISTICA DESCRIPTIVA Y PROI]ABILIDADES MEDIDAS,'I-ENDENCIA CINTRAL Y DISPERSIÓN
'DE

haberes ir,foricres a 2 500 soles -v e'o 85atí de los iiabajadcres tienen haberes 20. Los salarios de una emprcsa son en promedio S/. 500. Con posterioridad, se
i::feriares a 4 0S0 soles. Con esta información, celcule: incorporan'a Ia empresa un grupo de obreros igual al 25Yo de los que estaban
a) Cuartii 3 y Percentii 2Ü. anteriormente. El nuevo grupo ingresa a la empresa con un salario medio igual
b) ¿Cuántos trabajadores ganan mas de 2 000 soles mensu'ales? al 60aio de lcs antiguos. Dos meses más tarde, la empresa concede un aumento
fi.84 empieados de salario de S/. 30. Se pide:
c) La media, ¡nediáira y moda de los haberes a) El promedio de salario del totai de obreros.
ft.iviedia =2997,2. tuiediana= 3i92,31, Moda =325Ü b) Si el aurnento hubiera sido del 20ok de los salarios, ¿cuál habría sido la
rnedia de Ios salarios así ajustados?
l7.Una persona tiene 4 acciones, de las que recibe los siguientes dividendos en
.{. a) 5/.460 b) S/. 552
2004 y 2006 (cantidades expresadas en soles):
2l.Siguiendo la única carretera que cruza cierta región se enctrentran cinco
I OQ,{ 1 0aÁ
pueblos \,Pz,P3,P+y Ps, en dicho orden y a las distancias siguientes: 6 kn
Capital Dividen- Rendi- Dividen- Rendi-
Inversión Inversión de P, a P, ,3 kmde P, a P3 , 8 km de P, a Pa ,2km de Pa a P5. Una sociedad
do miento dn rniento
tiene sus socios repartidos entre los cinco pueblos de la siguiente manera: el
8 000 480 6% 5 000 300 6%
^ ¡ o/ I 0oá vive en P1 , el 20% vive en P2 , el 30% vive en P. y el 25olo en Pr. Sc trata
B 5 000 200 4% r4 000 560 1/O
de establecer en algún punto a lo largo de la carretera un campo de deportes al
C 6 000 480 8% 2 000 i60 8%
que concurrirán los socios.
D r0 000 1 000 10% 8 000 800 tq%
La experiencia de la sociedad ies indica que el costo del viaje para caü uno de
Totai 29 000 2rc} 29 000 i 820
sus socios es proporcional al cuadrado de la distancia que tengan querecorrer.
Rendi-
Como la sociedad paga los viajes, tiene interés en reducir dichos gtstos a un
miento 7.45% 6.26ei
nrí¡rimo en el caso de que acudan al campo todos sus socios. ¿Donde debe
promedio
situarse el campo?

a) ¿Cómo se han obtenicio los rendimientos promedio? rt. El campodebeestarsituadoa li kmdePr,5 kmdeP2,2 kmCePr,6km
b) Dado que no han carnbiado los rendirnientos Ce ninguna de las accir:nes, dePo y aSkmdeP5
iÓn ocurrida en el rendimierto promedio?
¿cómo expliea usied 1a
-{isrninue 22. Supongamos que una organización de cadena de restaurantes tiene siete de
ellos en una carrelera, como indica el cuadro. Diariamente cad¿ restaurante
18"La fábrica A produce;n artícllos, la fábrica B produce ei doble tjel número de
debe buscar alimentos frescos de un almacén central. Además, supongamos
artículqS que la fábrica A y Ia fábrica C produce ZAaÁnás que la fábrica B" Si
que el servicio requiere dos camiones cada día. Entonces para ninimizar la
los cosios unitarios son respectivamente 10c, 120 y 14Ú soles, caicule el precio
si los productores desean ganar el 3AYo de los disrancia totai de ios 7 reslaurantes al almacén central, ¿dónce debe estar
piomedio de venta
situado ei almacén?
correspondientes precios unitarios de costo'
¡t. Precio promedio cie venta es S/^ 162'741" Restaurante Distancia en nlillas del restaurante al alm¡cén
l,)
i9.En una sección de Estadistica General.24 estudiantes ilevan oi curso por A
primera vez, 6 }levan por segunda vezy 2 por iercera vez. se sabe clue i2 es ei B 40
76
promedio rie ngtas de los que llevan por primera vez y que ias notas de los que C
lievan por segunda vez en prorneciio son superiores en un 107á a lris que llevan t) 96

por primera vee" E 124

Caicule el promedio de notas de los que llevan ei curso por tercera vez' si la F I32
G 148
suma tolai cie las notas es <ie 390.

90
9l
.|ÓPICOS MEDIDAS, IENDENC1A CENTRAL Y DISPERSiÓN.
DE ESTADiS'NCA I}ESCRIP'IIVA Y PROBABILIDADES

R. i = 96 rnillas. Luego. el almacén central dcbc cstar situado en el n=10; f+-fs=l.A; ft-fz-fr=0; ñ= fs,; fz= f¿,iel límite inferior
de la primera clase es 12,5 y yafa -, 975, donde yo es e[ límite superior de la
r' res[áurante I).
cuarta clase.
23.En un examen tinal dado por$es secciones de una clase de Estadística de 9l a)
Dibuje el histograma y polígono,de frecuencias.
alumnos, la nota promedio de todos los estudiantes fue de 14,5' b)
Halle el valor de la media y medinna
El prornedio de la sección A fue de 15,5 y el de la sección B fue de 9,2. Los R. Media = 25, Mediana = 25
datos sobre el número de alumnos de cada sección y e I promedio de las rroias 27 .IJna empresa de transportes lleva ¡estadisticas desde hace varios años del
de la sección c se perdieron, pero los profesores de la sección A y B recuerdan rendimiento de dos marcas de llantas. Se han obtenido los siguienres
que ambos lenían exactamente el mismo número de estudiantes. mientras que resultados:
e[ profesor de la sección c recuerda que tenia 5 estudiantes menos que el de la
Media (cn millas)
sección A. ¿Cuál es el promedio de los alumnos de la sección C?

24. Se tiene la siguiente información sobre una distribuciÓn de frecuencias de 50


elementos de un material sometido a prueba de rotura (en kg/cmz). pa
longitud de los intervalos de clase es constante e igual a 20'
Suponga que las dos llantas se venden ai mismo precio. ¿Qué marca
recomendaria uste<i ai negocio de rr,amsportes? ¿Por gué?
Inrervalos I Mur", de clase x¿ i f, x¡f¡
2E. Un vendcdor viajante hizo 5 via-ies durante los meses de Junio y julio de 2006. i
300
10
Ei número cie dias 1,' ei vaior de las venras cíe cacia viaje len soles) son los i,
400 I
siguientes:
350
Via-ie : No de dias I Valor de ias venras i Ventas por dia
jr00 i 0(¡
I t00
1 t 544 220
t0 2 000 20ú
a) Determine la media Y mediana. ,1 d00 80
R. Media = 73,6, Mediana = 82,35 § I(, 1250 225
b) Derermine el No de daros que se estima que pertenezcan al intervalo [X;Í]. j'oTAt 35 6 49Ci 825

R,¡ Aproximadamente 4"


Ei gerente cje venras criticó ia actuación dcl venciedor porque sus venras
25.Una empresa de butano quiere colocar en una red viaria un depósito para rreiias por día ascendieron a Si. 165. Pero ei vendecior arguyó que ei gcrente
abasrecer a los pueblos que esrán en los kilómetros l0;50; 80; 1401290 ya50. rie. venlas estaba equivocacio porque sus ventas medias por día fueron
Se pide: S/. i 85"43. ¿Cómo obruvo ias ventas meciias por día? ¿De quién es ei promedio
a) suponiendo que todos los pueblos consumen la misma cantidad, ¿en qué correcto'l
kilómerro se debe colocar el depósito de forma que los gastos de .R. I-a meciia ciei venciecior es correctra, pues pondera por ei número ie dias err
abas¡ecimiento sean mínimos? cacia vraje.

b) si se sabe que los pueblos que están en los kilómetros 50 y 80 tienen el 29"La compañía Petro-Perú maneja una pequeña refineria en Ica que vende
doble de población que los demás y, por tanto, consumen el doble, ¿en qué gasoiina ai por mayor a minoristas inciepenriienres. Las venras iie ia semana
lugar se deberia colocar el depósito? pasacia fuerolr ias siguientes:
26.lJna distribución de frecuoncias consta de 5 intervalos de clase de igual
longitud, y de ella se conocen los siguientes datos:

92 fl3
dp",+#-*'-* \ - 1,,.r, e+'r# alr4"'rr-F#*'
,dflté1-'h r<lg¡*,

'TOPICOS DE E§TADISTICA DE§Ct{IIITIVA Y PROBABILIDADES


MEDIDAS. ]'ENDENCIA CENTI§AL Y DJISPERSIÓN
Calones de gasolina (en miles)
3l.En Ia sÍguiente iabla se presenta.[a distriburción dle salarios de 50 rrabajadores
[0; 10) l0
de nna Universidad del mes de abnil del pres,enre ai,io.
[10;20) 20
[20;30) 30
[30; a0) 25
Haberes (en miles de solesJ I No d,c'rtrabajadores

[a0;50) 15 [6;10) 5
Icñ. ÁA\ tn [10;15) l0
[60;70) 5 1L5;2r) 20
[70;80) 5
127:25) 8
r20
lZ5;26)
a) A partir de esta distribución de frecuencias, calcule el número total d€ Po¡ incremento del costo de vida, se planteum dos ¡nlternativas de aurrentcl para
galones vendidos !a semana pasada. ei rnes de mayo.
b) Determine la rnedia de los galones vendidos en cada operación. La primera propuesra consiste en un aument,u general de i500 soles merrsuales.
c) ¿La moda se encuentra poi debajo o por arriba de los 25 000 galones? La segunda propuesta consistc cn un aumeilto den 301ó de los salarios de abril
¿Córno lo sabe? a ios obreros que ganan urenos rle 21 00[l-soles ry del 5% a los obreros que
ganan más rje 21 000 soies,,v un aumento adiclonnl de 2 00ü soles paratodos
d) Calcule la mediana de las ventas.
los tlabajadores.
30. Las distribuciones de ingresosde dos departamentos del Perú son las siguientes: aj ¿Cuál de las propuestas convendría a las traba-iadores?
b) Para los traba_iadores que gaflan mello$i de 2! 000 soles, ¿que propuesra
Depanamento A i |i "-
Departamento B convenriria?
rlnsrM--":;.'_ I

I¡ ;:.;
.
i Poblaciór,
nabrlanfes {mrles oe I
i
-:2. En una clase de la signatura de Análisis I, thay 4ü estudiantes varones con una
| .
soles) liemuneraoa!
:
I

: I eciad media de 20 años l' las rnujeres ern prornedio son 10% más jóvenes.
[60;90] t0 000 ¿Cuántas mr¡jeres ha.v si la edad media de la clase,es de 19 años? R. 40
I lUU; r¿Ul [90:120) 20 üriü
I r¿u; 15U/ - JU IJUU 3-l.Consiciere un aeroplano que vuela airededbr de run cuadrado que tiene j00
[150;"180) 20 000 millas cie iacio.;'ecor¡iencio ei prirner lado a [00 m.p.h, ei seguncÍo a 200 m.p.h,
[180;210) l5 000 el tercero a 300 m.p.h;, ei cuarto a 400 rn.,pl.ir ¿.Ctuál es ia velocicjaci me<iia oei
[?LA;24At r0 000 aeropiano en su vueio airecieior riel cuadradm?
IZaC;Z?A) 4 ü00 ñ. 192,021 ur.p.ir

a) Calcule el ingreso promedio del 30% de la población de rnayores ingresos


34. Suponga que una ciudad ruviese en el aflu 2020 una poblacíón de 50 000
. personas1- que ésta fuera cie,+90 0ú0 en 2ü3i0. Esúime ia población para2025.
en cada depanamento.
i5.F.ncuentre la medra ariimética rie los n priimreros números naturaies y probar
R. Xt
=
1+A,6 , Xs = 2A3,4
que coincide con ia mediana.
b) Calcule el ingreso promedio para el 40% de ia poblacién de menores
recursos. 36. El precio del metro cuadrado de umr tenenn, urbanm subió del año 2005 al añb

R, Xs = 97,6, NB ='108,2 2010 de $ 200 000 a $ 400 000" o sea ,en lú]070: mienrras que ei merro
cuadrado de un terreno rurai en el mism,o lapso subió de $ 8,00 a $ 10,50, o
c) ¿Cuál es el ingreso promedio dg los dos depanarnentos en conjunto?
: sea en 25?ó. ¿CuáI es el promedio deJ.o-s au,rr¡ent-o,s de-pre-cios?
R. X=i30

s4 95
TÓPICOS DE E§TADiSTICA DE§CRIPTIVA Y PROÜABILIDADES MEDIDAS, TENDENCIA CENTRAL Y DISPERSIÓN

S7.Al estucliar ei consumo diario de leche, se verifrcó que en cierta región 20% de
Ias familias consume menos de I lifro, 50% de las familia§ consume entre I
y
a) Calcute la media y'ia.mediana
2 li¡ros,20{zá consi¡n-r€ e¡ifie 2 y 3 iitros ¡r,ei restaiiie i09á co¡isuiiie eiiire 3 y 5
R. 24,5 y 21,4999
litros. Para la vari4ble en estudio: b) Calcule la moda y el 88 percentil
a) Escriba las informaciones en la forma de una tabla de frecuencias. .R. moda :20,5 i Pas .= 35,577
b) Construya el histograma.
c) Calcule Ia media Y.la mediana.
40 A1 final dei año pasado" Ios salarios por hora de dos clases de empleados de
d) ¿Cuál es el valor del prirner cuarti[?
producción de una dctcrminada compañia fueron ios siguientes:
f,\u:s.pn una granja avicola se registra Ia siguiente tabla de distribución de pesos de
pollos en gramos.
'vt
No de llos Ingresos por hora Clase A (%) Clase B (%o)
f1,i, q'7
ivóv) ,OU +;:i [2,30;2,50)
.14,2
.1000) 160 12,s0.2,7A)
12,70;2,90J
11
zlo
[2,90;3,10) is,s 52,4
JÓU
[3,10;3,30) 43,2
160
[3,30;3,50] 21,8
[1o6oi 1o8o) 80 i0,0
[3,50;3,70)
[3,70;'3,80i 1,0
Se desea agrupar los pollos en cuatro categorías con retagión al peso de modo [3,90;a,10i 0,5
que: i ¡r,-h..--,
vl 'i: 100%
a) Los20o/omenospesadosseandelacaregoriaD 4 i;'#i'r: "
830 20'15

b) L,os 30% siguientes sean de la categoría C *''S


? l
c) Los 30% siguientes sean de la categoría B f
a) Para cada clase de empleados, calcule la tarifa promedio y la mediana por
**H
d) Los 20'Yo más pe.sados sean de ia categoria A hora.
las categorías A, B''C y D'/ b) ¿Que suposición hizo usted en cada uno de los anicriores cálcuios?
¿Cuáles son los límiies de peso entre
¿Parecen estas suposiciones razonables para este caso?
39. 100 eiementos de un materíAi determinado fueron sometidos a prueba rie rotura c) Comparando la media y la mediana para cada una de las disuibuciones,
por compresión, obteniéndose ios resultados en kg/cmz. Cuanrio se recurriÓ a ¿qué información obtiene usted con respscto a la distribución? Expliquc'
la tabla de cálculo§ que el operador debió confeccionar, §e encontrÓ scio ic'
41. Se ha construido una planta de tratamiento de agua para uso domestico en una
siguiente:
ciudad de capacidaci de 4 500 000 rn3 por dia. Casi siempre es necesario
suspender el riego de jardines pirblicos cuando la demancia excede al
abastecimiento. Esto hace pensar que hay fugas en las ;uberías. I-a demanda

)
-54 medida por dia laborable (en miliones de m3) en los meses de abril, mayo y
junio de 2006 permitió construir la siguiente tabia
92

)
14

TOTALES

96 97
TOPICOS DE ESTADiSTICA DESCR.IPTIVA Y PRC'BA-BILIDAL)E§
intervaiits

420 000) l0
[2 S80 000;3
960 000) 26
[3 a20 000;3
s00 000) 16
[3 960 000;4
040 000) 5
[a 500 000;5

a) Halle el promedio de la demanda diaria de agua'


R. 3 6s7 272.7
b) Halle la mediana.
R. 3 710 769,23
c) demanda excede la capacidad de la planta?
¿Qué porcentaje de la
a.' R. 7.5757%
42. De una muestra de tamaño 3 se sabe que

\-1
a\ ) xi:183
-' /-¿ c) La mediana es 6
i=1
aj La media aritmética es ? d) rr ( xz 1xt
Determine los valores de ios datos muestrales x1' x7 ! x3'

de ia industria son
43.Los salarios rnedios mensuales en cinco diferentes §ectores
de toda la in<iustria'
dados en la rabla siguiente. Determine ei salario medio

loicentaje del emPleo i!q§93]


Saiario medio inensual en e[ sector
de amplitud
P?h. tiene una disribución de frecuencia simétrica con 6 intervalos
L-,/ y t^- ^i^,.io-rac ¡iotnc'
los sigr.rienres datos:
constante
30,
n = 150 , límite superior del quinto intervalo de clase = 60, fs =
0r=43,5,f2=il*5 R. 52,5

Se tiene una distribución de frecuencias simétricas con 9 intervaios de

amplitud constante y los siguientes datos:


hs = 0,50 , límite superior de la quinta clase = 110,h*h5,=$,13,
ht= 0,02, Pzt 1'tZ, h; = hr * 0'04
hr' 7 R. 97
Calcule el 22avo Percenti!.

También podría gustarte