Está en la página 1de 88

Estadistica aplicadrt

No se ha logrado un acuerdo en torno al origen etimolgico de la palabra estadstica. Se-


gn algunos autores, se deriva del latn status que significa estado, en el sentido poltico. Vale la pena recalcar que la estadstica moderna es la teora de la informacin que
Si se tiene en cuenta que en un principio los gobiernos la utilizaban para la recoleccin
tiene como objetivo la inferencia.
de datos, tambin significa "posicin" o "situacin de personas o cosas". Segn otros,
se deriva del vocablo griego statera que significa "balanza'', en razn de la funcin que
cumple en la medicin o peso de los hechos que son objeto de estudio; otros sostienen Trminos y expresiones que deben
que proviene del alemn staat que tambin significa ''estado", considerado como una
organizacin poltica. conocerse
~- "-....:~ !!Y"'i"1t _. .. rtn=r7"~

No hay 1.nidad acerca del origen de la palabra estadstica; sin embargo, puede afir- Por lo anterior, el conjunto de mtodos que ofrece la estadstica cumple dos funciones
marse que la etimologa latina (status) es la ms aceptada, por ser la que ms explica la igualmente importantes: describir e inferir, permitiendo su clasificacin en estadstica
finalidad y aplicacin de esta disciplina. descriptiva o deductiva y estadstica inductiva o inferencia!.

!~Trminos que deben conocerse y manejarse- 11 Estadstica descriptiva o deductiva


La palabra estadstica se menciona y se utiliza a diario, con una gran variedad de inter- Como su nombre lo indica, describe el comportamiento de un hecho, a travs de la recolec-
pretaciones. Sin embargo, la relacionan con todos o algunos de los siguientes trminos: cin, el ordenamiento, clasificacin, presentacin de los datos mediante cuadros y grficas,
recoleccin, clasificacin, tabulacin, descripcin e interpretacin de resultados, estimativos, anlisis e interpretacin y utilizacin de medidas, algunas de ellas como los promedios.
proyecciones y adopcin de decisiones frente a la incertidumbre. La estadstica descriptiva o deductiva podra resumirse como el conjunto de instru-
Se podra afirmar que la palabra estadstica est asociada a trminos o frases como: mentos que colaboran en la depuracin de los datos, en su presentacin clara y en su
anlisis de datos; diseos de experimentos; procesos aleatorios; mtodos cuantitativos; prue- simplificacin para la interpretacin, el anlisis y su publicacin. A esto se le podra
ba de hiptesis; decisiones prcticas. Por ot~a parte, en numerosas ocasiones cuando se complementar, elaborando un cuadro que sea claro, acompaado de una buena grfica
dispone de muchos datos, el problema principal es cmo organizarlos, resumirlos, que. visualice mejor la informacin; adems, la aplicacin de una o varias medidas bien'
presentarlos e interpretarlos. La estadstica es una herramienta para resolverlo. A pe- empleadas, que permita describir la "verdad" que encierra un conjunto de datos.
sar de la buena impresin que a primera vista ofrece la estadstica, tambin goza de Algunos consideran que si solo se investigara la totalidad de las observaciones de una
impopularidad, especialmente cuando se hacen encuestas sobre simpatizantes por un poblacin objetivo, bastara la aplicacin de la estadstica descriptiva, cuyo proceso sera,
candidato o por el gobernante. del momento; lo mismo sucede con los indicadores como ya se anot, la recoleccin, presentacin y anlisis de la informacin obtenida. Se
econmicos, entre ellos el ndice de precios del consun:-idor, utilizado para indicar las sabe, adems, que en la mayora de los casos eso no es posible por varios motivos, entre
variaciones en los precios de los artculos de primera necesidad, generalmente, aplica- otros por costo y tiempo, que obligan a realizar investigaciones ms pequeas denomina-
do para calcular el porcentaje de inflacin o prdida del poder de compra del dinero das muestras, a travs de las cuales se estiman los valores de la poblacin, cuando el in-
respecto a un perodo determinado. . vestigador requiere determinar la extensin, validez y confianza del proceso, valindose
Para la mayora de tratadistas, la estadstica es un mtodo de investigacin, no solo para ello de la inferencia estadstica.
para la observacin y descripcin de un hecho, sino tambin para la formulacin de
hiptesis, la aplicacin del diseo de experimentos, la comparacin de determinadas 11 Estadstica inductiva o inferencia!
teoras, cuando no se puede hacer experimentalmente. Son todas aquellas tcnicas usadas en la realizacin de investigaciones parciales, denomi-
Otros la definen, a menudo, como un conjunto de mtodos para la toma de decisio- nadas muestras, que permiten la obtencin de ciertos resultados mediante la aplicacin
nes en condiciones de incertidumbre. de medidas, considerados como estimadores de los valores estadsticos de la poblacin,
Algunos la sintetizan, como el profesor Ross, quien da una definicin que abarca a tambin denominados parmetros.
1
muchas otras, al afirmar que la estadstica "es la ciencia que estudia los hechos colectivos, La estadstica inductiva parte de datos que han sido depurados y condensados, faci-
- 1
mediante la observacin numrica, el anlisis matemtico y la interpretacin lgica, inves- litan el anlisis, el establecimiento de relaciones y correlaciones, la aplicacin de medi-
tigando especialmente sus causas y leyes empricas': ciones especiales que permiten inferir y contrastar hiptesis, en aquellos campos donde !
i
Una definicin propia, que sintetizara gran parte de las definiciones existentes sera: no existen verificaciones fsicas. 1

~---~ ------~-------------


!
Esladsllca aplica~'!_ __________ .,.......__ Captulo 1 Aspectos ge11emles- Sumatoria, pmductoritt y simbo/os
-------------------~--~------------------------------------~---

lll Estadstico 11 Sustitucin de elementos


Aquella personk que aplica mtodos estadsticos y maneja cifras, que presen~a informacin En una investigacin por muestreo, cuando al realizar la encuesta, algunos de ellos no
de hechos, rec<)gidos a travs de la observacin o experimentacin. Algunos, por costum- responden o no dan informacin por diferentes motivos, por tanto, no se debe o no se
bre, utilizan inpropiadamente el trmino de estadgrafo, que realmente sigllifica medida. aconseja realizar sustitucin del informante; sin embargo, en la prctica, por lo general,
se hace de diferentes maneras:
11 Estadsticas e Seleccionando un nmero mayor al tamao de la muestra requerida.
Son todas aq~ellas informaciones o cifras que aparecen en las publicaci~nes en forma 0 Seleccionando al siguiente elemento que se consider elegible dentro de la muestra.
de cuadros o ficas, las cuales se han ordenado de forma sistemtica, para mostrar el o Seleccionando el elemento que no inform dentro de aquellos que informaron,
comportamiento de un hecho que ha sido objeto de estudio. duplicando la informacin.
- o Dentro de la poblacin que no qued seleccionada, se puede realizar una nueva
!IPobladn seleccin, considerando un nmero igual al que no inform.
.. '

En la forma~~ simple, puede afirmarse que este trmino se refiere a un conjunto finito
o infinito de~l~entos. Es sinnimo de agregado y, cuando se emplea, no hace referencia
11 Caracterstica
un
nicamente a conjunto de seres vivientes, a la poblacin de una regin o una ciudad,
como se podra entender en principio, sino a un conjunto de observaciones totales. Los elementos que conforman la poblacin objetivo deben poseer ciertos rasgos o cua-
El trmiri.o. poblacin, tambin conocido como universo, se refiere a la totalidad o lidades denominadas caractersticas que deben estudiarse. Por tanto, todos los elementos
conjunto de n'edidas, o al recuento de todos los elementos que presentan una caracte- o unidades de esa poblacin deben poseerlas, es decir, deben ser comunes en su presen-
rstica comn. Se aconseja, con el fin de evitar equvocos, el trmino poblacin {objetivo} tacin para que guarden relacin con el objetivo de la investigacin.
investigada o por investigar. En los ejemplos de poblacin, se mencionaron los estudiantes de un plantel; es-
De acuerdb con el nmero de elementos que constituye o conforma la poblacin tos, como conjunto, constituyen la poblacin objeto; el estudiante es el elemento y las
objetivo, se daslfica en finita o infinita. En el primer caso, se tendr un nmero caractersticas que se van a estudiar podran ser: calificaciones, asistencia, edad, sexo,
limitado de elementos o unidades; en el segundo, deber ser ilimitado. Definir la curso, nivel o grado, procedencia, aficiones, entre otras. En el caso de una industria, las
cobertura, es (lecir, identificar y determinar el tamao de la poblacin, va a ser objeto pblaciones seran el total de unidades o lotes producidos en un periodo; las cuentas
de estudo mi~ adelante, siendo de gran importancia su conocimiento en las primeras por cobrar, el nmero de trabajadores, etctera Los elementos son: unidades, cuentas
e~apas de la investigacin estadstica. y empleados de la empresa, respectivamente, y las caractersticas que se van a estudiar,
Un co~jt.ihto de estudiantes matriculados en un plantel podra considerarse una entre otras, seran: c~idad, peso, resistencia, dureza del artculo; valor de las cuentas,
poblacin fini~~; pero si se hace referencia a todos los estudiantes de un pas, no solo tiempo de vencimiento, .concepto de la deuda; horas trabajadas; accidentes de trabajo,
en el present~;sino en el pasado, se tendra una poblacin infinita. En una industria asistencia, antigedad, salarios devengados, cargos, estudios realizados, tiempo de expe-
manufacturera; seran numerosas las poblaciones de estudio, de acuerdo con el obje- riencia, visitas al mdico, tiempo de incapacidades, etctera.
tivo de inves~gacin y, por consiguiente, con la variable principal que sea de inters Segn las ~teriores caractersticas, se conforman dos grupos: cualitativas y cuantitativas.
para el investigador. Algunas de ellas podran considerar caractersticas como: lotes o Caractersticas cualitativas Todas ellas se expresan mediante palabras, tales como:
unidades p;oducidas durante un periodo; cuentas por cobrar o de difcil cobro; n- sexo (masculino, femenino); grado (primero, segundo, ... , decimoprimero ...); aficiones
inerci de empl~.ados que laboran, etctera. (canto, lectura, deportes, teatro, ... ); calidad (defectuosos, no defectuosos); estudios
(economa, administracin, ... ); entre otros. Estas y otras ms se consideran caracters-
llUnidad.o elemento ticas cualitativas, y su cuantificacin se obtiene mediante el recuento: cuntos hombres
Es el objeto, institucin, regin, persona, familia, animal, etctera, que va a ser sometido y mujeres hay; cuntos al~mnos hay en cada grado, etctera. Estas se conocen tambin
a estudio, respecto a aquellas caractersticas que ms interesan. Esta unidad o elemento como atributos, y puede!"\ admitir varias formas de presentacin, denominadas modali-
dades o categoras. .
debe definirse._claramente, entenderse por todos, sin equvo.cos; adem~, de~e permitir
medirse o con,tarse, segn al tipo de estudio y, finalmente, haer comparaciones. El ele- Caractersticas cuantitativas El segundo grupo se conforma por aquellas caracte-

_J ___ _
! mento es incfiyisible, en cambio, la unidad es divisible, es decir, se puede descomponer rsticas que se expresan en forma numCrica, ya que requieren ser medidas, como: peso,
en otras unid;des o en otros elementos. valor, tiempo, nmero de accidentes o visitas al mdico. A las anteriores se les considera i

---------+-
1

:
Estadstica aplicada Capitulo 1 Aspectos gl!1lerales- Smnaroria, productoia y sfmbobJs

tambin como caractersticas cuantitativas, conocidas como variables, las que, a su vez, Tambin hay una observacin parcial o muestra, cuando se investiga una parte de los
tericamente se clasifican en variables discretas y continuas. elementos de una poblacin. Algunos la denominan como sttbpoblacin, sin ninguna
o Variables discretas: son aquellas que admiten nicamente valores enteros: el nme- diferenciacin; otros, por d contrario, la consideran aquella parte seleccionada, cuyos
ro de accidentes o visitas al mdico, son algunos ejemplos. Las variables discretas elementos presentan una caracteristica tan especial, que el resto de la poblacin no la
se cuantifican mediante el recuento. tiene. Esta ltima apreciacin no corresponde a la definicin de muestra y ms bien
e Variables continuas: admiten fracciones; por ejemplo, peso: 30 libras y 1Oonzas; concuerda con el concepto de estrato.
tiempo de experiencia dada en aos, meses y das, etctera. En las variables con- De acuerdo con la probabilidad que muestren los elementos por seleccionar, la
tinuas se procede mediante el uso de la medicin. muestra puede ser aleatoria o no aleatoria.
o Muestra aleatoria: deber ser representativa de la poblacin, si las probabilidades
de seleccin de los elementos son todas iguales, durante todo el proceso. Por
ti Investigacin total
ejemplo, el mtodo de seleccin por sorteo, aplicado a los estudiantes en un
Denominada tambin cemo o investigacin exhaustiva, se presenta cuando se investiga la saln de clases; para ello se elaboran fichas ya sea con el nombre o el cdigo del
totalidad de los elementos que constituyen la poblacin objetivo. alumno de manera que se identifique al elemento, todas se introducen en una
Cuando se hace referencia a un censo de poblacin, de viviendas, agropecuario o bolsa, luego se revuelven y van extrayndose de una en una de acuerdo con el
industrial, por ejemplo, nos est indicando una enumeracin completa de unidades o nmero de alumnos que han de seleccionarse. Este proceso puede hacerse con
elementos, ya sean personas, familias, viviendas, establecimientos industriales o explo- reposicin o sin esta, segn el criterio del estadstico.
taciones agrcolas en un tiempo dado, con unas caractersticas especficas.
La investigacin total, en muchos casos, es impracticable; por ejemplo: o Muestra no aleatoria: cuando algunos de los elementos de la poblacin tengan
ms probabilidad de presentacin que otros. Por ejemplo, la mayora de las en-
e Cuando el nmero de observaciones es demasiado grande o infinito, es imposi- cuestas de opinin, en las que los elementos se seleccionan en forma caprichosa
ble investigar a la totalidad de los elementos o unidades. o por conveniencia; por esta razn, sus resultados no merecen confianza.
e Cuando se requiere demasiado tiempo en su observacin o recoleccin, presenta
el inconveniente de desactualizarse cuando van a utilizarse. Denominada tambin como muestra no probabilstica suele ser ms sencilla y ba-
e Cuando los costos son elevados, superando los recursos disponibles para su rea- rata de obtener. Algunas de ellas son denominadas muestras ajuicio, muestras por
lizacin. cuotas y aquellas en las que los elementos se seleccionan de manera voluntaria.
o En casos como en el control de calidad, el elemento sometido a prueba puede Este procedimiento no es confiable, y por lo general conduce a errores. Solamen-
destruirse, impidiendo la investigacin de su totalidad; a esto podrn aadirse te tiene alguna validez cuando la caracterstica tiende a ser homognea.
algunas situaciones ms: por ejemplo, cuando la empresa no cuenta con personal o Muestra probabilstica: es aquella que se ha denominado aleatorio, dentro de la
suficiente para su realizacin; o cuando existe dificultad en la recoleccin de la cual se consideran los siguientes mtodos: el muestreo aleatorio simple, estrati-
informacin. ficado, por conglomerados, reas o geogrfico, sistemtico, por fases y la combi-
nacin de algunos de ellos que recibe el nombre de mixto.
1!1 Investigacin por muestreo
Esta expresin se utiliza frecuentemente cuando no es posible la realizacin de una investi- La grfica 1.1 de la siguiente pgina ilustra las clases de muestras y sus divisiones.
gacin total. Este procedimiento es menos costoso, ms rpido de realizarlo, requiere me-
nos personal y, finalmente, puede proporcionar una mayor precisin en los resultados. iilMuestreo
En la utilizacin de cualquiera de los procedimientos o mtodos de muestreo previa-
&Muestra mente establecidos para obtener una muestra, no debe perderse el objetivo, que es el de
Es la parte de elementos o unidades seleccionadas de una poblacin que contiene una considerar el mayor nmero de elementos con el menor costo posible.
caracterstica igual a aquella que no qued seleccionada.
Corresponde a una parte de la poblacin o subconjunto de un conjunto de elemen-. !f~Muestreo aleatorio o probabilstico
tos, que resulta de la aplicacin de algn proceso estadstico, generalmente seleccin de- Los mtodos del muestreo aleatorio pueden ser:

l liberada, con el objetivo de investigar las caractersticas de los elementosde la poblacin


0 del conjunto del cual proviene.
Mu~treo aleatorio ~imple Co~o su nombre lo !ndica, los elementos de la po-
1
blac10n deben tener 1gual probabilidad de ser selecciOnados para formar parte de la !
---l------------------------------ ------------------------.f------
:1
1
Estadstica aplicad'! Capitulo 1 Aspectos gmernles- Sumaroria, productoria y sfmbolos
-----------------.:...----------------------
Grfica 1.1 Clases de muestras Muestreo por conglomerados Se emplea a menudo para reducir el costo de mues-
trear una poblacin dispersa en un rea geogrfica extensa. Tambin se utiliza cuando
no es posible elaborar un mttrco con elementos finales o de anlisis; por tanto, se toma
la unidad, es decir, aquella que contiene ms unidades o elementos y que constituye el
determinado conglomerado. En este caso, se seleccionan al azar los conglomerados y de
ellos los elementos que van a constituir la muestra.
Muestreo por etapas Cuando de un marco se extrae una muestra de conglomerados,
para luego seleccionar de ella otra muestra, y as sucesivamente hasta llegar a la unidad
o al elemento de anlisis o final, se le denomina muestreo por etapas. Algunos lo denomi-
nan muestreo por reas ogeogrfico o conglomerados.

1! Muestreo no aleatorio
En este mtodo, denominado tambin no probabilstico, las unidades no se seleccionan
al azar, sino en forma caprichosa, por conveniencia o con alguna intencin; de ah se de-
duce que sus resultados no son confiables. Este mtodo incluye el muestreo voluntario,
: muestra. En la aplicacin de este mtodo, en primer lugar, debe elaborarse un listado el muestreo dea juicio y el muestreo por cuotas.
cqmpleto, actualizado y correctamente identificado, de los elementos que forman par-
Muestreo de voluntarios Es aquel en el cual las unidades o elementos no se seleccio-
te; de la poblacin, y que van a ser seleccionados por algn mtodo al azar, como el
nan, son ellos quienes deciden formar parte de la muestra, colaborando voluntariamen-
sorteo, extrayendo de un recipiente fichas o papeletas, cada una de ellas identificando
te, ya sea diligenciando un cupn que aparece en alguna publicacin o realizando una
a la unidad o al elemento, procedimiento similar al del bingo. Adems, en su lugar se
llamada para participar, suministrando la informacin solicitada.
podr utilizar la calculadora, oprimiendo primero la tecla SHIFT y luego, donde apa-
.rece RANN, despreciando el cero (O,) que aparece en pantalla al comienzo de la cifra; Muestreo a juicio Llamado tambin intencional, puesto que las unidades se seleccio-
taritbin se puede hacer lo anterior, mediante el uso de las tablas de mmeros aleatorios, nan a juicio del investigador, ya sea por conveniencia o .algunas veces con intencin.
c~struidas especficamente para ello. Tambin se denominan muestras dirigidas, y frecuentemente se utilizan en los procesos
',Est mtodo de muestreo, generalmente, se aplica en aquellos casos en que la pobla- de auditora.
c,in investigada no es muy grande, presenta poca variabilidad y los elementos, adems, Muestreo por cuotas A cada persona encargada de recolectar la informacin se le
muestran una reducida dispersin geogrfica, es decir, presentan una gran concentra- asigna cierto n.i:nero de unidades o elementos muestrales, cuya seleccin depende de la
~(in en 'el lugar en el que se realiza el estudio. decisin que tome el entrevistador, aunque, necesariamente, haya necesidad de estable-
cer o dar ciertas indicaciones.
:ryiitestreo estratificado Generalmente debe aplicarse cuando la poblacin requiere
s~~ dividida en sttbpoblaciones o estratos, por presentar su caracterstica un alto grado de
yatiabilidad, buscando, de esta manera, que cada uno de los estratos sea lo ms homo-
11 Parmetros
gneo posible, y un elemento dado no pueda pertenecer a ms de un estrato. Una vez Son medidas aplicadas a las caractersticas de las unidades de la poblacin. Frecuente-
establecidos los estratos, se elige, en cada uno de ellos, el nmero indicado de elementos mente interesa determinar un valor de la variable que represente o muestre el compor-
COI)siderados en la muestra aleatoria. tamiento, ya sea del total de la poblacin. Algunas de ellas podran ser:

Muestreo sistemtico Se aplica en aquellos casos en que la caracterstica investigada La media o promedio Por ejemplo, promedio de horas trabajadas, el ingreso medio
este ordenada, ya sea alfabticamente, por valor o cantidad o en forma cronolgica. El de los empleados, el rendimiento medio de algodn por hectrea, y muchos ms.
procedimiento de aplicacin es simple: se calcula un intervalo de seleccin, dividiendo el El total Por ejemplo, el total de establecimientos comerciales en una ciudad; el total
tamao de la poblcin por el nmero de elementos en la muestra. Al seleccionar al azar de granos recolectados en una cosecha, el total de faltas de asistencia de alumnos a clase
un nmero dentro de ese intervalo, este se constituye en punto de iniciacin o primer durante un periodo, etctera.
elemento seleccionado, y luego va sumndosele el valor del intervalo calculado, para la La proporcin Por ejemplo, la proporcin de nias que estudian bachillerato co-
! seleccin de los dems elementos. mercial; de establecimientos dedicados a la distribucin de determinado artculo; la de
!
I =NIn =intervalo de seleccin bachilleres que prestan servicio militar obligatorio, entre otros. 1
!
----------i------------ ..... - --- -- -- -- ------- ---------r------
\ .
Esladslica aplicada
:.-------------------~~~~lUID 1 Aspectos genernlcs- Srmzntoria, produ_ctoria y simbo/os 4]_
1
. al' .. d l ~ por ejemplo, se selecciona un nmero de estudiantes y se analiza nicamente a aquellos
La razon' ' . .
p r e'emplo la relacin entre el gasto de dinero en Imentos Yv!Vlen a; a . lo log1co
que trabaJan; , . sena , selecciOnar
. . do numero
un determrna ,
de alumnos, dentro del
1
relacin o razn de hombres y mujeres, como, cuando se dice que por cada hombre hay tal d 11 al 1 b
to que esarro an guna a oro tra aJan. b .
dos mujeres en un establecimiento escolar, etctera.
En el desarrollo de ~te libro se vern otros promedios como: mediana, media geom-
trica, media armnica centro recorrido, cuartiles, deciles y percentiles, sin olvidar que exis-
ten muchos ms.
La importancia que tiene la estadstica radica en sus grandes aplicaciones en las diferen-
Se mencion anteriormente que estas y otras medidas, aplicadas a las caractersticas
tes actividades. En la vida cotidiana, se leen, interpretan o usan datos, muchas veces sin
de la poblacin, se les denomina pardmetros o valores estadsticos de la poblacin; y al
tener conocimiento de lo que es la estadstica, pero una persona con algunos principios
aplicarse, a las caractersticas de las unidades o de los elementos en una muestra, se les
estadsticos sacar ~ejor provecho de la informacin. Si se trata de un profesional, la im-
denominan estimadores; algunos a estos ltimos los identifican como estadgrafos.
portancia de estos instrumentos ser mejor, ya que se utilizar en su campo de accin.
La estadstica se considera una herramienta de vital importancia en la toma de deci-
11 Estimador siones, pues suministra la informacin necesaria para la valoracin de planes y progra-
Pitrnan establece alguna diferencia entre estimador y estimacin. El primero se considera
mas; adems, su adecuada utilizacin depender en especial del conocimiento, habili-
como una norma de procedimiento, utilizada para estimar una constante perteneciente
dad y experiencia de quien la emplea.
a una poblacin; y la segunda, para los resultados o valores obtenidos. El estimador se
Vale la pena repetir lo anotado por Salomn Fabricant, sobre su importancia: "Todo
puede clasificar en puntual y por intervalos. el mundo parece coincidir en que la estadstica puede ser til para comprender, evaluar y
o Puntual: cuando hace referencia a un solo valor o punto calculado. controlar el funcionamiento de la sociedad". Por otra parte, H. G. Wells deca: "El pen-
o Por intervalos: cuando corresponde a dos puntos, dentro de los cuales se consi- samiento estadstico un da serd tan necesario para una ciudadana eficiente como el saber
dera estar contenido el parmetro, con cierto grado de confiabilidad, el cual ha leer y escribir~ Todo lo anterior se corrobora, si se observa que la mayor parte de los
sido establecido por el investigador. acontecimientos que diariamente ocurren en la sociedad, en cualquier campo y parte
del mundo, se encuentran estrechamente ligados a la concepcin de nmero y medida.
lllnferenda estadstica Se podra afirmar, sin temor a equivocacin, que la mayor parte de las actividades del
Uno de los objetivos de la estadstica es obtener conclusiones o generalizar acerca del ser humano o de las instituciones, por no decir que todas, no importa la rama en que se
parmetro, mediante el clculo de estimadores, en una muestra aleatoria extrada de una desarrollen, estn afectadas en mayor o menor grado por decisiones basadas en antece-
poblacin. dentes de tipo cuantitativo.
Se podr comprender la importancia que tiene la estadstica, si se obsef'ian despre-
llllntervalo de confianza venidamente algunos de los siguientes puntos de reflexin:
Indica los lmites de precisin en una inferencia, es decir, al calcular una medida en la mues- o Los mtodos estadsticos se utilizan a diario, tanto en el sector pblico como en
tra, por ejemplo la media aritmtica, esta podr ser igual o diferente al del parmetro; por el privado.
tanto, es preferible establecer unos lmites dentro de la cual se pueda encontrar esta ltima o Las noticias, frecuentemente dadas en los diferentes medios de comunicacin,
con cierto grado de confiabilllidad preestablecido, no mayor all Oo/o. requieren interpretacin estadstica.
e Algunas de las materias del plan de estudios necesitan la aplicacin de estos co-
111 Error, sesgo o bias nocimientos.
La difernca que puede haber entre estimador y el pardmetro se denomina errores o o Para conocer su rendimiento acadmico a travs del promedio de calificaciones o
sesgo generalmente es cuantificado por el investigador. Hay tambin errores ajenos al la posicin ocupada en el curso, se utiliza desprevenidamente la estadstica.
muestreo, los cuales surgen de imperfecciones y equivocaciones en el registro, conteo y
Es tan vasto el campo de aplicacin que se le ha dado a la estadstica, que sera
anlisis de las informaciones; son fallas instrumentales y/o humanas.
larga su enumeracin y podra resumirse diciendo que todas las ciencias, de una u
otra forma, la aplican. Sin embargo, podra afirmarse que en todas las actividades
11 Dominio de estudio
econmicas, el empresario, el industrial o el hombre de negocios, en general, la utili-
Se produce cuando se establece el tamao ptimo de la muestra, es decir, se cuen;a con
1 za, ya sea para el anlisis financiero, en las ventas o en los procesos de la produccin;
11 1 el mnimo de elementos que debe tener la muestra y, luego, se trabaja con.un n~mero
tambin en la investigacin de mercados, para ellaiJ.zamiento de un producto, para
1! .. f... .................. in.f<<io< , ~- T=hiln rumdo d <fu<o do k mn~tta no ro'"'l"'odo ' lo """'',Wo;
Estadstica aplicada Captulo 1 Aspectos gcuemlcs- Smnatoria, prodttctoria y smbolos
1 - - - - _ ; _ - - - .- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

averiguar su grado de aceptacin o para la proyeccin de su produccin y de sus ven- financieras, en el control y elaboracin del presupuesto, en la realizacin de inventarios,
tas; piando se desea aceptar o rechazar un lote de su producc~n o de la materia prima en la administracin de personal, etctera.
.~amprada; en la elaboracin del presupuesto, o como parte integrante en el desarrollo Se podra seguir mencionando una gama de actividades, profesiones o campos don-
de :i-~iticas y decisiones de carcter administrativo. de la aplicacin de la estadstica es necesaria para el economista, el contador, el auditor,
.l Estado la utiliza frecuentemente para trazar polticas econmicas y administrati- el ingeniero en todas las ramas, el actuario, el socilogo, el gelogo, el mercadotecnista,
va.S;}!q la elaboracin de planes de desarrollo, ya sea para todo el pas, para una regin o el periodista, ... todos ellos tendrn que aplicar de alguna manera estas tcnicas en su
un s~cior especial; en la elaboracin del presupuesto de inversin y de funcionamiento; ejercicio profesional.
eni~Jormacin de polticas, ya sea en lo fiscal, aduanero, carcelario, educativo, etctera. Hoy, el uso del computador y algunas calculadoras manuales facilitan la utilizacin
Tan.ib'in se utiliza en las campaas electorales, para determinar el grado de aceptacin de paquetes estadsticos, como: SAS, MICROSTAT, TSP, SPSS y otros ms, necesarios para
op.~pularidad que presenta el candidato a una corporacin pblica. el manejo de abundantes datos numricos, permitiendo su agilizacin y la aplicacin de
~tilla salud y la medicina, el Estado, los fabricantes de d~;ogas, las instituciones o una variedad de medidas que estos paquetes ofrecen, que facilitan el proceso de anlisis
proFesionales. en el campo de la salud, realizan investigaciones encaminadas al trata- y la toma de decisiones.
ni.lelto d~ ciertas enfermedades, como el sida, o al mejoramiento de los productos En todos los campos, la utilizacin de los mtodos estadsticos se encamina hada:
. erl~~~tes, buscando que sean ms efectivos; o para deterrhinar los posibles efectos o Aquellos procesos que permitan recolectar, agrupar, concentrar o descubrir con
: sec\indarios que puedan tener; tambin en el desarrollo de programa> sanitarios, en la mayor facilidad ese cmulo de informacin, a travs de lo que algunos llaman
pr~~~cin de enfermedades. "reducci6n de datos" .
. :pif el sector agrcola, por ejemplo, se observa la aplicacin de la teora mendeliana e El anlisis de los datos, mediante la observacin directa o el desarrollo de experi-
'de'!i herencia, en la obtencin de nuevas variedades de mayor rendimiento o ms re- mentos, con el fin de realizar estimativos o comprobacin de hiptesis.
si~te~tes frente a plagas o enfermedades; en la aplicacin de fertilizantes e insecticidas, e Determinar o indicar los cambios que sufren los datos a travs del tiempo, o
etif:ra. En este campo se observa, as como en la biologa, la utilizacin de mtodos estimar su comportamiento futuro .
. est~dsticos para la realizacin de investigaciones que permitan detectar las reacciones 0 Determinar las causas que originan esos cambios y permitir relacionar dos o ms
n~ ~ola de las plantas sino de los animales. Hoy dia es preocupacin permanente el hechos.
aulriento y mejoramiento de los recursos alimenticios, para atender a una poblacin cre-
c.ie(ite y, en gran parte, en condiciones nutricionales nada satisfactorias, lo cual requiere Dentro de la mltiple utilidad que ofrece la estadstica, vale la pena recordar que
el apoyo de los mtodos estadsticos. todas aquellas actividades que se realizan en procura de un mejoramiento econmico,
n foica y qumica se emplea con frecuencia, y una de sus aplicaciones es la contrasta- en salud y educacin, elevando, por consiguiente, las condiciones de vida, estn liga-
.. ci~; de hiptesis con base en resultados obtenidos a travs de experimentos, aplicando la das a los programas de desarrollo de un pas a travs de sus instituciones, las cuales
tGdica estadstica conocida como diseo experimental. riecesitan detectar y disear polticas basadas en informaciones recogidas, tratadas y
'~i estadstica tiene un vasto campo de aplicacin, tanto en las empresas comerciales analizadas median la aplicacin de mtodos estadsticos. Sin embargo, muchas ve-
como en las industriales. Si se considera que la empresa es una organizacin dentro de ces se critica al g9bierno de turno de no contar con informacin estadstica confiable,
1~ ~~iu se realiza una serie de operaciones, casi siempre, con la meta de obtener benefi- sin saber que estos hechos de ocurrencia diaria o peridica requieren cumplir ciertas
'~[6~ ~el capital invertido, se requiere informacin organizada que sirva de control y que condiciones para que formen parte de las estadsticas. Estas se describen continua-a
irerita hacer planes fu turistas. . cin.
. -~ estadstica, dentro de la empresa, cumple, entre otras, las siguientes funciones: l. Deben manifestarse al exterior, es decir, no se trata nicamente de observar su
ci: Permite obtener una visin general de la empresa y de algunos de sus aspectos presentacin, como el contrabando, pues para ello bastara visitar los "Sanandre-
en partcula;. sitos" o lugares donde generalmente se realizan. La manifestacin o su observa-
.( Facilita descubrir las relaciones causa efecto en las distintas manifestaciones eco- cin debe hacerse mediante registros. Si los registros presentan deficiencias, estas
." nmicas. se reflejarn en las estadsticas. Muchos usuarios critican las estadsticas del sector
.e. A~da a analizar y a separar lo que es normal de lo qu~ no lo es, es decir, permite oficial as como las del sector privado, pero no se dan cuenta de la falta de con-
. ejercer control en muchas de las actividades u operacio~es de la empresa. ciencia o e[ desinters de algunas personas hace que muchas de las informaciones
no se registren; tal es el caso de los robos, violaciones domiciliarias, entre otras,
'
Ia estadstica aplicada en una empresa es importante para: la planeacin de operado- donde la gente no acude a colocar el denuncio correspondiente. As que los indi- 1

cadores sobre estos hechos solo harn referencia a las informaciones registradas, 1

. ----- ---------- ------;----

1
1
Estadstica aplicada Capitulo 1 Aspectos gt!llemles- S11mt1toria, prod11ctoria y smbolos
-------------------------~:....------------- ----
y solo sobre ellas se aplicarn los instrumentos de medicin. As, aquellos hechos La mala interpretacin, en algunos casos, se debe a que no satisface intereses perso-
que no se registran, no sern abarcados por la estadstica. nales; en otras ocasiones, se presentan acomodadas a determinadas circunstancias, pero
2. Adems de ser registrados, para su estudio requieren que correspondan a hechos generalmente es la falta de informacin sobre la metodologa empleada, es decir, cmo
colectivos, descartando los individuales; es decir, lo sucedido a una persona no se dise, qu grado de confiabilidad tiene, cul es su cobertura y cul es su verdadero
ser analizado en forma particular, debe, entonces, formar parte de un grupo, significado o intencin, si lo tiene.
masa o colectivo de datos para su estudio. El registro de la produccin de una Mi preocupacin en estos momentos es el enfoque de este libro, si se debe conservar
empresa solo tendr un inters particular, pero si el gobierno es quien piensa la forma tradicional de presentacin, tal como ocurre en la mayora de los textos o si,
intervenir el mercado, la informacin formar parte del sector que se analiza. p9r el contrario, nos concentramos en las etapas de planeacin, recoleccin, sistemati-
3. Se podr agregar otra condicin, como la de su frecuente repeticin. Un hecho zacin, la forma adecuada de presentacin de los datos (cuadros, grficas) y anlisis de
que se presente en forma aislada, es decir, ocurre una vez y difcilmente vuelve los resultados obtenidos a travs del uso de la calculadora, del Excel o cualquiera de los
a ocurrir, no es observado por la estadstica y queda solo como un registro hist- paquetes estadsticos, ya que estos se incluyen en la parte operativa, mediante la aplica-
rico. Cuando dice que el hecho debe repetirse, no se hace referencia a que ocu- cin de frmulas. En este ltimo proceso, se pensara que solo se debera hacer nfasis
rra a cada momento; es posible, en algunos casos, que transcurra cierto tiempo en ensear qu medidas o procedimientos .son los ms adecuados y el porqu de su uti-
para que se repita, tal como sucede con aquellos productos estacionales, o en lizain ptima. Mi decisin, a esta altura de elaboracin, creo en la combinacin entre
el caso de las matrculas que ocurren cada ao o cada semestre. Debido a su las dos formas de presentacin de tal manera de poder alcanzar los objetivos propuestos
presentacin en forma peridica, se les consdera como hechos distantes en el desde su inicio.
tiempo.
4. Adems de su frecuente repeticin, deben ser a la vez de distinta frecuencia. Si la
11 Fuentes de informacin
frecuencia es constante, de este hecho no se ocupa la estadstica. Por ejemplo, las
transacciones comerciales, el volumen o valor de las ventas que se registran todos Las fuentes de informacin se clasifican en: internas, externas, primarias y secundarias.
los das, los nacimientos, defunciones, etctera, s son de inters para la estads-
Fuentes internas
tica, pues la intensidad es diferente de un periodo a otro. Si, por el contrario, el
valor o la cantidad fuera igual a cada momento, bastara registrar una sola vez. All los datos se producen y se registran internamente dentro de la empresa o entidad,
No se requiere que el hecho se presente en el mismo lugar, puede estar ocurrien- en donde se puede obtener informacin sobre ventas, produccin, cuentas por pagar,
do en diferentes sitios; por tanto, la estadstica abarca tambin aquellos hechos consumo de materia prima, horas trabajadas, etctera.
distantes en el espacio. Quizs por desconocimiento, o ignorancia, muchos no le dan importancia a las
5. Finalmente, se podr decir que aquellos hechos cuyas caractersticas cualitativas fuentes de informacin interna, y a veces las consideran como operaciones corrientes que
pueden cuantificarse, son tenidos en cuenta por la estadstica. El amor a la patria forman parte de la rutina de los departamentos de contabilidad, ventas, produccin,
o al trabajo no se pueden medir o cuantificar, pero s el nmero de personas por recursos humanos, etctera, pues desconocen que la verdadera investigacin comienza
cargos, ocupacin, sexo, profesin, el nmero de artculos vendidos por departa- precisamente all, para iniciar, de esta manera, la bsqueda de informacin externa, por
mento, marcas, modelos, sucursales, ... , son ejemplos de caractersticas cualitati- no encontrarse esta dentro de los archivos y documentos de la empresa.
vas que s las abarca la estadstica.
Fuentes externas
Son aquellas que suministran informaciones o datos de lo que sucede fuera de la em-
presa. Por ejemplo, una encuesta acerca de las personas que utilizan los productos de la
Mru~d~la~t~ffiti~L=================== empresa, a fin de conocer el grado de aceptacin.
Despus de hacer alusin al campo tan amplio de aplicacin y la importancia de la esta-
dstica en todos los aspectos de la vida diaria, puede concluirse que ella puede emplearse Fuentes primarias
para probar o mostrar cualquier hecho que ocurra. Algunos medios de informacin, Cuando una persona, entidad o empresa realiza una investigacin, con las consiguientes
1 que parecen veraces, mediante las estadsticas demuestran lo que ellos creen que puede etapas de recoleccin, procesamiento y andlisis, esta informacin se constituye en fuente
. !, ser cierto o falso, informacin que muchas veces debe aceptarse sin discusin. Otras de primaria.
, las estadsticas correctamente diseadas y elaboradas se consideren engaosas, por el Algunos denominan a las fuentes primarias como mtodos de observacin directa, i
~---l--
111
- - ----~""imlm<o ~
q"' ti= <k ], <iwi"' plic.W. m '" O,bornci6n.
ya que la informacin la recoge el interesado mediante la aplicacin de un formulario

. - - - - - --r 1
i ~ ,,.,.~...,..,-"'"~'' ,,.,~,;.,., ~
y
....,.. "'""' ...,

o cuestionatio. Gracias a aquellas se observan o se registran los datos directamente de la


fuente de informacin, es decir, de las unidades que son objeto de estudio.
Etapa 1. Planteamiento o formulacin del problema
El conocimiento del problema plantea la necesidad de realizat una investigacin. Por
Y
ejemplo, un empresario siempre estat atento a la situacin interna de la empresa, lo
Fuentes secundarias
cual se constituye en tatea diatia de direccin. Evala los resultados de gestin frente
En cambio, pata otra persona, entidad o empresa diferente a quien la produce, la informa- a los objetivos trazados, que van visualizndose a travs de informaciones recogidas en
cin se convierte en fuente secttndaria. Estas se obtienen de boletines, revistas, peridicos, los diferentes depattamentos, sobre: ventas, patticipacin de mercado, costos, liquidez,
publicaciones especializadas y de los informes realizados por otras entidades o empresas. imagen, etctera, que en algunos casos podran mostrat anormalidad, sntomas sobre los
cuales se deben diseat los respectivos correctivos por aplieatse, con base en la formula-
lj Clases de investigacin cin de una serie de hiptesis.
Se menciona a Inglaterra como el pas donde se inician las investigaciones de mercado La decisin de realizat una investigacin nace cuando se siente la necesidad de di-
y de opinin pblica; sin embatgo, en Amrica del Norte tomaton mayor auge, y cada sear correctivos o fijat polticas a corto o largo plazo, que mejoren la situacin de la
da se ve en todos los pases o lugares; cmo las entidades gubernamentales, y en especial empresa, y cuando no se disponga de una informacin adecuada, lo cual requiere la
las empresas privadas, cuentan con clepattamentos de investigacin. elaboracin de un plan de investigaciones que permita la recoleccin y el anlisis de
..-.
La investigacin se podr clasificat en dos clases: descriptiva y experimental. esos resultados.
Se debe tener muy en cuenw que las conclusiones estadsticas dependern en gran
Investigacin descriptiva patte de la informacin recogida y esta, a su vez, de la formulacin del problema.
Se realiza sobre hechos reales con e\ fin de explicat, de modo sistemtico, sus catacte-
_ ...
rsticas. Esta clase de investigacin comprende etapas como la recoleccin, descripcin, Etapa 2. Formulacin de objetivos
andlisis e interpretacin de los datos; tambin puede referirse al andlisis de datos prove- Clatamente definidos, los objetivos indican aquello que se desea hacer.
nientes de fuentes secundatias. Se puede afirmat que, generalmente, se utiliza el mtodo " Qu se va a investigat?
de casos y el estadstico. o Cmo se va a realizat?
En el depattamento de mercados de una empresa, la investigacin descriptiva podra o Cmo se pueden obtener los datos? Mediante una investigacin patcial o total?
estat encaminada, por" ejemplo, a describir las catactersticas del mercado de un pro- e Cul sera el diseo de muestreo?
ducto o de la empresa en general;-la aplicacin de algunas medidas, para determinat
o Qu cobertura tendra?
.. la proporcin de personas que prefieren esa matea, es decir, conocer la reaccin de los
..... o Dnde se va a investigat?
consumidores frente al producto, o el comportamiento futuro de las ventas, etctera.
o En qu lugat?
. .'~~ Investigacin experimental o Qu reas debern incluirse?
Corresponde a una observacin dirigida en unas condiciones rigurosamente controla- G Cundo es el momento ms indicado pata llevatla a cabo?
.. ,. das, determinando las relaciones de ::ausa y efecto. Debe quedat elato que el experimen- o Cundo se necesitan?
to es una situacin provocada, siendo esencial el empleo de un diseo adecuado pata a Pata qu se requiere la informacin?
evitat, de esta manera, situaciones que invaliden la investigacin. o A quin va dirigida?
La investigacin experimental difiere de la investigacin descriptiva en que la primera o Cul es la unidad de investigacin?
tiene su base en realidades fsicas, y la segunda, en abstracciones; adems, si las condi-
ciones no vatan, no se puede actuat sobre ellas,_ y tampoco reproducirlas, como cuando Algunos establecen diferencias en cuanto al elemento y la unidad. La primera es indi-
se realiza una experiencia en el laboratorio pata comprobat su desatrollo. visible, por ejemplo una persona, un objeto; la segunda, podr dividirse, por ejemplo,
Algunos la denominan modelos metodolgicos y la clasifican en: (a) histrica; (b) expe- en barrios, estos en manzanas, estas en viviendas, luego en hogates y a su vez en perso-
rimental; (e) descriptiva; (d) correlacional (e) ex post jacto sobre hechos cumplidos; (f) cttasi nas. Esta ltima corresponde al elemento.
! experimenta4 (g) terica; (h) participativa; (i) evaluativa; (j) estudios de casos; (k) bibliogrdfica. La clatidad del objetivo dar una visin perfecta de lo que se va a hacer, es decir:
li
i!l (a) el fin de la observacin; (b) la eleccin y definicin de la unidad; (e) la list de los
:: ~ E Etapas en una investigacin elementos denominado mateo o mateo de seleccin y de las catactersticas; (d) el mo-

'~d
1 .

El modelo descriptivo, que tambin se denomina estadstico, requiere pata su ejecucin
nueve etapas, que se describen a continuacin.
! ----------- - -- ...
mento en que se va a realizat; (e) el mtodo de observacin; (f) las condiciones en que
se desatrollat; (g) la eleccin de las medidas que se empleatn.
----------

1 ,,
t.-
.
t.....,~ Defini~ investigac~~
~)\)\vf'\'-\- -, 0'1) ,~~ \ j . ~
- ,, '\!'(}" ~:;0
1\\) V

CapitUlO 1 Aspectos genemles- Sumntoria, productorit y smbolos .


--------------~--~------~- 21 -
'''":pa 3. unid:de 2. Formular preguntas claras, concisas, utilizando trminos a nivel del informante, para
que sean entendidas por todas aquellas personas involucradas en el estudio.
la unidad de investigacin se definir cuando los objetivos de la investigacin se hayan
3. No hacer preguntas que de antemano se est seguro de que no van a ser con-
determinado con precisin. Se podr saber si hay necesidad de otras unidades de selec-
testadas.
cin para llegar al elemento o la unidad final, es decir, el objeto de estudio. Lo anterior
4. Iniciar con las preguntas generales, para luego seguir con las especficas.
permite elaborar el marco o marcos, es decir, conformar y actualizar el listado de uni-
dades o elementos de la poblacin que se seleccionarn al azar o en forma sistemtica. Existen tres (3) formas para hacer una encuesta: entrevista personal, entrevista telef-
De esta manera, se podr establecer con exactitud la cobertura, el tiempo necesario, nica y el uso del correo.
la naturaleza cuantitativa y cualitativa del hecho. No se debe olvidar que las unidades
Entrevista personal Es un mtodo muy costoso e implica un gran esfuerzo de adies-
deben ser accesibles al observador.
tramiento a fin de tener la seguridad de que el entrevistador podr extraer con habilidad
Etapa 4. Formulacin de hiptesis la informacin deseada. Las ventajas principales de la entrevista personal son: el por-
Las hiptesis son supuestos que se hacen en una investigacin para luego ser comproba- centaje de respuestas que se logra hacer suele ser el mximo, y el entrevistador puede
dos. Las hiptesis estadsticas son aquellos supuestos respecto a valores de la poblacin . rectificar con ms facilidad las ambigedades imprevistas.
o parmetros, y cuya comprobacin requieren la aplicacin de mtodos estadsticos. Entrevista telefnica Al igual que la anterior, es un mtodo muy costoso porque
Aquellas hiptesis que no hacen referencia a un valor (media, propordn, razn, etc- requiere amplia capacitacin del encuestador; no obstante, los porcentajes de respuesta
tera), son simplemente hiptesis. no suelen ser altos, porque no hay un contacto, entre el entrevistador y el entrevistado,
Algunos ejemplos de hiptesis descriptivas son:"El rendimiento del curso en el pre- directo.
sente periodo lectivo es bueno"; "En un gobierno de coalicin, la inmoralidad de los
funcionarios disminuir''; "Si hay inversin social, la situacin de orden pblico mejora- Encuesta por correo Aunque es la menos costosa, por lo general presenta un mnimo
r''. Como se observa en los ejemplos anteriores, no se hace mencin de valor alguno. porcentaje de respuesta. En ocasiones, las personas que en un momento dado las contes-
En cambio, "Los salarios en el ao venidero aumentarn por en~ima del ndice de taran, van posponiendo el retorno de los formularios y, por ende, producen demoras o,
precios al consumidor" o "Los precios en diciembre subirn en una proporcin inferior en algunos casos, faltas de respuesta a muchas de las preguntas, que en vez de permitir
a la del ao pasado" o "El promedio de calificacin del curso ser superior a la califica- la conclusin del proyecto, lo retardan de forma considerable.
cin de 4.1 ", todos ellos, son ejemplos de hiptesis estadsticas. Las preguntas, hasta donde sea posible, deben ser cerradas, en las que el informante
tiene dos posibilidades de respuestas: s o no. Tambin podran ser de respuesta numri-
Etapa 5. Mtodos de investigacin ca simple; por ejemplo, la edad, para que una persona coloque en el espacio indicado, el
Ya se anot que la investigacin puede ser total {censo) o parcial {muestra), dependien- nmero de aos o para que elija uno de los intervalos preestablecidos. Se acostumbra,
do de ciertos factores que tambin se mencionaron: ostos, tamao de la poblacin, con mucha frecuencia, utilizar pregunt~ de seleccin mltiple, en los que la persona po-
tiemp~. Sabiendo, adems, que cada elemento tendr cierta cantidad de informacin, dr sealar ms de una respuesta, como en la pregunta referente al deporte o deportes
se deber seleccionar la estrictamente necesaria, dependiendo tambin del nmero de que practica. Las preguntas poco recomendables, por la dificultad que presentan en su
unidades o elementos que se va a investigar, su dispersin geogrfica y el grado de varia- tabulacin, son las abiertas, que permiten la libre expresin de acuerdo con la opinin
bilidad que la caracterstica presenta. que se tenga en el momento de la entrevista.
El diseo de la encuesta por muestreo ayudar a controlar la cantidad de infor- Antes de aplicar el cuestionario, es necesario someterlo a prueba realizando una pe-
macin y su variacin, y en la decisin sobre cul sera el mtodo ms indicado en quea preencuesta, lo cual permitir hacer las correcciones necesarias, mejorar su diseo
esa investigacin. Se proceder, luego, a establecer el mtodo de observacin o re- tanto en las preguntas como en las instrucciones. La encuesta preliminar o piloto permi-
coleccin de datos, siendo los ms usuales, entre otros: las entrevistas personales, por te, entre otros aspectos, familiarizar al entrevistador con el formulario y con la unidad a
telfono, la observacin directa, cuestionarios enviados por correo. Cada uno de ellos la que se va aplicar el instrumento; conocer la reaccin de los informantes; determinar el
presentar ventajas y desventajas. Cualquiera de estos mtodos que se vayan a aplicar, tiempo que dura la entrevista. De esta manera se podr estimar el tiempo necesario que
deber tener muy en cuenta, al elaborar preguntas, minimizar la falta de respuestas o requiera la recoleccin. Hoy da, en cualquier investigacin, es indispensable tener un
contestaciones incorrectas. Al disear un cuestionario, vale la pena tomar en cuenta mayor conocimiento sobre la poblacin objeto de estudio, para poder estimar el grado
lo siguiente: de dispersin, para lo cual se aplica una de las medidas estadstica denominada varianza
l. Incluir nicamente aquellas preguntas que sean estrictamente necesarias, puesto o, eh otros casos, la proporcin, ambas fundamentales para determinar el tamao pti-
que un elevado nmero de ellas incrementar su costo y tiempo. mo de la muestra.
Estadstica ttplicada
---- ~
~,,
C-0 1 ~~~oook-~'""P-'-y"d~los ?,
_J
Una ve:z que el investigador ha es_tudiado los pros y contras en cada una de las pre- , do; el tamao de la muestra calculada, as como el diseo del cuestionario, las
guntas, se organiza el cuestionario d~ forma apropiada y se alistar una prueba piloto, ,_ preguntas que se hicieron; la indicacin de la fecha en que se inici y termin
a fin de examinar el instrumento de recoleccin, en cuanto a claridad y extensin. Esa la recoleccin de la informacin. En los captulos siguientes, en forma breve y
prueba se hace generalmente con un grupo pequeo de sujetos u objetos, y es una fase descriptiva, se har la exposicin de los puntos ms importantes, apoyados en " ~'\ .,_
esencial para efectuar la encuesta. Este grupo de personas no solo aportarn un estima- cuadros, grficas y otros resultados que sean consecuencia de la aplicacin de > ~
tivo del tiempo necesario para responder a cada encuesta, sino que se les puede pedir mtodos estadsticos. (>
::~
sus comentarios respecto a ambigedades percibidas y la recomendacin de preguntas 2. Conclusiones Constituye la parte fundamental del informe, ya que en ella apare- --:;; \?'"':,
adicionales, si fuese necesario. cen relacionados los resultados obtenidos, la confrontacin con lo esperado, la )J;:~\
exposicin de cmo deben ser interpretados y qu se deduce de ellos. El infor- .,,,..
Etapa 6. Recoleccin' de datos me, adems, debe remitir al lector, cuando sea necesario, a consultar todos los 11
. ::
Distribuyendo o aplicando los instrumentos de recolecdn, de los cuales ya se hizo cuadros y grficas que hagan ms comprensible la explicacin y, sobre todo, la \;,
referencia, se recomienda la supervisin permanente del trabajo de los encuestadores, presentacin de recomendaciones. '-:J'~
quienes con anterioridad recibieron un riguroso entrenamiento sobre la forma de en-_
trevistar, el manejo del instrumento y el propsito de la encuesta. Por otra parte, es el
(
I_-
-
,;.'
---
3. Apndices Integra toda la documentacin que se ha citado en la introduccin y K
en las conclusiones, para que el lector del informe pueda consultar rpidamente()
momento de volver a la fuente de informacin cuando se detecten inconsistencias, para y con facilidad cualquier informacin contenida en el mismo.
as corregir fallas de algn entrevistador, o para hacer planes para las no respuestas o
unidades que no fueron detectados olocalizadas.
ti Seleccin del tamao de la muestra
Etapa 7. Organizacin y manejo de la informacin En vez de realizarse un cemo completo, los procedimientos del muestreo estadstico se
Recolectada, verificada y controlada la informacin, debe procederse a su organizacin han vuelto el instrumento preferido en la realizacin de la mayora de las encuestas.
y manejo. La informacin podr procesarse en forma manual o mecnica, dependiendo Existen tres razones principales para preferir una muestra: primera, se suele necesitar
de la cantidad de unidades o de preguntas determinadas, de la disponibilidad de equipo demasiado tiempo para hacer un censo completo; segunda, es muy costoso; tercera,
o dinero. Esto permitir agruparla de acuerdo con los criterios preestablecidos, acordes es engorroso e ineficiente obtener un conteo completo de la poblacin objetivo. Por
con la forma de presentacin, anlisis y descripcin del hecho, de manera que faciliten tanto, una encuesta ha de servir para hacer inferencia sobre la poblacin total, con base
la obtencin de conclusiones o recomendaciones. en los resultados obtenidos de la encuesta, seleccionando una parte representativa de la
poblacin.
Etapa 8. Anlisis de los datQs
Luego de organizada la informacin, se proceder al anlisis de los datos comenzando IIISeleccin de elementos o unidades
por la aplicacin de aquellas medidas que permitan la obtencin de estimadores, y que
Cuando se hizo referencia al m;testreo aleatorio simple (MAS), se mencionaron y explicaron,
adems faciliten la comprobacin de las hiptesis establecidas.
en forma simple, algunos de los mtodos para la seleccin de unidades; sin embargo, vale la
Etapa 9. Redaccin y entrega del informe final pena detenerse en ellos y dar una explicacin un poco ms amplia que permita su aplicacin
inmediata a travs de ejercicios desarrollados en clases.
Corresponde a la ltima etapa de la investigacin y a la culminacin de todos los
Para la utilizacin de cualquiera de los mtodos de seleccin hay que tener en cuenta
trabajos que la misma caus.
los aspectos que se describen a continuacin.
A pesar de que el informe constituye un todo indivisible, se consideran tres partes
perfectamente identificables: introduccin, conclusiones y apndices. Elaborar un listado completo y actualizado de los elementos
\.. l. Introduccin En esta parte de~ informe se utilizar un lenguaje sencillo y ameno, o unidades que conforman la poblacin objetivo
dejando por fuera los tecnicismos, de manera que sea entendible por quien lo Por ejemplo: si se considera como poblacin los alumnos matriculados en un plantel, si
lea; adems, debe mantenerse una secuencia que guarde armona con el proceso se va a investigar el total de drogueras existentes en la ciudad, a los t[_abajadores de una
utilizado en la investigacin. Se har claridad sobre el planteamiento del pro- empresa o el total de manzanas de una zona o de un barrio, en todas estas poblaciones
-. 'l blema que condujo a la reaizacin del estudio, la fijacin de objetivos, eleccin se deber elaborar un listado o croquis que se constituye en el marco de referencia, y del
1 del mtodo de investigacin aplicado, incluido el mtodo de seleccin utiliza- cual se extraern los elementos que conformarn la muestra. En la elaboracin de un
1
. ~-------------- .... ------- - - ----.
-!
ly----ap_t_ca
....... ,. "'=~~co,-=-po~r ur:;~ar elli:ro actas de ~:ricula q::~enga-~1 plantel;
:
el-lis-ta_d_o_d_e--:~-~~:~ml-.-nar-=-n-to-s d-gi_to_s
,~,..,..,_,.,.,.,_,~"''"""''~''".>""""'
~:-tendrn que utilizar, de acuerdo con el
tam~o de -
0
drogueras inscritas en la Secretaria de Salud o en la Cmara de Comercio; la nmina la poblacin.
que utiliz la empresa para el pago de los ltimos salarios. La Oficina de Catastro los e Establecer la direccin que se seguir en su lectura.
puede suministrar el croquis donde se localizan las zonas, barrios 0 viviendas objeto de o Solo se seleccionarn aquellos nmeros que formen parte del marco muestra!.
estudio.
e Hacer la seleccin con reposicin o sin esta. En el primer caso, el elemento podr
Las unidades o elementos se identificarn en el marco, ya sea , seleccionarse ms de una vez; en el segundo, una vez tenido en cuenta, no podr
mediante el nombre, su direccin o el uso de. un cdigo seleccionarse nuevamente.

Generalmente, se procede a la enumeracin de la poblacin. Si esta est constituida


por 82 elementos, se numerarn desde O1 hasta 82; si la conforman 480 elementos, se Considrese la seleccin de los elementos o unidades en una muestra aleatoria me-
numerarn desde 001 hasta 480 (utilizando tres dgitos para cada cifra); si la poblacin diante el uso, en primer lugar, de la tabla de nmeros aleatorios o tabla Random.
es de 1.3 50 elementos, se utilizarn cuatro dgitos, y as sucesivamente. Para ello, se supone disponer de una poblacin hipottica de 250 elementos, de la
cual se hace necesario contar con una muestra aleatoria de.25, para el estudio sobre
Seleccionar y aplicar el mtodo ms conveniente duracin, resistencia, precio, entre otras variables requeridas.
Se har la seleccin aplicando cualquiera de los siguientes mtodos: sorteo, tablas de
nmeros aleatorios, seleccin sistemtica, utilizacin de calculadoras o Excel.
Sorteo Se procede en una forma similar a la realizacin de un sorteo o al juego de En primer lugar se le asigna un nmero a cada elemento, en este caso, desde 001
lotera. Para ello, se preparan fichas, cartoncitos o balotas. Cada balota, por ejemplo, hasta 250. Luego se selecciona una tabla que contenga nmeros al azar. En este caso,
identificar un elemento. Introducidas en un recipiente, se extraen de una en una, con es la tabla 1.1 que aparece en la pgina 27.
reposicin o sin esta, revolvindolas en cada extraccin. De esta forma se determina el punto de partida; por ejemplo, la fila 16 y la columna
11, y se obtendr el primer nmero: 524. Si se lee de izquierda a derecha, el segundo
Seleccin sistemtica Denominada tambin seleccin a intervalos regulares, se emplea
ser 962; luego, 094, 080, y as sucesivamente. Tambin se hubiese podido obtener
de preferencia cuapdo las unidades estn ordenadas en relacin con el valor o el tiempo.
cualquiera de los siguientes nmeros: 524, 249, 496, 620, 209, al realizarlo en for-
En las oficinas, algunas veces, se cuenta con gavetas que contienen archivos diseados en
ma continua formando cifras de tres dgitos, Si la lectura se hiciera por columnas
tarjetas, que permiten extraer varias de ellas a intervalos regulares. El procedimiento que
se tendran: 524, 601, 100, 557, siendo 421 el ltimo en la columna. La forma de
se sigue es calcular un intervalo de seleccin;
continuar depende de lo establecido antes de iniciar la seleccin, es decir, si se toma
l= Nln. Siendo N: el tamao de la poblacin; n: el tamao de la muestra.
en la parte inferior, el nmero ser 681; luego el 044,y as sucesivamente hacia
Supngase que N= 80 y n,; 10, el valor de I ser 80/10 igual a 8. Luego, se selec-
arriba y en esa misma columna; o por el contrario, haber comenzado desde la parte
ciona un nmero al azar dentro de este intervalo, es decir, entre 1 y 5. Supngase que
superior con los nmeros 646, 676, 686 ...
se obtuvo el3. Este ser el primer elemento seleccionado; el segundo ser 11; el tercero
19, y as sucesivamente ir sumndosele a cada nmero resultante el valor del intervalo,
hasta completar el valor correspondiente al tamao de la muestra.

Uso de las tablas de ntmel'os aleatol'ios o tablas Random Este mtodo an uti-
lizado, garantiza que todos los elementos tengan igual probabilidad de ser seleccio-
nados, pues se eliminan aquellas decisiones negativas como el factor humano y las
condiciones fsicas del material utilizado en la elaboracin de las fichas. Estas tablas se
presentan de forma diferente, con cifras de 2, 4, 6, 8 o 1Odgitos, con el fin de hacer
ms fcil su observacin, como se muestra en la tabla 1.1. Para la lectura de esta tabla,
se recomienda:
o Dentro de un conjunto de tablas al azar seleconar una de ellas (en este caso la tabla 1.1).
o Luego, sin mirar la tabla seleccionada, poner el dedo en un lugar cualquiera, que
1
se considera como punto de partida. i
!
------------ . . . ------r----
1
1
3614826526 4051634248 2548341204 3326522652
4891530382 6424063103 9744822489 8848665410 4127091161
9464972725 6223944054 5632977890 3886417519 4290853668
1585825208 5296269288 9311032352 0823578543 5390422222
7'
"'
0981376656 99085919.48
...

Ahora supngase que el caso corresponde a una poblacin cuyo tamao tan solo
consta de dos dgtos (N= 70).

Solo se observarn-los dos ltimos dgitos. Por ejemplo, apareci el nmero 288, (
6129843451 2039299628
que sera 88, pero cmo pasa de 70, no se tendr en cuenta y se repetir el proceso.
3884181029 2965053716
Pero si la poblacin fuera de N= 720, se tendrn que considerar los tres dgitos; en
6429480408 9935706958
este caso, la unidad que se seleccionara sera la 688, dado que se encuentra dentro
del rango 001 y 720.

En algunas calculadoras, se deben repetir los tres (3) pasos realizados en cada selec-
cin; en otras, cornoya se anot, una vez hecha la primera seleccin, solo basta oprimir
la tecla O o 11 ; de esta manera se observarn los nmeros aleatorios respectivos.
Tambin puede apar~cer en pantalla 0.2 equivalente a 200 0.32, lo cual corresponde a
3592970234 7732736679
0.320. En muy pocas.calculadoras, se podr operar con aquellas poblaciones superiores
6055355724 4111831778
a 1.000, corno N= 3:230. En este caso, se har necesario utilizar otro mtodo de selec-
4317210960 3796735663
cin diferente o un~ calculadora con mayor capacidad que permita obtener nmeros
aleatorios de 4 mis dgitos, que podra ser la tabla Randorn o con la aplicacin de
Excel, que se explicar en el taller de estadstica aplicada 1, al final de este captulo.

B Seleccin aleatoria
De acuerdo con la ififorrnacin, se cuenta con una poblacin de 820 estudiantes (N
=820), pero solo como ejercicio de aplicacin, se desea trabajar con una muestra de
50 estudiantes (n = $0), cuya informacin permite aplicar no solo los diferentes m-
todos de seleccin, sino tambin las diferentes frmulas, correspondientes a algunas 7781151467 7222464632
medidas (tendencia central, de dispersin, e inferencia), y que se consideran necesarias 1887050996 1267467202 5906104912 7328235248
en el anlisis de la iuforrnacin recolectada. 0858536366 3907469640 2086721181 7411152317
1607795761 6021591207 0499842239 7516691384
1~ '
Esladslica ap!icadt~
Capilulo 1

3. / =[n(n+l)]z
La sumatoria corresponde a una de las tantas operaciones que se realizan en la estads- i=l 2
tica, ya que siempre se tendr que sumar numerosos trminos, los cuales muchas veces
Como se observ en la aplicacin de la propiedad anterior, en esta se observa con
deben expresarse por smbolos o frmulas, con el fin de simplificar s_u presentac~n.
El signo de la sumatoria es L. (sigma), letra griega que indica suma de o sumatorta de.
Por definicin se tendr que: m~<dum.d mfu;;:~::::::~~::::d:;: ~~ <y~~\~'::-'
~ ,_:d, ~m~ im"'""" 1 ~-
n
LX;= x1 tx2 tx3 +...+x.
~ n En cl"" dt m dt ""' "'"''"'"' , ,,Jirndn dt-

En trminos generales, una operacin de sumatoria se expresa as: Li las propiedades, por ejemplo:
5
i=l w =10+10+10+10+10 =50
Al signo sigma L. la acompaa i =1, que representa el limite inferior, donde i no 1=1

necesariamente debe ser igual a uno; n corresponde allm;;;;p;rior y, finalmente, i es Siendo n = 5 y k= 1O, se podr realizar la operacin mediante el producto de nk
el elemento genrico de la suma. Una calculadora de bolsillo tiene algunas teclas que al =5(10) =50, y la propiedad se expondr as: "La sumatoria de una constante es
2 2
oprimirse, dan resultados para las expresiones LX;, L X; , L Y, L Y , L X;J; y n, que igual al producto de/limite superior n por la constante K':
corresponde al nmero de observaciones o datos registrados.
n
La expresin Li
=l
se lee: "Sumatoria de i cuando i va de 1 hasta n ", lo cual quiere
!;K= nK => 5(10) =50
i=l

decir que i toma valores desde uno hasta n y el resultado final ser la suma de esos valo- El procedimiento anterior se aplica cuando el lmite inferior de la sumatoria es
igual a uno; en caso contrario, se realiza una pequea modificacin, tal como se
res. _Algunas aplicaciones:
ver en el siguiente ejercicio:
5
8
a. l:i=1+2+3+4t5=15
i=l
2:12 = 12+ 12 +12 +12 +12 = 60 => ((8 -4) +1)12 = 5(12) = 60
i=4
10
b. l:i =1 +2+3+4+5+6+7 +8+9+10 =55 Como se observa en el anterior ejercido, al lmite superior se le resta el valor del
i=l
lmite inferior; a este resultado se le suma uno y el'valor obtenido se multiplica por la
En un ejercicio igual a los anteriores, si n es demasiado grande se podr simplificar constante: [(n-L;)+1]K.
mediante la aplicacin de una de sus propiedades.
5. Ahora, considrese la sumatoria de una constante por una variable.
5
11 Propiedades de la sumatoria L8i = 8(1) +8(2) +8(3) +8(4) +8(5) = 8 +16 +24 +32+40 = 120
i=l

l. i:J =n(n+2 1)
i=l
=>ti= 50;1) = 1.275
t=l
Aqu es mas fcU aplicar la propiedad que dice: "La mmatoria de una constante por
una variable es igual alproducto de la constante por la sumatoria de la variable':
i.
1
z. !;e = n(n +1)(2n +1) => Ii 2 = 5(6)(11) = 55 n 5 5
i=l 6 i=l 6 l:Ki = Kl:i => l:8i= 8Li = 8(1 +2+3+4 +5) = 8(15) = 120
i=l i=l i=l i=l
Pues si no se aplica esta propiedad, el proceso es ms dispendioso, veamos:
5 6. La sumatoria de dos o mas trminos, todos ellos incluidos dentro del parntesis.
l:i 2 =1 2 +2 2 +3 2 +4 2 +5 2 =55 Esto dar origen a tantas sumatorias dependiendo del nmero de variables que
'1 i=l i
se encuentren dentro de l. i
1
i
_, 1
!
;---+--------------. -- .. - --- -~ --~--+------
1q 1
!
i

1\1.
-?'"' -
1 . .

~~~;,,
n
_!(a+b)= ,La+ _Lb
n n
,;"

~
:.
____ Cap~~~IO 1 Aspectos generales- Sumntoria, productorifl y smbolos

Hasta aqu sera la solucin, salvo que se indique lo contrario; por ejemplo,
;: cuando cada trmino de la sumatoria le corresponder un determinado valor:
o; i=l i=l

.'

En este caso, la sumatoria se dar reemplazando cada trmino por su respectivo


Resolver la siguiente sumatoria. valor:
6
5 ~
2
5
2
5 .. 5 5
2
5 x = 8 +3+10+2+0+10 = 33
1
l:U +3i+8)= Li +.L>+L:8= Li +3l:i+5(8) i=l
i=l i=l i=l i=l i=l i=l Otro ejemplo podra ser:
6
L7X1 = 7(X1 +X2 +X3 +X4 +X5 +X6)
i=l .

= (1 + 4 + 9 +~6 + 25) + 3(15) + 40 =55+ 45 t40 = 140 Si se le dan valores, el resultado sera:
6
l:7X = 7(8 + 3+ 10 + 2+ o+ 10) = 7(33) = 231
i=l
Si la sumatoria cobija varios t{ininos, pero ellos no se encuentran dentro del parn- Si se diera el siguiente caso, su solucin sera muy parecida a la anterior:
tesis, el proceso ser diferente al anterior. 6

5 .. +
LX1Y = X1Y +X2Y2 + X3Y3 X4Y, + X5Y5 + X6Y6
+3i +8 = (1 +2
2 2 2
+3 +4 +5 2) +3i +8 =55 +3i +8 = 63+3i
2 2 i=l

i=l Supngase que adems los valores dados p~a X, se tendra los correspondientes a K-
Como se observa en el ejemplo anterior, la sumatoria solo cobijar al primer trmi- Y = 2 Y2 =-4 Y3 = 6 Y, =O fs = 12 ~ = 10
no y el desarrollo de. esta expresin quedara as: 55 + 3i + 8 63 + 3i La solucin en este caso ser:
6
x y; = 8(2) +3(-4) +10(6) +2(0)+0(12)+10(10)
1
i=l
7. Ahora, si, por el contrario:; la sumatoria se expresara en la forma cmo se presen-
= 16-12 + 60 +o+ o+ 100 =I?i:) -12 = 164
ta a continuacin: primero se efecta el producto, y luego la sumatoria cobijara
a los trminos que se enC~J~ntran dentro del parntesis. Otro caso muy particular, en varias oportunidades, ocasiona confusin y errores en
5 5 .. 5 el proceso de clculo de algunas medidas, entre ellas, la varianza.
4(i L:<4i +) = 4i
(tJ
2 2 2
+ 3) = +5(12)
i=l i=l i=l
=(1+2+3+4+5/ =15 2 =125 .

Totalmente diferente de la siguiente expresi6n:


5
8. La sumatoria de n elem~!ltos se podr expresar de diferentes formas.
Se observa que no siempre el lmite inferior de la sumatoria ser igual a uno;
2:/ =1 +2
1=1
2 2 2 2 2
+3 +4 +5 =1+4+9+16+25 =55 :;<:125
adems, puede cambiarse 'el elemento genrico de la suma, teniendo en cuenta
Como se ve los dos resultados anteriores no son iguales, de ah que se recomienda
que concuerde con elln;tite inferior. En este caso se debe tener cuidado con el recordarlos, a fin de no cometer errores ms adelante.
uso de las sumatorias.
7
l:I= 3+4 +5 +6 +7 =25. Como se observa,j solo toma valores a partir del Nota: cuando el smbolo de la sumatoria se expresa sin lmites explcitos (inferior y supe-
=3 rior), se entiende que la sumatoria abara desde el lmite inferior i =1 hasta n.
lmite inferior, en este caso 3. Otro caso diferente de los anteriores:
6 n
LX =X +X +X +X +X +X
i=l
1 1 2 3 4 5 6 })=~) i

i=l

. . . . . ,_ . . .. . .... . . _. . . -.t-.---
!
1
Esladlslica aplicada
---------------------------....:'!
Capflulo 1 Aspectos genemles- Smnrttoria, protfuctoria y smb~/os~
33
Ldproductoria de una constante es igual a una potencia, en donde la base es la cons-
Ejercidos resueltos de sumatoria tante y el exponente es el limite superior.
4 3
l. :L>=1+2+3+4=10 2. :L/ =1 +2 2+3 =14
2 2
n
EjK=K.K.K .. K=K"~
~
1=1 1=1
7 4
3. :L> =4+5+6+7 =22 4. :L/ =2 +3 +4 =29
2 2 2

/=;4 1=2
--....______../l 3
5. })i = 2~> = 2(1+2+3) = 2(6) = 12
1=1 1=1
3 3 3 3
6. ~)i=5(1)+5(2)+5(3)=30 7. Li =1 +2 +33= 32
1=1
1 1 2 IT2=2.2.2=2 =8
i=l
1=1
4 6
8. i =2 +2 +2 +2 4 =30
1 2 3
~ ~=~+~+~+~+~+~
1=1 El producto de una constante por una variable es igual a la constante elevada al valor
1=1
5 4
que toma el lmite superior por la productoria de fa variable i, desde el lmite inferior hasta
10. L xj =X2 +X3 +X4 +X5 11. 2 =2+2+2+2 = 8 = (2 x 4) = 8
}=2 1=1 stt lmite superior.
3
12. :L:(i+2) =(1+2) +(2+2) +(3+2) =12
1=1
3 3 3 ~KX =Kn[~xJ
1=1 1=1
3
1C
}=1
3 3
2i = 2 1C
}=!
j = 8(1.2.3) = 8(6) = 48
13. (i +2) = i + 2 = (1 +2 +3) + 6 = 12
1=1 1=1 1=1

14.[~r =[1+2+3]2 =6 2
=36
~XYZ =(~xi)(~Y)(~zi)
1=1 1=1 1=1 1=1

Ejercidos resueltos de productoria


Se utiliza la letra griega pi mayscula (TI), que se lee ''producto de", para designar al 1. n4 =4 =64
3

elemento genrico del producto, que puede ser i, escribiendo debajo y encima del sig- i=l

no pi los valores extremos (lmites inferior y superior) que toma ese elemento i. Tiene 3
una aplicacin parecida a la sumatoria, con la diferencia de que en vez de ser sumados
2. B4i=4 [Bi] = 64(1x2x3) = 384
los trminos, ellos se multiplican entre s; por tanto, la productoria tendr un lmite
inferior y otro superior, adems del elemento genrico del producto. 3. px;r;
r=1
=[fix~J
r=l
[fir;]
r=l
=PX;Y;
r=l
=[X .x2 ."x3 .x4][r;
.
.r2 .Y3 .Y4]

1 Bi = 1.2.3.4.. n 1 <=>
5
ITi =1.2 .3 .4 .5 =120
1=1
3 3
ITi =1 .2 2 .3 2 =1.4.9=36
2 2
<=> rr l = 12 . 22 32 = 36
1=1 }=!
4 n
!JX1 =X1 .X2 .X3 .X4 <=> ITX1 =X1 .X2 .X3 ... X"
~ H
La productoria va ser de gran utilidad en la estadfstic, para el clculo de la media
geomtrica, que se ver en el captulo 3.

1' ,:
11 Propiedades i'
1'
1: 1 Como en el caso de la sumatoria, tambin se debe tener en cuenta algunas propiedades.
1
................................-..----
-Jr.--------+- . . -------- --- -------- 1

; \\:
"J i
&apilulo 1 Aspectos gmemles- Sumatoria, productolitt y smbolos

Es imp'<>rtante conocer y manejar algunos de los smbolos que a continuacin se pre- El redondeo de un nmero se puede realizar por:
a. Aproximacin a un entero 4,3 =4 4,7 =5
sen tan:, b. Aproximacin a la dcima 4,68 =4,7 4,42 = 4,4 0,09 = 0,1
. ;._
Mayor o igual que < Menorque
~ lyi~no r o igual que ~ c. Aproximacin a la centsima 4,318 =4,32 4,352 =4,35 4,097 =4,10
Diferente Igual
> Mayor que "X Multiplicacin Resta
Por lo general, si el ltimo dgito es mayor que cinco, se aproxima al nmero in-
+ Sma
:=} Implica
Aproximadamente igual {:::} Equivale mediatamente superior; si, por el contrario, es menor que cinco, se desprecia. En caso
- Parntesis :E Sumade
[] Corchete
i::
() de que sea cinco, se tomar el siguiente criterio: si el dgito que le antecede al cinco es
impar se aumenta en una unidad, y si es par, se conserva. Ejemplos:
10,875 = 10,88 10,05 =10,00 10;25 =10;20 10,975 =10,98

Minsculas Nombre Valor


. Maysculas
a Alfa A a
A
p Beta B b
B
Delta D d
8.
A. Lambda L l
A
muomiu M m
M fl p p
pi
TI 1t
N n
N V myonu
p p rho R
Sigma S
1: Ci
X X
X 'X Chioji

.
tos smbolos que ms se utizan en la estadstica de atributos y en la teora de con-
. jttnt~s son:
: i
U oS Conjunto universal
A 11 B Dos conjuntos cualesquiera.
Ar;;B A subconjunto de B.
AoB Suceso contrario o comple~ento de A o de B.
.Au BoA+B A unin B o suma de dos conjuntos.
Pertenece ~ No pertenece
E
A n BoAxB A interseccin B, o A por B
Igualdad -:f: Diferente
Conjunto vaco 1 Tal que
i

i
;
i

l .. ---------- ... -~-~ ----- ----~t----
i i
-..-......... .
i
i
!
Estadistica nplicttdrt
Captulo 1 Aspectos geue1'll!es- Smnatorill,

Atributos Muestreo
Elemento genrico de la suma Muestreo aleatorio y no aleatorio
r:
Estadstica Poblacin .

Estadsticas Poblacin objetivo


Estadstico Productoria 1t
Estadstica descriptiva o deductiva Signo de la suma 2:
Estadstica inductiva o inferencia Signo del producto 1t
Caractersticas cualitativas y cuantitativas Sumatoria 2:
Estimadores Tamao ptimo
o Estimativos Unidad
o Elementos o Variables

Estratos Variable discreta


Lmite superior Variable continua
Lmite inferior

d.

5 .
e. 1t i
i=l
!

i
1
.-~. ---- - ----------------------------1---

1
EstadsUca tplica:_w __

r 1. Un ejemplo de caracterstica cualitativa puede ser datos sobre:


.. ~

::-.' a. Salarios.
(9cupadn.
c. Gastos en alimentacin.
d. Ausencias a clase.
e. Nmero de accidentes en el trabajo.
2. Cualquier medida aplicada a las caractersticas de las unidades o elementos en la
poblacin se denomina:
ji., Estimador.
@variable.
c. Estadstica.
d. Parmetro.
e. Ninguna de los anteriores.

3. La estadstica descriptiva tiene como objetivo:


@ Probar la significacin de los resultados.
b. Lograr conclusiones ms all de las muestras.
c. Ser aplicada en investigaciones poblacionales.
d. Ninguna de las anteriores .

.4. Por poblacin o universo se entiende:


a. Conjunto de seres humanos.
r
.' b. Un recuento de unidades.
@ Conjun;o .de medi,das o recuento de rodas las unidades que tienen una
. ~- caractensnca comun.
d. Es un ordenamiento sistemtico de la informacin.
e. Descubrir las causas que originan el hecho.
... 5. Determine cules de las siguientes variables son cualitativas o cuantitativas y entre
estas ltimas cules son diScretas o continuas:
a. Vida til de un.bmbilla. OIO/'IV'
b. Marca de una bombilla. Q.va L.\
c.
. ,, de unas.accwnes
eonzacwn . ll . .fo-J\)j\
..\.-IJ_I,f___ '\' .
d. Nmero de accidentes en una fbrica. tv.t'fl \ 1
e. Tipos de accidentes que ocurren en una fbrica.~ v(}.\\
f. Estado civil de los trabajadores.tti.J.~
Lea el siguiente caso: por los conductores de vehculos en la ciudad, motivo por el cual desea hacer una
investigacin por muestreo.
En un barrio de clase media de una capital, se localiz un total de 320 manzanas; a. Cmo podra hacerla?
adems, cada manzana (aproximadamente) cuenta con 30 viviend~. El objetivo
b. Qu preguntas podra formular?
de la investigacin es determinar el gasto promedio mensual en articulas de aseo:
c. Qu unidad utilizara?
Se estableci la necesidad de realizar una selecin de 40 manzanas y en cada una
de ellas seleccionar 1O;viviendas.
d. Qu mtodo de muestreo sera el indicado?
Algunas preguntas que contiene el formulario: 9. Un auditor se enfrenta en una larga lista de cuentas por cobrar en su empresa.
o Cantidad de dinero gastado. Debe verificar las cantidades (valor) con base en una muestra que abarca aproxi-
Establecimientos donde generalmente compra. madamente el 1Oo/o de esas cuentas, con el fin de estimar la diferencia promedio
Da que generalmente lo hace. entre los valores revisados (muestra) y sus respectivos asientos en el libro.
o Tiempo (horas) dedicado a sus compras.
a. Suponga que las cuentas estn ordenadas cronolgicamente, admitiendo que
Nmero de veces que realiza el mayor nmero de compras. las ms antiguas tienen la tendencia a tomar valores pequeos. Qu mtodo de
El nmero de personas que conforman su hogar. muestreo utilizara?
.....,.,,.. . ,.,..~. ' ' " '.;'r.. , :-: ,., J''"' '""."'1:... ,... ,, ., : ..... ;;r~ , ~'1-. '1 -~"! . ., ~-~- ~ . :,.>' ~< '"'"'''"'~' ~': .t..: ~~~ 1"\lr" ,_.!
b. Suponga que las cuentas no estn ordenadas. Cul sera el mtodo de
Determine los siguientes aspectos: muestreo en este caso?
a. Mtodo de muestreo utilizado. c. Suponga que las cuentas estn divididas en tres (3) grupos de acuerdo con su
b. Poblacin. 5tol\ ~O . .,. valor. Cul sera el mtodo por utilizar?
')"0\(ti.J'
c. Muestra (tamano . ...:
1O. Se tiene un grupo de consumidores e interesa conocer sus preferencias por uno de
d. Marco. estos productos que la empresa fbrica, que son de consumo popular. De acuerdo
r. o
e. Elemento o unidad. - ~o r: con el objetivo, se ha diseado una muestra, para lo cual se selecciona un barrio,
f. En las caractersticas investigadas, cules son atributos y cules son variables; en conformado aproximadamente por 120 manzanas, cada una de ellas con un prome-
estas ltimas identifique las variables discretas y continuas. dio de 28 viviendas.

7. En cada uno de los siguientes problemas identifique: la poblacin, el elemento o a. Formule el procedimiento que se utiliz en la seieccin. En primer lugar 18
unidad. Establezca como mnimo dos caractersticas que podran estudiarse. manzanas y luego de cada una de ellas, 4 viviendas. Qu mtodo se emple?
b. Si el mtodo que le han exigido que r~alice es de un muestreo aleatorio simple,
a. Un fabricante de helados tiene varios puntos de venta en la ciudad de Ccuta
cmo procedera?
y desea estudiar si existe una relacin o no, entre el valor de las ventas Y la
temperatura ambiental. . .' . 11. De las siguientes caractersticas, cules considera: atributo o cualitativa (A); cuanti-
b. El director de recursos humanos de una universidad desea estuldiar st elxtsdtedodnol tativa (C); variable discreta (VD); variable continua (VC).
relacin entre la ausencia al trabajo (nmero de das) durante e ao Y a e a e a. Nmero de veces que los alumnos d mia universidad utilizan el servicio de
empleado. , transmilenio, en un mes.
c. Una promotora de vivienda social est interesada en establecer como el aumento b. Alumnos atendidos por el servicio mdico que ofrece la universidad en el mes,
en los materiales de. construccin est afectando la construccin de vivienda en segn diagnstico.
una regin del pas. Como parte de la investigacin pl<IDea reunir datos realizando c. Gasto semanal en que incurre un estudiante.
una muestra de empresas constructoras durante los ltimos cinco (5) aos.
d. Nmero de veces que en el mes frecuenta la biblioteca.
8. Una empresa distribuidora de gasolina desea determinar los factores que infl.u~en e. Deportes que ms practican los estudiantes los fines de semana.
en la eleccin de las estaciones de gasolina (Shell, Texaco, Esso, Terpel, Petrobras),
c. Al usar el directorio, extraera usted una lista de direcciones o una lista de
12. Explique brevemente qu entiende por: personas?
a. Dominio de estudio y de qu manera puede ocurrir.
17. Explique brevemente qu diferencias puede haber entre:
b Marco muestra y marco defectuoso. d . .
d D ' aneras se pue en susntutr a. Estadstica y estadsticas.
c. Sustitucin de elementos o unida es. e cuantas m
cuando no hay informacin? . ., , . b. Parmetro y estimador.
d. Preguntas cerradas, abiertas , de filtro ' de control, de seleccton rnluple. c. Variable discreta y continua.
e. Hechos que abarca y no abarca la estadstica. d. Caracterstica cuantitativa y cualitativa.

l3. Explique brevemente qu entiende por: 18. Mencione algunos aspectos relacionados con:

a. Estadstica descriptiva e inferencia estadstica. a. Las limitaciones que hay para la realizacin de un censo.
b. La finalidad en la aplicacin de la estadstica.
b. Estadsticas internas Yexternas.
c. Estadsticas primarias y secu~darias. 19. D tres ejemplos de medidas aplicadas en la estimacin de las caractersticas de las
d. Error de muestreo y ajeno al muestreo. unidades de una poblacin: media aritmtica, proporcin, total y razn.
e. Investigacin total Yparcial.
20. Utilizando corno poblacin los estudiantes de su plantel, identifique 1Ocaractersti-
f. Estadstica y estadsticas.
cas. Diga cules son atributos y cules variables. En las variables distinga las discretas
14. Explique brevemente: y las continuas.

a .llu f~ctores impiden realizar un censo o investigacin total?


' ' .~

C<.: 21. Seale con una (A) las series constituidas por datos cualitativos y con una (V) las
b. Los mtodos de muestreo al~atorio y no aleatono. que son cuantitativas.
c. Las ventajas del muestreo. a. Nacionalidad.
.: d. Finalidad de la estadstica. . . l' d b. Temperatura.
e. Cundo un mtodo de muestreo no aleatorio puede constderarse v t o. c. Estado civil.
15 En cada uno de los casos seald~s, en la siguiente lista, indiqu~si es ~ariable o d. Produccin.
. atributo; a nisrno tiempo, establezca la medida ms indicada (me a tot ' propor- e. Nmero de tornillos producidos.
cin).
f. Filiacin poltica.
a. Biologa: peso de un ser vivo.
g. Kilmetros recorridos.
h. Gasto en alimentacin;
b. Agricultura: cultivo de legumbres.
c. Economa: ventas efectuadas por una empresa.
i. Llamadas diarias.
d. Transporte: en ferrocarril (en toneladas-!~: 22. Cules son las limitaciones y en qu circunstancia es preferible la realizacin de un
e. Demografa: nmero de hijos de una familia. censo?
f. Demografa: estado civil. .
23. Los directivos de una fbrica estudian un programa de vivienda para sus empleados
. dd d 4 rs y tiene las direcciones a lo largo y solicitan informacin a un grupo de 30 de ellos, de un total de 350 emplea-
16. El directorio de una ctuda ata e anos at . . d d !las
de cada calle, con los nombres de las personas que vtven en ca a una e e . dos, sobre el nmero de habitacibrtes que requerir sti vivienda, en el caso de salir
. ~~: .
a. Cules son las deficiencia; d~ este marco si se utiliza para tornar una encuesta favorecido en el programa. La investigacin se hace nicamente en aquellos que
tienen ms de cuatro aos de antigedad y en la actualidad no tienen vivienda.
por muestreo?
Determine:
b. Pueden corregirse tales deficiencias durante los trabajos de terreno.
27. Si X ~ 3, Xz = 9, X3 = -7, X4 =- 3, calcule el valor numrico de las siguientes
a. La poblacin. expresiOnes.
b. La muestra. 4
c. La caracterstica y cmo la clasificara. a. 2:(X1 +1)2
1=2

24. Cules de los siguientes casos corresponden al muestreo aleatorio: 3

a. Si de las jaulas de lii! criadero de gallinas se toma un muestra de 25 animales,


b. L. XI(X-7)
1=1
2

seleccionando aquellos que alcanza la mano.


b. Si se toman las hojas de registro de matrcula de los alumnos de un instituto y 28.SiX1 =8 X2 =4 X3 =4 X4 =0,calcule:
se selecciona una muestra de 20 hojas a intervalos regulares. 4
a. 2:(X1 +3) 2
c. Si de una muestra de frutas que se encuentran en un recipiente bastante 1=2
grande, se toma como muestra la porcin correspondiente a los 1Ocentmetros
4
de la parte superior de la vasija. b. 2: (X1 -a) 2 ; donde a=4.
1=1
d. Si para conocer el sentimiento popular sobre una medida de orden pblico, se
entrevistan a 30 personas que pasan por un sitio importante de la ciudad. 29. En los ejercicios siguientes, suponga que se da un conjunto de nmeros:
Xp X2 , X3 , ... , X. yque
25. Escriba en forma explcita las sumas representadas por cada una de las siguientes n

expresiones.
LX
1=1
6
a=--.
n
a. 2:X1
1=2
Demuestre las siguientes relaciones.
3 ? n 2
b. 2:(X1-2t
1=1
S
c. 2: (Y1 +7)
)=2
a. i;[<X,- 3a)'-2aX,J = i;x? +
1=1 1=1
(
P]
n
9
d. LX~
}=1 J

4
e. l;(X1 +3)X1
1=1

f.
(~/~J
26. Escriba cada una de las siguientes expresiones, utilizando el signo de la sumatoria,
con los lmites adecuados.
a. X1 +X2 +X3 +X4 ~~ta: cu~ndo :e da la.sumatoria sin los lmites inferior y superior, se entiende ue el
b. Xi+Xi+X hmlte y (d). es Igual a z= 1 y el lmite superior ser n ' ta1como ocurre con los q.
cios (b)mfenor eercl-.
2
c. [(X3 -4)+(X4 -4)+(X5 -4)]
d. y92 +Y~+ Y~+ :r;; +:r;;
,.:
Mtodos de seleccin aleatoria con el uso
30. Resuelva.
.. 5 de Excel@
5
a. 2: ( + 1) j;;~; ~ (3i-2)
i=l ..; i: 7=1 Mtodo 1
.. _:-;: 4
Seleccin aleatoria para 50 datos, trabaj;mdo con fX (funcin) .
4
b. 2: (2 + i + 8) .k:' 2: (3i-:-2) 2
i=l
.. i=l
Pasos
l. Abra la hoja de clculo.
6 2
c. 2:(5i+8) 2. Haga die en Herramientas ( donde aparece el cono.f.X);haga die dos veces, y se
i=l . ~.. l .
desplegar la ventana pegar fimcin (pantalla 1.1). .

[(~x;}+3J
.,: : 10

d. ~ L:Ci-2)
..
:'.,.

i=l
.
-=-
'.: .. 4
4
e. 2:X;+8 n.' 2: (2i-i+5)
. : \ i=l
i=l
5

f. (x;J ; u +1)(i -1)


i=l
1=1

6
g. L (X +3)2
i=l
~ t,x -(t, X; J
h. 2:i
i=l
5
i ~);Y;-(tx;l(tr;l
..':. i=l 1=1 ) 1=1 )

6 .;...
i. 2: z ..':
i=3

3. Observe que la ventana tiene dos columnas, a la izqui;rda est la categora de la


funcin. Seleccione la categora matemtica y trigonoiitrica.
4. Luego haga die en la columna de la derecha, dond~-ap;rece Nombre de la fun-
ci(in, y seleccione aleatorio entre. ....
5. Haga dicen~-~ Se desplegar la pantalla 1.2.
6. Empiece a generar los nmeros aleatorios. La poblacin es de 820 estudiantes, nu-
merados del 001 (lmite inferior) hasta 820 (lmite superior). Digite estas cifras
en las casillas inferior y superior. ..
l
-----L--

!:

Estadsllca aplicada
Cap(lulo 1 Aspectos gmumzles- Sum11toria, pmluctoria y smbolos

Pantalla 1.3 Aleatorio entre nmero generado

Mtodo2
7. Haga die en ~y obtendr el nmero generado, tal co.mo se muestra en la Ahora se puede observar un segundo procedimiento para generar esos nmeros aleato-
parte inferior de la pantalla 1.3. rios. Para ello considere la misma poblacin de 820 alumnos y la muestra ser la misma
8. Como hay necesidad de generar ms nmeros aleatorios, dado que la muestra es decir, de SO alumnos. '
es de SO estudiantes (n =50), con la misma funcin, active la celda donde debe Pasos
aparecer el nmero generado; para ello, colquese (con la ayuda del mottse) en l. Ahra una hoja de clculo.
el extremo inferior derecho de esa celda, la flecha. cuadrada blanca se transformara
2. Con el mot/Se, haga die en el men herramientas (pantalla 1. 4)
en cruz, haga die en el botn izquierdo del mot/Se y arrstrela hasta donde desee. 3. Busque la opcin Anlisis de datos y haga dic. .
Como re~ultado aparecen varios nmeros aleatorios con su respectiva informa-
4. En la ventana Anlisis de datos seleccione la opcin Generacin de nmeros alea-
cin, cuando suelte el mot/Se. torios, y haga die en~ (pantalla 1.5).
5. Al hacer clic en la teda~ de la pantalla 1.5 se abre la pantalla 1.6.
6. Digite en las celdas de la ventana Generacin de mmeros aleatorios la siguiente
informacin:
0
Nmero de variables: si se requiere de todas las columnas 0 variables co-
rrespondientes a la informacin dada para la poblacin, las cuales son 10,
entonces el valor que debe colocarse en la primera casilla es 1O, y este ser la
cantidad de columnas que deben aparecer en la Tabla de salida. Si solamente
9. La muestra de SO datos, perteneciente a los registros que se han tomado de la es una se digita 1, solo generar una sola columna.
1 poblacin, le permite realizar la aplicacin en aquellos temas relacionados con gr- "' Cantidad de nmeros aleatorios: digite el nmero aleatorio requerido; en este caso
1 !
ficas, promedios y otros procedimientos que exija el contenido de esta obra. ser de SO. Cada nmero ale-atorio debe aparecer en. la Lnea de salida. 1
! 1
-;;~<l---------l--- ............ -- ... - .............. _____________ ,l!___ _
!! !li 1 i
1
!
e Una vez escogida la opcin unifonne, se abre un espacio que indica parme-
tros, con los valores de este caso, 001 y 820, que son los correspondientes a
la primera y ltima observacin de la poblacin.
o Finalmente se abre la casilla iniciar con; en sta, fije un nmero cualquiera
con el cual se inicia la seleccin.

Nota: si este mismo nmero de inicio lo usa en otro equipo PC, para la misma poblacin,
se generarn los mismos nmeros aleatorios, ya que existe una regla de generacin para to-
dos los PC; de ah que se recomienda cambiar el nmero de inicio en cada PC.

7. Cuando haya introducido los datos, seleccione las opciones de salida; haga die
en el botn Etclil. Debe desplegarse la pantalla 1.7, que muestra el cuadro de
nmeros aleatorios.

Nota: agregue las leyendas que considere en cada una de las

Esta opcin le ofrece la oportunidad de escoger la muestra de 1Oregistros distintos


y puede organizarla, para efectos de establecer las medidas tanto de Posicin como Dis-
persin que se tratarn ms adelante.
;
::] ________ -

1 '
.J.
l
!
'
Captulo 1 &pectos Snmatoritt, poductorht y smbolo.r

Mtodo 3
No se considera necesario un tercer mtodo de seleccin. No obstante, se h~ce a fin de
que el lector tenga la opcin con la cual se encuentre ms a gusto. Como en los dos
mtodos anteriores, se har referencia a los pasos que se deben seguir.

Pasos
l. Abra una hoja de clculo.
2. En la barra de men, haga die en herramientas.
3. Se despliegan unos submens. Observe que en la parte inferir se encuentra la
opcin anlisis de datos; haga clic con el mouse.
4. Al hacerlo, se despliega la ventana anlisis de datos (pantalla 1.8.)
5. Para abrir la pantalla 1.9, seleccione la opcin muestra y luego haga die en
~
6. Ingrese los datos correspondientes al rango de entrada.
7. Este mtodo solo admite un rango de entrada. En este caso, seleccione el nmero
de registro.
-7. Seleccione el mtodo aleatorio, haciendo dic.
8. Digite el tamao de muestra; en este caso 50.
9. Finalmente, seleccione la opcin salida y haga die en~
Nota: una vez obtenga el rango de entrada, recuerde que por este mtodo solo es posible
tomar un rango. Para mayor manipulacin de la muestra, ordnela en forma ascendente;
luego dirjase a la tabla donde est la informacin considerada para la poblacin.
A\V''
-:~

~E- sl_ad_is-'li_ca_a.:. p_lic_1Ul_a


________ d___..Jl - - - - - - - - - - - - -----t---o--Es-c,_a_!IIS_p_r-op-o-~-ci,~=~:::::::::~::::::~:::Jd~m~~'~
Presentacin e uatos = -""~..=~ ::~ uso corriente, como cuando se clasifican so establecimientos de acuerdo con los
Una ve:::~:::::::~:=~n, p:; cualquiera de los mtodos (censo, muestra volmenes devemas, nmero de empleados, etctera.
o registro continuo), tal como sucede en las diferentes investigaciones, se debe proceder en
a su organizacin, mediante dos procesos: H IJTabuladn u organizacin de los datos
1. Clasificacin u ordenamiento de los datos. ~ \ Despus de determinar el criterio de clasificacin que se va a seguir, hay que iniciar el

2. Tabulacin o procesamiento de la informacin. -.._:.'_-.,


....___-.:._. proc~o de otabbulacidn,
ractenstica el cual
serva a; por co1nsiste
ejemp en undre
o, cuntos: e 1cuefumnto
os addeores
las vecefis
pre erenque cigarr'
se repilliteosladeca1a-
~Clasificacin U ordenamiento de los'c:latos marca Andino?, cuntos de la marca Derby?, y as sucesivamente.
Consiste en determinar el criterio que se va a utilizar, para agrupar los datos recolecta- La tabulacin puede realizarse en forma manual o mecnica. La decisin depende de
dos. Algunos de los criterios que pueden tenerse en cuenta son: muchos factores, entre otros: del nmero d formularios, de la cantidad de preguntas
0 Orden alfabtico: si se hace una investigacin en una empresa sobre su personal, ~ que tenga el instrumento de recoleccin y d~ la disponibilidad de equipo para procesar
referente a cargos, profesin, sexo, departamento en el que laalbora,.etctera, se .-._, la informacin. De todas formas, se requiere elaborar un plan de tabulacin que debe re-
observar a primera vist~ que todas estas caractersticas son cu itativas Yse pue- ferirse al diseo de una serie de ettadros o tablas, los cuales deben atender al objeto de la

0
den clasificar alfabticamente.
Geogrfico: si al personal de esa empresa se agrupa de acuerd~. con el ~ugar de ~~oce-
,
1!i encuesta y permitir as la presentacin de los datos en forma clara, que facilite su anlisis
y la aplicacin de algunas medidas de carcter estadstico, como se ver ms delante, y
dencia 0 de nacimiento (no necesariamente en orden alfabeuco), la informac!On se ".: . ., . en la mayora de los casos acompaados de una representacin grfica.
presentar por regiones o zonas (por ejemplo, de norte a sur, de oriente a occiden;e). ,
0 Histrico 0 cronolgico: se denomina as, si la caracterstica se representa por das, Cuadros
meses 0 aos; por ejemplo, los accidentes de trnsito, segn las causas. que los -...-.!'.
Los cuadros que constituyen el plan de procesamiento o sistematizacin, sea manual o
originan, se pueden ordenar alfabticamente, geogrficamente o por penados de , : mecnica, no deben ser necesariamente iguales a aquellos que finalmente se van a pre-
tiempo, es decir, en forma cronolgica. . . . . . ,, sentar o publicar; sin embargo, es preferible que sean iguales por economa de tiempo y
Convencional: muy utilizado por el Departamento Admirustranvo Nac10nal de ', i dinero. Los c.uadros, de acuerdo con el nmero de caractersticas que se van a presentar,
-~~~:
0
Estadstica (DANE) obedece a recomendaciones internacionales, a fin de que la se clasifican en simples, de doble y mltiple entrada.
informacin guarde uniformidad con la de los dems pases. ~] e Cuadros simples: siempre representan una sola variable o un atributo.
o Usual: cuando se emplean sin ningn criterio especial, solo por costumbre. . -. - .: 0 Cuadros de doble y mzltiple entrada: se elaboran para presentar dos 'o ms carac:-
0 Numrico: por ejemplo, el nmero de alumnos ordenados por grados .1, 2... 11. tersticas. Cuando en un cuadro se combinan variables con atributos, algunos lo
:}
denoininan cuadro o tabla mixta.
Formas de medicin
~
Se vio que las caractersticas se ~viden en cualit~tiv~ y cu~titativas. Las ,c~alitativas se En la elaboracin de cuadros finales o de publicacin, se recomienda:
clasifican utilizando escalas nmmales y las cuantttanvas, ordinales y numencas. a Si el informe tiene ms de un cuadro, los cuadros deben numerarse de forma
Escalas o~dinales Supngase la realizacin de una investigacin en torno a fumad~res consecutiva.
sobre las marcas preferidas; los resultados fueron: Andino, Derby, K~ol, Lucky Str~e, o Todo cuadro debe tenerun ttulo, lo ms completo posible, de manera que al
Marlboro y Pielroja. La caracterstica "Marca de cigarrlllos" queda clastficada por las ste- leerlo se tenga una visin general sobre su contenido.
te categoras encontradas. Si con la anterior informacin se clas~ca a los ~ad~~es por o La mayora de los tcnicos recomiendan que el ttulo debe situarse en !aparte supe-
nivel socioeconmico dentro de tres categoras (alto, medio y bao), se estara utthzando rior del cuadro; sin embargo, otros consideran que debe ir en la parte inferior.
una escala ordinal, puesto que se ha tenido en cuenta su orden jerrquico. o Las lneas que encierren el cuadro deben ser ms gruesas que las internas. Algu-
Escalas numricas Son aquellas que se utilizan para clasificar las caractersticas cuan- nos aconsejan, por presentacin, cerrar el cuadro por encima y por debajo, es
titativas 0 variables. Algunos las dividen en escalas a intervalos regulares y escalas pro- decir, suprimir las lneas laterales.
porcionales. . . 0 Los ttulos en las columnas deben ir en mayscula y los subttulos en minsculas.
e Esca!IIS a intervalos regulares: se establecen cuando no extsten patrones de medi- o Toda observacin que se haga debe indicarse en el sitio correspondiente con un
.1 ! cin de uso comn, por ejemplo, cuando se requiere medir la inteligencia, los llamado, y al final, debajo del cuadro, hacer la aclaracin. En ese mismo sitio se
1
- ! hbitos, actitudes, formas de comportamiento. acostumbra colocar la fuente de la cual se tom la informacin.
J~r, 1 1
--------------------------------r---
-~-------------------------------- ----
Jr
;:;;;

Estadistica aplicad"

. ~.
.
'


r--;
_ 58 --------------------------------------------------------..,;_,: ----------------~M- 1 ;

'
Ca lul .
P 02 Dtstl'/buczouesrlefiemendas- Tttb/,t 0
-------~--!_J____
----------------
i J,fi .
:!!.!!...~ ros u' 'CCilt!11CIIIS y repre~tntadu U1'flfictt
............. - - - - - - - - o' 59
1 Tablas de frecuencias . .- i:~ Ello se debe a que existen fumadores que tienen preferenc'as
d .
, d
por mas e una marca.
------
Las tablas de frecuencias corresponden a-~na agrupacin o clasificacin de los datos, con ~ Las os presentaCIOnes son totalmente distintas.
el fin primordial de determinar la frec~_iihcia'con que.serepiie el atr.ibuto oel vilor que }~ En ~bas tabl~s, cada frecuencia se divide por 90. De esta forma se calculan las
..$c?refiere como distribtii6tz defo.~cuen.c.ias. a aque-
toma la variable. En este ltimo cas-. !':~; frecuencias;
1i . u!ademas, los datos de la primera tabl a se podran ' representar med1.ante una
llas tablas que se elaboran atendiendo. .l.-nmero de observaciones o datos relativamente :~ gr ca circ ar 0 de barras; la segunda solo podr representarse mediante la grfic d
.., barras a e
grandes, siendo a la vez la aplicacin ifi:naria de la estadstica. .!_~
. ''
.: .
:'~
.,,
Una tabla de doble entrada podra ser la clasificacin de 150 em 1 d d
d . il
d
p ea os, e acuer o
Atributos ..~ con su esta o c1v y sex.
~:
Se anot que estas caractersticas se i<p{esan tambin mediante palabras. El trmino se -: f;"~
-~
emplea habitualmente para distinguirJo:~e la palabra variable o caracterstica cuantitati- :g Tabla 2.2 Nmero de fumadores de acuerdo con las
.. ~a. Poreje!Ilplo! sex9, es~a4o Civil; pM.!in, cargo, ocupacin, aficiones, estudios reali-
zados y otros ms, se clasifitan com Jjfibtios; pro la dad, el salario; tiempo"de :servido, :! ;:r!:;.~:t:";;;;.:
marcas que compra generalmente

personas a cargo, retardos en el mes, ~Q~is lab9radas, etctera, son ejemplos de variable,.
Con frecuencia, los atributos son di~'t,tJmicos, de modo que cada miembro de una pobla-
: !:S
Andino
Derby
16 1 17,78

~
36 1 40,00
cin se incluye en uno de los dos grap,~. conforme posea una caracterstica especfica o :~ Kool 12
'f: 1 13,33
no la posea.Tambinpermite clasif1isi.i9nes mltiples, ya que una persona puede tener -~ Lucky 16 1 17,78
preferencia por ms de ~a opcin, 'p6.r ejemplo, las marcas de un producto o deportes :w Marlboro 28 31,11
que prctica, etctera. Latabulaci~ e$~uysencilla, pues su cuantificacin se hace me- :~ Pieiroja 22 24,44
diante el recuento del nmero de ve~~s;gue se repite la caracterstica i~vestigada.
Hy da sea ha generalizado el trmin4 e variable, ptra indicar tanto alas caractersticas
1
.~. Tabla 2.3 Clasifica_ci?n de empleados de una empresa, segn
ci.J.alit~tiVas como a las CUantitativ~, pr tanto, no hay dific;uJtad al usarlo, sin embargo .t estado Civil y sexo
secilnsidera lg:o la divis.n antri~: : .. .. . ' .. . .
]
1

28
!,f..
Separado
Viudo
17
3
.. 10

5
62
22
4
10
7
f
f:
1

..................=.-. ~""E~~-::t:.JO!.~~.::cf,.~.:::c::;:!~.r.t:r.::::=:.c~~-"'"'~Z"!~'l<;.!:.:;;o.:

1 ~:as se clasifican en discretas y ~ontinttas. Las primras son rodas aquellas que admiten
Lo anterior puede eXplicarse al re~l~aruna encuesta a funadOre;:sobre su preferencia .e umcamenre valores_ enteros; las segundas aceptan valores fraccionarios. El procedimien-
por una marca, cuyos resultados se mtiesrran en las tablas 2.1 y 2.2. En estas se relaciona ki to que ~e debe _seguir en la elaboracin de una tabla de frecuencias se har arendi d
la informacin correspondiente a '4os:pregumas difere~tes realizadas a 90 fumadores
J
la antenor dasJficacin. en a
encuestados. La primera hace refer~~~i~ a ~a marca de Cigarrillo preferido; es d~ii:, solo se ~f
debe sealar una sola marca, y el resUI~.ado total de fumadores es. de 90 y la distribucin ~Variable dnscreta
~
porcentual de la s[u;a debe ser el W:Q%; en ca:rri.bio; en la segunda pregtrita, se hace .. ;n la elabo~acin 'de una tabla de frecuencias, para v_ariables discretas y continuas, se uri-
referencia a la marca de cigarrillos qti~gene~almente fuma, y la slilJ.a debe ser superior a slza una se~Je de sJmbol~s con los cuales hay que familiarizarse, ya que continuamente
los 90 encuestados y, por consigukn~e, el porcentaje es mayor que el lOO% .. t e emplearan, y se consutuyen en una forma de lenguaje. Estos trminos SOJ1:
;~hl.
.

;. :
J
1
.~licad,
-\!!:!) - --- -- - - ___ .... Captulo 2 Disflibuciolles de frecuellcias- Tablas o mrulros tk frecuencias y represmt1tci11 grdjica

l Cada elemento se representa en un smbolo. As, si se pide cules son los valores para
x11 , x 26, Yx42, se dir que son 6, 4 y 2, respectivamente..

Ahora, se determinan los valores que toma la variable y se observa que son: O1 2 3 4 5
6; en total 7, el cual se simboliza como m= 7. Vale aclarar que la variable puede pre-
sentarse de manera discontinua; por ejemplo, X;: 1 3 4 6 9 10; en este caso m= 6.

Luego se tabula, es decir, se determina cuntas veces se presenta o se repite, cada


valor que toma la variable, como se muestra en la tabla 2.5.

Tabla 2.5 Tabulacin. Variable discreta

1
H++ 11 7
2 H++H++ 10
3 H++H++H++ 15
4 H++ 111 8
5 H++ 5
1

En las las tablas 2.6 y 2. 7 se presentan, respectivamente, los valores de las frecuen-
cias y sus smbolos.

Cule's seran los valores en la tabla de frecuencias 2.6, para x3 , fs , fz 1n , N y


6
H2 ? En el mismo orden, los valores son: 2 8 O, 14 48 y 0,20, respectivamente.
Las frecuencias relativas se obtienen dividiendo las frecuencias absolutas por el n-
Para entender mejor el uso de estos smbolos, un ejmplo de variable discreta permi- mero de observaciones; as; el resultado de la primera frecuencia relativa ser 3 + 50
tir construir una tabla de ji-ecue~cas. = 0,06; en !asegunda, 7 +50= 0,14; la tercera, 10 +50= 0,20; la cuarta, 15 +50=
0,30; la quinta, 8 +50= 0,30; la sexta, 8 +50= 0,16, y as sucesivamente.
Una empresa tiene 220 empleados, de los cuales se selecciona una muestra al azar de
50 de ellos, con el fin de investigar qu porcentaje y con qu frecuencia hay retardos Tabla 2.6 Tabla de frecuencias. Variable discreta
en la llegada del personal en las horas de la maana. Para ello, se recoge las tarjetas
de control de la ltima quincena, cuyos resultados se muestran en la tabla 2.4.
o 3 0,06 3 0,06
7 0,14 10 0,20
2 10 0,20 20 0,40
3 15 0,30 35 0,70
4 8 0,16 43 0,86
5 5 0,10 48 0,96
6 2 0,04 50 1,00

1

-----------------------------1--
"-------

_ _ _C_a_pt_ulo 2 Distribuciou:es de fiecuenciiJS- Tablas omndros dt frecuencillS y mpri!.fentrtcin grjita


Estadstica aplicada
----~------

'Tabla 2.7 Simbologa. Tabla de frecuencias

X ; J;/n N H

x2 !2 !2/n N2 H2

XJ J; JJ/n NJ HJ

x4 !4 !4/n N4 H4
Xs fs fs/n Ns Hs
x6 f6 !6/n N6 H6

En un estudio realizado a 50 establecimientos comerciales, sobre el volumen de


ventas (millones $) en un mes cualquiera, se obtuvo el resultado que se muestra en
La prinera frecuencia absoluta acumulada fue 3; la segunda se obtuvo sumando
la tabla 2.8.
la primera frecuencia ms la segunda: 3 + 7 = 1O; la tercera ser igual a 3 + 7 + 1O
20, q:siendo igual a la suma de la segunda frecuencia absoluta acumulada con
la terc~rafrecuencia absoluta, igual a 10, que era el acumulado, ms 10, que es el Tabla 2.8 Datos no agrupados. Variable continua
valor de.Ia frecuencia, igual a 20. Algo similar se hace con la frecuencia relativa
acumulada.

Propiedades de las frecuencias


o Las frecuencias absolutas son nmeros enteros.
o . La'suma de las frecuencias absolutas ser igual al nmero total de observaciones,
en este caso n. Los pasos que deben seguirse para la confeccin de una tabla de frecuencias, cuando
o L~- frecuencias relativas son nmeros fraccionarios as: O</; 1n < l. se tiene una variable continua, son:
o L~.suma de las frecuencias relativas ser igual a l.
Paso 1
o El' ltimo trmino de la frecuencia absoluta acumulada es igual al total de obser-
Se determina el valor mximo y mnimo que toma la variable. x . =65, o sea la
viones, en este caso n. b ,, ffi]J(
o servac10n x47 yXmrn= 36, correspondiente a la observacin x26 .
o Ef iltimo trmino de la frecuencia relativa es igual a l.
' Paso 2
il11Variable continua Se obtiene el rango o recorrido R =xmx- xmrn =65- 36 29.
Corresp~nde a aquella variable que admite fracciones, ya que son resultados de la apli- Paso 3
cacin d algn mtodo de medicin. A los smbolos anteriores dados para una variable Se determina el valor de m o nmero de intervalos necesarios para agrupar los
discreta, ed necesado agregarles algunos ms, que son propios de esta variable. datos. Se puede elegir un valor arbitrario, si as se desea. Recurdese que no deben
ser muchos ni pocos los intervalos o marcas de clase; generalmente, debe utilizarse
un nmero no mayor de 16, para otros 18, ni menor a 5.
Tambin, obsrvese si la empresa o entidad que realiza el estudio utili~a estos
procedimientos en las publicaciones o estudios anteriores. En estos casos, se deber
emplear tablas similares, con el fin de continuarlas presentando de la misma forma,
con fines comparativos.
\
,:---\-------------------------- ----------------------------r--
1 . 1
Captulo 2 Distribud01zes de fremezzdas- 7itb/,1S o ruadros de fi-ecuencias y
Estadistica aplir11da

En este ejercicio se puede utilizar la frmula m = 1 + 3,3 log n, para calcular


el nmero de intervalos o marcas de clase~ Siendo m= 1t 3,3 log 50 = 1 + 3,3
(1,698970) = 1 + 5,60660 = 7. x0-x ;
En este caso, como en los dems, siempre se aproximar al nmero inmediata-
mente superior, pero no tiene importancia si se trabaja con el valor infererior, en
x -x; fz
este caso 6. A pesar de que muchas personas, quizs por abreviar, calculan este valor
mediante la aplicacin de la frmula m= .J50 = 7,07 = 8, el procedimiento se con-
sidera como poco recomendable.
Paso4
Se determina el valor de la amplitud, es decir, la diferencia que hay en cada uno Las marcas .de clase que aparecen en la ltima columna de la tabla 2.1 O, se pueden.
e
de los intervalos de clase y que se simboliza por o i. Por comodidad y presenta- calcular de varias maneras:
cin debe ser un nmero entero; y en la mayora de los casos, se le puede considerar 0 Promediando los valores para cada intervalo. Para ello se le suma al lmite infe-
constante para cada uno de los intervalos de clase. rior el valor correspondiente del lmite superior del intervalo y luego se divide
e= rango/ m 2917 = 4,14 = 5. entre dos (33 + 38)/2 = 35,5; (38 + 43) /2 = 40,5, y as sucesivamente.
De todas formas, por pequea que sea la fraccin, siempre se debe aproximar al 11 Si la amplitud es constante, basta obtener la primera marca de clase por el mtodo
nmero inmediatamente superior. Si se mantienen constantes los valores de m = 7
ante:i~r y va sumndosele el valor de la constante, que en este caso es igual a 5.
y e= 5, se nota que el valor del rango cambia. " Se divide la constante por 2 y el resultado se le suma al lmite inferior, o se le resta
5 =rango+ 7, el nuevo rango ser 35, es decir, se increment en 6 unidades. Y
al lmite superior del intervalo.
siempre que esto ocurra, el valor excedente deber repartirse, sumndole una parte
al lmite superior y restando la otra al lmite inferior.
En este caso, como el incremento fue 6, se le suma 3 a 65 y se obtiene 68 como
nuevo xmx' y si se le resta 3 a 36, lo cual dar 33 como xmln' El nuevo rango, en este
caso, ser igual a 68- 33 = 35. En ~1 desarro~o de la. teora estadstica, se emplean algunas grficas que ayudan a vi'
Lo ms indicado, en este proceso, es repartir el incremento hasta donde sea po- s~alJZar y exphca: mejor el contenido de las tablas; estas son: diagramas de frecuencias,
sible en partes iguales, pero no necesariamente se debe hacer. histogramas, pohgonos y ojivas.
Paso 5
Una vez se establezca el nuevQ rango, se coloca como lmite inferior del primer interva- ~Diagramas de frecuencias
lo al valor mnimo del rango, en este caso 33, y va sumndosele el valor de la amplitud. ~orlo general se utiliz~ para representar las variables disc;etas, por medio de lneas ver-
En la tabla 2.9, obsrvese que al lmite inferior se le ha agregado 0,1, pero solo se ticales cuya altura estara dada por los valores de las frecuencias, ya sea absoluta 0 relativa
hace con el fin de clasificar los datos. Es decir, si un valor de x1 es igual a 48, quedar o por medio de lneas horiZontales que dan la sensacin de peldaos en una escalera. '
dentro del tercer intervalo, ya que el cuarto corresponder a valores superiores a 48.
Grfica 2.1 Diagrama de frecuencia X
Tabla 2.9 Tabulacin. Variable continua

33,1-38 111 3
38,1-43 H-H 5
43,1-48 H-H 11 7
48,1-53 H-H 1111 9
53,1-58 H-HH-HH-H 15
58,1-63 H-H 1111 9
63,1-68 11 2

Los smbolos que se cuando se confecciona la tabla frecuencias se mues- 1

h', 1l tran en la tabla 2.1 O, en la cual se calculan, a la vez, las marcas de clase. 1
m;------1----------------------------. -----c---------T
l
~ .
1--Es_ta_dl_sl_ic_a....:apLlt:_ca_d'_' -------------------------------------------------------+-----~-----Ca_P_lu_lo_2 _Distribucioues tlcfrectlencillS- TitbbJS o cuadros de.fi?wmcias y represcntacingn.fica

_..,_. Grfica 2.2 Diagrama ~e frecuencias absolutas acumuladas };R Grfica 2.4 Curva normal
(variable discreta) ~-~
~.
;i[
,;~

:. .
~.~
::~~

..:. 11
-~
.in:
.)~;
. .......
...
l,,
..;~ -.:

-.-~;;~; Como puede observarse en las grficas 2.1 y 2.2, utilizando un par de ejes cartesia- }~ Polgono
. /~:-nos, en el eje horizontal o abscisa se sealan los distintos valores correspondientes a la 'i Puede dibujarse sobre el histograma o aparte, si as se desea. En el primer caso, se unen

- .-~
i- :: variable discreta, y en el eje vertical u ordenada, las frecttencias absolutas, relativas o las los centros superiores en cada barra o rectngulo; en el segundo, se unenlos puntos de
(' acttmuladas. Cada valor de la variable, con su correspondiente frecuencia, constituye interseccin de la abscisa, correspondiente a la marca de clase, y la ordenada (frecuencias
;:i ~
. una pareja que se sealar en el plano mediante un punto, desde los cuales se tra- absolutas o relativas).
. :.-_ zan lneas verticales u horizontales que, en conjunto, conforman grficas denominadas ~ Cuando. la distribucin es simtrica, el polgono toma la forma de una campana,
denominada generalmente de Gauss, ya que los valores de las frecuencias absolutas y
:-'diagramas de frecttencias.
:~r,; relativas equidistantes a un valor c~ntral son iguales, creciendo desde los valores ex-
....: fi Histogramas, polgonos y ojivas ~~ tremos hacia el centro. Esta grfica es de gran importancia en el desarrollo de la teora
-= Estas grficas se utilizan para representar una variable conti~ua. 'l' estadstica y con grandes aplicaciones en la inferencia estadstica.
..
fi:t1 Grfica 2.5 Polgono de frecuenciasX
-~-Histograma de frecuencias f~~
... Para su elaboracin requiere que la amplitud del intervalo sea constante; se compone de
: :: barras o rectngulos unidos, levantados sobre su base o abscisa. Su ancho est dado por
' el intervalo de clase y su altura por la frecuencia, absoluta o relativa.
:~
]
f::
Grfica 2.3 Histograma de frecuenCias '~
..'.... ~
--~
.'.
~:._,.
~~;k
:.: .,.
:
~: . -~

ji Ojiva
..........
:

Se construye utilizando las frecuencias absolutas y relativas acumuladas, y se aplica
para obtener soluciones en aquellos problemas donde hay necesidad de aplicar los 1
percentiles.
1
---------------------------------

1
-

Estadistica aplicad!l

Grfica 2.6 Ojiva segmento del pastel representa un elemento o componente de una serie de datos, con la
salvedad de que solo puede mostrar una sola serie a la vez.
Es de anotar que los ngulos de cada uno de los sectores son proporcionales a los
componentes, siendo ms llamativos cuando se colocan colores o con la aplicacin de
diferentes formas de rayado. La forma de hacer la grfica consiste en la subdividisin
de los 360 de un crculo, proporcionalmente al nmero o al porcentaje de cada una de
las clases o sectores, en que se ha dividido la observacin. En la grfica 2.7, en primer
lugar se muestra su aplicacin en los atributos, donde con mayor frecuencia se utiliza.
En la mayora de casos, se utilizan para representar caractersticas cualitativas o atri-
butos. En su elaboracin se recomienda ordenar los sectores de acuerdo con su magni-
tud numrica o porcentual; adems, hay que tener presente algunos de los inconvenien-
tes que generalmente se observan en su aplicacin.

Para la interpretacin de estas grficas, se considera nicamente el histograma de Tabla 2.11 Distribucin porcentual sobre lugares
de de 400 familias
frecuencias. Considerando la grfica 2.3 se observa que la altura corresponde a la fre-
cuencia absoluta o a la relativa; se dir, entonces, que el 6% de los establecimientos, o
sea 3, vendieron entre 33,1 y 38 millones de $; el1 Oo/o de los establecimientos, o sea 5,
vendieron entre 38,1 y 43 millones de$; el14o/o de los establecimientos, o sea 7, ven-
dieron entre 43,1 y 48 millones de$; el18o/o de los establecimientos, o sea 9, vendieron
entre 48,1 y 53 millones de$.
1

11 Grficas utilizadas en los informes


Las grficas presentadas anteriormente (diagramas de frecuencias absolutas, relativas y
acurimladas), histogramas, ojivas y polgonos de frecuencias, como ya se anot se apli-
can comnmente en el desarrollo de la teora estadistica, pero hay una gran cantidad
Grfica 2.7 Distribucin porcentual de 400 familias sobre lugares de compra
de ellas que por lo general se utilizan para visualizar mejor la informacin que aparecen
en tablas. .
En un informe, las recomendaciones que se hacen son: primero va el texto y luego
la tabla acompaada de la grfica, como procedimiento eficaz en el anlisis y la inter-
pretacin de la informacin. De esta manera se examinan rpidamente los datos; ade-
ms, se recuerdan con facilidad, y se aprecian mejor las magnitudes y las regularidades
que la variable o variables manifiestan.
Hoy da, se cuentan con una buena herramienta, ya sea en la casa, en la oficina o
en la universidad, que permite elaborar en forma rpida una buena representacin: el
Excel. Esta ofrece diversos tipos de grficas, ya sea de reas, barras, columnas, lineales,

circulares o pastel, de dispersin, anillos y radar. Existen ms tipos de grficas como:
1 1
cartogramas, pictogramas, piramidales, las grficas de Gantt, de escala, entre otras. Al- o Cuando la caracterstica se subdivide en muchas partes, su representacin se hace
gunas de ellas de poco uso. confusa e inconveniente en la visualizacin de la informacin, siendo preferible

l
la utilizacin de otro tipo de figura (por ejemplo, barras).
11. Grfica circular o pastel 0 Cuando una de:"Js partes que se quiere representar corresponde a una propor-
1(. 1 Recibe esi:e nombre por su forma que permite visualizar los componentes de una cin o cantidad muy pequea en relacin en las dems; esto hace casi imposible !
! : totalidad, si se utiliza para mostrar la relacin entre las partes y el todo. Cada parte o visualizarse, perdindose dentro de la grfica. i
1

~- ---t ----------------
1
-- --
!
------~---~--------+-----

!
i
Estadstica aplicada ---------------------------------------------t--"~---""'bl" 2_DUihmi""''~-""" r,..':?!!"'' kf="Y-17'f
Grficas de barras o columnas :.
Grfica 2.9 Diagrama de una escala
Se utilizan para comparar elementos individuales o para mostrar cambios fuera de tiem-
' po; cada barra o columna representa un elemento en una serie de datos. La gran ventaja
4e estas grficas es permitir representaciones tanto de caractedsti~a.S cualitativas como
las cuantitativas.
.. _Estas grficas se comparan de un conjunto de rectngulos (verticales u horizontales)
.:cuya longitud ser proporcional a las frecuencias o a las magnitudes correspondientes;
;todas ellas debern tener el mismo ancho y cuando estas se encuentren separadas, debe-
.fn tener la misma distanci~ de separacin.
Cuando se utilizan las barras, existen varias formas de representacin, ya que pueden
ser simples o compuestas y se emplean para representar caractersticas cuantitativas o
_cualitativas, como se muestra en la tabla 2.12 y en la grfica 2.8. .
Tabla 2.12 Valores (miles de millones de $),.en las formas de
pago en 1Oestablecimientos comerciales durante un
fin semana en la ciudad x Grficas de lneas
Se utilizan para mostrar cambios en los datos a intervalos regulares, casi por lo general
correspondiente al tiempo, ya sean horas, das, meses, aos. De ah que se empleen en
: .. estadsticas temporales o de tiempo, donde cada lnea representa una serie o variable.
En resumen, se podr afirmar que son lneas que representan una o varias variables,
lo cual permte describir los cambios o variaciones que sufren uno o varios hechos, du-
rante un periodo dete'rrninado. En el eje horizontal o abscisa, se sealan los periodos de
tiempo y en la lnea vertical u ordenada, se tendrn en cuenta los valores o cantidades
correspondientes a la variable o variables que se desean representar, cuya interseccin
Diagrama de una escala permite ubicar un punto y luego unirlos mediante una lnea poligonal, reflejando las
variaciones que ocurren en esos periodos.
El trmino diagrama es muy amplio y puede abarcar varias clases de grficas. En este ca5o,
Algunos la denominan como lineal aritmtica,_ dado que ambas escalas que muestran
son representaciones bastante sencillas en las que se trata generalmente sobre una base co-
los cambios aritmticos o porcentuales son de igual magnitud; es necesario tener en
..rhn lineal, de longitud proporcional a las cantidades que se desean mostrar. En muchos
cuenta que la longitud de ambas lneas sean iguales, ya que una de ellas, al extenderse
c:asos, la grfica lineal se puede elaborar utilizando rectngulos, sombreando cada parte en
ms que la otra, distorsiona la representacin que se quiere hacer.
.forma diferente, donde la longitud total deber representar al ciento por ciento.
Grfica 2.8 Formas de pago (miles de millones de$) en 10
establecimientos comerciales el fin de . en la ciudad
Tabla 2.13 Evolucin de los precios de tres
productos del pas: 2007- 2011

l
1
l
1

1
,: _.:--------------------::': ......... .- - -- - - -----------+---

' .
1 1
}---_..:._ ____________________________________________
Estadstica aplicada ;;;~
- - - - - - - - - Captulo 2 Distribuciones de fiectlellcins- Tablas o cuadros defi~cuencit/J y represcmndr1 grtiftca
1

Grfica 2.1 O Representacin lineal Tabla 2.14 Matrcula por sexo y cursos
1'

1: Pictogramas
Aos
Se consideran la representacin por medio de figuras que guardan relacin con la carac-
terstica que se desea visualizar. Es un mtodo restringido a la representacin de relacio-
A veces hay necesidad de graficar, de manera diferente de la anterior, pues existen nes simples, con el fin de eliminar la comparacin entre objetos de tamaos diferentes,
otras grficas, corno: la semilogartmica, cuando una de las variables en vez de presentar pues en la mayora de los casos distorsionan la realidad. Se acostumbra representar un
un crecimiento aritmtico lo hace en forma geomtrica, por tanto, ese eje debe estar valor nitario por un smbolo, el cual describe la magnitud en cuestin, repitiendo ese
dada en escala logartmica; mientras que la otra se da en forma aritmtica. De ah que smbolo tpico un nmero adecuado de veces hasta alcanzar el valor total. Sin embargo,
sea necesario la utilizacin del papel sernilogartrnico; la logartmica, cuyas dos variables es necesario colocar a continuacin la cantidad o el valor total que se va a representar,
presentan crecimientos geomtricos. Para ello es necesario utilizar el papel logartmico. acompaada de una figura con los valores dados, indicando el valor correspondiente a
cada una de ellas.
Pirmide de poblacin Siempre que elabore un pictogmma, se debe tener presente que esa figura explique,
Nombre que se le da a aquella representacin grfica en la cual la poblacin se encuen- por s misma, la caracterstica que se quiere representar; se aconseja no utilizar dimen-
tra, por ejemplo, clasificada de acuerdo con su edad (variable) y sexo (atributo); se sin, volumen o tamao del smbolo. Adems, se debe procurar dibujar nicamente
utiliza, preferentemente, en representaciones de estadsticas mixtas de investigaciones el nmero apropiado de smbolos o figu~as, dependiendo de la cantidad que se va a
! demogrficas, econmicas y sociales. Esta grfica no suele ser ms que un histograma, el representar, dando de esta manera una visin global del problema, para evitar expresar 1

, . 1 cual permite representar dos caractersticas en una misma grfica. en detalle el comportamiento del hecho.
1
' :------+-------------- -----------------r--
': 1
1,

1
Grfica 2.12 Pictograma sobre inversin extranjera en Grfica 2.13 Pictogramas con el uso de figuras

3.500
3.000
Colombia
Millones de dlares
KKKK~ 8.200 pies de
fuerza
K 2.000:

2.500 1.200 explotaciones 200


2.000 agrcolas
1.500
1.000 5.000 vehculos 1.000
500 importados
o

Industria
manufacturera
Cartogramas
Sector financiero
Se consideran muy expresivos porque permiten deducir fcilmente las caractersticas
'
de cada regin o de todo el pas, as corno las diferencias que puedan existir entre ellas.
.. :. Generalmente se emplean para visualizar informacin estadstica de carcter descrip-
tivo, por medio de mapas que contienen figuras, smbolos o cualquier otro elemento
correspondiente a la informacin. Por ejemplo, los que se observan, todos los das, en
la televisin o en los peridicos y que muestran el estado del tiempo o los lugares del
pas en conBlctos.

Grfica 2.14 Cartogrruna de zona turstica

1 ._.

1
..
::.
Fuente: Tomado del peridico E/Tzeinpo.

.-:.
Tambin se pueden utilizar 'figuras de -~bjetos, personas o animales, de ig~al tamao
i,
y con el mismo valor, colocando siempre tanto el valor total y el de cada obero.
Finalmente, cuando se tenga la oportunidad de leer peridicos o revistas yse vean
:: .. esta representaciones grficas, .hay _que ser cuidadosos, pues pueden hab.er ~tilizad_ Grficas de Gantt
equvocos que desorientan al interpretarlas. Vale la pena recordar que .los dibuos, en la. En muchas empresas, es indispensable la utilizacin de esta valiosa herramienta grfica,
mayora de los casos, dan vida al informe pero tambin pue~en ocaswnar, en algunos en las que se establecen las diferentes etapas de trabajo por ejecut~ y al mismo tiempo,
casos, una falsa impresin, la q.al debe evitarse cuando se dec1de usarlas. , . . durante ese periodo establecido, van sealndose la cantidad realizada, lo cual permite
i saber si se est cumpliendo lo establecido o, por el contrario, alguna o algunas de ellas
, 1 se encuentran retrasadas.
1
- 1
'~~~:-~-----f----- -------- ----
. 1
~~
tl
76
Esladlslica aplicttdil
~~----- 2_D_im~'_"'!!~""-'Wbl ruMm~Jim._tcr_tc_ia. . :sy_'_,_"eJi_'~-m_,t,_tct1. :'g:. ;if1~c_n_~.7
Captulo __

Hoy da, se ha modernizado su presentacin y utilizacin y se distinguen varias clases


de grficas de Gantt.
i Grfica 2.16 Grfica en forma de anillo Y
o Grfica de avance del trabajo: permite visualizar la forma como se avanza en la
ejecucin del trabajo, basado en un plan; en algunos casos, esto permite trasladar
recursos a aquellos que presentan retardos o demasiado avance en la ejecuCin.
o Grfica de trabajo de los obreros y mquinas: como su nombre lo indica, permite
hacer control por obrero o por mquina, en todo el proceso de desarrollo tanto
en el volumen de trabajo, como en el aprovechamiento del tiempo que se ha
indicado que debe .llevarse a cabo en uri periodo determinado.
G Grfica del programa de trabajo: visualiza el tiempo utilizado y la tarea por reali-
zar, haciendo de esta manera mucho ms equitativo la ejecucin de los diferentes
procesos, evitando la presentacin de algunas inactividades (tiempo y recursos), Grfica 2.17 Grfica en forma radial
en el desarrollo de alguna operacin o en el trabajo en general.

Diagrama de dispersin
Ms conocido como nube de puntos, se usa para mostrar la relacin que puede haber
entre dos variables o series de datos. Se aplica mucho en el anlisis de regresin y correla-
cin, que se ver ms adelante (captulo 13), como una forma prctica para determinar
y analizar la lnea que mejor se ajusta a un conjunto de puntos. 1
~-._.

Grfica 2;15 Diagrama de dispersin .,

Eterogramas
Se puede considerar como un conjunto de dos pruebas fotogrficas 0 los dibujos desti-
nados a observarse, a travs de un estereoscopio; es una representacin tridimensional
de una figura sobre una superficie plan~.

Grficas que utilizan cuad~ados y tringulos


Como su nombre lo indica, son grficas en cuya representacin se utilizan cuadrados
Ytringulos. Su elaboracin requiere cierta habilidad para determinar el rea de forma
correcta, superponiendo las figuras en vez de yuxtaponerlas. De todas formas, la visuali-
zacin de la informacin no es tan clara, como debe ser el objetivo de una graficacin.

Grfica 2.18 Formas de tringulos y cuadrados


Grfica en forma de anillo
En algunos casos, se utiliza para mostrar la relacin entre las pattes y el todo. Es diferen-
te del grfico circular, pues permite visualizar msde una serie de datos, dado que cada
anillo representa un conjunto de informacin.

'Grfica eri forma de radial


Con poca frecuencia, se utiliza para comparar elementos en algunas series de datos, en la
que cada una muestra una lnea que se ubica alrededor de un punto central, que indica i

el comportamiento de cada serie de datos.
i
i
.........................- ........ _ .. ____,. .. _+----


~r<'''
':r-:
Estadstica aplicada . Caplulo 2 DistribuciOIICS de frecltCIJCIIS- Tilblas o madras de jreclll:nCtlS y represenll/Ci6n grdjica
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -----------~ - - - ------ _ _ _ _ _ _,:___ _.::.__:.__ _..:::.._:..____j

ll11Aigunos comentarios acerca :de las grficas


Las grficas son una forma de visualizar mejoOa informacin, pero esta nunca sustituye (~
la tabla que contiene los datos, solo la complementa. En un informe con una preseni:- ;:~
cin adecuada, primero d~be ir el t~x;o, que.irrCluy~ la explica~.n de los resultados; ,lue- .[l
go aparee~ la ~abla.con la :nfor~acwn c~~r,es?ondiente; por ulumo, se anexa la grfica, ;~ Amplitud del intervalo Polgonos
que permtta vtsualtzar meor la mformaqon_'.que se desea presentar. ':ti. Cartogramas o Ojivas
La apariencia de la grfica depende de Ja 'escala usada y de los datos presentados. Datos agrupados Rango
Puede ocurrir que una misma lnea tenga un.a:significacin diferente, segn la posicin, Datos originales , . Recorrido
en cuanto a la relacin con la magnitud' 1'\e:Jos valores presentados. Estos se pueden Diagramas de frecuencias Tablas de frecuencias
observar en los efectos de la publicidad;<c~ya ilustracin muchas veces produce un o Grficas de barras o Tabulacin de datos
gran efecto sobre los hechos mismos. Basra.c~biar la escala del dibujo o exagerando la Grficas lineales Variable continua
significacin aparente de la lnea, para lograr: ~1 efecto deseado. Quiz no sea exagerado Histogramas de frecuencias Variable discreta:
afirmar que de todos los mtodos estadiscl.cd.s;_~inguno ms til para engaar a incautos Intervalos de clase
que la grfica estadstica. : . Lmite inferior del intervalo
En un informe se recomienda si existe ,rrs :de una grfica, numerarlas; y cada una de Lmite superior del intervalo
ellas llevar el ttulo correspondiente que e~pli<}ue claramente su contenido; es indispen- o Marcas de clase
sable el uso de convenciones (rayado, co!ores.:~tctera) que identifique fcilmente cada Nmero de intervalos
variable por representar. La escala debe sei"Q~tante amplia, de tal forma que permita o Pictogramas
revelar diferencias o tendencias significativas:; ya que el ojo del lector no distingue f-
cilmente ligeras diferencias, ni debe ampliar$(: hasta dar nfasis inadecuado a detalles
significantes; por tanto, deber conceder atencin a los valores que toman las escalas a
fin de no distorsionar aquello que deber rc;#esentarse.

,: .

.;
'

...
,

. ..

1
i

~~- --i-- --- -.. ------------------- .-------+---

~
Esladisllca apliaul.!

i:cit.res~ori1ien alosri:t~d~s.P~~d~t@Jf~rij~ .. . ,
<U u.uua,v '"""'~'" .. d~ 40 trabaj~d~r~s de uii~ ~mprisi; -:
2 '6 i2 6 10 s 7 8 4 6 12 5 4 6 2 s7\; /: ... 0,10 8
i 2 10 12 1o 7 8 6 4 6 12 1o 5 6 7 8 2 4 1() 6 . 5 3 0,07 11
6 9 0,22 20
a~ Elabor6 una tabla de frecuencias 7 5 0,13 25 0,62
b. Identifique: x; 2 x34 y3 fs N 2 y H4 8 5 0,13 0,75
c. Elabore las grficas correspondientes (diagramas de frecuencias abso-
10
lutas y acumuladas).
d. Determirte la caracterstica investigada.
2. El jefe de personal no solo ha querido identificar el nmero de retardos, '"~

sino tambin el tiempo en minutos que no se est en la oficina. Los


resultados para los 40 trabajadores fueron:
15 30 42 18 72 49 48 25 32 64 15 16 32 26 32 41 28 62 51 32
76 62 39 27 16 22 32 30 20 16 28 32 43 34 18 21 22 55 23 54
a.. Elabore una tabla de frecuencias.
b. Identifique: Xz x34 Y4 YJ fs N2 H4 m y rango. e
c. Elabore el histograma, el polgono, la ojiva respectivos.
. d. Determine la cara~terstica investigada.
.3. Esos 40 trabajadores se clasilicaron de acuerdo con el nivel de.estudios:
.... incompletos (In); primarios (P); secundarios (S); tcnico (t) y superior .
.. (SU). .
. SU(ri) P SU(Irt) S T SU P T(In) P S(In) P S P P S P T S T T
PP(In) P (In) S S P P P T P T P T S T(In) S(ln) P T S T
. .a. Elabore la tabla de frecuencias yla grfica correspondiente...
. . ~.. Pe termine la caracterstica investigada.
. 4. Adems de las tres informaciones en las cuales se clasilicaron los 40
trabajadores, se les indag por las actividades que realizaba11 en los das
\libres. cine(C); deportes (D); Tv; lectura (L); caminar p pas~;r (Cp); 0,32
'oficio casero (OC); otros (0). Hubo trabajadores que sele~cionaron 3 0,08 28 0,70 36,5
ms de .una actividad, por tal razn se da la tabla con la fretue11cia, para 4 0,10 32 0,80 45,5
. . tener una informaCin el!- trminos porcentuales sobre ell~. 3 0,08 35 54,5
Elabore la tabla. de f~ecuencias y la grfica correspondiente.
Caractbrstica inv~stigada. '

!!

"'" .......------------------------f---
1

1
Esladslica ap!iCIU~t------- .......... -. ------ - ... ------ - ..... --- - .. -------- ---- ---------------------2

1. Con los siguientes datos, correspondientes a una variable continua, elabore um,___~-.
tabla ~e frecuencias y las grficas polgono y ~iva.
46 (jf]. 64 58. 72_ 77- 52. 76 43. 46 78 73
61 ()8 42 54 8,2 70 63. 59. 49 8.0 40 49'
(2 62 58 66'.. 55 60

2. Con los siguientes datos, el gerente de la compaa le propone hacer dos (2) grfi- .,/ o
cas con el fin de escoger una de ellas para la prxima publicacin de la revista de la .- ./ " '\ lO~ \$
empresa. ... "' ~)( ~ \ ..tf\ )~tl (/1 /
Aos: 2006 2007 2008 2009
Produccin: 380 450 780 620
201 O 2011 -~ _.- ,..
930 1.080 (millones$) /~{)
~/ Q:v
fllr()
Ventas: 760 680 800 905 1.500 1.300 (millones$) ,:___:;.,; -({\\
' ./' J/ t')!.J\
\ / ~ J
3. En una pequea encuesta realizada por las autoridades del barrio, sobre el nme~~- ~) "
de personas que trabajan en industrias caseras y que emplean menores de edad, se-::- ., 1 .._\l
obtuvo la siguiente informacin; U'
e)
(?o\'"S. ~ "') r. --:./' 4-'1'" \J ;./:

Trabajador 1 5 cursos Trabajador ~ '\~-cursos ~ 00;\o <>{: j'


Trabajador 3 6 cursos Trabajador fr'4\ri4 cursos \.(.\ .:;')!
-!J."<r . ~(..P t:rl'~~ / 0
1
Trabajador 5 5 cursos Trabajador 6 cursos
Trabajador . 7 2 cursos Trabajador Q. ~~ 4 cursos \_,di'.:. ..;_~
Primaria
Trabajador 9 4 c~rsos Trabajador ""' 1O 3 cursos xv ~
Primaria (In) 2 Trabajador 11 2 cursos Trabajador \p dfu:sos \...01'~ .
Secundaria 8 Trabajador 13 4 cursos Trabajador ~_t4!J:W:\tursbs~ -y.\ . :< 1 \ ~-
Secundaria (In) 2 Trabajador 15 1 cursos Trabajador l~ps '3~-b,~ ~ :l.) 6 11
Universitario (In) 2
Trabajador 17 5 cursos Trabajador 18 ~\1~cursfs l ~
20 1 cursps l{G~) O(l.-1 .. ~) .
8
Trabajador 19 3 cursos Trabajador
Trabajador 21 3 cursos Trabajador 22 4 cursbs '551 C~;,1 1 :l.)
Trabajador 23 5 cursos Trabajador 24 4 curs~s 6o1 '~ 1 (Go)\ 0\,l) fo
Trabajador 25 5 cursos ~ 6':1 11 J (61".: .\.'l) ~\
Como ayuda en la lecmra de la anterior informacin presentada, los datos ]e~dtga~:)i 'l)
1
nizaron en una tabla de frecuencias, mediante la cual se obtienen 5 grfitas de barra
que se presentan a continuacin. Elija la grfica de barras que representd la anterior
situacin. ~-l~ e ') -'l) ce"'f"' t.o.
1
\

l.',;
es igual a ________ %.
c. Entre los clientes habituales, el porcentaje (%) de los que pagan con tarjeta de
crdito es igual a _________%.
d. El nmero de clientes que pagan con tarjeta de crdito es igual a _____%.
e. Elabore un cuadro o tabla con esta informacin.

4. Con la informacin de 'la grfica que aparece a continuacin, complete y responda. 6. Una distribucin de frecuencias relativas representa las frecuencias en trminos de

Ventas diarias en(millones de$) 270 establecimientos a. nmeros enteros.


comerciales de la ciuda.d- 2011 b. fracciones.
c. porcentajes.
d. las opciones {a) y (b).
e. todos las anteriores.
7. El histograma y la ojiva se utilizan para representar
a. distribuciones cualitativas.
b. variables discretas.
a. El nmero de establecimientos cuyas ventas diarias fluctuaron entre $15 c. variables continuas.
millones y $45 millones es igual a - - -
d. ambas (b) y {e), pero no {a).
b. El porcentaje(%) de establecimientos cuyas ventas diarias fue de por lo menos
e. ninguna de las anteriores.
$25 millones es igual a-----
c. El nmero de establecimientos cuyas ventas diarias fueron superiores a $35 8. La frmula de Sturges 1 + 3,3 log n, se utiliza para determinar
millones es igual a -----
a. frecuencias absolutas.
d. El porcentaje(%) de establecimientos cuyas ventas diarias se encuentran entre
$5 y $15 millones es igual a ___________%.
b. frecuencias relativas.
c. nmero de intervalos.
e. Construya el polgono de frecuencias de la distribucin. Qu concluye?
d. amplitud del intervalo.
f. Construya una tabla de frecuencias.
e. marcas de clase.
5. Considere la informacin contenida en la siguiente tabla y-complete y responda.
9. Con la siguiente grfica, sobre el porcentaje de estudiantes, de acuerdo con el n-
mero de libros ledos, en el ltimo semestre del 2011, se sabe que la muestra fue
realizada a 500 estudiantes de la jornada diurna en nuestra universidad.

a. El porcentaje(%) de clientes habituales es igual a_ _ _%.


b. Entre los clientes espordicos, el porcentaje(%) de los que pagan en efectivo
a. Elabore una tabla de freu~ndas. e. todas las anteriores.
b. Qu porcentaje de estudiantes leyeron menos de 6 libros?
14. Una encuesta realizada entre 500 estudiantes sobre la distribucin del tiempo en la
c. Cuntos estudiants leyeron ms de 5 libros?
semana, cuando se termina el tiempo de estudio en la universidad se muestra en la
d. Qu nombre recibe la grfica? .. grfica.
1O. Seale como mnimo cinco (5) recomendaciones que se deben teuer en l!i elabora-
cin de una buena grfita.
.. ;

11. Como regla general, qu cantidad de intervalos o marcas de clase se recomienda


para organizar datos en. una tabla de frecuencias? ..;;
a. Menos de cinco.
....
b. Ms de 25.
....
c. Entre 20 y 25. ;,
d. Entre 5 y 16. Complete.
e. Ninguna de las anteriores. ., a. El porcentaje de los estudiantes que prefieren ver Tv. y lecturas practican un
12. Una corporacin de ahorro y vivienda desea conocer el nmero de deud~es en el deporte y comparten su tiempo es-----%.
pas con ms de 6 meses de vencido el plazo, al finalizar el ao 2011. b. El nmero de estudiantes que se dedican a estudiar, investigar y hacer tareas es
Los departamentos de. crdito de cada sucursal informaron lo siguiente.
c. El nmero de estudiantes que no realizan ninguna actividad es---
d. Elabore una tabla de frecuencias.

15. Quinientas (500) empresas de un sector de la economa distribuye utilidades (en


millones de $) entre sus accionistas, como se muestra en la tabla:
a. Cuntas empresas tienen utilidades entre $30 y $150 millones?
b. Cuntas empresas tienen prdidas superiores a los $10 millones?
c. Cuntas empresas tienen utilidades superiores a los $120 millones?
d. Elabore una grfica correspondiente a las utilidades recibidas por las 500
a. Complete la tabla de frecuencias. empresas.
b. Calcule el porc~nt~je de sucursales con menos de 210 deudores mor~~os.
c. Qu porcentje de sucursales tienen ms de 108 y menos de 306 rrifosos?
d. Elabore una~grfica conlos anteriores datos, :~
13. En la construccin de una distribucin de frecuencias, al dividir el valor'del rango
por el nmero de intervalos, el resultado obtenido indica
a. las frecuencias. absolutas.
b. el valor del recorrido.
c. la amplitud del intervalo.
d. los lmites del intervalo.
Convierta los datos en porcentajes y construya
16. Una encuesta realizada a 300 estudiantes respecto a consultas hechas en la biblioteca
de la institucin, segn los temas requeridos, encontr que 86 de ellas eran de eco- a. un diagrama circular.
noma, 50 de matemticas, 70 de derecho, 26 de ingls, 60 del rea contable y 8 de b. un diagrama de barras.
diferentes temas. Elabore una tabla de frecuencias con la respectiva grfica. c. un diagrama de barras de componentes en porcentajes (% acumulado
horizontal).
17. Suponga que se realiza una investigacin sobre precios (miles de $) de un artculo,
distribuido en la ciudad, con los siguientes resultados: 21. Una muestra realizada a 250 familias de un barrio de la ciudad, sobre el consumo
de chocolate en el desayw1o, de acuerdo con sus preferencias por la marca del pro-
$ 250 265 250 290 '238 260 248 270 232 275 262 262 240 270 272 236 263 258 ducto, arroj los siguientes resultados:
248 254 280 263 246 236 288 254 270 263 265 240 270 280 260 250 246 260
284 290 272 268 230 300 284 240 254 258 296 278 280 278.
a. Elabore una tabla de frecuencias, trabajando con una amplitud constante.
Obtenga el nmero de intervalos aplicando m =1 + 3,3log n.
b. Dibuje el histograma, el polgono y la ojiva.
c. Aproximadamente qu porcentaje de establecimientos vende el producto a un
precio inferior a $270?
Construya la grfica que mejor representa a este conjunto de observaciones. Expli-
18. La seccin de cobro de una empresa comercial registra los das de mora en el cum- que el porqu de su decisin.
plimiento de sus obligaciones, en un mes, a 64 deudores. Los resultados son:
22. Responda.
a. Cundo se aconseja usar la distribucin de frecuencias para organizar datos?
b.. En qu casos se debe graficar en papel semilogarrrnico? Cundo en papel
logartmico?
C. Segn la regla de Sturges m ;' 1 + 3,3log n, cuntas clases o marcas de clases
de obtiene:
o Si la muestra es de 80 observaciones?
a. Considere los das como variable discreta y elabore una tabla de frecuencias. 0 Si la muestra es de 150?

b. Dibuje el diagrama de frecuencias correspondiente.


c. La empresa da tres das de gracia, en los cuales no se cobra intereses por mora. 23. Realice una pequea encuesta con sus compaeros de clases, solicitndoles infor-
Qu proporcin de deudores tendrn que pagarlos? macin sobre: edad, peso, estatura, promedio de calificacin en una asignatura,
nmero de libros consultados en la biblioteca, durante un determinado periodo.
19. Explique qu diferencia puede haber entre una grfica de barra y un histograma. Organice los datcis obtenidos y elabore las grficas correspondientes.

20. Una empresa realiza una encuesta a 800 empleados respecto al traslado de sus ce- 24. Una programadora de televisin realiza una encuesta telefnica sobre aceptacin de
santas a los fondos de pensin, recientemente creados. El objetivo es determinar uno de sus programas, de acuerdo con la edad del televidente. Los resultados obte-
cuntos empleados estn dispuestos a aceptarlo. Los resultados obtenidos son: nidos fueron:
b. Elabore un diagrama de frecuencias.

28. Se les pi~ a 800 comerciantes que dijeran qu tipo de programa de Tv. preferan
pa:a emmr sus mensajes de publicidad. Las respuestas se resumen en la siguiente
grfica:

Elabore la grfica correspondiente que represente a este conjunto de informacin.

25. Suponga que 30 empleados, de acuerdo con el rendimiento en el trabajo durante la


semana, se clasificaron as(:
A = Excelente C = Aceptable F = Deficiente
B =Bueno D =Regular
Los resultados fueron:
CBCAFADBDCABFDCABDCCBAACBFADDF
a. Elabore un cuadro de tabulacin. Complete.
b. Presente la informacin de manera que pueda publicarse en una revista.
a. El porcentaje (%) de los comerciantes que prefieren emitir sus comerciales en
c. Acompae al cuadro anterior obtenido, con una grfica que sea representativa. las telenovelas o en los programas de deportes es igual a---
26. Las personas que trabajan en una empresa se clasificaron en los ltimos aos por b. El nmero de comerciantes que prefieren los programas culturales 0 las
noticias para emitir sus comerciales es igual a---
niveles de estudio y sexo, as(:
C. El nmero de comerciantes que prefieren las novelas y los programas
~~'~(:~~~t~~B.n~~E~i:Y& ;;:)~~~m';;t\t'~9~W!&t: \~{;~9lQ.;~~ ~~#Q!f}~ s~ deportivos para emitir sus comerciales es igual a - -
Con grado ~niversirario 40 70 62 85 ~.
. Mujeres 12
Hombres
~---~-

Cmo procedera para elaborar un cuadro que el gerente desea presentar en un Este taller est disponible en el CD-ROM que se incluye con el libro.
informe sobre la proporcin de empleados vinculados a la empresa en los ltimos Las actividades que contiene el taller son las siguientes:
aos, por niveles estudio y sexo? 0 Tablas de distribucin de frecuencias:
' Variable aleatoria discreta.
27. Una encuesta a 30 trabajadores de una empresa, sobre el nmero de accidentes de Variable aleatoria continua.
trabajo sufridos durante su vida laboral, arrojaron los siguientes resultados: 0 Grficas:
Histogramas.
Ojivas.
Diagramas porcentuales.
Diagramas de Gantt.
a. Construya una tabla de frecuencias.
Estadistica- ap!icdda . Captulo 3 Medidas de posicin d de tende11cia cmlb'ltl
---------------------------------------~----~~----------------~
Como puede observarse, la finalidad en esta unidad es presentar aquellas medidas
ms utilizadas y al mismo tiempo indicar cmo deben calcularse, en qu casos debe apli-
carse y cundo se corre el riesgo de obtener un valor considerado poco representativo.

Las medidas deposicin, generalmente denominadas promedios, algunas d~_ellas consi-


derada de ten_derjr:ia centra~ se destinan a resumir un conjunto de datos respecto a una Frecuentemente se omite la calificacin de aritmtica, de modo que solo se menciona
caracterstica ot$ervada o investigada, en un solo nmero considerado como repre- la palabra media. Esta es la medida ms utilizada, ms conocida y la ms fcil de cal-
sentativo~ ios:_r~ultados obtenidos con la aplicacin de estas medidas, solo pretenden cular. Sus frmulas admiten tratamiento algebraico. Por tal razn, se considera la ms
explicai, mediiiii.e un valo~ considerado tpico o representativo, un conj~~to de datos. importante dentro de los promedios, a pesar de ser demasiado sensible a cambios que
Algunos eS):~pl~cen diferencias entre estos promedios y los clasifican en medidas de se introduzcan en sus datos; adems, se afecta en forma considerable cuando los valores
posicin y/o det,;;;dencia central; a los primeros se les define como un valqr_ tfpico, ubica- extremos que tome la variable sean demasiados grandes. Se simboliza indistintamente,
. do dentro de lo~_:,valores que toma la variable, el cual a su vez representa _al conjunto de
empleando una rayita sobre la letra X o ji, con la cual se seala la variable; general-
observacionesiilos segundos, como un valor central. De todas formas es. n valor que mente se representa con letra minscula para indicar el estimador y, con mayscula, para
se calcula p~r:(!k.scribir una caracterstica que suele agrupar muchas clases de datos, y el par.metro. Otras formas de simbolizar la media es utilizando la letra M (mayscula),
que se .difei-eJ;J.::iui.. en la forma en que se definen tpicamente, en la cantidad y.tipo de colocndole como subndice la letra con cual se. quiere identificar la variable y entre
informacin qti se puede perder, al resumir la informacin.
parntesis la letra que la. identifica: M(X) 1M(J')i M(Zi M 1 Algunos utilizan la letra !1 (mi-_
Por ot~a par.~e, el promedio es un concepto ms familiar que puede considerar- nscula). En poblaciones, para identificar al parmetro, se emplea con mucha frecuencia
se como ind~~rnnado. Por lo general, un valor promedio intenta _rpresentar o
la letra griega miu o mu simbolizado por fl
resumir la~ d~-a,ctersticas relevantes de un conjunto de valores; los ins conocidos
son media antirrtlca, mediana y moda, y otros de menor importancia como: media
geomtrica, ~pdilr. armnica, media cbica, media cuadrtica, cuartiles, deciles, percen-
tiles y el cintM.:~ecorrido. Por lo general, se consideran medidas de posicin o sim-
plement~ se le~ denomina promedios. Por consiguiente, la expresin promedios no
. solo hace refei:~hcia a la media, sino tambin a todas las medidas que se mencionaron
' .:;'t . Obsrvese que esta frmula matemtica es simplement~ un conjunto de instruccio-
anteriormente. . nes. En este caso, estaran impartindose procedimientos.
Si estos pr~medios se calculan con los valores observados en una poblacin, se les de-
nomina pardm~fJ_os o valores estadticos en una poblacin; si, por el contrario, se aplican a Media aritmtica simple
aquellos valo~es)iui: toma la caracterstica investigada, en las unidades de_ una muestra, Algunos la denominarr coino media no ponderada, cuando se utiliza en datos sin agru~
sern llarnados~timadores o estadgrafos. par, y se obtiene dividendo l suma de todos los valores que toma la variable por el
Vale la pe~:fpreguntarse: es posible calcular un promedio capaz de r~presentar, lo nmero de observaciones.
mejor posible, -~n conjunto de datos? La respuesta es afirmativa, conociendo .Jas ven-
tajas y desve~ta:jas que presentan las diferentes medidas de posicin y/o de tendencia - k"C - :EX.
x=- .t=X=-'
central. ; ~ n N
Algunos a:ut?.res establecen diferencias en cuanto a la forma de medicin. Una de (Muestra) (Poblacin)
ellas es el prom;dio objetivo, que se utiliza para remediar la imperfeccin de los elemen- Donde:
tos de medida, -q~e se dispone en un momento dado. Por ejemplo, la distancia entre un
n = nmero total de observaciones vistas en el conjunto.
punto y otro c~n posibilidades de obtener resultados diferentes, ya sea por dificultad
o por imperfeccin del instrumento de medicin utilizado; pero si se promedian esos
x = media, para el conjunto de observaciones.
resultados, se b.~ene una cifra que puede estimarse como representativa, y se considera, }; indica suma de los elementos o valores de la variable.
en este casi>,.t;~o promedio objetivo. Otro es el promedio subjetivo, el cu~ es diferente x.J =valores de cada una de
.
las. observaciones enla variable, donde i toma valores de
del anterior, y S_;: obtiene al medir varios elementos o unidades, calculand.una sola cifra 1 hasta n.
que indicara ~1 promedio para el conjunto; por ejemplo, el promedio de venta diaria en N= tamao poblacional.
un establecimiento comercial. El proceso que debe seguirse en la aplicacin de esta medida ser:

-------------------------
Esladsllca aplicada Capitulo 3 Medidas de posicin o de tmzde11cia cmtral

l. Sumar todos los valores observados. es uno de los tantos casos, en que la media aritmtica no se aconseja aplicar. En
2. Dividir el resultado anterior, por el nmero total de observaciones. el ejemplo 3.2, se puede observar que la media fcilmente se afecta por valores grandes
0 extremos, en este caso $1.200.000, y como una posible solucin, lo ms indicado ser

El objetivo de emplear la frmula, en vez de la descripcin verbal, significa economa aplicar el modo o la mediana, como se observar ms adelante.
y precisin.
La anterior frmula, denominada por algunos como meda simple o no ponderada, se
emplea cuando los datos estn sin agntpar, es decir, se trabaja con los datos originales
provenientes del instr~liieto de recoleccin utilizado, sin que se haya iniciado el pro-
ceso de concentracin, tabulacin o elaboracin de cuadros o tablas.
Mediante este procedimiento, muy conocido y empleado, se calcula el promedio
obtenido en las asignaturas del grado o semestre que adelantan los estudiantes.

Si se utiliza una escala de Oa 5y las calificaciones obtenidas por un estudiante al pre-


sentar sus parciales fueron. 3,8 3 5 2,8 y 4, cul es su promedio de calificacin?

~.8+3+5+2,8+4 =18,6=372 - Lx - u.
J.L=X=-'
x=-
5 5 ) n N
(Muestra) (Poblacin)

El anterior resultado indica que las cinco notas obtenidas podrn representarse por
una sola cifra, y su promedio sera de 3,72. Algo similar ocurre si en vez de 5 datos
se tienen 100; 500; 1.000 o ms, se utilizara este mismo procedimiento, como la
manera ms fcil de visualizarlos mediante un solo valor o nmero, que hemos de~
nominado promedio. . .

A pesar de su sencillez, este promedio no siempre es muy til.

En un almacn, donde el administrador gana mensualmente $1.200.000 y cada


una de sus cuatro empleadas reciben un salario mensual de $600.000, cul sera el
promedio salarial del grupo?

El promedio del grupo sera:

.X= 600.000 +600.000 +600.~00 +600.000 +1.200.000 = 7ZO.OOO

Segn esta informacin, el 75% de los empleados tienen un salario por debajo de
' r los $720.000 y solo el restante 25% se encuentra por encima de ese valor, por tanto,
el promedio no es representativo.
, ~mt~11l'f#a
1
~-~ --- ------~--~--~---~-- --------------
. 1

1
Esladlslica aplicadil Caplulo 3 Medidas de posid11 o de tl!lzdmda ce11tl'lll

Variable discreta. Clculo de la media aritmtica ponderada

0,14 0,14
2 10 20 0,20 0,40
3 15 45 0,30 0,90
4 8 32 0,16 0,64
5 5 25 0,10 0,50

Media aritmtica ponderada


Este procediri:liento se aplica cuando los datos estn agrupados en una tabla de frecuen-
Tabla 3.2 Variable continua. Clculo de la media aritmtica ponderada
cias, dadoernmero grande de observaciones, como en los casos de tener ms de 50
datos, lo cua;l hace engorroso la aplicacin de la anterior frmula expuesta. En este caso,
algunos la1ldrnan media ponderada, El trmino ponderacin corresponde a la importan-
cia ~ peso que tiene cada valor de la variable dentro del conjunto; este es el caso de la 38,1-43 .40,5 202,5 0,10
frecuencia absoluta o la relativa, que se han tomado como ponderaciones. La frmula que 43,1-48 7 45,5 318,5 0,14 6,37
debe utilizarse es casi igual a la anterior, solo que en este caso se simplifica, en la cual 48,1-53 9 _50,5 454,5 0,18 0,09
se multiplica cada valor de la variable por su respectiva frecuencia. Recurdese que el 53,1-58 15 55,5 832,5 0,30 16,95
proceso demutiplicacin es una suma abreviada: 58,1-63 9. 544,5 10,89

. Y=L:'"' 1
- rx.;
.t.=X=--'-'
. N.
Yi-1- Yi 11;
Para el ~sarrollo de la anterior frmula, se procede de la siguiente manera:
l. Se ffi,ultiplica cada valor de la variable por su respectiva frecuencia.
2. Se sl:\inan los productos anteriormente obtenidos y el resultado se divide por el Si se comparan los anteriores resultados con los obtenidos en datos no agrupados,
nmero de observaciones, es decir, por el tamao_de la muestra (n) o el de la se observa que en la variable discreta estos debern ser iguales; en cambio, en la variable
poblacin (N). continua, por lo general difieren. Ello se debe a la prdida de informacin, primero, al
agrupar los datos en intervalos de clase, y luego, al calcular la media se han utilizado las
Cuando solo se dispone de la frecuencia relativa, tambin se puede calcular la media marcas de clase. .
aritmtica; aplicando la siguiente frmula:

1 y=:-ylt 1

~ X= 1' (jln) Suma de los productos


[1 1 Ahora se aplicarn las dos frmulas anteriores, tanto en variables discretas como en
t_~; ____ j__________:_______ las continuas; para ello, se considerar la informacin de las tablas 3.1 y 3.2.
~ . 1
-------------------- 1

[i'
1
Estadstica aplicadil Capitulo 3 Medidas de posicin o de te11tmcia central
----------------------
Tabla 3.4 Variable continua. Desviaciones respecto a la media ..

38,1-43 40,5 -11,3


43,1-48 7 45,5 -6,3 -44,1
48,1- 53 9 50,5 -1,3 -11,7
53,1-58 15 55,5 3,7 55,5
Supngase los valores 6 8 6 1O y 5 cuya media ser 7. Luego las diferencias o 58,1- 63 9
desviaciones, aplicando la frmula d1 =x1 - x, sern: 6 - 7 = - 1 1O- 7 3 y 5 - 7
=-2. Lasuma:-1 + 1-1 +3 -2= O, es decir, I.d1.=0.
En el caso de los datos agrupados, cada diferencia deber ponderarse, es decir, cada
uno de los resultados o desviaciones se multiplicar por la frecuencia absoluta, como se
observa en las tablas 3.3 y 3.4.

Tabla 3.3 Variable discreta. Desviaciones respecto a la media

-1,82
2 10 -0,82 -8,20
3 15 0,18 2,70
4 8 1,18 9,44
5 5 2,18 La aplicacin de la segunda y tercera propiedades pueden observarse en las tablas 3.6
y 3.7, cuyo procedimiento se explica mediante frmula y en forma numrica.
La informacin correspondiente a la tabla inicial3.5, de la cual se sbe que el pro-
medio o~tenido es igual a x = 51,8 (ji = 51,8), a cada uno de los valores de la variable
que se muestra en la tabla 3.5 se le ha sumado 10,5 y el resultado puede verse en la tabla
3.6, con la cual se ha calculado la nueva media aritmtica.
Obsrvese que, en el caso de. datos no agrupados, la suma de las desviaciones respecto
x =3.115/50=62,3 M(X+K) 51,8+10,5 62,3.
Como se puede observar, en la tercera propiedad los valores iniciales de la tabla 3.5
a la media aritmtica debe ser siempre igual a cero; en cambio, para datos agrupados o
se han multiplicado por dos, como constante, a cada uno de los valores de la variable, tal
presentados en tablas de frecuencias, deber estar multiplicada cada desviacin por su
como se puede ver en la tabla 3.7, y se ha calculado nuevamente la media aritmtica.
respectiva frecuencia, para que la sumatoria sea siempre igual a cero.
x=s;~O =103,6 <=> M X)= 51,8 (2) =103,6
(K

Se observa que mediante la aplicacin de los dos procedimientos, se obtienen los


mismos resultados.

1

i.1
1
---------------------- ........... . --------------------------~----~
l
1
Estadstica aplicada Captulo 3 Medidas de posicin o de te11dencia ce11tral
----------------------------------------------~--------------~

Tabla 3.5 Da:tosjniciales Tabla 3.6 Propiedad de la suma Tabla 3.8 Primera submuestra Tabla 3.9 Segunda submuestra
-~' 'j "
-~--:L
"',-; ~
35i5~ 3 46 3 138 :~}
40;~.
'J)

5 51 5 255 .

45_i?.: 7 56 7 392 5:
- --
5o;f 9 61 9 549 -,'f,'.
55.,5 15 66 15 990
60,?. 9 71 9 639
76 2 152

Resumen de las propiedades d(! la media


Es de gran importancia conocer y manejar las propiedades que presenta este promedio,
a fin de simplificar y agilizar procedimientos de clculo o para entender, ms adelante,
algunos procesos estadsticos.
Tabla 3.7 Propiedad del producto e Primera propiedad: la suma de las desviaciones respecto a la media siempre debe
ser igual a cero...
En datos no ;agrupados ser :E(x1 -.X) =O y en datos agrupados ser
71 3 213 :E(x; - x)J; =.o.
81 5 405 e Segunda propiedad: la media aritmtica de una constante es igual a la constante.
91 7 637 Por ejemplo, si ~n u~ curso todos los estudiantes obtienen la misma nota, es
.~-
101 9 909 decir, el valor es. constante, p()r tanto, el promedio ser igual a ese valor.
!'
111 15 L665 :Ek nk
MK=--=-=k
121 9 1.089 n n
131 2 262 0 Tercera propiedad: la media aritmtica de una constante por una variable ser
igual al producto-de la constante por la media aritmtica de la variable.
M - :Ekx;
[ktJ -:. n -
-k[:Ex;] -
n -
ki M - :Eky;n; -
[Ky] - n -
kY .

e Cuarta propiedad: la media de una vari;tble ms una constante es igual a la ~urna


Es dedr; cada media debe estar multiplicada por el nmero de elementos conte- de la media m~ la constante.
nidos, y hii:go la suma de estos productos deber dividirse por el total de elementos M<xkl=M<XJ +Muo= .X+ k
contenidos ~n esas muestras. Esta propiedad es vlida para la diferencia.
Se divide la distribucin con la cual ha venido trabajndose en dos submuestras: la
o Qytinta propiedad:- la media de la suma de dos o ms muestras es igual a la media
primera de:~llas con 15 elementos y la segunda con 35. Luego se calcula la media para
de estas II).edias ponderadas.
cada una de las submuestras.

Es decir, las medias deben estar multiplicadas por su respectivo nmero de elemen-
:..~l para e1total sera.' x--
La medi - 41,83(15)+56,071(35)-
. .. .. .. - 2.590-55
. . - ,8
tos, y la suma de estosproductos se dividir por el total de los mismos.
. ' 50 50 .

Estadsllca aplicada Captulo 3 Medidas de posicin o de tet1de11cia ce11tml

Aqu se puede calcular la mediana aplicando la frmula, para determinar nicamen-


te la posicin en donde se encuentra el valor correspondiente.
Es aquel vawr de la variable que divide la frecuencia total en das partes iguales, es decir, (n + 1)/2 =(5 + 1) /2 =3
aquel valor de la variable, que supera y a la vez es superado por ms de la mitad de las obser-
vaciones, en un conjunt ordenado. La mediana, en otras palabras, es el valor central. Lo anterior indica que la mediana se localiza en la tercera observacin de la variable,
Se le considera una medida de tendencia central, ya que se localiza en el centro de la cuyos datos deben estar ordenados, y ese tercer valor lo ocupa el valor de 6.
distribucin, superando a la mitad y siendo superada por la otra mitad de las observa-
ciones. Este promedio es menos importante que la media aritmtica y su clculo es un
poco ms complicado, ya que en cada situacin en particular debe aplicarse una deter- Nmero par de observaciones
minada frmula, tan rgida que no admite tratamiento algebraico alguno, pero a la vez Si se dispone de un conjunto par de datos, se toma convencionalmente la mediana,
presenta la ventaja de no afectarse por cambios que se le hagan en cada valor que toma a la media aritmtica de las dos observaciones centrales. Si estos dos valores observados
. variable, siempre y cuando se mantenga su ordenamiento, adems, no se afecta en su son iguales se tomar uno de ellos .
resultado, aun cuando existan valores demasiados grandes en su extremo superior.
Para la determinacin de la mediana no se requiere conocer el valor de todos los Con los datos 6 8 5 y 1O lodcese la mediana.
datos; solo es preciso saber cul es la observacin central y que los valores restantes, la
mitad de ellos, sean menores y la otra mitad mayores que este. Tambin se puede apli- Se ordenan los datos, por ejemplo, de mayor a menor: 10 8 6; 5o de menor ama-
car en datos incompletos; por ejemplo, en aquellas distribuciones cuya variable tenga yor: 5 6 8 10. La mediana en este caso ser el promedio entre la tercera y la cuarta
valores extremos que no estn definidos. Generalmente, estos intervalos se encuentran observacin obtenida de la siguiente manera: (6 + 1) + 2 =3,5; es decir, el valor de
identificados con las expresiones "menos de" o "ms de". la mediana se localiza entre la tercera y la cuarta observacin, siendo los valores de
6 8
Datos no agrupados =
la variable 6 y 8. Ahora se promedian + 7 . Este resultado corresponder al
valor de la mediana: ::::} Me= 7. 2
Para el clculo de la mediana, cuando los datos no estn agrupados en una tabla de fre-
cue~cias, debe tenerse en cuenta si el nmero de observaciones es impar o par. En cada
caso se siguen estos pasos:
l. Se ordenan los datos de menor a mayor o de mayor a menor. Datos agrupados
2. Se determina el valor central, ya sea mediante la observacin directa de los datos Cuando se trabaja con tablas de frecuencias, se debe establecer si la variable es discreta
o a travs de la aplicacin de la frmula (n + 1)/2. El resultado seala el nmero o continua; luego, se mira si al dividir por dos el total de las observaciones, el valor ob-
o la proporcin de la observacin en el cual se localiza la mediana. A continua- tenido se encuentra o no en la columna de las frecuencias absoh,tas acumuladas; como
cin se procede en ~ada uno de los casos que se pueden presentar. consecuencia, se presentan dos situaciones al calcular la mediana, En cada caso, deber
aplicarse una frmula diferente, tanto para la variable discreta como la continua, para lo
Nmero impar de observaciones cual es necesario tener en cuenta las siguientes recomendaciones:
Si solo se dispone de un nmero impar de datos, la mediana se localizar en el centro.
e Se obtienen las frecuencias absolutas acumuladas, sumando las sucesivas frecuen-
cias, ya sea de arriba abajo o en sentido contrario, sin que este procedimiento .
Considrese nuevamente los datos 6 8 6 10 y 5 y localcese la mediana. afecte el resultado.
o Se divide por dos el total de observaciones : ni 2.
o El resultado anterior se busca en la columna de las frecuencias absolutas acu-
Primero se ordenan de menor a mayor o de mayor a menor, de la siguiente manera: muladas. Al respecto, recurdese que se presentan dos situaciones: la primera,
5 6 6 8 10. Obsrvese que uno de los valores, el6, ocupa el centro; por tanto, a ese cuando el valor puede observarse, es decir, aparece en esa columna, el cual se
valor le corresponde ser la mediana. Me =6. simboliza por N1_1 y al inmediatamente superior por N1; por lo cual se dice que
=
Ahora se dispone de dos resultados: :X 7 y Me =6. Qu sucede si el ltimo valor N1_1 =n 12. La segunda situacin se da cuando el valor de la operacin n 12 no
1 de la variable en vez de 1Oes 100? La mediana sigue siendo 6; en cambio, la media se observa o no aparece en esa columna; en este caso N_1 corresponder al valor 1
, 1 se altera, pasando a ser 25 para el mismo conjunto de datos, debido a lo sensible que inmediatamente anterior a n/2 y N al inmediatamente superior en valor y se
1
11.
lv---
.~
J
------------ -
es la media, a cualquier cambio que se haga en su variable.

----- 1
Esladslica aplicada Capilulo 3 l'rledidiiS de posici11 o de tendettcia ce~ttrnl

Tabla 3.11 Variable discreta. Clculo de la


dir que N1_1< n /2. Adems, la frmula que deber aplicarse ser diferente al mediana
tipo de variable, ya sea discreta o continua.

Variable discreta
Se procede a calcular la mediana, de acuerdo con las dos situaciones descritas anterior-
mente.
En la tabla 3.10 aparece en la columna de las frecuencias absolutas acumuladas,
el valor obtenido al calcul:rr n /2 =25; por tanto, se dir que N1_1 = n/2. En este
caso, la frmula que deber emplearse, siendo xH =2 y x1 =3 adems NH = 25 y
N1 =35
u X _1 +X 2+3
M = Yj-1 +yj
JYle = -1- - ==? Me=--=2,5 e 2
2 2

Tabla 3.1 O Variable discreta. Clculo de la


mediana

Tabla 3.12 Variable continua. Clculo de la


mediana

En, la tabla 3.11 se observa que en la columna de las frecuencias absolutas acumula-
das no aparece el valor 25, por tal razn se considera como N_ 1 a 20, es decir, el valor
inmediatamente anterior a 25, y como N, al inmediatamente superior. En este caso se
tendr que N_1 < n /2, y la frmula por emplear ser Obsrvese que el valor x_1 se ha localizado al frente de N, ya que 53 estar locali-
zada en el centro de la distribucin, en cuanto se refiere al nmero de observaciones.
Si hay duda en lo realizado anteriormente, se observa que al sumar 3 t 5 t 7 t 10 =25
Y15 + 9 + 1 =25, con lo cual queda demostrado que el punto medio estar localizado
Variable continua entre los valores 10 y 15, que corresponde al valor de la variable de 53.
En la tabla 3.12 se trata de localizar el valor de n/2 =25, en la columna de las frecuencias
~b~olutas acumuladas. Como se observa este valoraparec en la tabla, siendo N_1 =n/2.
La frmula que debe aplicarse ser Me= x_1 = 53 jM. =y_1j.

!
, ,_
; 1.
_J_______________________
1
___________________L_ 1

Estadstica aplicadt~ Caplulo 3 Medidas de posicin o de te11de~Jcia ce11tml

Tabla 3.13 Variable continua. Clculo de la Cuando ningn valor de la variable se repite ms de una vez, puede afirmarse que
mediana no hay moda; por ejemplo: 8 3 7 5 y 1O. Si un valor de la variable se repite ms veces
que los dems, se considerar como unimoda4 si hay ms de dos modas, se presentar
una distribucin plurimodal.

Datos agrupados
As como se calcul la moda, en datos no agrupados, en una forma sencilla e inmediata,
casi por simple observacin y sin frmula alguna, se procede de igual manera en datos
agrupados, tanto para la variable discreta como para la continua. En este ltimo caso,
deber calcularse utilizando las marcas de clase, y solo cuando la amplitud del intervalo
sea constante; en el caso que no le sea, es preferible aplicar otra medida diferente que
no sea la moda.
En las tablas 3.14 y 3.15 se han calculado las modas en cada una de las dos distribucio-
nes, siendo Ma =Y1 =3 en la variable dis~reta y M1 =y1=55,5 en la variable continua.
Para ello se han utilizado los datos correspondientes al ltimo de los ejercicios, trabajando
En la tabla 3.13, en este caso, el valor 25 no se encuentra en la columna de las fre- con la columna correspondiente a las marcas de clase.
cuencias absolutas acumuladas, por tanto, se dir que N1_1 < n /2. As que N_1 = 24 y N
=40. Para su clculo se aplicar la siguiente frmula: Tabla 3.14 Variable discreta. Tabla 3.15 Variable continua.
Calculo de la moda Clculo de la moda

Me = x:1-l +e
(n 12) - N1_1 ] ,
o
M. = Yj_ +c[--'-(n_12)_-_N;e...:..j-!]
[ ll ll

M,=53+5[ -25 -
15
-24] [
=53+5 1 ] =53+0,33=53,33
15

Nota: N es el smbolo que se ha utilizado para indicar la columna de las frecuencias ab-
solutas acumuladas, por ser el ms fcil de manejar.

Moda (M)
. . a~-=,="'-""""'"""'=-=<- .
= ... .
Es una medida de posicin que sacrifica una mayor cantidad de informacin que la
mediana; su resultado es ms general y en algunos casos poco til. Est definida como No vale la pena mencionar y realizar el proceso de clculo, para las cuatro frm~~
aquel valor de la variable que mds se repite, es decir, se deber localizar en algn valor de o procedimientos para la obtencin de la moda, y que solo se pueden utilizar cuando la
la variable, de acuerdo con la mxima frecuencia que ella presenta en la distribucin. amplitud de los intervalos es constante.
Se simboliza por Ma siendo igual a X1 ::::} Ma= X1 o JMa = y1J.

Datos no agrupados Beladpn entre_ an~~m,ed_an"'~"'""J!L,=O~Lca't===


Hagamos algunas comparaciones en cuanto a la aplicacin de estas medidas que se han
Se aplicar la moda en los datos siguientes: 6 8 6 1O 5. Obsrvese que el6 es ei valor
considerado como las ms importantes y de mayor utilidad.
de las variable que ms se repite; por tanto, M d =x1 =6.
o La media aritmtica es la ms conocida y aplicada. Muchas personas desconocen
Considrese otro conjunto d~ 6 observaciones, cuyos valores son 6 8 6 10 5 y 10.

'. ------~!-
la existencia de otras medidas o si las conocen tiene dificultades no solo en su 1
-- -----------H--a--y-dos valores en la variable con igual nmero de repeticiones: 6 y 10. En este caso clculo sino en su verdadera aplicacin. . i
__ _ ____ _ hay ~os modas, y se dice que la distribucin es bimodal
.... -----------------------------t--
,,
&
1
Esladisllca aplicada Captulo 3 Medidas de posicin o de tmdellda cCIItral

o En una dis.tribucin simtrica, adems de ser unmodal, la media, la mediana y En la tabla 4.16 se muestra un ejemplo de distribucin simtrica, cuya media, moda
la moda so~ iguales. En este caso, se prefiere el uso de la media. y mediana sern iguales.
o Los tres p~medios dependen de la forma que toma la distribucin. Si es sim-
trica o ligeJ;llllente asimtrica, debe utilizarse la media; cuando eso no ocurre, la Tabla 3.16 Distribucin simtrica
mediana .es la ms indicada.
e Si una distribucin tiene ms de un valor mximo, es decir, dos o ms valores
alcanzan la:inayor frecuencia, la sola aplicacin de la media o la mediana puede o 2 0,03
ocultar propiedadeS que podran ser interesantes para el estudio que se realiza. 2 8 0,11
o La media t<:ne puede calcular en distribuciones que presenten los intervalos ex- 4 15 0,22
tremos abi~rtos o no definidos; por tanto, la mediana y la moda son las medidas 6 20 0,28
ms indiclas. 8 15 0,22
o Dos medi~1ltl! o dos modas no pueden promediarse para obtener el valor prome- 10 8 0,11
dio de do.s .muestras combinadas, pero esta operacion s se puede realizar con la
media aritmtica.
G En una distribucin de frecuencias, cuando la amplitud del intervalo no es cons-
tante, no {e aconseja la aplicacin de la moda, y se prefiere el uso de la media o
mediana:. ~
e La medta.es.el promedio ms estable o ms confiable, ya que presenta menos La moda es la nica medida de posicin que puede utilizarse, tanto en aquellas
fluctuacin entre el resultado obtenido a travs de una muestra, comparada con caractersticas cuantitativas (variables) como en las cualitativas (atributos). Es un error
el de otr~:medida:s aplicadas a la misma poblacin, por tanto, proporciona una grave aplicar frecuentemente en forma equivocada la media, o en todos aquellos cuadros
mejor estimacin del parmetro. o tablas donde solo se hace referencia a caractersticas cualitativas, como se muestra en
o Las relaciones entre estas medidas se describe de la siguiente manera: las tablas 3.17 y 3.18.
El clculo de los porcentajes se realiz dividiendo cada valor de la frecuencia por el
x =M~= J:f cuando hay simetrla.
x > M~:~ M cuando es asimtrica positiva. total de estudiantes: ~
200
=O,20 =20% _!!
20
100 =9% y as suc~ivamente Esto se
.
x < M.< M cuando es asimtrica negativa. debe a que cada estudiante puede practicar ms de un deporte.
Los dlculos.6la aplicacin de frmulas utilizados para determinar el grado de sime-
trla o asimetfla,~sC! desarrollarn en el siguiente captulo. Tabla 3.17 Depones practicados Tabla 3.18 Estado civil
o La md 'aritmtica es sensible a cualquier cambio que se haga en los valores que
toma la variable, y en especial cuando uno de ellos es exageradam~nte grande. La.
mediana. y la moda no se afectan mientras el cambio no se realice en su propio Ajedrez 40 20,0 Soltero 82 41,0
valor, pero conservando el orden ascendente o descendente de los valores que Atletismo 18 9,0 Casado 48 24,0
toma la y~iable. Baloncesto 72 36,0 Viudo 20 10,0
o En grari parte de las distribuciones, se considera qu~ la distancia entre la media Bisbol 20 10,0 Separado 12 6,0
y la moda, es tres veces la distancia entre la media y la mediana. Esta relacin fue Balompi 58 29,0 Unin libre 26
establecida por K. Pearson y sirve para calcular una de ellas en funcin de las Ciclismo 16 8,0 Divorciado 12
otras dos; Natacin 40 20,0
Patinaje 26 13,0
Tenis 14 7,0
e Una distribucin es simtrica. cuando las frecuencias absolutas y relativas, equi- Otros 6 3,0
distantes a un valor central, son iguales; en caso contrario, la di~tribucin es
asimtrica: En una distribucin simtrica, la mediana, media y mo~a tendrn el El total de estudiantes entrevistados es de 200 y los resultados obtenidos se conden-

.; .:_,---l-~------------
1
1 san en las tablas 3.17 y 3.18. En el primer caso, la moda corresponder al estado civil
mismo valor, el cual se localizar en el centro de la variable.
-'-----------------
1
Estadistica aplicada Capitulo 3 Medidas de posiri11 o de tmde11ria cmtl'al

Soltero, la caracterstica que ms se repite y en el segundo caso, la moda podra ser la En el2001, la poblacin de una regin fue 6 millones y en 2011 alcanz a 8,6 mi-
caracterstica Balompi. En ambos casos se observa el mayor porcentaje de ocurrencia, llones. Cul fue la poblacin media en este periodo.
en esas caractersticas.

M0 = ~6(8,6) = .J5f:6
=7,18 millones de habitantes es el promedio de pobla-
cin para el periodo 2001 - 2011.

La media geomtrica de n cantidades positivas es la raz positiva ensima del producto de


esas cantidades. Se simboliza por M g, M 0 , G y se aplica en todos aquellos casos en los
que la variable muestra un crecimiento geomtrico, como en la poblacin de un pas o Datos agrupados
regin, el de un capital colocado a una tasa de inters compuesto, es decir, con tendencia Las dos frmulas de clculo anteriores se modifican un poco, pues deben estar pondera-
exponencial. A continuacin se explican las frmulas que deben aplicarse en este caso y das, es decir, la variable debe multiplicarse por las respectivas frecuencias absolutas.
cul es el procedlrniento que debe seguirse para su clculo.
~ ,.----;: L' 1og x. Ln1 1ogy1
Datos no agrupados M o = 'i/'ltX"' ~ 1ogMo = ff 1 , 1og Mo=
n n
De acuerdo con la definicin, la frmula por aplicar, si se dan los datos 6 8 6 1Oy 5
sin agrupar, ser:
Por cornodldad se utilizar esta ltima frmula, es decir, se trabajar con logaritmos
nC ,/
Mo = iJ71:X = -vX.Xz .x3 .. .x, ~
M Y.
g =1CX n {::}
1 M Llogx;
og o =--- tanto para la variable dlscreta corno para la continua. Los procedlrriientos de clculo
n respectivos se muestra en la tabla 3.19.
La letra griega TI (pi) se lee corno "multiplicacin de', es decir, corresponde al pro-
ducto de los elementos o valores que tome la variable. La anterior frmula presenta varios
inconvenientes en su clculo. Algunos de ellos son: Tabla 3.19 Variable continua. Clculo de la rnedla geomtrica
o Si un valor de la variable es O, el producto obtenido ser igualmente cero.
o Ninguna observacin puede ser negativa, y en el caso de que as sea, su producto
dara una raz imaginaria. 33,1-38 3 35,5 1,550228 4,65069
Corno solucin a las dos anteriores situaciones, es preferible trabajar con logaritmos.
M Ln1 logy1
1og o= .
38,1-43 5 40,5 1,607455 8,03728 n
Al aplicar estas dos frmulas a los datos originales, el resultado debe ser exactamente
igual. . . 43,1-48 7 45,5 1,658011 11,60608 LJ; logx
logM0
En el primer caso: M0 = !\/6.8.6.10.5 = V14.400 = 6,7879::6,79 n
48,1-53 9 50,5 1,703291 15,32962
85,77864
En el segundo, se procede as: logM0 = 1,715571
53,1-58 15 55,5 1,744293 26,16439 50
logMo log6+log8+1og6+1og10+1og5 = 0 ,831672 . 16,03580 Mo = antilog1,715571
58,1-63 60,5 1,781755
5 M0 =51,95
Ahora se procede a obtener el antilogaritrno de 63,1-68 2 65,5 1,816241 3,63248

log M0 =anti log 0,831672 =6,79

M0 6,79

Ya se mencion que la aplicacin de este prornedlo se utiliza frecqenternente en


algunos datos o series que se presentan a travs del tiempo y se agrupan en un orden
cronolgico, corno la poblacin de una regin que presenta un crecimiento geomtrico Para el desarrollo de estos ejercicios, es preferible el uso de la calculadora CASIO o de
cualquiera otra marca que tenga funciones estadsticas. Corno el proceso de iniciacin
1 y, algunas veces; se desea determinar la poblacin prornedlo entre dos periodos.

_.;..
1
,.
~
" - - - - - - - - - - - - .. - - -
1
------------------


Esladslica aplicadt~ Caplulo 3 Medidas de posicir1 o de tlmdeuca ce11tral

o preparacin de la calculadora es igual en todos los casos, se explica desde la entrada El valor que se obtiene con la aplicacin de esta medida ser menor que el obtenido
de informacin. con la media geomtrica, que a su vez ser menor que la media aritmtica.
MA <M.< X
Su importancia es menor que el de todas las medidas anteriores, as que su aplicacin
es limitada, y solo se emplea en aquellos casos en que la variable est expresada en forma
de tasas, cuando la variable tiene un comportamiento armnico, o en aquellos proble-
mas en los que se desea calcular la velocidad media.
Sus frmulas y aplicacin, las haremos con la misma informacin que ha venido
utilizndose con las medidas anteriores.

Datos sin agrupar

Obtenga la media arm~ica respecto ; los siguientes datos: 6 8 6 io 5.

En aquellos problemas de clculo de velocidad media, se puede plantear as:

Cuando los dos-espacios recorridos son iguales S1 =S2

La primer~ frmula que se present para ser empleada, 'en datos agrupados o sin Una persona recorre en su auto la distancia entre A y B a una velocidad media de
agrupar 120 kilmetros por hora y el regreso lo hace a una velocidad media de 70 kilmetros
por hora. Cul es el promedio de velocidad para el total del recorrido?
=> Mo =" r:r:;
!iJiw'

no puede utilizarse cuando ocurre algunas de las siguientes situaciones:


2 2
e SI un. valor de la variable es O(cero), el producto es cero. Vm=---- - - - =88,42k.ph
o Si un valor de la variable es negativo, dara una raz imaginaria. 1/120 +1/70 0,022619
o En algunas calculadoras, la operacin no es posible, si el valor de n es muy grande. ~

lliwdiittrnQ..BJi~Mt..MA-21\itL=~..=~-==,.~-= Cuando los dos espacios recorridos son diferentes S1 :t:- S2


El recproco de la media armnica es igual a la media del recproco de los valores que toma

L
Se aplica la frmula dada para calcular la velocidad media, ahora con una ligera modi- 1

la variable. Se simboliza indistintamente mediante M H , M A o M _1 ficacin al problema anterior. !


t- -----------
''
------------------t--
' 1'1
1
!l':
Estadistica aplicadtt Captulo 3 Medidas de posieitz o de tmdencia ce1ltl'lll_

Considere que el automovilista recorre la distancia de 60 km que hay entre A y B, a por edades, estaturas, pesos, ingresos o salarios; o empresas organizadas por volumen de
una velocidad de 120 kmph, y luego los 200 km que hay entre By C, a una veloci- ventas, de empleados, horas trabajadas, etctera. Una condicin importante que se exige
dad de 80 kmph. Cul es la velocidad promedio para el total del recorrido? su aplicacin es su ordenamiento de los datos de menor a mayor o viceversa; por otra parte,
se opera en forma muy parecida a la mediana, por tal razn, los resultados del segundo
cuartil, quinto decil y percentil50 deben ser exactamente iguales a los de la mediana.

Datos sin agrupar

Suponga que se tienen los siguientes datos:


Al aplicar la formula anterior, la respuesta es 86,67 kmph.
8 12 24 30 10 12 16 18 20 18 16 28 4 16 22
S= espacio total S = espacio parcial v; =velocidad por espacio Calcule el primero y tercer cuartil; el sptimo decil y finalmente el percentil 32 y
el72.

Lo primero que se hace con la informacin anterior es ordenar los datos de menor
Datos agrupados a mayor
Tabla 3.20 Variable discreta. Clculo Tabla 3.21 4 8 10 12 12 16 16 16 18 18 20 22 24 28 30
de la media armnica
Se procede a determinar la posicin donde se encuentra el primer decill(n +%,
lo
cual ser igual a 16/4 = 4, quiere decir que debe ubicarse en la posicin cuarta, en
este caso es Q1 =12. Para el tercer cuartil, se tendr 3(n + 1) 14, siendo igual a 48 1
o 3 o 4 = 12, correspondiendo a sta posicin. En este caso ser: Q3 = 22.
7 7 40,5 Para el sptimo decil ser:
2 10 5 45,5 7
7(15 + 1) 1 10 11,20. Obsrvese que hay decimales, por tanto, el procedimiento
3 15 5 50,5 9 vara un poco, dado que el resultado deber estar entre la observacin 11 y 12.
4 8 2 55,5 15 En este ejercicio, primero se determina el valor en la primera posicin, que es 20;
5 5 9
luego se establece la diferencia que hay respecto al siguiente valor y el resultado se
6 2
multiplica por el decimal 0,20.
El procedimiento numricamente es: (22 20)0,20 =0,40
Yse le suma a 20; el resultado es D1 =20,40.
Finalmente, en el clculo de P3z, se proceder as: 32(15 + 1) 1100 =5,12; el primer
valor ser 12 y se le agrega (16- 12) =4, el cual se multiplica por 0,12, y es igual a
n
n 0,68. El siguiente clculo para el valor de P32 =5.68. Se realiza el mismo procedi-
M=--
1 =_____,~--='
M
- r[xJ H r[~]
miento para hallar el valor de P78 = 21, 14, que lector con lo observado hasta ahora
podr comprobar.

MA := 5%,98959 := 50,33
Examinando lo realizado, el procedimiento, al trabajar con datos sin agrupar, es
exactamente igual al utilizado en el clculo de la mediana, para establecer la posicin

~til~ dedl~i,Y=~~~n!iJes
donde esta se deba encontrar. Recurdese que n + 1/2, que se moclifica de acuerdo con
======== lo solicitado; por ejemplo, en el cuartil n~ se divide entre dos, sino entre 4; en el decil
Tambin se les consideran como medidas de posicin, utilizadas con mucha frecuencia se divide entre 10, y en el percentil por 100. El otro cambio se opera en el numerador:
en aquellas poblaciones que pueden ser divididas en grupos o estratos, cada una de ellas si es el tercer cuartil, se multiplica por 3; si es el sexto decil, por 6 y si es el40 percentil 1
con una condicin especial; por ejemplo, una poblacin de personas clasificadas ya sea por 40, y as sucesivamente. i
i
--- ---------------r----
1

1
- .. Eladlsllca apliciukr -------------------------:
Caplulo 3 Medidas de posicin o de te11det1cia celltml
-
Tabla 3.23 Variable discreta
Datos agrupados
Nuevamente, como en los anteriores ejercicios, el proceso es bastante parecido al utiliza-
do en el clculo de la mediana, es decir, se procede a determinar las frecuencias absolutas
acumulada~;Jtiego se determina la posicin, casi igual a la mediana. Por ejemplo, el ter-
.cer decil3n/1, obteniendo dos situaciones, cuando el resultado aparece en la columna
y cuando no aparece.

Variable discreta
Se procede a calcular los cuartiles, deciles y percentiles Q1 , Q3 , D4 , P4z y Pa3 utilizan-
do las tablas :3,22 y 3.23 que son las mismas que aplicamos en el clculo de la mediana,
dado que el procedimiento es casi igual o con una ligera diferencia en sus frmulas.

Tabla 3.22 Variable discreta

En P83,la posicin donde est ubicado es 83n/100 = 4,150/100 41.5; por tanto,
Ni-l = 35 y N1 = 43; as que el percentil83 ser igual S.
Todos los clculos anteriores coincidieron en el proceso, pues se realizaron con la
aplicacin de una sola frmula. Ahora supngase que los valores correspondientes a la
columna de las frecuencias absolutas acumuladas fueran 3 10 25 30 43 y 48; si el
valor de N-1 hubiera coin~idido con algn valor, la frmula. que se debera utilizar sera
x.+~ . al
_,__- - . Por ejemplo, si N-1 = 25, el v or para alguna de las medidas a las que se
2 .
ha hecho referencia, sera (2 + 3)/ 2, como pudo suceder con el clcuio de la mediana
2 o Ds o Pso En caso contrario, cuando no aparece, el valor se localizar en X'
al frente de N.

Variable' continua
Para ~[ . desarrollo, se procede de la siguiente manera: Ahora, con la variable continua se harn los mismos clculos, utilizando nicamente
l. Al iguhl que en la mediana, se acumulan las frecuencias absolutas. la tabla 3.24 y, el lector har lo mismo con la tabla 3.25.
2. Luego se calcula la posicin en donde debe localizar a Ni-l y N1 Obsrvese:
Para Q1 , se establece su posicin 1(nl4) = 50/4 12,5; en este caso N1_1= 8 y N1 =
o )?araQl' la posicin ser n/4 = 50/4 = 12,5; en este caso N1_1= 10 y
15. El primer cuartil ser igual a Q1 = 43 + 5 e ~- ) = 4,86.
2 8
N=25y Ql =X =2 (1).
o Para Q3 , la posicin ser 3n/4 = 150/4 = 37,5; siendo N1_1= 35 Y Para Q3 , su posicin estar en 3(n/4)= 150/4 = 27,5; por tanto, NH = 25 y N 1 =
N=43y 3 =X =4 (1).
o . Para D4 , la posicin ser 4n/10 = 200/10 = 20; siendo N1_1= 10 y
40, y el tercer cuartil ser igual a Q3 = 53 +5(
27
~; 25 ) = 53,83.
N;= 25; el valor para D4 =x1 =2 2. Para calcular D4 , la posicin es 4n/10 = 20, el valor de NH = 15 y N1 = 25; as, el
20-15)
o Para P42 la posicin ser 42n/100 = 00/100 = 21; siendo N 1_1= 10 y resultado ser D4 = 48+ 5 ( lO = 50,5.
N1 = 25; el valor que corresponde a P42 = 2 .Finalmente, ef;ruor del ultimo
percentil, al igual que los anteriores, se calcularon utilizando la tabla 3.22 y el i
lector podr practicarlo utilizando la tabla 3.23. 1
1
' . 1
! - -l - ........................ .. .. --------------...........-----j----
1
\ 1
i
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _c_a.:_p_tu_lo_3_:M.::::e:.::d::::id.:.::m:..::d.::::epco:.::si.::.:ci:.:::..:o:..::d.::__:tl!l:.::'d.::m::et_:'a~ce~'':tl'_:'lll:_
Estadstica aplicada
1------=---------------------------------...:
Ta_bla 3.24 Variable continua

38,1-43 8 Media armnica


Amplitud del intervalo
43,1-48 7 15 o Centro recorrido Media geomtrica
48,1-53 10 25 . Mediana
Cuartiles
53,1-58 15 40 Moda
o Datos agrupados
9 49 Modo
Datos sin agrupar
o Deciles Percentiles
Frecuencias Promedios
Intervalos o Valor modal

Marcas de clase o Variable continua

o Media aritmtica o Variable discreta


Tabla 3.25 Variable continua i
~~~'J>.v,>ltl"'l.'=".m=,..~, .,...ov:.,\'l"-'l:"--.;'<>f::-l'fl::-<ttcl~l..,...;=...,~r,'O)'Iy.>~~/'4'l't"m"'""''~':'l"~~.,fll'""'~rm-_.,,..,--...,..._..,~~i'W'~'<.!:~.r~ 1 r,~~,..~.....-,...l';nu""""""'!"',......_1'~'<'....._-..,~,'l'!'!'>~> l

38,1-43 8
43,1-48 7 15
48,1-53 9 24
53,1-58 15
9

Al calcular P83 , tendr como posicin 83(n/100) = 41,5; as que Ni-1 = 40 y


41 5 40
N = 49. Se aplica la frmula; P83 = 58 + 5( - ) = 58,83.
9
Como ya se anot, todos los anteriores ejemplos requirieron la aplicacin de la mis-
ma frmula, debido a que el valor correspondiente no se visualizaba en la columna de
las frecuencias absolutas acumuladas, pero, en el caso en que aparezca, como al calcular
la mediana ( Q2 , D5 y P50 ) se tendr abora, en todos los casos, que N.. =25 y N =
40; por tanto, X =53.

Como su nombre lo indica, corresponde al promedio de la suma de los valores extremos


que toma la variable, tanto en datos sin agrupar como en los agrupados. 1

e= Xmx+xmI e =y"'+y
1 r 2 r 2
lt l
!(; --------T--------------------------- --L 1

i !
yl - - - -. : - - - - - - - - .
Esladslica aplicadt,
~-
."

. . Sup6~ga que en un estudio sobre retardos ~~lallegadaai tr~Qajo; ' ,


duninte el semestre, se encontr que la media aritmtica fue f6vckes: Si~ 1. Se tienen 12 vendedores en una compaa. Cada uno vendi en un da las siguientes
po~ ~ualquier razn, el jefe de control le dio por aplicarlam~diar!aY l cantidades de cierto producto: 29 48 18 20 20 25 29 14 33 25 16 y 12.
rri~da, con los resultados 22 y 36, respectivamente, se podr ac~ptrlos
de:acueido en los promedios o resultados obtenidos? ~-. , , . a. Calcule la media, mediana, moda, el cuartil tres y el decil seis.
b. De los tres (3) primeros promedios solicitados, cul representa mejor la
2. Cci~sidere que lonesultados de la aplicacin de tres medidas, rn~~ia, . ... informacin? Por qu?
media geomtrica y media armnica, son 16, 22 y 12. Estos':cktos ~on ..
~opslstentes con la teora sobre el comportamiento qu deb~n terer? , . 2. Justifique las respuestas a cada uno de las siguientes afirmaciones:
3. Eii rtn ejercicio; se obtuvo la siguiente distribucin de frecu:~C:ias: ..: a. La moda se utiliza para promediar caractersticas cualitativas.
b. En una serie de datos cuando n es par, la mediana es ig!lllllll vr central.
c. Si se desea promediar la preferencia de los estudiantes por un determinado
deporte, se puede utilizar la media aritmtica.
.~alice los clculos y obtenga la media, mediana y hi :loda.. d. En una distribucin simtrica puede darse que x=16 M.= 16 y M= 20 .
e. En una distribuCin de intervalos abiertos en sus extremos, se puede utilizar la
4. Cn l"os siguientes datos de una distribucin cualquiera, ca!~ttii: \~ media aritmtica.
rr{~di~, mediana, moda, media geomtrica, media armnica; el
._... dicil6 y el percentil48. Los datos son:8, 12, 43,12, 6, 15 , 3. Calcule la media, mediana, la moda, el sptimo decil y el percentil 62, con los si-
. .. ''16,10. ' . " '. '._, ,'
guientes datos:

4. Complete.
a. La se determina ordenando los datos de menor a mayor,
seleccionando el valor central.
b. Como se define una distribucin de frecuencias, si la media, mediana y moda
son iguales,________
c. La no es representativa si un valor de la variable es demasiado
grande con relacin a los dems.
d. Se debe utilizar la cuando se quiere dar importancia
a valores pequeos de la variable o cuando los datos muestran un
comportamiento geomtrico.
e. La no se puede calcular, si la distribucin es de
intervalos abiertos o no definidos.
f. Las frmulas para calcular la admiten tratamiento algebraico.

1
>--------+ _____,________ ,
;:
5. Explique brevemente las ventajas y desventajas que se observan en la aplicacin de c. modo.
cada una de las medidas de posicin y de tendencia central. d. media armnica.
e. ninguno.
6. En una empresa trabajan 300 empleados que ganan en promedio $986.200 men-
suales. Qu ocurre con este promedio del salario mensual, 11. Un ascensor tiene capacidad para soportar un peso mximo de 700 kilos. Al utilizar-
se por 6 nios que pesan en promedio 22 !dios y 8 adultos que pesan en promedio
a. si se aumenta los salarios a cada uno de los empleados en $60.000?
72 !dios, est sobrecargado el ascensor?
b. si se aumenta los salarios a cada uno de los empleados en un 6,8%?
c. si se aumenta los salarios a cada uno de los empleados en un 4,2% ms 12. Cinco profesores trabajan en diferentes universidades por horas, con un valor de:
$25.000? $25.200 $20.000 $16.500 $30.000 y $35.000.
7. Complete. a. Obtenga el salario promedio por hora para los cinco profesores.
a. El _ _ _ _ cuartil supera al 75% de las observaciones. b. Si cada una trabaja 1O 12 8 6 y 20 horas a la semana, calcule sus sueldos
b. El resultado del decil es igual a la mediana. totales a la semana.
C. El percentil supera al 30% de las observaciones. c. Calcule el salario promedio por hora considerando el nmero de horas de
trabajo semanal.
d. El cuartil es superado por el25o/o de las observaciones.
e. El decil es superado por el20o/o de las observaciones.
d. Qu conclusin se obtiene con las respuestas (a) y (e)?
f. El percentil que supere al 82% de las observaciones. 13. Si las acciones de una compaa han mostrado aumentos porcentuales en su valor
durante los ltimos seis aos, cul es el aumento porcentual promedio del valor de
8. En un problema donde se debe calcular ~1 promedio de velocidad para diferentes
las acciones en el periodo de s~is aos?
espacios, la medida indicada es
a. media.
b. mediana.
c. modo.
14. Una firma comercial tiene dos sucursales con un total de 220 empleados, con. un
d. media armnica.
promedio salarial de $1.20'0.000. Se sabe que el30o/o trabajan en ht.primera sucur-
e. geomtrica. sal; adems, en la segunda de ellas el personal gana $180.000 menos que.los de la
9. Cuando la variable muestra un crecimiento geomtrico, la medida correcta es primera. Cul es el promedio salarial de cada una de las sucursales?

a. media. 5, Con los siguientes datos de una serie sin agrupar


b. mediana. ~: 8 2 16 24 2 8 2 16 2 8
C. modo.
calcule:
d. media armnica.
a. Mediana.
e. ninguno.
b. Media geomtrica.
10. Cuando es posible convertir una caracterstica cualitativa (atributo) en una variable c. Decil siete.
cuantitativa, asignando un nmero consecutivo a cada posibilidad de respuesta, en d. Percentil62.
una escala de opinin, gusto o preferencia, el promedio que podra utilizarse en este
caso es 16. Con los siguientes datos de una distribucin de frecuencias calcule:
a. Media.
misma curacin media de 9 aos. Se realiza una encuesta entre los compradores de
c. Tercr cuartU.
estos productos, para determinar cul ha sido su duracin. Los resultados obtenidos
d. Qtti_;;P decil. fueron: producto A: 10 7 8 9 10 10 9 11 9 8 9.
e. Percentil 80. Producto B: 19 4 3 4 3 9 10 3 19 5 9 4 9 5 9 4 9 5 9 4 9 10 19 4 5 9.
-:
Determine:
a. Cul medida "promedio" se utiliz para cada marca?
.. .. b. Cul marca aconsejara usted?
c. Como vendedor, en qu marca se sentir ms seguro, al afirmar que la vida
media de duracin son 9 aos?

... : 21. Una muestra de 22 empresas editoras de textos revela los siguientes porcentajes del
.~ .
gasto en promocin, respecto al total de ventas del producto:

21 18 25 20 16 18 16 10 18 20 16

17. Hallel~:media, mediana y moda, en cada uno de los siguientes conjuntos de obser- 14 20 26 12 14 12 14 12 12 12 18
vaciolies: Calcule la media, mediana y moda.
A. 20 ': 18 16 10 18 13 12 12 18 20
17 19 22. Los siguientes datos representan el nmero de interrupciones diarias, en un mes.
B. n 13 13 15 15 15 17
Los factores son de diversa ndole, tales como de Huido elctrico, dao en las m-
c. 10,. Ll 12 15 14 14 130
quinas, enfermedad Q. malestar el operario, etctera. Los resultados se presentan en
a. Eri{ul el~ l:s 'tres casos la media tiene poca repres~ntatividad? la siguiente tabla de frecuencias:
b. Er(cida uno de los casos, compruebe que las sumas de las desviaciones respecto
a la ro.edia aritrndca es igual a cero.
e '[)~i~jercicio'(A) conteste: qu pasara con los resultados obtenidos con la
. ap!ftidn de:Ias tres medidas: (1) si a cada uno de los valores de la variable se o 10
mtil{lpcara por 3(; (2) si a cada valor se le suma 5? 8
2 4
. 13. c6{q~e en las siguientes medidas de posicin, indiqueen cules de los puntos 4 2
erlst~tinardacin:
.. ,
5 3
a. :x\:18 mediana= 84 moda= 90 7 2
b.. x_:,;_g. mediana= 84 moda= 78 10 1
c. x-~84 mediana= 84 moda= 84
d.

,Ss4
'4 .
mediana= 84 moda= 52
.:
Calcule el promedo de interrupciones d.\arias en la fbrica durante el mes.
19:Sllos't~~ultados obtenidos al aplicar tres promedios son media= 50, mediana= 46
y moda.'= 40, qu pasar con los promedios si cada uno de los valores de la variable
23. En un almai::!l de reiuesros se realiz un estudio el valor y nmero de deudores.
;e mtili:ipica por 1O? .. - La muestra al azar correspondi a 80 cuentas, con la cual se construy la siguiente
20. Suponga que usted es el gerente de mercadeo de una empresa, donde se distrim- tabla:
ye el mismo producto con dos marcas diferentes, asegurando que ambas tienen la .
26. Considere que una empresa cuenta con tres departamentos con diferente nmero
de empleados. Se realiza una encuesta para determinar el nmero de unidades pro-
ducidas por hora, con los siguientes resultados:
26
20
60,1-80 10
80,1- 100 6

a. Calcule la media y la moda.


b. Cmo procedera usted si le pidieran calcular la media aritmtica?
24. Suponga que se realiz una encuesta sobre la tasa de desempleo en 40 de las princi-
pales ciudades del pas, con los siguientes resultados:

a. Calcule el promedio (media) de rendimiento para cada uno de los


6 2- 5o/o
departamentos.
10 5,1- So/o
8,1-llo/o
b. Obtenga el promedio de unidades para el total de los 120 empleados.
16
5 11,1- 14o/o 27. La media de dos nmeros es 10 y su 'media geomtrica es 8. Calcule la media arm-
3 14,1-18%
nica.

28. Con los siguientes datos de tina distribucin simtrica, correspondiente a 150 ob-
Calcule:
servaciones, se elabor una tabla de frecuencias agrupados en cinco intervalos de
a. Media, mediana y moda. igual magnitud. Solo se conoce parcialmente la informacin de la tabla, siendo:
b. Media geomtrica y armnica. h =50 / 2 =f.. + 10 X5=80 X1=35.Reconstruya la tabla y calcule la media
c. Las desviaciones respecto a la media y compruebe que su surnatoria es igual a mediana y moda. '
cero.
29. En qu situacin la media, mediana y moda son iguales?
25. Una compaa aumenta sus ventas (mUiones de$) en los ltimos aos de la siguien-
te forma: 30. Un control de produccin realizado en 50 lotes sobre el nm~ro de unidades defec-
tuosas dio el siguiente resultado.
2007 2 5 2 10 12 7 9 6 3 2 3 1 o o
2008 4 8 6 3 3 5 5 7 4 5 8 7 5
2009 11 11 9 6 4 3 2 7 4 o 10 8 8 3
2010 16 o 7 8 5 3 3 9 4 4 8 2
2011 28
a. Calcule la media, mediana y moda con los siguientes datos originales.
b. Agrupe los datos en una tabla de frecuencia, calcule los promedios
a. Calcule la media aritmtica y la geomtrica.
mencionados en esta unidad y compare sus resultados.
31. El jefe de control de calidad realiza una inspeccin durante 12 horas su<;esivas ;on- Microsoft Excel es una potente herramienta de clculo y brinda una gran variedad de
tando el nmero de unidades defectuosas cada hora. Los resultados fueron: 4 5 7 funciones aplicadas a muchos campos cientficos entre ellos la estadstica.
,.;.. 4 2 7 4 10 4 5 7 y 4. Calcule la media, la media armnica y la geomtrica. .o Los siguiente datos muesrran el nmero de cajeros que tiene una entidad financiera
en diversas sucursales:
32. Un fabricante compra todos los aos la misma cantidad de un artculo indispen- 8 6 5 7 5 4 5 4 2 4 3 8 4 2 5
sable como materia prima para la elaboracin de un producto. Por kilo, ha subido
en los ltimos cinco aos de la siguiente forma: $1.200 a $1.800; luego a $2.600; Halle e interprete:
despus a $3.500 y fin~ente a $5.000. Cul es el precio promedio por kil que a. La media aritmtica.
ha pagado el fabricante en los ltimos cinco aos? b. La media geomtrica.
c. La media armnica.
33. Un grupo de motociclistas realiz un recorrido y logr en la primera hora un prb- d. La mediana.
medio de 70 lanph; en la_ segunda hora la media fue 52lanph; en la tercera hora fue e. La moda.
80 lanph y en la cuarta 60 lanph. Halle la velocidad media. f. Cuartil3.
g. Percentil12.
34. De acuerdo con el ejercicio 33, suponga que los primeros 50 kilmetros los recrre Para resolver este ejercicio, proceda de la siguiente manera:
a una velocidad de 70 lanph; los .40 lan siguientes a 52 kmph; los siguientes 100
km a 80 lanph y los ltimos 70 lan a una velocidad de 60 lanph. Calcule en 'estas l. Abra Excel y digite los datos en filas o columnas (pantalla 3.1).
<: Pantalla 3.1 Digitacion de datos
condiciones la velocidad media.

35. El promedio de salario que paga una empresa a sus trabajadores es de $680.600.
La empresa tiene dos departamentos con un nmero diferente de empleados; en-el
primero el promedio de salario es $565.830 y en el segundo es de $711.480. Qu
porcentaje de empleados labora en cada uno de los departamentos?

36. Se sabe que el salario mensual de los empleados de una empresa es $680.000. El
total de empleados aument en un 30% en relacin con los que haba ala fecha. Los
nuevos empleados tienen un salario mensual promedio igual al78% del salario pro-
medio de los antiguos. Un ao despus se hace un aumento de $27.600 a to'dos los
empleados de la empresa._ Cul es el salario promedio de la empresa actualmente?

37. En una fbrica el departamento de produccin est dividido en tres (3) .seccihes.
Se sabe que en la seccin A, con 120 empleados, la asistencia promedio es de 240
das al ao; en la seccin B, que tiene 180 empleados, la asistencia media es 216 das
al ao. Si la asistencia media en todo el departamehf es 226,5 das al ao, cun-
tos empleados hay en la seccin e, donde la asistencia promedio es de 230 das al
ao?
Estadislica aplicadll Caplulo 3 Medidas de posicin o de temlencia ccntml

2. De la celda C2 hasta la celda C9, dgite el nombre de cada una de las medidas que va a 4. En la caja de dilogo que aparece, d die al frente de o seleccione la categora y
determinar; amplie la columna e para visualizar mejor lo digitado (pantalla 3.2). busque estadsticas (pantalla 3.4).
Pantalla 3.2 .Ull',lld'-l'Ull
Pantalla 3.4 Seleccin de categoras

,;cu~rti!3...
Perc~.ntij .1? .

. ..L.

5. En la caja de dilogo modificada se observan varias funciones estadsticas, debajo de


3. Ubique la celda D2; d die en fx que se encuentra ubicado debajo de la barra de Seleccionar una funcin. Para buscar la funcin requerida, muvase con las barras
herramientas (pantalla 3.3). de desplazamiento hasta llegar a promedio, la cual le permite hallar la meda aritm-
tica. D die en Aceptar (pantalla 3.5).
Pantalla 3.5 Seleccin de funcin


j
1 l
.. ~-- ~--- -- j---.
-:lt------t- --- i
j ~ .
!
Captulo 3 Medidlls de posicirt o de teude11cia ce11tral

En la caj;l. de dilogo Argumentos d~ funcin, digi~<: lps datos, seleccionndoios con Pantalla 3.8 Cuartiles y percentiles
die sostenido desde A2 hastaA16. Por ltimo, d die en Aceptar e inmediatamente
aparece en D2 el valor de la rr;.edia aritmtica: 4.8 (pantalla 3.6).

:Mediana
. ..... -----
iMada
J.----
.,
iCuartil3
.
_!Percentil12

i
1

De forma similar, halle las otras; media, mediana y moda, seleccionndolas de las
funciones estadsticas (pantalla 3.7).
Pantalla 3.7 Otras medidas estadsticas Por tanto, las medidas para este ejercicio son (pantalla 3.9).
Pantalla 3.9 Medidas estadsticas

Para el cuartil 3 y percentil12, proceda de forma similar, teniendo en cuenta que


despus de seleccionar los datos debe digitar el nmero del cuartil o nmero de
percentil en decimales, es decir, 3 y 0.12, respectivamente (pantalla 3.8).

.--------------------------J-
1
Estadstica ,tp/icnda Captulo 3 Medidas de posir:i o de te11de1zcia cemral

o Los prstamos concedidos a unos empresarios de un departamento determinado se


, muestran a continuacin.

50 53
53 56 5
56 59 12.
Calcule la media aritmtica, mediana, cuartil3.
59 62 8
Media aritmtica 62 65 15
l. Ingrese en Excel y digite los datos, usando una columna para los lmites inferiores y
otra para los lmites superiores. Total empresarios en la celda C8, dando doble die
en el cono de autosuma (:) (pantalla 3.10).
Pantalla 3.10 Digitacin.de datos
En la celda El digite f! X; En la celda E2 escriba la frmula +C2*D2; este proceso
tambin se puede realizar seleccionando las celdas respectivas. Repita el proceso
explicado en el punto 2 para copiar frmulas, pero con la celda E2. En la celda E8
presione dos veces el cono de autosuma (:) (pantalla 3.12).
Pantalla 3.12 Promedios por frecuencias absolutas simples

.50 53
53 56 S
56 59 :12
59 62 8 .. i

62 65 15 51,5: . 1
54,5i
. . . . . l

57,5;
. .. t

6_(),?j
63,5:

2. Como la frmula es x =
- }.:X.*f 1 1
, construya una columna para los promedios (x) y
6 66,5!
r-------l'liV'
n
otra columna para el producto (xt[J. Para ello, digite Promedio en la celda Dl. En la
celda D2, dlgite la frmula +promedio(A2:B3); d die en cualquier lugar de la hoja Y
luego ubquese en la parte-inferior derecha de la celda D2 hasta que el curso se convier- Proceda a aplicar la frmula escribiencl~~edia aritmtica en la celda Dl3 y digi-
ta en cruz y presionando el botn izquierdo del mouse arrastre hasta llegar a D7, para tando la frmula +E8/C8 en la celda F13; presione Enter para observar el valor de
que se copie la frmula en las dems celdas (pantalla 3.11). la media aritmtica (pantalla 3.13).
CaptUlO 3 l'r'IedidllS de posicin o de teude~zcia ce~ztral
Estadstica aplicada

3. La funcin +Y{valorlgico1;valorlgico2) comprueba si un valor es verdadero. Para


ello, digite en la celda G2 la frmula +Y{$D$10>F1;$D$10<=F2); D10 se coloca
con signos de $ para que no cambie el valor en las copias; las dos condiciones que
estn en signos de desigualdad generan que se escriba verdadero cuando el valor
que hay en D10 es menor o igual que la frecuencia absoluta acumulada. Luego se
efecta el proceso de copiar desde G2 hasta G7. Observe que la mediana est en el
4o imervalo (pantalla 3.16).
Pantalla 3.16 Identificaci~ de la clase mediana

-~:'

. ..~ .

: ~- .
25:

;: Para identificar el intervalo donde se encuentra h.-mediana, debe hall~ la frecuencia


absoluta acumulada partiendo:cTe ! frecuencia absoluta que se encuentra desde la . 4. Para hallar la mediana, aplique la frmula M. ~'L +
celda C2 hasta la celda C7. Ubicndose en F2 escriba +C2, en F3 escriba F2+C3 Y
.1 copie esta frmula desde F3 hsta F7 (pantalla 3.15).

~t~--+
Captulo 3 Medidlls de o de telldellcitl celltl'fll

6. Para hallar la frecuen~ia absoluta, aplique la misma funcin, teniendo presente que
.
.M.= Yj-I +e
. [Vt12)- Nj-l] ._. . la columna donde est~ las frecuencias absolutas es la D; por tanto, cambie e12 por
n; el cuatro. En C12 escnba f..., y en E12 copie la frmula de E11 y cambie el2 por 4.
Por tanto, debe identificar los datos que ella contiene; aunque ya se tiene claro cules Presione Enter (pantalla 3.19).
son los valores que se necesitan, debe generarlos en Excel. Inicie con el lmite inferior
usando la funcin tbuscarv. Corno esta funcin busca un valor en la primera colum-
na, debe llevar los datos de G2:G7 a la columna; por tanto, seleccione la columna A
haciendo elle derecho y elija insertar; seleccione las celdas G2:G7 y d elle en el botn
Copiar. Ubicado en A2, presione la tecla derecha del mottse, seleccionando Pegado
especial; del cuadro de dilogo que resulta seleccione Pegar vnculos y, por ltimo, d
clic e~ Aceptar (pantalla 3.17).

53 51,5 4 FALSO
FALSO 50
56 5 54,5 272,5 9 FALSO
FALSO 53
56 59 12 57,5 690 21 FALSO
FALSO
62 8 60,5 484 29 VERDADERO
59
65 15 63,5 952,5 44 FALSO Para hallar la frecuencia absoluta acumulada anterior, basta restar la frecuencia absolu-
FALSO 62
65 68 6 66,5 399 50 ta acumulada de la clase mediana con la frecuencia absoluta de la clase mediana. Para
FALSO
50 3004
esto, en F12, escriba FM y en G12 =tBUSCARV(VERDADERO;$A$2:$G$7;7;FA
LSO) - E12; presionando Enter aparece la frecuencia requerida (pantalla 3.20).
5. En DI 1 escriba L y en E11 escriba tBUSCARV(VERDADERO;$A$2:$G$7;2;F
Pantalla 3.20 Identificacin de ms datos
ALSO); el raiJ.go A2:G7 aparece entre $ para que permanezca: constante. El 2 que
aparece a continuacin hace referencia al nmero de la columna del rango en la
cual est el lmite para la condicin VERDADERO, que es donde se encuentra la
mediana, y FALSO significa que se encuentra un valor con coincidencia exacta, es
decir, el limite exacto (pantalla 3.18).

. . . . . . . . . . . . . . . . . . . . . . . . .r--
1

1
1
Captulo 3 Medidas de o de te11dcucia ce11tral

Se debe hallar la amplitud del intervalo. Para ello, reste un lmite superior de un Cuarti/3
intervalo con el lmite superior dd intervalo anterior. En F11 escriba C y en G11 +
Esta medida ser~~~ de form]a similar a la mediana. Teniendo en cuenta que la frmula
C4-:- C3Jpantalla 3.21). .:
del intervalo --F
4
es Q3 =L +e A , halle cada uno de los trminos de la frmula, pero prime-
1m
ro el que identifica el intervalo donde est el cuartil. Para ello siga este procedimiento:
1. Escriba 3n/4 en la celda Al O; en la celda BlO escriba la frmula +3*08/4. Presio-
n~do Enter se obtiene el resultado (pantalla 3.23).
Pantalla 3.23 Cuartil3

Recuerde que ya hall la frecuencia absoluta acumula yla tiene desde F2 hasta F7. Para
hallar el intervalo donde est el cuartil3 use la funcin t Y(valorlgico l;valorlgico2)
que con las condiciones que le van a dar ider.tifi_ca una frecuencia absoluta
acumulada menor o igual que 3n/4~ Para ello, digite en la celda A2 la frmula
tY($B$Hl>G1;$B$10<=G2); B10 se coloca con signos de$ para que no cambie el
valor en las copias. Las dos condiciones que estn en signos de desigualdad generan
que se escriba Verdadero cuando el valor que hay en BlO es menor o igual que la
frecuencia absoluta acumulada. Luego efecte el proceso de copiar desde A2 hasta
A7. Observe que el cuartil3 est en el So. intervalo (pantalla 3.24).

-- .....

i
..... - i
~-----------T~-----

1

l.
Captulo 3 Medidas de posidtl o de tendencia central

Mediana y en Gl4 tElltGll*(BlO-Gl2)/E12. Presionando Enter se muestra el


valor del cuartil3 (pantalla 3.26).
Pantalla 3.26 Cuartil3

37,5

Para identificar los datos de la frmula, recuerde que en la mediana se utiliza el


rango D11:G 12 para hallar estos trminos, si analiza los resultados en este rango,
observe que ya cambiaron y son los correspondientes al cuartil3 (pantalla 3.25).
Pantalla 3.25 Identificacin de datos

De esta forma se pueden hallar las otras medidas como el cuartil 1, percentil 36,
media armnica, media geomtrica. Excel es muy importante, ya que en un archivo
se pueden cambiar solo los datos y rpidamente se calculan las medidas de tendencia
central.

Nota: El lector podr resolver los ejercicios 16 y 21 de este captulo.

4. Ahora ya puede sustituir los valores en la frmula de la mediana. En E14 escriba .

1
1. 1 1
rc 1. 1 -'-+---
-n-----T /
Comprender la utilidad e Ider.tlt!t;<J.\
de cspe~sin.
Entender y conocer los e:'mcepto ~~e
Desarroilai: habilidades en el
y apuntamiento.
Estadistica aplicadtt Capitulo 4 MeddfiS de dispe~~itz -Asimetrla y aptmttLmiciJto

lntrodllllcdn Tabla 4.1 Variable discreta.(V discreta) Tabla 4.2 Variable continua.
m; "Z''"" Clculo del rango Clculo del
El comportamiento de un conjunto de datos se ha podido describir, en parte, mediante
la elaboracin de cuadros, grdficas y el clculo de algunos promedios, tal como se present .
o 3 33,1-38 3
en los captulos anteriores. Sin embargo, estos ltimos quedan incompletos ya que en 7 R =xmx -Xm;"
38,1-43 5
algunos casos particulares dan resultados que, por lo general, distorsionan el comporta- 2 15 R=y;, -y( 43,1-48 7
miento de ese conjunto de datos o, en el peor de los casos, nada miden en relacin con 3 10
el comportamiento de la variable poblacional, solo nos da una informacin incompleta,
R=ym-YI 48,1-53 9
4 8
53,1-58 15
pero importante. Esta es la razn que lleva hacia el conocimiento de otras medidas que 5 5
58,1-63 9
complementan indican cmo se distribuyen o se dispersan los valores observados a am- 6 2 V continuaR= 68 - 33 = 35
63,1-68 2
bos lados del promedio, es decir, cmo se concentran o se dispersan los datos, alrededor
del valor central o valor tpico. Cuanto mayor concentracin muestre el comportamiento V discretaR= 6- O= 6
de los datos, ms representativo ser el promedio.
El promedio calculado, por s mismo, tiene escaso valor significativo si no se deter-
mina el grado de variabilidad de los datos. No es extrao, pues, que dos distribuciones
tengan el mismo promedio pero con diferente grado de dispersin. La finalidad en esta
unidad, como ya se anot, es calcular el grado de concentracin de las observaciones !ID Varianza (52 o u2)
alrededor de un promedio, mediante la aplicacin de ciertas medidas de dispersin, de- Es una de las medidas de dispersin ms til. Se define, generalmente, como la media de
terminando cul de esas medidas (promedio) es la ms indicada en determinados casos. los cuadrados de las diferencias entre los valores que toma la variable, respecto a m media
A contin~acin se estudiarn algunas de ellas. aritmtica. Se define tambin como el cuadrado de la desviacin ttpica o estndar. Se
simboliza mediante Sl o cr2 A pesar de la definicin anterior, que hace pensar en la
existencia de una sola frmula para calcular la dispersin, hay ms de una expresin
M~~-ill-~ d,t_~.hR~!in,_.__=-=~,_~=- _ matemtica para la misma idea, algunas de ellas bastantes prcticas para casos simples;
otras, se utilizan en datos agrupados en la aplicacon mediante el uso de la ~alculadora.
llMOsdlacin (rango o recorrido) Veamos algunas de ellas.
Esta medida, mencionada en la elaboracin de tablas de frecuencias para la variable Datos sin agrupar
continua, se conoce tambin con el nombre de rango. Puede definirse como la diferen-
cia que hay entre el mayor y el menor valor que toma la variable. Tan sencilla de calcular, siguientes datos originales, 6 8 6 10 5, se quiere obtener la varianza por
se conoce ms como oscilacin, la cual solo brinda una ligera aproximacin del grado varias frmulas.( El estudiante escoger aquella que considere ms fcil de manejar).
de variabilidad, pues presenta el inconveniente de que solo toma en cuenta los valores
extremos, sin importar el conjunto de valores intermedios; por tanto, en algunos casos
puede arrojar un r~sultado totalmente distorsionado por su gran sensibilidad a valores Para hallar la varianza se pueden usar varias expresiones, una de ellas es
extremos, mostrndose engaador e inestable. }:;(x; -x}
Si se observan los siguientes datos, 6 8 6 10 5, el rango ser igual a 10-5 =5. n
Sin embargo, en la inferencia estadstica es muy usual la siguiente siguiente frmula,
cuando se trabaja con muestras, cuyos taJ]laos son menores que 30 elementos.
Apliquemos esta medida en datos agrupados, tanto en la variable discreta como en la sz =r(x -xY
1
con la misma informacin se utiliz en el clculo de los n-1

En el ejemplo anterior, se pudo observar que los valores intermedios que toma la va-
l riable, algunos de ellos con peso o frecuencia de alguna importancia, no se tomaron En la prctica, cuando haya complicaciones en los clculos anteriores, se recomienda

. _-+ .. . . . . . . . ..'"" doboia <k ~"""".


1 en cuenta en el clculo del rango, por tanto, su resultado no ser tan representativo proceder aplicando la siguiente frmula: 1
1
- ------------------------------
11
1
Capllulo 4 Medidas de dispersitz-Asimetrfa y 11p11ntmnimto

x=-=7
. 5
2:(x1-x-)2 =16~ .
a. S2 =
n 5
3 '_2 8 M:
6 -1 1 36
.
10 3 9 lOO

2
a. S2 =2:(x1 -x) !; =i09,38 = 2,19
n 50
2
s2 =ulfi-ni 2 =507-50(2,82} = 2,19
b. n 50

tienen los salarios en miles de pesos de los empleados de una en1presa que se muestran
en la tabla 4.5. Calcular la varianza por los diferentes mtodos o frmulas ya vistos.
Tabla 4.5 Variable continua

1-54.
55,1-59
60,1-64
.
65,1-69
70;1-74
1
75,1-79 8
1

Para el clculo de la varianza es necesario, en primer lugar, obtener las marcas de


clase, es decir, promediar cada intervalo y luego trabajar exactamente igual como si
fuera una variable discreta, tal como se hizo anteriormente, y cuyo procedimiento
Datos. agrupados En primer lugar se a:piicarn las. frmulas suministradas .~terior se muestr~ en 1~ tabla 4.6.
in:ente para datos sin agrupar, pero ligeramente modificadas, ya que se p9nd~rarn por
Tabla 4.6 Variable continua. Clculo de la varianza
las frecuencias absolutas, tanto al trab!ljar con la variable discreta como con la ca~tinua.
-.p.resta ltima, deber relizarse utilizando las marasde!ise. .
. . . , .(x -ij ; . .
.
.. .
Portante, la frmula que se sugiere aplicar es S
. ..
= 1. n ., aunque
. ..
en. otros
,:"'text()~: en internet se encuentran muchas frmulas igualmente validas par~ clcular
esta medida. Tambin S~ p~:~:pr:sentar as S =l.(y- yjn . . } '"'"
2

n
: 1
'i ........., .......... ---------------- -- ... .

~~ '
1
Estadstica ''flimda
-- 152 ------------------------------.!_aulul~_ll!:'!:'dns de ~fe~'~" -.~:!.:~::'!.~!!!'mtam~::!!_--~-

x = 3.305 =661 riable continua, fueron: x2 = 51,8 y si=


59,81. Con la informacin anterior, se va a 1
50 ' calcular la media y la varianza, para el conjunto de las 100 observaciones. Siendo:
'L(x. -ij ; sz
Aplicando la frmula S 2 ::: 1

n
1
x=2'82(50)100 +518(50)
' =27 )31 o tamb"Ien x- =2,82 2+51,8 = 27 ,31 . En este
2384 5 caso, por ser iguales n1 =n2 , ambos son iguales a 50, por tanto, en este procedimiento
a. S2 = = 47 69
50 ' se simplifican las operaciones.
2
Independientemente de la frmula que se aplique para el clculo de la varianza, en 2 2,19(50) +59,81(50) (2,82-27 ,31/50 +(51,8 -27 ,31) 50
S= +-'---'------'--"---'--'---:........!.-
una distribucin cualquie~a, el resultado obtenido siempre va a ser el mismo. 100 100
Hay que saber, entender y manejar las propiedades de la varianza, ya que en algunos S2 = 31 +599,7601 = 630,7601. Algo parecido se puede hacer aqu, quitando el
casos ayuda a simplificar las operaciones; en otros, puede servir como base de algn valor de 50 en la frmula y dividiendo por 2, en vez de 100, dado que n1 =n2
proceso matemtico posterior. Estas propiedades son:
o La varianza siempre debe serpositiva :::::} S2;:: O.
-~Desviacin tpica o estndar S o a
s La varianza de una constante siempre debe ser igual a cero :::::} V[RJ= O.
La varianza como medida de dispersin presenta el inconveniente en el resultado obte-
,,":
~ " La varianza de una variable ms una constante es igual a la varianza de la varia-
nido, ya que la unidad de medida en que est dada la variable se encuentra elevada al
ble
cuadrado, pues as lo requieren los clculos para las diferentes frmulas anteriormente
v!XIQ=Y(X)+ V(IQ= s;. aplicadas, y es necesario, en numerosos casos, contar con una medida de dispersin
Esta propiedad tambin es vlida para la diferencia V!X -lO= s;_. cuyo resultado se d en la misma unidad en que est dada la variable. Lo anterior se
o La varianza de una constante por una variable es igual al producto de la constante logra cuando se extrae la raz cuadrada de la vetrianza. Este mtodo se conoce como
elevada al cuadrado por la varianza de la variable V(kx) =k2 S2 desviacin tpica o estdndar y se simboliza con S o cr, siendo la medida de dispersin
i
ms empleada en los procesos estadsticos. Se dice que la desviacin estndar mide la
i:
La anterior propiedad es una de las que ms dificulta no solo su aplicacin sino su dispersin de los datos respecto a la media aritmtica.
i
comprensin. Considrese, por ejemplo, que se tiene un conjunto de datos cuya varia- 2 })x; -xY o, 2 L:c -2 -
ble est dada en horas, siendo su promedio 7 y la varianza igual a 3,2, y se desea con- S = S =---X (En datos sin agrupar).
n n
vertir estos resultados en minutos, sin tener que rehacer o volver aplicar las frmulas,
con los datos transformados en minutos. Esto se logra utilizando o aplicando solo esta /'L(y.- y)2n.1
propiedad. En primer lugar, la nueva media ser: M (kx) = kx =60 (7) =420 minutos
s= n
S= V 1
n (En datos agrupados o ponderado~).
en promedio.
Ahora, la varianza se calcular as: Vk,) =es_;
= 60 2(3,2) = 11.520 minutos. Hu-
Utilizando la varianza que se obtuvo en el ejemplo 4.4 para los salarios de los em-
biese sido ms fcil trabajar con la desviacin tpica s = .Jl
= .J3,2 = 1,788854 ~ 1,79 pleados de una empresa, calcular la desviacin tpica o estdndar.
horas, as que al multiplicar este resultado por 60, se convierte en minutos, s =
1,788854(60) = 11.520 minutos. S= ~48,66 = 6,97
o La varianza de dos o ms submuestras se obtiene mediante la siguiente aplica-
cin: Puede afirmarse que los salarios de los empleados de esa empresa se dispersan res-
sz =s~n 1 +sin2 +... + (x1 -xJn1 +(x2 -xJn 2 +... pecto a la media en $6.970.
n n
_ x1n1 +x2n2 ... 1 Coeficiente de variadB1 (CV)
Debe recordarse que x = -'--'----"-"--
n1 +nz .. Cuando se tienen dos o ms varianzas, que estn dadas en unidades con medidas di-
Supngase que los datos para la variable discreta, que tanto se ha utilizado, corres- . ferentes, estas pueden compararse entre s, empleando el coeficiente de variacin que se
ponden a la primera sub muestra con media x1 =2,82 y varianza s{ =2,1.9, mientras define como el cociente de dividir la desviacin tpica por su respectiva media aritmtica, el
que la segunda submuestra, correspondiente a los resultados obtenidos, siendo una va-
.t "'""""' ~;.;,
-@-_______...:...----
Captulo 4 Medidas de disptmin- Asimellia y apuntamil!llto

Z matemdtica = (7,0 - 6,8) 10,6 =0,33


!.~. cual se considera una desviacin relativa. Si el resultado obtenido se multiplica por 100,
Z estadstica= (7,6 - 7,8) 1 0,3 =0,66
la variacin comparativa entre dos o ms variables, dadas en unidades de medida dife-
... rentes, se expresarn en trminos porcentuales. Esta medida de dispersin se simboliza De acuerdo con estos resultados, se dir que hay una mejor posicin relativa cuanto ms
cerca del valor de 3 se encuentre, ya que es el mximo valor que supuestamente toma Z.
mediante CV.
En el ejemplo anterior se dir que en Estadstica le fue mejor respecto al grupo.
Coeficiente de variacin
q _ Desviacin tpica
Media aritmtica
S
CV= -100%
x y
El coeficiente de variaci~ general~ente se expresa en trminos porcentuales.
Este coeficiente permite comparar)a variabilidad de dos o ms distribuciones, dadas Existen otras medidas de dispersin, cada una de ellas con aplicaciones especficas en
en unidades de m~didas diferentes, con el fin de determinar cul de ellas tiene una ma- determinados casos, pero aqu solo se har referencia a dos de ellas: la desviacin media
~ ' . y la desviacin mediana.
yor o menor variabilidad relativa oporcentual.
De la consideracin hecha a partir de la distribucin normal, se afirma que una dis-
tribucin cualquiera que tenga un coeficiente de variacin menor o igual al 33% tiende
~Desviacin media (Da)
a ser homognea, es decir, la media obtenida ser bastante representativa del total de las Es una medida de dispersin qu: se obtiene al calcular la media de las desviaciones respec-
observaciones, y si, por el contrario, el CV se hace mayor al33%, indicar que cada vez to a su media, tomadas en valor absoluto. Esta medida se utiliza a menudo por su forma
su valor es mayor y ser ms heterogea. Por tanto, la media ir perdiendo su represen- de cuantificacin fcil y rpida, pero en realidad se usa poco. Al igual que la desviacin
tatividad, de ah que en el muestreo ~e proceda, en estos casos, a dividir la poblacin en tpica, se toman las diferencias entre los valores de la variable y su media aritmtica,
',.
grupos ms homogneos, denomin~dos estratos, permitiendo la aplicacin del mtodo todos con el signo positivo, es decir, en valores absolutos, para indicar su oscilacin o
de muestreo aleatorio estratificado. variacin alrededor de la media. Sin embargo, es menos exacta y, por lo general, su va-
lor es menor respecto a la desviacin tpica. De manera que en una distribucin normal
~ Puntaje tpico o estandarizad_o ( Z o t ) corresponde al 79,79% de la desviacin tpica. Se simboliza mediante Da o DM' Otra
Algunos lo denominan como puntaje de la Z y se expresa como desviaciones respecto a la forma de calcular la desviacin media es aplicando la siguiente frmula: Da= 0,7979S.
media muestra4 en unidades de desviacin tpica. Se aplica mucho en la transformaciJ1 Datos sin agrupar Se contina con la utilizacin de los mismos datos, 6 8 6 1O
de valores de una variable, expresado en cierta escala x1 o y1, por unidades dadas en 5, de manera que se puedan comparar los resultados obtenidos con la aplicacin de las
otra escala Z, proceso denominado tipificacin o estandarizacin. Igualmente se utiliza diferentes medidas. La frmula por aplicar es:
para comparar los resultados de determinados experimentos expresados en unidades de :lx~-xl
medida diferente; tambin sirve para 'indicar la posicin relativa de un elemnto de la dis- Da=---
~ :'
n
tribucin respecto a la media en unidades de desviacin estndar, como puede observarse
en los resultados de las pruebas que realiza el ICFES, los cualeS indican la posicin que x= L.x 1 = 35 =?
.... n 5
ocupa el estudiante dentro del conjnto. Esta medida se simboliza ya sea por Z o t como
puede observarse en la siguiente frmula: ~ :lx -xl s =1,6
1
Da = - n - = DaLS ~ 1,6L1,79
x-x
Z=- - 15
S S
Tabla 4.7 Clculo de Da
.-:: Si se considera que un curso obtiene un promedio 6,8 en matemtica y 7,8 en esta-
' ~. dstica, adems se requiere saber en cul de ellas un alumno alcanza mejor posicin
relativa, es decir, en cul obtuvo un mejor rendimiento con relacin al grupo, si se
sabe que.las. calificaciones de ese alumno fueron 7,0 y 7,6, respectivamente.

En un principio se dira que en s~gunda asignatura, pero su posicin dentro del


i
curso corresponder a la primera. Si se supone que se conocen las desviaciones tpi-
!
.! cas de 0,6 y 0,3, respectivamente, se aplica la frmula. 1

. . . - --------------------------- .
; 1
-----------------------------r-----
- ~-a_a!....'J!l_icn_d,_t--------------------------------:,::;:~; -----------
Capllulo 4 Medidas de dispersi11-Asimetra y

::sros conceptos se refieren a la comp~cin de la curva obtenida con los datos pro-
aptmtr~mi,~mo
157
1 Datos agrupados El procedimiento de c~culo ~ parecido .al d~arrollado 'par_a ob-
tener la varianza, pero trabajando con las diferencias entre la var~able y la media, en venientes de una muestra y una curva teonca o normal, observada en la mayora de los
fenmenos naturales, en especial cuando el nmero de observaciones es grande, a fin de
valores absolutos.
determinar su asimetra y su apuntamiento.
. Una distribucin es simtrica cuando la media, mediana y moda son iguales, es de-
cir, cuando en una curva normal las dos colas son iguales. Pero si la distribucin es
unimodal siendo un valor mayor que la media y la. mediana, esta tendr una cola ms
o 3 -2,82 2,82 8,46 larga hacia uno de los lados, y se dice que es asimtrica o deforme. Si la deformacin o
1 7 -1,82 1,82 12,74 alargamiento de la cola se presenta hacia los valores ms grandes de la variable, es decir,
2 10 -0,82 0,82 8,20 hacia la derecha, se dir que la distribucin es asimtrica positiva. En aso contrario, la
3 15 0,18 0,18 2,70 asimetra serd negativa cuando el alargamiento de la cola se presenta hacia los valores
4 8 1,18 1,18 9,44 menores de la variable, o sea hacia la izquierda.
5 5 2,18 2,18 10,90
6 2 3,18 3,18 6,36 Grfica 4.1 Distribuciones de asimetra o deformacin

Ljx;-:Xj_t; 58,80="!,176::1,18 :X=2,82 D =L:ly-yln


Da= n 50 a n
Segn los resultados anteriores, se puede observar, como ya se anot, que siempre la
desviacin media es menor que la desviacin tpica: Da <S<=? 1,18 < 1,48.
M, <M, <Md M1 >M, >Md y M1 =M, =Md
!&! Desviacin mediana (De)
- - o,~
x-Md _ 3(x-Me) ,
Si en un problema cualquiera se requiere el clculo de la mediana, en vez de la media a. As = h AS- o
S S S
aritmtica, debe utilizarse como medida de dispersin la desviacin mediana, simboli-
zada mediante De o DMe, que se define como la media aritmtica de las desviaciones o Esta deformacin que generalmente puede ocurrir, se conoce ~b~b- sesgo o bias y se
diferencias, en 11alores absolutos, que hay entre los valores que toma la variable y stt mediana. calcula aplicando diferentes medidas, especialmente las elaboradas por el estadstico K.
Su clculo se desarrolla exactamente igual al de la media, sustituyendo esta por la media- Pearson. .
Si As es igual a cero, la distribucin ser normal osimtrica; s el resultado es negativo
na. Las frmulas para aplicar en este caso son:
o positivo, significa _que es asimtrica, sealando a qu lado de la curva se presenta la
De= zjx; - Mej (sin agrupar). deformacin. El valor obtenido corresponde al grado de deformacin, es decir, cuanto
n ms alejado se encuentre de cero, ms asimtrica ser.
Ljx.-Mej.t; I:!Y; -M.ln
De= 1 1
(agrupados). D =---'------'--
n Manejar si se consiCl:ran
n
aplicadas anteriormente para una variable, como los que se muestran en la tabla
4.9.

~idas de def~.imLQ.asim,.tlr~=--=~'"'-= :X= 51,8 S= 7,73 Md= 55,5 Me= 53,33

En los captulos anteriores se estudi y explic la forma de calcular, aplicar y analizar las
a.
diferentes medidas de posicin y de dispersin, en distribuciones de frecuencias. Ahora
se presentarn dos nuevos conceptos, estrechamente relacionados con esas medidas,
1 como el de asimetra y apuntamiento, a fin de alcanzar un mayor conocimiento respecto h. As= 3( 51,8- 53,33) 17;73 =- 0,59 <=? A8 =3(y- MJ
S
al conjunto de datos investigados. 1
~----~-- -------+------
-,'j: , ..... - ......
1 ---------..----------""
i
t.~i i
Estadstica aplicada
Captulo 4 Medidas de disp~t~sitt -Asimetra y aptmt1tmiC11to
Los dos resul!ados, con pequeas diferencias, indican que la distribucin es ligera-
mente asimetrjca negativa, y no necesariamente los resultados deben ser iguales; por ~das d~ ,ntamiento o curtosis J; . .

lo general ~~~Jen.
Con.ocidas tambin como rurtosis, permiten establecer el grado de apuntamiento 0 acha-
Tambin p~de calcularse el grado de asimetra mediante la aplicacin de los mo- tamte~to de la curva de la distribucin, respecto a la normal. Esta medida propuesta
mentos: tarnbien por Karl Pearson, basada en los momentos unidimemionales, es dudosa si se con-
m3 : corresi.?~e al momento de orden tres respecto a la media. side~a que una simple razn mida adecuadamente el apuntamiento de una distribucin.
m2 : es el m6.rizento de orden dos y corresponde a la varianza; por tanto, se debe obte- La formula que se aplicar se har utilizando las marcas de clase:
ner su raz:ctidrada para.hallar la desviacin tpica, la que a su vez se eleva: al cubo m4: momento de orden cuatro respecto a la media.
para la a~lici;in de la frmula. Los momentos son medidas de potencias de variable.
~:;.. I@Si'MkSM~ Calcular el apuntamiento en una variable continua utilizando la tabla 4.1 O

Tabla 4.10 Variable continua. Clculo del mometo de orden


Calcular la d;formacin con los daros de la tabla 4.9, correspondiente .a los datos de cuatro, respecto a la meclia
una variabl'.~ontinua.
: .:'
.. :-
-16,3 265,69 797,07 211.773,5283
Tabla 4.9 .Yariable continua. Clculo del momento de orden tres respecto -11,3
:a la meclia 127,69 638,05 81.523,6805
45,5 7 -6,3 39,69 277,83 11.027,0727
50,5 9 -1,3 1,69 15,21 25,7049
55,5 15 .. 3,7 13,69 205,35
35,5 -16,3 265,69 60,5 9 8,7 75,69
40,5 -11.3 127,69 638,05
65,5 2
45,5 ) -6,3 39,69 277,83
50,5 ;.. 9 -1,3 1,69 15,21
55,5 .]5 3,7 13,69 205,35
: '9 8,7 75,69

_ L(x -X) 4J; ------"-'--..::...!..--'-!


L(y- .Y)\
m4- 1 m4
n n
429.117,0850.
m4 = =8.582,357 s =7,73 s2 =59,75
.. ~ : 50

. .... . ~
A _ 8.582,357 ..
m2 =l=:59,81 s=~59,81 =7,73 P- (59,75Y 2,40 y=51,8

:E(i.:..x)'.t; -10.147,80 =-202956 A = m3 = -202,1}56 =-0 44


m3 ,,:.n 50 ' s s3 7',733 '
Para ~a interpretacin de esta medida debe tenerse en cuenta lo siguiente:
11
... S1 Ap 3 , la distribucin ser comiderada normal.
0
Nota. El resultado obte~ido con la aplicacin de esta ltima frmula, tambin, muestra Si Ap > 3 , la curva es apuntada, ms alta que la normal y estar indicando una ma-
una ligera asimetra hacia. la izquierda. Se puede observar que, en la mayora eje los casos, yor concentracin alrededor del promedio.
los resultados son diferentes; como ya se anot, lo cual no tiene ninguna import~ncia. Tam-
0
Si Ap <_3, es achatada, y se tendr, por tanto, que hay ms dispersin respecto al
promedio.
poco podra afirmarse cul de ellas es la mejor.
En el ejercicio que se realiza se encuentra que 2,4 < 3, siendo la curva algo achatada. 1

~-~~---~-
Esladisllca aplicada -----------------------------------------------------------
A las tres formas anteriores se les denomina tambin leptoczrtca, platiczrtica y meso-
crtica.

Supongase que los salarios pagados por una empresa muestran que su
_media aritmtica es de $850.000, con una desviacin tpica de $55.600.
' Se'p'ci alir~ir q:Ue la variacin relativa es de 0,0654? O que el
coeficiente de variacin es del62,38%? .
En el ejercicio anterior, el jefe de Recursos Humanos calcul la mediana,
cuyo valor es de $820.250 Con esa informacin se podra saber qu
asimetra presenta esa distribucin salarial? La asimetra encontrada
podra decirse que es hacia la derecha?
3. Si adems de la media y la mediana, se conoce tambin la moda, cuyo
valor es de $788.342, establezca la asimetra presenrada relacionando
esos tres valores. Si solo se utiliza la media, la desviacin tpica y la moda,
cul sera el valor y la direccin de su asimetra?
4. Supngase que la media salarial h1e de $850.000 y la desviacin tfpica de
$92.500, valores que hacen suponer un comporrmiento similar a la normal.
De acuerdo con la campana de Gauss o curva normal, utilizando la regla
Desviacin estndar emprica de distribucin, entre qu valores estara el 68,3% de los salarios?
Desviacin tpica Aproximadamente, entre qu valores estara el95,5o/o de los salarios?
Medidas de apuntamiento Variacin relativa
Medidas de asimetra Varianza
Medidas de deformacin

1

-------- ........... --------------------!--------

l
1. Cul de las siguientes pr~sentaciones cree usted sea una medida de dispersin relativa? 8. Escriba verdadero (V) o falso (F), segn corresponda.
b. Varianza. a. El resultado obtenido al calcular la varianza se da en las mismas unidades en
a. Desviacin tpica. ~ que est dada la variable. _ _ __
c. Coeficiente de variacin. d. Todas las anteriores.
b. La varianza es igual al cuadrado de la desviacin estndar. _ _ __
e. a. y b, pero noc. C. El coeficiente de variacin se puede expresar en trminos porcentuales.

2. Cuando se hace referenra a una distribucin simtrica, el punto ms alto de la cur-


d. El puntaje tpico es la raz cuadrada de la varianza. ____
va corresponde a
e. La oscilacin o rango se puede utilizar como medida de dispersin,, _ __:...__
a. la mediana. b. la media armnica. c. media aritmtica.
d. el modo. e. todas las anteriores. 9. En una distribucin asimtrica negativa la media aritmtica debe ser
a. menor que la mediana y mayor que el ~odo.
3. Cuando se hace referencia a una distribucin asimtrica con alargamiento hacia la
b. mayor que el modo y menor que la mediana.
derecha, se puede afini:iar que es c. igual que el modo y la mediana.
a. simtrica. b. sesgada a ambos lados. c. apuntada. d. menor que la mediana y menor que el modo.
d. asimtrica positiva.. : . e. ninguna de las anteriores. e. ninguna de las anteriores.
4. La media aritmtica de los cuadrados de las diferencias entre los valores que toma la 1O. Con los resultados obtenidos en las tres distribuciones de la tabla 4.11, la distribu-
variable y su media aritmtica, corresponde al (a la) cin simtrica es
a. coeficiente de' varia_in. b. desviacin tpica. a. 1:~. primera. b. la segunda. c. la tercera. d. ninguna
c. desviacin media. : d. varianza. Tabla 4.11 Resultados
e. rango.
5. Al c[ividir la desviaci~_ tpica por su media aritmtica, multiplicando por 100 su
resultado, corresponde' ~la (al)
a. desviacin tpica.' .; . b. varianza. c. puntaje tpico.
d.. coeficiente
. .
de vai:l~Cn.
.
e. recorrido intercuartlico.

6. En una distribucin .c\onde la curva es ligeramente achatada, se dice que la


a. medida de apuntamiento calculada es mayor que 3.
11. En la tabla 4.11, observando nicamente la primera distribucin, se podra afirmar
b. medida de apunt~ento calculada es menor que 4.
que corresponde a una distribucin
c. curva es platicrtica o apuntada.
a. simtrica. b. asimtrica positiva.
d. curva es simtrica: .
e. medida de apuntarclento calculada es menor que 3.
e. asimtrica negativa. d. ninguna de las anteriores.
12. En cul de las tres distribuciones de la tabla 4.11, suponiendo que las variables estn
7. Dos grupos de trabaj~dores fueron sometidos a programas de entrenamiento di-
dadas en unidades de medida diferentes, hubo una mayor variabilidad absoluta?
ferentes. Para el grupqA, el tiempo requerido fue de 11,3 horas, con varianza de .
20,83 horas. Para el grupo B, 17 unidades en promedio y varianza de 25,36 unida- a. La primera. b~ La segunda.
des2. Qu programa 'tiene una variabilidad menor en su desempeo? La tercera. d. Ninguna de las anteriores.
13. Segn la tabla 4.11, suponiendo que las variables estn dadas en unidades de medi- 20. Para cinco artculos se tienen las variaciones en sus precios respecto al mes pasado.
da diferentes, en cul hubo una menor variabilidad relativa? Estos valores fueron:

a. En la primera. b. En la segunda. - $40 - $ 120 - $ 80 + 50 t$ 220


c. En la tercera. d. En ninguna de las anteriores. Calcule:
14. Con los datos de la tabla 4.11, calcula el grado de asimetra por los mtodos de a. El coeficiente de variacin. b. La desviacin media.
clculo de Pearson. c. La desviacin mediana.

15. Se sabe que una empresa paga en promedio mensual un salario de $980.000, con 21. En un curso de capacitacin ofrecido por la empresa a sus trabajadores, uno de ellos
terico y el otro prctico, se. calific utilizando una escala de Oa 1O. Uno de los
un coeficiente de variacin del16,32%.
trabajadores obtuvo las calificaciones 8,2 y 6,8 en los cursos respectivos. El traba-
a. Cul es la desviacin tpica de esa distribucin de salarios? jador pudo averiguar cules haban sido los promedios y la dispersin en las notas
b. Si para el2012 el gerente ofrece un reajuste del7,5% pata todos los salarios, obtenidas en cada curso, con d siguiente resultado:
cul es el nuevo coeficiente de variacin?
c. Si hay otra propuesta de un aumento de $50.000 pata todos, cul es el nuevo Curso terico Media= 8,7 Desviacin tpica = 0,8
coeficiente de variacin? Curso prctico => Media= 5,8 Varianza 1,21
Responda:
16. Los siguientes datos son los tiempos (en minutos) de 10 corredores en un una prue-
ba atltica de 10 kilmetros: 35 45 45 55 55 55 65 65 65 90.Complete: a. En cul de los cursos este trabajador obtuvo una mejor posicin relativa?
a. El promedio (media) de los 1Ocorredores es igual a - - - - minutos. b. Cul es el coeficiente de variacin de cada curso?
b. La mediana del tiempo de los 10 corredores es igual a;----- minutos. c. Cul es el coeficiente de variacin pata el curso en general, si adems se sabe
que al primero asistieron 30 trabajadores y al segundo solo asistieron' 20?
c. La moda del tiempo de 10 corredores es igual a - - - - minutos.
d. La desviacin tpica del tiempo de los 1Ocorredores es minutos. 22. Los empleados de tres departamentos de una empresa fueron sometidos a una prue-
e. El coeficiente de variacin de los tiempos de 1Ocorredores es %. ba sobre conocimiento del rea en la cual trabajan, con los siguientes resultados:
Complete.

17. Con los datos del ejercicio 16 correspondiente a los tiempos de 1Ocorredores, el
A 74 6,2 25
grado de asimetra es -----
B 82 7,8 40
18. El anterior resultado indica que los tiempos logrados por 1Ocorredores constituye e 68 4,4 35
una distribucin
a. simtrica. b. asimtrica hacia la izquierda. Una vez publicadas las notas se encontr que haba un error en los clculos, ya que
c. asimtrica a la derecha. faltaban 10 puntos que se haban ofrecido como compensacin a una pregunta cali-
ficada como mal pero era correcta. Calcule el coeficiente de variacin para el total de
19. Con la siguiente informacin correspondiente a una distribucin simtrica, m= empleados teniendo en cuenta los 1Opuntos que se deben aadir a la calificaciones
5 e= constante, x1 = 40, n1 = 3 H2 = 0,30, h5 = 0,05 y x5 = 85 , complete la de cada uno de los empleados.
tabla y calcule:
a. Coeficiente de variacin. 23. Un jefe de produccin encuentra anotado en el libro de control que el peso prome-
b. Desviacin media y desviacin mediana. dio del artculo fabricado es 270 gramos, con una desviacin tpica de 8 centme-
tros. Hay algo incorrecto?
c. El rango u oscllacin.
24. Si se tiene una media mu;strru" .t': ~:25 yvafianza de 36; halle-lil.riidia mesttal, la a. En trminos de kilmetros por galn ( uh km= 0,622 millas).
y;
varianza y desviacin tpica de en los siguientes casos: . b. En kilmetros por litro ( n litro = 1,056 c~artos de galn).
a. y= 8 + 20x 30. Responda:
25. Si en un problema cualquiera se obtjene una varianza de 2,4 horas, pero se solicita Cundo se utiliza el coeficiente de variacin?
el resultado en minutos, cul ser~ su valor?
31. A los trabajadores de una empresa, el prximo ao se les aumentar el salario men-
26. En una empresa, el salario promedio es $1.120.500, con una desviacin tpica de sual en un 9% ms $12.000. La empresa tiene 850 trabajadores y actualmente estos
$1.300. En otra empresa de la olppetencia, el salario promedio es $924.500, con devengan un salario medio mensual de $830.000, con un coeficiente de variacin
una varianza de $492.544. En cuM de las empresas los salarios presentan del38%.
a. Cul ser la desviacin estndar en el prximo ao?
a. una mayor variabilidad absol~1a?
b. una menor variabilidad relatiy?' b. En cunto se aumentar el valor de la nmina el prximo ao?

27. Cuando se aplica el muestreo ert un plan de auditora, uno de los aspectos ms 32. Una encuesta realizada a 12 fbricas de helados revela los siguientes porcentajes de
importantes que se deben consid~rar es la variabilidad de la poblacin objeto de utilidad:
estudio. Esto se mide por . . 25% 20% 22% 20% 25% 30% 18% 16% 30% 16% 20% 16%
a. la media. b. desviacin estndar. Calcule:
c. la mediana. . d. ninguna de las anteriores. a. El coeficiente de variacin. b. La desviacin media. c. El rango.
28. Una firma tiene 40 almacenes distribuidos en el territorio nacional y se cuenta con 33. En el lanzamiento de un producto, se realiz una investigacin para determinar el
la informacin de la tabla '4.12 sob.re las ventas mensuales en millones de pesos. grado de aceptacin, utilizando la escala de 10 puntos. Se tomaron 12 hombres y
12 mujeres con el siguiente resultado:
Ta,bla4.12 V~iable continua

10,1- 20 2
20,1- _30_:.. 7
13
a. Calcule:
30,1-.40 '.
0 El coeficiente de variacin, independiente para hombres y mujeres.
40,1- 5Q.:,: 8
o El coeficiente de variacin para el conju~to, es decir, para las 24 personas.
50,1-60. 6
b. Con los 24 datos, construya una tabla de frecuencias y calcule el coeficiente de
variacin.

a. Calcule: 34. Responda:


0 El coeficiente de variaci~..;. o La desviacin mediana.
a. Qu significa que una variable muestre un apuntamiento mayor a la
o La desviacin media.
normal?
b. Compruebe que DM 5, Da <S . b. Qu significa que la distribucin de una v~iable sea asimtrica a la
. . derecha?
29. En una prueba realizada en 30 at<;>s, de una nueva marca, se obtiene el rendimiento
promedio de 32,4 millas por galrr de gasolina, con varianza de 42,04 mpg. Exprese
35. Con los datos de la tabla 4.13:
estos resultados:
Se van a realizar dos ejercicios en los que se hallen las medidas de dispersin ms apli-
cadas.

48,1- 56 38 Variable discreta


56,1-64 22 En este caso se pueden hallar las medidas de tendencia central, de dispersin y otras
64,1-72 14 ms. Suponga que los siguientes datos corresponden al nmero de clientes que se atien-
72,1-80 6 den en una semana por un cajero de una entidad bancaria: 50, 80, 70, 85, 80, 76. Siga
80,1- 88 3 este procedimiento.
88,1-96 2 l. Abra Excel y digite los datos iniciando en la celda Al. No olvide que hay que
tener instalados los complementos de anlisis de datos. Seleccione Analisis de
datos del men Datos y en el cuadro de dilogo resultante elija Estadstica des-
criptiva y pulse Aceptar.
a. Construya un histograma y un polgono de frecuencias.
b. Calcule la media, mediana y moda. Utilice la informacin anterior para
determinar el grado de asimetra, indicando a qu lado se presenta la
deformacin.
c. Calcule el grado de apuntamiento.

36. Responda:
a. Qu significa que una variable tenga apuntamiento mayor a la normal?
b. Qu significa que 1~ distribucin de una variable sea asimtrica a la derecha?
Captulo 4 Medidas de dispe1~in- Asimellia y apuntmnimto
Estadistica aplicad"
Variable continua
Pantalla 4.2 Seleccin de datos
Tome los datos del ejemplo 4.4 de los salarios de los empleados, para hallar la desviacin
media, varianza y desviacin estndar.

50,1-54 3
55,1-59 5
60,1-64 12
65,1-69 16
70,1-74 6
75,1-79 8

Desviacin media
l. Copie los datos en una hoja de Excel usando tres columns diferentes, sin tener
en cuenta ell, correspondiente al lmite inferior del intervalo.

50
55 59
60 64 12
65 69 16
70 74 6
75 79 8
Total 50

2. En la celda DI, escriba promedios, en la celda C2 digite la frmula tPROME-


..... DIO (A2:B2), presione Enter y realice el proceso para pegar la frmula hasta la
celdaD7.
. De esta manera se hallan fcilmente las medidas estadsticas.
!


--------r-----
i
Capitulo 4 Medidas de

'
j Pantalla 4.5 Clculos de marcas de clase o promedios

52 156
3 55 59 57 285
55 59 S 60 64 12 62 744
12 65 69 16 67 1072
60 64
70 74 6 72 432
65 69 16
75 79 8 77 616
70 74 6
Total so 387
75 79 8
Total so En Al O, escriba media aritmjtica; en ClO, escriba la frmula tE8/C8, y presio-
ne En ter. En F1 escriba X- x; en F2 escriba la frmula +D2-$C$1 Oy copie esa
expresin desde F2 hasta F7.

3. En la celda El, escriba x"'f; en la celda E2 escriba la frmul~ tD2*~2. Repita el Pantalla 4.7 Clculo deJa media y restas de marca de clase con la media
procedi~ento para copiar la frmula pero teniendo E2 como referencia. En la
celda E8, presione dos veces el botn Autosuma.

1 1

- -------- . . . . . . . . . . . .l. . . _
.......
1
1

~-+ i

r:.: ..
r:....

_..-------------------------------------C~.a~:.P::Il:U::I:D~-~{..~M: : ": d:.'.: dn.:_:s.de


dispe1~i"- Asimetnt

s. En G1, escriba 1X- ~ 1; en G2, escriba la frmula +abs(F2) yrepita el procedi- Varianza
miento de copiar esta frmula desde G2 hasta G7. En GS, oprima dos veces el l. En Hl escriba (X X )1; en H2 digite la frmula +POTENCIA(F2;2) y repita el

botn Autosuma. procedimiento de copiar la frmula desde H2 hasta H7.

Pantalla 4.8 Clculo de valores absolutos de las diferencias entre marca de clase Pantalla 4.1 O Cuadrado de la diferencia de marcas de clase y media
y media

6. EnAll, escriba desviacin media; en Cll, escriba la frmula +G8/C8, y presio-


ne Enter yaparecer el valor inmediatamente.
En Il escriba f*( X- x )2; en 12 escriba +C2*H2. Vuela a copiar la expresin
Pantalla 4.9 Clculo de la desviacin media desde I2 hasta 17. En IS pulse dos veces el botn Autosuma.

r
,...1'~-------~
1
----------
. 1
Captulo 4 Medidas de dispet~ill- Asimetrfrl y npumamiemo

En A12 escriba varianza; en Cl2, digite +18/(CS-1). Al presionar En ter se obser- Pantalla 4.13 Desviacin estndar
va el valor de la varianza.

Desviacin estndar
Continuando el proceso en Al3, escriba desviacin estndar; en Cl3, escriba
+RAIZ(C12). Al presionar Enter se ve el valor de la desviacin estndar.