Está en la página 1de 35

UNIDAD I ESTADISTICA DESCRIPTIVA

ALGUNAS DEFINICIONES DE ESTADISTICA

1. ESTUDIA LOS METODOS CIENTIFICOS PARA RECOGER, ORGANIZAR, RESUMIR Y

ANALIZAR DATOS, ASI COMO PARA SACAR CONCLUSIONES VALIDAS Y TOMAR


DECIONES RAZONZABLES BASADAS EN EL ANALISIS.
2. CIENCIA DERIVADA DE LAS MATEMATICAS QUE ESTUDIA LOS METODOS
CIENTIFICOS PARA RECOGER, RESUMIR Y ANALIZAR DATOS, ASI COMO PARA
SACAR CONCLUSIONES VALIDAS Y TOMAR DECIONES RAZONABLES BASADAS
EN EL ANALISIS
3. CIENCIA CUYO OBJETO ES RECOLECTAR, CLASIFICAR, DESCRIBIR E
INTERPRETAR DATOS NUMERICOS, YA QUE LOS ORGANIZA Y RESUME
PRESENTANDOLOS EN FORMA GRAFICA Y/0 NUMERICA
4. CIENCIA QUE TIENE POR OBJETO AGRUPAR Y ESTUDIAR METODICAMENTE
DATOS Y HECHOS QUE SE PRESTAN A UNA EVALUACION NUMERICA
5. CIENCIA QUE ESTUDIA CONJUNTO DE DATOS CUANTITATIVOS Y SU
INTERPRETACION EN TERMINOS MATEMATICOS, ESTABLECIENDO METODOS
PARA LA OBTENCION DE LAS MEDIDAS QUE LOS DESCRIBEN, ASI COMO PARA
EL ANALISI DE LAS CONCLUSIONES, CON ESPECIAL REFERENCIA A LA TEORIA
DE LA PROBABILIDAD
6. CIENCIA QUE TRATA DE REUNIR INFORMACION CUANTITATIVA CONCERNIENTE
A INDIVIDUSOS, GRUPOS, SERIE DE HECHOS, ETC., Y DEDUCIR DE ELLAS,
GRACIAS AL ANALISIS DE LOS DATOS, UNOS SIGNIFICADOS PRECISOS O UNAS
PREVISIONES PARA EL FUTURO
7. RAMA DE LAS MATEMATICAS QUE SE OCUPA DE REUNIR, ORGANIZAR Y
ANALIZAR DATOS NUMERICOS Y QUE AYUDA A RESOLVER PROBLEMAS COMO
EL DISEO DE EXPERIMENTOS Y LA TOMA DE DESICIONES

La estadstica es la rama de las matemticas cuyo


objetivo es la obtencin, clasificacin y anlisis de la
informacin relativa a eventos o acontecimientos, a
partir de la cual se puede emitir conclusiones y con
esto tomar decisiones que puedan resolver o
entender dichos eventos

DIVISION DE LA ESTADISTICA PARA SU ESTUDIO

ESTADISTICA

DESCRIPTIVA

ESTADISTICA
CLASICA

INFERENCIAL

ANALISIS
BAYESIANO DE
DESICIONES

ESTADSTICA DESCRIPTIVA

Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto


de datos, obtenindose de esa manera conclusiones sobre las caractersticas de
dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de
compararlas. No obstante puede no solo referirse a la observacin de todos los

elementos de una poblacin (observacin exhaustiva) sino tambin a la descripcin


de los elementos de una muestra (observacin parcial).
En relacin a la estadstica descriptiva, Ernesto Rivas Gonzles dice; Para el
estudio de estas muestras, la estadstica descriptiva nos provee de todos sus
medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrn la
misma exactitud que tienen para la muestra, es decir al estimarse para el universo
vendr dada con cierto margen de error; esto significa que el valor de la medida
calculada para la muestra, en el oscilar dentro de cierto lmite de confianza, que
casi siempre es de un 95 a 99% de los casos
La estadstica descriptiva nos indica cual tal es una situacin, describe e informa lo
que hay de tal modo que permite describir y resumir las observaciones que se
hagan sobre un
asunto, fenmeno o problema de investigacin. Se calcula a partir de los datos de
una
muestra o de una poblacin.
EJEMPLOS:

La clase de Mtodos Estadsticos se rene cinco veces por semana de 20 a 21 horas


en el saln Q3
El Promedio de aprovechamiento obtenidos por los alumnos del segundo semestre
del ITC en el periodo A-D 08 result ser de 81.25
Durante la ltima semana la polica de trnsito inform que han ocurrido un total de
10 accidentes en esta Ciudad de cancn
La encuestadora denominada si tu pagas tu ganas informa al candidato del
partido SPSS que aventaja con 20 puntos a su perseguidor ms cercano
Como puede observarse en cada uno de estos ejemplos, los datos estadsticos
Utilizados solamente describen e indican lo que hay, informando donde, cuando y
cuanto de los hechos u observaciones indicadas. Lo mismo sucede cuando se
realiza una encuesta
poltica donde se nos informa que entrevistaron a 1100 electores y que el candidato
del
Partido Republicano obtuvo la preferencia de un 44% de los encuestados, que un
45% opt
por el candidato del Partido Demcrata y que an se mantiene un 11% indecisos.
Todos
estos datos numricos describen y nos sealan cul es el parecer u opinin de los
electores
encuestados y por tanto estos datos estadsticos se le clasifica como estadstica
descriptiva
de una muestra de electores.

ESTADSTICA INFERENCIAL

La estadstica inferencial es cuando de los datos estadsticos obtenidos de una


muestra se infiere o se deduce una observacin la cul se generaliza sobre la
poblacin en
total. Para determinar la confiabilidad de la inferencia de los datos estadsticos de
una
muestra, se hace necesario comprobar la misma para poder asegurar que lo que se
observa en una muestra se observar tambin en la poblacin. Por lo tanto, esto
requiere
utilizar tcnicas, cmputo y anlisis estadsticos ms avanzados con los datos
estadsticos obtenidos de la muestra para as confirmar la veracidad de las
inferencias
que se haga sobre la respectiva poblacin a que corresponde la muestra.
Generalmente el
anlisis estadstico inferencial se lleva cabo para mostrar relaciones de causa y
efecto, as
como para probar hiptesis y teoras cientficas.
La estadstica inferencial est fundamentada en los resultados obtenidos del
anlisis de una muestra de poblacin, con el fin de inducir o inferir el
comportamiento o caracterstica de la poblacin, de donde procede, por lo que
recibe tambin el nombre de Inferencia estadstica.
Segn Berenson y Levine; Estadstica Inferencial son procedimientos
estadsticos que sirven para deducir o inferir algo acerca de un conjunto de datos
numricos (poblacin), seleccionando un grupo menor de ellos (muestra).
El objetivo de la inferencia en investigacin cientfica y tecnolgica radica en
conocer clases numerosas de objetos, personas o eventos a partir de otras
relativamente pequeas compuestas por los mismos elementos.
En relacin a la estadstica descriptiva y la inferencial, Levin & Rubin (1996)
citan los siguientes ejemplos para ayudar a entender la diferencia entre las dos.
Supngase que un profesor calcula la calificacin promedio de un grupo de
historia. Como la estadstica describe el desempeo del grupo pero no hace ninguna
generalizacin acerca de los diferentes grupos, podemos decir que el profesor est
utilizando estadstica descriptiva. Graficas, tablas y diagramas que muestran los
datos de manera que sea ms fcil su entendimiento son ejemplos de estadstica
descriptiva.
Supngase ahora que el profesor de historia decide utilizar el promedio de
calificaciones obtenidos por uno de sus grupos para estimar la calificacin promedio
de las diez unidades del mismo curso de historia. El proceso de estimacin de tal
promedio sera un problema concerniente a la estadstica inferencial.

Los estadsticos se refieren a esta rama como inferencia estadstica, esta


implica generalizaciones y afirmaciones con respecto a la probabilidad de su
validez.

MAS EJEMPLOS DE ESTADSTICA INFERENCIAL:

Los estudiantes que obtuvieron un IQ de inteligencia sobre 120, probablemente


obtendrn sobre 700 puntos en cada rea de la prueba para ingreso a la
universidad.
Si an hay un 11% de los electores indecisos y si la poblacin electoral es de
cerca de 88 millones electores, quiere decir que an hay cerca de 10 millones de
electores quienes realmente decidirn cul va a ser el candidato ganador.
En estos dos ejemplos se lleva a cabo una deduccin lgica basada en
unos datos
estadsticos de una muestra, pero la inferencia o deduccin que se utiliza
para generalizar una observacin sobre la poblacin requiere de unos
cmputos y anlisis estadsticos que van ms all de los nmeros
obtenidos de la muestra. La deduccin o inferencia debe ser comprobada
para aceptarse como confiable y vlida, por lo tanto, esto requiere un
procedimiento estadstico mucho ms complejo el cul compete a la
estadstica inferencial.
VARIABLES : NUMERICAS (DISCRETAS Y CONTINUAS) Y CATEGORICAS
( ATRIBUTOS)

Las variables usadas en estadstica son de tipo numricas y categricas, las


primeras pueden ser medidas en las escalas convencionales asignndole un nmero
real, en tanto que las segundas solo pueden ser descritas mediante atributos o
categoras (p.e. muy bien, bien, regular; mucho poco, nada; de acuerdo,
parcialmente de acuerdo, en desacuerdo). En este ltimo caso hay la necesidad de
convertir una variable categrica en numrica asignndole para ello una escala de
medida previamente establecida ( p.e. muy bien = 5, bien = 4, regular = 2)
Una variable aleatoria discreta (VAD) solo puede tomar valores en puntos aislados a
lo largo de una escala de medida, por ejemplo el nmero de alumnos matriculados
en el ITC, el nmero de integrantes en una familia, las acciones que cierta empres
tiene cotizando en la bolsa de valores.

Una variable aleatoria continua (VAC) puede suponer un valor en cualquier en un


punto de la escala de medida, por ejemplo el promedio de calificaciones al finalizar
un semestre, el ingreso percapita, el tiempo que tarda una lmpara en fundirse
OBTENCION DE DATOS A TRAVES DE EXPERIMENTOS Y ENCUESTAS
Una manera de obtener datos es a travs de de la observacin directa. Un experimento
estadstico es una forma de observacin directa en la que se controlan algunos o todos los
factores que pueden influir sobre la variable que se estudia, ejemplo pueden compararse
dos mtodos de ensamblar un componente, haciendo que un grupo de empleados utilice
uno de ellos y que un segundo grupo utilice el otro mtodo. Se compara cuidadosamente a
ambos grupos en trminos de edad y experiencia.
En algunas situaciones, no es posible obtener la informacin de manera directa, en estos
casos la informacin se tiene mediante respuestas individuales empleando para tal fin las
entrevistas o cuestionarios. Una encuesta estadstica es el proceso de recopilar datos
pidiendo a las personas que proporcionen informacin. Los datos pueden obtenerse con
mtodos como la entrevista personal, telefnica o a travs de cuestionarios. Por ejemplo:
dada la crisis mundial, la secretara del trabajo est muy al tanto de los niveles de empleo y
desempleo del pas, para conocer estos ndices lo ms apropiado sera efectuar una
encuesta entre las empresas del estado
Algo importante que hay que tomar en cuenta en un estudio estadstico, es que no siempre
se trabaja con todos los datos. Esto por diversas razones, que pueden ser desde prcticas
hasta por economa. Por esta razn se considera un subconjunto del total de los casos,
sujetos u objetos que se estudian y que se les obtienen los datos. La poblacin, entonces,
es el total hipottico de los datos que se estudian o recopilan. Ante la imposibilidad
ocasional de conseguir a la poblacin, entonces se recurre a la muestra, que viene siendo
un subconjunto de los datos de la poblacin, pero tal subconjunto tiene que contener datos
que pueden servir para posteriores generalizaciones de las conclusiones.

Formas de Observar la Poblacin:


Atendiendo a la fuente se clasifican en directa o indirecta.
Observacin directa: es aquella donde se tienen un contacto directo con los
elementos o caracteres en los cuales se presenta el fenmeno que se pretende
investigar, y los resultados obtenidos se consideran datos estadsticos originales.
Para Ernesto Rivas Gonzlez (1997) Investigacin directa, es aquella en que el
investigador observa directamente los casos o individuos en los cuales se produce
el fenmeno, entrando en contacto con ellos; sus resultados se consideran datos
estadsticos originales, por esto se llama tambin a esta investigacin primaria.
Ejemplo; el seguimiento de la poblacin agrcola por ao, llevado en
una determinada granja.

Observacin Indirecta:
es aquella donde la persona que investiga hace uso
de datos estadsticos ya conocidos en una investigacin anterior, o de datos
observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o
fenmenos.
Ejemplo;
si un investigador pretende estudiar la produccin por
aos de una granja avcola, en sus ltimos cinco aos de produccin,
tendra que hacer un seguimiento, a tal fin recurrira a las observaciones
que posee la oficina administrativa de la granja durante estos cinco
aos, o dirigirse a la oficina de estadstica, llevada en el ministerio de
produccin y comercio (M.P.C) de la localidad donde est registrada
dicha granja. Es de notar que el investigador se vale de observaciones
realizadas por terceros.
Atendiendo a la periodicidad, puede ser continua, peridica o circunstancial.
Una observacin continua; como su nombre lo indica es aquella que se lleva
acabo de un modo permanente.
Ejemplo:
la contabilidad comercial, llevada en cuanto a
compras, ventas y otras operaciones que se van registrando a medida
que van producindose.
Una observacin peridica; es aqulla que se lleva a cabo a travs de perodos
de tiempo constantes. Estos perodos de tiempos pueden ser semanas, trimestres,
semestres, aos, etc. Lo que debemos destacar es que los perodos de tiempo
tomados como unidad deben tomarse constantes en los posible.
Ejemplo;
el registro llevado por la Oficinas de Control de
Estudios de la UNESR, en cuanto a la inscripcin de los estudiantes por
semestre.

La observacin circunstancial, es aquella que se efecta en forma ocasional o


espordica, esta observacin hecha ms por una necesidad momentnea, que de
carcter regular o permanente.
Ejemplo;
la obtencin de nmeros de aulas utilizadas y no
utilizadas en los colegios pertenecientes al municipio San Carlos del
Estado Cojedes.
Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta
Observacin Exhaustiva. Cuando la observacin es efectuada sobre la totalidad
de los elementos de la poblacin se habla de una observacin exhaustiva.
Observacin Parcial. Dado que las poblaciones en general son grandes, la
observacin de todos sus elementos se ve imposibilitada. La solucin para superar
este inconveniente es observar una parte de esta poblacin.
Observacin Mixta. En este tipo de observacin se combinan adecuadamente la
observacin exhaustiva con la observacin parcial. Por lo general, este tipo de
observaciones se lleva a cabo de tal manera que los caracteres que se consideran
bsicos se observan exhaustivamente y los otros mediante una muestra; o bien
cuando la poblacin es muy grande, parte de ella se observa parcialmente.

METODOS DE MUESTREO

Muestreo: es el proceso por medio del cual se seleccionan los individuos de una
poblacin para formar una muestra

Las tcnicas de muestreo que se implementan para recabar datos de una


poblacin, dependen fundamentalmente: del tiempo disponible para el
levantamiento de datos, la habilidad para muestrear, y la naturaleza de la
poblacin.

Existen dos mtodos para seleccionar muestras de poblaciones;


el
muestreo no aleatorio o de juicio y el muestreo aleatorio o probabilstico. Una
muestra se dice que es extrada al azar cuando la manera de seleccin es tal, que
cada elemento de la poblacin tiene igual oportunidad de ser elegido. Una muestra
aleatoria es tambin llamada muestra probabilstica y son generalmente preferidas
por los estadsticos porque la seleccin de las muestras es objetiva y el error
muestral puede ser medido en trminos de probabilidad bajo la curva normal, a
las muestras aleatorias se les denomina muestra probabilsticas o cientficas.
Una muestra seleccionada por muestreo de juicio se basa en la experiencia ( juicio
de experto) de alguien con la poblacin. Algunas veces una muestra de juicio se usa
como gua o muestra tentativa para decidir como tomar una muestra aleatoria ms
adelante. Las muestras de juicio evitan el anlisis estadstico necesario para hacer
muestras de probabilidad.
Son cuatro los principales mtodos de muestreo aleatorio: Aleatorio simple,
sistemtico, estratificado y por conglomerados.

MUESTREO ALEATORIO SIMPLE


Una muestra aleatoria simple es seleccionada de tal manera que cada elemento de
la poblacin que la conforma, tiene la misma probabilidad de ser elegido.
Este tipo de muestreo toma solamente una muestra de la poblacin para el
propsito de inferencia estadstica. Puesto que solamente una muestra es tomada,
el tamao de muestra debe ser los suficientemente grande para extraer una
conclusin. Una muestra grande muchas veces cuesta demasiado dinero y tiempo.

MUESTREO
SISTEMATICO
Se
utiliza
cuando
el
universo o poblacin es de
gran tamao, o ha de extenderse en el tiempo. Primero hay que identificar las
unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular
una constante, que se denomina coeficiente de elevacin K= N/n; donde N es el
tamao del universo y n el tamao de la muestra. Determinar en qu fecha se
producir la primera extraccin, para ello hay que elegir al azar un nmero entre 1
y K; de ah en adelante tomar uno de cada K a intervalos regulares. Esto quiere
decir que si tenemos un determinado nmero de personas que es la poblacin y
queremos escoger de esa poblacin un nmero ms pequeo el cual es la muestra,
dividimos el nmero de la poblacin por el nmero de la muestra que queremos
tomar y el resultado de esta operacin ser el intervalo, entonces escogemos un
nmero al azar desde uno hasta el nmero del intervalo, y a partir de este nmero

escogemos los dems siguiendo el orden del intervalo. Ocasionalmente, es


conveniente tener en cuenta la periodicidad del fenmeno.

MUESTREO ESTRATIFICADO
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se
suponen homogneos respecto de la caracterstica a estudiar. En cada uno de estos
estratos se le asignara una cuota que determinar el nmero de miembros del
mismo que compondrn la muestra. Dentro de cada estrato la seleccin se realiza
mediante el muestreo aleatorio simple, o bien otra tcnica que resulte apropiada
para elegir la proporcin de la muestra en cada estrato
Existen dos tcnicas del muestro estratificado

Asignacin proporcional: el tamao de la muestra dentro de cada estrato es


proporcional al tamao del estrato dentro de la poblacin.

Asignacin ptima: la muestra recoger ms individuos de aquellos estratos


que tengan ms variabilidad. Para ello es necesario un conocimiento previo
de la poblacin.

Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. As, si la poblacin est
compuesta de un 55% de mujeres y un 45% de hombres, se tomara una muestra
que contenga tambin esos mismos porcentajes de hombres y mujeres, es decir,
suponiendo que el tamao de la muestra sea de 100 individuos, entonces el
nmero de mujeres seleccionadas es de 55 (0.55 X 100 = 55) y 45 hombres (0.45 X
100). La muestra incluye 55 mujeres y 45 hombres, a esto se le denominan
asignacin proporcional:

MUESTREO POR CONGLOMERADOS


Se utiliza cuando la poblacin se encuentra dividida de manera natural, en grupos
que se supone que contienen toda la variabilidad de la poblacin, es decir, la
representan fielmente respecto a la caracterstica a elegir, pueden seleccionarse
slo algunos de estos grupos o conglomerados para la realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por
ejemplo, las personas a encuestar, y podra aplicrsele el instrumento de medicin
a todas las unidades, es decir, los miembros del grupo, o slo se le podra aplicar a

algunos de ellos, seleccionados al azar. Este mtodo tiene la ventaja de simplificar


la recogida de informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos
para integrar la muestra, el diseo se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer
mtodo funciona mejor cuanto ms homognea es la poblacin respecto del
estrato, aunque ms diferentes son stos entre s. En el segundo, ocurre lo
contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben
ser muy parecidos entre s.

Es sumamente importante considerar que en todos los casos, el objetivo


fundamental de la tcnica de muestreo empleada permita extraer una muestra
representativa de la poblacin, es decir, que tenga iguales caractersticas y
composicin que la poblacin documental de la que procede.

Ventajas e inconvenientes de los distintos tipos de muestreo probabilstico

CARACTERISTICAS

VENTAJAS

INCONVENIENTES

Aleatorio simple

Sistemtico

Se selecciona una muestra de tamao n de una


poblacin de N unidades, cada elemento tiene
una probabilidad de inclusin igual y conocida de
n/N.

Conseguir un listado de los N elementos de la


poblacin
Determinar tamao muestral n.
Definir un intervalo k=N/n.
Elegir un nmero aleatorio, r, entre 1 y k
(r=arranque aleatorio).
Seleccionar los elementos de la lista.

Estratificado

Conglomerados

En ciertas ocasiones resultar conveniente


estratificar la muestra segn ciertas variables de
inters. Para ello debemos conocer la
composicin estratificada de la poblacin objetivo
a muestrear. Una vez calculado el tamao
muestral apropiado, este se reparte de manera
proporcional entre los distintos estratos definidos
en la poblacin usando una simple regla de tres.

Se realizan varias fases de muestreo


sucesivas (polietpico)
La necesidad de listados de las unidades de
una etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior.

Sencillo y de fcil comprensin.


Clculo rpido de medias y varianzas.
Se basa en la teora estadstica, y por
tanto existen paquetes informticos para
analizar los datos

Fcil de aplicar.
No siempre es necesario tener un
listado de toda la poblacin.
Cuando la poblacin est ordenada
siguiendo una tendencia conocida,
asegura una cobertura de unidades de
todos los tipos.
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacin en funcin de unas variables
seleccionadas.
Se obtienen estimaciones ms precisa

Requiere que se posea de


antemano un listado completo de
toda la poblacin.
Cuando se trabaja con muestras
pequeas es posible que no
represente a la poblacin
adecuadamente.
Si la constante de muestreo est
asociada con el fenmeno de
inters, las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccin

Se ha de conocer la distribucin en
la poblacin de las variables
utilizadas para la estratificacin.

Su objetivo es conseguir una muestra lo


mas semejante posible a la poblacin en
lo que a la o las variables
estratificadoras se refiere.
Es muy eficiente cuando la poblacin es
muy grande y dispersa.
No es preciso tener un listado de toda la
poblacin, slo de las unidades
primarias de muestreo.

El error estndar es mayor que en


el muestreo aleatorio simple o
estratificado.
El clculo del error estndar es
complejo.

El muestro, implica algo de incertidumbre que debe ser aceptada para poder
realizar el trabajo, pues aparte de que estudiar una poblacin resulta ser un trabajo
en ocasiones demasiado grande, existen otras razones extras:

Recursos limitados. Es decir, no existen los recursos humanos, materiales o econmicos


para realizar el estudio sobre el total de la poblacin. Es como cuando se compra un aparato,
un automvil usado (por ejemplo), que se prueba unos minutos (el encendido, una carrerita,
etc.) para ver si funciona correctamente y luego se adquiere, pero no se espera a probarlo
toda la vida (encendindolo y apagndolo o, simplemente, dejndolo encendida) antes de
realizar la adquisicin.

Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el estudio
paleontolgico de los dinosaurios (el T. Rex por ejemplo) sera muy bueno contar con, al

menos, muchos restos fsiles y as realizar tales investigaciones; sin embargo, se cuenta slo
con una docena de esqueletos fosilizados (casi todos incompletos) de esas criaturas en todo
el mundo.

Pruebas destructivas. Es el caso en el que realizar el estudio sobre toda la poblacin


llevara a la destruccin misma de la poblacin. Por ejemplo, si se quisiese saber el conteo
exacto de hemoglobina de una persona habra que extraerle toda la sangre.

El muestreo puede ser ms exacto. Esto es en el caso en el que el estudio sobre la


poblacin total puede causar errores por su tamao o, en el caso de los censos, que sea
necesario utilizar personal no lo suficientemente capacitado; mientras que, por otro lado, el
estudio sobre una muestra podra ser realizada con menos personal pero ms capacitado.

El tamao de la muestra depende de la precisin con que el investigador desea llevar a


cabo su estudio, pero por regla general se debe usar una muestra tan grande como sea posible de
acuerdo a los recursos que haya disponibles. Entre ms grande la muestra mayor posibilidad de ser
ms representativa de la poblacin. (Vase la tabla adjunta sobre las recomendaciones para el
tamao de la muestra.) En la investigacin experimental, por su naturaleza y por la necesidad de
tener control sobre las variables, se recomienda muestras pequeas que suelen ser de por lo menos
30 sujetos. En la investigacin descriptiva se emplean muestras grandes y algunas veces se
recomienda seleccionar de un 10 a un 20 por ciento de la poblacin accesible.

INFORMACIN PARA DETERMINAR EL TAMAO DE LA MUESTRA


CORRESPONDIENTE A UNA POBLACIN ESPECFICA:
N: Tamao de la poblacin, M: Tamao de la muestra
NM

N M

10 10 220 140 1200 291


15 14 250 144 1300 297
20 19 240 148 1400 297
25 24 250 152 1500 306
30 28 260 155 1600 310
35 32 270 159 1700 313
40 36 280 162 1800 317
45 40 290 165 1900 320
50 44 300 169 2000 322
55 48 320 175 2200 327
60 52 340 181 2400 381
65 56 360 186 2600 355
70 59 380 191 2800 338
75 63 400 196 3000 341
80 86 420 201 3500 346
85 70 440 205 4000 351
90 73 460 210 4500 354
95 76 480 214 5000 357
100 80 500 217 6000 361

110 86 550 226 7000 364


120 92 600 234 8000 367
130 97 650 242 9000 368
140 103 700 248 10000 370
150 108 750 254 15000 375
160 113 800 260 20000 377
170 118 850 265 30000 379
180 123 900 269 40000 380
190 127 950 274 50000 381
200 132 1000 278 75000 382
210 136 1100 285 1000000 384
Fuente: Cornett, J.D. y Beckner, W., Introductory Statistics for the Behavioral Sciences,

PRESENTACIONES ESTADISTICAS (TABLAS Y GRAFICAS)


C

Lmites
nominales

Lmites reales

Marca de clase
MC

Frecuencia
f

Frecuencia
relativa fr

Frec rel acum


fra

Cuando se trabaja con distribuciones de frecuencias uno de los problemas es la


determinacin del nmero apropiado de clases. Aunque no existe una regla precisa
para el nmero de clases, generalmente tratamos de no tener ni muchas ni muy
pocas en la distribucin de frecuencias. El uso de
Demasiadas clases tiende a producir irregularidades en las frecuencias de las clases
y obscurece la concentracin de valores. Por el contrario, si usamos un numero
excesivamente pequeo de clases, estas tienden a resumir y cierta informacin
valiosa se pierde en el
En general, se desea que el nmero de clases (k) este comprendido entre 5-20.
Algunas reglas que ayudan a conocer el valor de k ms apropiado son las
siguientes:
Regla de Sturges:
K = 1 + 3,3 log n
K= nmero de clases,
n= nmero total de observaciones de la muestra,
log= logaritmo comn base 10.
En aquellos casos donde n <100, entonces K =

k = n

PROCEDIMIENTO PARA CONSTRUIR UNA TABLA DE DISTRIBUCION DE


FRECUENCIAS
1.

Calcular el rango R = Vmayor - Vmenor

2.

Calcular el nmero de clases K

3.

Determinar la amplitud del intervalo de clase IC =

4.

Construir la tabla

R
k

EJEMPLO
En la tabla de abajo se resume el tiempo en minutos que requieren 40
empleados para terminar una labor tpica de ensamblaje y que han solicitado una
transferencia promocional a otro puesto que requiere ensamblaje de precisin. A
partir de estos datos construya una tabla de distribucin de frecuencias donde se
pueda analizar este evento.

10

14

15

13

17

16

12

14

11

13

15

18

14

14

15

11

13

11

12

10

17

16

12

10

18

12

16

17

11

16

12

14

15

13

12

15

14

17

SOLUCIN

REPRESENTACIONES GRAFICAS

EJEMPLO 2
Los datos que se describen en la tabla de abajo, indican la vida til de 40 bateras para
automvil expresada su duracin en aos. Con esta informacin construir una tabla de
distribucin de frecuencias y posteriormente explique mediante un resumen la
interpretacin que usted hace de la tabla elaborada

DESCRIPCION DE DATOS: MEDIDAS DE POSICION Y MEDIDADES DE VARIABILIDAD


MEDIDADES DE POSICION EN CONJUNTO DE DATOS NO AGRUPADOS

Una medida de posicin es un valor que se calcula para un grupo de datos y que se
utilizan para describirlos de alguna manera. Normalmente se desea que el valor sea
representativo de todos los valores incluidos en el grupo y, por ello, se desea alguna
clase de promedio. En sentido estadstico, un promedio es una medida de
tendencia central para un conjunto de valores
LA MEDIA ARITMTICA

La medida aritmtica, o promedio aritmtico, se define como la divisin de la suma


de todos los valores entre el nmero de valores.
X=

X
n

LA MEDIA PONDERADA

La medida ponderada o promedio ponderado es una medida aritmtica, en la cual


se considera a cada uno de los valores de acuerdo con su importancia en el grupo.
Las formulas para la media ponderada maestral y poblacional son idnticas
p o X p=

( pX )
p

En trminos de operaciones, cada uno de los valores del grupo (X) se multiplica por
el factor de ponderacin apropiado (p) y despus se suma estos productos y la
suma se divide entre los pesos (o ponderaciones)
LA MEDIANA

La mediana de un grupo de datos es el valor del dato que ocupa un lugar cuando
se les agrupa a todos en un orden ascendente o descendente. Para un grupo con un
nmero par de elementos, se supone que la mediana se encuentra a la mitad entre
los dos valores adyacentes al centro. Cuando el conjunto de datos contiene un
nmero grande de valores, resulta til la siguiente frmula para determinar la
posicin de la mediana en el conjunto ordenado
Med= X [ ( n/ 2) +(1 /2 )]
LA MODA

La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos.


A una distribucin que tiene una sola moda se le denomina unimodal. Para un
conjunto de datos pocos numerosos, en los que no se repite ningn valor, no existe
moda. Cuando dos valores no adyacentes tiene frecuencias mximas similares, se
dice que la distribucin es bimodal. A las distribuciones de mediciones que tienen
varias modas se les denomina multimodales.

CUARTILES DECILES Y PERCENTILLES

Los cuartiles, deciles y percentiles son muy parecidos a la mediana porque tambin
subdividen una distribucin de mediciones de acuerdo con la proporcin de
frecuencias observadas. Mientras que la mediana divide a la distribucin en dos
mitades, los cuartiles la dividen en cuartos, los deciles en diez dcimos y los puntos
percentiles la dividen en cien partes. La frmula de la mediana, modificada de
acuerdo con el punto fraccionario de inters es, por ejemplo.
Q2 (segundo cuartil)=X

2n 1
+
4 2

D3 (tercer decil)=X

3n 1
+
10 2

P4 ( cuarto percentil)= X

]
[

4n 1
+
100 2

MEDIDADES DE VARIABILIDAD PARA CONJUNTO DE DATOS NO AGRUPADOS

Las medidas de tendencia


central descritas anteriormente, son tiles para
identificar el valor tpico en un conjunto de datos. En contraste las medidas de
variabilidad se ocupan de describir la variabilidad entre los valores. Existen diversas
tcnicas para medir la magnitud de la variabilidad en conjunto de datos: Rango,
rango modificado, desviacin media, varianza, desviacin estndar y coeficiente de
variacin.

EL RANGO

El rango representado por R es la diferencia entre los valores mayor y menor del
conjunto de datos
R=V y V n

RANGOS MODIFICADOS

Un rango modificado es aquel para el cual se elimina cierto porcentaje de los


valores en cada uno de los extremos de la distribucin. Algunos rangos modificados
tpicos son: 50% central, 80% central y 90% central. El procedimiento mediante el
cual se determina un rango modificado consiste, primero, en ubicar los dos puntos
percentiles adecuados, para despus, calcular la diferencia entre los valores que se
encuentran en esos puntos. Por ejemplo, para el rango del 80% central, los puntos
percentiles apropiados son el dcimo y el nonagsimo percentil, porque el 80%
central de esos valores se ubica entre esos dos puntos.

R 50 central=P75P25

X
No.

R 80 central=P90P 10
R 90 central=P95 P 5

| X i X |

DM= i=1

|X X |

10

10

10

11

11

11

11

10

12

11

12

12

12

13

12

14

12

15

12

16

13

17

13

18

13

19

13

20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

14
14
14
14
14
14
15
15
15
15
15
16
16
16
16

DESVIACION MEDIA

La desviacin media se
entre el valor absoluto
elementos del conjunto
grupo.
Despus
se
esas desviaciones. Si
calculara por la suma
positivas y negativas
media aritmtica, la
siempre igual a cero.
valores absolutos de
se suman.

X-

4.575
4.575
3.575
3.575
3.575
2.575
2.575
2.575
2.575
1.575
1.575
1.575
1.575
1.575
1.575
0.575
0.575
0.575
0.575
0.425
0.425
0.425
0.425
0.425
0.425
1.425
1.425
1.425
1.425
1.425
2.425
2.425
2.425
2.425

4.575
4.575
3.575
3.575
3.575
2.575
2.575
2.575
2.575
1.575
1.575
1.575
1.575
1.575
1.575
0.575
0.575
0.575
0.575
0.425
0.425
0.425
0.425
0.425
0.425
1.425
1.425
1.425
1.425
1.425
2.425
2.425
2.425
2.425

basa en las diferencias


de cada uno de los
de datos y la media del
calcula la media de
esta
media
se
de
las
diferencias
entre cada valor y la
respuesta
sera,
Por esta razn son los
las diferencias los que

DM=

83.85
=2.09
40

VARIANZA Y DESVIACION ESTANDAR

La varianza es similar a la desviacin media porque se basa en las diferencias entre


cada uno de los valores del conjunto de datos y la media del grupo. La diferencia
consiste en que, antes de sumarlas, se eleva al cuadrado cada una de las
diferencias.
A diferencia de otras estadsticas muestrales que se han utilizado, la varianza de
una muestra no es, en trminos de clculo, completamente equivalente a la

X
No.

varianza
de
la
caso, el denominador
varianza muestral es
En esencia, lo que se
es
un
factor
de
varianza muestral sea
insesgado
para
la
poblacin. Su frmula

X
n

( i X )2
i=1

n1
S 2=

X-

(X X )2

-4.575

-4.575

10

-3.575

10

-3.575

10

-3.575

6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

11
11
11
11
12
12
12
12
12
12
13
13
13
13
14
14
14
14
14
14
15
15
15
15
15
16
16
16
16
17

-2.575
-2.575
-2.575
-2.575
-1.575
-1.575
-1.575
-1.575
-1.575
-1.575
-0.575
-0.575
-0.575
-0.575
0.425
0.425
0.425
0.425
0.425
0.425
1.425
1.425
1.425
1.425
1.425
2.425
2.425
2.425
2.425
3.425

36

17

3.425

37

17

3.425

38

17

3.425

39

18

4.425

40

18

4.425

20.93062
5
20.93062
5
12.78062
5
12.78062
5
12.78062
5
6.630625
6.630625
6.630625
6.630625
2.480625
2.480625
2.480625
2.480625
2.480625
2.480625
0.330625
0.330625
0.330625
0.330625
0.180625
0.180625
0.180625
0.180625
0.180625
0.180625
2.030625
2.030625
2.030625
2.030625
2.030625
5.880625
5.880625
5.880625
5.880625
11.73062
5
11.73062
5
11.73062
5
11.73062
5
19.58062
5
19.58062
5
243.775

poblacin. Para este


de la frmula de la
ligeramente diferente.
incluye en la frmula
correccin, para que la
un
estimador
varianza
de
la
es:

S 2=

243.775 243.775
=
=6.25t 2
401
39

Por lo general resulta complicado, interpretar el significado de la varianza porque


las unidades en las que se expresa son cuadrticas. Por esta razn se emplea la raz
cuadrada de la varianza, a este nuevo valor se le denomina desviacin estndar.
Esta dada por
X
n

( i X )2
i=1

n1
S=

243.775
= 6.25=2.5
39
243.775
=
401
S=

CLCULOS ABREVIADOS DE LA VARIANZA Y LA DESVIACION ESTNDAR

La frmula para calcular S requiere que en cada caso, se determinen las


desviaciones de los valores individuales con respecto a la media grupal. Existen
formas alternativas que son matemticamente equivalentes, pero que no requieren
del clculo de cada una de las desviaciones. Debido a que por lo general, es ms
fcil utilizar estas frmulas para realizar clculos, se les denomina frmulas
abreviadas.

Varianza

X 2n X 2

S 2= i=1

Desviacin estndar

n1

S=

X 2n X 2
i=1

n1

No.

X2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

9
9
10
10
10
11
11
11
11
12
12
12
12
12
12
13
13
13
13
14
14
14
14
14
14
15
15
15
15
15
16
16
16
16
17
17

81
81
100
100
100
121
121
121
121
144
144
144
144
144
144
169
169
169
169
196
196
196
196
196
196
225
225
225
225
225
256
256
256
256
289
289

La media aritmtica del conjunto de datos


n

es

X =

Xi

543
=13.57
X =
40

i =1

n X 2

= 40(13.75)2 = 40(184.28) =
76157321.20
2
S
=
7321.20
Varianza
401
Y

S 2=

243.80
=6.25 t 2
39

Desviacin estndar
S=

76157321.20
401

S= 6.25 t 2=2.5

37
38
39
40

17
17
18
18
543

289
289
324
324
7615

MEDIDADES DE POSICION EN CONJUNTO DE DATOS AGRUPADOS


LA MEDIA ARTMETICA

Cuando se agrupan datos en una distribucin de frecuencias, se utiliza el punto


medio de cada clase como aproximacin de todos los valores contenidos en ella y
se determina mediante la siguiente expresin
n

f xi

x = i=1n

f
i=1

LA MEDIANA

Para datos agrupados, en primer lugar es necesario determinar la clase que


contiene el valor de la mediana, para despus determinar la posicin de la mediana
dentro de la clase mediante interpolacin. La clase que contiene la mediana es la
primera cuya frecuencia cumulada iguala o excede la mitad del total de las
observaciones. Una vez que se identifica esta clase, se determina el valor especifico
de la mediana mediante la siguiente formula.

[ ]

n
fa A
2
Med=L I +
i
fc
Donde:
LI

= Limite exacto inferior de la clase que contiene a la mediana

n = Nmero total de observaciones


faA = Frecuencia acumulada de la clase que precede a la clase que contiene a la
mediana
fc = Frecuencia de la clase que contiene a la mediana
i = tamao del intervalo de clase

LA MODA

Para datos agrupados, primero se identifica la clase que contiene la moda


determinando cul de ellas tiene el mayor nmero de observaciones.
Posteriormente se interpola dentro de la clase modal de acuerdo con la siguiente
frmula

Moda=LI +

d1
i
d1 +d 2

Donde:
d1

= Diferencia entre la frecuencia de clase modal y la frecuencia de la clase

precedente
d1

= Diferencia entre la frecuencia de clase modal y la frecuencia de la clase

siguiente

CUARTILES, DECILES Y PERCENTILES

Para datos agrupados, la frmula de la mediana se modifica de acuerdo con el


punto fraccionario de inters. Al utilizar esta frmula modificada, en primer lugar se
determina la clase que contiene el punto de inters, de acuerdo con la frecuencia
cumulada, y despus se lleva a cabo la interpolacin.

[ ]

n
fa A
4
Q1=LI +
i
fc

[ ]

3n
fa A
10
D3=L I +
i
fc

70 n
fa A
100
P70=LI +
i
fc

LA VARIANZA Y LA DESVIACIN ESTNDAR PARA DATOS AGRUPADOS


Para datos agrupados en una distribucin de frecuencias, se asume que el punto medio de
cada clase representa a todas las mediciones incluidas en esa clase. Este es el mismo
enfoque que se utilizo al calcular la desviacin media en la seccin 4.11. por ello, las
fortunas para datos de muestras y de poblaciones agrupados, son:

Varianza muestral:

X X
f

s 2=

Desviacin estndar muestral:

X X
f

s=

RELACION ENTRE LA MEDIA, MEDIANA Y MODA

Las diferencias entre los valores de la media, la mediana y la moda permiten saber
la forma de la curva de frecuencias en trminos de asimetra. Para una distribucin
unimodal asimtrica, el valor de la media, la mediana y la moda son iguales. Para
una distribucin asimtrica positiva, la media es el mayor valor de los tres y la
mediana es mayor que la moda pero menor que la media. Para una distribucin
asimtrica negativa, la media es el menor valor de los tres y la mediana es inferior
a la moda pero mayor que la media. El coeficiente de asimetra de Pearson, es una
medida conocida de asimetra que utiliza la diferencia observada entre la media y la
mediana de un grupo de valores.

MEDIA, MEDIANA Y

MEDIAN
A
MOD
A

MEDIAN
A
MEDI
A

MEDI
A

MOD
A

COMENTARIO: a media aritmtica es la medida de tendencia central ms comn y


tiene la ventaja que se entiende y se calcula con mucha facilidad a partir de datos
agrupados y datos no agrupados y se presta para manipulaciones e
interpretaciones algebraicas posteriores. Desafortunadamente, la media aritmtica
est afectada por los valores extremos o atpicos y a diferencia de la mediana,
puede experimentar desviaciones drsticas a causa de las observaciones muy por
encima o por debajo de ella.
Por ejemplo la media aritmtica y la mediana de los datos 30, 40, 50, 60 y 70, es 50
y representa una medida excelente del punto central de los datos. Si el ultimo dato
envs e 70 fuera 700, la media aritmtica se convertira en 180, mientras tanto la
mediana seguira siendo 50. Como la mediana no es afectada por este valor
extremo, refleja con mayor credibilidad el centro verdadero del conjunto de datos.
Al igual que la mediana la moda es menos afectada por unas cuantas observaciones
atpicas. Si tuviramos 30, 40, 50, 50 y70, la moda seguira siendo 50 aunque el
ltimo valor fuera 700. Pero si no hay moda o si el conjunto de datos es multimodal,
su utilizacin puede causar confusin. Es de vital importancia utilizar
adecuadamente las medidas de tendencia central en la toma de decisiones.

COEFICIENTE DE ASIMETRA DE PEARSON


El coeficiente de asimetra de Pearson mide la desviacin de la simetra, expresando
la diferencia entre la media y la mediana con respecto a la desviacin estndar del
grupo de mediciones. Las formulas son:

asimetria poblacional=

3 ( Med )

asimetria de lamuestra=

)
3 ( XMed
s

Para una distribucin simtrica, el valor del coeficiente de asimetra es siempre 0,


porque la media y la mediana son iguales. Para una distribucin con asimetra
positiva, la media es siempre mayor que la mediana y, por ello, el valor del
coeficiente es positivo. Para una distribucin con asimetra negativa, la media es
siempre menor que la mediana y, por ello, el valor del coeficiente es negativo.

USO DE LA DESVIACION ESTNDAR

La desviacin estndar es la medida de dispersin ms importante, ya que se le


utiliza junto con varios de los mtodos de inferencia estadstica para el anlisis de
datos. El concepto de desviacin estndar implica que la dispersin de un conjunto
de datos es pequea si los valores se acumulan estrechamente alrededor de su
media y es amplia si los valores se acumulan en forma esparcida de su media. De
modo correspondiente se puede argumentar que si la S de un conjunto de datos es
pequea, entonces los valores se concentran cerca de la media y si S es amplia, los
valores se acumulan en forma esparcida alrededor de la media. Esta idea se
expresa ms formalmente por medio del teorema de de Chebyshev por el
matemtico ruso P.L Chebyshev (1821 1894)
Para cualquier conjunto de datos (de una poblacin o muestra) y cualquier
constante k mayor que 1, el porcentaje de datos que debe caer dentro de k
desviaciones estndar de cualquier lado de la media es de por lo menos

As, podemos estar seguros de que, como mnimo,

1 3
= ,
2
2 4

1
2
k

o 75% de los

valores de cualquier conjunto de datos deben caer dentro de las dos desviaciones
estndar de cualquier lado de la media; por lo menos

1 8
= ,
32 9 o 88.9% debe caer

dentro de las tres desviaciones estndar de cualquier lado de la media; y que como
mnimo

1 24
= ,
52 25

o 96% debe caer dentro de las cinco desviaciones estndar de

cualquier lado de la medida. Aqu, arbitrariamente establecemos que

k =2,3 y 5

Figura ilustrativa

Ejemplo: si todas las latas de una libra de caf llenadas por un procesador de
alimentos tienen un peso medio de 16.00 onzas con una desviacin estndar de
0.02 onzas, qu porcentaje de las latas, como mnimo, deben contener entre
15.80 y 16.20 onzas de caf?
Solucin: ya que

desviaciones estndar o

k (0.02) equivale a

16.20 16 = 16.00 15.80 = 0.20


Tenemos que
se
1

k ( 0.02 )=0.20 y k =
deriva

0.20
=10. De acuerdo con el teorema de Chebyshev,
0.02
que

por

lo

menos

1
=0.99, o 99 de las latas debe contener entre 15.80 y 16.20 onzas de cafe
102

El teorema de Chebyshev se aplica a cualquier tipo de datos, pero solo nos indica
por lo menos que porcentaje debe caer entre ciertos lmites. Para casi todos los
datos, el porcentaje real de los datos que cae entre los limites es bastante mayor
que el que esperamos del teorema de Chebyshev
Para las distribuciones que tienen la forma general de la seccin de corte
de una campana (vase la figura 4.1), podemos hacer la siguiente
aseveracin que es que mucho ms que un firme:

(1)

Alrededor del 68% de los valores caern dentro de una


desviacin estndar de la media, esto es, x s y x + s ;

(2)

Aproximadamente 95% de los valores caern dentro de dos


desviaciones estndar de la media, es decir que x 2 s y x + 2 s ;

(3)

Alrededor del 99.7% de los valores caern dentro de tres


desviaciones estndar de la media, esto es, entre x 3 s y x +3 s .
En ocasiones, nos referimos a este resultado como la regla emprica,
supuestamente porque esos porcentajes se observan en la prctica. En
realidad, se trata de un resultado terico basado en la distribucin normal, la
cual estudiaremos en el captulo 9 (en particular, vase el ejercicio 9.12 de la
pagina 224)

68%

UNA DESVIACION
ESTANDAR DE LA
MEDIA

95%

UNA DESVIACION
ESTANDAR DE LA
MEDIA

TRES DESVIACIONES
ESTANDAR DE LA
MEDIA

99.7%
X

Ejemplo: use los valores de

x y s

que se dan en la impresin por

computadora de la figura 3.4 para determinar que porcentaje de los datos de


la emisin de oxidos de azufre de la pagina 22 en realidad cae dentro de una
desviacin estndar de la media, dentro de dos desviaciones estndar de la
media y dentro de tres desviaciones estndar de la media
Solucin:

puesto

que

x =18.896 y s=5.6565,

primero

tendremos

que

determinar el porcentaje de los datos que cae entre


18.896 5.6565 = 13.2395 y

18.896 + 5.6565 = 24.5525

Contamos 14 valores menores que 13.2395 y 14 valores mayores que


24.5525, encontramos que 80 28 = 52 valores y por tanto,

52
80 . 100% =

65% de los datos cae entre los dos limites. De modo similar, encontramos que
78
.100 =97.5
80
media y que

de los datos cae dentro de dos desviaciones estndar de la


80
.100 =100
80

de los datos cae dentro de tres desviaciones

estndar de la media.

COEFICIENTE DE VARIACION
El coeficiente de variacin, CV, indica la magnitud relativa de la deviastacin estndar con
respecto a la media de la distribucin, as, las formulas son:

As
Poblacin:

Muestra:

CV =

CV =

s
X

El coeficiente de variacin es til cuando se desea comparar la variabilidad de 2 conjuntos


de datos con respecto al nivel general de los valores de cada conjunto (y, por ello, respecto
a la media)

Un problema que plantea, tanto la varianza como la desviacin estndar,


especialmente a efectos de comparaciones entre distribuciones, es el de la
dependencia respecto a las unidades de medida de la variable. Cuando se quiere
comparar el grado de dispersin de dos distribuciones que no vienen dadas en las
mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente
de Variacin de Pearson", del que se demuestra que nos da un nmero
independiente de las unidades de medidas empleadas, por lo que entre dos
distribuciones dadas diremos que posee menor dispersin aquella cuyo coeficiente
de variacin sea menor
C.V. representa el nmero de veces que la desviacin estndar contiene a la media
aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la
representatividad de la media.

EJEMPLO 8. Para 2 acciones comunes de empresas de la industria electrnica, el precio


promedio de cierre en el mercado de valores durante un mes fue, para la accin A, de
$1500, con desviacin estndar de $500. Para la accin B, el precio promedio fue de
$5000, con desviacin estndar de $300. Haciendo una comparacin absoluta, resulto ser
superior la variabilidad en el precio de la accin A debido a que muestra una mayor
desviacin estndar. Pero, con respecto al nivel de precios, deben compararse los
respectivos coeficientes de variacin:

500
300
CV ( A ) = =
=0.033 y CV ( B )=
=0.060
1500
5000
Por ello, puede concluirse que el precio de la accin B ha sido casi 2 veces ms variable de
la accin A (con respecto al precio promedio para cada una de las dos)

Se desea comparar el peso y talla de de un grupo de personas para determinar en donde


existe mayor variabilidad: el peso medio del grupo es de 70 kg. con una S de 10.5 kg.; la
talla media es de 166.5 cm con una S de 15 cm.

CV(peso) = 10.5/70 = 0.15, es decir el peso presenta un 15% de variabilidad o dispersin


CV(Talla) = 15/166.5 = 0.09, es decir la talla presenta un 9% de variabilidad o dispersin
Conclusin: la talla respecto del peso es ms estable, no tan cambiante, o sea, tiene menor
variabilidad .