Está en la página 1de 54

INTRODUCCIN A LA ESTADSTICA

1. Poblaciones. Variables aleatorias.


2. Muestras. Datos estadsticos. Estadstica Descriptiva. Inferencia
Estadstica.
3. Tablas de frecuencias:

Variables unidimensionales.

4. Histogramas.
5. Parmetros de posicin:

Medias

Mediana

Moda

6. Parmetros de dispersin:

Recorrido.

Varianza.

Desviacin Tpica.

7. Parmetros de asimetra y de curtosis.

Universidad Tecnolgica de Chile - INACAP


Profesor: Alejandro Pieiro Caro.
Semestre Otoo Invierno
2009

Temas:
Estadstica
Introduccin
Qu significa estadstica?
Por qu usted necesita conocer estadstica?
Algunas aplicaciones de la estadstica
Los computadores, la calculadora y la estadstica.
Trminos comnmente usados en estadstica
Estadstica descriptiva e inferencial
Organizacin de datos
Organizacin de datos de acuerdo al tipo
Organizacin de datos de acuerdo a escalas de
medidas
Organizacin de datos mediante tablas
Organizacin de datos mediante representaciones
grficas
Anlisis de datos en tablas de frecuencias no
agrupadas
Medidas de tendencia central o de centralizacin
Medidas de colocacin o de posicin relativa
Medidas de dispersin o de variabilidad
Medidas de formas
Ejercicios (Soluciones Incluidas).-

Ing. Lc. Cs: Alejandro Pieiro Caro

1.1 Introduccin
1.1.1

Qu significa estadstica?

En la vida diaria los diversos fenmenos de orden econmico, social,


poltico, educacional, e incluso biolgico, aparecen, se transforman y
finalmente desaparecen. Para tan abundante y complejo material es
preciso tener un registro ordenado y continuo a fin de conseguir en un
momento dado los datos necesarios para un estudio de lo que ha
sucedido, sucede o puede suceder. Para ello se requiere contar con un
mtodo, con un conjunto de reglas o principios, que nos permita la
observacin, el ordenamiento, la cuantificacin y el anlisis de dichos
fenmenos. En general, el termin estadstica tiene tres acepciones
gramaticales perfectamente definidas:
1. Estadstica, en su acepcin ms comn, no es ms que una coleccin
de datos numricos ordenados y clasificados segn un determinado
criterio. Nos referimos a este significado cuando hablamos de
estadsticas de produccin, estadsticas de cotizaciones burstiles,
estadsticas demogrficas, etc.
2. Estadstica, en una segunda acepcin, es la ciencia que, utilizando
como instrumento a las matemticas y al calcul de probabilidades,
estudia las leyes de comportamiento de aquellos fenmenos que, no
estando sometidos a las leyes fsicas y basndose en ellas predice e
infiere resultados. El termin estadstica matemtica viene a ser el
nombre propio de esta acepcin.
3. Finalmente, estadstica, significa en su ltima acepcin, la tcnica o
mtodo cientfico usado para recolectar, organizar, resumir, presentar,
analizar, interpretar, generalizar y contrastar los resultados de las
observaciones de los fenmenos reales.
Se considera fundador de la estadstica a Godofredo Achenwall (17191772;53), profesor y economista alemn quien, siendo profesor de la
universidad de Leipzig (Alemania), escribi sobre el descubrimiento de
una nueva ciencia que llamo estadstica (palabra derivada del termin
alemn Staat que significa estado) y que defini como el

Ing. Lc. Cs: Alejandro Pieiro Caro

conocimiento profundo de la situacin respectiva y comparativa de cada


estado. Achenwall y sus seguidores estructuraron los mtodos
estadsticos que se orientaron a investigar, medir y comparar las
riquezas de las naciones. Lo anterior no significa que, antes de los
estudios de G. Achenwall, los estados no hubiesen efectuado inventarios
de sus riquezas. Estos inventarios se efectuaron desde la antigedad. Se
sabe que 2.000 a 2.500 aos antes de Cristo, los inventarios que
efectuaron los chinos y los egipcios eran muy elementales.

1.1.2 Por qu usted necesita conocer estadstica?

En general, el problema que enfrentan las compaas e industrias no es


la escasez de informacin, sino como utilizar la informacin disponible
para tomar las decisiones mas adecuadas. Por esta razn, desde la
perspectiva de una toma de decisiones informada, cabe preguntarse por
qu un ingeniero, un administrador y un economista necesita saber
Estadstica. Para dar respuesta a esta inquietud podemos decir que
estos deben comprender la estadstica, bsicamente, por tres razones
fundamentales:
1. Presentar y describir la informacin en forma adecuada.
2. Inferir conclusiones sobre poblaciones grandes basndose solamente
en la informacin obtenida de subconjuntos de ellas.
3. Utilizar modelos para obtener pronsticos confiables.

1.1.3 Algunas aplicaciones de la estadstica

En esta seccin presentaremos ejemplos que ilustran algunas de las


aplicaciones de la estadstica en la ingeniera, en la administracin y en
la economa.
Ingeniera
La importancia de la estadstica en la ingeniera ha sido subrayada por la
participacin de la industria en el aumento de la calidad. Muchas
empresas se han dado cuenta de que la baja calidad de un producto (ya
sea en la forma de defectos de fabricacin, en una baja confiabilidad en
su rendimiento, o en ambos), tiene un efecto muy pronunciado en la
productividad global de la compaa, en el mercado y la posicin
competitiva y, finalmente, en la rentabilidad de la empresa. Mejorar
estos aspectos de la calidad puede eliminar el desperdicio; disminuir la
cantidad de material de desecho, la necesidad de volver a maquilar las
piezas, los requerimientos para inspeccin y prueba y las prdidas por
garanta. Adems de mejorar la satisfaccin del consumidor y permitir

Ing. Lc. Cs: Alejandro Pieiro Caro

que la empresa se convierta en un productor de alta calidad y bajo costo


en el mercado. En este sentido, la estadstica es un elemento decisivo
en el incremento de la calidad, ya que las tcnicas estadsticas pueden
emplearse para describir y comprender la variabilidad.
Contabilidad
Las empresas de contadura pblica emplean procedimientos
estadsticos de muestreo para llevar a cabo auditorias a sus clientes. Por
ejemplo, supongamos que una empresa de contadores desea determinar
si la cantidad que aparece en las cuentas por cobrar, en el balance de
un cliente, representa fielmente la cantidad real de ese rubro.
Normalmente, la cantidad de cuentas individuales por cobrar es tan
grande que sera demasiado lento y costoso revisar y validar cada
cuenta. En casos como este, regularmente se acostumbra que el
personal del auditor seleccione un subconjunto de las cuentas (llamado
muestra).
Despus de revisar la exactitud de las cuentas muestreadas, los
auditores llegan a una conclusin acerca de si la cantidad que aparece
en cuentas por cobrar, en los estados financieros de sus cliente, es
aceptable.
Finanzas
Los asesores financieros recurren a una gama de informacin estadstica
para guiarse en sus recomendaciones de inversin. En el caso de las
acciones, revisan una variedad de datos financieros, que incluyen
relaciones de precio a rendimiento y los dividendos. Al comparar la
informacin de determinadas acciones con la correspondiente acerca de
promedios del mercado accionario, un asesor financiero puede comenzar
a sacar conclusiones sobre si esas acciones estn sobre o subevaluadas.
Mercadotecnia
Los scanners en las cajas de los almacenes al detalle se emplean para
reunir datos que tienen muchas aplicaciones de investigacin de
mercados.
Produccin
Con el nfasis actual hacia la calidad, el control de calidad es una
aplicacin importante de la estadstica en la produccin. Para vigilar el
resultado de un proceso de produccin se emplean diversas grficas de
control estadstico de calidad, en especial, se usa una grfica para vigilar
el promedio de un producto. Por ejemplo, supongamos que una mquina
llena envases con 12 onzas de una bebida muy conocida.
Peridicamente se selecciona una muestra de envases y se le determina

Ing. Lc. Cs: Alejandro Pieiro Caro

su contenido promedio. Este promedio, o valor x, se anota en una


grfica, a partir de la cual se observa si es necesario ajustar o corregir el
proceso de produccin.
Economa
Con frecuencia se pide a los economistas su pronstico acerca del futuro
de la economa o de alguno de sus aspectos. Recurren a diversas
informaciones estadsticas para elaborarlo. As, para pronosticar las
tasas de inflacin usan indicadores como el ndice de precios al
productor, la tasa de desempleo y la ocupacin de la capacidad de
produccin. Muchas veces, esos indicadores estadsticos se introducen
en modelos computarizados de pronostic, cuyo resultado son
predicciones sobre las tasas de inflacin.

1.1.4 Los computadores, la calculadora y la estadstica


El computador se ha convertido en una herramienta importante en la
presentacin y el anlisis de datos. Si bien muchas tcnicas estadsticas
slo necesitan una calculadora de mano, cuyo empleo consume mucho
tiempo y esfuerzo, el computador realiza las tareas con mucha
eficiencia. La mayor parte del anlisis estadstico se realiza utilizando
una biblioteca de programas estadsticos. El usuario introduce los datos
y luego selecciona los tipos de anlisis y la presentacin de los
resultados que le interesan. Los paquetes estadsticos estn disponibles
para grandes sistemas de cmputo y para computadores personales.
Entre los paquetes mas utilizados estn SAS (Statistical Analysis
System), SPSS (Statistical Package for Social Sciencies), Statgraphics e,
inclusive, Excel.

1.1.5 Trminos comnmente usados en estadstica


Definicin 1.1.1 Una poblacin es el conjunto total de objetos que son de
inters para un problema dado. Los objetos pueden ser personas,
animales, productos fabricados, etc. Cada uno de ellos recibe el nombre
de elemento o individuo de la poblacin

Ing. Lc. Cs: Alejandro Pieiro Caro

Ejemplo: Todos los nios nacidos en determinado ao pueden constituir


una poblacin.
Si el director de una gran empresa manufacturera desea estudiar la
produccin de todas las plantas de propiedad de la firma, entonces, la
produccin de todas estas plantas es la poblacin.
Definicin 1.1.2 Una muestra es un subconjunto de la poblacin.
Ejemplo: Si todos los nios nacidos en determinado ao constituyen una
poblacin, entonces, los nios nacidos en el mes de febrero pueden
constituir una muestra.
Definicin 1.1.3 Los datos u observaciones son nmeros o
denominaciones que podemos asignar a un individuo o elemento de la
poblacin.
Ejemplo: Son ejemplos de datos: la edad de una persona, la respuesta a
la pregunta Usted fuma?, el tipo de sangre, el salario mensual de una
trabajador, etc.
Definicin 1.1.4 Un parmetro es cualquier caracterstica medible de una
Poblacin.
Ejemplo: El ingreso promedio de todos los trabajadores de una
determinada empresa es un ejemplo de parmetro, si todos los
trabajadores se consideran como una poblacin.
Definicin 1.1.5 Un estadstico es cualquier caracterstica medible de
una muestra.
Ejemplo: El ingreso promedio de todos los asalariados de una
determinada seccin de la empresa (viendo a los trabajadores de esta
como una muestra de todos los trabajadores de esta empresa) es un
ejemplo de estadstico.
Definicin 1.1.6 Un censo (palabra derivada del latn censere que
significa valuar o tasar) es una enumeracin completa de la poblacin.

1.1.6 Estadsticas descriptiva e inferencial


Los procedimientos y anlisis que aparecen en estadstica caen en dos
categoras generales, estadstica descriptiva (o deductiva) y estadstica
inferencial (o inductiva), dependiendo del propsito del estudio.
Ing. Lc. Cs: Alejandro Pieiro Caro

Definicin 1.1.7 La estadstica descriptiva comprende aquellos mtodos


que incluyen tcnicas para recolectar, presentar, analizar e interpretar
datos. En general, la estadstica descriptiva tiene como funcin el
manejo de los datos recopilados en cuanto se refiere a su ordenacin y
presentacin, para poner en evidencia ciertas caractersticas en la forma
que sea ms objetiva y til. En este sentido, investiga los mtodos y
procedimientos y establece reglas para que el manejo de los datos sea
mas eficiente y para que la informacin entregada resulte confiable, y
exprese correctamente ciertos contenidos en un lenguaje que permita
que cualquier persona los comprenda y pueda establecer
comparaciones.
Ejemplo: Las siguientes situaciones utilizan estadstica descriptiva:
(a) A un empresario le interesa determinar el promedio semanal total de
sus gastos en algunos productos durante un tiempo determinado.
(b) Una entidad quiere calcular la proporcin de colombianos
encuestados que estn a favor de determinado candidato poltico.
Definicin 1.1.8 La estadstica inferencial abarca aquellos mtodos y
conjuntos de tcnicas que se utilizan para obtener conclusiones sobre
las leyes de comportamiento de una poblacin basndose en los datos
de muestras tomadas de esa poblacin.
Ejemplo: Las situaciones siguientes, que son paralelas a las situaciones
descriptivas dadas anteriormente, requieren estadstica inferencial:
(a) Con base en una muestra de estudiantes, cierta universidad desea
determinar el porcentaje de estudiantes que fuman.
(b) Con base en una encuesta de opinin, al poltico le gustara calcular
la oportunidad de reelegirse en las prximas elecciones.
Definicin 1.1.9 Las tcnicas y mtodos utilizados por la ciencia
estadstica, tanto en su parte descriptiva como en la parte inferencial
son los llamados mtodos estadsticos.

1.2 Organizacin de datos

Nosotros estudiaremos cuatro formas de organizar los datos, a saber,


por el tipo de dato, de acuerdo a escalas de medidas, mediante tablas y
mediante representaciones grficas.

1.2.1 Organizacin de datos de acuerdo al tipo

Ing. Lc. Cs: Alejandro Pieiro Caro

Como se ilustra en la figura existen dos tipos de datos: categricos (o


cualitativos) y numricos (cuantitativos).
1. Los datos categricos o cualitativos representan categoras o atributos
(como, por ejemplo, si o no) que pueden clasificarse como un criterio o
cualidad.
2. Los datos numricos o cuantitativos producen respuestas numricas
como el peso en kilogramos o el numer de universidades que hay en la
Costa Atlntica.
Estos datos son de dos tipos: decretos y continuos.
Los datos discretos producen respuestas numricas que surgen de un
conteo. Ejemplos de datos discretos son la cantidad de universidades
que hay en la Costa, el nmero de estudiantes en la Universidad en
2.003, la cantidad de hermanos que tiene un determinado estudiante de
administracin, el nmero de personas en una fila, etc.
Los datos continuos producen respuestas numricas que surgen de un
proceso de medicin, donde la caracterstica de que se mide puede
tomar cualquier valor numrico en un intervalo.
Ejemplos: datos continuos son el peso (en kilogramos) de una persona,
su estatura (en metros), el tiempo que usted tarda en llegar a la
Universidad, etc.

1.2.2 Organizacin de datos de acuerdo a escalas de medidas

Los datos tambin se pueden clasificar segn la escala de medicin o el


procedimiento que los gener. Cuatro tipos de escalas de medicin
usados en estadstica son las escalas nominal, ordinal, de intervalo y de
razn.
Datos de nivel nominal
Un dato nominal se crea cuando se utilizan nombres para establecer
categoras con la condicin de que cada dato pertenezca nica y
exclusivamente a una de estas categoras.
Existen escalas nominales tanto para los datos numricos como
categricos. Una escala nominal para datos numricos asigna nmeros a
las categoras.
Ing. Lc. Cs: Alejandro Pieiro Caro

Por ejemplo, entre los datos numricos que son nominales se incluyen
los nmeros en las camisetas deportivas, los nmeros telefnicos, etc.
Una escala nominal para datos categricos es un agrupamiento no
ordenado de los datos en categoras discretas, donde cada dato puede
incluirse solamente en uno de los grupos.
Por ejemplo, los datos nominales que son cualitativos incluyen el gener,
la raza, el tipo de sangre y la religin.
Datos de nivel ordinal
Los datos medidos en una escala nominal ordenada de alguna manera
se denominan datos ordinales. Una escala ordinal coloca las medidas en
categoras, cada una de las cuales indica un nivel distinto respecto a un
atributo que se est midiendo. La lista de datos ordinales comprende:
1. Clasificaciones por letra: A, B, C y D; estos grados indican categoras
de perfeccionamiento, as como los niveles alcanzados.
2. Rangos acadmicos: Doctor, magster, especialista y licenciado.
3. La evaluacin de un maestro: insuficiente, aceptable, bueno y
excelente.
4. Los grados de la escuela: primero, segundo, tercero, etc.
No es posible determinar la diferencia o distancia entre los valores
medidos en una escala ordinal. Aun cuando codifiquemos las letras A
como 4, B como 3, C como 2 y D como1, esto no quiere decir que con A,
el estudiante sabe el doble que un estudiante con C.
Todo lo que podemos decir es que la calificacin A es mejor o de un
grado superior a la de C, ya que una escala ordinal no admite unidad de
distancia.

Datos de nivel de intervalo.Los datos medidos en una escala ordinal para los cuales pueden
clasificarse las distancias entre valores, se llaman datos de intervalos. La
distancia entre dos valores es importante y los datos de intervalo son
numricos por necesidad; una escala de intervalo no siempre tiene un
punto cero (es decir, un punto que indique la ausencia de lo que se
quiere medir). La lista de datos de intervalo comprende:

Ing. Lc. Cs: Alejandro Pieiro Caro

10

1. Puntajes en las pruebas de inteligencia. Un puntaje de inteligencia de


110 es cinco puntos superior a uno de 105 (datos ordinales). En este
caso, no slo podemos decir que un puntaje de 110 es superior a uno de
105, sino que tambin podemos decir que es cinco puntos ms altos;
pero no podemos decir que una persona con un puntaje de inteligencia
de 180 es doblemente inteligente que una persona que tiene uno de 90.
2. Temperaturas Celsius. Una temperatura Celsius de 80 es 40 ms
caliente que una de 40, pero no es correcto decir que 80 es el doble de
caliente que 40. Ntese tambin que una temperatura de 0 no
representa la ausencia de calor. El punto cero en la escala de
temperatura Celsius fue escogido arbitrariamente como el punto de
congelamiento e indica que est presente algo de calor.
3. Fechas. Brian LLinas naci en Mainz (Alemania) en el ao 2000, 31
aos despus de su padre, el Dr. Rernat Humberto LLinas (1969).
Podemos especificar la distancia entre estos dos sucesos ordenados, 31
aos, pero si existiera el ao cero, no representara la ausencia de
tiempo.
Datos de nivel de razn.Los datos medidos en una escala de intervalo con un punto cero que
significa ninguno, se llaman datos de razn. Con datos medidos en una
escala de razn, podemos determinar cuntas veces es mayor una
medida que otra. Las escalas de razn incluyen salarios, unidades de
produccin, peso, altura, etc. El dinero nos da una buena ilustracin. Si
usted tiene cero pesos, entonces, no tiene dinero.
El peso es otro ejemplo.
Si la aguja marca cero en la escala, entonces, hay una completa
ausencia de peso (sin importar si se utiliza distintas escalas de razn
como kilogramos, gramos o libras). Las escalas de razn tambin
incluyen escalas usadas comnmente para medir unidades como pies,
libras, centmetros, etc. Los resultados de contar objetos tambin son
datos de razn como, por ejemplo, diez peras es el doble que cinco.

1.2.3. Organizacin de datos mediante representaciones


grficas

Ing. Lc. Cs: Alejandro Pieiro Caro

11

Hay grficas de varios tipos, entre los cuales se encuentran los


siguientes: el diagrama Circular o de pastel, el pictograma, el diagrama
de barras, el diagrama de caja y bigote, el histograma, el polgono (de
frecuencia o de frecuencias relativas), la ojiva (o polgono de frecuencias
acumuladas o polgono de frecuencias relativas acumuladas) y el
diagrama de tallo y hojas.
1) Diagramas circulares (o de pastel): Estos diagramas se utilizan para
hacer representaciones porcentuales y se utilizan generalmente para
datos categricos.
2) Pictogramas o pictgrafos: Un pictograma es la representacin de
datos estadsticos por medio de smbolos que por su forma sugieren la
naturaleza del dato.
3) Diagrama de barras: Es una representacin grfica en la que cada una
de las modalidades del aspecto de inters se representa mediante una
barra. En este grafic se suelen disponer los datos en el primer
cuadrante de unos ejes coordenados, levantando sobre el eje de las
abscisas una barra para cada modalidad del dato observado. La altura
de la barra ha de ser proporcional a la frecuencia absoluta o relativa,
que se representara en el eje de las ordenadas. Estos diagramas se
utilizan tanto para datos categricos como numricos.
4) Histogramas: Los histogramas son una forma de representacin
grfica de una distribucin de frecuencia que consiste en representar las
frecuencias (absolutas, relativas, acumuladas o relativas acumuladas)
por medio de reas de rectngulos (barras). Cuando utilizamos
frecuencias absolutas, hablamos de histograma de frecuencias; cuando
usamos frecuencias relativas, histogramas de frecuencias relativas, etc.
Los histogramas pueden construirse para distribuciones de frecuencias
agrupadas y no agrupadas.
5) Polgonos: Estos grficos se utilizan para representar series
cronolgicas y se construye usando una tabla de frecuencias (absoluta o
relativa) agrupadas con marcas de clase. Si se usan frecuencias
absolutas, se denomina polgono de frecuencias y si se utilizan
frecuencias relativas, polgono de frecuencias relativas.
6) Ojivas: La ojiva, llamada tambin polgono de frecuencias acumuladas
(o polgono de frecuencias relativas acumuladas), se construye a partir
de tablas de frecuencias (acumuladas o relativas acumuladas). Las
ojivas ofrecen un medio grafic para interpolar o aproximar el numer o
porcentaje de observaciones menores o iguales que un valor especific.

Ing. Lc. Cs: Alejandro Pieiro Caro

12

7) Diagrama de Tallo y Hojas:


El uso de una tabla de frecuencia agrupada tiene una desventaja
bastante obvia: los datos originales se pierden en el proceso de
agrupamiento. Para salvar esta limitacin puede usarse el llamado
diagrama de tallo y hojas. Estos diagramas fueron creados por el
estadstico John Tukey y ofrecen una forma novedosa y rpida de exhibir
informacin numrica: si un numeral tiene dos o ms dgitos, entonces,
se puede descomponer en una rama y una hoja. Un tallo es el primer
dgito o parte del numeral, mientras que una hoja est formada por el o
los dgitos restantes.
Por ejemplo, el numeral 534 se puede descomponer en dos formas:
5|
34

Tallo Hoja

53 | 4

Tallo Hoja

La exhibicin grfica de datos es muy fcil de realizar usando tallos y


hojas; cada dato aporta una hoja de algn tallo.
Ejemplo: Los datos de abajo muestran el numer de anuncios
radiofnicos de 30 segundos pagados el ao pasado por cada uno de los
45 miembros de una empresa.
Organice los datos en un diagrama de tallo y hojas y determine la forma
que toma este diagrama.
Alrededor de qu valores tiende a acumularse el nmero de
anuncios?
Cul es el menor nmero de anuncios pagados por un
comerciante?
El mayor nmero pagado?
96 93 88 117 127 95 113 96 108 94 148 156 139 142 94 107
125 155 155 103 112 127 117 120 112 135 132 111 125 104
106 139 134 119
97 89 118 136 125 143 120 103 113 124 138
SOLUCION:

Ing. Lc. Cs: Alejandro Pieiro Caro

13

En el conjunto de datos se observa que el menor nmero de anuncios


pagados es 88. As es que el valor del primer tallo seria 8. El nmero
ms grande es 156. Entonces, los valores de los tallos empezaran en 8
e iran hasta 15. El primer nmero en los datos es 96, que tendra como
tallo 9 y como hoja 6. Movindose por el rengln superior el segundo
valor es 93 y el tercero 88.

Despus de tomar los tres primeros valores del conjunto de datos, su


diagrama es:

Lo que suele hacerse es ordenar los valores de las hojas de menor a


mayor y, en este caso, el diagrama final se vera as:

Del diagrama de tallos y hojas se pueden sacar varias conclusiones


como, entre otras, las siguientes:
Primero, el menor nmero de anuncios comprados es 88 y el
mayor es 156.
Dos comerciantes compraron menos de 90 anuncios y tres, ms
de 150.
Ing. Lc. Cs: Alejandro Pieiro Caro

14

Puede observarse, por ejemplo, que los tres comerciantes que


compraron ms de 150, compraron 155, 155 y 156 comerciales.
La mayor concentracin del nmero de comerciales est entre
110 y 130.
Hubo 9 comerciantes que compraron entre 110 y 119 anuncios y
que 8 compraron entre 120 y 129.
Tambin podemos decir que dentro del grupo de 120 a 129 el
nmero de anuncios comprados se reparti uniformemente.
Dos comerciantes compraron 120, un comerciante compr 124,
tres compraron 125 y dos, 127.

Para concentrarnos en la forma que toma el diagrama de tallos y hojas,


coloquemos un rectngulo para representar la cantidad de hojas de
cada tallo. Al hacerlo obtenemos la siguiente representacin:

Si giramos la pgina 90 grados en el sentido de las manecillas del reloj,


obtenemos una imagen de los datos que se parece mucho a la de un
histograma con clases de 80 a 90, 90 a 100, 100 a 110, etc. Aunque el
diagrama de tallos y hojas parece ofrecer la misma informacin que un
histograma, tiene dos ventajas principales:
1. Es ms fcil de construir.
2. Dentro de un intervalo de clase, el diagrama de tallo y hojas da ms
informacin que un histograma porque muestra los valores reales.

1.2.4 Tablas de Frecuencias Unidimensionales.


Las tablas de frecuencias son un cuadro numrico que permite la
clasificacin de los datos en categoras. Estas tablas se dice que son
unidimensionales si se refieren al estudio de una variable, bidimensionales
si se refieren a la presentacin en forma conjunta de dos variables y

Ing. Lc. Cs: Alejandro Pieiro Caro

15

multidimensionales cuando se refieren a la presentacin de informacin


conjunta de dos o ms variables.
Estas tablas son tiles cuando se necesita resumir los datos para
posteriormente analizar la informacin registrada para cada una de las
variables.
Se denominan de frecuencia por que esta es la informacin que se coloca
en cada una de las categoras de las variables.
El formato general de este tipo de tablas para una variable es el siguiente:
TITULO DE LA TABLA
Nombre de
Tipo de
la variable
frecuencia

Categoras
de la
variable

Frecuencia
s
observada
s

FUENTE:
El ttulo de la tabla debe indicar por lo menos qu informacin se
presenta, dnde fueron registrados los datos y cundo se obtuvo la
informacin.
El nombre de la variable puede utilizarse completo, con sus respectivas
unidades de medida, o bien, alguna sigla previamente definida.
Las categoras que tendr la variable van a depender del tipo de variable
segn nivel de medicin o recorrido. De acuerdo a esto veremos la
construccin de los distintos de tablas.
Tipos de frecuencia:
1.
FRECUENCIA ABSOLUTA o simplemente FRECUENCIA es el nmero
de veces que se presenta un valor o una categora de una variable.
Se acostumbra a denotar por ni, que indica la frecuencia en la clase
o categora i de la variable. En toda tabla, siempre ni n , donde n
es el nmero total de observaciones en los datos.
2.

FRECUENCIA RELATIVA es la proporcin del total de datos que se


presenta en un valor o una categora de una variable. Se
acostumbra a denotar por hi (tambin se usa fi o pi) a la proporcin
de elementos del total que est en el valor o categora i, valor que
se obtiene por fi = ni / n, con f i 1 . Esta frecuencia resulta ser en
la mayora de los casos ms clara e informativa, sobretodo si se
desea comparar conjuntos de datos con distinto nmero (n) de

Ing. Lc. Cs: Alejandro Pieiro Caro

16

observaciones. Por lo general, en la presentacin de una tabla esta


frecuencia se muestra como porcentaje, es decir fi100.
Tanto la frecuencia absoluta como la frecuencia relativa se pueden
usar en todo tipo de variables. Cuando las variables son de un nivel
de medicin al menos ordinal, podra ser de utilidad usar alguna de
las dos siguientes frecuencias.
3.

FRECUENCIA ABSOLUTA ACUMULADA es el nmero de datos que se


presenta hasta un valor o una categora de una variable. Se
acostumbra a denotar por Ni al nmero de observaciones que hay
hasta la clase i entre el total de datos.

4.

FRECUENCIA RELATIVA ACUMULADA es la proporcin de datos que


hay hasta un valor o una categora de una variable. Se acostumbra a
denotar por Fi o Pi a la proporcin de observaciones que hay hasta la
clase i en el total de datos, pudindose usar tambin en valores
porcentuales.

1.2.4.1 CONSTRUCCION DE TABLAS UNIDIMENSIONALES.


1.

Variable en nivel de medicin nominal.


En este caso cada valor
que asume la variable pasa a ser una categora y se disponen en un
orden arbitrario en la tabla.
EJEMPLO.
Los siguientes datos corresponden al sexo de un grupo de personas
en estudio:
M-M-F-M-F-M-M-F-F-M-F-M-F-F-M-F-F-M-M-M F-M -F-M-F-M-M-F-F-F-M-M.
La tabla de frecuencias para este caso es como sigue:
DISTRIBUCIN DE LAS PERSONAS DE ACUERDO A SU SEXO.
Cantidad
Porcentaje de
SEXO
de
personas
personas (fi100)
(ni)
Femenin
15
46,875

Ing. Lc. Cs: Alejandro Pieiro Caro

17

o
Masculin
17
o
TOTAL
32
FUENTE: Elaboracin propia.

53,125
100,000

Tome nota que en esta tabla las frecuencias acumuladas no tendran


ningn sentido prctico.
1.

Variable en nivel de medicin al menos ordinal y discreta con una


cantidad pequea de valores distintos (alrededor de 20).
En este
caso cada valor que asume la variable pasa a ser una categora y se
disponen segn el orden implcito de la variable.

EJEMPLOS.
a) Los siguientes datos corresponden al nmero de das ausentes en
un semestre de los alumnos a la clase de Estadstica:
1-3-2-7-4-0-1-2-0-5-5-4-2-7-0-1-3-2
0 - 1 - 2 - 0 - 4 - 3 - 0- 2 - 3 - 2 - 1 - 1 - 1 - 0 - 1 - 3 - 2 - 2
Construir la tabla de frecuencias.
Solucin:
Como la variable es discreta con un nmero de valores que va
desde 0 hasta 7, cada valor pasa a ser una categora,
quedando la tabla como sigue:
DISTRIBUCION DE LOS ALUMNOS DEL CURSO DE ACUERDO A
SUS AUSENCIAS DURANTE EL SEMESTRE.
DIAS
AUSENTES

Cantidad
de
alumnos
(ni)

0
1
2
3
4
5
6
7

Ing. Lc. Cs: Alejandro Pieiro Caro

7
8
9
5
3
2
0
2

Cantidad
Acumulad
a
de
alumnos
(Ni)
7
15
24
29
32
34
34
36

Proporci
n de
alumnos
(fi)
0,1944
0,2222
0,2500
0,1389
0,0833
0,0556
0,0000
0,0556

Proporci
n
Acumulad
a de
alumnos
(Fi)
0,1944
0,4167
0,6667
0,8056
0,8889
0,9444
0,9444
1,0000

18

TOTAL

36

1,0000

Fuente: Elaboracin propia.


Nota: Un buen ejercicio ser interpretar algunos de los valores
de la tabla, por ejemplo, n4=5 indica que durante el semestre
hubo 5 alumnos que faltaron 3 das a la clase de estadstica y
F5=0,8889 indica que el 88,89% de los alumnos del curso
faltaron a lo ms 4 das a la clase.
b) La siguiente tabla resume las respuestas de 30 dueas de casa a
la pregunta Es usted quien hace las compras en el
supermercado?
DISTRIBUCIN DE LAS DUEAS DE CASA DE ACUERDO A SUS
HBITOS DE COMPRAS
Cantidad
Porcentaje de
RESPUESTA
de amas
amas de casa
de casa
Siempre
12
0,4000
Casi siempre
10
0,3333
A veces
4
0,1333
Casi nunca
3
0,1000
Nunca
1
0,0333
Total
30
1,0000

2.

Variable en nivel al menos de intervalos y continua, o bien, variable


discreta que asume demasiados valores distintos (>21).
En esta tabla se pierde informacin, ya que las clases estarn
formadas por intervalos de valores, cuyos puntos medios se
denominan marcas de clase y se denotan por mi (para la variable X).
A veces se denominan tablas de datos agrupados, ya que en ellas se
pierde informacin al disponer las observaciones en intervalos. Estas
tablas de frecuencia deberan tener las siguientes caractersticas
para su construccin: uniformidad (cada clase debe tener la misma
amplitud), unicidad (dos clases no se traslapan) y exhaustivas (cada
uno de los datos debe pertenecer a laguna clase). Aunque la
caracterstica de uniformidad no es estrictamente necesaria.
Los pasos para la construccin de estas tablas con intervalos de
igual amplitud son:

Ing. Lc. Cs: Alejandro Pieiro Caro

19

Determinar el rango o recorrido RM de la variable: R = mx mn.


Establecer el nmero k de intervalos a usar. En caso de no
tener una buena idea de cuantos usar se puede recurrir a una
de las frmulas empricas existentes, como la regla de Sturges
que establece una buena aproximacin de k como la parte
entera de {1+ 3,3 log n}.
Determinar la amplitud a de cada clase, es decir la diferencia
entre el lmite superior (LS) de una clase y su lmite inferior
(LI). Para ello se divide R por k y el resultado se aproxima al
valor siguiente con la misma cantidad de cifras decimales que
los datos, si esta divisin resulta con ms decimales; si la
divisin resulta tener igual o menor cantidad de decimales que
los datos se conserva ese mismo resultado como valor de a.
Si el valor de a se ha obtenido por aproximacin, se procede a
multiplicarlo por k, obteniendo como resultado el rango RT
que tendrn los datos en la tabla. Para no sesgar demasiado
los datos en la tabla respecto de los reales conviene hacer la
diferencia entre RT y RM repartiendo sta en partes lo ms
equitativas posibles entre el mnimo y el mximo. Al mnimo
se le resta aproximadamente la mitad de la diferencia y al
mximo se le suma el resto, conservando siempre el nmero
de cifras decimales de los datos para lograr una visin clara
de ellos.
Si el valor de a no se ha obtenido por aproximacin, el
recorrido RM de los datos ser el mismo que el de la tabla.
Construir la tabla comenzando por el mnimo obtenido en el
paso anterior y agregar en cada intervalo el valor a de la
amplitud., empleando el mismo valor en el lmite superior de
una clase y en el lmite inferior de la clase siguiente, slo que
para colocar las frecuencias se debe tener presente que la
convencin en los lmites de los intervalos es que los lmites
inferiores son siempre cerrados y los lmites superiores
abiertos, exceptuando el ltimo lmite superior que siempre es
cerrado.
Se debe hacer notar que en la construccin de estas tablas existen
otros criterios para trabajar con los lmites de los intervalos, en la
metodologa que se emplea aqu se trabaja directamente con los
lmites reales de clase, tambin llamados fronteras de clase; en los
caso en que se trabaja con valores distintos entre el lmite superior
de una clase y el lmite inferior de la clase siguiente se dice que se
trabaja simplemente con los lmites de clase.
EJEMPLO:

Ing. Lc. Cs: Alejandro Pieiro Caro

20

Los siguientes datos corresponden a los tiempos, en minutos,


requeridos para atender a 50 clientes en una caja de supermercado,
obtenidos en un control de eficiencia de ste:
2,6 - 1,4 - 3,2 - 3,5 - 1,8 - 2,3 - 0,7 - 5,2 - 0,9 - 0,9 - 0,9 - 3,0 - 1,1 1,2 - 2,3 - 1,7 - 3,2 -1,7 - 0,7 - 1,8 - 1,3 - 1,5 - 2, 5 - 0,3 - 0,7 - 1,6 5,9 - 4,5 - 5, 9 - 6,0 - 3,2 - 1,4 - 1,6 - 1,1-0,5 - 2,4 - 1,6 - 0,9 - 1,3 0,7 - 0, 9 - 1,0 - 1,5 - 0,4 - 0,5 - 1,2 - 1,5 - 0,8 - 0,4 - 0,3.
Construir la tabla de frecuencias, con todas las frecuencias
incluyendo la marca de clase.
Solucin.
RM = Xmx - Xmn = 6,0 - 0,3 = 5,7
k = [1 + 3,3 log 50] = 6
R/k = 0,95 a= 1
Pero 1 6 = 6 = RT
RT - RM = 0,3, cifra que repartimos lo ms iguales posibles
conservando un decimal, entre el mnimo y el mximo. En este caso
procederemos a restar 0,1 al mnimo y a sumar 0,2 al mximo (0,1
+ 0,2 = 0,3).
Por tanto, nuestra tabla comenzar con el valor 0,2 y terminar con
el valor 6,2; teniendo cada intervalo una amplitud igual a 1.
DISTRIBUCIN DE LOS CLIENTES SEGN EL TIEMPO DE ATENCIN
EN LA CAJA.
TIEMPO
Tiempo Cantida Proporcin
Cantidad
Proporci
(minutos promedi
d de
de clientes Acumulada
n
)
o
clientes
(fi )
de clientes Acumulad
[ LI - LS [
Marca
(ni )
(Ni )
a de
de Clase
clientes
(mi )
(Fi )
0,2 - 1,2
0,7
19
0,38
19
0,38
1,2 - 2,2
1,7
16
0,32
35
0,70
2,2 - 3,2
2,7
6
0,12
41
0,82
3,2 - 4,2
3,7
4
0,08
45
0,90
4,2 - 5,2
4,7
1
0,02
46
0,92
5,2 - 6,2
5,7
4
0,08
50
1,00
Total
50
1,00
Fuente: Elaboracin propia con base en los resultados de la
medicin de eficiencia.

Ing. Lc. Cs: Alejandro Pieiro Caro

21

Nota: Algunas interpretaciones en esta tabla son: h4 indica que el


8% de los clientes demoran en ser atendidos entre 3,2 y 4,2
minutos; N5 indica que 46 clientes demoraron menos de 5,2
minutos.
Todas las tablas mostradas en esta seccin permiten hacer un primer
anlisis de lo que est ocurriendo con los datos, con frecuencia se indica
en este anlisis en que valores se encuentra la mayora de las
observaciones, donde se encuentra la minora y en qu punto se
encuentra aproximadamente la mitad de las observaciones.

1.3 MEDIDAS DESCRIPTIVAS PARA UNA VARIABLE.


Los conjuntos de datos tienen distintas caractersticas que los hace
diferenciarse de otros conjuntos de datos. Estas caractersticas se
denominan medidas descriptivas y se clasifican en: medidas de posicin,
medidas de dispersin y medidas de forma.
Estas medidas descriptivas se pueden obtener tanto en la muestra como
en la poblacin. Cuando los datos corresponden a una muestra, las
medidas se denominan estadgrafos y cuando los datos son de la
poblacin, las medidas se denominan parmetros.
1.3.1 MEDIDAS DE POSICION
Por lo general, las medidas de posicin tienen como objetivo resumir el
conjunto de datos de manera de tener un panorama general de ellos, de
manera que sirva como representante del resto de la informacin. La
mayora de las medidas de posicin indican donde se ubica el centro de la
distribucin, por lo que se les llama medidas de tendencia central.
Las medidas de tendencia central son: la media aritmtica, la mediana, la
moda, la media geomtrica y la media armnica. Las medidas de posicin
son las cuantilas (cuartiles, quintiles, octiles, deciles, percentiles).
a) LA MEDIA O PROMEDIO ARITMETICO (M x ).
DEFINICION:

La media aritmtica se define como la suma de todos los


valores observados dividida por el nmero de datos.

Si los datos son todos los valores X1, X2,, XN de la poblacin tamao N
N

(finito), la media se denota por y la definicin dice que:

X
i 1

; si

los datos corresponden a una muestra x1, x2, , xn de la poblacin, la

Ing. Lc. Cs: Alejandro Pieiro Caro

22

media aritmtica se denota por x , o bien, M(x) y la aplicacin de la


n

definicin es:

i 1

Si los datos estn ordenados en una tabla de frecuencias, entonces la


definicin se transforma en:
k

m n
i 1

mi f i ; donde xi es el valor de la variable o marca de

n
clase si los datos son de una variable X discreta o continua

EJEMPLO:
La siguiente tabla muestra la distribucin del saldo de 120 cuentas de
crdito, en miles de $, que maneja en sus archivos la empresa XX.
Saldo
Cantidad de cuentas
(miles de $)
0 30
10
30 60
25
60 90
40
90 120
20
120 150
15
150 180
10

Obtener la media aritmtica


Solucin:
Para obtener la media, se deben calcular las marcas de clase x i, con lo
que se usarn los siguientes datos:
Saldo promedio(xi)
(miles de $)
15
45
75
105
135
165

Cantidad de cuentas
10
25
40
20
15
10

La media aritmtica est dada por:


x

15 10 45 25 75 40 105 20 135 15 165 10


83,75 [miles de $], lo que se
120

interpreta como "el saldo promedio de las cuentas de crdito es de


$83.750.

Ing. Lc. Cs: Alejandro Pieiro Caro

23

Propiedades de la media.
La media aritmtica tiene la gran desventaja de que se ve muy
influenciada por los valores extremos, pero an as es la medida de
tendencia central que ms se usa, ya que posee las siguientes
propiedades:
1.

5.

La media aritmtica de una constante k es igual a la misma


constante, es decir, M(k)=k.
La media del producto de una constante a por una variable X, es
igual al producto de la constante por la media de la variable, es
decir, M(a X) = a M(X).
La media del producto de una constante a por una variable X ms
otra constante, digamos b, es igual a la constante a por la media de
la variable X ms la constante b, es decir, M(a X + b) = a M(X) + b.
La media de la suma de dos variables X e Y, es igual a suma de las
medias de cada una de esas variables, es decir, M ( X + Y ) = M( X )
+ M( Y ).
xmn x xmx.

6.

En toda distribucin

2.
3.
4.

(x

x) 0 .

i 1

7.

En toda distribucin

(x

a) 2

es mnimo para a = x .

i 1

Usos de la media aritmtica.


La media aritmtica resulta ser la mejor medida indicadora de tendencia
central cuando la distribucin es ms bien simtrica, es decir, no hay
observaciones extremas y cuando el nivel de medicin es de intervalos o
de razn. En caso que no se den estas condiciones la medida ms
representativa de la tendencia central es la mediana.
b) LA MEDIANA (Me).
DEFINICION: La mediana es el valor que est justo al centro del conjunto
de datos ordenados segn magnitud; es decir es la observacin que
supera a no ms del 50% de los datos y es superado por no ms del 50%
de las observaciones.

Ing. Lc. Cs: Alejandro Pieiro Caro

24

Obtencin de la mediana:

si n es par
x n 1
2

x x
n
n
1
2
2
Me(X)
si n es impar
2

2 N k 1
LI k a k
si los datos estn ordenados en una tabla de frecuencias con intervalos.
nk

donde: x(i) indica la observacin que est en el lugar i del conjunto de


datos ordenados.
LIk es el lmite inferior del intervalo que contiene a la mediana.
El intervalo que contiene a la mediana es aqul cuya frecuencia absoluta
n
, o bien, su frecuencia relativa acumulada
2

acumulada alcanza el valor


alcanza el valor 0,5.
EJEMPLOS:
1)

2)

3)

Sea el siguiente nmero impar de datos: 2 - 5 - 6 - 6 - 7 - 7 - 7- 8 9 - 9 -10.


El valor mediano de estos datos ordenados es 7. Su interpretacin
es que el 50% de las observaciones es al menos igual a 7 y el resto
a lo ms igual a 7.
Sea el siguiente nmero par de datos: 2 - 2 - 3 - 4 - 4 - 5 - 6 - 6 - 7
- 8.
Su mediana es (4+5)/2 = 4,5.
La siguiente tabla muestra la distribucin de un grupo de familias
clasificadas segn el nmero de hijos:

Ing. Lc. Cs: Alejandro Pieiro Caro

25

N de hijos N de familias
0
12
1
18
2
24
3
32
4
22
5
12
6
2
Para obtener la mediana en este caso debemos obtener las
frecuencias acumuladas.
N de hijos
N acumulado de familias
0
12
1
30
2
54
3
86
4
108
5
120
6
122

3)

Por ser un nmero par de datos, la mediana es el promedio de las


observaciones centrales, que estn en la posicin 61 y 62, lo que
corresponde a 3 hijos; esto significa que el 50% de las familias tiene
a lo menos tres hijos y el otro 50% tiene a lo ms tres hijos.
Obtener la mediana en la tabla de frecuencias del ejemplo de la
media, de las 120 cuentas.
Solucin:
n

Primero se debe calcular el valor

y obtener las frecuencias

acumuladas.
Saldo
Cantidad de cuenta Cantidad acumulada
(miles de $)
de cuentas
0 30
10
10
30 60
25
35
60 90
40
75
90 120
20
95
120 150
15
110
150 180
10
120

n
= 60 El intervalo que contiene a la mediana es el tercero.
2

Ing. Lc. Cs: Alejandro Pieiro Caro

26

Me(x) = 60 + 30

60 35
= 78,75 [m$], esto significa que el 50% de
40

las cuentas tiene un saldo de a lo ms $78.750 y el 50% restante un


saldo de a lo menos $78.750.
Propiedades de la mediana:
1.
2.
3.

El clculo de la mediana se ve afectado


por el nmero de
observaciones y no por la magnitud de cualesquiera de los
extremos, pero no utiliza toda la informacin como la media.
Cualquier observacin seleccionada al azar es igual de fcil que
supere a la mediana o que la mediana supere a la observacin.
La suma de las diferencias absolutas en torno a la mediana es un
mnimo, es decir,
n

a Mnimo

si a Me .

i 1

c) LA MODA O MODO (Mo).


DEFINICION: Es el valor ms comn observado en un conjunto de datos.
Esta es la nica medida descriptiva que se puede utilizar en datos
medidos en una escala nominal. Si la variable es continua, la moda (o las
modas) corresponden a aquellos valores de la variable en los cuales la
funcin alcanza un mximo local y habr tantas modas como mximos
locales; pero si el mximo es global, la moda es nica y se habla de
distribucin unimodal y si la funcin es uniforme, entonces no tiene moda.
Obtencin de la moda:
-

Si los datos estn sin agrupar, o bien, si corresponden a una variable


discreta ordenada en una tabla de frecuencias, se aplica la
definicin para obtenerla.
Si los datos corresponden a una variable continua agrupada en
intervalos, slo se puede calcular la moda si los intervalos son de
igual amplitud y el intervalo con mayor frecuencia se denomina
clase modal y el valor modal est dado por:
d1
n i n i 1
ai , donde el subndice k
Mo(x) LIi a i
LI i
n i n i 1 n i n i 1
d1 d 2
denota al intervalo que contiene la moda, c denota la amplitud de
los intervalos y las nj se refieren a las frecuencias absolutas o
relativas.

COMPARACION ENTRE MEDIA, MEDIANA Y MODA.


Si la distribucin es simtrica, las tres medidas coinciden. Graficamente
es:
Ing. Lc. Cs: Alejandro Pieiro Caro

27

M=Me=Mo
Si la distribucin es unimodal
y asimtrica positiva (con cola a la
derecha), entonces M>Me>Mo. Grficamente es:

Mo Me M

Si la distribucin es unimodal
y asimtrica negativa (con cola a la
izquierda), entonces M<Me<Mo. Grficamente es:

M
1.4

Me Mo

LAS CUANTILAS.

Las cuantilas son medidas de posicin que dividen el conjunto de datos


ordenados en un nmero determinado de partes iguales. Una de estas
medidas es la mediana que divide en dos partes iguales. Cuando el
conjunto ordenado de datos se divide en cuatro partes iguales, los puntos
de divisin se llaman cuartiles (Qi) y cuando el conjunto ordenado de datos
se divide en cinco partes iguales, los puntos de divisin se llaman quintiles
(Fi); se podra seguir mencionando otras medidas, pero son los percentiles
(Pi) los puntos de divisin que denotan la mayor cantidad de particiones
en partes iguales, dividen el conjunto ordenado en cien partes iguales.
Como es posible establecer una equivalencia entre los percentiles y
cualquier otra cuantila, como por ejemplo, P50 = Q2 = Me y P20 = F1, ser a
los percentiles a quienes estudiaremos en detalle.

Ing. Lc. Cs: Alejandro Pieiro Caro

28

El percentil Pk puede definirse como el valor en que el k % de las


observaciones es igual o inferior a l y el (100 - k)% de las observaciones
es igual o superior a l.
Obtencin de los percentiles:

k n

100

Pk

k n
1
100

k n
si

2
100
si los datos slo se han ordenado de menor a mayor (no se han tabulado).
k n

x kn si

100

1

100

kn

N k 1

si los datos estn ordenados en una tabla de frecuencias con intervalos.


LI k c k 100

nk

El parntesis [] indica parte entera y x(i) denota a la observacin de la


posicin i en el conjunto de datos ordenados.
Para obtener el resto de las cuantilas, slo se debe cambiar en la
expresin:

k n
, el divisor 100 por el nmero de partes en que divide los
100

datos la cuantila.

EJEMPLO:
Los trabajadores de una empresa clasificados segn su rendimiento
mensual, cuantificado en cientos de miles de $, dan origen a la
siguiente distribucin:
Rendimiento

Cantidad de trabajadores

50 - 70
70 - 90
90 - 110
110 - 130
130 - 150
150 - 170
170 - 190
a)

18
27
20
12
11
9
3

Obtenga e interprete P20.

Ing. Lc. Cs: Alejandro Pieiro Caro

29

b)

Qu porcentaje de trabajadores supera


rendimiento?
Solucin:
a)

a $11.700.000 en

Para obtener P20 primero se debe obtener el valor

k n
100

compararlo con las frecuencias acumuladas.


Rendimiento
trabajadores

Cantidad de trabajadores

50 - 70
70 - 90
90 - 110
110 - 130
130 - 150
150 - 170
170 - 190

Cantidad

18
27
20
12
11
9
3

Acumulada

de

18
45
65
77
88
97
100

k n 20 100

20 El intervalo que contiene al valor P20 es el 2.


100
100
20 18
P20 70 20
71,48 cientos de miles de $ , es decir, el 20% de los
27

trabajadores tiene un rendimiento de a lo ms $7.148.000.

b) Se desea obtener el valor de 100- k tal que Pk = 117.


117 110 20

k 65
k 69,2% , es decir el 100-69,2 =30,8% de
12

los trabajadores
$11.700.000.

tiene

un

rendimiento

superior

los

Existen, adems otras medidas de tendencia central pero que son de uso
ms especfico, ellas son la media geomtrica y la media armnica.
1.5 ANEXOS:
DEFINICION:

LA MEDIA GEOMETRICA (MG).


MG n x1 x 2 x n

La media geomtrica se utiliza en el clculo de promedios de tasas de


variacin y en la elaboracin de nmeros ndices; con el inconveninte que
no se puede calcular cuando hay algn valor igual o inferior a cero.
EJEMPLO:

Ing. Lc. Cs: Alejandro Pieiro Caro

30

El PNB de cierto pas ha aumentado de 550 u.m. a 1200 u.m. en 10 aos,


Cul ha sido la tasa media de crecimiento?
Solucin:
10

1200
1,0811
550

La tasa media de crecimiento anual fue de

8,11%.
1.6 ANEXOS :

DEFINICION:

LA MEDIA ARMONICA (MH).


MH

1
M

n
ni
yi

La media armnica se usa para obtener un valor representativo de un


conjunto de datos expresados en forma de tasas, esto es, tantas unidades
de un tipo por cada unidad de otra especie.
EJEMPLO: Una persona conduce su vehculos a 60 km/hora los primeros
40 km y a 100 km/hora los siguientes 60 km. Cul fue la velocidad media
en todo el trayecto?
Solucin:
NOTA:

MH

40 60
78,95
40 60
km/hora.

60 100

En cualquier distribucin se cumple que: MH<MG<M.

1.4 MEDIDAS DE DISPERSION.


Son medidas que describen la variabilidad de los datos.
a)

EL RANGO, AMPLITUD O RECORRIDO(R Rx).


DEFINICION: Es la diferencia entre el mayor valor y el menor valor
de una serie de datos, es decir, Rx = xmx - xmn

Ing. Lc. Cs: Alejandro Pieiro Caro

31

Esta es la medida de dispersin ms simple de calcular y entender,


que slo tiene sentido calcularla cuando los datos estn en un nivel
de medicin de intervalos o de razn.
Por depender slo de los valores extremos, su utilidad es muy
restringida, ya que estos pueden presentarse en forma accidental.
Se usa bastante en Control de Calidad.
b)

RANGO INTERCUARTILICO O AMPLITUD INTERCUARTILICA (Q).

DEFINICION:

Es la diferencia entre el cuartil tres y el cuartil uno, es decir,


Q Q 3 Q1 . Esto se interpreta como la mayor diferencia
entre los valores del 50% de las observaciones centrales en
los datos ordenados.

A pesar de ser ms adecuada que la anterior, ya que elimina la influencia


de los valores extremos, no permite hacer una interpretacin precisa de
un valor dentro de la distribucin. Al igual que el rango, se usa bastante
en Control de Calidad.
c) LA VARIANZA Y LA DESVIACION ESTANDAR.
DEFINICION:

La varianza poblacional, que se denota por 2 (sigma


cuadrado), se define como el promedio de las desviaciones
cuadrticas de los valores de la distribucin y su media. Es
decir:
N

i 1

De todas las medidas descriptivas, esta es la nica en que es distinta la


frmula poblacional de la muestral. La varianza muestral, que se denota
por s2, est dada por:
n

s2

x i x 2
i 1

n 1

2
i

n x 2

i 1

La

ltima

igualdad

n 1

corresponde al desarrollo de la sumatoria, con lo que se logra una frmula


ms fcil para el clculo. En caso que los datos estn en tablas de
n

frecuencia la varianza muestral se obtiene por:

s2

2
i

ni n x 2

i 1

, donde xi

n 1

es la marca de clase o valor de la clase i y ni corresponde a la frecuencia


absoluta de la clase i.

Ing. Lc. Cs: Alejandro Pieiro Caro

32

El valor numrico de la varianza cuantifica el grado de dispersin de los


valores de los datos respecto de su media aritmtica, de manera que
mientras mayor es la dispersin de las observaciones, mayor es la
magnitud de sus desviaciones respecto a la media aritmtica y por lo
tanto, ms alto es el valor numrico de la varianza.
Las unidades de medicin de la varianza son iguales al cuadrado de las
unidades con que se mide la variable, por lo tanto, el valor de la varianza
nunca ser negativo y como esas unidades cuadrticas son de difcil
comprensin es que se usa la desviacin estndar, que corresponde a la
raz cuadrada positiva de la varianza, es decir:
2 corresponde a la desviacin estndar poblacional y s s 2
corresponde a la desviacin estndar muestral. Las unidades de medicin
de la desviacin estndar son las mismas con que se mide a la variable.
Para tener una idea de si el valor obtenido en la desviacin estndar
indica que la dispersin de los datos es grande o pequea, podemos usar
el teorema de Chebyshev, que establece que la expresin 1

1
k2

representa la proporcin mnima de los datos que dista no ms de k


desviaciones estndar de la media si k 1; expresado en otros tminos la
1

siguiente afirmacin equivale al teorema de Chebyshev: A lo ms

100

k2

% de los datos de cualquier conjunto, distan ms de k desviaciones


estndar de la media, con k 1.
Propiedades de la varianza:
Para presentar las propiedades tanto de la varianza poblacional como de
la varianza muestral, se denotar con la letra V a la varianza.
1.
La varianza de una constante es cero. V(a) = 0, si a es constante.
2.
La varianza del producto de una constante por una variable es igual
a la constante al cuadrado multiplicada por la varianza de la
variable. V(bX) = b2 V(X).
3.
De 1. y 2. podemos concluir lo siguiente:
a)
V(a + bX) = b2 V(X)
b)
V(a - bX) = b2 V(X)
(Las demostraciones de estas propiedades se pueden obtener fcilmente
aplicando la definicin y las propiedades de la sumatoria y de la media
aritmtica).

EJEMPLO:
Ing. Lc. Cs: Alejandro Pieiro Caro

33

Usando los datos del ejemplo de la media


a) Obtenga la desviacin estndar.
b) Si se sabe que por las condiciones econmicas los saldos han
aumentado un 20%, determine la nueva desviacin estndar.
Solucin:
a)

Recordemos que los datos para los clculos son:


Saldo promedio(xi)
(miles de $)
15
45
75
105
135
165

Cantidad de cuentas
10
25
40
20
15
10

Suponiendo que los datos son de una muestra, la desviacin


estndar muestral se calculara como sigue:
s

b)

(15 2 10 ... 165 2 10) 120 83,75 2


41,23 [miles de $]
119

Sea X: saldo antiguo


e
Y: saldo nuevo
Y = X + 0,2 X = 1,2 X
Aplicando propiedades se tiene que s y = 1,2 s x = 49,48 [miles de $]

Usos de la varianza.
La varianza (o la desviacin estndar) se usa como medida de dispersin
cuando se ha usado la media aritmtica como medida de tendencia
central.
Tambin se usa para comparar la dispersin de dos o ms distribuciones,
cuando ellas presentan igual media aritmtica y las observaciones estn
en la misma unidad de medida. Por ejemplo, no se podr usar en la
comparacin de la dispersin del rendimiento de la gasolina de dos
vehculos si uno est medido en Km por litro y el otro en millas por galn.
Cuando las distribuciones tienen distinta media aritmtica o estn en
unidades diferentes, se usa una medida de dispersin relativa, como es el
coeficiente de variacin.

Ing. Lc. Cs: Alejandro Pieiro Caro

34

d)

EL COEFICIENTE DE VARIACIN (CV(x) CVx).

DEFINICION:

Es el cuociente entre la desviacin estndar y la media


aritmtica. Es decir, CV(X)
CV(X)

x
para datos poblacionales y
x

sx
para datos muestrales.
x

Se interpreta como la proporcin de variabilidad con respecto a la media.


Es una medida sin unidades, que multiplicada por 100 indica la dispersin
en trminos porcentuales.
Las propiedades matemticas del coeficiente de variabilidad se obtienen
de la aplicacin de las respectivas propiedades en la desviacin estndar y
la media.
As como se tiene una medida de dispersin relativa, tambin existe una
medida de posicin relativa, que se llama puntaje tpico o estndar.
EJEMPLO:
Con los datos del ejemplo anterior obtener e interpretar el coeficiente de
variacin.
Solucin:
CV(x)

41,23
0,4923 Esto
83,75

significa que hay un 49,23% de variabilidad en

los saldos respecto del saldo promedio.


d) PUNTAJE TIPICO O ESTANDAR (zi).
DEFINICION:

Zi

xi xi x

Indica el nmero de desviaciones estndar en que un valor de un conjunto


de datos se encuentra bajo la media (si zi<0) o sobre la media (si zi>0),
luego lo que hace es determinar la posicin relativa de una observacin
dentro de un conjunto, de manera de poder establecer un ranking con
algunas observaciones en particular.
EJEMPLO: Los siguientes datos corresponden a los resultados
semestrales de un alumno y los valores de las medias y desviaciones
estndar del curso.
Curso Nota alumno

Ing. Lc. Cs: Alejandro Pieiro Caro

35

A
4,8
4,3 1,2
B
4,5
4,1 0,8
En cul de los dos cursos tuvo mejor desempeo el alumno?
Solucin:

Se tiene que ZA = 0,4167 y ZB = 0,5; por lo tanto en el curso B


tuvo mejor desempeo, ya que est a una mayor cantidad de
unidades de desviacin estndar sobre la media.

1.5 MEDIDAS DE FORMA.


Existen dos medidas de este tipo, son la asimetra y la curtosis.
a)

ASIMETRIA

DEFINICION:

La asimetra es la medicin de la deformacin de una


distribucin respecto de una curva simtrica o "normal".

Existen varios coeficientes para medir la asimetra (o simetra), entre ellos


estn:
1.

x Mo 3 x Me

s
s

AS

Estos dos coeficientes fueron determinados

empricamente por Pearson.


n

x
2.

x 3

i 1

AS

i 1

En todos los coeficientes ocurre que si AS = 0, entonces la distribucin es


simtrica; si AS<0, entonces la distribucin es asimtrica negativa y si
AS>0 entonces la distribucin es asimtrica positiva.

b)

CURTOSIS.

DEFINICION:

La curtosis es el grado de apuntamiento de una distribucin.


Las distribuciones pueden ser platicrticas (achatadas),
mesocrticas (normal), o bien leptocrticas (elevadas).

Entre las medidas de curtosis est la siguiente:

Ing. Lc. Cs: Alejandro Pieiro Caro

36

i 1

b2

i 1

Para una distribucin normal b2=3, para una platicrtica b2<3 y para una
leptocrtica b2>3.
ANEXO: DIAGRAMAS DE CAJA Y BIGOTE.
Es una presentacin visual que describe tanto la tendencia central como la
dispersin, la asimetra y adems los valores atpicos.
El diagrama es una caja alineada en forma vertical u horizontal, el
rectngulo se forma con la amplitud intercuartlica, lo atraviesa una lnea
que corresponde al cuartil dos. De ambas aristas del rectngulo nace una
lnea o bigote que se extiende hasta los valores extremos (mximo y
mnimo) si la distancia con los cuartiles uno y tres respectivamente no
supera 1,5 veces la amplitud intercuartlica. En caso de que esa distancia
est entre 1,5 y 3 veces el rango intercuartlico se dibujan con crculos
llenos los valores, que se denominan atpicos; los puntos que estn ms
all de 3 amplitudes intercuartlicas de los bordes de la caja se dibujan con
crculos vacos y se denominan valores atpicos extremos.
La estructura general es:

Variable
xmn

Q1

Q2

Q3

xmx

1.6 MEDIDAS DESCRIPTIVAS EN DATOS ESTRATIFICADOS.


En ciertas ocasiones la informacin de un conjunto de datos est dividida
en una cantidad L de grupos o estratos, de cada estrato conocemos la
siguiente informacin:
n h = tamao del estrato h, con h= 1, 2, , L
x h = media aritmtica del estrato h.
s2h = varianza del estrato h.
En este caso podemos obtener dos medidas descriptivas para el total de
los elementos: la media total y la varianza total.
La media total ( x T ) se obtiene como una media de las medias de los
estratos, esto es:

Ing. Lc. Cs: Alejandro Pieiro Caro

37

xT

nh

donde

h 1

h 1

La variacin total de los datos tiene dos fuentes de variacin, la variacin


que hay en las observaciones dentro de los estratos, que se mide con la
intravarianza y se denota por s 2w , y la variacin que se produce entre los
distintos estratos, que se mide con la intervarianza y se denota por s 2B .
Por lo tanto, la varianza total s T2 se obtiene por:
s T2 s 2W s 2B

La intravarianza se define como el promedio de las varianzas de los


estratos, esto significa que:
L

s 2W

2
h

nh

h 1

nh

La intervarianza se define como la varianza de las medias de los estratos,


es decir:
L

s 2B

xT 2 nh

h 1

EJEMPLO:
La siguiente informacin corresponde al contenido de folacina (Vitamina
B) para especmenes escogidos al azar de cuatro marcas de t.
Marca
A
B
C
D

Cantidad de especimenes
(nh)
( xh )
7
8,271
5
7,500
6
6,350
6
5,817

Media

Varianza
s 2h

( )
2,139
2,825
1,123
2,406

Obtener la varianza total e indicar dnde se produce mayor variacin en el


contenido de folacina, entre las distintas marcas o dentro de las marcas.
Solucin:

Ing. Lc. Cs: Alejandro Pieiro Caro

38

xT

8,271 7 7,5 5 6,35 6 5,817 6


7,0166
24

s B2

8,2712 7 7,5 2 5 6,35 2 6 5,817 2 6


7,0166 2 0,9785
24

2
sW

2,139 7 2,825 5 1,123 6 2,406 6


2,0947
24

s T2 0,9785 2,0947 3,0732

Existe mayor variabilidad en el contenido de folacina al interior de las


marcas, ya que sW2 s B2 .

EJERCICIOS:
1.

Una empresa est constituida por tres secciones de produccin. El consumo


semanal de cada seccin es el siguiente:

Das
A
B
C
Lunes
1.200 1.000 1.000
Martes
500 1.200 2.500
Mircoles
1.500 2.000 1.000
Jueves
1.000 1.500 1.200
Viernes
1.400 1.000
800
Sbado
0 1.800
900
Domingo
0
0 2.000
a) Calcular el coeficiente de variacin del consumo de materias primas para cada
seccin.
Solucin:
a.1)

Das
Lunes
Martes
Mircoles
Jueves
Viernes
Sbado
Domingo
n=5

A
A2
1.200 1.440.000
500
250.000
1.500 2.250.000
1.000 1.000.000
1.400 1.960.000
0
0
0
0
5.600 6.900.000

Ing. Lc. Cs: Alejandro Pieiro Caro

X = 5.600/5 = 1.120

(X)2 = (1.120)2 = 1.254.400


(X2) = 6.900.00/5 = 1.380.000
V(X)= 125.600
S= 354.40
CVa = 354.40/1.120 = 0.3164
CVa = 31,64%

39

b.1)

Das
Lunes
Martes
Mircoles
Jueves
Viernes
Sbado
Domingo
n=6

B
B2
1.000 1.000.000
1.200 1.440.000
2.000 4.000.000
1.500 2.250.000
1.000 1.000.000
1.800 3.240.000
0
0
8.500 12.930.00
0

X = 8500/6 = 1.416,67

Das
Lunes
Martes
Mircoles
Jueves
Viernes
Sbado
Domingo
n=7

C
C2
1.000 1.000.000
2.500 6.250.000
1.000 1.000.000
1.200 1.440.000
800
640.000
900
810.000
2.000 4.000.000
9.400 15.140.000

X = 9400/7 = 1.342,86
(X)2 = (1.342,86)2 = 1.803.265
(X2) = 15.140.000/7= 2.162.857
V(X)= 359.592
S= 599, 66
CVc = 599.66/1.342,86 = 0,44656

(X)2 = (1.416,67)2 = 2.006.944


(X2) = 12.930.000/6= 2.155.000
V(X)= 148.056
S = 384.78
CVb = 384.78/1.416,57 =0.27161
CVb = 27,161%

c.1)

CVc = 44,656%

2. Complete la siguiente tabla de frecuencia cuantitativa de una variable


continua en base a la informacin dada: corresponden a los sueldos en
Uf. de un grupo de trabajadores de una empresa.
CLASE Lmite
Inferior

Lmite
Marca Frecuencia
superior de Clase absoluta

Ing. Lc. Cs: Alejandro Pieiro Caro

Frec. Abs.
Acumulada

Frecuencia
Relativa

Frec. Rel.
Acumulada

40

I
II
III
IV
V

CLASE

I
II
III
IV
V

Li
6,0

LS

mi

ni

Ni

fi

Fi
0,09

8
0,47
27
10,0

Lmite
Inferior
Yi-1
Y1
Y2
Y3
Y4
Y6

Lmite
Superior.
Yi
Y2
Y3
Y4
Y5
Y7

7,0

Lmite
Inferior
Yi-1
6,0
6+C
6+2C
6+3C
6+4C

Lmite
Superior.
Yi
6+C
6+2C
6+3C
6+4C
6+5C

Lmite
Inferior
Yi-1
6,0

Lmite
Superior.
Yi

10,0

6 +5C =10
C = 4 / 5 = 0.8
La Amplitud o Longitud de la Clase es constante e igual a 0.8
La marca de Clase es
i + i-1
Yi =
-----------2
Clase I:
Clase II:
Clase III:
Clase IV:
Clase V:

(6.0 + 6.8) / 2 = 6.4


(6.8 + 7.6) / 2 = 7.2
(7.6 + 8.4) / 2 = 8.0

6.8 + 0.8 = 7.2


7.2 + 0.8 = 8.0

(8.4 + 9.2) / 2 = 8.8


(9.2 + 10.) / 2 = 9.6

8.0 + 0.8 = 8.8


8.8 + 0.8 = 9.6

La Frecuencia Relativa Acumulada ( F1) de la primera Clase es 0.09,


la Frecuencia Aculada de la quinta Clase es (27 + 7 = 34), por lo
tanto:
F1 = n1 / N
0.09 = n1 / 34
n1 = 3

Ing. Lc. Cs: Alejandro Pieiro Caro

41

Por lo tanto,

n2 = 8 3 = 5

Lmite Lmite Marca Frec.


Clas
Frec. Abs. Frecuencia Frec. Rel.
Inferio Superio de
absolut
e
Acumulada. Relativa Acumulada
r
r
clase
a
Yi-1
Yi
yi
ni
Ni
fi
Fi
I
6,0
6,8
6,4
3
3
0.09
II
6,8
7,6
7,2
5
8
III
7,6
8,4
8,0
0.47
IV
8,4
9,2
8,8
27
V
9,2
10,0
9,6
7
34
La Frecuencia Relativa Acumulada ( F3) de la tercera Clase es 0.47,
por lo tanto:
F3 = (n1 + n2+ n3) / N
0.47 = (3 + 5+ n3) / 34
n3 = 8
Lmite Lmite Marca Frec.
Clas
Frec. Abs. Frecuencia Frec. Rel.
Inferio Superio de
absolut
e
Acumulada. Relativa Acumulada
r
r
clase
a
Yi-1
Yi
yi
ni
Ni
fi
Fi
I
6,0
6,8
6,4
3
3
0.09
II
6,8
7,6
7,2
5
8
III
7,6
8,4
8,0
8
0.47
IV
8,4
9,2
8,8
27
V
9,2
10,0
9,6
7
34

n = n1 + n2+ n3 + n4+ n5 = N5
n4 = 34-(3+5+8+7)
n4 = 11

Lmite Lmite Marca Frec.


Clas
Frec. Abs. Frecuencia Frec. Rel.
Inferio Superio de
absolut
e
Acumulada. Relativa Acumulada
r
r
clase
a
Yi-1
Yi
yi
ni
Ni
fi
Fi
I
6,0
6,8
6,4
3,0
3,0
0,09
0,09
II
6,8
7,6
7,2
5,0
8,0
0,15
0,24
III
7,6
8,4
8,0
8,0
16,0
0,24
0,47
IV
8,4
9,2
8,8
11,0
27,0
0,32
0,79
V
9,2
10,0
9,6
7,0
34,0
0,21
1,00
Ing. Lc. Cs: Alejandro Pieiro Caro

42

Preguntas:
a) Qu representa la frecuencia relativa acumulada de la tercera
clase?
Establece que 16 trabajadores ganan entre 6 y 8,39 UF. Y
representa el 47% de toda la informacin acumulada.
b) Qu representa la frecuencia relativa de la tercera clase?
Establece que 8 trabajadores ganan entre 7,6 y 8,39 UF. y
representa el 24% de toda la informacin.
c) Cul estima Ud. es el intervalo que acumula el 50% de la
informacin?
El cuarto intervalo.
d) Qu porcentaje de la informacin se ubica en el cuarto intervalo?
Un 32.4% de la informacin.
e) Qu porcentaje de la informacin se acumula hasta el segundo
intervalo?
Un 24% de la informacin.

3.A partir de la siguiente tabla de distribucin cuantitativa de una


variable aleatoria continua, y de la informacin dada complete los datos
que faltan.
Lmite Lmite Marca Frec.
Clas
Frec. Abs. Frecuencia Frec. Rel.
Inferio Superio de
absolut
e
Acumulada. Relativa Acumulada
r
r
clase
a
Yi-1
Yi
yi
ni
Ni
fi
Fi

Ing. Lc. Cs: Alejandro Pieiro Caro

43

I
II
III
IV
V

Lmite
Clas
Inferio
e
r
Yi-1
I
Y0
II Y0 + C
III Y0 +2
C
IV Y0 +3
C
V Y0 +4
C

5,0
10,0
15,0
20,0
25,0

Lmite
Superio
r
Yi
Y0 + C
Y0 +2 C
Y0 +3 C

2,0
4,0

0,30
0,30
0,85

Marca Frec.
Frec. Abs. Frecuencia Frec. Rel.
de
absolut
Acumulada. Relativa Acumulada
clase
a
yi
ni
Ni
fi
Fi
5,0
2,0
2,0
10,0
4,0
6
0,30
15,0
0,30

Y0 +4 C 20,0

0,85

Y0 +5 C 25,0

Marca de Clase:
Clase I: ((Y0 )+ (Y0 + C)) / 2 = 5
Clase I I:
C)) = 10

((Y0 + C )+ (Y0 +2

Y0 + Y0 +C = 10

Y0 + C+ Y0

+2C = 20
2Y0 + C = 10

2Y 0 +

3 C = 20
C = 5,0

Y0 = 2.5

Frecuencia Relativa Acumulada y Relativa:


F2= N2 / n
F2 = (n1 + n2) / n
0.30 = (2 + 4 ) / n
n = 20

f3 = n3 / n
0.30 = n3 / 20
n3 = 6

Clas Lmite Lmite Marca Frec.


Frec. Abs. Frecuencia Frec. Rel.
e Inferio Superio de
absolut Acumulada. Relativa Acumulada

Ing. Lc. Cs: Alejandro Pieiro Caro

44

r
Yi-1

I
II
III
IV
V

Y0
Y0 + C
Y0 +2 C
Y0 +3 C
Y0 +4 C

r
Yi
Y0 + C
Y0 +2 C
Y0 +3 C
Y0 +4 C
Y0 +5 C

clase
yi
5,0
10,0
15,0
20,0
25,0

a
ni
2,0
4,0
6
5
3

F4= N4 / n

Ni
2,0
6
12
17
20

fi

Fi
0,30

0,30
0,85

N4 = N3 + n4
0.85 = N4 / 20
N4 = 17

17= 12 + n4
n4= 5

Lmite Lmite Marca Frec.


Clas
Frec. Abs. Frecuencia Frec. Rel.
Inferio Superio de
absolut
e
Acumulada. Relativa Acumulada
r
r
clase
a
Yi-1
Yi
yi
ni
Ni
fi
Fi
I
2,5
7,5
5,0
2,0
2,0
0,10
0,10
II
7,5
12,5
10,0
4,0
6,0
0,20
0,30
III
12,5
17,5
15,0
6,0
12,0
0,30
0,60
IV
17,5
22,5
20,0
5,0
17,0
0,25
0,85
V
22,5
27,5
25,0
3,0
20,0
0,15
1,00

4.De una tabla de distribucin de simtrica de una variable aleatoria


continua, se tiene la siguiente informacin: Representa el sueldo de 150
trabajadores en Unidades de Fomento
Y4 = 7.000, N7 = 150 , n3 = 24 , n1 = 12 , n1 * y1 = 48.000
f7 = 0.08 ,

F4 = 0.62

Se pide completar la tabla de frecuencia en el supuesto de amplitud


constante en los intervalos.
12 * y1 = 48.000
y1 = 4.000

Clas Lmite Lmite Marca Frec.


Frec. Abs. Frecuencia Frec. Rel.
e Inferio Superio de
absolut Acumulada. Relativa Acumulada

Ing. Lc. Cs: Alejandro Pieiro Caro

45

r
Yi-1
I
II
III
IV
V
VI
VII

Clas
e
I
II
III
IV
V
VI
VII

Lmite
Inferior
Yi-1
Y0
Y0 + C
Y0 +2 C
Y0 +3 C
Y0 +4 C
Y0 +5 C
Y0 +6 C

r
Yi

clase
yi
4.000

a
ni
12

Ni
12

fi

Fi

24
7.000

0,62
24
12

Lmite
Superior
Yi
Y0 + C
Y0 +2 C
Y0 +3 C
Y0 +4 C
Y0 + 5 C
Y0 + 6 C
Y0 +7 C

0,08

1,00

marca de
clase
mi
4.000

7.000

Y0 + Y0 + C) / 2 = 4.000
2Y0 + C = 8.000

C = 1.000

Ing. Lc. Cs: Alejandro Pieiro Caro

150

(Y0 +3C + Y0 +4C) / 2 = 7.000


2Y0 + 7C = 14.000

Y0

= 3.500

46

Lmite Lmite Marca Frec.


Frec. Abs.
Clas
Frecuencia Frec. Rel.
Inferio Superio
de
absolut Acumulada
e
Relativa Acumulada
r
r
clase
a
.
Yi-1
Yi
mi
ni
Ni
fi
Fi
I
3.500
4.500 4.000
12
12
II
4.500
5.500 5.000
III 5.500
6.500 6.000
24
IV 6.500
7.500 7.000
0,62
V
7.500
8.500 8.000
24
VI 8.500
9.500 9.000
VII 9.500 10.500 10.000
12
150
0,08
1,00

F4 = N4 /n

0.62 = N4 /150

N4 = 93

N7 n7 = N6

150 12 = N6

N6= 138

Lmite Lmite Marca Frec.


Frec. Abs.
Clas
Frecuencia Frec. Rel.
Inferio Superio
de
absolut Acumulada
e
Relativa Acumulada
r
r
clase
a
.
Yi-1
Yi
yi
ni
Ni
fi
Fi
I
3.500
4.500 4.000
12
12
II
4.500
5.500 5.000
21
III 5.500
6.500 6.000
24
IV 6.500
7.500 7.000
36
93
0,62
V
7.500
8.500 8.000
24
117
VI 8.500
9.500 9.000
21
138
VII 9.500 10.500 10.000
12
150
0,08
1,00
150 12 = 138

93 + 24 = 117 138 117 = 21

12 + 21 + 24 + n4 + 24 + 21 + 12 = 150

Ing. Lc. Cs: Alejandro Pieiro Caro

n4 = 36

47

Lmite Lmite Marca Frec.


Frec. Abs.
Clas
Frecuencia Frec. Rel.
Inferio Superio
de
absolut Acumulada
e
Relativa Acumulada
r
r
clase
a
.
Yi-1
Yi
yi
ni
Ni
fi
Fi
I
3.500
4.500 4.000
12
12
0,08
0,08
II
4.500
5.500 5.000
21
33
0,14
0,22
III 5.500
6.500 6.000
24
57
0,16
0,38
IV 6.500
7.500 7.000
36
93
0,24
0,62
V
7.500
8.500 8.000
24
117
0,16
0,78
VI 8.500
9.500 9.000
21
138
0,14
0,92
VII 9.500 10.500 10.000
12
150
0,08
1,00

Ejemplo 6:
Sean los siguientes datos
3 53 5 7 6
6 22 1 1 3
Marca de
clase

Frecuencia
absoluta

mi

ni

18

N=12

mi *

ni

=
45

mi * ni
X = ---------- = 45 / 12 = 3,75
n

Ing. Lc. Cs: Alejandro Pieiro Caro

48

Ejemplo 7 :
Clases o
intervalos

Marca de
clase

Frecuencia
absoluta

( i-1- i (

mi

ni

(133-143(

138

414

(143-153(

148

296

(153-163(

158

316

(163-173(

168

18

3.024

(173-183(

178

16

2.848

(183-193(

188

1.504

n=55

=8.402

mi

* ni

m i * ni
X = ---------- = 8.402 / 55 = 152,76
n

Ejemplo 8:
Sean las siguientes notas del curso de estadsticas:
5, 3, 2, 5, 7, 6,3
xi
X = ---------- = 5+3+2+5+7+6+3 / 7 = 4,43

Ejemplo 9: Clculo de la Mediana.Considere los siguientes datos:


9

8 15 8

Ing. Lc. Cs: Alejandro Pieiro Caro

49

Se ordenan, de mayor a menor o vise versa


1 2 2 3 7 8 8 9 9 15
N = 10, es par, por lo tanta se obtiene la media aritmtica de los dos
trminos centrales
Me = (7 + 8) / 2 = 7.5
Ejemplo 10:
1
8

2
8

3
9

4 5 6 6 6
9 10 11 15

N = 15, Me = 7
Ejemplo 11: Calculo de la Mediana Datos Tabulados.Contiene la tabla 55 datos, esto implica que (55) / 2 = 27.5
Se encuentran 27,5 datos acumulados en la 4 clase y corresponde al
intervalo mediano
Clas
e

Clases o
intervalos

Marca de
clase

Frecuencia
absoluta

Frec. Abs.
Acumulada

(i-1- i(

Yi

ni

Ni

(133-143(

138

II

(143-153(

148

III

(153-163(

158

13

IV

(163-173(

168

18

31

(173-183(

178

16

47

VI

(183-193(

188

55

Ni-1 = Frec. Abs. Acumulada del intervalo


anterior

Intervalo Mediano

n=55

Longitud de la 4 clase C4 = 173 163 = 10

( ( n / 2 ) N3) a4
Me = L1 + -------------n4
( ( 55 / 2 ) 13) 10
Me = 163 + --------------------Me = 171.06

Ing. Lc. Cs: Alejandro Pieiro Caro

18

50

Ejemplo 12: Calculo de la Moda para variable discreta:


1
8

2
8

3
9

4 5 6 6 6 7 8
9 10 11 15 15 18 20
Mo = 6

Ejemplo13: Calculo de la Moda para variable continua datos


tabulados.Lo primero es encontrar el intervalo modal, y corresponde a la
frecuencia absoluta mayor, es decir 18. Por lo tanto el intervalo modal se
encuentra en la cuarta clase
ni+1: Frecuencia absoluta posterior al intervalo modal
ni-1: Frecuencia absoluta anterior al intervalo modal
Clase

Clases Mar Frecu Frecu.


o
ca encia Absol.
interva de absol Acumu
los
clas uta
l..
e
(i-1- i(

Yi

ni

Ni

(133143(

138

II

(143153(

148

III

(153163(

158

13

IV

(163173(

168

18

31

(173183(

178

16

47

VI

(183193(

188

55

n=55

D1
Mo = LI + ----------D1 + D2

10

*ai

16

Mo = 158 + --------8 + 16

Ing. Lc. Cs: Alejandro Pieiro Caro

Mo = 164

51

Nota:
Si existe ms de una frecuencia absoluta que contiene el nmero mayor
de datos se deben sacar igual nmero de modas.
Ejemplo
14:
Percentiles.-

Clculo

de

Cuarteles,

Quintiles,

Deciles,

Primero se determina su posicin con las siguientes formulas:


POSICIONES:
Cuartil (QX) = X

n / 4 + 0.5

Decil (DX) = X * n / 10 + 0.5


Percentil (PX) = X * n / 100 + 0.5
Quintil (qx) = X * n /20 + 0.5

Si n es par, el ( Q, D, P, q ) es la media aritmtica de los dos trminos


entre los cuales est el valor buscado.
Ejemplos para una variable Discreta
5

8 11 12 13 14 16
n=8

Q*1 = 1 * 8/4 + 0.5 = 2.5

Ing. Lc. Cs: Alejandro Pieiro Caro

8 11 12 13 14 16

52

Q1 = (8 + 8) / 2 = 8
El Cuartil nmero uno es 8
Q2 = 2 * 8/4 + 0.5 = 4.5

8 11 12 13 14 16

Q2 = (11 + 12) / 2 = 11,5


El Cuartil nmero dos es 11.5

Ing. Lc. Cs: Alejandro Pieiro Caro

53

Ejemplo de percentiles

P*35 = 35 * 8 / 100 + 0.5 =


3,3

5 8 8 11 12 13 14 16
Q2 = (8 + 11) / 2 = 9,5

Ing. Lc. Cs: Alejandro Pieiro Caro

54

También podría gustarte