Está en la página 1de 26

ESTADÍSTICA PEGGI MONTOYA 1

PROBABILIDA Y ESTADISTICA
UNIDAD I

DEFINICION DE ESTADISTICA

La función principal de la estadística es elaborar principios y métodos que nos ayuden a tomar decisiones
frente a la incertidumbre. En realidad muchos autores definen la estadística actualmente como un método de
toma de decisiones frente a la incertidumbre. La estadística se a convertido en un invalioso instrumento para
tomar decisiones cuando no se esta seguro de sobre el estado de la naturaleza. El punto central del análisis
estadístico moderno es la toma de decisiones en condiciones de incertidumbre para resolver problemas.

A diario nos enfrentamos a fenómenos económicos, físicos, sociales, industriales, psíquicos, etc. Que nos
obligan a generalizar o actuar frente a la incertidumbre tal como son las cosas.
,
La estadística desde el punto de vista tradicional se define como los métodos científicos por medio de los
cuales se puede recolectar, organizar, tabular, procesar, analizar procesar e interpretar los datos relativos a un
conjunto de elementos (como ser personas, animales, cosas, materiales equipos , plantas, etc.) que poseen una
característica determinada. Toda persona recibe información a través de:

 Revistas
 Periódicos A menudo es necesario obtener conclusiones sobre la
 Televisión información contenida en los datos.
 Otros

Los ingenieros y científicos obtienen y analizan datos de manera rutinaria, por ello el conocimiento de la
estadística es importante, porque es una herramienta poderosa para científicos e ingenieros para el diseño de
nuevos productos y sistemas, perfeccionar los ya existentes a diseñar y mejorar los procesos de producción.

EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA Y LA CIENCIA

El papel de la estadística es importante en las diferentes actividades del ser humano, así se puede
encontrar una variedad de aplicaciones:

 Aumento de la calidad; La calidad ayuda a eliminar el desperdicio, eliminar la cantidad de desecho, mejora la
satisfacción del cliente, permite que la empresa se convierta en un productor de alta calidad y bajo costo en
el mercado.
La estadística es un elemento decisivo en el incremento de la calidad ya que las técnicas estadísticas
pueden emplearse para describir y comprender la variabilidad.
La variabilidad puede presentarse cuando:
 Cambios en las condiciones en la cual se realiza el trabajo.
 Cambio en las propiedades de los materiales.
 Forma en que trabajan los obreros.
 Variables de proceso (Temperatura, Presión, Tiempo) o (Humedad Relativa).

El campo de la estadística y la probabilidad consiste de métodos tanto para describir y modelar la


variabilidad, como para tomar decisiones en presencia de estas.
La baja calidad de un producto tiene efectos negativos como:
 Defectos de fabricación
 Baja de confiabilidad en su rendimiento
 Baja productividad
 Afecta a la competencia
 Rentabilidad
 Para un Ing. Químico o Industrial; La estadística le sirve para el control del rendimiento de sus
investigaciones, control de los procesos para el control de la incidencia de ciertas variables en el
comportamiento de los productos por ejemplo vida en anaquel de los alimentos en función a la temperatura,
humedad ambiental, exposición a la luz, composición de los ingredientes, etc. También es usado en el
control de los procesos de producción desde diferentes puntos de vista como ser número de unidades
producidas, número de accidentes por año, número de paradas en un proceso de producción, número de
unidades defectuosas, etc.

-1-
ESTADÍSTICA PEGGI MONTOYA 2

 Para un director de colegio; la estadística es la información a cerca del ausentismo, el crecimiento de


alumnos a través de los años, el número de aplazados, las calificaciones de los alumnos , el sueldo de los
docentes, el presupuesto de gastos, la cantidad de nuevos profesionales etc.
 Para un investigador médico; le sirve para indagar los efectos de un determinado medicamento, la
estadística es la evidencia del éxito de sus trabajos de investigación.
 Para un comerciante; la estadística es la información proporcionada de las ventas por estación por área
geográfica, las preferencias de los clientes, el monto de las utilidades, el crecimiento del mercado de los
últimos 5 años, la variación de precios del producto en cuestión, etc.
 Para el gerente de una central de energía eléctrica; la estadística puede ser la información de la cantidad de
contaminantes que están siendo emitidos a la atmósfera, el incremento el consumo de energía eléctrica por
año

CAMPOS DE LA ESTADISTICA

La estadística se divide en tres campos claramente definidos así:

1. Estadística Descriptiva: Es la parte de la estadística que se encarga de la recolección clasificación,


presentación, descripción y simplificación de los datos que no sobrepasan el conjunto de conocimientos que
proporcionan estos datos. En otras palabras la estadística descriptiva se limita solo a analizar y describir los
datos.

Población
( General )

Muestra Muestra
(particular) (General)
Muestra
(particular)
(particular)

2. Inferencia Estadística: La estadística inferencial es aquella parte de la estadística que nos proporciona la
teoría, métodos y conjunto de técnicas necesaria para poder obtener conclusiones que sobrepasan los
límites del conocimiento que proporcionan los datos; en otra palabras, nos permite inferir o estimar las leyes
de la población a partir de los resultados o conclusiones de una muestra. Dicho de otra forma nos permite
información sobre el colectivo, total o global mediante un metódico procedimiento de datos de una nuestra
tomada de él; es decir, esta constituido por métodos que permiten generalizar información obtenida de una
muestra.

Muestra Población
( particular ) (general)

3. Toma de Decisiones: Los métodos y técnicas de la inferencia estadística también pueden ser utilizados en
una rama de esta disciplina denominada teoría de decisiones. El conocimiento de la teoría es de gran utilidad
para los gerentes porque les permite tomar decisiones en condiciones de incertidumbre.

POBLACION Y MUESTRA

Población:

Se entiende por población o universo de estudio la totalidad de individuos o elementos en las cuales
puede presentarse cualquier característica susceptible de ser enumerada. Generalmente este conjunto viene
definido por compresión, es decir citando las propiedades que caracterizan a sus elementos. Los datos
individuales de la población se llaman unidades elementales u observaciones.

La población puede ser:


 Finita: Cuando tiene un número determinado de elementos.

-2-
ESTADÍSTICA PEGGI MONTOYA 3

 Infinita: Aquella que tiene un número tan grande de elementos que no es posible al investigador
someter a medida cada uno los elementos.

Ejemplos:
 Los libros de la biblioteca municipal.
 Los alumnos del colegio Nacional Florida.
 La arena de la orilla del río Piraí

Muestra:
Es un subconjunto de la población o una fracción o segmento de la población con el propósito de obtener
información acerca de ella.

Se suelen tomar muestras cuando resulta difícil o costosa, el levantamiento de información de todos los
elementos de la población estadística o cuando esta actividad demandaría demasiado tiempo.

El número de elementos de una muestra se llama tamaño de muestra (n). La muestra se extrae de la
población.
La muestra debe ser representativa y para ello debe contener las características relevantes de la
población en las mismas proporciones que están incluidas en la población.

Censo: Es un procedimiento que permite la recolección de la información que abarca a la totalidad de las
unidades poblacionales

Muestreo: Es un procedimiento para recopilar datos que abarca sólo a una parte de la población llamada
muestra.

Dato Estadístico: Es un número o medida que se ha recopilado como resultado de observaciones que pueden
ser comparados, analizados e interpretados.

Un número aislado de que no muestra relación significativa o no puede compararse no es número


estadístico.

Variables Estadísticas:

Una variable estadística es una característica de una población que interesa al investigador y que puede
tomar diferentes valores. Las variables se pueden clasificar en:

1. Variable Cualitativa
Son variables cuyos valores consisten en categorías de clasificación, o sea se refiere a la cualidad que
representa la población, no lleva clasificación numérica.

1.1. Variable Cualitativa Nominal: Son aquellas que surgen cuando se definen categorías y se
cuenta el número de observaciones pertenecientes a cada categoría. No lleva ordenación.
Ejemplo:
 Orientación en el tiempo (presente, pasado y futuro)
 Color de Ojos
 Partidos Políticos
 Sexo

1.2. Variable Cualitativa Ordinal: Son aquellas variables que se buscan ordenar en términos que el
grado que posee una determinada característica.
Ejemplo:
 Nivel de estudios (1er Grado, 2do Grado…)
 Estatura (bajo, medio, alto)

2. Variable Cuantitativa
Son aquellas que se obtienen como resultado de mediciones o conteos. Estas variables se clasifican
en:

2.1. Discreta: Son aquellas que toman valores numéricos aislados y no pueden tomar ningún valor
entre dos consecutivos.

-3-
ESTADÍSTICA PEGGI MONTOYA 4

Ejemplo:
 Número de monedas.
 Número de muertes por día terminado.
 Número de hermanos.
 Número de accidentes automovilísticos en un mes determinado.

2.2. Continua: Son aquellas que pueden tomar infinitos valores entre dos números, por muy
próximos que estos sean.
Ejemplo:
 La estatura de los estudiantes de la UAGRM.
 La temperatura.
 Densidad.
 Humedad.
 Numero de Reynolds.
 Promedio de muertes por año

DIFERENCIA ENTRE PARAMETRO Y ESTADIGRAFO:

Parámetro: Es una medida para describir las características de la población y para determinar su valor es
necesario utilizar la información de la población completa y por lo tanto, las decisiones se tomarán con
certidumbre total; ejemplo:
 Media poblacional.
 Desviación Poblacional.
 Proporción Poblacional.

Estadígrafo: Es una medida usada para describir algunas características de la muestra y la toma de decisiones
contienen un grado de incertidumbre; ejemplo:
 Media muestral.
 Proporción Muestral.
 Varianza Muestral.

ETAPAS DEL METODO ESTADISTICO

1. Formulación o definición del problema: El análisis estadístico al igual que un proceso industrial comienza
con la materia prima, osea con los datos numéricos, y a través de este proceso fluyen los productos
terminados, que consisten en cualquier información útil o conclusiones valederas que se encuentran
escondidas en los datos no elaborados.

Al industrializar un bien el productor debe primero decidir lo que se va a producir, y luego fijar las
especificaciones precisas de la calidad del bien, de lo contrario no puede saber ¿qué clase de material voy a
utilizar?, Ni ¿cuánto va a consumir?

En estadística lo primero que se debe hacer es definir ¿qué se va a investigar?, formular la pregunta tan
precisa como sea posible. Solo así el investigador puede decidir cuales son los datos relevantes del
problema. Si no se procede así, los datos recolectados pueden ser totalmente irrelevantes o pueden tender a
oscurecer en lugar de aclarar el problema.

La calidad de las Dependen de la adecuación de


conclusiones los datos y estos a su vez
Estadísticas

Dependen de la
formulación del
problema

-4-
ESTADÍSTICA PEGGI MONTOYA 5

2. Diseño del Experimento. Una vez que el problema ha sido claramente definido o formulado el investigador
debe decidir entre estudiar la población en su totalidad u observar sólo una parte de ella. El primer
procedimiento se llama enumeración completa o censo, el segundo es llamado muestreo. En la práctica
realizar censo es demasiado costoso, largo y a veces físicamente imposible, por ello debemos recurrir al
muestreo como único método práctico de realizar el estudio.

Existen diferentes tipos de muestreo, así:

 Muestreo Probabilístico:
 Aleatorio simple
 Porcentual
 Estratificado
 Sistemático
 Conglomerados
 Por etapas
 No Probabilístico
 Por cuotas
 Basado en criterios de expertos

La muestra debe representar a la población adecuadamente; es decir, la muestra debe tener la


variabilidad que posee la población para que ésta pueda considerarse representativa.

3. Recolección de Datos. Una vez definido el diseño muestral o diseño del experimento se procede a la
recolección de datos. Esta etapa es la que consume mayor tiempo y es un componente costoso del proceso
estadístico total.
Se recopila información por observación, por encuestas o simplemente es obtenida de publicaciones y/o
fuentes confiables.
Para la recolección de la información se utiliza por lo general cuestionarios cerrados o preguntas
claras o precisas.

4. Procesamiento, Clasificación y Organización de Datos. Una vez reunidos los datos, estos deben ser
ordenados en forma legible. Pueden ser clasificados según algún criterio y presentados en tablas o cuadros o
bien en gráficas o diagramas. Seguido de esto se calculan medidas descriptivas como la varianza, la media,
etc. Una medida derivada de los datos muestrales se llama estadigrafo, mientras que una medida derivada a
partir de la población se llama parámetro.

5. Análisis y Generalización de los Resultados. Luego se concluye con el análisis y generalización de los
resultados, que consiste en realizar un análisis de los datos muestrales y establecer conclusiones
generalizadas para toda la población. Cuando la muestra incluye toda la población, es decir, cuando se ha
hecho un censo, la última etapa del análisis es la etapa descriptiva, con esto las características de la
población habrán sido descritas y se podrá tomar decisiones de uno u otro tipo acerca de ella.
Pero si se realizó un muestreo, el estudio no se detendrá con las medidas descriptivas, pues se necesita
de metodologías y del razonamiento para llegar a conclusiones; a esto se llama Estadística Inductiva, esta es
parte más valiosa de la estadística.

TRATAMIENTO DE DATOS

Una vez obtenidos los datos de encuestas experimentos o cualquier serie de medidas, los datos estadísticos
son con frecuencia tan numerosos que se hace necesario ordenarlos y organizarlos de tal manera que sea más
fácil manejarlos y además con una simple mirada podamos identificar algunas características como ser:
 Su valor mínimo
 Su valor máximo
 El valor que más se repite
 Podemos definir fácilmente los datos en secciones
 Podemos observar la distancia entre los valores consecutivos
 Podemos apreciar ¿qué otros valores se repiten más?

La organización de datos contempla las siguientes etapas:

1. Revisión y corrección de la información recogida.


2. Presentación de la información mediante cuadros.
3. Presentación de la información mediante gráficas.

-5-
ESTADÍSTICA PEGGI MONTOYA 6

DISTRIBUCION DE FRECUENCIA DE UNA VARIABLE DISCRETA

Cuando se estudia la característica X de una población, el mayor interés del investigador es conocer la
distribución de esta característica a través de los posibles valores del mismo:
Una distribución de frecuencia es un arreglo de datos observados x1, x2, x3,….xn de la variable X,
donde Y1 , Y2 , Y3 , Y4 ,…… Ym es el conjunto de valores diferentes que toma la variable X , y ni representa sus
respectivas frecuencias, donde:

n : Número total de observaciones.


m : Número de los diferentes valores que hay en las n observaciones.
n m : Esto debe cumplirse

Frec. Frec. Frec. relativa Frec. relativa


Frecuencia Frecuencia
Valor de la Acumulada Acumulada acumulada acumulada
Absoluta Relativa
Variable x Menor que Mayor que menor que mayor que
ni hi
Ni Ni * Hi Hi*
Y1 n1 N1 N1 h1 H1 H1*
Y2 n2 N2 N2 h2 H2 H2*
. . . . .
. . . . .
Ym n3 Nm Nm hm Hm Hm*

Frecuencia Absoluta (ni): La frecuencia absoluta de la variable Yi, es el número de veces que aparece repetido
dicho valor en el conjunto de las observaciones realizadas.

Frecuencia Acumulada Menor que (Ni): La frecuencia acumulada menor que correspondiente al valor Yi, viene
a ser el número de las observaciones cuyos valores son menores o iguales a Yi.

Frecuencia Acumulada Mayor que (Ni * ): La frecuencia acumulada mayor que correspondiente al valor Yi,
viene a ser el número de las observaciones cuyos valores son mayores o iguales a Yi.

Frecuencia Relativa (hi): La frecuencia relativa correspondiente al valor Yi, viene a ser el cociente entre la
frecuencia absoluta y el número total de observaciones.

hi= ni/n
Frecuencia Relativa Acumulada menor que (Hi): La frecuencia relativa acumulada menor que de Yi , viene a
ser el cociente entre su frecuencia absoluta acumulada menor que y el número total de observaciones.

N i n1  n2  n3 ........  ni
 ( j 1 n j ) / n
i
Hi  
n n
n1 n2 n3 n
   ....  i  h1  h2  h3  ...  hi   j 1 h j
i

n n n n
Frecuencia Relativa mayor que (Hi *).- La frecuencia relativa acumulada mayor que del valor de Yi , viene a
ser a frecuencia total de las observaciones mayores o iguales a yi

H i *   ji h j  h i  h i1  h i 2 ........  h m


m

Algunas propiedades:
m m

 hj  1
j 1
n
j i
j  Ni *

-6-
ESTADÍSTICA PEGGI MONTOYA 7

n
j 1
j n n = N1 *
m
Hi*   hj
j i

i
Ni  n
j 1
i

ni  N1  N 2  N 3  N 4  ....  N m  n

N i  N i 1  ni

n  N1*  N 2 *  N 3 *  N 4 *  ....  N m *  nm

N i *  ni  N *i 1

De igual forma se puede hacer el análisis para las frecuencias relativas

H i  H i 1  hi H i *  hi  H *i 1
Ejemplo:

Durante 25 días se observo el número de artículos defectuosos:


3, 4, 3, 2, 1, 0, 3, 4, 4, 0, 1, 2, 4, 4, 4, 2, 2, 3, 3, 1, 3, 2, 2, 0, 1
n=25
m=5

Variable * *
Frecuencia ni Ni hi Hi
X Ni Hi
0 3 3 3/25 3/25 25 1
1 4 7 4/25 7/25 22 22/25
2 6 13 6/25 13/25 18 18/25
3 6 19 6/25 19/25 12 12/25
4 6 25 6/25 25/25 6 6/25

n3=6 …………………… Es el número de días que hubo 2 artículos defectuosos


N5=25 …………………... Es el número de días que hubo 4 0 menos artículos defectuosos
h2=4/25 …………………. Es la proporción de días con un 1 artículo defectuoso
H3=13/25…………………Es la proporción de días con 2 o menos artículos defectuosos
N4*=12 …………………. Representa el número de días que se ha encontrado 3 o más artículos defectuosos
H2*=22/25 ……………... Es la proporción de dias que se ha tenidos 1 o más artículos defectuosos

DISTRIBUCIONES DE FRECUENCIA DE DATOS AGRUPADOS EN INTERVALOS DE CLASES

A continuación anotamos algunas razones por las cuales es necesario agrupar los datos en clases:
1. Es antieconómico trabajar con muchos datos.
2. Poco práctico
3. Algunos valores tienen a veces frecuencias tan bajas que no se justifica mantenerlos como entidades
individuales o aisladas.

Rango o recorrido de la variable Es la longitud del recorrido del conjunto de datos y se simboliza
por la letra R.

-7-
ESTADÍSTICA PEGGI MONTOYA 8

Clase Se llama clase a cada uno de los grupos en que se dividen los datos, o a cada uno de los
grupos que describe una característica. El número de clases se simboliza por la letra m. El número de
clases no debe ser grande porque no se simplificaría el trabajo, pero tampoco debe ser pequeño
porque perderíamos información. Algunos autores aconsejan que el número de clases debe estar
comprendido entre 5 y 20 ; otros entre 8 y 15. Para determinar el número de clases se dispone dos
puntos de vista que plantean que :
* m ≥ n siempre que n sea mayor que 25
* m = 1+3.22 log(n) ; conocido como la regla de Sturges
Intervalos de Clase: Esta formado por los valores contenidos entre el limite superior e inferior de cada clase.

Amplitud de Clase: Es la diferencia que hay entre el limite superior e inferior de cada clase. Los intervalos de
clase pueden ser de:
 Amplitud constante (se usa más)
 Amplitud variable
 La amplitud de clase se simboliza con la letra C= R/m

Se sugiere que los intervalos de clase contengan solamente datos más o menos homogéneos. Estos intervalos
pueden ser:
 Intervalos Semiabiertos [ > , < ]

TABLA - 1
Valores que caen dentro del
Intervalos Frecuencia
intervalo
[ 21 , 24 > 21, 23, 23, 22, 21 5
[ 24 , 27 > 24, 25, 25 , 26, 24, 25 6
[ 27 , 30 > 27, 27, 27, 28, 28, 29, 30 7

TABLA - 2
Peso en Kg. Numero de personas
50 -- 54 4
55 -- 59 8
60 -- 64 12
65 -- 69 4

Los limites de clase pueden ser:


 Limites reales, como se indica en la TABLA – 1
 Limites aparentes, como se indica en la TABLA – 2

Los limites reales de los intervalos de clase se obtendrá restando y sumando 0.5 (mitad de la unidad de medida)
al limite inferior y superior, respectivamente.
Ejemplo:

Limites Aparentes Frecuencia


10 12 3
13 14 10
15 16 15
17 18 11

Limites Reales de Clase Frecuencia


9.5 12.5 3
12.5 14.5 10
14.5 16.5 15
16.5 18.5 11

-8-
ESTADÍSTICA PEGGI MONTOYA 9

Marca de Clase

Es el valor promedio de los límites reales (o aparentes ) de cada intervalo de clase punto medio del intervalo de
clase y se obtiene sumando el límite inferior más el límite superior de una clase todo dividido entre 2.

Regla para la construcción de una distribución de frecuencias de una variable agrupada en


intervalos de clase

1. Determinar el rango

Rango = Xmax – Xmin

2. Definir el número de Clases (m)

Esto depende de la experiencia del investigador, de la naturaleza del tema, etc. Para determinar el número
de clase se sugiere el uso de las siguientes reglas:
 Regla de Sturges m  1 3.22 * log n
 Regla m  n ; Cuando n>25
La práctica aconseja que el número de clases no sea pequeña, debido a que la condensación de la
información se vería afectada; pero tampoco, debe ser grande porque no se simplificaría el trabajo
El número de clases siempre debe ser un valor entero

3. Se determina la amplitud de cada clase (c)


R
C 
m
Si c resulta un valor decimal este debe redondearse al inmediato superior, por consiguiente el rango deberá
también ampliarse. Si c resulta entero se pasa al 4.

4. Este último cálculo se adiciona el valor Xmin y así obtenemos el límite superior de primera clase, el límite
inferior de la primera clase es igual a Xmin.

El límite inferior de la 2da. Clase será igual al limite superior de la anterior y el límite superior de la segunda
clase se obtendrá sumándole a este último el valor de la amplitud de la clase y asi sucesivamente.

Limite Inferior Limite Superior


LI1 =Xmin LS1 = LI1 + (c)
LI2 = LS1. LS2 = LI2 + (c)
LI3 = LS2 LS3 = LI3 + (c)
LI4 = LS3. LS4 = LI4 + (c)
LI5 = LS4. LS5 = LI5 + (c)

5. Luego se determina la marca de clase, la frecuencia absoluta, la frecuencia relativa, las frecuencias
acumuladas mayores y menores que, las frecuencias relativas acumuladas mayores y menores que.

Ejemplo:

Los siguientes datos son mediciones de intensidad solar en (watt/m 2) realizadas en distintos días en una
localidad del sur de Santa Cruz.

562 869 708 775 775 704 809 856 655 806 878 870 909 918 558 768
918 940 946 898 661 820 935 952 957 693 835 905 939 955 960 498
653 730 753

Organice estos datos en una tabla de distribución de frecuencias con 5 clases


m=5
Rango = 960 – 498 = 462
R 462
C   92.4
m 5
Como no es entero redondeamos el valor de c a: c = 93

-9-
ESTADÍSTICA PEGGI MONTOYA 10

Intensidad Solar En (Watt/M2) De Una Localidad Del Sur De La Ciudad


De Santa Cruz Tomada En Distintos Días.

Intervalos de Clase *
ni Ni hi Hi yi
Reales Ni
498 591 3 3 3/35 3/35 35 544
591 684 3 6 3/35 6/35 32 637
684 777 8 14 8/35 14/35 29 730
777 870 6 20 6/35 20/35 21 823
870 963 15 35 15/35 35/35 6 916

Terminado este cálculo se debe interpretar:

y2 = 637 Watt/M2; este es el valor representativo de la segunda clase


n1 = 3; ha habido tres días en la intensidad solar estuvo entre 509.5 - 683 Watt/M2
N4 = 20; ha habido 20 días con intensidad solar igual o menor que 869.5 Watt/M2
H1 = 3/35; es la proporción de días en que la intensidad solar ha sido 590.5
Watt/M2 o menos
N5* = 6; ha habido 6 días o más en que la intensidad solar ha sido de 869.5
Watt/M2 o más

NOTA:
En toda tabla o cuadro estadístico debe considerarse:
1. Titulo
2. Indicaciones complementarias
3. El cuadro propiamente dicho.

REPRESENTACIONES GRÁFICAS

Las representaciones gráficas sean de distribuciones de frecuencias absolutas o relativas son útiles porque
ponen de relieve, aclaran las tendencias de los datos que no se captan fácilmente.

Los gráficos:

 Atraen la atención del investigador sobre los datos.


 Ayudan a resolver problemas concernientes a distribuciones de frecuencias.
 Nos permiten estimar algunos valores con una simple ojeada.
 Nos brindan una verificación grafica sobre la veracidad de nuestras soluciones.

Existen diferentes tipos de representaciones gráficas como ser:

1. Histogramas
2. Diagrama de barras
3. Polígono de frecuencias
4. Polígono de frecuencias acumuladas “Ojivas”
5. Pictografos
6. Gráfico de sectores o de Pastel

1. Diagrama de frecuencias.

Se usa para representar gráficamente diferentes tipos de distribución de datos discretos. Con este tipo
de representación grafica se puede representar tanto datos absolutos como relativos, así mismo frecuencias
acumuladas. Así:
 Diagrama de frecuencias absolutas
 Diagrama de frecuencias absolutas acumulada menor que
 Diagrama de frecuencias absolutas acumulada mayor que
 Diagrama de frecuencias absolutas relativas

- 10 -
ESTADÍSTICA PEGGI MONTOYA 11

 Diagrama de frecuencias absolutas relativas acumulada menor que


 Diagrama de frecuencias absolutas relativas acumulada mayor que

Número de hijos

yi ni Ni hi
0 3 3 3/20
1 4 7 4/20
2 7 14 7/20
3 5 19 5/20
4 1 20 1/20

Diagrama de frecuencias absolutas del número de hijos de un grupo de familias

Diagrama de frecuencias absoluta acumuladas menor que

2. Diagrama de Barras.

Consiste en representar el fenómeno que se estudia a través de barras verticales u horizontales. Este
tipo de grafico se usa para representar variables cualitativas y discretas. Así podemos tener:
 Diagrama de barras simples

- 11 -
ESTADÍSTICA PEGGI MONTOYA 12

 Diagrama de barras dobles


 Diagrama de barras multiples y
 Diagrama de barras compuestas

Diagrama de Barras Simples


40
35
Frecuencias

30
25
20
15
10
5
0
Atención Atención Vacunación Partos Hospitalización Quemados
Médica Odontológica

Servicios de Atención realizados en el


Hospital del Niño el año 2001

- 12 -
ESTADÍSTICA PEGGI MONTOYA 13

Diagrama de Barras Dobles


45
40
Frecuencias

35
30
25 Año1
20 Año2
15
10
5
0
Atención Médica Atención Vacunación Partos Hospitalización Quemados
Odontológica

Servicios de Atención realizados en el


Hospital del Niño el año 2001-2002

Gráfico Barras Proporcionales


1600

1400

1200
Cantidad de
Estudiantes

1000 Sistemas
Electrónica
800
Civil
600 Industrial

400

200

0
1 2 3 4 5

Años

- 13 -
ESTADÍSTICA PEGGI MONTOYA 14

3. Grafica de sectores o de pastel.


Este tipo de representación es de la misma naturaleza que el gráfico de barras. Se utiliza para
representar datos discretos y cualitativos. Su uso es frecuente para fines comparativos

Gráfico de Sectores o de Pastel

Otros
Internet 7%
6%
Periódicos Periódicos
34% Revistas
Correo
18% Televisión
Radio
Correo

Radio Internet
8% Otros
Revistas
Televisión 7%
20%

4. Histograma de frecuencias.
Se usa para representar gráficamente las frecuencias absolutas y frecuencias relativas de datos
cuantitativos continuos agrupados en intervalos de clase. El histograma esta constituido por una serie de
rectángulos todos de anchura proporcional a la amplitud de clase y de altura proporcional al número de
elementos que cae dentro de cada clase. Así tenemos:
 Histograma de frecuencias absolutas
 Histograma de frecuencias absolutas relativas
 Histograma de frecuencias absolutas acumulada mayor que
 Histograma de frecuencias absolutas acumulada menor que
 Histograma de frecuencias absolutas relativas acumulada mayor que
 Histograma de frecuencias absolutas relativas acumulada menor que

Histogramas

25
frecuencia

20
absoluta

15

10

0
100 - 150 150 - 200 200 - 250 250 - 300 300 - 350 350 - 400 400 - 450

peso de conservas de atun en gr

5. Polígono de frecuencias

- 14 -
ESTADÍSTICA PEGGI MONTOYA 15

Los polígonos de frecuencia pueden ser absolutas o relativas, mayor que o menor que. Estos se
obtienen uniendo los puntos medios de las bases superiores de los rectángulos.
Los polígonos de frecuencias acumuladas se denominan también Ojivas

Gráfico de Polígonos
25

20
Frecuencias

15

10

0
125 175 225 275 325 375 425

Promedio

6.- Ojivas o Polígonos de frecuencia acumulada


Los polígonos de frecuencia acumulada pueden ser polígonos de frecuencia absoluta o relativa mayor o menor
que. Estos se obtienen uniendo los puntos medios de las bases superiores de los rectángulos de un histograma.
Los polígonos de frecuencia acumulada se denominan también ojivas.

7.- Pictografos.-
Es la representación de datos mediante símbolos que por su forma sugieren la naturaleza del dato. Los expertos
ponen en juego gran creatividad e ingenio en la presentación de datos buscando siempre atraer la atención del
auditorio con una vistosa y llamativa presentación de la información

Medidas Descriptivas
Medidas De Tendencia Central

Igual que los promedios las medidas de tendencia central nos indican el punto medio o valor típico de datos que
cabe esperar. Entre las medidas de tendencia central más usadas tenemos: la media o promedio, la moda, la
mediana. Sin embargo existen otras medidas de relativa importancia que estiman el valor medio de las
observaciones así: media ponderada, media armónica y media geométrica.

1. Media Aritmética. Es una medida de valor central que dá información más precisa porque para su cálculo
usa todos los datos. Alrededor de este valor se distribuyen las observaciones individuales. Su valor numérico
se obtiene sumando el valor de todos los datos dividido entre el número de datos obtenidos en el estudio.
 = media de la población
x = media de la muestra

nX
n

 1 i i

X
n

X  1 i
Para datos no tabulados
n

- 15 -
ESTADÍSTICA PEGGI MONTOYA 16

 nY
n

X  1 i i
Para datos tabulados
n
2. Media Ponderada. Se aplica para calcular promedio de cantidades donde cada valor tiene asociado
un numero o peso que la pondera.

Ejemplo

Un comerciante compra tres partidas de maíz a Bs.18.30, Bs.17.40 y Bs.18.60 el kg. Para calcular el precio
promedio es necesario conocer el peso de cada partida, si estos pesos son 360, 1800 y 240 kg
respectivamente. Calcular el precio promedio por kilogramo.

m x i i
X  i 1
n
mi = peso o ponderación de la varible

m
i 1
i

Xi = valor de la variable

m i x 1  m 2 x 2  .....  mx
X
m1  m 2  .....  m n

360 *18.30  1800 *17.40  240 *18.60 42372


X    17655
360  1800  240 2400
Ventajas de la Media

1. Su concepto es conocido por todos y además es bastante claro.


2. Todo conjunto de datos posee una media.
3. La media nos sirve para hacer comparaciones de las medias a partir de varios conjuntos.

Desventajas

1. Aunque es confiable porque refleja todos los valores de un conjunto de datos, pueden ser afectados por
valores extremos que no sean representativos del resto.

Propiedades de la Media

a. La media aritmética de una constante es igual a la constante M ( k ) k.


b. La media aritmética de una variable  una constante e igual a la media aritmética de la variable  la
constante M ( x  k )  x  k .
c. La media aritmética del producto de una variable por una constante que multiplica a la media aritmética
de la variable M ( x  k )  k  x .
d. La media aritmética del cociente de una variable sobre una constante es igual a la media de la variable
 x x
sobre la constante M   .
k k
e. La suma algebraica de las desviaciones de cada valor observado x1 , x2 ,..., xn con respecto a su media
es cero.

 x 
n

1  x  0
i 1

- 16 -
ESTADÍSTICA PEGGI MONTOYA 17

f. La suma de los cuadrados de las desviaciones de cada una de las observaciones x1 , x2 ,..., xn con
respecto a su media es mínima.

 x 
n n 2

 x   xi  a 
2
1
i 1 i 1

m = # de clases

g. Si una muestra de tamaño n se particiona en k submuestras y x1 , x 2 ,..., xk son las medias de las k
submuestras de tamaños respectivamente, entonces:

x = media global de la muestra particionada.


k
x i  ni n = Tamaño de la muestra.
x
i 1 n n i = Tamaño de la submuestra.
x i = Media de la submuestra.
3. Mediana. La mediana es sólo un valor del conjunto de datos que mide el elemento central de los datos. Ese
elemento es el más central en el conjunto de números. La mitad de los elementos se encuentran por arriba de
ese punto y la otra cae debajo de él. Para esto los datos deben estar ordenados en forma ascendente o
descendente.

2.1 Para Datos no Tabulados

a. Si el número de observaciones es impar entonces se ordenan los datos en forma creciente y se


toma como valor de la mediana el valor de la observación que ocupa la posición central.
M e  X  n 1 
 2 

Ejemplo:

19 24 27 37 39 43 51

M e  X  7 1   X 4
 2 
 

b. Si el número de observaciones es par entonces se ordenan los valores en forma creciente y se


observa que los valores centrales
X n   X n 1
Me  2 2

2
Ejemplo:
19 24 27 37 39 43 51

37  39
Me   38
2
2.2 Para Datos Tabulados

a. Para Variable Discreta

- Se construye la tabla de distribución de frecuencias absolutas acumuladas.


- Se determina la frecuencia acumulada menor que

- 17 -
ESTADÍSTICA PEGGI MONTOYA 18

- Determinar la menor frecuencia absoluta acumulada que supere a n tal que:


2
N j1  n  N J
2
 n  N j 1  M e Y   Y j
2
Y  Yj
 n  N  M Y   j 1 o cualquier valor comprendido entre estas.
2 j 1 e
2

Yi ni Ni
Y1 n1 N1
Y2 n2 N2
. . .
. . .
Y j 1 n j 1 N j 1
Yj nj Nj
. . .
. . .
Ym nm Nm

Ejemplo:

1) Dada la tabla de frecuencias de datos discretos hallar la mediana.

Yi ni Ni
20 12 12
30 10 22
50 20 42
60 18 60
70 15 75 n/2=46
80 10 85
90 7 92
92

92
 46  La menor frecuencia acumulada que supere a 46 es N 4  60
2
M e Yi   60

2) Dada la tabla de frecuencias de datos discretos hallar la mediana.

- 18 -
ESTADÍSTICA PEGGI MONTOYA 19

Yi ni Ni
30 4 4
31 2 6
32 2 8
33 1 9
34 1 10
35 3 13 Nj-1
36 2 15
37 2 17 Nj
38 6 23
39 4 27
40 3 30
30

n 30
  15  La menor frecuencia acumulada que supere a 15 es N 8  17
2 2

36  37
M e Yi    36.5
2
b. Para Variable Continua

- Construir la distribución de frecuencias absolutas acumuladas “menor que”.

n
- Determinar la menor de las frecuencias absolutas acumuladas Nj tal que: Nj  puede ser
2
n
 N j. El intervalo de clase correspondiente a Nj es la clase que contiene a la mediana.
2
Una vez determinada la clase que contiene a la mediana se calcula la mediana con la siguiente fórmula:

 n  n 
 2  N j1   2  N j1 
M e  Y' j1 C j    Y' j1 C J  
 N j  N j1   nj 
   
Donde:
C j  amplitud de la clase mediana.
n  número de observaciones.
N j  Frecuencia absoluta acumulada de la clase mediana.
N j 1  Frecuencia absoluta acumulada que precede a la clase
mediana.
n j  número de observaciones que contiene la clase mediana.
“OJO” si la amplitud es constante  Cj  C
 1  H j 1 
M e  Y ' j 1 C j  2 
 H j  H j 1 
Donde H j  frecuencia acumulada relativa de la clase mediana.

Ejemplo:

- 19 -
ESTADÍSTICA PEGGI MONTOYA 20

1) Hallar la mediana de los pesos de 50 lingotes de acero producidos por SIDERMUTUN

Es decir que el peso mediano de los lingotes de acero (50) producidos por SIDERMUTUN es de 93.95
kg/lingote de acero, lo que significa que no más del 50% de ellos tienen un peso mayor que 94.95
kg/lingote.

2) Las notas de 50 alumnos se clasificaron en una tabla de frecuencias con 4 intervalos de clase de
igual magnitud. Se pide calcular la mediana sabiendo además que:

Propiedades de la Mediana

En una distribución simétrica se cumple que

Ventajas de la Mediana

1. Los valores extremos no le afectan tan profundamente como a la media.


2. La mediana es fácil de entender y puede ser calculad con cualquier clase de datos, aún a partir de
datos agrupados con clases abiertas, a menos que la mediana caiga dentro de una clase abierta.
3. Podemos obtener la mediana aún cuando los datos sean descripciones cualitativas.

Desventajas

1. Se trata de un proceso lento para cualquier conjunto de datos que tenga un basto número de
elementos.

4. Moda. La moda es un concepto muy simple, con el mismo sentido que se da en el lenguaje común
La moda de una muestra, es aquel valor variable que se presenta con mayor frecuencia; es decir es el valor que
más se repite y se simboliza así Mo.
Para un conjunto de observaciones la moda puede no existir si es que no se repiten valores medidos entonces la
distribución es uniforme.
Si el conjunto de datos tiene una sola moda se llama unimodal, si tiene dos modas se llama bimodal y si tuviera
más de dos se llamará multimodal.
Cuando en una distribución de frecuencias hay más de una moda, este estadígrafo como medida de tendencia
central no tiene sentido.
Ejemplo

Determinar la moda para cada conjunto de observaciones: 4, 8, 9, 6, 8, 5, 4, 3, 8, en este caso la Mo=8

Cálculo de la moda para datos tabulados

Cuando los datos están tabulados: La clase que contiene la mayor frecuencia será la que contiene a la moda, y
se llama clase modal.

a) Para variable discreta.- La moda es el valor de la variable que se repite más.

Ejemplo:
En la siguiente tabla se muestra la distribución de frcuencias del número de hijos de 20 familias

yi ni Ni hi
0 3 3 3/20
1 4 7 4/20
2 7 14 7/20
3 5 19 5/20
4 1 20 1/20

La mayor frecuencia es 7
Lo que significa que la variable que toma el valor es la moda por ser el valor que más se repite.

b) Para variables continuas.- Aquí se presentan dos casos:

i. Cuando la amplitud del intervalo (c) es constante.

- 20 -
ESTADÍSTICA PEGGI MONTOYA 21

ii. Cuando la amplitud del intervalo es variable.

I. Cuando es constante.- Primero se debe determinar la clase modal que es la clase que tienen mayor
frecuencia , y luego la moda se la calcula a través de la siguiente fórmula:

 d1 
Mo  Y ` j1  Cj  ´
 d1  d 2 
donde:
Y j1  Es el límite inferior de la clase que contiene a la moda
Cj= Es la amplitud de la clase modal
d1= Es la diferencia entre la frecuencia de la clase modal y la post modal
d2= Es la diferencia entre la frecuencia de la clase modal y la post modal
Ejemplo
Los siguientes datos son mediciones de intensidad solar en (watt/m 2) realizadas en distintos días en una
localidad del sur de Santa Cruz, los mismos que están organizados en una tabla de distribución de frecuencias
con 5 intervalos de clase .

Intervalos de Clase *
ni Ni hi Hi yi
Reales Ni
498 591 3 3 3/35 3/35 35 544
591 684 3 6 3/35 6/35 32 637
684 777 8 14 8/35 14/35 29 730
777 870 6 20 6/35 20/35 21 823
870 963 15 35 15/35 35/35 6 916

a) Se pide determinar el valor modal?


La clase que contiene a la moda es la quinta clase porque es la que presenta mayor frecuencia por tanto el
valor de la moda será:
 (15  6) 
Mo  870  93   904.875
 (15  6)  (15  0) 
En la distribución el valor que más se repite es 904.875 watt/m2

II. Cuando la amplitud del intervalo es variable.- Antes de calcular la moda se debe estandarizar la
distribución de frecuencias.

Ventajas de la Moda

1. Puede usarse como una medida central para datos cualitativos y cuantitativos.
2. A semejanza de la mediana a la moda no le afectan los valores extremos.
3. Podemos emplearla cuando una o más clases sean abiertas.

Desventajas de la Moda

1. Algunos datos poseen valor modal (distribución uniforme).


2. Otras veces todos los valores son la moda ya que ocurre el mismo número de veces.
3. Algunos datos proporcionan uno o más valores modales, entonces es difícil interpretar.

RELACIÓN ENTRE LA MEDIA – MEDIANA – MODA

a.- Distribución Simétrica

MODA
MEDIA
MEDIANA En una distribución simétrica la
media, mediana y moda coinciden
con el punto más alto de la gráfica.

- 21 -
ESTADÍSTICA PEGGI MONTOYA 22

b.- Distribución Asimétrica Positiva

MODA
MEDIANA La moda esta en el punto más alto de
la gráfica, pero la mediana esta a la
MEDIA
derecha de este punto y la media a la
derecha de la mediana

c.- Distribución Asimétrica Negativa

MODA
MEDIANA La moda sigue situado en el punto
MEDIA
más alto de la gráfica, hacia la
izquierda esta la mediana y la
izquierda de la mediana esta la
media

5. MEDIA GEOMETRICA. Se usa para medir la tasa promedio de cambio o crecimiento de alguna
cantidad y se calcula tomando la enésima raíz del producto de n valores que representan el cambio.

La media geométrica se aplica cuando estamos usando cantidades que cambian a lo largo de un periodo y
entonces necesitamos saber una tasa promedio de cambio.

a) Para Datos No Tabulados


n
MG  n X 1  X 2  ..  X n MG  n X
i 1
i

log MG = (1/n)[log X1 + logX2 + .. + log Xn]

n
MG  anti log(1 / n )  log X i
i 1

b) Para Datos Tabulados

Si estos estan ordenados en clase seria:

Donde: Yi = Marca de clases


ni = Frecuencia de clases

- 22 -
ESTADÍSTICA PEGGI MONTOYA 23

MG  n Y1  Y2  ..  Yn
m
MG  n Y
i 1
i
ni

MG  n Y1n1 * Y2n2 * Y3n3 * ... * Ymnm

 
1
Log MG  Log Y1n1 * Y2n2 * Y3n3 * ... * Ymnm n

* n1 * LogY1  n2 * LogY2  ...  nm * LogYm 


1
Log MG 
n
m

 n log Y i i
MG  antiLog i 1
n
DESVENTAJAS DE LA MEDIA GEOMETRICA

1. Su calculo es muy engorroso


2. Esta limitado por valores positivos para que pueda ser interpretado
3. Si algún valor de la variable es cero la media geométrica será cero
4. Si aparece algún valor negativo el estadígrafo toma un valor imaginario

APLICACIONES DE LA MEDIA GEOMETRICA

Se aplica en especial a las series cronológicas que siguen una tendencia exponencial, se hace indispensable su
uso si se desea calcular valores intermedios

Ejemplo 1:

Hallar la MG de los siguientes numeros:

X1 = 3 X2 = 4 X3 = 5 X4 = 8 X5 = 3 X6 = 2
MG  3 * 4 * 5 * 8 * 3 * 2  3.77
6

Ejemplo 2:

Hallar la MG de la siguiente distribucion de frecuencia:

Marca de Clase 92 93 94 95 96
Frecuencia 4 11 21 10 4

 4 * Log 92  11* Log 93  21* Log 94  10 * Log 95  4 * Log 96 


MG  antiLog  
 50
 7.855  21.653  41.435  19.777  7.929 
MG  antiLog 
 50 
MG  93.968
Ejemplo 3:

Supóngase que durante 5 años de una economía altamente inflacionaria, los bancos pagan tasas anuales de
interés de 50, 100, 150, 250, 300. ¿Hallar la tasa de interés promedio anual de un deposito de 100?

- 23 -
ESTADÍSTICA PEGGI MONTOYA 24

Factor de Ahorro al final Ahorro Ahorro


Año Tasa de Interes
crecimiento del año X MG
1 50% 1.5 150 270 253.6
2 100% 2.0 300 729 643.1
3 150% 2.5 750 1968.3 1630.97
4 250% 3.5 2625 5314.41 4136.16
5 300% 4.0 10500 14348.91 10489.29

50
 Factor de crecimiento es 1  1.5
100
Si sacamos una media aritmética tenemos:

13.5
1.5  2  2.5  3.5  1   2.7  Media Aritmética del factor de crecimiento
5

1  2.7
100
  2.7  1 * 100  170%anual
Entonces el deposito crecerá como se muestra:

100 * 2.7 * 2.7 * 2.7 * 2.7 * 2.7  14348 .91


Si sacamos la media geométrica tenemos:

MG  5 1.5 * 2 * 2.5 * 3.5 * 4  2.536  Media Geométrica del factor de


crecimiento

100 * 2.536 * 2.536 * 2.536 * 2.536 * 2.536  10489 .29


En este caso puede observarse que la media apropiada es la Media Geométrica.

Ejemplo 4:

En una empresa, la producción ha experimentado un crecimiento del 25% del primer al segundo año del 30% del
segundo al tercero y del 40% del tercero al cuarto.
a) Determine la tasa de crecimiento del primero al cuarto.
b) Estime la producción del 5 año.

Año % de Factor de Producción Producción Producción


crecimiento cambio (Xi) (TM) usando MG
usando X
1 1.00 100 100 100
2 25% 1.25 125 131.66 131.52
3 30% 1.30 162.5 173.34 172.97
4 40% 1.40 227.5 228.22 227.49
5 300.00 299.20

Media Aritmética = ( 1.25 + 1.3 + 1.4 ) / 3 = 1.3166

3
Media Geométrica = 1.25 x1.3 x1.4
Ejemplo 4:

- 24 -
ESTADÍSTICA PEGGI MONTOYA 25

En una empresa, la produccion ha experimentado un crecimiento del 25% del primer al segundo año del 60% del
segundo al tercero y del 100% del tercero al cuarto.
c) Determine la tasa de crecimiento del primero al cuarto.
d) Estime la produccion del 5 año.

Año % de Factor de Producción Producción Producción


crecimiento cambio (Xi) (TM) usando MG
usando X
1 1.00 100 100 100
2 25% 1.25 125 161.66 158.74
3 60% 1.60 200 261.36111 251.98421
4 100% 2.00 400 422.53379 400.00000
5 683.09633 634.96042

Media Aritmética = ( 1.25 + 1.6 + 2 ) / 3 = 1.6166666

3
Media Geométrica = 1.25 x1.6 x 2 =1.5874

6.- CUANTILES

Como una consecuencia de la mediana es fácil aplicar este concepto a otros estadígrafos que dividen a los datos
en otras proporciones. Así como: los cuartiles, los deciles y los percentiles.

6.1 Cuartiles

Los cuartiles son valores que dividen a un conjunto de datos ordenados en forma ascendente o descendente en
cuatro partes iguales y se denota por: Qi; i=1, 2, 3.

25% Q1 Q2 Q3
50%
75%

Q1 = es el valor supera a no más de un cuarto de las observaciones y es superado por no más tres cuartos de
ella.
Para Datos No Tabulados

1. Se ordenan los valores en forma ascendente o descendente


2. Se localiza el punto (n + 1) / 4 en los datos ordenados
3. Si (n + 1) / 4 es un entero; Qi = X ((n + 1) / 4) ; i = 1, 2, 3, ..

Si (n + 1) / 4 no es un entero entonces para calcular Qi hacemos la interpolación inicial entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentra la fracción.

Ejemplo:

1. Los jornales por hora de los operarios de industria son:

32 38 42 49 54 65 81
36 40 45 50 55 70 90
37 41 48 52 58 80

Se pide determinar : Q1, Q2, Q3

(n + 1) / 4 = (20 + 1) / 4 = 21/4 = 5.25  como no es un valor entero hay que interpolar

- 25 -
ESTADÍSTICA PEGGI MONTOYA 26

Q1 = X5.25 = 40 - 41

Q1 = 40 + (41 – 40)(0.25) = 40.25


Q1 = 40.25

2((n + 1)/4) = 2 (21/4) = 10.5

Q2 = X10.5= 49 + 0.5(50 – 49) = 49.5

Q3 = 58 + 0.75(65 – 58) =63.25

Ejemplo 2:

En el siguiente cuadro se indican las estaturas de un grupo de 15 niños (en centímetros).

Estaturas en centímetros
120 128.5 137
121 129.2 138.1
122.5 130 139.5
125 135 139.8
128 136 140

n  1 15  1 16
  4
4 4 4

X 4  125 Q1  125

Para datos tabulados.

1.- Se construye la tabla de frecuencia absolutas acumuladas “menor que” o la de las frecuencias relativas
“menor que”.
2.- Se identifica la clase que contiene a Q1, determinando la menor de las frecuencias absolutas acumuladas Nj
ni ai
que supere a (o la menor Hj que supere )
4 4
ni  1 
N j 1   Nj  H j 1  i  H j 
4  4 

ni  1
i) N j 1   H j 1  
4  4
Entonces Qi = al límite inferior de la clase que contiene a Nj = Y’j-1

ii) N j-1 es menor que ni/4 entonces el Qi es:


 n  n 
 4  N j1   4  N j1 
Qi  Y' j1 C j    Y' j1 C J  
 N j  N j1   nj 
   
NOTA: El calculo de los denciles y percentiles se hace de forma semejante al de los cuarteles, tanto para el caso
en que los datos estén tabulados o no

- 26 -

También podría gustarte