Está en la página 1de 23

2014

ESTADSTICA
GENERAL
Apuntes del curso
Ing. Sergio Anbal Dopazo

Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 1 de 120


ESTADSTICA DESCRIPTIVA

La Estadstica es un mtodo de descripcin numrica de conjuntos numerosos, o sea, un
mtodo de descripcin cuantitativa que utiliza al dato (numrico o no) como soporte objetivo. No se
debe conceder a los datos estadsticos un valor o una precisin que no poseen. Para ser eficaz, la
Estadstica debe necesariamente simplificar. Cuando se describe una poblacin segn un carcter,
todos los individuos que presenten la misma modalidad del carcter se consideran equivalentes. Se
puede, ciertamente, considerar un nmero elevado de criterios de diferenciacin entre los individuos,
pero el costo de recopilacin de la informacin se encuentra rpidamente entorpecido y el anlisis
complicado. Adems, es necesario observar que los datos estadsticos no escapan de la regla
general de las medidas, que es la de estar afectadas de error.

Adems, la Estadstica no se ocupa de los casos raros, que, en general, son mal conocidos: la
ancdota no pertenece al dominio estadstico. Las permanencias estadsticas no aparecen, en
efecto, ms que en conjuntos numerosos. Se puede concluir que la Estadstica Descriptiva es una
tcnica de anlisis de conjuntos numerosos; la misma se aplica a todos los dominios de investigacin
cuantitativa: investigacin demogrfica, econmica, agronmica, biolgica, industrial... No obstante,
los mtodos de recoleccin de informacin, la crtica de los datos recopilados, y ms an la
interpretacin de los resultados obtenidos, no son propiamente hablando, competencia de la
Estadstica Descriptiva. Numerosas crticas hechas a la Estadstica se dirigen realmente al dominio
en que se le aplica o a la interpretacin que ella da a los resultados que expone y no a su mtodo en
s.


QU SON LOS DATOS?

Para conocer las condiciones reales de algo (elemento, proceso, producto), es necesario
medirlo. Para ello se utilizan instrumentos de medicin, que pueden ser de distinta naturaleza, segn
lo que sea necesario medir. Existe la ms variada gama de instrumentos, pero todos, a partir de las
mediciones que se realizan con ellos, entregan informacin. Estas mediciones, estadsticas, son los
Datos de la Realidad.

Para no tener una imagen deformada de la realidad, se deben cumplir las siguientes
condiciones: la medicin, el registro de los datos y las operaciones realizadas con la interpretacin de
sus resultados, deben ser correctos. Si ello no ocurriera, tendremos una imagen deformada de la
realidad, lo cual nos puede llevar a una accin equivocada.

Los datos son los hechos y los nmeros que se renen, analizan y resumen para su
presentacin e interpretacin. Al estar reunidos, los datos recopilados se denominan en general
conjunto de datos para el estudio. Los datos nos proveen una informacin que tiene un propsito
definido, por eso tanto la forma en que se tomarn los datos como su misma naturaleza, quedan
automticamente determinadas por ese objetivo.

Los elementos son las entidades acerca de las cuales se renen los datos, y una variable es
una caracterstica de inters de los elementos. En definitiva, los datos se obtienen anotando las
mediciones de cada variable para cada elemento en el estudio, y al conjunto de mediciones, reunido
para determinado elemento se llama observacin. Dicha observacin procesada de manera
conveniente, se convierte en informacin vital.

Las informaciones pueden ser cualitativas, no expresables en escalas numricas, o
cuantitativas, las cuales surgen de datos cuantitativos, expresables en escalas numricas
Pgina 2 de 120 Ing. Sergio Anbal Dopazo

ordenables. Estas informaciones cuantitativas son medibles o numerables, el nmero que surge es
variable con cada modalidad medible y se llama variable estadstica.

OBJETIVO DE LA RECOLECCIN DE DATOS

Todos los datos deben estar referidos al problema. En muchas empresas, existe la costumbre
de guardarlos "por si llegaran a necesitarse" o con la intencin de analizarlos "cuando haya tiempo";
estos datos no sirven, porque no responden al momento en que se va a efectuar la accin
correspondiente. Los datos nos proveen una informacin que tiene un propsito definido, por eso
tanto la forma en que se tomarn los datos como su misma naturaleza, quedan automticamente
determinadas por ese objetivo.

La Buena Informacin sirve al Ente Central de todo este trabajo, quien es el que analiza y
resuelve los problemas, en definitiva es: El Hombre Que Toma Decisiones (H.Q.T.D.). Para tomar
estas decisiones racionales, se debe estar bien informado y para ello se debe remitir al pasado,
sabiendo que las mismas influyen en el futuro. Hay que tener en cuenta que la accin se convierte
luego en informacin, continuando el ciclo en la toma de decisiones cotidiana.

Hoy, la calidad en la toma de decisiones, exige elegir mtodos apropiados. Los mtodos
pueden ser: Subjetivos u Objetivos. Los subjetivos, dependen de la formacin personal y
profesional; en cambio los objetivos, dependen del conocimiento cientfico y de las herramientas
existentes.

Las acciones pueden ser de distinta naturaleza: corregir un proceso, rechazar o aceptar un
lote, parar o no un proceso, realizar una reparacin, comprar o no una mquina, etc.


TIPOS DE DATOS

a) DATOS DE MEDICIN (variables): Son los que responden a una variable
continua, en los que se registra el valor ledo, seguido por la unidad de medida
correspondiente.

b) DATOS DE CONTEO (atributos): Son los que responden a una variable
discreta, un lote no puede contener 2,5 unidades defectuosas.

c) DATOS DE PONDERACIN: Son datos, en los que se asigna un valor a un
atributo para cuantificarlo, se suelen aplicar en casos como ser: evaluacin de
texturas, sabores, grado de confort, etc., y normalmente se usan tomando como
base un patrn de comparacin.

Adems, a los datos, podemos tipificarlos de la siguiente manera:

d) DATOS PARA COMPRENDER LA SITUACIN ACTUAL: Son datos que se
recogen para tomar conocimiento de cules son las caractersticas de una
determinada situacin o poblacin de estudio. La cantidad de datos a recolectar
depender del nivel de seguridad pretendida en las conclusiones que de ellos
obtengamos.

e) DATOS PARA EL ANLISIS CAUSA/EFECTO: Son datos que se obtienen de a
pares, para evaluar la relacin existente (por ejemplo: entre un defecto y su
causa aparente); esto implica realizar pruebas sucesivas hasta encontrar la
causa verdadera del problema. Se utilizan herramientas estadsticas.
Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 3 de 120


f) DATOS PARA EL CONTROL: Son datos que se toman de manera tal, que
brinden una informacin que permita saber si una situacin se encuentra o no en
estado de control estadstico. Esto permitir tomar la accin adecuada para
mantenerla bajo control o para volverla a ese estado, segn sea el caso.

g) DATOS DE/PARA LA REGULACIN: Son datos que sirven de base para fijar
los parmetros de funcionamiento de un sistema o proceso. Las especificaciones
finales, estarn basadas en esos datos.

h) DATOS PARA LA APROBACIN o RECHAZO; COMPRA o VENTA: Son datos
que permiten tomar la accin de decidir sobre lo que se est evaluando.


ANLISIS DE DATOS

Antes haremos algunas consideraciones sobre los datos. Para cumplir con los objetivos de la
recoleccin de ellos, los datos deben cumplir ciertos requisitos:

LOS DATOS DEBEN SER COMPLETOS: Debe registrarse toda la informacin requerida; un
registro parcial no ser compatible con el resto de la informacin y, por lo tanto, deber ser
descartado, lo que equivale a no haberlo tomado, o sea, que es trabajo desperdiciado. Se
debe ser muy cuidadoso con los detalles que, en apariencia, no son de importancia (tales
como: fecha, hora, nmero de mquina, orden de los datos, etc.).

LOS DATOS DEBEN SER HOMOGNEOS: Todos los datos deben ser tomados en las
mismas condiciones, con el mismo instrumental (de igual nivel de calibracin). Datos que no
son homogneos con el resto debern ser descartados, y esto es esfuerzo desperdiciado.

LOS DATOS TIENEN VARIACIN: Al tomar una serie de mediciones de una caracterstica
dada, nos encontramos con que existen diferencias entre los valores ledos. Estas diferencias
son explicadas en la Teora de la Variacin, que define que la variacin es una ley natural.
No existen en la naturaleza dos elementos exactamente iguales (idnticos). Estas
diferencias son el efecto visible de las llamadas causas no asignables (o causas naturales
de variacin). Dichas causas siguen un patrn o un "Modelo Probabilstico": las leyes del
azar. Estas leyes sern definidas por las matemticas. Tambin los datos pueden ser
diferentes como consecuencia de otras causas, las cuales seguirn otras leyes de
probabilidad.

El procesamiento de los datos nos provee informacin simple y vital referida a un nico objeto
de estudio. Entonces la estadstica nos brinda, por medio del anlisis, una serie de valores que
representan al conjunto estudiado; por ello, es importante definir algunos conceptos fundamentales:

VARIABLE: Es una caracterstica de inters de estudio de los Individuos. Trabajaremos con
variables cuantitativas, stas pueden ser discretas o pueden ser continuas:

Variables Estadsticas Discretas: Son aquellas donde sus valores posibles son
valores aislados, a saltos, o tienen un incremento fijo. Las mismas surgen del conteo o
de la observacin directa: la cantidad de hijos de una familia, la cantidad de piezas
defectuosas de un lote, el nmero salido en un dado o en una ruleta, etc.

Variables Estadsticas Continuas: Son aquellas donde sus valores posibles estn en
un nmero infinito y a priori, entre dos valores cualesquiera, existen infinidad de ellos.
Pgina 4 de 120 Ing. Sergio Anbal Dopazo

Las mismas surgen de la medicin o de su naturaleza intrnseca: el salario de un
empleado, el beneficio anual de una empresa, la edad de una persona, el peso de un
cuerpo, y, en general, todas las magnitudes. Para estudiar a estas variables se deben
definir clases de agrupamiento, que pueden tener una amplitud constante o variable.

Se debe aclarar, que la distincin entre variable estadstica discreta y continua es, a
veces, arbitraria. En realidad, toda medida es discreta, debido a una precisin limitada.
Por ejemplo si se miden los dimetros de piezas mecnicas con una aproximacin de
centsima de milmetro (13,63 mm) esto significa que su dimetro est comprendido
entre 13,625 mm y 13,635 mm; si se afirma que el dimetro es una variable continua,
se debe a su naturaleza intrnseca, independientemente de la medida y de la nocin
de dimetro. Se puede convenir que una medida o una magnitud, que pueda tomar un
gran nmero de valores posibles (aunque sean aislados), se representa por un
intervalo de valores; por lo tanto ser considerada como una variable continua. Como
ejemplos particulares tenemos: los salarios de los empleados y los beneficios de una
empresa. Para estudiar una variable estadstica continua, se deben definir las clases o
grupos de valores posibles, la amplitud de cada clase puede ser constante o variable.

Tambin, a las variables, se las puede clasificar en: dicotmicas (las cuales tienen
dos posibles resultados) o no.

INDIVIDUO: Es la mnima parte de la Poblacin que posee la caracterstica objeto de estudio.

POBLACIN: Es el conjunto de todos los Individuos que poseen la caracterstica a estudiar.
Tambin se la llama UNIVERSO. Los valores caractersticos distintivos de una
poblacin reciben el nombre de parmetros poblacionales o, simplemente,
parmetros. Por su naturaleza, las poblaciones pueden ser discretas (unidades que
se pueden separar entre s) o continuas (no pueden separarse en unidades reales).
Adems, por su tamao, las poblaciones se clasifican en finitas (de tamao pequeo)
e infinitas (de tamao muy grande); sabemos que, en la prctica, el infinito no existe.

LOTES: Son particiones de una poblacin infinita que, se supone, conservan los mismos
parmetros.

Debemos aclarar que, casi siempre, en la prctica estos parmetros son desconocidos, ya
que no se tienen todos los datos. Esto se debe a muchas causas: tiempo, costo, etc.; y, a veces, se
nos hace difcil o imposible conocer a todos los individuos. Es, por eso, que la estadstica usa
muestras y por medio de ciertas metodologas permite Inferir sobre la poblacin objeto de estudio.

MUESTRAS: Es una porcin de la poblacin que se extrae para estudiarla. Los valores
caractersticos distintivos de una muestra reciben el nombre de estadsticos o
estimadores muestrales o simplemente estimadores. Estos se utilizan para estimar
o inferir los parmetros de la poblacin objeto de estudio.










Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 5 de 120

PROCESO ESTADSTICO DESCRIPTIVO DE LOS DATOS

VALORES CARACTERSTICOS DE TENDENCIA (O POSICIONAMIENTO) CENTRAL:

Por convencin: los parmetros (valores caractersticos distintivos poblacionales) se
identificarn con letras del alfabeto griego; en cambio, los estimadores (valores caractersticos
distintivos muestrales) se identificarn con letras de nuestro alfabeto. Al tamao de la poblacin la
indicaremos con N y al de la muestra con n.

MEDIA (o Promedio): Es el promedio Aritmtico (o sea, la suma de todos los valores
observados dividido por el total de observaciones). Es un concepto matemtico de equilibrio
(baricentro o centro de gravedad) en donde todos los datos se encuentran en equilibrio
matemtico respecto de l. Hay otros promedios: como el Armnico (se utiliza para
promediar razones; que indica la relacin entre dos tipos diferentes de unidades de medida
que pueden ser expresadas recprocamente: Km/h., etc.; en dnde el numerador permanece
constante y el denominador es lo que varia). Tambin tenemos al Geomtrico (se utiliza para
promediar tasas de cambio, valores porcentuales como el inters mensual, etc.).

MEDIANA (o Valor Mediano): Es el valor de la variable que divide en dos efectivos iguales a
los individuos observados ordenados por valor creciente del carcter (la posicin que ocupa la
mediana corresponde al total de los individuos observados divido 2; o sea, que el 50% son
inferiores que ella y el otro 50% son superiores).

MODA (o Modo, o Valor Modal): Es el valor ms frecuente de la variable, el valor dominante.
Es el que est ms repetido dentro de un conjunto observado. El ms frecuente dentro de los
ms frecuentes. Un conjunto observado puede ser unimodal (moda nica), puede ser
plurimodal (varios valores modales) o puede ser amodal (carente de moda o todos los
valores tienen la misma influencia).

VALORES CARACTERSTICOS DE DISPERSIN:

DESVOS: Son la diferencia entre un valor cualquiera que puede tomar la variable y una
caracterstica de tendencia central (las ms usadas son la mediana y la media aritmtica). Se
denominan: desvos respecto de la mediana y desvos respecto de la media. Indican la
distancia a la que se encuentran los correspondientes valores respecto del valor tomado como
referencia (alejamiento en magnitud y direccin). Por la propiedad que tienen los baricentros,
la suma de todas las desviaciones con respecto a la media aritmtica es igual a cero.

DESVO MEDIO: Es el promedio de los desvos respecto de la media aritmtica tomados en
valor absoluto. Representa el promedio de la distancia de todos los valores respecto del
promedio.

VARIANZA (o Variancia): Es el promedio de los desvos respecto de la media aritmtica
elevados al cuadrado. Se elevan al cuadrado para que la sumatoria no sea nula. Representa
la variabilidad que tienen los datos entre s, o sea, el rea de dispersin de los datos tomando
como centro al promedio aritmtico. sta tiene ciertas propiedades matemticas, pero es de
poca comprensin ya que las unidades de la variable se expresan al cuadrado ($, etc.).

DESVO ESTNDAR (o Standard, o tpico): Es la raz cuadrada de la varianza. Vuelve a
llevar las unidades de la variable a su expresin original. Representa la variabilidad de los
datos en promedio respecto de la media aritmtica (o sea, el mismo concepto del desvo
medio).

Pgina 6 de 120 Ing. Sergio Anbal Dopazo

CUASIVARIANZA: Es una correccin que se le efecta a la varianza, en vez de promediar a
los desvos cuadrados dividiendo por el total de datos, se divide por el total de datos menos
uno. Se calcula cuando los datos provienen de una muestra extrada de manera aleatoria y,
as poder estimar a la varianza de la poblacin de donde proviene dicha muestra.

CUASI DESVO ESTNDAR: Es la raz cuadrada de la cuasivarianza. Se calcula para estimar
al desvo estndar de la poblacin.

COEFICIENTE DE VARIACIN (o Dispersin Relativa): Es la relacin que existe entre el
desvo estndar y el promedio aritmtico, multiplicado por 100. Indica en forma porcentual si la
media aritmtica es representativa del conjunto de valores caractersticos. Si se encuentra por
debajo del 5%, diremos que el promedio aritmtico es representativo de los datos; si est por
encima del 5% y por debajo del 20%, diremos que slo el promedio no basta para representar
a los datos; en cambio si se encuentra por encima del 20%, los datos estn tan dispersos que
conviene fraccionar a la observacin.

RANGO: Es la diferencia entre el valor mximo y el valor mnimo de un conjunto observado.


OTROS TIPOS DE VALORES:

FRACTILES: Son valores que representan a una fraccin del conjunto observado. Se usan
cuando los anteriores valores caractersticos no representan al conjunto observado (o cuando
el conjunto observado es muy disperso). Su clculo es muy parecido al de la mediana. Los
ms conocidos o usados son: los cuartiles (que dividen en 4 partes al conjunto observado),
los deciles (que lo dividen en 10 partes) y los percentiles (que dividen al conjunto observado
en 100 partes). Cabe aclarar que al conjunto se lo puede dividir en partes no iguales (por
ejemplo: 80/20 %, 70/30 %, etc.).

CARACTERSTICAS DE FORMA:

COEFICIENTE DE ASIMETRA: Indica si la distribucin de los valores del conjunto observado
es simtrica o asimtrica. En el caso de distribuciones simtricas, los tres valores de
tendencia central (la media, la mediana y la moda), coinciden; quiere decir que la distribucin
de los valores a un lado u otro del centro son iguales. En el caso de las asimtricas, los tres
valores se alejan. Si es as, la distribucin de los valores puede tener sesgo positivo o
negativo. Si es sesgo positivo (asimetra derecha), tenemos omedio Pr Mediana Modo < << < < << < ; si
es sesgo negativo (asimetra izquierda), tenemos Modo Mediana omedio Pr < << < < << < . Hay varias
formas de calcular este coeficiente.

COEFICIENTE DE APLASTAMIENTO O DE AGUDEZA (o Kurtosis): Indica si la distribucin
de valores est o no concentrada alrededor de la moda. Adems indica cun aguda o
aplastada es la distribucin de los valores del conjunto observado. Hay varias formas de
calcularlo.


A continuacin veremos el clculo de los conceptos enunciados para las distintas formas en
las que se pueden recopilar los datos:





Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 7 de 120

PROCESAMIENTO DE DATOS REFERIDOS A VARIABLES DISCRETAS


DATOS INDIVIDUALES: Los datos se registran en forma individual y en forma ordenada.

Supongamos una muestra de 13 individuos (n=13), correspondientes a una variable discreta
(nmero que sale al tirar un dado), los r
i


correspondientes son:

2 2 3 3 3 3 4 4 4 5 5 6 6

r
i
= valor observado de la variable.

MEDIA o PROMEDIO: 5 8461538461 , 3
13
50
n
r
r
n
1 i
i
= == = = == = = == =

= == =


MODO: repite se ms que valor 3 r Mo
o
= == = = == = = == = , conjunto unimodal.

MEDIANA: observado conjunto al partes dos en divide que valor 4 r Me
e
= == = = == = = == = . Si el conjunto es
impar, la Mediana es el valor central. La Mediana debe ser uno de los valores
observados y depende de las observaciones slo por su orden y no por su valor.


Si la muestra fuera de 14 individuos (n=14), o sea cantidad par, la Mediana est indeterminada
entre r
e
y r
e+1
. Siendo r
e
el valor mximo de la primer mitad del conjunto y el r
e+1
el valor
mnimo de la segunda mitad.

1 2 2 3 3 3 3 4 4 4 5 5 6 6

La Mediana: est indeterminada entre 3 y 4: 4 y 3 r Me
e
= == = = == = , o sea, 3 para la primer mitad y 4
para la segunda mitad del conjunto. La indeterminacin dada en un conjunto par de datos discretos,
se comprender mejor cuando procesemos los datos discretos de manera agrupada.


Volvamos a nuestro ejemplo de 13 individuos:

VARIANZA:
( (( ( ) )) )
5 6686390532 , 1
13
6923076923 , 21
n
r r
S
n
1 i
2
i
2
= == = = == =

= == =

= == =
(cuando no se quiere estimar el
valor de la varianza de la
poblacin)
CUASIVARIANZA:
( (( ( ) )) )
8076923077 , 1
12
6923076923 , 21
1 n
r r
S
n
1 i
2
i
2
1 n
= == = = == =


= == =

= == =

(cuando se quiere estimar el
valor de la varianza de la
poblacin)

DESVO ESTNDAR: 2917581249 , 1 S S
2
= == = = == =


CUASIDESVO ESTNDAR:
3445044841 , 1 S S
2
1 n 1 n
= == = = == =


Pgina 8 de 120 Ing. Sergio Anbal Dopazo


COEFICIENTE de VARIACIN (expresado en porcentual):
% 59 , 33 100 3359 , 0 100
84615 , 3
291758 , 1
100
r
S
C
v
= == = = == = = == = | || |

| || |

\ \\ \
| || |
= == =
o: % 96 , 34 100 3496 , 0 100
84615 , 3
344504 , 1
100
r
S
C
1 n
v
1 n
= == = = == = = == =
| || |

| || |

\ \\ \
| || |
= == =




COEFICIENTE de ASIMETRA:
( (( ( ) )) )
2876096444 , 0
1554780546 , 2
6199362767 , 0
1554780546 , 2
13
0591715976 , 8
S
n
r r
As
3
n
1 i
3
i
= == = = == = = == =

= == =

= == =


COEFICIENTE de KURTOSIS:
( (( ( ) )) )
9855892561 , 1
5 7843562900 , 2
5285879346 , 5
5 7843562900 , 2
13
5 8716431497 , 71
S
n
r r
Ku
4
n
1 i
4
i
= == = = == = = == =

= == =

= == =





DATOS AGRUPADOS: Si los mismos datos observados en forma individual se agrupan por
clase de observacin (este procedimiento se justifica si la cantidad de datos observados es
cuantiosa). Los datos se distribuyen en una tabla que se puede representar grficamente.

En este caso hay que introducir los conceptos de frecuencias:

f
ai
: frecuencia absoluta, es la cantidad de observaciones (individuos) pertenecientes a una
clase o al valor de la variable observado. O sea que cada valor se repite con una
frecuencia determinada.

f
i
: frecuencia relativa, es el porcentaje de observaciones (individuos) pertenecientes a una
clase o al valor de la variable observado (frecuencia absoluta expresada en fraccin).
n
f
f
ai
i
= == =

F
ai
: Frecuencia Acumulada absoluta izquierda, es la cantidad de observaciones (individuos)
que se encuentran por debajo (o a la izquierda) de una clase o del valor de la variable
observado.

= == =
i
1
ai ai
f F

F
i
: Frecuencia Acumulada relativa izquierda, es el porcentaje de observaciones (individuos)
que se encuentran por debajo (o a la izquierda) de una clase o del valor de la variable
observado.

= == =
i
1
i i
f F

Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 9 de 120

G
ai
: Frecuencia Acumulada absoluta derecha, es la cantidad de observaciones (individuos)
que se encuentran por encima (o a la derecha) de una clase o del valor de la variable
observado.

= == =
k
i
ai ai
f G

G
i
: Frecuencia Acumulada relativa derecha, es el porcentaje de observaciones (individuos)
que se encuentran por encima (o a la derecha) de una clase o del valor de la variable
observado.

= == =
k
i
i i
f G

k: cantidad de clases o de tems o de filas en las que se divide la variable observada.


Volvamos al ejemplo tratado en forma individual: Veremos el mismo ejemplo de la tirada
de un dado con 13 observaciones de manera agrupada.

Item o fila r
i
f
ai
f
i
F
ai
F
i
G
ai
G
i

1 2 2 0,153846154 2 0,153846154 13 1
2 3 4 0,307692307 6 0,461538461 11 0,846153846
3 4 3 0,230769231 9 0,692307692 7 0,538461539
4 5 2 0,153846154 11 0,846153846 4 0,307692308
5 6 2 0,153846154 13 1 2 0,153846154
f
ai
= n = 13 f
i
= 1

MEDIA: 15 8466153846 , 3 f r 50
13
1
f r
n
1
r
k
1 i
i i
k
1 i
ai i
= == = = == = = == = = == =

= == = = == =


MEDIANA:
e
r Me = == = ; es el valor de la variable tal que se cumplen (en forma simultnea) las siguientes
condiciones (para un total de conjunto impar): 5 , 0 F y 5 , 0 F
) re ( ) 1 re (



5 , 0 692307692 , 0 ) 4 ( F y 5 , 0 461538461 , 0 ) 3 ( F = == = = == =
La Frecuencia Acumulada relativa izquierda del valor 3 (que es el anterior a 4,
r
e-1
= 3) es menor que 0,5 (se cumple la primer condicin); y, la Frecuencia
Acumulada relativa izquierda del valor 4 (r
e
= 4) es mayor que 0,5 (se cumple
la segunda condicin). Por lo tanto: 4 M
e
= == =


Se puede visualizar la obtencin de la mediana mediante el trazado de una curva de
frecuencias acumuladas. Esta curva tambin se define como curva de distribucin; si tomamos a
las frecuencias acumuladas relativas, esta curva describe una funcin llamada funcin de
distribucin. La misma es estrictamente creciente en el caso de las Variables Continuas, o bien, es
una curva en escalera en el caso de las Variables Discretas. En el siguiente grfico podemos apreciar
que la Mediana es 4, resultado que obtuvimos de manera analtica.
Pgina 10 de 120 Ing. Sergio Anbal Dopazo




Si el total del conjunto es par, tambin se cumplen las condiciones estipuladas:

Supongamos el ejemplo de 14 tiradas de un dado visto en el procesamiento individual:

Item o fila r
i
f
ai
f
i
F
ai
F
i
G
ai
G
i

1 1 1 0,07143 1 0,07143 14 1
2 2 2 0,14286 3 0,21429 13 0,92857
3 3 4 0,28571 7 0,5 11 0,78571
4 4 3 0,21428 10 0,71428 7 0,5
5 5 2 0,14286 12 0,85714 4 0,28572
6 6 2 0,14286 14 1 2 0,14286
f
ai
= n = 14 f
i
= 1

5 , 0 5 , 0 ) 3 ( F y 5 , 0 21429 , 0 ) 2 ( F = == = = == =
5 , 0 71428 , 0 ) 4 ( F y 5 , 0 5 , 0 ) 3 ( F = == = = == =

Hay 2 valores que satisfacen las condiciones. Por lo tanto: 4 y 3 M
e
= == = . La mediana
estara indeterminada entre 3 y 4, o sea, Me = 3 para la primer mitad; y Me = 4 para la
segunda mitad del conjunto. Se define entonces el intervalo mediano 3 4, el cual se
visualiza en el grfico siguiente.

Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 11 de 120




En general, la mediana, es el valor de la variable estadstica donde se cumple que ( (( ( ) )) ) 5 , 0 r F
e
= == =
Esta ecuacin tiene solucin nica en el caso de las variables continuas; pero puede o no
existir o no ser nica si la funcin de distribucin presenta escalones, en el caso de las variables
discretas. Si el total del conjunto es impar: la mediana es el valor r
e
, tal que: ( (( ( ) )) ) ( (( ( ) )) )
1 e 1 e
r F 5 , 0 r F
+ ++ +
< << < < << < .
Si el total del conjunto es par, se tiene que ( (( ( ) )) ) 5 , 0 r F
e
= == = : entonces la mediana est indeterminada entre
los valores r
e
y r
e+1
, a este intervalo se lo denomina mediano.


Volvamos a nuestro ejemplo de 13 individuos: Sigamos con el procesamiento de los datos.

MODO: 3 r Mo
o
= == = = == = (es el valor de la variable que tiene frecuencia absoluta mxima)

VARIANZA: Con las mismas consideraciones anteriores (si se quiere o no estimar el valor de la
varianza de la poblacin):
( (( ( ) )) ) ( (( ( ) )) ) 5 6686390532 , 1 r r f 6923076923 , 21
13
1
r r f
n
1
S
k
1 i
2
i i
k
1 i
2
i ai
2
= == = = == = = == = = == =

= == = = == =

CUASIVARIANZA: ( (( ( ) )) ) 8076923077 , 1 6923076923 , 21
12
1
r r f
1 n
1
S
k
1 i
2
i ai
2
1 n
= == = = == =

= == =

= == =



DESVO STANDARD: 2917581249 , 1 S S
2
= == = = == =

CUASIDESVO STANDARD:
3445044841 , 1 S S
2
1 n 1 n
= == = = == =



COEFICIENTE de VARIACIN (expresado en porcentual):
% 59 , 33 100 3359 , 0 100
84615 , 3
2918 , 1
100
r
S
C
v
= == = = == = = == = | || |

| || |

\ \\ \
| || |
= == =
o: % 96 , 34 100 3496 , 0 100
84615 , 3
344504 , 1
100
r
S
C
1 n
v
1 n
= == = = == = = == =
| || |

| || |

\ \\ \
| || |
= == =



Pgina 12 de 120 Ing. Sergio Anbal Dopazo


COEFICIENTE de ASIMETRA:
( (( ( ) )) ) ( (( ( ) )) )
2876096444 , 0
1554780546 , 2
6199362767 , 0
S
r r f
1554780546 , 2
0591715976 , 8
13
1
S
r r f
n
1
As
3
k
1 i
3
i i
3
k
1 i
3
i ai
= == = = == =

= == =

= == =

= == =

= == = = == =



COEFICIENTE de KURTOSIS:
( (( ( ) )) ) ( (( ( ) )) )
9855892561 , 1
5 7843562900 , 2
5285879346 , 5
S
r r f
5 7843562900 , 2
5 8716431497 , 71
13
1
S
r r f
n
1
Ku
4
k
1 i
4
i i
4
k
1 i
4
i ai
= == = = == =

= == =

= == =

= == =

= == = = == =




Para las variables compuestas (aquellas que tienen unidades en el numerador y en el
denominador), hay que tener cuidado a la hora de promediar ya que el simple promedio aritmtico
puede dar error. En la siguiente tabla mostraremos cmo se debe promediar en cada caso:

Numerador Vara Constante Vara
Denominador Constante Vara Vara
Promedio? Aritmtico Armnico Armnico


Veamos un ejemplo, supongamos datos en un taller de manufactura sobre el tiempo de
montaje de una pieza determinada:

OPERARIO Cantidad de Piezas Fabricadas Tiempo Insumido en el Montaje (en minutos)
Fulano 1 10
Fulano 1 11
Fulano 1 12
Fulano 1 11
Fulano 1 10
Fulano 1 10
Fulano 1 12
Fulano 1 11
Fulano 1 11
Fulano 1 10
TOTAL n = 10 108

Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 13 de 120

Cul es el tiempo estndar de fabricacin? Se entiende por tiempo estndar, al tiempo
promedio de fabricacin por unidad de produccin (en este caso minutos por pieza promedio). Por lo
cual la variable debe estar medida en esa unidad:

10 X ; 11 X ; 11 X ; 12 X ; 10 X ; 10 X ; 11 X ; 12 X ; 11 X ; 10 X
10 9 8 7 6 5 4 3 2 1
= == = = == = = == = = == = = == = = == = = == = = == = = == = = == =
(variable medida en min/pza)

En este caso se usa el promedio aritmtico:
pza
min
8 , 10
10
108
n
X
X
n
1 i
i
= == = = == = = == =

= == =


Cul es la productividad de Fulano? Se entiende por productividad, a la cantidad de unidades
de fabricacin promedio por unidad de tiempo (en este caso cantidad de piezas por minuto promedio).
Por lo cual la variable debe estar medida en esa unidad:

10
1
X ;
11
1
X ;
11
1
X ;
12
1
X ;
10
1
X ;
10
1
X ;
11
1
X ;
12
1
X ;
11
1
X ;
10
1
X
10 9 8 7 6 5 4 3 2 1
= == = = == = = == = = == = = == = = == = = == = = == = = == = = == =
(variable medida en pza/min)

En este caso se usa el promedio armnico:

min
pza
0925 , 0
10 11 11 12 10 10 11 12 11 10
10
X
1
n
X
n
1 i i
arm = == =
+ ++ + + ++ + + ++ + + ++ + + ++ + + ++ + + ++ + + ++ + + ++ +
= == = = == =

= == =


Si hubiramos usado el promedio aritmtico:

min
pza
09303 , 0
10 n
X
X
10
1
11
1
11
1
12
1
10
1
10
1
11
1
12
1
11
1
10
1
n
1 i
i
= == =
+ ++ + + ++ + + ++ + + ++ + + ++ + + ++ + + ++ + + ++ + + ++ +
= == = = == =

= == =
(este resultado es errneo)


Veamos el error: si usamos el resultado del promedio aritmtico para proyectar, en 108
Fulano debera hacer 10,0472 piezas y no 10 piezas como realmente ha ocurrido. En cambio, si
usamos el resultado del promedio armnico la proyeccin a 108 da exactamente 10 piezas. Si en
slo 108 minutos tenemos una diferencia de 0,05 piezas, la diferencia se incrementa en ms tiempo
de proyeccin.



Pgina 14 de 120 Ing. Sergio Anbal Dopazo

PROCESAMIENTO DE DATOS REFERIDOS A VARIABLES CONTINUAS

Las variables continuas siempre deben ser agrupadas en intervalos de clase (o grupos de
valores posibles). Si bien en el agrupamiento se pierde cierta informacin (los datos pierden su
individualidad), se gana en el anlisis.
El nmero de clases a adoptar depende de la precisin que se requiera. En un nmero
elevado de clases, aparecern irregularidades accidentales que provienen del hecho de haber pocos
individuos por clase. Al contrario, un nmero demasiado restringido de clases, conduce a una prdida
de informacin. La experiencia conduce a limitar el nmero de clases segn el tamao del conjunto a
tratar: entre 5 y 7, o bien, entre 10 y 15.
Como una gua aproximada de establecer el nmero k de intervalos, puede utilizarse la
frmula que Herbert Sturges propuso en 1926:
( (( ( ) )) )
( (( ( ) )) ) 2 ln
n ln
1 k + ++ + = == =

La eleccin de las amplitudes de clases, est condicionada por la preocupacin de obtener
efectivos comparables de una clase a otra (es decir, del mismo orden de magnitud). Esta
preocupacin considera tomar clases cuyas amplitudes sean variables: pequea amplitud donde el
carcter estudiado es frecuente, y mayor amplitud donde el carcter es ms raro (esta situacin se
observa en estudios socio-econmicos). En el caso de la estadstica industrial, en general se
consideran por simplicidad, clases de amplitud constante.
La experiencia indica que el agrupamiento en intervalos de clases de una variable estadstica
continua, se realiza aplicando no slo tcnica estadstica sino tambin el conocimiento de la
problemtica a estudiar, proveniente de la actividad profesional del realizador.

Veamos un ejemplo: Supongamos una muestra de 100 observaciones (o individuos) (n = 100),
correspondientes a una variable continua, que corresponde al consumo diario de agua (medido en
miles de litros) en una curtiembre:

I = Intervalo de Clase X
i
= consumo C
i
f
ai
= das obs. f
i
F
ai
F
i
G
ai
G
i

1 20 30 25 1 0,01 1 0,01 100 1
2 30 40 35 15 0,15 16 0,16 99 0,99
3 40 50 45 39 0,39 55 0,55 84 0,84
4 50 60 55 32 0,32 87 0,87 45 0,45
5 60 70 65 11 0,11 98 0,98 13 0,13
6 70 80 75 2 0,02 100 1 2 0,02
f
ai
= n = 100 f
i
= 1


I: nmero del intervalo de clasificacin de la variable estadstica continua.

A
i
: Amplitud del intervalo de clase, es la diferencia entre el lmite superior e inferior del
intervalo. Las clases pueden tener una amplitud constante o variable.

X
i inf
x
i sup
: lmites inferior y superior, respectivamente del intervalo de clase correspondiente.

C
i
: Centro del intervalo o marca de clase, es el valor central del Intervalo.
2
x x
C
sup i inf i
i
+ ++ +
= == =
Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 15 de 120


f
ai
: frecuencia absoluta, es la cantidad de observaciones (individuos) pertenecientes a un
intervalo de clase o cantidad de individuos cuyos valores se encuentran dentro del
intervalo de clase.

f
i
: frecuencia relativa, es el porcentaje de observaciones (individuos) pertenecientes a un
intervalo de clase (frecuencia absoluta expresada en fraccin).
n
f
f
ai
i
= == =

F
ai
: Frecuencia Acumulada absoluta izquierda, es la cantidad de observaciones (individuos)
que se encuentran por debajo (o a la izquierda) del valor de la variable (lmite superior del
intervalo).

= == =
i
1
ai ai
f F

F
i
: Frecuencia Acumulada relativa izquierda, es el porcentaje de observaciones (individuos)
que se encuentran por debajo (o a la izquierda) del valor de la variable (lmite superior del
intervalo).

= == =
i
1
i i
f F

G
ai
: Frecuencia Acumulada absoluta derecha, es la cantidad de observaciones (individuos)
que se encuentran por encima (o a la derecha) del valor de la variable (lmite inferior del
intervalo).

= == =
k
i
ai ai
f G

G
i
: Frecuencia Acumulada relativa derecha, es el porcentaje de observaciones (individuos)
que se encuentran por encima (o a la derecha) del valor de la variable (lmite inferior del
intervalo). Esta frecuencia se puede hallar como complemento de la frecuencia
acumulada relativa izquierda.

= == =
k
i
i i
f G

k: cantidad de intervalos de clase en los que se divide y clasifica el conjunto observado.

i: Id del intervalo de clase correspondiente.


Veamos los datos del ejemplo representados grficamente por el histograma:
Pgina 16 de 120 Ing. Sergio Anbal Dopazo




MEDIA: litros 300 . 49 litros de miles 3 , 49 f C 4930
100
1
f C
n
1
X
k
1 i
i i
k
1 i
ai i
= == = = == = = == = = == = = == =

= == = = == =
; vemos como
el promedio refiere al baricentro del histograma (grfico).


MODO: En el caso de variables continuas no se puede identificar al modo (el mismo queda
indefinido), solamente podemos identificar al intervalo de clase modal (Io) = que es el
intervalo de clase de mayor frecuencia absoluta. En nuestro ejemplo:
litros de miles 50 a 40 3 Intervalo I I
3 o
= == = = == = = == = , o sea el intervalo que va de 40.000 a 50.000
litros.


Veamos la informacin de las Frecuencias Acumuladas grficamente mediante las Curvas de
Frecuencias Acumuladas:


Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 17 de 120

0 10 20 30 40 50 60 70 80
1
2
13
16
45
50
F
ai
X
i
55
84
87
98
99
100
G
ai
Me


El punto donde se cortan las dos curvas, corresponde a un valor de variable, en el eje de
abscisas, que tiene por debajo a la mitad de las observaciones (o sea al 50%), y tiene por encima a la
otra mitad de las observaciones. Dicho valor divide al conjunto de datos en dos mitades (este es el
concepto de Mediana).

MEDIANA:
e
X Me = == = , es el valor de la variable tal que: 5 , 0 ) X ( F
e
= == = . En el caso de las variables
continuas la mediana divide al histograma en dos reas iguales. Tambin, a la
mediana, se la puede interpretar como el fractil (valor de la variable) que encierra al
50% de los valores, del conjunto observado, a su izquierda. A la mediana, se la puede
calcular por interpolacin lineal a partir de los extremos de los intervalos de la clase
correspondiente. Para poder interpretar la ecuacin de la misma, hay que identificar
primero al intervalo de clase mediano: Ie, el cual contiene al 50% de las
observaciones del conjunto, en este caso: 3 Intervalo I I
3 e
= == = = == =


De manera que el clculo de la Mediana ser:


( (( ( ) )) ) ( (( ( ) )) )

( (( (
( (( (

( (( (





+ ++ + = == =
( (( (
( (( (

( (( (





+ ++ + = == = = == = = == =

3
2
3 3
ae
) 1 e ( a
e e ) 5 , 0 ( e
f
F
2
100
A inf L
f
F
2
n
A inf L X X Me
Pgina 18 de 120 Ing. Sergio Anbal Dopazo

litros 94872 , 717 . 48 litros de miles 71794872 , 48
39
16 50
10 40 X Me
) 5 , 0 (
= == = = == =
( (( (

( (( (



+ ++ + = == = = == =

VARIANZA: Con las mismas consideraciones anteriores (si se quiere o no estimar el valor de la
varianza de la poblacin):
( (( ( ) )) ) ( (( ( ) )) )
2
k
1 i
2
i i
k
1 i
2
i ai
2
litros) de (miles 51 , 94 X C f 9451
100
1
X C f
n
1
S = == = = == = = == = = == =

= == = = == =

CUASIVARIAZA: ( (( ( ) )) )
2
k
1 i
2
i ai
2
1 n
litros) de (miles 464646 4646464646 , 95 9451
99
1
X C f
1 n
1
S = == = = == =

= == =

= == =



DESVO STANDARD: litros 9.721,6254 litros de miles 7216253785 , 9 S S
2
= == = = == = = == =

CUASIDESVO STANDARD: litros 9.770,6011 litros de miles 7706011312 , 9 S S
2
1 n 1 n
= == = = == = = == =



COEFICIENTE de VARIACIN (expresado en porcentual):
% 72 , 19 100 1971932125 , 0 100
3 , 49
7216253785 , 9
100
X
S
C
v
= == = = == = = == = | || |

| || |

\ \\ \
| || |
= == =
o: % 82 , 19 100 1981866355 , 0 100
3 , 49
7706011312 , 9
100
X
S
C
1 n
v
1 n
= == = = == = = == =
| || |

| || |

\ \\ \
| || |
= == =




COEFICIENTE de ASIMETRA:
( (( ( ) )) ) ( (( ( ) )) )
2299914155 , 0
7908145225 , 918
9 313 , 211
S
X C f
7908145225 , 918
9 3 , 21131
100
1
S
X C f
n
1
As
3
k
1 i
3
i i
3
k
1 i
3
i ai
= == = = == =

= == =

= == =

= == =

= == = = == =
)
)


COEFICIENTE de KURTOSIS:
( (( ( ) )) ) ( (( ( ) )) )
8703736633 , 2
1401 , 8932
5797 , 25638
S
X C f
1401 , 8932
97 , 2563857
100
1
S
X C f
n
1
Ku
4
k
1 i
4
i i
4
k
1 i
4
i ai
= == = = == =

= == =

= == =

= == =

= == = = == =



FRACTILES: Es el valor de la variable (dentro del conjunto) que encierra un cierto porcentaje (y%) de
observaciones o individuos a su izquierda (o sea por debajo de ese valor). Al igual que
la mediana (que es el fractil del 50%, ya que encierra a un 50% de individuos a su
izquierda), hay que reconocer, primero, al intervalo de clase del fractil (Ix) que es el
que contiene a dicho porcentaje de observaciones.

As tenemos, para el ejemplo que venimos desarrollando, que el valor 40, es el fractil
del 16%, porque encierra a un 16% de observaciones a su izquierda (por debajo) y a
un 84% de observaciones a su derecha (por arriba). El valor 50, es el fractil del 55%,
porque encierra a un 55% de observaciones a su izquierda (por debajo) y a un 45% de
observaciones a su derecha (por arriba). El valor 60, es el fractil del 87%, porque
encierra a un 87% de observaciones a su izquierda (por debajo) y a un 13% de
observaciones a su derecha (por arriba). El valor 70, es el fractil del 98%, porque
encierra a un 98% de observaciones a su izquierda (por debajo) y a un 2% de
observaciones a su derecha (por arriba).

Para otros valores dentro de un intervalo, el fractil se calcula:
Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 19 de 120

( (( ( ) )) )
( (( (

( (( (



+ ++ + = == =

ax
) 1 x ( a
I X %) y (
f
F % y n
A inf L X

Veamos algunos ejemplos tomando como base el cuadro del consumo diario de agua:

Cul es el valor de la variable superado el 10% de los das (o sea que encierra a un 10% de
las observaciones a su derecha o por arriba)?

Lo que me estn pidiendo es el fractil del 90%: ste se encuentra en el Intervalo 5 (I
5
).

( (( ( ) )) )
litros de miles 2 7 , 62
11
87 90
10 60
f
F 90 , 0 100
A inf L X
5 a
) 4 ( a
5 5 ) 90 , 0 (
) )
= == =
( (( (

( (( (



+ ++ + = == =
( (( (

( (( (



+ ++ + = == = ; o sea que
el 90% de las observaciones, el consumo, se encuentra por debajo de 62.727,27 litros, y, el
10% de los das (observaciones), se encuentra por encima de 62.727,27 litros.

Cul es el valor de la variable superado el 40% de los das (o sea que encierra a un 40% de
las observaciones a su derecha o por arriba)?

Lo que me estn pidiendo es el fractil del 60%: ste se encuentra en el Intervalo 4 (I
4
).

( (( ( ) )) )
litros de miles 5625 , 51
32
55 60
10 50
f
F 60 , 0 100
A inf L X
4 a
) 3 ( a
4 4 ) 60 , 0 (
= == =
( (( (

( (( (



+ ++ + = == =
( (( (

( (( (



+ ++ + = == = ; o sea
que el 60% de las observaciones, el consumo, se encuentra por debajo de 51.562,5 litros,
y, el 40% de los das (observaciones), se encuentra por encima de 51.562,5 litros.

Cul es el valor de la variable superado el 90% de los das (o sea que encierra a un 90% de
las observaciones a su derecha o por arriba)?

Lo que me estn pidiendo es el fractil del 10%: ste se encuentra en el Intervalo 2 (I
2
).

( (( ( ) )) )
litros de miles 36
15
1 10
10 30
f
F 10 , 0 100
A inf L X
2 a
) 1 ( a
2 2 ) 10 , 0 (
= == =
( (( (

( (( (



+ ++ + = == =
( (( (

( (( (



+ ++ + = == = ; o sea que el
10% de las observaciones, el consumo, se encuentra por debajo de 36.000 litros, y, el 90%
de los das (observaciones), se encuentra por encima de 36.000 litros.


FRECUENCIA ACUMULADA IZQUIERDA RELATIVA (Porcentual Acumulado): Es el porcentaje de
observaciones (individuos) que se encuentran a la izquierda (por debajo) de un valor
determinado de la variable.

As tenemos, para el ejemplo que venimos desarrollando, que el 16% de las
observaciones se encuentra a la izquierda (por debajo), del valor de variable 40, o sea
que F(40) = 0,16. El 55% de las observaciones se encuentra a la izquierda (por
debajo), del valor de variable 50, o sea que F(50) = 0,55. El 87% de las
observaciones se encuentra a la izquierda (por debajo), del valor de variable 60, o sea
que F(60) = 0,87. El 98% de las observaciones se encuentra a la izquierda (por
debajo), del valor de variable 70, o sea que F(70) = 0,98.

Para otros valores dentro de un intervalo, el porcentual acumulado se calcula:
Pgina 20 de 120 Ing. Sergio Anbal Dopazo

( (( (
( (( (

( (( (




+ ++ +
| || |
| || |

| || |


\ \\ \
| || |


= == =
) 1 x ( a ax
I
X
F f
A
inf L X
n
1
) X ( F

Veamos algunos ejemplos tomando como base el cuadro del consumo diario de agua:

Cul es el porcentaje de los das (observaciones) en los que el consumo se encuentra a la
izquierda (por debajo) del valor de la variable 51 miles de litros (51.000 litros)?

Lo que me estn pidiendo es el F(51): se encuentra en el Intervalo 4 (I
4
).

582 , 0 55 32
10
50 51
100
1
F f
A
inf L 51
100
1
) 51 ( F
) 3 ( a 4 a
4
4
= == =
( (( (

( (( (



+ ++ + | || |

| || |

\ \\ \
| || |


= == =
( (( (
( (( (

( (( (




+ ++ +
| || |
| || |

| || |


\ \\ \
| || |


= == = ; o sea que el
58,2% de los das (observaciones), el consumo se encuentra por debajo de 51.000 litros, y
el 41,8% de los das (observaciones), el consumo se encuentra por encima de 51.000 litros.

Cul es el porcentaje de los das (observaciones) en los que el consumo se encuentra a la
derecha (por encima) del valor de la variable 32 miles de litros (32.000 litros)?

Lo que me estn pidiendo es el G(32), o sea el complemento del F(32): se encuentra en el
Intervalo 2 (I
2
).

04 , 0 1 15
10
30 32
100
1
F f
A
inf L 32
100
1
) 32 ( F
) 1 ( a 2 a
2
2
= == =
( (( (

( (( (



+ ++ + | || |

| || |

\ \\ \
| || |


= == =
( (( (
( (( (

( (( (




+ ++ +
| || |
| || |

| || |


\ \\ \
| || |


= == = ; o sea que el 4% de
los das (observaciones), el consumo se encuentran por debajo de 32.000 litros, y por lo
tanto el 96% de los das (observaciones), el consumo se encuentra por encima de 32.000
litros (que responde a lo solicitado).


JUGANDO CON LOS PORCENTUALES: Tomando como base el cuadro del consumo diario de agua

Cul es el porcentaje de los das (observaciones) en los que el consumo se encuentra entre
los valores de variable 32.000 y 51.000 litros?

Lo que me estn pidiendo es: 542 , 0 04 , 0 582 , 0 ) 32 ( F ) 51 ( F ) 51 X 32 ( P = == = = == = = == = ; o sea que
el 54,2% de los das (observaciones), el consumo se encuentra entre 32.000 y 51.000 litros.

De los das (observaciones) en los que el consumo est por debajo de 51.000 litros, cul es
el porcentaje de esos das en los que el consumo se encuentre por encima de 32.000 litros?

Lo que me estn pidiendo es un porcentual condicional:

( (( ( ) )) )
[ [[ [ ] ]] ]
9313 , 0
582 , 0
542 , 0
) 51 ( F
) 51 X 32 ( P
) 51 X ( P
) 51 X ( ) 32 X ( P
51 X
32 X
P = == = = == =

= == =


= == =


; o sea que el
93,13% de los das (observaciones) en los que el consumo se encuentra por debajo de 51.000
litros, el consumo est por encima de 32.000 litros.

De los das (observaciones) en los que el consumo est por debajo de 51.000 litros, cul es
el porcentaje de esos das en los que el consumo se encuentra por debajo de 32.000 litros?

Estadstica General Tema: Estadstica Descriptiva Procesamiento de Datos

Ing. Sergio Anbal Dopazo Pgina 21 de 120

Lo que me estn pidiendo es un porcentual condicional:

( (( ( ) )) )
[ [[ [ ] ]] ]
0687 , 0
582 , 0
04 , 0
) 51 ( F
) 32 ( F
) 51 X ( P
) 51 X ( ) 32 X ( P
51 X
32 X
P = == = = == = = == =


= == =


; o sea que el 6,87% de los
das (observaciones) en los que el consumo se encuentra por debajo de 51.000 litros, el
consumo est por debajo de 32.000 litros. Tambin se puede obtener como complemento de
la pregunta anterior. Porque si el 93,13% de los das (observaciones) en los que el consumo
se encuentra por debajo de 51.000 litros, el consumo est por encima de 32.000 litros; es
lgico que el 6,87% de esos das (observaciones), el consumo est por debajo.

De los das (observaciones) en los que el consumo est por encima de 32.000 litros, cul es
el porcentaje de esos das en los que el consumo se encuentre por debajo de 51.000 litros?

Lo que me estn pidiendo es un porcentual condicional:

( (( ( ) )) )
[ [[ [ ] ]] ]
5646 , 0
96 , 0
542 , 0
) 32 ( F 1
) 51 X 32 ( P
) 32 X ( P
) 32 X ( ) 51 X ( P
32 X
51 X
P = == = = == =


= == =


= == =


; o sea que el
56,46% de los das (observaciones) en los que el consumo se encuentra por encima de
32.000 litros, el consumo est por debajo de 51.000 litros.

De los das (observaciones) en los que el consumo est por encima de 32.000 litros, cul es
el porcentaje de esos das en los que el consumo se encuentre por encima de 51.000 litros?

Lo que me estn pidiendo es un porcentual condicional:

( (( ( ) )) )
[ [[ [ ] ]] ]
4354 , 0
96 , 0
418 , 0
) 32 ( F 1
) 51 ( F 1
) 32 X ( P
) 32 X ( ) 51 X ( P
32 X
51 X
P = == = = == =


= == =


= == =


; o sea que el 43,54% de
los das (observaciones) en los que el consumo se encuentra por encima de 32.000 litros, el
consumo est por encima de 51.000 litros. Tambin se puede obtener como complemento de
la pregunta anterior. Porque si el 56,46% de los das (observaciones) en los que el consumo
se encuentra por encima de 32.000 litros, el consumo est por debajo de 51.000 litros; es
lgico que el 43,54% de esos das (observaciones), el consumo est por encima.

Pgina 22 de 120 Ing. Sergio Anbal Dopazo

También podría gustarte