Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Además, la Estadística no se ocupa de los casos raros, que, en general, son mal conocidos: la
anécdota no pertenece al dominio estadístico. Las permanencias estadísticas no aparecen, en
efecto, más que en conjuntos numerosos. Se puede concluir que la Estadística Descriptiva es una
Técnica de análisis de conjuntos numerosos; la misma se aplica a todos los dominios de investigación
cuantitativa: investigación demográfica, económica, agronómica, biológica, industrial... No obstante,
los métodos de recolección de información, la crítica de los datos recopilados, y más aún la
interpretación de los resultados obtenidos, no son propiamente hablando, competencia de la
Estadística Descriptiva. Numerosas críticas hechas a la Estadística se dirigen realmente al dominio
en que se le aplica o a la interpretación que da a los resultados que expone y no a su método en sí.
Los "datos" son los hechos y los números que se reúnen, analizan y resumen para su
presentación e interpretación. Al estar reunidos, los datos recopilados se denominan en general
"conjunto de datos" para el estudio.
Los "elementos" son las entidades acerca de las cuales se reúnen los datos; y una "variable"
es una característica de interés de los elementos. En definitiva, los datos se obtienen anotando las
mediciones de cada variable para cada elemento en el estudio; y al conjunto de mediciones, reunido
para determinado elemento se llama "observación"; ésta procesada de cierta manera conveniente, se
convierte en información vital.
Las informaciones pueden ser cualitativas (no son expresables en escalas numéricas); o
cuantitativas (las cuales surgen de datos cuantitativos, expresables en escalas numéricas
ordenables).
Todos los datos deben estar referidos al problema. En muchas empresas existe la costumbre
de guardar información "por si llegara a necesitarse" o con la intención de analizarlos "cuando haya
tiempo"; estos datos no sirven, porque no responden al momento en que se va a efectuar la "acción
correspondiente". Los datos nos proveen una información que tiene un propósito definido, por eso
tanto la forma en que se tomarán los datos como su misma naturaleza, quedan automáticamente
determinadas por ese objetivo.
La "Buena Información" sirve al Ente Central de todo este trabajo, quien es el que analiza y
resuelve los problemas, en definitiva es: "El Hombre Que Toma Decisiones" (H.Q.T.D.). Para tomar
! !"
estas decisiones racionales, se debe estar bien informado y para ello se debe remitir al pasado,
sabiendo que las mismas influyen en el futuro.
Hoy, la calidad en la toma de decisiones, exige elegir métodos apropiados. Los métodos
pueden ser: Subjetivos u Objetivos. Los subjetivos, dependen de la formación personal y
profesional; en cambio los objetivos, dependen del conocimiento científico y de las herramientas
existentes.
TIPOS DE DATOS
f) DATOS PARA EL CONTROL: Son datos que se toman de manera tal, que
brinden una información que permita saber si una situación se encuentra o no en
estado de control estadístico. Esto permitirá tomar la acción adecuada para
mantenerla bajo control o para volverla a ese estado, según sea el caso.
g) DATOS DE/PARA LA REGULACIÓN: Son datos que sirven de base para fijar
los parámetros de funcionamiento de un sistema o proceso. Las especificaciones
finales, estarán basadas en esos datos.
# !"
h) DATOS PARA LA APROBACIÓN o RECHAZO; COMPRA o VENTA: Son datos
que permiten tomar la acción de decidir sobre lo que se está evaluando.
ANÁLISIS DE DATOS
El procesamiento de los datos nos provee información simple y vital referida a un único objeto
de estudio. Entonces la estadística nos brinda, por medio del análisis, una serie de valores que
representan al conjunto estudiado; por ello es importante definir algunos conceptos fundamentales:
LOTES: Son particiones de una Población "Infinita" que, se supone, conservan los mismos
parámetros.
Debemos aclarar que, casi siempre, en la práctica estos Parámetros son desconocidos, ya
que no se tienen todos los datos. Esto se debe a muchas causas: tiempo, costo, etc., y a veces se
nos hace difícil o imposible conocer a todos los individuos. Es por eso que la estadística usa
Muestras y por medio de ciertas metodologías permite Inferir sobre la población objeto de estudio.
MUESTRAS: Es una porción de la población que se extrae para estudiarla. Los valores
característicos distintivos de una muestra reciben el nombre de Estadísticos o
Estimadores Muestrales o simplemente Estadísticos o Estimadores. Estos se
utilizan para estimar o inferir los parámetros de la población objeto de estudio.
$ !"
que pueden ser expresadas recíprocamente: Km/h., etc.; donde el numerador permanece
constante y el denominador es lo que varía). También tenemos al promedio Geométrico (se
utiliza para promediar tasas de cambio, valores porcentuales como el interés mensual, etc.).
MEDIANA (o Valor Mediano): Es el valor de la variable que divide en dos efectivos iguales a
los individuos observados ordenados por valor creciente del carácter (la posición que ocupa la
mediana corresponde al total de los individuos observados divido 2; o sea, que el 50 % son
inferiores que ella y el otro 50 % son superiores).
MODA (o Modo o Valor Modal): Es el valor más frecuente de la variable, el valor dominante.
Es el que está más repetido dentro de un conjunto observado. El más frecuente dentro de los
más frecuentes. Un conjunto observado puede ser unimodal (moda única), puede ser
plurimodal (varios valores modales) o puede ser amodal (carente de moda o todos los
valores tienen la misma influencia).
FRACTILES: Son valores que representan a una fracción del conjunto observado. Se usan
cuando los anteriores valores característicos no representan al conjunto observado (o cuando
el conjunto observado es muy disperso). Su cálculo es muy parecido al de la mediana. Los
más conocidos o usados son: los cuartiles (que dividen en 4 partes al conjunto observado);
los deciles (que lo dividen en 10 partes) y los percentiles (que dividen al conjunto observado
en 100 partes). Cabe aclarar que al conjunto se lo puede dividir en partes no iguales (por
ejemplo: 80/20 %, 70/30 %, etc.).
% !
"
valores se alejan), y la distribución de los valores puede tener sesgo positivo (asimetría
derecha) o sesgo negativo (asimetría izquierda). Hay varias formas de calcularlo.
DATOS INVIVIDUALES:
Supongamos una muestra de 13 individuos (n=13), correspondientes a una Variable Discreta (número
que sale al tirar un dado):
2–2–3–3–3–3–4–4–4–5–5–6–6
MODO: Mo = 3 MEDIANA: Me = 4
n
ri
50
MEDIA o PROMEDIO: r = i =1
= = 3,8461538461 5
n 13
n
(ri − r )2
21,6923076923
VARIANZA: S = 2 i=1
= = 1,6686390532 5 (cuando no se quiere estimar el
n 13
valor de la población)
n
(ri − r )2
21,6923076923
o: S2 = i=1
= = 1,8076923077 (cuando se quiere estimar el valor de la
n−1 12
población)
n
(ri − r )3
i =1
8,0591715976
n 13 0,6199362767
COEFICIENTE de ASIMETRÍA: A s = = = = 0,2876096444
S3 2,1554780546 2,1554780546
& !
"
COEFICIENTE de KURTOSIS:
n
(ri − r )4
i=1
71,8716431497 5
n 13 5,5285879346
Ku = = = = 1,9855892561
S4 2,7843562900 5 2,7843562900 5
fai i i
fi = / Fai = fai / Fi = fi
n i=1 i =1
1 n
1 n
MEDIA o PROMEDIO: r = ⋅ ri ⋅ fai = ⋅ 50 = ri ⋅ fi = 3,8461538461 5
n i=1 13 i=1
1 n 1 n
VARIANZA: S 2 = ⋅ fai ⋅ (ri − r ) 2 = ⋅ 21,6923076923 = fi ⋅ (ri − r ) 2 = 1,6686390532 5
n i=1 13 i=1
1 n
1
o: S 2 = ⋅ f ai ⋅ (ri − r ) 2 = ⋅ 21,6923076923 = 1,8076923077
n − 1 i=1 12
" !
"
DESVÍO ESTÁNDAR: S = S 2 = 1,2917581249 o = 1,3445044841
COEFICIENTE de ASIMETRÍA:
1 n 1
n
⋅ fai ⋅ (ri − r )3 ⋅ 8,0591715976 fi ⋅ (ri − r )3
n i=1 13 0,6199362767
As = = = i =1
= = 0,2876096444
S3 2,1554780546 S 3
2,1554780546
COEFICIENTE de KURTOSIS:
1 n 1
n
⋅ fai ⋅ (ri − r )4 ⋅ 71,8716431497 5 fi ⋅ (ri − r )4
n i=1 13 5,5285879346
Ku = = = i=1
= = 1,9855892561
S4 2,7843562900 5 S 4
2,7843562900 5
MEDIANA: Me = re ; es el valor de la variable tal que se cumplen las siguientes condiciones en forma
simultánea: F(re − 1) ≤ 0,5 y F(re ) ≥ 0,5
F(3) = 0,461538461 ≤ 0,5 y F(4) = 0,692307692 ≥ 0,5
La Frecuencia Acumulada Relativa Izquierda del valor 3 (que es el anterior a 4,
3 = re-1) es menor que 0,5 (se cumple la primer condición); y, la Frecuencia
Acumulada Relativa Izquierda del valor 4 (4 = re) es mayor que 0,5 (se cumple
la segunda condición). Por lo tanto: M e = 4
COEFICIENTE de VARIACIÓN (expresado en porcentual): Tanto para valores individuales como para
agrupados
1,2918
C v = S ⋅ 100 = ⋅ 100 = 0,3359 ⋅ 100 = 33,59 %
r 3,84615
' !
"
1,344504
o: C v = S ⋅ 100 = ⋅ 100 = 0,3496 ⋅ 100 = 34,96 %
r 3,84615
X1= 10 ; X2= 11 ; X3= 12 ; X4= 11 ; X5= 10 ; X6= 10 ; X7= 12 ; X8= 11 ; X9= 11 ; X10= 10 (en min/pza)
n
Xi
108
En este caso se usa el promedio aritmético: X = i =1
= = 10,8 min
n 10 pza
( !
"
1 1 1 1 1 1 1 1 1 1
X1 = ; X2 = ; X3 = ; X4 = ; X5 = ; X6 = ; X7 = ; X8 = ; X9 = ; X 10 =
10 11 12 11 10 10 12 11 11 10
(variable medida en pza/min)
n 10
X arm = = = 0,0925 pza
n
1 10 + 11 + 12 + 11 + 10 + 10 + 12 + 11 + 11 + 10 min
i=1 Xi
n
Xi 1
+ 1
+ 1
+ 1
+ 1
+ 101 + 1
+ 1
+ 1
+ 1
X= i =1
= 10 11 12 11 10 12 11 11 10
= 0,09303 pza (este resultado es erróneo)
n 10 min
Veamos el error: si usamos el resultado del promedio aritmético para proyectar, en 108’
Fulano debería hacer 10,0472 piezas y no 10 piezas como realmente ha ocurrido. En cambio si
usamos el resultado del promedio armónico la proyección a 108’ da exactamente 10 piezas. Si en
sólo 108’ minutos tenemos una diferencia de 0,05 piezas, la diferencia se incrementa en más tiempo
de proyección.
) !
"
PROCESAMIENTO DE DATOS REFERIDOS A VARIABLES CONTINUAS
Ai = Amplitud del Intervalo de Clase = Es la diferencia entre el límite superior e inferior del intervalo
fai i i n n
fi = / Fai = fai / Fi = fi / G ai = f ai / Gi = fi
n i=1 i =1 i i
!
* !
"
1 n 1 n
MEDIA: X = ⋅ C i ⋅ fai = ⋅ 4930 = C i ⋅ fi = 49,3 miles de litros = 49.300 litros ; vemos como
n i =1 100 i=1
Donde se cortan las dos curvas corresponde a un valor de variable que tiene por debajo a la
mitad de las observaciones (o sea al 50 %); y tiene por encima a la otra mitad de las observaciones.
Por lo cual dicho valor divide al conjunto de datos en dos mitades (este es el concepto de Mediana).
!
! !
"
MEDIANA: Me = X e ; es el valor de la variable tal que: F(X e ) = 0,5 ; hay que reconocer al Intervalo
de Clase Mediano: Ie, el cual contiene al 50 % del conjunto observado, en este caso:
Ie = I3 = Intervalo 3
Me = X e = X ( 0 ,5 ) = L inf e + A e ⋅
(n 2) − F a ( e − 1)
= L inf3 + A 3 ⋅
(100 2) − F
2
f ae f3
50 − 16
Me = X ( 0 ,5 ) = 40 + 10 ⋅ = 48,71794872 miles de litros = 48.717,94872 litros
39
1 n 1 n
VARIANZA: S 2 = ⋅ fai ⋅ (C i − X ) 2 = ⋅ 9451 = fi ⋅ (C i − X) 2 = 94,51 (miles de litros) 2
n i =1 100 i=1
1 n
1
o: S 2 = ⋅ fai ⋅ (C i − X ) 2 = ⋅ 9451 = 95,46 (miles de litros ) 2
n − 1 i=1 99
!
# !
"
DESVÍO STANDARD: S = S 2 = 9,7216253785 miles de litros = 9.721,6254 litros
o: S = S 2 = 9,7706011312 miles de litros = 9.770,6011 litros
COEFICIENTE de ASIMETRÍA:
1 n 1
n
⋅ fai ⋅ (C i − X ) 3 ⋅ 21131,39 fi ⋅ (C i − X ) 3
n i=1 100 211,3139
As = = = i =1
= = 0,2299914155
S3 918,7908145225 S3 918,7908145225
COEFICIENTE de CURTOSIS:
1 n 1
n
⋅ fai ⋅ (C i − X ) 4 ⋅ 2563857 ,97 fi ⋅ (C i − X ) 4
n i=1 100 25638,5797
Ku = = = i=1
= = 2,8703736633
S4 8932,1401 S 4
8932,1401
(n ⋅ y%) − Fa ( x −1)
Para otros valores dentro de un intervalo: X ( y %) = L infX + A I
fax
Veamos algunos ejemplos:
!
$ !
"
(100 ⋅ 0,90 ) − Fa( 4 ) 90 − 87
X (0 ,90 ) = L inf5 + A 5 = 60 + 10 = 62,72 miles de litros ; o sea que
fa 5 11
el 90% de las observaciones, el consumo, se encuentra por debajo de “62.727,27 litros” y el
10% de los días (observaciones) se encuentra por encima de “62.727,27 litros”.
1 X − L infX
Para otros valores dentro de un intervalo: F(X ) = ⋅ ⋅ fax + Fa ( x −1)
n AI
Veamos algunos ejemplos:
!
% !
"
1 51 − L inf4 1 51 − 50
F(51) = ⋅ ⋅ fa 4 + Fa (3 ) = ⋅ ⋅ 32 + 55 = 0,582 ; o sea que el
100 A4 100 10
58,2% de los días (observaciones), el consumo se encuentra por debajo de “51.000 litros” y
el 41,8% de los días (observaciones), el consumo se encuentra por encima de “51.000 litros”.
1 32 − L inf2 1 32 − 30
F(32) = ⋅ ⋅ fa 2 + Fa (1) = ⋅ ⋅ 15 + 1 = 0,04 ; o sea que el 4% de
100 A2 100 10
los días (observaciones), el consumo se encuentran por debajo de “32.000 litros” y por lo
tanto el 96% de los días (observaciones), el consumo se encuentra por encima de “32.000
litros”.
• ¿Cuál es el porcentaje de los días (observaciones) que el consumo se encuentra entre los
valores de variable 32.000 y 51.000 litros?
Lo que me están pidiendo es el P(32 ≤ X ≤ 51) = F(51) − F(32) = 0,582 − 0,04 = 0,542 ; o sea
que el 54,2% de los días (observaciones), el consumo se encuentra entre 32.000 y 51.000
litros.
• De los días (observaciones) que el consumo está por debajo de 51.000 litros, ¿Cuál es el
porcentaje de esos días que el consumo se encuentra por arriba de 32.000 litros?
• De los días (observaciones) que el consumo está por debajo de 51.000 litros, ¿Cuál es el
porcentaje de esos días que el consumo se encuentra por debajo de 32.000 litros?
!
& !
"
• De los días (observaciones) que el consumo está por arriba de 32.000 litros, ¿Cuál es el
porcentaje de esos días que el consumo se encuentra por debajo de 51.000 litros?
• De los días (observaciones) que el consumo está por arriba de 32.000 litros, ¿Cuál es el
porcentaje de esos días que el consumo se encuentra por arriba de 51.000 litros?
!
" !
"