Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadı́stica Descriptiva
1.1.1. Introducción.
Este capitulo tiene como propósito establecer el marco de referencia para el estudio de
1.1.2. Origen.
Durante mucho tiempo se considero que el campo propio del estudio cientı́fico era ex-
clusivo de fenómenos que bajo las mismas condiciones producen los mismos resultados,
es decir, de fenómenos deterministicos. Sin embargo, aquellos fenómenos o situaciones
1
2 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
1. Lanzamiento de un dado.
2. Juegos de azar.
Estadı́stica
dada por datos. Estos datos son el resultado de medir en un conjunto de elementos o
individuos, una o varias caracterı́sticas a ser analizadas en una investigación.
Definición 1.2 (Elemento) Es un ser vivo, objeto o cosa que posee caracterı́sticas
que se desean investigar.
En sentido estadı́stico un elemento puede ser algo con existencia real, como un au-
tomóvil o una casa, o algo más abstracto como la temperatura, un voto, o un intervalo
de tiempo.
junto finito o infinito de seres vivos o cosas, sobre las cuales están definidas las carac-
terı́sticas que interesan analizar.
Cada elemento del universo tiene una serie de caracterı́sticas que pueden ser objeto
del estudio estadı́stico. Ası́ por ejemplo si consideramos como elemento a una persona,
podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios,
Por lo tanto, de cada elemento del universo podremos estudiar uno o más aspectos
cualidades o caracteres.
Universo finito: cuando el número de elementos que la forman es finito, por ejem-
Definición 1.5 (Población) Es el conjunto de todas las posibles mediciones que pue-
den hacerse de una caracterı́stica en estudio de los elementos del universo. Por lo tanto,
la población está constituida por valores o datos bien sea numéricos o no.
Ejemplo 1.6 :
Se puede notar que un Universo puede estar constituido por una o varias poblaciones.
Además, al igual que el universo, la población puede ser finita o infinita, dependiendo
del número de valores que la constituyen. En el caso de que la población sea finita, se
dice que esta tiene tamaño N.
Ejemplo 1.8 :
Definición 1.9 (Parámetro) Es una función de los valores de la población que sirve
para sintetizar alguna caracterı́stica relevante de la misma. Ejemplos de parámetros
son: La media poblacional, La proporción poblacional, la varianza poblacional, entre
otros.
Definición 1.10 (Estadı́stico) Es una función de los valores de la muestra que sirve
se les conocen como variables y a las distintas formas en que pueden presentarse,
modalidades o valores de las variables.
Definición 1.11 (Variable) Una variable es una caracterı́stica que poseen los ele-
mentos del universo que pueden o no variar entre cada uno de ellos.
El sueldo de un emplead.
1. Escala Nominal: Son aquellas en que la única relación que se define entre sus
valores es la igualdad o diferencia, es decir solo podemos decir que dos valores de
una variable son iguales o diferentes. No hay operaciones aritméticas definidas,
por lo tanto, los números no tienen sentido como magnitudes.
El sexo.
El color de ojos.
El estado civil.
2. Escala Ordinal: Son aquellas en que entre sus valores están definidas las relaciones
de igualdad, diferencia, mayor que o menor que, es decir solo podemos decir
que dos valores de una variable son iguales, diferentes y en el caso de que sean
diferentes se puede establecer un orden entre ellos. No hay operaciones aritméticas
definidas.
Grado de satisfacción.
Intensidad de un dolor.
Rango militar.
Nivel de educación.
3. Escala De Intervalo: Los valores de las variables son números y entre ellos tienen
importancia.
La temperatura.
El nivel de hemoglobina.
5. Escala Absoluta: Los valores que puede tomar la variable son el resultado de un
conteo, por lo tanto, esta escala está constituida por todos los número enteros
positivos y el cero.
Tipos de Variables
tivas.
1.1. CONCEPTOS GENERALES 9
Definición 1.18 (Variable Cualitativa) Son aquellas cuya escala de medida es no-
minal u ordinal, es decir, na variable es cualitativa si sus valores representan una
cualidad o atributo del elemento en estudio. Por ejemplo:
El Tipo de sangre.
La nacionalidad.
do los valores posibles son cantidades numéricas con las que podemos hacer operaciones
aritméticas. Es decir, son aquellos cuya escala de medidas es de intervalos, proporcional
o absoluta. Por ejemplo:
tanto, son variables que no admiten valor alguno entre dos valores consecutivos de las
mismas. Por ejemplo:
10 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
Clasificación de la Estadı́stica
ción contenida en ellos. Puede llevarse a cabo sobre una muestra o sobre toda una
población.
1.2.1. Introducción.
Esta sección tiene como propósito principal, introducir técnicas que permitan tanto
Al finalizar el tema, el estudiante debe estar en capacidad, una vez coleccionados los
datos, de:
Ordenarlos y clasificarlos
estudio implica gran cantidad de datos que no es fácil interpretar directamente. Esta
organización depende, como dijimos en la sección anterior, del tipo de variable que
se maneje. Por lo tanto, vamos a estudiar como se realiza la agruapación cuando la
Modalidades fi f ri
1 f1 f r1
2 f2 f r2
.. .. ..
. . .
k fk f rk
donde
k
fi = n: representa el número total de datos.
i=1
k
fi
f ri = n
y debe cumplirse que f ri = 1
i=1
1.2. ESTADÍSTICA DESCRIPTIVA 13
Ejemplo 1.24 A continuación se muestran los resultados obtenidos al aplicar una en-
cuesta a 50 estudiantes de FACES donde se les preguntó sobre la carrera que estudiaban:
C A A C C A A E A C
E E C ES E A C C A C
C A ES C E A A C A C
C C A E E A C C C A
C C A C C C C ES A E
donde
A: Administración
C: Contadurı́a
E: Economı́a
ES: Estadı́stica
La variable en este ejemplo es la carrera que estian las personas, la cual es cualita-
tiva de escala nominal, dicha variable presenta cuatro modalidades representadas por
A,E,C y ES. Por lo tanto, al organizar los datos en una distribución de frecuencia se
tiene que:
Carrera fi f ri
Administración 16 0.32
Contadurı́a 23 0.46
Economı́a 8 0.16
Estadı́stica 3 0.06
14 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
La tabla anterior es utilizada cuando se está estudiando una variable. Para el caso
de dos variables, se usan comunmente las llamadas tablas de doble entrada o tablas
de contingencia, pues las mismas permiten agrupar el numero de observaciones que
Variable B
Totales
B1 B2 . . . Bk
hhh A1
A2
..
.
Ak
Totales
Si los datos son cuantitativos, usamos un procedimiento similar al utilizado con los
datos cualitativos, excepto, que es más laborioso. En este caso la tabla de frecuencias
contiene los siguientes elementos:
Marcas de Clase (mi ): Punto medio o centro de intervalo. Es una forma abre-
viada de representar el intervalo.
1.2. ESTADÍSTICA DESCRIPTIVA 15
Nota: En el caso discreto, cuando el número de valores diferentes que puede tomar la
variable es pequeño, entonces cada uno de ellos representa una clase. De esta forma
las marcas de clase coinciden con las clases. Lo mismo es valido en el caso continuo,
número de clases no existe una regla fija. Una primera aproximación es tomar
√
K = N de clases = n
Existe una fórmula para calcular el número óptimo de clases, denominada fórmula
de Stugers
K = 1 + 3,3 log n
Una vez que hemos decidido en cuanto al número de clases, la amplitud de las
clases, es simplemente
R
A=
K
Esto nos permite en resumen, particionar los datos en K clases, cada una con
amplitud A.
Es importante hacer notar que, no siempre es posible contar con clases de igual
amplitud.
siguiente, conviene considerar las clases como intervalos del tipo [Linf - Lsup);
esto es, intervalos cerrados por la izquierda y abiertas por la derecha.
5. Calcular las marcas de clase (mi ): Las marcas de clase estan representadas por
mi = LSi − LIi
mulada.
tativos
Clases mi fi f ri Fi F ri
[li1 − ls1 ) m2 f1 f ri F ri F ri
[li2 − ls2 ) m2 f2 f ri F ri F ri
.. .. .. .. .. ..
. . . . . .
[lik − lsk ) mk fk f ri F ri F ri
1 1 3 3 2 4 4 1
1 2 1 3 3 2 1 3
2 1 2 2 4 3 4 4
4 0 3 0 4 1 5 2
2 3 3 4 4 4 1 2
dado por {0, 1, 2, 3, 4, 5}. Entonces las clases de la distribución de frecuencia estan
dadas por los valores individuales de la variable. A continuación se muestra se
muestra dicha tabla:
N deHijos fi Fi f ri F ri
0 2 0,050 2 0,050
1 9 0,225 11 0,275
2 9 0,225 20 0,500
3 9 0,225 29 0,725
4 10 0,250 39 0,975
5 1 0,025 40 1
Donde se observa que gran parte de las mujeres estudiadas tiene de 1 a 4 hijos
30 28 22 28 34 32 32 23
28 35 34 28 20 29 21 30
30 19 27 19 25 30 34 32
31 24 32 20 21 30 31 19
18 27 19 26 26 27 29 34
Si organizamos los datos en una distribución de frecuencia cuyas clases son va-
lores individuales obtenemos lo siguiente:
N deHijos fi Fi f ri F ri
18 1 0,025 1 0,025
19 4 0,100 5 0,125
20 2 0,050 7 0,175
21 2 0,050 9 0,225
22 1 0,025 10 0,250
23 1 0,025 11 0,275
24 1 0,025 12 0,300
25 1 0,025 13 0,325
26 2 0,050 15 0,375
27 3 0,075 18 0,450
28 4 0,100 22 0,550
29 2 0,050 24 0,600
30 5 0,125 29 0,725
31 2 0,050 31 0,775
32 4 0,100 35 0,875
34 4 0,100 39 0,975
35 1 0,025 40 1
Esta agrupación de los datos es poco eficiente ya que la variable edad posee muchos
valores diferentes (modalidades), lo que conlleva a no ser de fácil interpretación.
20 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
V max = 35 y V min = 18
R = V max − V min = 35 − 18 = 17
R 17
A= = = 2,7
K 6,28
[18 - 21)
[21 - 24)
[24 - 27)
[27 - 30)
[30 - 33)
[33 - 36)
f) Calculo de las marcas de clase: La marcas de clase para cada una de los
intervales de clases se muestran a continuación
Esta tabla presenta los datos de manera mas resumida que la tabla 8, lo cual
la hace más fácil de interpretar. Por ejemplo, se puede decir que el 50 % de los
estudiantes tienen edades entre 27 y 30 años.
1.2. ESTADÍSTICA DESCRIPTIVA 23
Edad fi Fi f ri F ri
[18 − 21) 7 0,175 7 0,175
[21 − 24) 4 0,100 11 0,275
[24 − 27) 4 0,100 15 0,375
[27 − 30) 9 0,225 24 0,600
[30 − 33) 11 0,275 35 0,875
[33 − 36) 5 0,125 40 1
una determinada población. Este método tiene como objetivo fundamental facilitar la
comprensión y análisis de ese conjunto y el resumen puede ser representado gráfica-
mente, lo que permite esclarecer aun más las caracterı́sticas asociadas con la población.
Existe una gran variedad de gráficos y la selección apropiada de algunos de ellos para
la representación de la información dependerá, entre otras cosas, del tipo de datos, la
preferencia e interés del investigador. La tabla 10 muestra los gráficos más apropiados
de acuerdo al tipo de variable.
fi
C1 C2 C3 C4 Ck
Clases
25
20
Estudiantes
15
10
5
0
Carrera
C4
C3
C2
C1
Clases
ES
C
o relativa. Para cada valor se traza una lı́nea recta vertical cuya altura
fi
C1 C2 C3 C4 Ck
Clases
10
0 1 2 3 4 5
Número de Hijos
Fi
C1 C2 C3 C4 Ck C6 C7
Clases
40
35
30
25
20
15
10
0 1 2 3 4 5
Nùmero de Hijos
son intervalos.
terı́stica que las barras están juntas unas de otras. Se obtiene constru-
yendo sobre cada intervalo de clase de la variable, un rectángulo cuya
se muestra en la figura
fi
f ri
barra igual a hi = Ai
donde Ai es la amplitud de la clase i, cuando
A1 = A2 = . . . = Ak entonces hi coincide con fi o f ri .
10
8
Frecuencia
6
4
2
0
20 25 30 35
Edad (años)
puntos del histograma que corresponden a los puntos medios. Para re-
presentarlo en el primer y ultimo intervalo, suponemos que adyacentes
fi
Fi
40
30
20
10
18 21 24 27 30 33 36
Edad (Años)
X0 − LIr F0 − Fr−1
=
LSr − LIr Fr − Fr−1
Fi
F0
sentido opuesto.
3. Gráficos Especiales
Hay gráficos o diagramas que se utilizan con gran frecuencia que no hemos con-
siderado hasta ahora por no encontrarse enmarcados en la calificación anterior.
kawa”.
Al concluir esta sección debemos estar en la capacidad de definir y usar las principales
medidas de tendencia central, las medidas de posición , las medidas de dispersión, las
medidas de forma (Asimetrı́a y Curtosis) de un conjunto de datos y las técnicas para
manipular distribuciones de frecuencias ası́ como técnicas de codificación especial.
Las medidas descriptivas las podemos clasificar de acuerdo a lo que se mide en los
forma.
1. Medidas de Localización
tipos de medias:
36 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
n
xi
i=1
x=
n
donde
el número de observaciones
es:
⎧ k
⎪
⎪
⎪
⎪ xi ∗ fi
⎪
⎪
⎪
⎨ i=1
n
, clases individuales;
x =
⎪
⎪
k
⎪
⎪ mi ∗ fi
⎪
⎪
⎪
⎩ i=1
n
, clases en intervalos.
ya que se supone que todos los valores dentro de una clase son iguales
al punto medio de la misma. Esta pérdida de precisión es sin embargo
despreciable.
1.2. ESTADÍSTICA DESCRIPTIVA 37
Propiedades:
n
(xi − x) = 0
i=1
n
n
2
(xi − x) < (xi − k)2
i=1 i=1
n
es decir (xi − x)2 es un mı́nimo.
i=1
x=c
• Si y = a + bx ⇒ y = a + bx para a, b ∈ IR;
n1 x1 + n2 x2 + ... + nr xr
x=
n
Ventajas
Desventajas
son asimétricas.
afectadas por un factor que las modifica. A este factor se le conoce con
el nombre de ponderación y, debe ser considerada al momento de calcu-
lar la media aritmética de esos valores. La media aritmética calculada
considerando esa ponderación recibe el nombre de Media Aritmética
Ponderada y se define de la siguiente manera:
n
xi ∗ pi
i=1
x=
n
pi
i=1
donde
Media Geométrica
√
n
xG = x1 x2 ...xn
40 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
Media Armónica
x21 + x22 + ... + x2n
xa =
n
es, la mediana es aquel valor por debajo (encima) del cual se encuentra el
50 % de los datos.
⎧
⎪
⎨ xn/2 +Xn/2+1
2
, si n es par;
Md =
⎪
⎩ x(n+1)/2 , si n es impar.
1) Se calcula n/2.
la variable y el siguiente.
n/2 − Fam
md = LIm + ∗ am
fm
1) Calcular n/2.
2) Desde este punto trazamos una lı́nea paralela al eje de lasa abcisas hasta
cortar la ojiva.
42 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
Propiedades de la Mediana
Δ1
Mo = LIo + ∗ Ao
Δ1 + Δ2
donde:
Ao = Amplitud modal.
Propiedades:
Nominal Moda
Cualitativa
Ordinal Mediana, Moda
Además del tipo de escala de medida, existen otros factores que deben con-
2. Medidas de Dispersión.
conjunto de datos. Esto es, permiten determinar si los valores están cercanos o
separados entre si. Se pueden clasificar en absolutas y relativas. Las absolutas
dida de dispersión a utilizar, dependerá, entre otras cosas, del objetivo a cumplir
en el estudio. Si se quiere tener una visión general de la variabilidad de los datos,
R = V max − V min
3 y 4. Esto es,
RIC = Q3 − Q1
mos.
de las diferencias entre cada valor del conjunto de datos y su media. Mide
la diferencia que hay en cualquier sentido, positivo o negativo, entre los
n
|xi − x|
i=1
DM =
n
⎧ k
⎪
⎪
⎪
⎪ |xi − x|fi
⎪
⎪
⎪
⎨ i=1
n
, Individuales;
DM =
⎪
⎪ k
⎪
⎪ |mi − x|fi
⎪
⎪
⎪
⎩ i=1
n
, Intervalos.
n
(xi − x)2
S2 = i=1
n−1
⎧ k
⎪
⎪
⎪
⎪ (xi − x)2 fi
⎪
⎪
⎪
⎨ i=1
n−1
, Individuales;
DM =
⎪
⎪ k
⎪
⎪ (mi − x)2 fi
⎪
⎪
⎪
⎩ i=1
n
, Intervalos.
cálculo
⎧
⎪
⎪ k
⎪
⎪ xi 2 − nx2
⎪
⎪
⎪
⎪
⎪
⎪
i=1
, No agrupados;
⎪
⎪ n−1
⎪
⎪
⎨ 2
k
DM = xi fi − nx2
⎪
⎪ i=1
⎪
⎪ , Individuales;
⎪
⎪
n−1
⎪
⎪ k
⎪
⎪
⎪
⎪ m2i fi − nx2
⎪
⎪
⎩ i=1 , Intervalos.
n−1
√
S= S2
Por lo general están dados por el cociente entre una medida de dispersión y
una medida de tendencia central y sirven para comparar la variabilidad de
dos conjuntos de valores.
Q3 − Q1
IQ =
Md
S
CV = ∗ 100
x
Propiedades:
3. Medidas de Forma
50 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
Estas medidas permiten evaluar la situación de los datos desde los ejes vertical
(simetrı́a) y horizontal (curtosis).
Si x = M d = M o la Distribución es simétrica.
⎧ n
⎪
⎪
⎪ (xi − x)3
⎪
⎪
⎪
⎪
⎨ i=1 3 , Datos no agrupados;
nS
Af =
⎪
⎪
k
⎪
⎪ (mi − x)3 fi
⎪
⎪
⎪
⎩ i=1
nS 3
, Datos agrupados en intervalos.
Si Af = 0 la Distribución es simétrica.
x − Mo
Ap =
S
Si Ap = 0 la Distribución es simétrica.
b) Medidas de Curtosis.
⎧ n
⎪
⎪
⎪ (xi − x)4
⎪
⎪
⎪
⎪
⎨ i=1 − 3, Datos no agrupados;
nS 4
Cf =
⎪
⎪
k
⎪
⎪ (mi − x)4 fi
⎪
⎪
⎪
⎩ i=1
nS 4
− 3, Datos agrupados en intervalos.
1.3. Ejercicios
1.3.1. Introducción
Particular 45
Taxi 25
Trolebús 50
Bus 60
Otros 10
Identifique:
a) Universo
b) Población
c) Muestra
e) Tipo de escala.
a) Universo
54 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
b) Población
c) Muestra
e) Tipo de escala.
Identifique:
a) Universo
b) Población
c) Muestra
e) Tipo de escala.
b) El color del cabello de los niños que estén viendo por televisión una pelı́cula.
5. Para cada uno de los ı́tem del ejercicio 5, identifique el tipo de escala más ade-
cuada para realizar la medición.
c s s s d c s s d c
s s s s c d s s s s
c s c c v s s c c s
d v c c s s s s s c
c s s s s s s s s s
2. Los siguientes datos recogen la información del sexo de una persona, la ocupación
y su opinión referente a como ha visto la participación de Venezuela en la Copa
América 2007.
56 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA
F Estudiante Buena
F Docente Regular
M Estudiante Buena
F Estudiante Buena
M Empleado Mala
F Docente Regular
M Estudiante Mala
M Obrero Buena
F Empleado Buena
F Docente Buena
F Estudiante Regular
M Estudiante Mala
M Docente Mala
F Estudiante Buena
M Estudiante Mala
a) Organize los datos en una distribución de frecuencia para cada variable por
separado.
27.9 29.3 31.8 22.5 34.2 34.2 32.7 26.5 26.4 31.6
35.6 31.0 28.0 33.7 32.0 28.5 27.5 29.8 31.2 28.7
30.0 28.7 33.2 30.5 27.9 31.2 29.5 28.7 23.0 30.1
30.5 31.3 24.9 26.8 29.9 28.7 30.4 31.3 32.7 30.3
33.5 30.5 31.3 32.7 30.3 30.1 30.3 29.6 31.4 32.4
5. Construir una distribución de frecuencias con los datos dados a continuación que
1.45 1.49 1.43 1.64 1.64 1.47 1.53 1.22 1.72 1.50
1.46 1.41 1.39 1.39 1.45 1.57 1.18 1.71 1.62 1.48
1.38 1.49 1.27 1.25 1.34 1.56 1.36 1.30 1.21 1.44
1.80 1.29 1.55 1.36 1.61 1.43 1.70 1.50 1.51 1.52
[52 − 56) 4
[56 − 60) 12
[60 − 64) 17
[64 − 68) 20
[68 − 72) 15
[72 − 76) 9
[76 − 80) 3
Calcule:
[100 − 150) 12
[150 − 200) 18
[200 − 250) 21
[250 − 300) 48
[300 − 350) 24
[350 − 400) 15
[400 − 450) 12
Calcule:
N de Hijos N de mujeres
0 13
1 20
2 25
3 20
4 11
5 7
6 4
Se pide:
dientes.
1 3
4 6
10 5
12 20
8 5
Se pide:
1.3. EJERCICIOS 61
[3000 − 3600) 6
[3600 − 4200) 10
[4200 − 4800) 20
[4800 − 5400) 22
[5400 − 6000) 18
[6000 − 6600) 14
[6600 − 7200) 10
Se pide:
dientes.
15
10
Frequency
5
0
1 2 3 4 5 6 7
jub$V1