0% encontró este documento útil (0 votos)
135 vistas15 páginas

Guía Completa de Estadística Descriptiva

Este documento presenta definiciones y conceptos básicos de estadística descriptiva. Explica medidas de tendencia central como la media, moda y mediana, medidas de dispersión como el rango, desviación estándar y varianza, y medidas de posición como cuartiles, deciles y percentiles. También incluye fórmulas para calcular estas medidas para datos agrupados y no agrupados.

Cargado por

Aldo Ortega
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
135 vistas15 páginas

Guía Completa de Estadística Descriptiva

Este documento presenta definiciones y conceptos básicos de estadística descriptiva. Explica medidas de tendencia central como la media, moda y mediana, medidas de dispersión como el rango, desviación estándar y varianza, y medidas de posición como cuartiles, deciles y percentiles. También incluye fórmulas para calcular estas medidas para datos agrupados y no agrupados.

Cargado por

Aldo Ortega
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Universidad Católica Andrés Bello 1

Preparaduría Probabilidades y Estadísticas

UNIVERSIDAD CATOLICA ANDRES BELLO


Urb. Montalbán – La Vega – Apartado 29068
Teléfono: 471-4148 Fax: 471-3043
Caracas, 1021 - Venezuela
___________
Facultad de Ingeniería
Escuela de Ingeniería Informática
-----------------------

ESTADÍSTICA DESCRIPTIVA

A continuación serán expuestas las definiciones y notaciones que vamos a utilizar en


estadística descriptiva:

 Frecuencia Absoluta: f i
 Frecuencia Relativa: hi
 Frecuencia Relativa Porcentual: hi %
 Frecuencia Acumulada: Fi
 Frecuencia Relativa Acumulada: H i
 Frecuencia Porcentual Acumulada: H i %
LimiteInfe rior  LimiteSuperior
 Marca de Clase ( X i ):
2
M N
 Amplitud de Clase ( a ): M  Máximo , N  Mínimo
k
 1) Número de Clases ( k ): k  n n  tamaño de la muestra
Observación: Esta regla es útil cuando n  400 .

 2) Número de Clases ( k ): 1  3,322 * log( n) (Regla de Sturges)


 3) Número de Clases ( k ): log( n) / log( 2)

La estadística descriptiva se divide en tres partes que serán expuestas a continuación:

Representación Grafica:

- Sectores Circulares.
- Histograma.
- Diagrama de Cajas.
- Barras.
- Puntos.

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 2
Preparaduría Probabilidades y Estadísticas

Medidas de Tendencia Central: Son un número entorno a que valor está concentrado el
resto de la muestra.

- Media Aritmética.
- Moda: Es la variable de la muestra que más se repite.
- Mediana: Es el valor que divide el conjunto de datos ordenados en dos partes
iguales.

Medidas de Dispersión: Cuan disperso están los valores.

- Recorrido.
- Desviación Estándar.
- Varianza.

Medidas de Posición: Dividen la muestra en distintas partes iguales.

- Cuartiles: Dividen el conjunto de datos ordenados en 4 partes iguales.


- Deciles: Dividen el conjunto de datos ordenados en 10 partes iguales.
- Percentiles: Dividen el conjunto de datos ordenados en 100 partes iguales.

Fórmulas de Medidas de Tendencia Central:

Media Aritmética:

x  Cuando sea para una muestra.


  Cuando sea para una población.

Datos no Agrupados Datos Agrupados


n n

X i
X  X 2  X 3  ...  X n X i * fi
X 1 * f1  X 2 * f 2  ...  X n * f n
x i 1
 1 x i 1

n n n n
X i : Marcas de Clases.
N

X i
f i : Frecuencias absolutas.
 i 1

Moda: Es el valor que más se repite en un grupo de números dentro de una muestra.

Datos no Agrupados Datos Agrupados


No existe fórmula para datos no agrupados, lo Los pasos son:
único que hay que hacer es tomar la variable 1. Ubicar la mayor f i , para hallar el
con el valor que más se repite. intervalo modal

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 3
Preparaduría Probabilidades y Estadísticas

2. Aplicar la fórmula

i
Mo  li  *a
i   s
li : Límite inferior.
 i : Es el valor que se obtiene de restar la
f mod al con la frecuencia anterior.
 s : Es el valor que se obtiene de restar la
f mod al con la frecuencia siguiente.
a : Amplitud de Clase.

Consideraciones:

- Puede haber más de una moda cuando dos o más números se repiten la misma
cantidad de veces. En este caso se estaría hablando de una muestra multi-modal.
- No hay moda si ningún número se repite más de una vez.

Mediana:

Datos no Agrupados Datos Agrupados


El valor de la mediana puede coincidir o no Los pasos son:
con un valor de la muestra, todo depende si el n
número de datos es par o impar. 3. Calcular:
2
4. Localizar ese valor en Fi , si no está
Los pasos son:
1. Organizar en orden ascendente los pasar al inmediato superior, con esto
datos. se haya el intervalo de la mediana.
2. Si el número de datos es impar, 5. Aplicar la formula sustituyendo los
valores correspondientes.
n 1
utilizamos la siguiente fórmula:
2 n
Si el número de datos es par, la  Fa
mediana será el promedio aritmético Me  li  2 *a
de los dos valores que se encuentran f med
en la mitad de la muestra. li : Límite inferior.
Fa : Frecuencia acumulada anterior.
f med : Frecuencia absoluta del intervalo de la
mediana.
a : Amplitud de Clase.

Fórmulas de Medidas de Dispersión:

Recorrido: Es la diferencia entre el valor más alto y el más bajo observado.

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 4
Preparaduría Probabilidades y Estadísticas

R  Xmáximo  Xmínimo

Desviación típica o estándar: Se define como la raíz cuadrada positiva de la varianza.

S  Cuando sea para una muestra.


  Cuando sea para una población.

Datos no Agrupados Datos Agrupados


n n

 ( X i  X )2 (X i  X )2 * fi
S i 1
S i 1

n 1 n 1

N N

 ( X i  )2 (X i  )2 * fi


 i 1
 i 1

N N

Consideraciones:

- La desviación típica de una constante es cero.


- Siempre es una cantidad positiva.
- La desviación típica del producto de una constante por una variable es igual al
producto de la constante por la desviación típica de la variable.

Varianza: Es la medida del cuadrado de la distancia promedio entre la media y cada


elemento de la población.

S 2  Cuando sea para una muestra.


 2  Cuando sea para una población.

Datos no Agrupados Datos Agrupados


n n

 (X i  X )2 (X i  X )2 * fi
S2  i 1
S2  i 1
n 1 n 1
N N

 ( X i  )2 (X i  )2 * fi


2  i 1
2  i 1

N N

Consideraciones:

- Cuando deseamos estimar la varianza de una población, a partir de una muestra,


el error cometido es mucho menor si lo dividimos entre n  1 y no n .

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 5
Preparaduría Probabilidades y Estadísticas

Fórmulas de Medidas de Posición:

MEDIANA  Q2  D5  P50

Anteriormente observamos la mediana con su respectiva medida de posición. Además


podemos denotar otros tipos de igualdades entre las diferentes medidas de posición:

Cuartiles = Percentiles
Q1  P25
Q3  P75

Deciles = Percentiles
D1  P10 D6  P60
D2  P20 D7  P70
D3  P30 D8  P80
D4  P40 D9  P90

Datos no Agrupados Datos Agrupados


Los pasos son: Los pasos son:
1. Organizar en orden ascendente los n* p
datos. 1. Ubicar el resultado de en Fi
100
2. Calcular el índice “i”: 2. Si no está el valor, se pasa al
inmediato superior.
 p  3. Al ubicar el valor de Fi determinamos
i *n
 100  el valor de donde se obtendrán los
p : Percentil que queremos hallar. datos para sustituir en la ecuación.
n : Tamaño de la muestra. 4. Aplicamos la fórmula:

- Si “i” es entero el percentil es el n* p


promedio de los valores de los datos  Fa
Pp  li  100 *a
ubicados en los lugares “i” e “i+1”.
fp
- Si “i” no es entero el percentil se
redondea al valor entero inmediato li : Límite inferior.
superior. Fa : Frecuencia acumulada anterior.
p : Percentil que queremos hallar.
n : Tamaño de la muestra.
a : Amplitud de Clase.
f p : Frecuencia Absoluta del intervalo.

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 6
Preparaduría Probabilidades y Estadísticas

PROBLEMAS
Debemos destacar que los problemas expuestos en esta sección son sacados de libros,
guías, internet o cualquier otra herramienta bibliográfica.

Tabla de distribución de frecuencias para datos sin agrupar:

1) (Prof. José Campos) Si en un examen de base de datos las notas fueron 7, 7, 7, 8, 9,


9, 9, 10, 10, 11, 11, 11, 11, 12, 12, 14.

Construimos la tabla de distribución de frecuencias.

NOTAS Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta Relativa Acumulada Relativa Relativa Porcentual
Porcentual Acumulada Acumulada
7 3 3/16 =0,19 3 19 0,19 19
8 1 1/16 =0,06 4 6 0,25 25
9 3 3/16 =0,19 7 19 0,44 44
10 2 2/16 =0,125 9 12,5 0,565 56,5
11 4 4/16 =0,25 13 25 0,815 81,5
12 2 2/16 =0,125 15 12,5 0,94 94
14 1 1/16 =0,06 16 6 1 100
TOTAL 16 1 16 100 1 100

Cálculo de Medidas de Tendencia Central para datos sin agrupar:

a. Media:

16

X i
7  7  7  8  9  9  9  10  10  11  11  11  11  12  12  14
x i 1

16 16

16

X i
158
x i 1
  9,88
16 16

b. Mediana

Xn  Xn
1 X 8  X 9 10  10
Par.- Me  2 2
   10
2 2 2

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 7
Preparaduría Probabilidades y Estadísticas

c. Moda

La moda es: Mo  11

Cálculo de Medidas de Dispersión para datos sin agrupar:

a. Recorrido

R  Xmáximo  Xmínimo  14  7  7

b. Desviación típica o estándar

(X i  X )2
S i 1

n 1

[3 * (7  9,88) 2 ]  (8  9,88) 2  [3 * (9  9,88) 2 ]  [2 * (10  9,88) 2 ]  [4 * (11  9,88) 2 ] 


[2 * (12  9,88) 2  (14  9,88) 2
S
15

24,88  3,53  2,32  0,03  5,02  8,99  16,97 61,74


S   4,116  2,029
15 15

c. Varianza

V  S 2  4,116

Tabla de distribución de frecuencias para datos agrupados:

2) (Prof. José Campos) Si en un examen de base de datos las notas fueron 7, 7, 7, 8, 9,


9, 9, 10, 10, 11, 11, 11, 11, 12, 12, 14.

- Para construir la tabla de distribución de frecuencias (datos agrupados):

1) Ordeno los datos en forma ascendente.


2) Busco n .
3) Busco el número de clases k .

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 8
Preparaduría Probabilidades y Estadísticas

4) Busco la amplitud de la clase a .

1) Ordeno los datos en forma ascendente:

7, 7, 7, 8, 9, 9, 9, 10, 10, 11, 11, 11, 11, 12, 12, 14.

2) Buscamos n :

n  16

3) Buscamos el número de clases k .

k  16  4

4) Buscamos la amplitud de la clase a .


14  7 7
a   1,75  2
4 4

Construimos la tabla de distribución de frecuencias.

NOTAS Frecuencia Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta de Clase Relativa Acumulada Relativa Relativa Porcentual
Porcentual Acumulada Acumulada
[7-9) 4 8 4/16 = 0,25 4 25 0,25 25
[9-11) 5 10 5/16 = 0,31 9 31 0,56 56
[11-13) 6 12 6/16 = 0,38 15 38 0,94 94
[13-15) 1 14 1/16 = 0,06 16 6 1 100
TOTAL 16 1 16 100 1 100

Cálculo de Medidas de Tendencia Central para datos agrupados:

a. Media:

16

X i * fi
8 * 4  10 * 5  12 * 6  1 *14 168
x i 1
   10,5
16 16 16

El valor anterior es un estimado de la media ya que al agrupar las clases no conocemos


el verdadero valor de cada individuo de la muestra, se renuncia a la exactitud por la
comodidad de los cálculos.

b. Mediana

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 9
Preparaduría Probabilidades y Estadísticas

n 16
Calcular:  8
2 2

Como no se encuentra 8 en la frecuencia acumulada, se toma el inmediato superior, que en este


caso vendría siendo 9.

84
Me  9  * 2  10,6
5

c. Moda

65
Mo  11  * 2  11,333
(6  5)  (6  1)

Cálculo de Medidas de Dispersión para datos agrupados:

a. Recorrido

R  Xmáximo  Xmínimo  14  7  7

b. Desviación típica o estándar

(X i  X )2 * fi
S i 1

n 1

[(8  10,5) 2 * 4]  [(10  10,5) 2 * 5]  [(12  10,5) 2 * 6]  [(14  10,5) 2 *1]


S
15

25  1,25  13,5  12,25 52


S   3,467  1,862
15 15

c. Varianza

V  S 2  3,467

3) (Prof. José Campos) Un investigador desea determinar cómo varían las estaturas de
las obreras de una empresa y toma una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas. Los datos obtenidos fueron los siguientes:

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 10
Preparaduría Probabilidades y Estadísticas

65 63 65 63 69 67 53 58 60 61
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62

- Para construir la tabla de distribución de frecuencias (datos agrupados):

5) Ordeno los datos en forma ascendente.


6) Busco n .
7) Busco el número de clases k .
8) Busco la amplitud de la clase a .

1) Ordeno los datos en forma ascendente:

53, 55, 56, 57, 57, 58, 58, 59, 59, 60, 60, 60, 61, 61, 61, 61, 62, 62, 62, 62, 63, 63, 63, 63,
63, 64, 64, 64, 64, 64, 64, 65, 65, 65, 65, 65, 66, 66, 66, 66, 67, 67, 67, 68, 68, 69, 69, 70,
71, 72.

2) Buscamos n :

n  50

3) Buscamos el número de clases k .

k  50  7,071  7

4) Buscamos la amplitud de la clase a .


72  53 19
a   2,71  3
7 7

Construimos la tabla de distribución de frecuencias.

ESTATURAS fi Xi hi Fi hi % Hi Hi %
[53-56) 2 54,5 0,04 2 4 0,04 4
[56-59) 5 57,5 0,1 7 10 0,14 14
[59-62) 9 60,5 0,18 16 18 0,32 32
[62-65) 15 63,5 0,3 31 30 0,62 62**
[65-68) 12 66,5 0,24 43 24* 0,86 86
[68-71) 5 69,5 0,1 48 10 0,96 96
[71-74) 2 72,5 0,04 50 4 1 100
TOTAL 50 1 50 100 1 100

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 11
Preparaduría Probabilidades y Estadísticas

Interpretación

* El 24% de las obreras tienen una estatura mayor de 65 y menor de 68 pulgadas.

** El 62% de las obreras tienen una estatura menor de 65 pulgadas.

a. Media:

50

X i * fi
54,5 * 2  57,5 * 5  60,5 * 9  63,5 *15  66,5 *12  69,5 * 5  72,5 * 2 3184
x i 1
   63,68
50 50 50

Las obreras en promedio tienen una estatura de 63,68 pulgadas

b. Mediana

n 50
Calcular:   25
2 2

Como no se encuentra 25 en la frecuencia acumulada, se toma el inmediato superior, que en


este caso vendría siendo 31.

25  16
Me  62  * 3  63,8
15

El 50% de las obreras tienen una estatura igual o inferior a 63,68 aproximadamente.

c. Moda

15  9
Mo  62  * 3  64
(15  9)  (15  12)

La mayoría de las obreras tienen una estatura de 64 pulgadas aproximadamente.

d. Recorrido

R  Xmáximo  Xmínimo  72  53  19

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 12
Preparaduría Probabilidades y Estadísticas

e. Desviación típica o estándar

[(54,5  63,68) 2 * 2]  [(57,5  63,68) 2 * 5]  [(60,5  63,68) 2 * 9]  [(63,5  63,68) 2 *15] 


[(66,5  63,68) 2 *12]  [(69,5  63,68) 2 * 5]  [(72,5  63,68) 2 * 2]
S
49

871,38
S  17,783  4,217
49
f. Varianza

V  S 2  17,783

4) (Prof. José Campos) La siguiente tabla representa la edad de los empleados que
trabajan en cierta empresa:

Edad N° de Empleados
22-26) 12
26-30) 29
30-34) 27
34-38) 19
38-42) 16
42-46) 10
46-50) 7

Construimos la tabla de distribución de frecuencias.

Edad fi Xi hi Fi hi % Hi Hi %
[22-26) 12 24 0,1 12 10 0,1 10
[26-30) 29 28 0,24 41 24 0,34 34
[30-34) 27 32 0,23 68 23 0,57 57
[34-38) 19 36 0,16 87 16 0,73 73
[38-42) 16 40 0,13 103 13 0,86 86
[42-46) 10 44 0,08 113 8 0,94 94
[46-50) 7 48 0,06 120 6 1 100
TOTAL 120 1 120 100 1 100

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 13
Preparaduría Probabilidades y Estadísticas

a. Edad más frecuente:

29  12
Mo  26  * 4  29,58
(29  12)  (29  27)

b. La edad que se encuentra justo en el 50% de la distribución:

n 120
Calcular:   60
2 2

Como no se encuentra 60 en la frecuencia acumulada, se toma el inmediato superior, que en


este caso vendría siendo 68.

60  41
Me  30  * 4  32,81
27

c. La edad mínima del 40% entre los mayores:

Calculamos el P60

120 * 60
 72
100

Como no se encuentra 72 en la frecuencia acumulada, se toma el inmediato superior, que en


este caso vendría siendo 87.

120 * 60
 68
P60  34  100 * 4  34,84
19

d. Porcentaje entre 28 y 40 años:

Pp  28 Pp  40

( Pp  li ) * f i ( Pp  li ) * f i
 Fa  Fa
p a *100 p a *100
n n

(28  26) * 29 (40  38) *16


 12  87
p 4 *100  22,08 p 4 *100  79,17
120 120

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 14
Preparaduría Probabilidades y Estadísticas

El porcentaje entre 28 y 40 años es: R  79,17  22,08  59,07

e. Porcentaje entre x  s :

Media:

120

X i * fi
24 *12  28 * 29  32 * 27  36 *19  40 *16  44 *10  48 * 7 4064
x i 1
   33,87
120 120 120

Desviación típica o estándar:

[(24  33,87) 2 *12]  [(28  33,87) 2 * 29]  [(32  33,87) 2 * 27]  [(36  33,87) 2 *19] 
[(40  33,87) 2 *16]  [(44  33,87) 2 *10]  [(48  33,87) 2 * 7]
S
119

5373,87
S  45,159  6,72
119

x  s : 27,15;40,59

Pp  27,15 Pp  40,59

( Pp  li ) * f i ( Pp  li ) * f i
 Fa  Fa
p a *100 p a *100
n n

(27,15  26) * 29 (40,59  38) *16


 12  87
p 4 *100  16,95 p 4 *100  81,13
120 120

El porcentaje x  s es: R  81,13  16,95  64,18

f. Calcule la curtosis e interprete:

El intervalo es 64,18% por lo que la distribución de los datos es platicúrica.

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Bello 15
Preparaduría Probabilidades y Estadísticas

g. Calcule el coeficiente de asimetría e interprete:

3 * ( x  Med ) 3 * (33,87  32,81)


SK    0,47
S 6,72

La asimetría es positiva, lo que quiere decir, sesgo a la derecha.

h. Histograma:

35

30

25

20

15

10

0
[22-26) [26-30) [30-34) [34-38) [38-42) [42-46) [46-50)

Preparador: Eduardo Lakatos Contreras

También podría gustarte