Está en la página 1de 38

MÉTODOS NUMÉRICOS

RESUMIR LOS DATOS


NUMERICAMENTE

MEDIDAS DE MEDIDAS DE MEDIDAS MEDIDAS DE


TENDENCIA CENTRAL DISPERSION DE POSICION FORMA

MEDIA DEV. MEDIA PERCENTILES CURTOSIS

MEDIANA VARIANZA CUARTILES ASIMETRÍA

MODA DEV. ESTANDAR


MEDIDAS DE TENDENCIA
CENTRAL

Son llamadas también medidas de localización y permiten


determinar un valor característico de una distribución de
frecuencias ubicado hacia el centro de la distribución.
1. MEDIA ARITMÉTICA
n

1. Datos no agrupados x i
x  i 1
n

2. Datos agrupados en tablas de frecuencias.


k

x
2.1 Discretos
i * ni
x i 1

k
2.2 Continuos
m *n i i
x i 1
n
PROPIEDADES DE LA MEDIA ARITMÉTICA

1. Producto de la media por una constante.

cX  cX
2. Suma o diferencia de la media con una constante.

X C  X C
3. Si X e Y representan 2 variables con igual número de datos,
entonces la media de la suma de estas variables es

X Y  X Y
4. La suma de las desviaciones del i-ésimo dato con respecto de
la media es cero

 (x  x)  0
i 1
i

DESVIACIÓN
2. MEDIANA.

Corresponde al valor de la variable bajo el


cual está el 50% de las unidades muestrales
con los valores más pequeños de la variable
y sobre él, está el otro 50% de las unidades
muestrales con los valores más altos, de la
variable.
1. Datos sin agrupar

CONJUNTO DE DATOS DE TAMAÑO n


ORDENADOS.

n 1
Posición ( Me) 
2
n par n impar

x(i )  x(i 1) Me  xPosición(Me)


Me 
2

x(i ) ; x(i 1) Datos centrales


2. Datos agrupados en tablas de frecuencias.

2.1 Discretos
Se identifica el valor de la frecuencia acumulada N que supera
inmediatamente al valor n/2, entonces

Me  xi
2.2 Continuos

n
 N i 1
Me  Li 1  2 * ai
ni
INTERVALO MEDIANO.
Corresponde al intervalo cuya
frecuencia acumulada Ni supera
inmediatamente la Posición (Me)
Li1 : Límite inferior del intervalo mediano.
n : tamaño de muestra.
N i-1 : frecuencia acumulada del intervalo anterior al
mediano.
n i : frecuencia absoluta del intervalo mediano.
a i : amplitud del intervalo.
3. MODA

1. Datos sin agrupar

El valor de la variable que más se repite


en el conjunto de datos

2. Datos agrupados

Valor de la variable de mayor frecuencia absoluta.

2.1 Discreto
Mo  xi
2.2 Continuos

ni 1
Mo  Li 1  * ai
ni 1  ni 1
INTERVALO MODAL.
Corresponde al intervalo de
mayor frecuencia absoluta ni

L i 1 : Límite inferior del intervalo modal.


n i-1 : frecuencia absoluta anterior al intervalo modal.
n i 1 : frecuencia absoluta del intervalo siguiente al modal.
a i : amplitud del intervalo.
EJEMPLO 1. Obtención e interpretación de las medidas de
tendencia central.
Para las siguientes tablas de frecuencias obtener media,
mediana y moda. Interprete.

CASO 1. Tabla de frecuencias para datos de


variables discretas

Clase Xi ni x=
(i)
1 3 2 Me =
2 7 3
3 9 10 Mo =
4 12 5
CASO 2. Tabla de frecuencias para datos de variables
continuas

Intervalo ni
s
x =

10-20 2
Me =
20-30 5
30-40 9
Mo =
40-50 3
50-60 1
MEDIDAS DE DISPERSIÓN
1. VARIANZA V(X).
n

1. Datos sin agrupar.  (x i  x) 2

s 
2
x
i 1

n
2. Datos agrupados en
tablas de frecuencias. k

2.1. Discretos
 i
( x  x ) 2
* ni
s x2  i 1

n
k

2.2. Continuos  i
( m  x ) 2
* ni
s x2  i 1

n
PROPIEDADES DE LA VARIANZA

a) V (C )  0
b) V (CX )  C 2V ( X )
c) V ( X  C )  V ( X )
d )V ( X  Y )  V ( X )  V (Y ); si X e Y son independie ntes.
2. DESVIACIÓN ESTÁNDAR (s)

sx   V (X )
3. RANGO DE VARIACIÓN (R)

ES LA DIFERENCIA QUE EXISTE ENTRE EL


MÁXIMO Y MÍNIMO VALOR DE LA VARIABLE
PRESENTES EN UN CONJUNTO DE DATOS.

R  X máx  X mín
COEFICIENTE DE VARIACIÓN (CV)

ENTREGA UNA MEDIDA DE DISPERSIÓN


DE DATOS POSITIVOS EXPRESADA EN
FORMA PORCENTUAL.
SE UTILIZA PARA COMPARAR LA
VARIABILIDAD, ENTRE CONJUNTOS DE
DATOS DE VARIABLES CUANTITATIVAS

SX
CV  *100
X
MEDIDAS DE POSICIÓN
1.- CUARTILES (Q) Dividen a la
distribución de
Ejemplo. frecuencias en
N° Notas
1 4,2 cuatro partes
2 3,9
3 2,6 iguales.
4 2,3
5 4,9
6 2,4
7 3,4
8 2,6
9 5,8 Q2= Mediana = 50%
10 5,7
11 3,3
12 4,5
13 1,8
14 4,4 Q1:25%
15 3,7
16 4,1
17 2,9 Q2:50%
18 3,1
19 4,7
20 2,9 Q3:75%
21 4,5
22 4,8
23 3,6
24 4,5
25 4,2
26 4,6
Se ordenan los datos y se dividen en 4 partes iguales.

N° Notas Posición Notas Jerarquía Porcentaje


1 4,2 9 5,8 1 100,0%
2 3,9 10 5,7 2 96,0%
3 2,6 5 4,9 3 92,0%
4 2,3 22 4,8 4 88,0%
5 4,9
19 4,7 5 84,0%
6 2,4
26 4,6 6 80,0%
7 3,4
8 2,6
12
21
4,5
4,5
7
8
76,0%
68,0%
Q3
9 5,8
10 5,7 24 4,5 8 68,0%
11 3,3 14 4,4 10 64,0%
12 4,5 25 4,2 11 60,0%
13 1,8 1 4,2 12 56,0%
14 4,4
15 3,7
16
2
4,1
3,9
13
14
52,0%
48,0%
Q2
16 4,1 15 3,7 15 44,0%
17 2,9 23 3,6 16 40,0%
18 3,1
7 3,4 17 36,0%
19 4,7
11 3,3 18 32,0%
20 2,9
18 3,1 19 28,0%
21
22
4,5
4,8 20 2,9 20 24,0% Q1
23 3,6 17 2,9 21 20,0%
24 4,5 3 2,6 22 16,0%
25 4,2 8 2,6 23 12,0%
26 4,6 6 2,4 24 8,0%
4 2,3 25 4,0%
13 1,8 26 ,0%
2-. DECILES (D)

Dividen la distribución de
frecuencias en 10 partes iguales
D5= mediana =50%
D1=10%, D2=20%,….,D9=90%

3-. PERCENTILES (P)

DIVIDEN LA DISTRIBUCIÓN EN 100 PARTES IGUALES.

Observación: con la fórmula de percentil para datos


agrupados, se pueden obtener deciles y cuartiles
3-. PERCENTILES (P) ¿Cómo encontrar el intervalo cuantílico?

ES AQUEL CUYA FRECUENCIA


n*r
 N i 1 ACUMULADA ES

Pr  Li 1  100
INMEDIATAMENTE MAYOR A
* ai
ni
n*r
n : total de datos.
L : límite inferior del intervalo cuantílico.
100
i-1
N : frecuencia acumulada del intervalo anterior al cuantílico.
i-1
n : frecuencia absoluta del intervalo cuantílico.
i
a : amplitud del intervalo.
i
r : orden del percentil.
RECORRIDO INTERCUARTÍLICO (Q)

ES LA AMPLITUD ENTRE LOS CUARTILES:

Q  Q3  Q1
MEDIDAS DE FORMA
MOMENTO MUESTRAL DE ORDEN p (MP).

SE DEFINE AL MOMENTO MUESTRAL DE


ORDEN p ( Mp) ALREDEDOR DE LA MEDIA
ARITMÉTICA:
n

 ( xi  x ) p
Mp  i 1
n
1.- COEFICIENTE DE ASIMETRÍA (C)
M3
La asimetría o sesgo es la falta de simetría C 3
de una distribución de frecuencias, respecto
de la distribución normal.
sx
8

7 Si C<0 asimetría negativa


6 7

5
6
No of obs

5
3

2 4

No of obs
1
3

0
0 1 2 3 4 5 6 7 8
2

1
7

0
6 0 1 2 3 4 5 6 7 8 9 10

5
No of obs

3
Si C = 0 simétrica.
2

0
0 1 2 3 4 5 6 7
Si C>0 asimetría positiva.
Asimétrica

Positiva
Negativa
Distribución Asim étrica Positiva
Dis tribución As im é trica Ne gativa

12
12
10
10
8
8
6
6
4
4 2
2 0
0 1 2 3 4 5 6 7
1 2 3 4 5 6 7

C<0 C>0
2.- CURTOSIS (K)
ESTE COEFICIENTE MIDE EL GRADO DE
APUNTAMIENTO DE UNA DISTRIBUCIÓN DE
FRECUENCIAS.
M4
K  2 3
LEPTOCÚRTICA M2
K>0

MESOCÚRTICA
K=0

PLATICÚRTICA
K<0
individuo longitud
1 2,625 EJEMPLO1. Los siguientes datos corresponden a la
2 2,625 longitud de larvas criadas en un ambiente adecuado.
3 2,625
Obtener:
4 2,875
5 3,125 a) Media, Mediana , Moda.
6 3,375 b) Varianza, desviación estándar y CV.
7 3,375
8 3,375 c) A partir de los resultados del cuadro 1, concluya respecto
9 3,375 de la asimetría y forma de la distribución de frecuencias.
10 3,875
11 3,875
12 3,875
13 3,875
Curtosis -1,3625
14 3,875 Coeficiente de asimetría -0,3454
15 4,375 Rango 2,75
16 4,875
17 4,875 Mínimo 2,625
18 4,875 Máximo 5,375
19 4,875
20 4,875
21 4,875
22 5,375
23 5,375
Media 4,2916667
24
25
5,375
5,375
Mediana 4,625
26 5,375 Moda 5,375
27 5,375
28 5,375 Desviación estándar 0,9920662
29 5,375
30 5,375
Varianza de la muestra 0,9841954
paciente minutos
1 10.5
2 12.7
3 3.8
4 9.1 EJEMPLO2. Los siguientes datos corresponden al tiempo
5 13.6
6 11.2
de reacción alérgica a la picadura de abeja, en minutos
7 11.4 Obtener:
8 10.5
9 13.4 a) Media, Mediana , Moda.
10 14.7
11 9.9
b) Varianza, desviación estándar y CV.
12 11.6
13 11.7 c) A partir de los resultados del cuadro 1, concluya respecto
14 12.3 de la asimetría y forma de la distribución de frecuencias.
15 11.5
16 15.0
17 6.2
18 8.4 Estadísticos minutos
19 5.9
20 11.5 Media 10,6
21 11.4 Mediana 10,9
22 7.9
23 12.5 Moda 11,4
24 11.4
25 10.9
Des. estándar 2,53
26 12.7 Varianza 6,42
27 8.3
28 11.2 Coef. Variación 23,87
29 8.8
30 9.8
31 16.5
Curtosis 0,66
32 10.9 Asimetria -0,26
33 9.1
34 7.4 Rango 12,7
35 12.9 Mínimo 3,8
36 10.1
37 8.1 Máximo 16,5
38 10.4
Cuenta 40
39 8.6
40 9.9
GRAFICO DE CAJA

EL GRAFICO DE CAJA ES UTILIZADO PARA


OBSERVAR LA POSICIÓN RELATIVA DE LOS
CUARTILES, LA PRESENCIA DE VALORES
EXTREMOS DE UNA DISTRIBUCIÓN DE
FRECUENCIAS, LA FORMA DE LA
DISTRIBUCIÓN, ENTRE OTRAS COSAS.
GRAFICO DE CAJA (BOX-PLOT)

197,35

162,42 PUNTOS ATIPICOS

127,50

Q3 75% MEDIANA

92,57
Q1 25%

57,65
COMENTARIOS DEL GRAFICO DE CAJA

a) Si la mediana esta más cerca del primer cuartil y la antena


superior es de mayor longitud, la distribución presenta
sesgo positivo.
b) Si la mediana esta más cerca del tercer cuartil y la antena
superior es de menor longitud, la distribución presenta
sesgo negativo.
c) Si la mediana esta en el centro de la caja y las antenas
tienen la misma longitud, la distribución es simétrica.
Ejemplo
• ¿Qué peso no alcanza el 25% de los
individuos?
– Primer cuartil = percentil 25 = 60 Kg.

• ¿Qué peso es superado por el 25% de los


individuos?
– Tercer cuartil= percentil 75= 80 kg. 50%

• ¿Entre qué valores se encuentra el 50% de


los individuos con un peso “más normal”?
– Entre el primer y tercer cuartil = entre 60
y 80 kg. 100

– Indica que tan dispersos están los


individuos que ocupan la “parte 90

central” de la muestra. Ver más adelante


rango intercuartílico. 80

– Los diagramas de caja (‘boxplot’)


sintetizan esta información (y algo 70

más).
Estadísticos 60

PESO
50
Percentiles 25 60,00
50 70,00
40
75 80,00
Ejemplo 1 Gráfico de Cajas(box-plot)

0
G K Q
Empresa G= General Mills
K= Kellogg’s
Proteínas Grasa Fibra Q=Quaker

También podría gustarte