Está en la página 1de 31

Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Estadística
Grado en Terapia Ocupacional
Tema 2: Estadística Descriptiva
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer 5

Tipos de variables (o datos)


Cualitativas: son las variables que se refieren a una cualidad y no son expresables de
forma rigurosa por un número. A cada una de las formas en las que se presenta una
variable cualitativa se denomina Modalidad. Por ejemplo, el sexo tiene dos
modalidades: varón y mujer; el color del pelo: moreno, castaño y rubio. Se distinguen
dos tipos de variables cualitativas:
1. Nominales: las modalidades no se pueden ordenar (sexo, estado civil, grupo
sanguíneo, etc.). Si solo hay dos modalidades se dice que la variable es Binaria o
Dicotómica, y si hay más de dos se dice que es Policotómica.
2. Ordinales: las modalidades se pueden ordenar (nivel de satisfacción, estado
después del tratamiento, etc.).
Cuantitativas (numéricas): son las variables que se expresan de forma rigurosa mediante
números, y hacen referencia a variables en las que se mide algo. Se distinguen dos tipos de
variables cuantitativas:
1. Discretas: aquellas que sólo pueden tomar “valores numéricos aislados“ (número
de hijos, número de visitas al terapeuta, etc.). En general, hacen referencia a variables
en las que se cuenta el número de veces que ocurre algo.
2. Continuas: pueden tomar cualquier valor dentro de un intervalo de valores, de
modo que entre dos valores siempre existe otro valor posible (peso, estatura, valor
hematocrito, etc.). En general, hacen referencia a medidas.
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Método de tabulación: Tablas

Tabla
original de
datos

Objetivo:
resumir esta
tabla
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

k
Frecuencia absoluta: f 1 + f 2 + ....... + f k= ∑ f=
i =1
i n

Frecuencia relativa (%): h i = fi / n


k
h1 + h 2 + ....... + h=
k ∑ h=
i =1
i 1 (o el 100%)
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Características de las tablas


1. Enunciado que las haga autosuficientes.
2. En las columnas que sea necesario deben ir totales.
3. Unidades de medida.
4. Igual número de decimales por columna.
5. Intervalos de clase de igual anchura.
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Método gráfico: gráficos

Características de los gráficos


1. Deben indicar las escalas y unidades de medida.
2. Deben explicarse por sí solas.
3. Deben contribuir a clarificar el material presentado.
4. Para variables cualitativas, la figura que representa a cada una de las
modalidades debe tener el área proporcional a la frecuencia de dicha
modalidad.
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Gráfico de barras
(datos expresados en categorías)
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Diagrama de sectores
(datos expresados en categorías)
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Gráfico de barras compuesto (o agrupado)


(datos expresados en categorías)
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
Histograma
(datos agrupados en intervalos)
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Método de resumen de datos


• Medida de posición: es un valor que describe cómo se encuentran los datos de
la muestra respecto a el, por tanto informa de cómo se localizan los datos de la
muestra respecto a el.
• Medida de dispersión: es un valor que describe cómo de dispersos o variables
están los datos alrededor de una medida de posición.
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Medidas de posición
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
1. Mediana: es el valor de la variable que divide a la muestra ordenada (de
menor a mayor) en dos partes iguales, quedando por debajo y por encima de
ese valor al mismo número (%) de observaciones. Se denota como “m”:
m = x n +1 
 
 2 
Ejemplos:
a). {3, 6, 7, 10, 15} → m = x(3) = 7
Hay dos datos (el 50%) por debajo de 7 y otros dos (el 50%) por encima
x(3) + x( 4) 6 + 10
b). {1,3, 6,10,15, 20} → m= x 6+1 = x(3,5)= = = 8

 2 
 2 2
Hay tres datos (el 50%) por debajo de 8 y otros dos (el 50%) por encima

2. Percentiles: el percentil k, Pk, es el valor de la variable que divide a la


muestra ordenada en dos partes, dejando por debajo el k% de las observaciones
y por encima el (100-k) %. Se habla entonces de percentil 1 (P1), ..., percentil 99
(P99). Casos particulares:

a). Cuartiles: Q1 = P25, Q2 = P50 = m (mediana), Q3 = P75

b). Deciles: D1 = P10, ..., D9 = P90


Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
Pasos para calcular el percentil k con datos no agrupados:
1. Ordenar la muestra de menor a mayor
k ( n + 1)
2. Calcular el valor
100
3. Buscar en la muestra ordenada el valor que ocupa la posición calculada en el
paso 2. Si esa posición aparece en la muestra, entonces el valor correspondiente
es el percentil k. Si esa posición no aparece en la muestra, entonces el percentil k
es la media entre el valor que ocupa la posición inmediatamente anterior y el
que ocupa la posición inmediatamente posterior.

Ejemplo. Calcular el percentil 80 de los siguientes datos ( n = 10 ) : 1, 7, 3, 5, 3, 6, 7, 1, 9, 8

 1 1 3 3 5 6 7 7 8 9 
1. La muestra ordenada es:  
 x(1) x( 2) x( 3) x( 4) x( 5) x( 6) x( 7 ) x(8) x( 9) x(10) 

k ( n + 1) 80 × 11
2. El valor = = 8,8
100 100
x(8) + x( 9) 7 + 8
3. Como no existe la posición 8,8 entonces:=P80 = = 7,5
2 2
El 80% de los datos de la muestra son inferiores a 7,5 y el 20% superiores a 7,5
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Pasos para calcular el percentil k con datos agrupados:


k n_
1. Calcular el valor
100

2. Buscar en la columna de frecuencias absolutas acumuladas el primer valor


que supera (o iguala) al valor calculado en el paso 1. El percentil k es el valor
de la variable al que le corresponde esa frecuencia absoluta acumulada.

3. Moda: es el valor de la variable que tiene mayor frecuencia. Puede ocurrir


que no haya moda (variable amodal), que haya una (variable unimodal), que
haya dos (variable bimodal), etc… Se denota como “Mo”.
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

4. Media aritmética
a). Media aritmética con datos no agrupados. Se tienen n datos: x1 ,..., xn
n

x1 +  + xn ∑x i
=x = i =1

n n
Ejemplo. A continuación se muestran las edades de 10 niños:
10, 12, 12, 13, 14, 9, 10, 15, 10, 11. Calcular la edad media.
n

∑x 10 + 12 + 12 + 13 + 14 + 9 + 10 + 15 + 10 + 11 116
i
=
x i =1
= = = 11,6
n 10 10

La edad promedio de los 10 niños es 11,6 años.


El promedio de la edad para los 10 niños es de 11,6 años.
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

b). Media aritmética con datos agrupados en una tabla de frecuencias:


Valores de la variable: xi x1  xk
n = ∑ fi = f1 + ... + f k
Frecuencias observadas: fi f1  f k
k

x1 f1 +  + xk f k ∑x f i i
=x = i =1

f1 +  + f k n

Ejemplo. En la siguiente tabla se muestra el número de sesiones de fisioterapia a


las que asistieron 60 personas. Calcular la media.

Nº de sesiones ( xi ) : 5 8 10 12 15
Frecuencias observadas ( fi ) : 4 13 19 16 8
k

∑ x f ( 5 × 4 ) + (8 ×13) + (10 ×19 ) + (12 ×16 ) + (15 × 8)


i i
626
=x =
i =1
= = 10, 43
n 60 60
En promedio, las 60 personas mayores asisten a 10,43 sesiones de fisioterapia.
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

• Datos de la Tabla 2.3 (datos agrupados en intervalos):


k

∑ x f (16,55 ×1) + (17,55 × 5) + (18,55 × 23) +  + ( 23,55 × 2 )


i i
=x =
i =1
= 20, 62
n 320

Aquí cada valor xi es la marca de clase (punto medio) del intervalo.


Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

5. Media ponderada k

x1w1 +  + xk wk ∑xw i i
Valores de la variable ( xi ) x1  =
xk → xp = i =1

Ponderaciones ( wi ) w1 +  + wk k
w1  wk
∑w
i =1
i

xi 5 7 9 81
Ejemplo: wi 3 3 5
→ x p = =7,36 ( x 7; x p ≠ x )
=
11

6. Sobre la elección de la medida de posición


Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Medidas de dispersión
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

1. Amplitud o Rango:=
A xmax − xmin

Medida “pobre”, pues solo tiene en cuenta a dos observaciones de la muestra.


Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

2. Varianza y desviación típica n

∑ (x − x )
i
2

a). Datos no agrupados: x1 ,..., xn ⇒ s 2 = i =1

n −1

• Es una medida de dispersión que tiene en cuenta a todas las observaciones y


es la medida de dispersión más importante y utilizada.

• Se expresa en las unidades de la variable al cuadrado. Así, si la variable está


expresada en cm entonces la varianza se expresa en cm2.

• Es una medida de la dispersión media de los datos respecto a la media.

• Se verifica:∑ ( x − x ) =
0.
  n  
2

1 
 n 

∑ xi  
 
∑ i
i =1
=
• Cálculo práctico: s 2
x 2
− 
n − 1  i=1 n 
 
 
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
x x1 … xk
b). Datos agrupados en una tabla de frecuencias:
f f1 … f k n

n   n

2

∑ f i ( xi − x ) 2
1 
 n  ∑
 i =1
f i xi  
 
=s 2 i == ∑ i i −
2

1
f x
n −1 n − 1  i =1 n 
 
 
Ejemplo. Datos no agrupados: 10, 12, 12, 13, 14, 9, 10, 15, = =
10, 11; n 10 , ∑ xi 116
1  2 1162  1  13456 
=
s2

10 − 1 
(10 + 12 2
+ ... + 10 2
+ 112
) − = 
10  9 
 1380 − =
10 
 3,82

Ejemplo. Datos agrupados:


Nº de sesiones ( xi ) : 5 8 10 12 15
=
Frecuencias observadas ( fi ) : 4 13 19 16 8
=
n 60 ∑ fi xi 626

1  6262  1  391876 
=s 2
 4 × 5 2
+ 13 × 8 2
+ ... + 16 × 12 2
+ 8 × 15 2
− =   6936 − =  6,86
60 − 1  60  59  60 
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer
La varianza se justifica como sigue:
xi x1 x x2

d=
1 x1 − x
d= x2 − x
d=
i xi − x 2

Se calcula la distancia de cada dato a la media. Una posible medida de


dispersión es la media de estas distancias:

=d ∑
=
d ∑( x − x )
i i

n n
El problema es que ∑ ( xi − x ) =
0 y por tanto d = 0 . Soluciones:

1. Tomar los valores absolutos de las distancia, pero esta solución es


problemática.

2. Elevar cada distancia al cuadrado, sumarlas y a continuación calcular la


media, esto es
S2 ∑ ∑ i
( − )
2 2
d x x
= = i

n n
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

Por cuestiones teóricas (que se verán más adelante) se sustituye en el


denominador n por n-1, obteniéndose la expresión de la varianza

∑ (x − x)
2

s 2
= i

n −1

Como la varianza tiene el inconveniente de expresarse en unidades al


cuadrado, entonces se calcula la desviación típica (también denominada
desviación estándar), que se expresa en las mismas unidades que la variable
y se interpreta (aproximadamente) igual que la varianza:

Desviación típica: s = s2

3. Rango intercuartílico: es la medida de dispersión que se utiliza cuando


se utiliza la mediana como medida de posición. Se calcula como:

= Q3 − Q1
RI
Estadística ---------------------- 1º Grado en Terapia Ocupacional--------------Mari Cruz Melchor Ferrer

4. Medida de dispersión relativa: coeficiente de variación


s
CV = 100 %
x

• Se utiliza para comparar métodos de medida.


• Es una medida que tiene en cuenta a todas las observaciones.
• Es adimensional y no depende de las unidades de medida.
• Se utilizan solamente cuando los datos son positivos.
• Se expresa en %.
• Cuanto menor es el CV, mayor es la precisión del método.
• Ejemplo: CV=10% indica que por cada 100 unidades de medida, el
método comete un error, medido en desviaciones típicas, de 10.

FIN DEL TEMA 2

También podría gustarte