Está en la página 1de 9

UNIDAD DE INVESTIGACIONES- FACULTAD DE ODONTOLOGÍA

POSGRADOS 1ER SEMESTRE


ODONTOLOGÍA BASADA EN LA EVIDENCIA

LUIS FERNANDO GAMBOA MARTINEZ


ENDODONCISTA
MSc Epidemiología Clínica

MODULO 3: ESTADISTICA DESCRIPTIVA - MEDIDAS DE TENDENCIA CENTRAL

Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que
constituyen una muestra tomada de alguna población. Dentro de ellas tenemos el promedio,
la mediana y la moda.

PROMEDIO O MEDIA ARITMETICA

Equivale al cálculo del promedio simple de un conjunto de datos. Se representa mediante el

símbolo .

Su fórmula para calcularla es:

Ejemplo

Un estudiante tiene las siguientes notas en una asignatura: 4, 3, 5, 1, 4, 5. Al sumar estas cifras
obtenemos un valor de 22. Como son 6 notas, dividimos 22 entre 6 y nos da como resultado
promedio de notas del estudiante 3,6.

El promedio es la medida de resumen más utilizada, sin embargo se debe utilizar con cuidado
porque se deja afectar por valores extremos.

Si las notas del estudiante al final del semestre son: 4, 3, 5, 1, 4, 5, 0, 0, 0, 0, el promedio es 2.2
observe que este valor de la media aritmética, no pertenece al conjunto de valores obtenidos
por el estudiante.
MEDIANA

Es un número tal que al menos el 50% de las observaciones son menores o iguales a él, y al
menos el 50% son mayores o iguales a él. La mediana es muy resistente a valores extremos. La
representamos por el símbolo Me.

Se calcula de la siguiente forma:

1 - Se ordenan las observaciones, de menor a mayor o de mayor a menor.

2 - Si el número n de observaciones es impar, la mediana es la que queda exactamente al


centro.

3 - Si el número de observaciones es par, la mediana es el promedio de las dos observaciones


centrales.

En el ejemplo anterior sobre las notas de un estudiante, tenemos: 4, 3, 5, 1, 4, 5.

Los podemos ordenar de mayor a menor: 5, 5, 4, 4, 3, 1

Los podemos ordenar de menor a mayor: 1, 3, 4, 4, 5, 5

Como es un número par, sumamos y dividimos en dos, los dos valores centrales; en este caso 4
+ 4 = 8. Este valor lo dividimos en dos y nos da 4. En otras palabras la mediana de esta serie de
números es 4.

Ahora supongamos que tenemos una muestra (n) de números impar 4, 3, 5, 1, 4, 5, 1

Los podemos ordenar de mayor a menor: 5, 5, 4, 4, 3, 1, 1

Los podemos ordenar de menor a mayor: 1, 1, 3, 4, 4, 5, 5

Como es un número impar, solo que tenemos que observar el numero que esta exactamente
en la mitad. En este caso, dado que son 7 números, observamos el que está en la posición 4, el
cual casualmente es 4.

MODA (Mo)

Es el valor que más se repite. Si las notas de un estudiante son: 2, 3, 5, 1, 2, 5, 2, 4, podemos


observar que el valor que más se repite es el 2 (hay tres!), por lo tanto la moda de este grupo
de valores es 2.
Hasta el momento hemos estudiado los valores centrales de resumen, pero también es
importante conocer si los valores en general (las notas de los estudiantes) están cerca o
alejados de estos valores centrales. Con base en lo anterior surge la necesidad de estudiar las
medidas de dispersión.

MEDIDAS DE DISPERSION

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad


de una distribución (Pregúntese cuantos diferentes marcas y modelos de teléfonos celular
existen en la actualidad), indicando por medio de un número, si las diferentes puntuaciones de
una variable están muy alejadas de la media aritmética. Cuanto mayor sea ese valor, mayor
será la variabilidad, cuanto menor sea, más homogénea será a la media. Así sabremos si los
números son parecidos entre sí o varían entre ellos.

RANGO

Es la diferencia entre el mayor valor y el menor. Depende sólo de dos observaciones, y


justamente de las más extremas. Volvamos al ejemplo de la notas del estudiante; 4, 3, 5, 1, 4,
5.

Los podemos ordenar de mayor a menor: 5, 5, 4, 4, 3, 1

Restamos del mayor valor: 5, el menor valor 1. El resultado es 4, por lo tanto el rango es 4.

VARIANZA

Es un promedio de los cuadrados de las desviaciones respecto de la media, excepto que en


lugar de dividir por n (el número de observaciones), se suele dividir por n-1. Se usa el símbolo
s2 o bien var para representar la varianza.

La formula es:
No te preocupes!, no tienes que hacerlo manualmente, Excel© lo hace por nosotros:

El resultado es:

Como puedes observar es muy fácil, ya sabemos que la varianza es 2.27. Recuerdas cuanto era
el promedio?, no?, calcúlalo de nuevo o vuelve atrás y recuérdalo.
DESVIACION ESTANDAR

Es la raíz cuadrada de la varianza. Se mide en las mismas unidades que las observaciones
originales. Se usa el símbolo s o bien ds para representar la desviación estándar. La formula es:

Tanto la varianza y la desviación estándar se encuentran muy influidas por valores extremos.
Por lo tanto, cuando la muestra presenta mucha asimetría, estos no son buenos indicadores de
la dispersión, pues están sobrevalorados.

En nuestro ejemplo, ds = raíz cuadrada de 2.27, luego

ds = 1.51

Calculando todo con Excel©, obtenemos:

En los artículos que diariamente observamos que siempre nos dan el promedio y la ds. Esto se
debe a que siempre debe ir acompañado el promedio con su medida de variabilidad, la
desviación estándar.

Un ejemplo de esto es el siguiente; podemos observar como la desviación estándar la


representan con un signo más y otro menos y acompaña el promedio.
COEFICIENTE DE VARIACION

Es similar a la desviación estándar, pero dividido por la media. Con esto se logra que sea
independiente de la unidad de medida con que se midieron las observaciones. El coeficiente
de variación no tiene unidad de medida.

La formula es:

Tiene una limitación, y es que sólo puede utilizarse cuando los datos se midieron en una escala
que sólo admite valores positivos. Imaginemos que la estatura de un grupo de mujeres es de
165 cm (ds 7.4) y la de un grupo de hombres es de 176 cm (ds 3.4). Si calculamos con base en
lo anterior tendremos lo siguiente:

Coeficiente de variación en mujeres es de: 0,04

Coeficiente de variación en hombres es de: 0,02

El coeficiente de variación permite comparar dispersiones entre datos expresados en escalas


de medidas diferentes. En este caso se puede concluir que la muestra 1 tiene mayor dispersión
que las muestras 2.

Esto mismo lo podemos concluir si observamos las ds: claramente vemos que la ds de las
mujeres es mayor que la de los hombres, en otras palabras, los valores de altura de los
hombres son más homogéneos que los de las mujeres.

MEDIDAS DE POSICION

Señalan otras posiciones, aparte del centro (Me), dentro del grupo de datos. Hablamos de los
percentiles: se refiere a que valor (de las observaciones en la muestra) está en una posición
que deseamos conocer. El ejemplo más famoso es el percentil 50, que anteriormente ya
veíamos que corresponde a la Mediana, por favor vuelve atrás y recuerda que es la Me.
Percentil es un número entero entre 1 y 99.

El percentil q se obtiene de la siguiente forma:

Se ordenan las observaciones, de menor a mayor.

Se calcula el valor de r = q x n / 100, en que n es el número de observaciones.

Si el resultado de r es entero, el percentil Pq es el promedio de las observaciones que ocupan


los lugares r y r+1.

Si el resultado no es entero, se aproxima al entero superior y el percentil Pq es la observación


que ocupa ese lugar.

Recordemos nuestro ejemplo de las notas del estudiante: 4, 3, 5, 1, 4, 5, 1

Los ordenamos de menor a mayor: 1, 1, 3, 4, 4, 5, 5

Queremos conocer el valor correspondiente al percentil 50 (q 50):

r = q x n/100 es decir r = (50 x 7) / 100 = 3.5. Observe que el resultado no es un número entero,
por lo tanto aproxime al entero superior, en este caso 4. En la posición 4 está el valor 4, por lo
tanto el percentil (q) 50 de esta serie de datos es 4.

En otro ejemplo tenemos: 4, 3, 5, 1, 4, 5.

Los podemos ordenar de menor a mayor: 1, 3, 4, 4, 5, 5

r = q x n/100 es decir r = (50 x 6) / 100 = 3 es decir r = 3. Observe que este resultado es entero,
por lo tanto observe los valores en la posición 3 (valor de r) y r + 1: posición 4. Observe como
en las posiciones 3 y 4, aparece el mismo número el 4. Por favor regrese y observe el valor de
la Me.

INTERVALO DE CONFIANZA

En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de


valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro,
con una probabilidad determinada.

La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo


construido se denomina nivel de confianza, y se denota 1-α. La probabilidad de equivocarnos
se llama nivel de significancia y se simboliza α. Generalmente se construyen intervalos con
confianza 1- α = 95% (o significancia α = 5%). Menos frecuentes son los intervalos con α = 10%
o α= 1%.

La fórmula para calcular el IC para un promedio es:

La fórmula para calcular el IC para una proporción es:

Con un ejemplo lo entenderemos mejor:

Las edades de los estudiantes de primer semestre de postgrado de la Universidad El Bosque,


son las siguientes:

21 22 23 24 31 26 27 28 21 30 31 24
33 34 23 24 32 26 27 28 29 30 31
32 25 34 23 24 25 26 27 28 29 30
31 32 33 34 23 23 24 24 23 24 25
25 26 26 26 23 23 24 24 23 24 25
25 26 26 26

El promedio de edad de todo el grupo es 26.6 y la ds 3,6. Como todos sabemos, nosotros
nunca hacemos censos (evaluamos la totalidad de la población), sino que estudiamos
muestras. Supongamos que sacamos una muestra de 20 estudiantes y esta investigación la
hacen estudiantes de endodoncia.

21 22 23 24 31 26 27 28 21 30 31 24
33 34 23 24 32 26 27 28

El promedio es 26.8 y la ds 4. Valores muy similares entre la muestra y el censo. Supongamos


que otro grupo (estudiantes de operatoria) investiga lo mismo con una muestra de 20
estudiantes, pero tomando diferentes.

28 29 30 31 32 25 34 23 24 25 26 27
28 29 30 31 32 33 34 23 23
El promedio de edad de esta muestra es 28.5 y la ds 3.7.

Los investigadores de endodoncia y operatoria hacen su investigación y como lo afirmamos


anteriormente, trabajan con muestras. Al tener los resultados y obviamente desconocer LA
VERDAD, es decir los resultados del censo, la pregunta que cada investigador se hace es: la
muestra que obtuve se parece a la totalidad de la población o no se parece?. De hecho si
observamos la muestra de los investigadores de endodoncia es muy similar, sin embargo la de
los investigadores de operatoria dio resultados diferentes.

Ante esto lo que debemos hacer es calcular el intervalo de confianza. Antes de esto
recordemos: El intervalo de confianza del 95% nos dice: Si repetimos el estudio 100 veces, 95
veces el valor verdadero del parámetro que estamos estudiando se encuentra dentro del IC.

Veamos:

Cuando tomamos todos los estudiantes el promedio de edad fue de 26.6 y la ds 3,6

La muestra tomada por los estudiantes de endodoncia tuvo un IC95%: 24.8 a 28.6. se puede
observar como el promedio de edad de los estudiantes (los 60!) de 26.6 se encuentra dentro
del IC.

La muestra tomada por los estudiantes de operatoria tuvo un IC95%: 26.1 a 30.2 se puede
observar como el promedio de edad de los estudiantes (los 60!) de 26.6 se encuentra dentro
del IC.

En conclusión, el IC de la muestra, nos indica el valor real del parámetro de interés en la


población de estudio.

También podría gustarte