Está en la página 1de 49

Representación de datos

estadísticos
Definición de estadística

• Estadística es la ciencia y técnica que tiene que ver


con la recolección, procesamiento, análisis e
interpretación de datos.

• Se clasifica en:
• Descriptiva
• Inferencial
Estadística descriptiva

• Incluye la tabulación, representación y descripción de


conjuntos de datos.
• A partir de ellos se puede organizar, simplificar y resumir
información básica.
• Los datos pueden ser de variables cuantitativas o
categóricas.
Estadística inferencial

Proporciona métodos para


estimar las características de un Muestra

grupo (población) basándose en Población


los datos de un conjunto pequeño
(muestra).
Estadística en Medicina
• El resultado de un análisis estadístico no es un
objetivo en sí mismo, sino una herramienta para:
• Comprobar o rechazar una hipótesis de trabajo.

• Representar de una forma eficiente y resumida un


colectivo de observaciones,

• Validar un modelo de un proceso fisiológico


Datos cuantitativos
En el grupo de datos cuantitativos tenemos

• Aquellos cuyo resultado puede variar de forma continua, como puede


ser el peso, la presión arterial, el nivel de colesterol, etc. y

• Los que sólo pueden tomar valores enteros: número de hijos, el


número de ingresados en el Servicio de Ortopedia, un día concreto,
etc.
Datos cualitativos
• Pueden ser:

• Nominales: que constituyen una simple etiqueta como puede ser


el sexo, el grupo sanguíneo, etc.

• Ordinales: en las que se da una relación de orden entre las


respuestas, pej. resultado de una patología/tratamiento (fallece,
empeora, sin cambios, mejora, curación).
Presentación de datos cuantitativos
• Indicar un valor central y uno de variabilidad o
dispersión.

• Cuando es razonable suponer que los datos pueden seguir


una distribución normal, se estimará la media y la
desviación estándar.
• Ejemplo: La media de la PAS fue de 139.2 ± 14.9 mmHg
Distribución normal: distribución
aproximada de valores
Distribución normal: curva simétrica

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Asimetría a la
izquierda
30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Asimetría a la derecha

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Medidas de Variabilidad
50
45
40
35
30
25
20
15
10
5
0
1 3 5 7 9 11 13 15 17 19 21 23
Coeficiente de variación
El CV es igual al cociente entre la desviación típica y la media

Si encontramos que el coeficiente de variación es próximo o mayor


que 0.5 y no puede haber datos negativos, la distribución no es
normal
Ej.: triglicéridos en pacientes diabéticos

Por tanto el coeficiente de variación es 0.49.


Mediana
• Es un valor del conjunto de datos que mide el
elemento central: La mitad de los elementos se
encuentran por arriba y la otra mitad por debajo de él.
Distribución Sesgada a la Derecha
30
Moda
Mediana
25

20
Media
15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Distribución Sesgada a la Izquierda

30

25
Moda
Mediana
20
Media
15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Distribución Simétrica

90
80 Moda
70 Mediana
60
Media
50
40
30

20
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13
Moda
•Es el valor que se repite más dentro de un
conjunto de datos.
Media, mediana y moda
• La media, la mediana y la moda son idénticas en una distribución
simétrica

• La mediana puede ser la idónea en distribuciones sesgadas, ya que no


se afecta tanto por valores extremos.

• Sin embargo no se cuenta con un criterio único para aplicar alguna de


las tres medidas
CUARTILES

• Los cuartiles dividen en cuatro partes las observaciones.


• El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y
por encima 75% de las observaciones.
• El Q2 es la mediana (50%)
• Q3 deja por debajo 75% y por encima 25% de las observaciones
CUARTILES

75% 25%
25% 75%

25% 25% 25% 25%


Cuartil 1 Mediana, Cuartil 3 Máximo
Mínimo
Q1 Cuartil 2
Q3
Q2
PERCENTILES
• Los percentiles dividen en dos partes las
observaciones.
• Percentil 20, P20, es el valor que deja por debajo un
20% y por encima un 80% de las observaciones
PERCENTILES

20% 80%
Mínimo Percentil 20 Máximo

P20
Presentación de datos cualitativos
• Los datos cualitativos (nominales u ordinales) se cuantifican
como recuentos del número de casos observados para cada
categoría, y suelen expresarse habitualmente como
porcentajes u otro tipo de cocientes.
• Ej. La proporción de mujeres con síndrome X es del 82 % (55 de 67)
• El modo más simple de presentar datos
categóricos es por medio de una tabla de
frecuencias.

• Esta tabla indica el número de unidades de


análisis que caen en cada una de las clases de la
variable cualitativa.
• La primer y segunda columna de la Tabla muestran las categorías de
la variable (tipo de meningitis y la sigla correspondiente)

• La tercer columna presenta el número de casos de meningitis de cada


tipo notificados
• Es decir la frecuencia o frecuencia absoluta

• La última columna presenta la frecuencia relativa o el porcentaje de


casos notificados de cada tipo de meningitis.

• Por ejemplo, la frecuencia relativa de la categoría BSA se calcula del


siguiente modo:
Gráficos
• Son imágenes que, combinando la utilización de
sombreado, colores, puntos, líneas, símbolos,
números, texto y un sistema de referencia
(coordenadas), permiten presentar información
cuantitativa.
Gráficas
• Sirven para:
• Organizar los datos
• Observar patrones
• Observar agrupamientos
• Observar relaciones
• Comparar distribuciones
• Visualizar rápidamente la distribución de los datos
• Visualizar, obtener y comparar medidas estadísticas
Gráficas
• La calidad de un gráfico estadístico consiste en
comunicar ideas complejas con precisión, claridad y
eficiencia, de tal manera que:
•Induzca a pensar en el contenido más que en la apariencia
•No distorsione la información proporcionada por los datos
•Presente mucha información (números) en poco espacio
•Favorezca la comparación de diferentes grupos de datos o
de relaciones entre los mismos (por ejemplo una
secuencia temporal)
GRÁFICO DE TALLOS Y HOJAS
• Esta técnica gráfica es muy sencilla y permite mostrar
la forma de la distribución de una variable numérica.

• Es apropiada para conjuntos de observaciones no muy


extensos, se construye con poco esfuerzo
• Es muy fácil de realizar con lápiz y papel.
Diagrama de tallo y hojas

1* 34456
2* 001235
3* 04999
4* 344457777789
5* 23434
6* 244667777
¿Qué información nos brinda este gráfico?
• El rango de las observaciones y los valores máximos y
mínimos.

• La forma de la distribución:
• Si es aproximadamente simétrica o es asimétrica.
• Cuántos picos o modas tiene la distribución.
• Si existen valores que se aparten notablemente del
conjunto (datos atípicos).
GRÁFICO DE BARRAS
• Es útil para representar datos categóricos nominales u ordinales.
• A cada categoría o clase de la variable se le asocia una barra cuya altura
representa la frecuencia o la frecuencia relativa de esa clase.
• Las barras difieren sólo en altura, no en ancho.

• La escala en el eje horizontal es arbitraria y en general, las barras se dibujan


equiespaciadas.
• El eje vertical comienza en cero.
• Se debe indicar el número total de datos ya que el gráfico sólo muestra
porcentajes o frecuencias relativas y la fuente de la que se obtuvieron los
mismos.
Diagrama de barras

40
35
30
25
Frecuencia
20
15
10
5
0
Mes
(variable discreta o categoría)
HISTOGRAMA
• El histograma es el más conocido de los gráficos para
resumir un conjunto de datos numéricos

• Pretende responder a las mismas preguntas que un


gráfico de tallo-hojas.

• Para construir un histograma es necesario


previamente construir una tabla de frecuencias.
Histograma

40

Frecuencia de la clase
35
30
25
20
15
10
5
0
Clases

(variable continua agrupada en clases o intervalos)


• ¿Cuántos intervalos (contenedores) debería tener en
un histograma?

• No hay una respuesta perfecta para esto

• Depende del tamaño de la muestra n

• Regla general aproximada: # Intervalos ≈ √n Intervalos


Polígono de frecuencias
• El polígono de frecuencias es similar al histograma en muchos aspectos,
pero pretende dar una imagen aproximada de la “curva” definida por la
distribución de la variable.
• Para construirlo, se usan los mismos ejes que en el histograma.

• Se indica el punto medio de cada intervalo y en la escala vertical la escala


densidad para ese intervalo
• Define pares (x, y) en el gráfico que se unen con tramos de líneas rectas.

• Se marcan además los puntos medios del intervalo que precede al


primero y del que sigue al último.
• Los dos tipos de gráficos (histograma y polígono)
brindan esencialmente la misma información.

• El polígono de frecuencias es un gráfico útil para


comparar dos distribuciones de frecuencias.
GRÁFICO DE PASTEL
• En este gráfico se representa la frecuencia relativa de cada
categoría como una porción de un círculo

• El ángulo se corresponde con la frecuencia relativa


correspondiente.

• Esta representación gráfica es muy simple y permite


comparar la distribución de una variable categórica en 2 o
más grupos.
Diagrama de Pastel

17% Opcion 1
29% Opcion 2
Opcion 3
22%
Opcion 4
13%
Opcion 5
19%
Diagrama de cajas
• Otra herramienta de visualización visual común es el
diagrama de caja
• Da una buena idea de la forma de distribución en
términos de asimetría y valores periféricos (extremos:
valores diferentes a "la mayoría" del resto de los datos)

• Muy buena herramienta para comparar fácilmente la


distribución de datos continuos en múltiples grupos: se
puede trazar lado a lado
Diagrama de Caja y Bigotes

Min Max

Q1 mediana Q3

Escala
Recomendaciones para un gráfico
• Si es estético, fomenta la lectura y comprensión.
• Sencillez y claridad, el uso del color debe ser moderado y bien
elegido.
• Usar líneas finas, eliminar las superfluas
• Usar cuadrícula si es necesario
• Balance entre el espacio en blanco y datos
• Idealmente no hay que acudir al texto .
• Balance entre texto, tablas e imágenes,
• Combinar texto y tablas insertas

También podría gustarte