Está en la página 1de 64

Diplomatura en Higiene Ocupacional

Año 2021
SEMINARIO: ESTADÍSTICA APLICADA

Florio Eva Laura


OBJETIVOS GENERALES DEL CURSO

Incorporar conocimientos de estadística


básica para la correcta interpretación de
datos y recolección de información.

En esta versión virtual se suma la posibilidad de


ensayar con el Excel algunas operaciones estadísticas
sencillas y explorar el uso de un software estadístico

3
TRABAJO INTEGRADOR FINAL
 Identificación de un problema
 Definición de la población de referencia

 Muestreo representativo

 Posible asociación de variables

 Conclusiones válidas

4
TEMARIO
 Introducción a la estadística
Tipos de datos

 Estadística descriptiva
Diagramas de interpretación
Medidas Resumen (Media, Mediana, Moda, Desvío Estándar,
Cuartilos, Mínimo, Máximo, etc.)
Toma de decisiones

 Recolección de datos propios


Conceptos de sesgo y representatividad
Posibles herramientas informáticas para el análisis estadístico
(Excell, Infostat, Statistica, R, etc.)

 Otro tipo de análisis


Regresiones simples 5
INTRODUCCIÓN
¿Qué es la estadística?
 La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar
conclusiones válidas y tomar decisiones razonables basadas en
tal análisis. (Murray R. Spiegel)

 Estadística es una ciencia que proporciona un conjunto de métodos


que se utilizan para recolectar, resumir, clasificar, analizar e
interpretar el comportamiento de los datos con respecto a una
característica, materia de estudio o investigación. (Moya Calderón,
Rufino)

 La estadística es el arte de aprender a partir de los datos. Está


relacionada con la recopilación de datos, su descripción subsiguiente
y su análisis, lo que nos lleva a extraer conclusiones. (M. Ross, 6
Sheldon)
INTRODUCCIÓN
¿Qué es la estadística?

ES UNA 7

HERRAMIENTA
INTRODUCCIÓN
¿Qué es la estadística?

¿Para qué sirve?

DESCRIBIR ANALIZAR CONTROLAR

Las características La asociación Resultados de un


de una población entre variables tratamiento

Principales Posibles relaciones


8
lesiones causa-efecto

Rango de variación
INTRODUCCIÓN
¿Qué es la estadística?

¿Para qué sirve?

¿Cómo se aplica en la higiene ocupacional?

9
 La estadística descriptiva: es la técnica
matemática que obtiene, organiza, presenta y
describe un conjunto de datos.
 Calcula parámetros estadísticos como las medidas de
tendencia central y de dispersión que describen el
conjunto estudiado.

 La estadística inferencial: es la parte de


la estadística que por medio de la inducción
determina propiedades de una población, a partir
de una parte de esta.
 Su objetivo es obtener conclusiones útiles para hacer
deducciones sobre una totalidad, basándose en la
información numérica de la muestra
10
Etapas de una investigación

La Estadística nos permite realizar inferencias y sacar


conclusiones a partir de los datos. Extrayendo la información
contenida en los datos, podremos comprender mejor las
situaciones que ellos representan.

 Los métodos estadísticos abarcan todas las etapas de la


investigación, desde el diseño de la investigación hasta el
análisis final de los datos.

 Podemos distinguir tres grandes etapas:

1. Diseño: Planeamiento y desarrollo de las investigaciones


2. Descripción: Resumen y exploración de los datos
3. Inferencia: Predicciones y toma de decisiones sobre las
características de una población en base a la información
recogida en una muestra de la población. 11
DISEÑO
 En la etapa de Diseño se define cómo se desarrollará la
investigación con el fin de responder las preguntas que le
dieron origen. Un diseño bien realizado puede ahorrar
esfuerzos en etapas posteriores y puede redundar en un
análisis posterior más sencillo.

 Esta etapa es crucial, pues un estudio pobremente diseñado


o con datos incorrectamente recolectados o registrados
puede ser incapaz de responder las preguntas que originaron
el estudio.

 Una vez formulado el problema, en la etapa de Diseño se


definirá, entre otras cosas, la población objetivo, los tamaños
de muestra, los mecanismos de selección de individuos, los
criterios de inclusión y exclusión de sujetos, los métodos de
asignación de tratamientos, las variables que se medirán y 12
cómo se entrenará al equipo de trabajo para el cumplimiento
del protocolo.
DESCRIPCIÓN
 Los métodos de Análisis Exploratorio o Estadística
Descriptiva ayudan a comprender la estructura de los datos,
de manera de detectar tanto un patrón de comportamiento
general como apartamientos del mismo.

 Una forma de realizar ésto es mediante gráficos de


sencilla realización e interpretación.

 Otra forma de describir los datos es resumiendo los datos


en uno, dos o más números que caractericen al conjunto
de datos con fidelidad. PARÁMETROS

13
INFERENCIA
 Finalmente, la Inferencia Estadística nos permite tanto hacer
predicciones y estimaciones como decidir entre dos hipótesis
opuestas relativas a la población de la cual provienen los
datos (test de hipótesis).

 La calidad de las estimaciones puede ser muy variada y están


afectadas por errores. La ventaja de los métodos estadísticos
es que, aplicados sobre datos obtenidos a partir de muestras
aleatorias, permiten cuantificar el error que podemos cometer
en una estimación o calcular la probabilidad de cometer un
error al tomar una decisión en un test de hipótesis.

14
 Población: “Conjunto de elementos a los
que se les estudia una característica”

 Individuo (o unidad experimental): “Cada


uno de los elementos de la población”

 Muestra: “Subconjunto representativo de


la población”

 Variable respuesta: ”Característica propia


de la unidad experimental objeto del estudio
estadístico” →TIPO DE DATOS
15
INTRODUCCIÓN A LA ESTADÍSTICA
La estadística está principalmente abocada a:

1) la organización y resumen de datos y

2) a la extracción de conclusiones acerca de las características de


un conjunto de objetos a partir de una porción de dicho
conjunto, muestra

CUANTITATIVOS
POBLACIÓN
TIPO DE
DATOS
MUESTRA

CUALITATIVOS 16
TIPOS DE DATOS
CUANTITATIVOS→ cuantifican → Pueden asumir un espacio métrico
(cantidad, número, ppm, decibel, etc.)

DISCRETOS → contar → cantidad de lesiones, días de exposición

CONTÍNUOS → medir → peso, altura, tiempo

CUALITATIVOS→ clasifican → NO constituyen un espacio métrico


(genero, color, olor)

17
Pueden seguir o no un
gradiente……¿ejemplos?
ESTADÍSTICA DESCRIPTIVA
Ordenamiento, clasificación y presentación de los datos

N° registro Horas/día
1 5
2 6
3 8
4 2
5 3
6 4
7 5
8 9
Datos registrados
DATOS CRUDOS 9 2
por el operador 10 6
11 7
12 8
13 5
¿Qué me dicen estos datos? 14 6
15 3
16 3
17 4
¿Es sencillo interpretarlos? 18
19
5
4
18

20 7
ESTADÍSTICA DESCRIPTIVA
N° registro Horas/día N° registro Horas/día
1 5 4 2 MÍN
2 6 9 2
3 8 15 3
4 2 5 3
5 3 16 3
6 4

RANGO= 9 – 2 = 7
6 4
7 5
DATOS
17 4
8 9 ORDENADOS 19 4
9 2 1 5
10 6 7 5
11 7 13 5
12 8 18 5
13 5 2 6
14 6 14 6
15 3 10 6
16 3 20 7
17 4 11 7
18 5 12 8
19 4 3 8 19
20 7 8 9 MÁX
ESTADÍSTICA DESCRIPTIVA
Representación gráfica de datos cuantitativos
HISTOGRAMA
O
5 GRAFICO DE
FRECUENCIA
4

Observaciones
3

0
2 3 4 5 6 7 8 9
Horas/día de exposición a altas temperaturas

AMPLITUD = 7 HORAS
DATOS = 20 20
ESTADÍSTICA DESCRIPTIVA
¿Qué pasa si paso de una amplitud de 7 hs a una
amplitud de 25 hs y de 20 datos a 60?
8
7
6
Observaciones

5
4
3
2
1
0
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
Horas/semana de exposición a altas temperaturas

21
SE DIFICULTA DE INTERPRETACIÓN → SE DIFICULTAN LAS CONCLUSIONES
Puedo agrupar los datos en clases

ESTABLECER CLASES
2-4 ; 5-7; 8-10; 11-13;……25-27 hs

14

12

10

Observaciones
8

0
3 6 9 12 15 18 21 24 27
Marca de clase
22
GANO CLARIDAD →PERO PIERDO INFORMACIÓN
OBSERVACIÓN….
 No existen criterios óptimos para elegir la cantidad de intervalos.
Utilizar muchos o muy pocos intervalos puede ser poco informativo.

 Se debe buscar un equilibrio entre un histograma muy irregular y


uno demasiado suavizado.

 No es necesario que todos los intervalos tengan la misma longitud,


pero es recomendable que así sea ya que esto facilita su
interpretación.

23
ESTADÍSTICA DESCRIPTIVA
¿Qué pasa si quiero comparar dos muestras con tamaños
muy diferentes?
35 35
30 30
Observaciones

Observaciones
25 25
20 20
15 15
10 10
5 5
0 0
3 6 9 12 15 18 21 24 27 3 6 9 12 15 18 21 24 27
Horas Horas

24
¿Me puedo dar cuenta qué tan diferentes son
las “poblaciones”?
Puedo utilizar frecuencias relativas

Frecuencia relativa = N° Observaciones/ Total de Observaciones


Frecuencia relativa 25 25

20 20

15 15

10 10

5 5

0 0
3 6 9 12 15 18 21 24 27 3 6 9 12 15 18 21 24 27

Horas Horas

AL PONERLO EN TÉRMINOS RELATIVOS ES MÁS FÁCIL DE COMPARAR

¿ Es sencillo comparar un gráfico de barras? 25


POLÍGONO DE FRECUENCIAS

25 25
Frecuencia relativa

20 20

15 15

10 10

5 5

0 0
3 6 9 12 15 18 21 24 27 3 6 9 12 15 18 21 24 27

Horas Horas

26
POLÍGONO DE FRECUENCIAS

25

Frecuencia relativa
20

15

10

0
3 6 9 12 15 18 21 24 27

Horas

27
ESTADÍSTICA DESCRIPTIVA
¿Qué pasa si quiero conocer el % por encima o por
debajo de un valor?

18 ¿¿¿ME PONGO
A SUMAR????
16
Frecuencia relativa (%)

14
12
10
8
6
4
2
0
3 6 9 12 15 18 21 24 27 28

Horas
Puedo utilizar frecuencias acumuladas

100
90

Frecuencia acumulada
80
70
60
50
40
30
20
10
0
3 6 9 12 15 18 21 24 27
Horas
29
PROBAMOS USAR UN SOFT ESTADÍSTICO??...Y EL EXCEL?

 https://www.infostat.com.ar/index.php?mod=page
&id=37

30
PROBEMOS HACER
 Ordenar datos usando filtros
 Construir histogramas con Excel y con Infostat

 Pedir un polígono para ese histograma

31
ESTADÍSTICA DESCRIPTIVA
Representación gráfica de datos cualitativos

Intensidad de la dolencia
15
13
Observaciones 11

9
7
5
nula muy leve leve moderada fuerte muy fuerte

HISTOGRAMA
O
32
GRAFICO DE
CONSERVAR UN ORDEN LÓGICO FRECUENCIA
ESTADÍSTICA DESCRIPTIVA

Diagrama de
sectores o
Gráfico de torta

33
ESTADÍSTICA DESCRIPTIVA
Representación gráfica de los datos cualitativos

AL IGUAL QUE CON LAS VARIABLES CUANTITATIVAS PUEDO


TRABAJAR CON:

➢ FRECUENCIAS ABSOLUTAS (N° DE OBSERVACIONES)

➢ FRECUENCIAS RELATIVAS

➢FRECUENCIAS ACUMULADAS

La elección de una u otra dependerá de las conclusiones a las que


quiero llegar
34
TIPOS DE DISTRIBUCIÓN
Distribución Distribución
Bimodal ´J´

Distribución asimétrica Distribución asimétrica


positiva negativa

35
TIPOS DE DISTRIBUCIÓN
Distribución Normal → Campana de Gauss

La mayoría de los datos biológicos tienen una distribución de


tipo NORMAL

36
MEDIDAS RESUMEN
Posición y Tendencia central
2 clases
Dispersión

37
1 2 3 4 5 6 7
MEDIDAS RESUMEN
Posición y Tendencia central
2 clases
Dispersión

38
MEDIDAS DE POSICIÓN Y
MEDIDAS DE TENDENCIA CENTRAL
❖De posición: dan una idea de cómo es la estructura de los datos a
través de la posición que ocupan en una escala ascendente.

CUANTILOS (CUARTILES, PERCENTILO)

❖De tendencia central: dan una idea de dónde está la región central
de la distribución de los datos (promedios).

MEDIANA, MODA, MEDIA ARITMÉTICA

39
MEDIDAS DE POSICIÓN
CUARTILES →PRIMER CUARTIL→25%

→SEGUNDO CUARTIL→ MEDIANA→50%

→TERCER CUARTIL→75%
Mediana: es el valor que separa el 50% superior del 50% inferior de los datos
¡¡Atención!! Puede o no coincidir con el valor promedio

(n+1)/2

Si la muestra tiene un “n” impar → posición: valor intermedio

Si la muestra tiene un “n” par → posición: valor calculado+ % de la diferencia


entre ese valor y el siguiente
40
* Si ambos valores son iguales no se calcula la diferencia
MEDIANA
N par….

4-5-6-7-8-9

(n+1)/2 = (6+1)/2 = 7/2= posición 3,5

→ pos “3” + 0,5* (pos “4”-pos “3”)→6+0,5*(7-6)=6+(0,5*1)=6,5

41
MEDIANA = Q2
N impar….

VAMOS A SUPONER 2 MUESTRAS DIFERENTES

EJEMPO: HORAS SEMANALES DE EXPOSICIÓN

POSICIÓN 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

MUESTRA 1 1 1 1 3 3 3 5 5 5 12 12 12 12 15 30 30 50 50 55

MUESTRA 2 10 10 10 11 11 11 12 12 12 12 12 13 14 14 15 15 17 18 18

Si son 19 datos la mediana es

(N+1)/2→ posición 10
42
PARA AMBAS MUESTRAS LA MEDIANA ES IGUAL A 12 HS DE
EXPOSICIÓN
MEDIANA = Q2
¿Me alcanza esta medida para describir mis muestras?

Puedo decir que el 50% de las personas de la muestra están más de 12


horas expuestas

¿Si fueran 2 empresas diferentes, puedo decir que la exposición es igual?

43
MEDIANA = Q2
¿Me alcanza esta medida para describir mis muestras?

Puedo decir que el 50% de las personas de la muestra están más


de 12 horas expuestas

¿Si fueran 2 empresas diferentes, puedo decir que la exposición es


igual?

VAMOS A CALCULAR EL PRIMER Y TERCER CUARTIL →Q1 Y Q3

Q1= (N+1)/4 para nuestras muestras (19+1)/4= 5


44

Q3= 3*(n+1)/4 3*(19+1)/4 =15


Q1 Y Q3

Q1 Q2 Q3
Mediana
POSICIÓN 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

MUESTRA 1 1 1 1 3 3 3 5 5 5 12 12 12 12 15 30 30 50 50 55

MUESTRA 2 10 10 10 11 11 11 12 12 12 12 12 13 14 14 15 15 17 18 18

CON ESTA INFORMACIÓN YA PODEMOS DESCRIBIR MEJOR LA


ESTRUCTURA DE LAS MUESTRAS Y TENEMOS UNA PISTA DE SU
VARIABILIDAD

45
CON LA INFORMACIÓN DE LOS CUARTILOS Y LOS VALORES
MÁXIMO Y MÍNIMO, PUEDO CONSTRUIR UN DIAGRAMA DE CAJA Y
BIGOTES

Q3
MEDIANA
Q1
MEDIDAS DE TENDENCIA CENTRAL

POSICIÓN 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

MUESTRA 1 1 1 1 3 3 3 5 5 5 12 12 12 12 15 30 30 50 50 55

MUESTRA 2 10 10 10 11 11 11 12 12 12 12 12 13 14 14 15 15 17 18 18

MODO O MODA: Es el valor más frecuente de la serie de datos

MEDIA ARITMÉTICA: Es el promedio. El resultado de dividir la suma de


todos los valores por “n”
47
MEDIDAS DE TENDENCIA CENTRAL
6

5 16,05 MODA

Observaciones
4

2 MEDIA
1

0
1 3 5 12 15 30 50 55

6
5
Observaciones

4 13
3
2
1
0 48
10 11 12 13 14 15 17 18

Horas de exposición
VENTAJAS DE LA MEDIA:
Es una medida intuitiva y de fácil cálculo.

VENTAJAS DE LA MEDIANA:
No se afecta por valores extremos/ Es fácil de entender/ Se puede hallar
incluso cuando los datos son descripciones cualitativas.

VENTAJAS DE LA MODA:
No se afecta por valores extremos/ Se puede hallar incluso cuando los datos
son descripciones cualitativas/ Se puede obtener en datos agrupados.

DESVENTAJA DE LA MEDIA:
Los valores de los extremos afectan a los demás valores.
.
DESVENTAJAS DE LA MEDIANA:
Su cálculo es más complejo que el que utiliza la media/ Como se tiene que
ordenar los datos, cuanto más numerosos son hay un mayor consumo de
tiempo.

DESVENTAJAS DE LA MODA:
A menudo no existe un valor modal ya que los datos no se presentan más 49
de una vez/ Puede existir más de una moda y resulta difícil de interpretar.
MEDIDAS DE TENDENCIA CENTRAL
MUESTRA 1: MEDIANA→12
MODA →12
MEDIA→16,05

MUESTRA 2: MEDIANA→12
MODA→12
MEDIA→13

SI SOLAMENTE UTILIZARAMOS MEDIDAS DE TENDENCIA CENTRAL,


PODRÍAMOS LLEGAR A LA CONCLUSIÓN DE QUE AMBAS MUESTRAS
SON IGUALES O POR LO MENOS BASTANTE SIMILARES

50
MEDIDAS RESUMEN
Posición y Tendencia central
2 clases
Dispersión

51
MEDIDAS DE DISPERSIÓN
✓Amplitud o rango

✓Rango Intercuartil

✓Variancia/Varianza

✓Desvío Estándar

✓Coeficiente de Variación

52
MEDIDAS DE DISPERSIÓN
✓Amplitud o rango
POSICIÓN 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

MUESTRA 1 1 1 1 3 3 3 5 5 5 12 12 12 12 15 30 30 50 50 55

MUESTRA 2 10 10 10 11 11 11 12 12 12 12 12 13 14 14 15 15 17 18 18

Es la diferencia entre el máximo y el mínimo

MUESTRA 1: 55-1= 54 HORAS


53
MUESTRA 2: 18-10= 8 HORAS
MEDIDAS DE DISPERSIÓN
✓Amplitud o rango

✓Rango Intercuartil
Q1 Q3

POSICIÓN 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

MUESTRA 1 1 1 1 3 3 3 5 5 5 12 12 12 12 15 30 30 50 50 55

MUESTRA 2 10 10 10 11 11 11 12 12 12 12 12 13 14 14 15 15 17 18 18

Es la diferencia entre Q1 y Q3, por lo tanto representa el


50% central de los datos 54
Es la longitud de la caja en el diagrama de caja y bigotes
MEDIDAS DE DISPERSIÓN
MUESTRA 1: 30-3= 27 HORAS
✓Amplitud o rango
MUESTRA 2: 15-11=4 HORAS

✓Rango Intercuartil

55
MEDIDAS DE DISPERSIÓN
✓Amplitud o rango

✓Rango Intercuartil

✓Variancia

Es una medida que indica la dispersión de los


datos alrededor de la media aritmética

Se define como el promedio de los cuadrados de


los desvíos de los datos respecto de su media 56
MEDIDAS DE DISPERSIÓN
✓Variancia

Se define como el promedio de los cuadrados de


los desvíos de los datos respecto de su media
i=n
S2 n-1 = 1 * ∑ (Xi – X) 2
i=1
n-1
Promedio= suma de.. /n° de..
Cuadrados
Desvío respecto de su media 57
MEDIDAS DE DISPERSIÓN
✓Variancia

POSICIÓN 1 2 3 4 5 6 7 8 9 10 media
MUESTRA 1 1 1 1 3 3 3 5 5 5 12 3,9
MUESTRA 2 10 10 10 11 11 11 12 12 12 12 11,1
suma
(Xi- X)2 8,41 8,41 8,41 0,81 0,81 0,81 1,21 1,21 1,21 65,61 96,9

(Xi- X)2 1,21 1,21 1,21 0,01 0,01 0,01 0,81 0,81 0,81 0,81 6,9

/ n-1
varianza 1 10,77
58

varianza 2 0,767
MEDIDAS DE DISPERSIÓN
✓Amplitud o rango

✓Rango Intercuartil

✓Variancia
Es una medida que indica la
dispersión de los datos
✓Desvío Estándar
alrededor de la media
aritmética y es la raíz
cuadrada de la variancia.

LA VENTAJA ES QUE SE EXPRESA EN LAS 59


UNIDADES DE LA VARIABLE Y ES MÁS
INTUITIVA SU INTERPRETACIÓN
MEDIDAS DE DISPERSIÓN
✓Amplitud o rango

✓Rango Intercuartil

✓Variancia

✓Desvío Estándar

✓Coeficiente de Variación RELATIVIZA LA VARIACIÓN

60
MEDIDAS DE DISPERSIÓN
✓Coeficiente de Variación CV= Desvío *100
Media
Ejemplo:

Si quisiéramos comparar el peso que manipula un operario y


dijéramos que una muestra tiene un Desvío de 50 kg y la otra tiene un
Desvío de 15 kg deberíamos relativizar esa variación al promedio de
peso que se manipula.

Muestra 1: peso que manipula un operario mediante una maquinaria


peso promedio 200 Kg

Muestra 2: peso que manipula un operario transportando cajas 61

peso promedio 60 Kg
MEDIDAS DE DISPERSIÓN
✓Coeficiente de Variación CV= Desvío *100
Media
MUESTRA 1

CV= 50 * 100 = 25%


200

MUESTRA 2

CV= 15 * 100= 25%


60 62
FIN….

…pero sólo de la primera parte

63
TEMARIO
 Introducción a la estadística
Tipos de datos

 Estadística descriptiva
Diagramas de interpretación
Medidas Resumen (Media, Mediana, Moda, Desvío Estándar,
Cuartiles, Mínimo, Máximo, etc.)
Toma de decisiones

 Recolección de datos propios


Conceptos de sesgo y representatividad
Posibles herramientas informáticas para el análisis estadístico
(Excell, Infostat, Statistica, R, etc.)

 Otro tipo de análisis


Regresiones simples 64

También podría gustarte