Está en la página 1de 57

 

Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Módulo 1 – Variables y Escalas de Medición

Definición de Estadística
La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones,
para poder hacer comparaciones y sacar conclusiones.

Un estudio estadístico consta de las siguientes fases:

Recogida de datos.

Organización y representación de datos.

Análisis de datos.

Obtención de conclusiones.

Conceptos de Estadística
Población
Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Individuo
Un individuo o unidad estadística es cada uno de los elementos que componen la población.

Muestra
Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una
muestra es menor que el de la población.

Muestreo
El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y
representativa de la población.

Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.

Dato

  1  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una
moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Escalas de medición
El proceso de asignar un valor numérico a una variable se llama medición. Las escalas de medición sirven
para ofrecernos información sobre las clasificaciones que podemos hacer con respecto a las variables
(discretas o continuas).

Cuando se mide una variable el resultado puede aparecer en uno de cuatro diversos tipos de escalas de
medición; nominal, ordinal, intervalo y razón.

Conocer la escala a la que pertenece una medición es importante para determinar el método adecuado
para describir y analizar esos datos.

Escala Nominal
Consiste en nombrar las observaciones, no es posible ordenar las categorías. Ejemplo: sano o enfermo, si
o no.

Escala Ordinal
Pueden clasificarse en grados según algún criterio de orden. Ejemplo: niveles de una enfermedad, rango
académico, edad (mayor de 21, menor de 13, etc)

Escala de Intervalo
Registra de manera numérica la distancia entre dos puntos, en este caso el cero no indica ausencia de
característica, es decir que la característica está presente y vale cero. Ejemplos: temperatura, metros sobre
el nivel del mar, etc.

Escala de Razón
A diferencia de la anterior el cero indica ausencia de característica. Ejemplos: distancia, peso, masa
altura, etc.

Variable estadística
Una variable estadística es cada una de las características o cualidades que poseen los individuos de
una población.

Tipos de variable estadísticas:

Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con
números. Podemos distinguir dos tipos:

  2  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
1)Variable cualitativa nominal
Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de
orden.

Ejemplo:    

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

2)Variable cualitativa ordinal o variable cuasicuantitativa


Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden.

Ejemplos:    

Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...

Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar
operaciones aritméticas con ella. Podemos distinguir dos tipos:

1)Variable discreta
Una variable discreta es aquella que solo puede tomar un número finito de valores entre dos valores
cualesquiera de una caraterística.

Ejemplo:    

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

2)Variable continua
Una variable continua es aquella que puede tomar un número infinito de valores entre dos valores
cualesquiera de una caraterística.

Ejemplos:    

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

Tablas de frecuencia

Distribución de frecuencias

  3  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los
datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio
estadístico.

Se representa por fi.

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria.

Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número
total de datos.

Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada

  4  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado
valor y el número total de datos. Se puede expresar en tantos por ciento.

Ejemplo:    

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33,
33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda


hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

xi   fi Fi ni Ni
27 1 1 0.032 0.032
28 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 3 27 0.097 0.871
33 3 30 0.097 0.968
34 1 31 0.032 1
  31                    1   1  

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribución de frecuencias agrupadas


La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase
se le asigna su frecuencia correspondiente.

Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

Marca de clase

  5  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo
para el cálculo de algunos parámetros.

Construcción de una tabla de datos agrupados


3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39,
37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.

2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el
número de intervalos queramos establecer.

Es conveniente que el número de intervalos oscile entre 6 y 15.

En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.

También se puede usar la siguiente fórmula:

! = !!"# − !!"#

! = 1 + 3.3 log !

!
!=
!

Siendo R el rango, k, la cantidad de intervalos y l la longitud de los mismos

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero
el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

  ci fi Fi ni Ni
[0,  5) 2.5 1 1 0.025 0.025
[5,  10) 7.5 1 2 0.025 0.050
[10,  15) 12.5 3 5 0.075 0.125
[15,  20) 17.5 3 8 0.075 0.200
[20,  25) 22.5 3 11 0.075 0.275
[25,  30) 27.5 6 17 0.150 0.425
[30,  35) 32.5 7 24 0.175 0.600
[35,  40) 37.5 10 34 0.250 0.850
[40,  45) 42.5 4 38 0.100 0.950
[45,  50Ȑ 47.5 2 40 0.050 1
    40   1  

  6  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Representaciones Gráficas

Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo
discreto.

Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la
variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas.

Los datos se representan mediante barras de una altura proporcional a la frecuencia.

Grupo sanguíneo fi
A 6
B 4
AB 1
0 9
20

 
 

Polígonos de frecuencia
Un polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.

También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante
segmentos.

Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:

Hora Temperatura
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°

  7  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
24 8°

 
(Lo utilizamos generalmente para variables continuas)

Diagrama circular
Un diagrama de circular se puede utilizar para todo tipo de variables, pero se usa frecuentemente para
las variables cualitativas.

Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la
frecuencia absoluta correspondiente.

El diagrama circular se construye con la ayuda de un transportador de ángulos.

Ejemplos

En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 9 juegan al fútbol y el resto
no practica ningún deporte.

  8  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Alumnos Ángulo
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Sin deporte 6 72°
Total 30 360°

Histograma
Un histograma es una representación gráfica de una variable en forma de barras.

Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se
han agrupado en clases.

En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por
altura, la frecuencia absoluta de cada intervalo.

  9  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
La superficie de cada barra es proporcional a la frecuencia de los valores representados.

Polígono de frecuencia
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de
cada rectángulo.

El peso de 65 personas adultas viene dado por la siguiente tabla:

ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
[100, 110) 105 5 63
[110, 120) 115 2 65
65

Histograma y polígono de frecuencias acumuladas


Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el
histograma de frecuencias acumuladas o su correspondiente polígono.

  10  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Histogramas con intervalos de amplitud diferente


Para construir un histogramas con intervalo de amplitud diferente tenemos que calcular las alturas
de los rectángulos del histograma.

hi es la altura del intervalo.

fi es la frecuencia del intervalo.

ai es la amplitud del intervalo.

En la siguiente tabla se muestra las calificaciones (no aprobado, aprobado, notable y sobresaliente)
obtenidas por un grupo de 50 alumnos.

fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50

  11  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Módulo 2 – Descripción de Datos

Medidas descriptivas
Una medida descriptiva es un número que se obtiene a partir de los datos de una distribución
estadística.

Las medidas descriptivas sirven para sintetizar la información dada por una tabla o por una gráfica.

Tipos de parámetros estadísticos


Hay FXDWUR tipos parámetros estadísticos:

De centralización.

De posición

De dispersión.

De forma.

Medidas de centralización
Nos indican en torno a qué valor (centro) se distribuyen los datos.

La medidas de centralización son:

Media aritmética
La media es el valor promedio de la distribución.

  12  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Mediana
La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior,
es decir divide la serie de datos en dos partes iguales.

Moda
La moda es el valor que más se repite en una distribución.

Medidas de posición
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

La medidas de posición son:

Cuartiles
Los cuartiles dividen la serie de datos en cuatro partes iguales.

Deciles
Los deciles dividen la serie de datos en diez partes iguales.

Percentiles
Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersión
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribución.

Las medidas de dispersión son:

Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

Desviación media
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la
media.

Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.

  13  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.

Medidas de Forma
Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de
la distribución, con la distribución normal.

Las medidas de forma son:

Medida de asimetría
Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas)
descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la
distribución es asimétrica a la izquierda.

Medida de curtosis

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda.

Medidas de centralización

Media  aritmética  
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el
número total de datos. (Promedio)

  14  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Esto significa que en promedio el peso de los seis amigos es de 80 kg

Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

Ejemplo:

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla.
Calcula la puntuación media.

xi fi x i · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1. 820

Esto significa que en promedio la puntuación del test fue de 43,33 puntos.

  15  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Propiedades de la media aritmética

1. La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la
misma igual a cero.

La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:

8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =

= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0

2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un número
cualquiera se hace mínima cuando dicho número coincide con la media aritmética.

3. Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda
aumentada en dicho número.

4. Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda
multiplicada por dicho número.

Observaciones sobre la media aritmética

1. La media se puede hallar sólo para variables cuantitativas.

2. La media es independiente de las amplitudes de los intervalos.

3. La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los
siguientes pesos:

65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.

4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

xi fi
[60, 63) 61.5 5
[63, 66) 64.5 18
[66, 69) 67.5 42
[69, 72) 70.5 27
[72, ∞ ) 8
100

  16  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de último
intervalo.

Mediana  
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a
mayor.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana

1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5

Esto significa que el 50% de los valores son inferiores o iguales a 5 y el otro 50% son superiores o iguales
a5

3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones
centrales.

7, 8, 9, 10, 11, 12 Me = 9.5

Esto significa que el 50% de los valores son inferiores o iguales a 9,5 y el otro 50% son superiores o
iguales a 9,5%

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la


suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre .

es la semisuma de las frecuencias absolutas.

  17  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Li es el límite inferior de la clase donde se encuentra la mediana.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:

fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100

100/2 = 50

Clase de la mediana: [66, 69)

Moda  estadística  
La moda es el valor que tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Hallar la moda de la distribución:

2, 3, 3, 4, 4, 4, 5, 5 Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima,
la distribución es bimodal o multimodal, es decir, tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

2, 2, 3, 3, 6, 6, 9, 9

  18  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Cálculo de la moda para datos agrupados

1º  Todos  los  intervalos  tienen  la  misma  amplitud.  

Li es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.

fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.

Ejemplo:    

Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:

  fi
[60,  63) 5
[63,  66) 18
[66,  69) 42
[69,  72) 27
[72,  75) 8
  100

  19  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
2º  Los  intervalos  tienen  amplitudes  distintas.  

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La fórmula de la moda aproximada cuando existen distintas amplitudes es:

 
 

En la siguiente tabla se muestra las calificaciones (desaprobado, aprobado, notable y sobresaliente)


obtenidas por un grupo de 50 alumnos. Calcular la moda.

fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50

 
 

  20  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
 

Medidas de posición

Quartiles  
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en
cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Q2 coincide con la mediana.

Cálculo de los cuartiles

1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la expresión:

(! + 1)
!! = !.
4

Ejemplo:

Las siguientes son las cifras de importe de gastos de quince personas durante un viaje, en orden
ascendente, en pesos

100 100 250 250 250 350 400 530 900 1250 1250 2450 2750 3090 4100

Determinar el valor del primer cuartil:

15 + 1
!! = 1. = 4º
4

En la tabla de frecuencias acumuladas buscamos el valor 4º, si éste no existe se realiza la interpolación
lineal.

!! !! !!
100 2 2
250 3 5
350 1 6
400 1 7
530 1 8
900 1 9
1250 2 11
2450 1 12
2750 1 13
3090 1 14
4100 1 15

  21  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
El cuarto lugar existe y es $250. ¿Qué significa que el primer cuartil tome el valor $250? Significa que el
25% de los valores son inferiores o iguales a $250 y el 75% restante es mayor o igual a $250.

Cálculo de cuartiles para datos agrupados

Ubicamos la clase cuartil con:

(! + 1)
!! = !.
4

Buscamos el valor obtenido en la columna de frecuencias acumuladas. Si el número obtenido no existe se


toma el inmediato superior. Una vez identificada la clase cuartil el valor dentro del intervalo se halla
mediante la formula:

!. !
− !!!!
! ! = !! + ! . !!
!!

Li es el límite inferior de la clase donde se encuentra el cuartil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del cuartil.

ai es la amplitud de la clase.

Ejemplo:

Hallar el tercer cuartil de la siguiente tabla referida a los pesos en libras de ciertas piezas de metal

Pesos (en libras) !! !! !!


[117,5; 126,5) 122 3 3
[126,5; 135,5) 131 5 8
[135,5;144,5) 140 9 17
[144,5; 153,5) 149 12 29
[153,5; 162,5) 158 5 34
[162,5; 171,5) 167 4 38
[171,5; 180,5] 176 2 40

40 + 1
!! = 3. = 30,75º
4
Buscamos el valor obtenido en la columnas de las frecuencias acumuladas, como el valor no existe se
toma el intervalo inmediato superior,. La clase del tercer cuartil es [153,5; 162,5).

Luego aplicamos la fórmula

!" − !"
!! = !"#, ! + . ! = !"ͷ, ͵  !"
!

Es decir que el 75% de los pesos son iguales o inferiores a 15, lb y el otro 25% es igual o superior a
15, lb

  22  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Deciles  
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

D5 coincide con la mediana.

Cálculo de los deciles

En primer lugar buscamos la clase donde se encuentra:

(! + 1)
!! = !.
10

Ejemplo (usaremos los mismos datos y tablas que usamos para los cuartiles):

Las siguientes son las cifras de importe de gastos de quince personas durante un viaje, en orden
ascendente, en pesos

100 100 250 250 250 350 400 530 900 1250 1250 2450 2750 3090 4100

Encontrar el octavo decil

!" + !
!! = !. = !", !º
!"

!! !! !!
100 2 2
250 3 5
350 1 6
400 1 7
530 1 8
900 1 9
1250 2 11
2450 1 12
2750 1 13
3090 1 14
4100 1 15

No está el valor 12,8º por lo que realizamos la interpolación entre los valores que ocupan los lugares 12º
y 13º

Posición Valor

1 0,8 12º 2450 x 300

  23  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
12,8º !!

13º 2750

0,8 !
= ! = 240
1 300

El valor del octavo decil es $2690. Es decir que el 80% de los valores son inferiores o iguales a $2690 y
el 20% restante es mayor o igual a $2690.

Cálculo de deciles para datos agrupados

Ubicamos la clase decil:

(! + 1)
!! = !.
10

El valor del decil dentro de la clase lo encontramos con:

Li es el límite inferior de la clase donde se encuentra el decil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase el decil..

ai es la amplitud de la clase.

Ejemplo

Hallar el segundo decil de la siguiente tabla referida a los pesos en libras de ciertas piezas de metal

Pesos (en libras) !! !! !!


[117,5; 126,5) 122 3 3
[126,5; 135,5) 131 5 8
[135,5;144,5) 140 9 17
[144,5; 153,5) 149 12 29
[153,5; 162,5) 158 5 34
[162,5; 171,5) 167 4 38
[171,5; 180,5] 176 2 40

Ubicamos la posición de la clase del segundo decil

(40 + 1)
!! = 2. = 8,2º
10

  24  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Como el numero obtenido no existe en la columna de frecuencias acumuladas entonces se toma el
intervalo inmediato superior es decir [135,5; 144,5). Luego

!−!
!! = !"#, ! + . ! = !"#, !  !"


Es decir que el 20% de los pesos son iguales o inferiores a 135,5 lb y el 80% restante superior o igual a
135,5 lb

Percentiles  
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

P50 coincide con la mediana.

P50 coincide con D5.

Cálculo de los percentiles

En primer lugar buscamos la clase donde se encuentra

(! + 1)
!! = !.
100

Ejemplo

Las siguientes son las cifras de importe de gastos de quince personas durante un viaje, en orden
ascendente, en pesos

100 100 250 250 250 350 400 530 900 1250 1250 2450 2750 3090 4100

Encontrar el percentil 43

!" + !
!" = !". = !, !!º
!""

!! !! !!
100 2 2
250 3 5
350 1 6
400 1 7
530 1 8
900 1 9
1250 2 11
2450 1 12

  25  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
2750 1 13
3090 1 14
4100 1 15

Buscamos en las frecuencias acumuladas la posición 6,88º y vemos que no existe, por lo cual realizamos
la interpolación correspondiente:

Posición Valor

1 0,88 6º 350 x 50

6,88º !!"

7º 400

0,88 !
= ! = 44
1 50

Luego el percentil 43 tiene como valor $394. Significa que el 43% de los valores son iguales o inferiores
a $394 y el 57% son superiores o iguales a $394

Cálculo de los percentiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra:

(! + 1)
!! = !.
100

Una vez ubicada la clase percentil :

Li es el límite inferior de la clase donde se encuentra el percentil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del percentil.

ai es la amplitud de la clase.

Ejemplo

Hallar el percentil 62 de la siguiente tabla referida a los pesos en libras de ciertas piezas de metal

Pesos (en libras) !! !! !!


[117,5; 126,5) 122 3 3
[126,5; 135,5) 131 5 8
[135,5;144,5) 140 9 17

  26  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
[144,5; 153,5) 149 12 29
[153,5; 162,5) 158 5 34
[162,5; 171,5) 167 4 38
[171,5; 180,5] 176 2 40

Ubicamos la clase percentil:

(40 + 1)
!!" = 62. = 25,42º
100

Luego buscamos el valor en la columna de frecuencia acumulada, como no existe se toma el intervalo
superior es decir [144,5; 153,5), luego:

24,8 − 17
!!" = 144,5 + . 9 = 150,35  !"
12

Es decir que el 62% de los pesos son iguales o inferiores a 150,35 lb y el 38% de los pesos es superior o
igual a 150,35 lb.

Medidas de dispersión
 
Varianza
La varianza es el promedio del cuadrado de las distancias entre cada observación y la media aritmética
del conjunto de observaciones.

El valor de la varianza puede sufrir un cambio muy desproporcionado aun más que la media, por la
existencia de algunos valores extremos en el conjunto de datos.

En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.

La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están
elevadas al cuadrado.

!
! (!! − ! ) . !!
!! =  !"#"  !"#$%  !"  !"#$%!&'(
!−1

!
! (… ! − ! ) . !!
!! =  !"#"  !"#$%  !"#$%!&'(
!−1

Siendo F ! el punto medio de la clase

Propiedades de la varianza
1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

  27  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
2 Si a todos los valores de la variable se les suma un número la varianza no varía.

3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por
el cuadrado de dicho número.

Desviación  típica  
La desviación típica es la raíz cuadrada de la varianza.

Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.

La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones
extremas.

En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.

Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la
media.

!
! (!! − ! ) . !!
!= !"#"  !"#$%  !"  !"#$%!&'(
!−1

!
! (… ! − ! ) . !!
!= !"#"  !"#$%    !"#!"#$%&
!−1

Propiedades de la desviación típica


1 La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.

2 Si a todos los valores de la variable se les suma un número la desviación típica no varía.

3 Si todos los valores de la variable se multiplican por un número la desviación típica queda
multiplicada por dicho número.

Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

  28  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
!
!. ! =
!

El coeficiente de variación se suele expresar en porcentajes:

!
!. ! = . 100
!

El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre
que sus medias sean positivas.

Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.

La mayor dispersión corresponderá al valor del coeficiente de variación mayor.

Una distribución tiene x = 140 y s = 28.28 y otra x = 150 y s= 24. ¿Cuál de las dos presenta mayor
dispersión?

La primera distribución presenta mayor dispersión.

Medidas de forma
Medida de asimetría
Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas)
descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la
distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente
de Asimetría de Pearson:

Donde:

  29  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
!= media aritmética.

Md = Mediana.

s = desviación típica o estándar.

Nota:

El Coeficiente de Pearson varía entre -3 y 3

Si As < 0 ? la distribución será asimétrica negativa.

Si As = 0 ? la distribución será simétrica.

Si As > 0 ? la distribución será asimétrica positiva.

 
 

Medida de apuntamiento o curtosis


Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de
distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de
la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un
elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica:
presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

Medida de Fisher

  30  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Para datos sin agrupar se emplea la siguiente fórmula:

Para datos agrupados en intervalos se emplea la siguiente fórmula:

Donde: !! = cada uno de los valores; n = número de datos; != media aritmética; ! ! = Cuádruplo de la
desviación estándar poblacional; f = frecuencia absoluta; xm = marca de clase

Nota:

Si a < 3 ? la distribución es platicútica

Si a = 3 ? la distribución es normal o mesocúrtica

Si a > 3 ? la distribución es leptocúrtica

Módulo 3 – Regresión y Correlación

CORRELACIÓN y REGRESIÓN
'

  31  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Hay dos enfoques, íntimamente relacionados en el estudio de las variables aleatorias
bidimensionales. El primero se ocupa de dar medidas de la dependencia entre las variables
unidimensionales que entran en la variable bidimensional y suele denominarse teoría de la
correlación. El segundo trata ele dar medios de obtener aproximadamente el valor de una de las
variables cuando se da el valor ele la otra y se suele llamar teoría de la regresión o ajuste de
curvas. Más precisamente, los métodos estadísticos presentados hasta ahora se han referido a
una sola variable X. Muchos de los problemas del trabajo estadístico, sin embargo involucran a
dos o más variables. El método se encuentra aplicado al caso de dos variables; pero puede
aplicarse a más de dos.

En algunos problemas, las variables se estudian simultáneamente, para ver la forma en que se
encuentran interrelacionadas; en otros se tiene una variable de interés particular y las restantes
se estudian por la posibilidad de que aclaren aspectos de la primera. Estas dos clases de
problemas se conocen, por lo general, con los nombres de correlación y regresión,
respectivamente.

CORRELACIÓN LINEAL
Un problema de correlación se presenta cuando el individuo se pregunta si existe alguna
relación entre un par de variables que el interesan, por ejemplo, ¿existe alguna relación entre el
uso del tabaco y las afecciones cardíacas?, ¿entre la capacidad de aprender música y la aptitud
científica?, ¿entre la recepción de ondas de radio y la actividad de las manchas solares?, ¿entre
la belleza y la inteligencia?

Con objeto de ilustrar la forma en que se procede a estudiar la relación entre dos variables,
analizaremos un ejemplo sobre los promedios de calificaciones correspondientes al último año
de la escuela y al primer año universitario. El promedio de la escuela se designa con x y el
promedio universitario con y.

  32  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
La investigación de la relación entre las dos variables comienza, generalmente con un intento de
descubrir la forma aproximada de la relación marcando los datos como puntos en el plano
cartesiano de coordenadas x, y. Esta gráfica recibe el nombre dc diagrama de dispersión. Por
este medio, puede decirse con facilidad si existe o no una relación acentuada y, en este caso, si
puede tratarse como aproximadamente lineal. El diagrama de dispersión para las treinta
calificaciones se muestra en la figura:

La observación de este diagrama de dispersión muestra que existe una tendencia de los valores
bajos de x a estar asociados con los valores bajos de y, así como también tienden a asociarse
entre sí los valores altos dc ambas variables. Por otra parte, y aunque vago, el aspecto general
del diagrama de dispersión es el de una línea recta.

Para determinar la naturaleza de una tendencia se busca cualquier propensión de los puntos a
agruparse a ambos lados de alguna curva simple, quizá con unas cuantas ondulaciones, o bien a
ambos lados de una, línea recta.
Se observa que en el ejemplo la línea recta serviría tan bien como una curva ondulante sencilla.

Par estas variables sería conveniente poder medir en alguna forma el grado en que se encuentran
linealmente relacionadas, esto se logra calculando el llamado coeficiente de correlación y se
designa con la letra r.

Así pues, en función de las medidas originales, r se define por la siguiente fórmula :

  33  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
!. ! !! . !! − ( ! !! ). ( ! !! )
!=
! !
!. ! !!! − ( ! !! ) . !. ! !!! − ( ! !! )

Si se calcula el coeficiente de correlación a partir de los datos de nuestro ejemplo, se obtendrá


r = 0,63, este valor de la correlación entre promedios de la escuela y la universidad es típico del
coeficiente de correlación entre calificaciones correspondientes a muchos pares de materias. La
correlación entre matemática y física puede esperarse un tanto mayor mientras que la
correlación entre las calificaciones entre matemática y arte dramático se esperaría baja.

Analizaremos dos propiedades de r:


1) el valor de r debe satisfacer las desigualdades:

−1 ≤ ! ≤ +1

2) el valor de r será igual a +1 o -1 si y sólo si todos los puntos del diagrama se encuentran
sobre una línea recta.

Para interpretar el valor de r y descubrir cuáles valores de r son de esperarse en los diversos
tipos de relaciones entre x e y, se presentan algunos diagramas de dispersión con los
correspondientes valores de r :

  34  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Los diagramas (a), (b), (e) y (d) corresponden a dispersiones con relación lineal cada vez más
acentuada. El diagrama (e) es una imagen especular del (e), con esto se ve que el valor absoluto
de r mide la fuerza de la relación lineal, pero que el signo de r es positivo si y tiende a crecer al
aumentar x, y es negativo si y tiende a disminuir al crecer x. En el diagrama (f) x e y están
fuertemente relacionadas, pero la relación no es lineal. Este ejemplo indica bien que r es una
medida útil de lo estrechamente que estén relacionadas dos variables sólo cuando hay una
relación lineal entre ellas.

Interpretación de r
La interpretación de un coeficiente de correlación como medida del grado de relación lineal
entre dos variables es una interpretación matemática pura y está completamente desprovista de
implicaciones de causa y efecto. El hecho de que dos variables tiendan a aumentar o disminuir
al mismo tiempo no implica que una tenga algún efecto directo o indirecto en la otra. Ambas
pueden estar sometidas a la influencia de otras variables, de manera que resulten con una
estrecha relación matemática, por ejemplo, en un período de varios años el coeficiente de
correlación entre los sueldos de maestros y el consumo de licor ha resultado ser de 0,98.
Durante este lapso se ha presentado una tendencia ascendente en sueldos y salarios de todos los
tipos y una tendencia general a mayores comodidades de vida. En tales condiciones, los salarios
de los maestros también habrían de aumentar. Además, la tendencia general de aumento de
salarios y poder adquisitivo, así como el aumento de población, se vería reflejada en un aumento
en el consumo de licor. Así pues, la alta correlación refleja sólo el efecto común de una
tendencia ascendente de las dos variables. Los coeficientes de correlación deben manejarse con
cuidado si se va a dar una información sensata respecto a la relación entre pares de variables. El
utilizarlas correctamente requiere familiarización con el campo de aplicación, así como con sus
propiedades matemáticas.

Los coeficientes de correlación han probado ser muy útiles, por ejemplo, para pruebas
psicológicas y en otros campos en que es importante determinar la interrelación de algunas
variables que se estudian simultáneamente.

REGRESIÓN LINEAL
Es usual estudiar entre dos o más variables con la esperanza dc que cualquier relación que se
encuentre puede usarse para hacer estimaciones o predicciones acerca de una de las variables en
particular.

Al estudiar la correlación entre las calificaciones la intención es obviamente usar esa relación
para tratar de predecir el éxito académico de un estudiante universitario a partir del
conocimiento de su promedio en la escuela. El coeficiente de correlación sólo indica qué tan
estrecha es la relación lineal entre las variables y no es capaz de resolver problemas de
predicción. De manera semejante; si se calcularan coeficientes de correlación entre promedios
de las calificaciones universitarias y resultados de pruebas de aptitud y vocabulario esas
correlaciones sólo servirían para indicar cuáles de estas variables conviene incluir en una
función de predicción del éxito académico.

Los métodos que se han desarrollados para manejar problemas de predicción se conocen como
métodos de regresión.

Con objeto de explicar los métodos de regresión, considérese el problema particular de predecir
el rendimiento en forraje como función de la cantidad de agua de irrigación aplicada que se
presenta en la siguiente tabla:

  35  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Agua (x) 12 18 24 30 36 42 48
Rendimiento 5,27 5,68 6,25 7,21 8,02 8,71 8,42
(y)

La cantidad de agua se mide en pulgadas y el rendimiento, en toneladas, de forraje del terreno


de una granja experimental.
La gráfica de estos datos es :

Según esta gráfica, resulta que x e y están relacionadas en forma aproximadamente lineal para
estos valores de x. Se ajustará una recta, pues, a estos conjuntos de puntos para tratar de
predecir el valor de y par1iendo de valores de x. Esta línea se ha trazado en la gráfica. Para
cualquier valor dado de x, por ejemplo, x = 30, el valor predicho de y es la distancia del punto x
= 30 del eje x, a la recta, directamente por arriba del punto. Leyendo el valor de la ordenada en
el eje y se verá que el valor predicho para x = 30 es casi igual a 7, comparando con el valor
observado de 7,21
Supóngase, ahora, que se considera que la relación entre el rendimiento promedio y el agua es
estrictamente lineal en esta región de valores de x. Esto significa que, si se hubiera repetido el
experimento muchas veces en las mismas condiciones de crecimiento y se hubieran promediado
por separado los valores de y correspondientes a cada uno de los siete valores de x, estos
promedios hubiesen dado un conjunto de puntos casi precisamente sobre una línea recta.
Mientras mayor sea el número de estas repeticiones, mayor será la precisión esperada. Esta
suposición dice, esencialmente, que existe una línea recta teórica que expresa la relación lineal
entre el valor medio teórico de y y el valor correspondiente de x.

Si se acepta la linealidad, entonces se esperaría que el valor dado por la línea recta ajustada a la
muestra, que es casi igual a 7, fuese más cercano al valor de la línea teórica para x = 30 que el
valor observado de 7,21, porque es de esperarse más estabilidad en la línea recta de muestra que

  36  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
en una sola observación puntual. En vista de este razonamiento, se predecirá el valor de la línea
teórica correspondiente a x = 30 como el correspondiente valor de y sobre la línea de regresión
de muestra. Se harán predicciones similares para los otros seis valores de x.

Si se tiene interés en un valor intermedio de x, se emplea la línea de muestra para encontrar el


valor predicho para y correspondiente al valor de x. Puesto que se supone que la relación es
lineal sólo en esta región de valores de x, no es legítimo usar la línea recta para predecir valores
de y fuera de estos intervalo de valores de x.

Sin duda, surge la necesidad de encontrar la ecuación de esta recta, para calcular fácilmente el
valor de y para un valor de x dado, veremos entonces un método para encontrar esta ecuación:

La ecuación de la recta de regresión es y = a + b.x

Siendo

! !! − !. ! !! !. ! !! . !! − ( ! !! ). ( ! !! )
!=                !                ! = !
! !. !
! !! Ǧ( ! !! )

En el ejemplo del agua y la ganancia, a = 3,994 y b = O, J 03, luego la recta de regresión de y


sobre x que ya fue representada es :
y' = 3,994 + 0,103. X
Galton, uno de los pioneros en el campo de la estadística aplicada ha dado este nombre a la
recta, en conexión con ciertos estudios que efectuaba pata la estimación de la medida en la que
regresa la estatura del hijo de padre alto, hacia la estatura media de la población, es decir, él
descubrió que hijos de padre alto tienen tendencia a ser más bajos que él y los hijos de padre
bajo tienen tendencia a ser más altos que su padre.

Los ejemplos expuestos ilustran bien la diferencia básica entre métodos de correlación y
regresión para dos variables:
En el problema de correlación correspondiente al diagrama de dispersión los datos consistían en
una muestra aleatoria de treinta estudiantes, esto significa que tanto x como y son variables
estadísticas cuyos valores quedan determinados sólo después de obtenida la muestra.
En el problema de regresión, sin embargo, los valores de x se eligieron de antemano, de manera
que sólo los valores de y se han determinado por muestra.

Ahora bien, la técnica para ajustar una recta a un conjunto de puntos se puede aplicar
independientemente de que los valores de x sean fijados de antemano o se obtengan de muestras
al azar. Luego, los métodos de regresión podrían haberse aplicado a datos del tipo considerado
en el estudio de correlación. Por otra parte, la interpretación de r como medida del grado de
relación lineal entre dos variables obviamente no se aplica si los valores de x se seleccionan de
manera no aleatoria, debido a que el valor de r por lo general dependerá en buena medida de la
elección ele los valores de x.

Aun cuando un coeficiente de correlación es útil para describir qué tan estrechamente se

  37  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
encuentran relacionadas linealmente dos variables, no es muy útil en otros sentidos. Si el
coeficiente de correlación entre aptitudes matemáticas y aptitud en música es 0,4, mientras que
el correspondiente a aptitudes matemáticas y aptitud en arte es 0,2, puede concluirse que la
primera asociación es más fuerte que la segunda y que ambas relaciones son relativamente
débiles; pero no puede decirse más.
Los coeficientes de correlación no se prestan a enunciados cuantitativos, a menos que se asocien
con la regresión. Así pues, la correlación por lo general es solo la primera parte, en el estudio,
de la relación de dos variables, mientras que la regresión es la técnica básica en este tipo de
estudios.

Módulo 4 – Teoría de probabilidad

Probabilidad
La probabilidad de un suceso es un número, comprendido entre 0 y 1, que indica las posibilidades que
tiene de verificarse cuando se realiza un experimento aleatorio.

Experimentos deterministas
Son los experimentos de los que podemos predecir el resultado antes de que se realicen.

Si dejamos caer una piedra desde una ventana sabemos, sin lugar a dudas, que la piedra bajará. Si la
arrojamos hacia arriba, sabemos que subirá durante un determinado intervalo de tiempo; pero después
bajará.

Experimentos aleatorios
Son aquellos en los que no se puede predecir el resultado, ya que éste depende del azar.

Ejemplos:

Si lanzamos una moneda no sabemos de antemano si saldrá cara o cruz.

Si lanzamos un dado tampoco podemos determinar el resultado que vamos a obtener.

Teoría de probabilidades
La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda
ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es
más probable que otro. Con este fin, introduciremos algunas definiciones:

  38  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Suceso
Es cada uno de los resultados posibles de una experiencia aleatoria.

Ejemplos:

Al lanzar una moneda salga cara.

Al lanzar un dado se obtenga 4.

Espacio muestral
Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o
bien por la letra griega Ω).

Ejemplos:

Espacio muestral de una moneda:

E = {C, X}.

Espacio muestral de un dado:

E = {1, 2, 3, 4, 5, 6}.

Suceso aleatorio
Suceso aleatorio es cualquier subconjunto del espacio muestral.

Ejemplos:

Tirar un dado un suceso sería que saliera par, otro, obtener múltiplo de 3, y otro, sacar 5.

Un ejemplo completo

Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas. Calcular:

1. El espacio muestral.

E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}

2. El suceso A = {extraer tres bolas del mismo color}.

A = {(b,b,b); (n, n,n)}

3. El suceso B = {extraer al menos una bola blanca}.

B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}

4. El suceso C = {extraer una sola bola negra}.

  39  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
C = {(b,b,n); (b,n,b); (n,b,b)}

Tipos de sucesos

Suceso elemental
Suceso elemental es cada uno de los elementos que forman parte del espacio muestral.

Ejemplo

Tirando un dado un suceso elemental es sacar 5.

Suceso compuesto
Suceso compuesto es cualquier subconjunto del espacio muestral.

Ejemplo

Tirando un dado un suceso sería que saliera par, otro, obtener múltiplo de 3.

Suceso seguro
Suceso seguro, E, está formado por todos los posibles resultados (es decir, por el espacio muestral).

Ejemplo:

Tirando un dado obtener una puntuación que sea menor que 7.

Suceso imposible
Suceso imposible, ∅, es el que no tiene ningún elemento.

Ejemplo:

Tirando un dado obtener una puntuación igual a 7.

Sucesos compatibles
Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común.

Ejemplo:

  40  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Si A es sacar puntuación par al tirar un dado y B es obtener múltiplo de 3, A y B son compatibles porque
el 6 es un suceso elemental común.

Sucesos incompatibles
Dos sucesos, A y B, son incompatibles cuando no tienen ningún elemento en común.

Ejemplo:

Si A es sacar puntuación par al tirar un dado y B es obtener múltiplo de 5, A y B son incompatibles.

Sucesos independientes
Dos sucesos, A y B, son independientes cuando la probabilidad de que suceda A no se ve afectada porque
haya sucedido o no B.

Ejemplo:

Al lazar dos dados los resultados son independientes.

Sucesos dependientes
Dos sucesos, A y B, son dependientes cuando la probabilidad de que suceda A se ve afectada porque haya
sucedido o no B.

Ejemplo:

Extraer dos cartas de una baraja, sin reposición, son sucesos dependientes.

Suceso contrario
El suceso contrario a A es otro suceso que se realiza cuando no se realiza A. Se denota por !.

Ejemplo:

Son sucesos contrarios sacar par e impar al lanzar un dado.

Espacio de sucesos
Espacio de sucesos, S, es el conjunto de todos los sucesos aleatorios.

Si tiramos una moneda el espacio se sucesos está formado por:

S= {∅, {C}, {X}, {C,X}}.

Observamos que el primer elemento es el suceso imposible y el último el suceso seguro.

  41  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Si E tiene un número finito de elementos, n, de elementos el número de sucesos de E es 2n .

Ejemplos:

Una moneda E= {C, X}.

Número de sucesos = 22 =4

Dos monedas E= {(C,C); (C,X); (X,C); (X,X)}.

Número de sucesos = 24 =16

Un dado E = {1, 2, 3, 4, 5, 6}.

Número de sucesos = 26 = 64

Unión de sucesos
La unión de sucesos, A ∪  B, es el suceso formado por todos los elementos de A y de B.

Es decir, el suceso A∪ B se verifica cuando ocurre uno de los dos, A o B, o ambos.

A  ∪ B se lee como "A o B".

Ejemplo:

Consideramos el experimento que consiste en lanzar un dado, si A = "sacar par" y B = "sacar múltiplo de
3". Calcular A ∪  B.

A = {2, 4, 6}

B = {3, 6}

A ∪  B = {2, 3, 4, 6}

  42  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Propiedades de la unión de sucesos

Conmutativa

Asociativa

Idempotente

Simplificación

Distributiva

Elemento neutro

Absorción

  43  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Intersección de sucesos
La intersección de sucesos, A ∩  B, es el suceso formado por todos los elementos que son, a la vez, de A
y B.

Es decir, el suceso A ∩  B se verifica cuando ocurren simultáneamente A y B.

A ∩  B se lee como "A y B".

Ejemplo:

Consideramos el experimento que consiste en lanzar un dado, si A = "sacar par" y B = "sacar múltiplo de
3". Calcular A ∩  B.

A = {2, 4, 6}

B = {3, 6}

A ∩  B = {6}

Propiedades de la intersección de sucesos

Conmutativa

Asociativa

Idempotente

  44  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Simplificación

Distributiva

Elemento neutro

Absorción

Diferencia de sucesos
La diferencia de sucesos, A − B, es el suceso formado por todos los elementos de A que no son de B.

Es decir, la diferencia de los sucesos A y B se verifica cuando lo hace A y no B.

A − B se lee como "A menos B".

Ejemplo:

Consideramos el experimento que consiste en lanzar un dado, si A = "sacar par" y B = "sacar múltiplo de
3". Calcular A − B.

A = {2, 4, 6}

B = {3, 6}

A − B = {2, 4}

  45  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Propiedad de la diferencia de sucesos

Sucesos contrarios

El suceso != E - A se llama suceso contrario o complementario de A.

Es decir, se verifica siempre y cuando no se verifique A.

Consideramos el experimento que consiste en lanzar un dado, si A = "sacar par". Calcular !.

A = {2, 4, 6}

!= {1, 3, 5}

Propiedades

  46  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Leyes de Morgan

Propiedades de la probabilidad

Axiomas de la probabilidad
1.La probabilidad es positiva y menor o igual que 1.

0 ≤ p(A) ≤ 1

2. La probabilidad del suceso seguro es 1.

p(E) = 1

3.Si A y B son incompatibles, es decir A ∩  B = ∅  entonces:

p(A ∪  B) = p(A) + p(B)

Propiedades de la probabilidad
1. La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la probabilidad del suceso
contrario es:

  47  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
2. Probabilidad del suceso imposible es cero.

3. La probabilidad de la unión de dos sucesos es la suma de sus probabilidades restándole la probabilidad


de su intersección.

4. Si un suceso está incluido en otro, su probabilidad es menor o igual a la de éste.

5. Si A1, A2, ..., Ak son incompatibles dos a dos entonces:

6 Si el espacio muestral E es finito y un suceso es S = {x1, x2, ..., xn} entonces:

Ejemplo:

La probabilidad de sacar par, al tirar un dado, es:

P(par) = P(2) + P(4) + P(6)

Ley de Laplace

Regla de Laplace
Si realizamos un experimento aleatorio en el que hay n sucesos elementales, todos igualmente probables,
equiprobables, entonces si A es un suceso, la probabilidad de que ocurra el suceso A es:

Ejemplos
1Hallar la probabilidad de que al lanzar dos monedas al aire salgan dos caras.

  48  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Casos posibles: {cc, cx, xc, xx}.

Casos favorables: 1.

2En una baraja de 40 cartas, hallar la P (as) y P (copas).

Casos posibles: 40.

Casos favorables de ases: 4.

Casos favorables de copas: 10.

3Calcular la probabilidad de que al echar un dado al aire, salga:

1 Un número par.

Casos posibles: {1, 2, 3, 4, 5, 6}.

Casos favorables: {2, 4, 6}.

2 Un múltiplo de tres.

Casos favorables: {3, 6}.

3 Mayor que 4.

  49  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
Casos favorables: {5, 6}.

  50  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

Práctico módulo 1, 2, 3 y 4
1) Indica que variables son cualitativas y cuales cuantitativas:
Comida Favorita.
Profesión que te gusta.
Número de goles marcados por tu equipo favorito en la última temporada.
Número de alumnos de tu Instituto.
El color de los ojos de tus compañeros de clase.
Coeficiente intelectual de tus compañeros de clase.

2) De las siguientes variables indica cuáles son discretas y cuales continuas.


Número de acciones vendidas cada día en la Bolsa.
Temperaturas registradas cada hora en un observatorio.
Período de duración de un automóvil.
El diámetro de las ruedas de varios coches.
Número de hijos de 50 familias.
Censo anual de población.

3) Clasificar las siguientes variables en cualitativas ordinales o nominales y


cuantitativas discretas o continuas.
La nacionalidad de una persona.
Número de litros de agua contenidos en un depósito.
Número de libro en un estante de librería.
Suma de puntos tenidos en el lanzamiento de un par de dados.
La profesión de una persona.
El área de las distintas baldosas de un edificio.

4) De 2000 circuitos de computadora revisados por el fabricante se obtuvieron los


siguientes datos:
Conexiones defectuosas: 31
Agujeros demasiado grandes: 55
Agujeros sin abrir: 182
Circuitos de tamaño incorrecto: 5
Otros: 7

a) Confeccione una tabla de frecuencias.


b) Realice un diagrama circular para representar los porcentajes de defectos
encontrados.
c) Realice un diagrama de barras

5) Dada la siguiente tabla, correspondiente a las edades de un grupo de personas, calcule e


interprete

  51  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
!! !! !!
25 1 1
26 2 3
27 3 6
28 4 10
29 6 16
30 5 21
31 3 24
32 1 25

a) Media
b) Mediana
c) Moda
d) Primer cuartil
e) Percentil ochenta y dos
f) Segundo decil
g) Varianza y desviación típica
h) Coeficiente de variación
i) Representar en un polígono de frecuencias

6) En un estudio sobre la productividad de los trabajadores se obtuvieron los siguientes


datos sobre el número total de piezas aceptables que produjeron cien de ellos

21 22 26 28 32 33 34 34 35 35 35 35 36 36 37 38 39 40 40 41 41 42 43 43 44
45 45 45 45 46 47 47 48 48 49 50 50 50 51 51 51 52 52 52 53 53 53 54 54 55
55 55 56 56 56 57 57 58 59 59 60 60 60 61 61 61 62 62 62 63 64 65 65 65 67
67 68 68 68 69 70 70 72 73 73 74 74 74 75 76 76 77 78 79 80 82 82 84 85 88

a) Agrupar los datos y confeccionar la tabla de frecuencias


b) Confeccionar un histograma

7) En un experimento que mide en milímetros el encogimiento al secar cincuenta


especímenes de prueba de arcilla plástica produjo el siguiente resultado:

19,3 15,8 20,7 18,4 14,9 17,3 16,1 22,5 17,9 18,6
20,5 20,5 16,9 18,5 18,7 12,9 19,5 17,5 17,4 23,4
18,8 18,3 16,9 17,9 17,1 22,5 18,8 19,3 17,4 19,4
17,4 18,5 17,5 16,5 17,5 17,3 19,5 18,8 22,5 19,1
17,5 16,8 16,3 19,0 18,2 17,4 18,2 19,0 19,2 17,1

a) Agrupe los datos en intervalos


b) Represente en un histograma
c) ¿Por debajo de qué valor se encuentra el 25% de los encogimientos?
d) ¿Hasta cuánto se han encogido el 40% de los especímenes?
e) ¿Por encima de qué valor se encuentra el 90% de los encogimientos?

8) Los siguientes datos son doce lecturas de temperaturas en Fº en varios puntos de un


horno:

445 410 470 460 415 510 450 495 465 500 475 425

  52  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

a) Calcular media, mediana, moda, desviación estándar y coeficiente de variación.

9) La siguiente es la distribución de salarios de los empleados de una pequeña empresa:

Salarios Número de empleados


$10000 1
$2500 1
$1000 1
$500 2
$200 4

Los empleados realizan una huelga para pedir mejoras salariales. Un periodista realiza
una nota preguntando cuál es el salario medio

a) ¿Cuál medida de tendencia central daría si fuera el dueño?


b) ¿Y si fuera un representante sindical?
c) ¿Y si fuera un investigador cienttfico?

10) se ha medido la vida en horas de cincuenta lámparas incandescentes obteniendo:

1067 919 1195 785 1126 936 918 1156 920 948
855 1092 1162 1170 929 950 905 972 1035 1045
1157 1195 1195 1248 1122 938 970 1237 958 1102
1022 978 832 1009 1157 1151 1009 765 958 902
923 1233 811 1217 1085 896 958 1211 1037 702

a) Agrupar los datos en una tabla de frecuencias


b) Dibujar un histograma y el polígono de frecuencias correspondiente
c) Calcular la media, mediana, moda y desviación estándar con datos sin agrupar
d) Calcular Q1, D7, y P92 con datos sin agrupar
e) Calcular la media, mediana, moda y desviación estándar con datos agrupados
f) Comparar los datos del punto d y f
g) Calcular Q1, D7, y P92 con datos agrupados
h) ¿Cuál es el P95 para datos agrupados?

11) Los siguientes son datos sobre estaturas (x) y pesos (y) de doce estudiantes

x 65 73 70 68 66 69 75 70 64 72 65 71
(pulgadas)
y (libras) 124 184 161 164 140 154 210 164 126 172 133 150

a) Trazar el diagrama de dispersión de y con respecto a x


b) Calcular la recta de ajuste analíticamente y trazarla en el diagrama
c) Calcular el coeficiente de correlación e interpretarlo
d) Estimar el peso de un alumno de 74 pulgadas

12) Al analizar la relación entre la temperatura promedio semanal y el promedio de


accidentes se obtienen los siguientes resultados:

Temperatura

  53  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
media de la 2 3 4 5 6 7
semana en
ºC
Promedio de
accidentes 278 240 198 132 111 83
viales

a) Calcular la recata de ajuste y representarla sobre el diagrama de dispersión


b) Calcular el coeficiente de correlación. Interpretar.
c) Estimar el promedio de accidentes si la temperatura bajara a 0 ºC

13) Trece ovejas comieron hierba tóxica y murieron envenenadas. A continuación se


presentan los pesos x en libras y los tiempos hasta producirse el deceso y en horas

Peso 46 55 61 75 64 75 71 59 64 67 60 63 66
(x)
Tiempo 44 27 24 24 36 36 44 44 120 29 36 36 36
(y)

a) Trazar el diagrama de dispersión


b) Calcular la recata ajuste y representarla sobre el diagrama de dispersión
c) Calcular el coeficiente de correlación e interpretar
d) Discutir sobre la manera de explicar lo ocurrido con la oveja terca que se niega a
morir antes de las 120 horas. ¿Afecta ese caso algunas de las suposiciones de
regresión?

11) ¿Qué interpretación puede dar a la información de que la correlación entre el número de
accidentes en una fábrica y la edad del operario es de -0,6?

12) Dados

Hallar:

a)

b)

c)

d)

  54  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

e)

f)

g)

13) Sean A y B dos sucesos aleatorios con:

Hallar:

a)

b)

c)

d)

14) Se sacan dos bolas de una urna que se compone de una bola blanca, otra roja, otra verde y
otra negra. Escribir el espacio muestral cuando:

a)La primera bola se devuelve a la urna antes de sacar la segunda.

b)La primera bola no se devuelve.

15) Una urna tiene ocho bolas rojas, 5 amarilla y siete verdes. Si se extrae una bola al azar
calcular la probabilidad de:

a)Sea roja.

b)Sea verde.

c)Sea amarilla.

d)No sea roja.

e)No sea amarilla.

  55  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 

16) Una urna contiene tres bolas rojas y siete blancas. Se extraen dos bolas al azar. Escribir el
espacio muestral y hallar la probabilidad de los sucesos:

a) Con reemplazamiento.

b) Sin reemplazamiento.

17) Se extrae una bola de una urna que contiene 4 bolas rojas, 5 blancas y 6 negras, ¿cuál es la
probabilidad de que la bola sea roja o blanca? ¿Cuál es la probabilidad de que no sea blanca?

18) En una clase hay 10 alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un
día asisten 45 alumnos, encontrar la probabilidad de que un alumno:

a) Sea hombre.

b) Sea mujer morena.

c) Sea hombre o mujer.

19) Un dado está trucado, de forma que las probabilidades de obtener las distintas caras son
proporcionales a los números de estas. Hallar:

a)La probabilidad de obtener el 6 en un lanzamiento.

b)La probabilidad de conseguir un número impar en un lanzamiento.

20) Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide:

a) La probabilidad de que salga el 7.

b) La probabilidad de que el número obtenido sea par.

c)La probabilidad de que el número obtenido sea múltiplo de tres.

21) Se lanzan tres dados. Encontrar la probabilidad de que:

a) Salga 6 en todos.

b) Los puntos obtenidos sumen 7.

22) Hallar la probabilidad de que al levantar unas fichas de dominó se obtenga un número de
puntos mayor que 9 o que sea múltiplo de 4.

23) Busca la probabilidad de que al echar un dado al aire, salga:

a) Un número par.

  56  
  Tecnicatura en Higiene y
Seguridad en el Trabajo   [Escriba  texto]  
 
b) Un múltiplo de tres.

c) Mayor que cuatro.

24) Hallar la probabilidad de que al lanzar al aire dos monedas, salgan:

a) Dos caras.

b) Dos cruces.

c) Una cara y una cruz.

25) En un sobre hay 20 papeletas, ocho llevan dibujado un coche las restantes son blancas.
Hallar la probabilidad de extraer al menos una papeleta con el dibujo de un coche:

a) Si se saca una papeleta.

b) Si se extraen dos papeletas.

c) Si se extraen tres papeletas.

26) Los estudiantes A y B tienen respectivamente probabilidades 1/2 y 1/5 de suspender un


examen. La probabilidad de que suspendan el examen simultáneamente es de 1/10. Determinar
la probabilidad de que al menos uno de los dos estudiantes suspenda el examen.

27) Dos hermanos salen de caza. El primero mata un promedio de 2 piezas cada 5 disparos y el
segundo una pieza cada 2 disparos. Si los dos disparan al mismo tiempo a una misma pieza,
¿cuál es la probabilidad de que la maten?

28) Una clase consta de 10 hombres y 20 mujeres; la mitad de los hombres y la mitad de las
mujeres tienen los ojos castaños. Determinar la probabilidad de que una persona elegida al azar
sea un hombre o tenga los ojos castaños.

29) La probabilidad de que un hombre viva 20 años es ¼ y la de que su mujer viva 20 años es
1/3. Se pide calcular la probabilidad:

a) De que ambos vivan 20 años.

b) De que el hombre viva 20 años y su mujer no.

c) De que ambos mueran antes de los 20 años.

  57  

También podría gustarte