Está en la página 1de 30

Documento de Apoyo IEstadistiCoach©

Tablas de frecuencia
En este vídeo se explica la manera de realizar una tabla de frecuencias
simple con las columnas de datos, frecuencias absolutas,
frecuencia relativa, frecuencia absoluta acumulada y porcentaje.
Se divide 6/15= 0,24
Rango o Recorrido
En este vídeo se explica cómo se obtiene el Rango o Recorrido para datos agrupados con
intervalos

Histogramas, ejemplos y ejercicios


Un histograma es una representación gráfica de una variable en
forma de barras, teniendo en cuenta que la superficie de cada
barra es proporcional a la frecuencia de los valores representados.
Un histograma nos permite ver cómo se distribuyen los valores de
la variable en estudio.

Usamos los histogramas cuando analizamos variables continuas, o


cuando trabajamos con variables discretas que toman un gran
número de valores y son agrupadas en intervalos. Cuando
tenemos variables cualitativas, se emplean los diagramas de
barras.
¿Cómo construir un histograma?
Partimos de una tabla de frecuencias con datos agrupados, y
seguimos los siguientes pasos:

1. En el eje horizontal (X), colocamos los límites de clase.


Opcionalmente, puedes colocar las marcas de clase.
2. En el eje vertical (Y), colocamos las frecuencias. Se suele
tomar la frecuencia absoluta, pero también se puede
trabajar con la frecuencia relativa o con la frecuencia
porcentual.
3. Dibujamos las barras de cada clase, teniendo en cuenta
que la altura de cada barra es igual a la frecuencia.
Ejemplo 1
Se registran los tiempos de las llamadas recibidas en un call
center, y se obtiene la siguiente tabla de frecuencias con datos
agrupados. Construir un histograma de frecuencias.

Solución:
Recuerda que si vas a trabajar con una variable cualitativa o
variable discreta que asume pocos valores, deberás usar
un diagrama de barras y no un histograma.

Polígono de frecuencias
Es un gráfico que se forma uniendo los puntos medios de la
parte superior de las barras mediante segmentos de recta. El
polígono de frecuencias es de mucha utilidad cuando se
representa más de una serie en una misma gráfica.

Los polígonos de frecuencias se trazan tomando en cuenta


las marcas de clase de cada barra.
Ejemplo 2
A partir del histograma del ejemplo anterior, construir el polígono
de frecuencias.

Solución:

Ojiva
La ojiva es una gráfica asociada a la distribución de frecuencias
acumuladas. Nos permite ver cuántos datos u observaciones se
encuentran por encima o por debajo de determinado valor.

Las ojivas se trazan tomando en cuenta los límites superiores de


cada clase o intervalo, es decir, tomando el extremo derecho de la
parte superior de cada barra. Dibujar una ojiva es muy similar a
dibujar un polígono de frecuencias acumuladas.

Una ojiva también se puede construir con las frecuencias relativas


acumuladas o frecuencias porcentuales acumuladas.

Ejemplo 3
A partir del histograma del ejemplo anterior, construir la ojiva.

Solución:
Diferencia entre el polígono de frecuencias y
ojiva
El polígono de frecuencias parte desde el histograma de
frecuencias absolutas, mientras que la ojiva parte del histograma
de frecuencias acumuladas. Además, el polígono de frecuencias se
forma uniendo los puntos medios de la parte superior de cada
barra, mientras que la ojiva se forma uniendo el extremo derecho
de la parte superior de cada barra.

En el siguiente gráfico, se apreciará mejor:

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores
de la distribución.

Las medidas de dispersión son:

Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una distribución


estadística.
 

Desviación media

La desviación respecto a la media es la diferencia entre cada valor de la variable


estadística y la media aritmética.

Di = x - x
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media.

La desviación media se representa por 

Ejemplo

Calcular la desviación media de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de


la desviación media es:

Ejemplo

Calcular la desviación media de la distribución:

xi fi xi · fi |x - x| |x - x| · fi

[10, 15) 12.5 3 37.5 9.286 27.858

[15, 20) 17.5 5 87.5 4.286 21.43


[20, 25) 22.5 7 157.5 0.714 4.998

[25, 30) 27.5 4 110 5.714 22.856

[30, 35) 32.5 2 65 10.174 21.428

21 457.5 98.57

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la


media de una distribución estadística.

La varianza se representa por  .

Varianza para datos agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que


son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza de la distribución:


9, 3, 8, 8, 9, 8, 9, 18

 
Calcular la varianza de la distribución de la tabla:

xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

1
La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones
sean iguales.

2
Si a todos los valores de la variable se les suma un número la varianza no varía.

3
Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por el cuadrado de dicho número.

4
Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Observaciones sobre la varianza


1
La varianza, al igual que la media, es un índice muy sensible a las puntuaciones
extremas.

2
En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.

3
La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.

Desviación típica

La desviación típica es la raíz cuadrada de la varianza.

Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de


desviación.
La desviación típica se representa por σ.

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
Desviación típica para datos agrupados

Ejercicios de desviación típica

Calcular la desviación típica de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviación típica de la distribución de la tabla:

xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

1
La desviación típica será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
2
Si a todos los valores de la variable se les suma un número la desviación típica no
varía.

3
Si todos los valores de la variable se multiplican por un número la desviación
típica queda multiplicada por dicho número.

4
Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones típicas se puede calcular la desviación típica total.

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Observaciones sobre la desviación típica


1
La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las
puntuaciones extremas.

2
En los casos que no se pueda hallar la media tampoco será posible hallar la desviación
típica.

3
Cuanta más pequeña sea la desviación típica mayor será la concentración de
datos alrededor de la media.

Completa las tablas:

1En una clase de 1º ESO de   alumnos se hace una encuesta preguntando a
qué dedican su tiempo de ocio. Las respuestas se reflejan en el siguiente
diagrama de sectores. Completa la siguiente tabla:

 
 

Hobby Alumnos Grad


Televisión
Lectura
Deporte
Otros
Total º

2En un instituto se ha realizado una encuesta a los alumnos de 2º de ESO para


saber cuáles son los libros que más les gusta leer, y así poder comprar nuevos
libros para la biblioteca. Los resultados son los que se muestran en el siguiente
diagrama de sectores. Completa la siguiente tabla y, después, contesta a las
preguntas que se te plantean:

Tipo de libro Alumnos Gr


Poesía º

Terror º

Aventuras º

Misterio º

Teatro º

Total º

¿A cuántos estudiantes se les ha realizado la encuesta?

Se ha hecho la encuesta a    estudiantes.

¿Cuántos alumnos prefieren los libros de terror?

 alumnos prefieren los libros de terror.

¿Qué libros son los que más gustan?

Los libros de  

¿Y los que menos?

Los libros de  

Si tienes dudas puedes consultar la teoría


Distribuciones marginales
Al analizar una distribución bidimensional, uno puede centrar su estudio en el
comportamiento de una de las variables, con independencia de como se comporta
la otra. Estaríamos así en el análisis de una distribución marginal.

De cada distribución bidimensional se pueden deducir dos distribuciones


marginales: una correspondiente a la variable x, y otra correspondiente a la
variable y.

Distribución marginal de X

X ni.

x x

x1 n1.

x2 n2.

..... ...

xn-1 nn-1.

xn nn.

Distribución marginal de Y

Y n.j

x x

y1 n.1

y2 n.2

..... ...

ym-1 n.m-1

ym n.m

 
Ejemplo: a partir del ejemplo que vimos en la lección anterior (serie con los pesos
y medidas de los alumnos de una clase) vamos a estudiar sus distribuciones
marginales.

Estatura / Peso 31 kg 32 kg 33 kg 34 kg 35 kg

1,21 cm 0 0 1 2 0

1,22 cm 0 1 1 0 1

1,23 cm 0 0 0 0 0

1,24 cm 0 2 1 0 0

1,25 cm 1 1 1 0 0

1,26 cm 0 0 0 0 0

1,27 cm 2 1 0 2 1

1,28 cm 0 1 1 0 1

1,29 cm 3 0 1 1 1

1,30 cm 0 0 0 2 1

Las variables marginales se comportan como variables unidimensionales, por lo


que pueden ser representadas en tablas de frecuencias.

a) Distribución marginal de la variable X (estatura)

Obtenemos la siguiente tabla de frecuencia:

Variable Frecuencias absolutas Frecuencias relativas


(Estatura) Simple Acumulada Simple Acumulada
xx xx xx xx xx
1,21 3 3 10,0% 10,0%
1,22 3 6 10,0% 20,0%
1,23 0 6 0,0% 20,0%
1,24 3 9 10,0% 30,0%
1,25 3 12 10,0% 40,0%
1,26 0 12 0,0% 40,0%
1,27 6 18 20,0% 60,0%
1,28 3 21 10,0% 70,0%
1,29 6 27 20,0% 90,0%
1,30 3 30 10,0% 100,0%
 

b) Distribución marginal de la variable Y (peso)

Obtenemos la siguiente tabla de frecuencia:

Variable Frecuencias absolutas Frecuencias relativas


(Peso) Simple Acumulada Simple Acumulada
xx xx xx xx xx
31 6 6 20,0% 20,0%
32 6 12 20,0% 40,0%
33 6 18 20,0% 60,0%
34 7 25 23,3% 83,3%
35 5 30 16,6% 100,0%
 

Ejercicios de estadística, covarianza, correlación


y recta de regresión
Ejercicios de estadística, problemas de distribuciones bidimensionales. Covarianza,
coeficiente de correlación entre las variables y ecuación de las rectas de regresión.

Ejercicios resueltos estadística bidimensional

1. Una compañía de seguros considera que el número de vehículos (y) que circulan por una
determinada autopista a más de 120 km/h , puede ponerse en función del número de
accidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes resultados:
Accidentes xi 5 7 2 1 9

Vehículos yi 15 18 10 8 20
  a) Calcula el coeficiente de correlación lineal.
  b) Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer que circulaban
por la autopista a más de 120 km/h?
  c) ¿Es buena la predicción?
Construimos una tabla con las columnas necesarias
Vemos las fórmulas que tenemos que aplicar para saber las columnas que necesitamos, a
continuación se explica la forma de hacer esto.
Problemas resueltos estadística bidimensional

2. Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las de


la tabla adjunta.

  a) Obtener la ecuación de la recta de regresión de calificaciones de estadística respecto de


las calificaciones de psicología.
  b) ¿Cuál será la nota esperada en estadística para un alumno que obtuvo un 4,5 en
psicología?
Construimos una tabla con las columnas necesarias

3. Las notas obtenidas por 10 alumnos en Matemáticas y en Música son:

  a)  Calcula la covarianza y el coeficiente de correlación.


  b)  ¿Existe correlación entre las dos variables?
  c)  ¿Cuál será la nota esperada en Música para un alumno que hubiese
obtenido un 8,3 en Matemáticas?

Covarianza de una muestra

Definición

La covarianza de una muestra bidimensional es la media aritmética de los


productos de las desviaciones de cada una de las variables respecto a sus medias
respectivas. Es decir

La covarianza se suele representar por  . En algunas ocasiones también se


suele representar mediante  , aunque no es recomendable.

Otra manera equivalente de calcular la covarianza es


 

El resultado debe ser el mismo sin importar la fórmula utilizada —observa que el
producto   no se divide por  .

Interpretación y propiedades

La covarianza indica el sentido de la correlación entre las variables

Si   la correlación es directa.

Si   la correlación es inversa.

La covarianza presenta como inconveniente, el hecho de que su valor depende de


la escala elegida para los ejes.

Es decir, la covarianza variará si expresamos la altura en metros o en centímetros.


También variará si el dinero lo expresamos en euros o en dólares.

Ejemplos

Las notas de   alumnos de una clase en matemáticas y física son las siguientes:

Matemáticas Física
 

Hallar la covarianza de la distribución.

Después de tabular los datos hallamos las medias aritméticas:


 

Los valores de dos variables   e   se distribuyen según la tabla siguiente:

Hallar la covarianza de la distribución.

En primer lugar convertimos la tabla de doble entrada en tabla simple y


calculamos las medias aritméticas.

v
 

 
Fuente de información
https://estadisticalidia.com/tema-2-parte-1-medidas-de-tendencia-central/

https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/
ejercicios-y-problemas-de-estadistica-ii.html

También podría gustarte