Está en la página 1de 26

UNIDAD II.

Resumen de la información

 Análisis descriptivo y presentación de datos de una


sola variable.
 Datos: en serie simple o agrupados.
 Tablas de frecuencias.
 Tablas de doble entrada.
 Gráficos: de sectores, de barra, histograma, polígono
de frecuencias, de puntos. Usos para cada variable.
Estadística descriptiva.
 Es la rama de la estadística que se encarga de
recolectar, analizar y caracterizar un conjunto de
datos (edad, salarios, etc.). Mediante medidas de
resumen, tablas o gráficos describe las
características de este conjunto de datos

Nominales
Cualitativas
Ordinales
Tipos de
variables
Continuas
Cuantitativas
Discretas
presentación de datos de una sola variable. Datos:
en serie simple o agrupados

Los datos pueden presentarse en forma de serie simple o datos


agrupados (tablas de frecuencias).

Serie simple: es un conjunto de mediciones u observaciones


realizadas a una variable. Ejemplo: los siguientes datos
representan la edad (en años) de 10 personas.
5,3,4,15,20,8,9,10,13,17.

Nota: En este caso se trata de una sola variable, pues sólo se


tiene en cuenta la edad de las 10 personas y no se registra ningún
otro dato. Se trata de una serie simple porque los datos no se
presentan agrupados como se verá en las tablas de frecuencias.
Tablas de Frecuencias
(distribución de frecuencias)
 Es una tabla que muestra la distribución de los datos
mediante sus frecuencias (Absoluta, relativa, porcentual).
 Las tablas de frecuencias se utilizan como herramientas
para ordenar los datos, a través de estás tablas podemos
presentar numéricamente las características de un conjunto
de datos (muestra).
 Las tablas de frecuencias pueden presentarse en una serie
ordenada o agrupada en clases (intervalos).
Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Xi absoluta (fa) absoluta relativa relativa porcentual
acumulada (fr) acumulada (%)
(FAA) (FRA)
1 7 7 0,08 0,08 8

2 25 32 0,284 0,364 28,4

3 8 40 0,09 0,454 9

4 15 55 0,171 0,625 17,1

5 23 78 0,261 0,886 26,1

6 10 88 0,114 1 11,4

Total 88 1 100
Pasos para construir una tabla de frecuencias.
1.  En la primer columna (Xi), se ordenan de menor a mayor los
valores de la variable.
2. En la segunda columna (fa), se ubican los valores de las
frecuencias absolutas.
fa=es el número de veces que el valor de Xi está en la muestra.

La suma de las fa es igual a n


(n).

3. En la tercer columna (FAA), se ubican los valores de las


frecuencias absolutas acumuladas. Se calcula sumando los
valores de las fa menores o iguales a Xi
 
4. Enla cuarta columna (fr), se ubican los valores de las
frecuencias relativas. fr son las proporciones de los
valores de cada Xi.
donde n es el número total de elementos

5. En la quinta columna (FRA), se ubican los valores de


las frecuencias relativas acumuladas. Se calcula sumando
los valores de las fr menores o iguales a Xi.
FRA
 6.En la sexta columna (%), se ubican los valores de las
frecuencias porcentuales. Se obtiene multiplicando por
100 la cuarta columna.

Ejemplo: las notas que obtuvieron los estudiantes en un


examen de estadística se presentan a continuación.

Notas de estadística
7 6 5 4 3
10 8 8 3 6
6 4 7 5 5
5 4 7 7 4
4 3 9 9 8
1. ¿Cuál es el tamaño de la muestra?

2. ¿Cuál es la variable de interés y qué tipo de variable


es?

3. Construya la distribución de frecuencias.

4. ¿Qué gráfico es el adecuado para estos datos?

5. Realice el gráfico.
Solución.
1. El tamaño de la muestra es 25 (n=25).

2. X= nota en el examen de estadística. Se trata de una variable


cuantitativa discreta.

3. Para completar la tabla de frecuencias recordemos los pasos


anteriormente descritos.

Columna 1. (Xi). ordenamos todos los valores de la


variable(notas) Xi=3,4,5,6,7,8,9,10

Columna 2. (fa). se realiza el conteo de la variable que nos


interesa (notas).

fa(3)=3, fa(4)=5, fa(5)=4, fa(6)=3,


fa(7)=4, fa(8)=3, fa(9)=2, fa(10)=1.
columna 3. (FAA). Sumamos las frecuencias absolutas

Frecuencia Frecuencia
Xi absoluta (fa) absoluta
acumulada FAA(3)=3
(FAA) FAA(4)=3+5=8
3 3 3 FAA(5)=8+4=12
4 5 8 FAA(6)=12+3=15
5 4 12 FAA(7)=15+4=19
6 3 15 FAA(8)=19+3=22
7 4 19
FAA(9)=22+2=24
FAA(10)=24+1=25
8 3 22
9 2 24
10 1 25
Total 25
 Columna 4. (fr). proporciones de los valores de cada Xi.

Columna 5.(FRA). Sumamos las frecuencias relativas

FRA(3)=0,12 , FRA(4)=0,12+0,20=0,32, FRA(5)=0,32+0,16=0,48


FRA(6)=0,48+0,12=0,60, FRA(7)=0,60+0,16=0,76,
FRA(8)=0,76+0,12=0,88, FRA(9)=0,88+0,08=0,96,
FRA(10)=0,96+0,04=1

Columna 5. (%). Frecuencias porcentuales.

2*100=12
Frecuencia Frecuencia Frecuencia
relativa relativa porcentual
(fr) acumulada (%)
(FRA)
0,12 0,12 12
0,20 0,32 20
0,16 0,48 16
0,12 0,60 12
0,16 0,76 16
0,12 0,88 12
0,08 0,96 8
0,04 1 4
1 100

Finalmente se obtiene la siguiente tabla


Tabla de frecuencias para las notas del examen de
estadística
Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Xi absoluta (fa) absoluta relativa relativa porcentual
acumulada (fr) acumulada (%)
(FAA) (FRA)
3 3 3 0,12 0,12 12
4 5 8 0,20 0,32 20
5 4 12 0,16 0,48 16
6 3 15 0,12 0,60 12
7 4 19 0,16 0,76 16
8 3 22 0,12 0,88 12
9 2 24 0,08 0,96 8
10 1 25 0,04 1 4
Total 25 1 100
4. Para el ejemplo tenemos una variable cuantitativa discreta, el
gráfico que corresponde para este tipo de datos es un gráfico de
barras.

fa
2

0
3 4 5 6 7 8 9 10
notas

Tablas de frecuencias para datos agrupados en intervalos o clases

 
Para construir esta tabla sólo debemos modificar la primer columna, ya que
pondremos ahora los intervalos. Se agrega una columna más, que será la marca
de clase (mc)

donde Ls es el límite superior del intervalo


Li es el límite inferior del intervalo
 Las demás columnas se obtienen como antes

Ejemplo: Los siguientes datos representan la duración en días de una muestra


de auditorias de fin de año de 20 clientes de una empresa pequeña de
contadores públicos.
Auditoria anual
12 14 19 18 14
15 15 18 17 18
20 27 22 23 16
22 21 33 28 13

Antes de construir la tabla de frecuencias debemos determinar:

a) Número de clases (o cantidad de intervalos. Se recomienda usar entre 5 y


20 clases. Si se tiene pocos datos 5 clases está bien. Otra forma puede ser
sacando raíz cuadrada de los datos ≡5).

b) El ancho de cada clase( o amplitud del intervalo)


 
Ahora calculamos las marcas de clase (mc), partiendo de 10 como límite
inferior.

Con esto ya podemos armar la tabla, las demás frecuencias se calculan


como antes

Duración Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


de las mc absoluta absoluta relativa relativa porcentual
auditorias (fa) acumulada (fr) acumulada (%)
Xi (FAA) (FRA)

10-14 12 4 4 0,20 0,20 20


15-19 17 8 12 0,40 0,60 40
20-24 22 5 17 0,25 0,85 25
25-29 27 2 19 0,10 0,95 10
30-34 32 1 20 0,05 1 5
Total 20 1
1. ¿El 60% de las auditorias en cuántos días se hicieron y cuántas fueron?
2. ¿Cuál es el porcentaje de auditorias realizadas entre 30 y 34 días?
3. ¿En cuántos días se hicieron la mayor cantidad de auditorias?
4. ¿Cuál es el porcentaje de auditorias que se hicieron entre 25 y 34 días?
5. .Realice el gráfico respectivo.

SOLUCIÓN

1. Para responder esta pregunta debemos sumar las dos primeras filas de la
columna de las frecuencias porcentuales, es decir: 20+40=60. Pero como la
pregunta es sobre los días debemos ver el límite inferior de la primera clase
y el límite superior de la segunda clase. R/ el 60% de las auditorias se hizo
entre 10 y 19 días

2. Para responder esta pregunta nos ubicamos en el intervalo 30-34 y


observamos el valor en la columna de las frecuencias porcentuales. R/ Entre
30 y 34 días se hizo el 5% de las auditorias
3. Para responder esta pregunta nos ubicamos en la columna de las
frecuencias absolutas. R/ 8 auditorias se hicieron entre 15 y 19 días.
4. Para responder esta pregunta nos ubicamos en la columna %. Tomamos las
dos ultimas clases y las sumamos. R/ el 15% de las auditorias se hizo entre
25 y 34 días.
5. Histograma.

Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
Versión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
0,42 1,00
Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
Versión Estudia ntil0,88Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
0,32 Versión Estudia ntil0,75Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
frecuencia relativa

Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil

frec. rel. acumulada


Versión Estudia ntil0,63Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
0,21 Versión Estudia ntil0,50Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
0,38
Versión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
0,11 Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
0,25
Versión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
Ve rsión Estudia ntil Ve rsión0,13
Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
Versión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
0,00 Ve rsión Estudia ntil Ve rsión0,00
Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
5 10 15 20 24 29 34 39
Versión Estudia ntil 5 rsión10
Ve 15ntil 20
Estudia 24Estudia
Ve rsión 29 ntil 34Ve rsión
39 Estudia ntil Ve rsión Estudia
días de auditoria Ve rsión Estudia ntil Ve rsión Estudia ntil días
Ve rsión de auditoría
Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil
Versión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia ntil Ve rsión Estudia
Tablas cruzadas (tablas de contingencia)

Las tablas de contingencia (formas tabulares de presentar datos


categorizados) son útiles para el análisis simultáneo de dos o más variables
categorizadas. Una variable categorizada
es aquella en la cual la escala de medida consiste en un conjunto de
categorías, por ejemplo la variable tipo de vivienda puede ser categorizada
de acuerdo a las siguientes dos categorías “rural” y “urbana”. Balzarini et all. 2008

Hasta ahora se han estudiado variables unidimensionales (una variable),


calculando: frecuencias y graficando su distribución. Siempre vemos las
variables de forma aislada, pero esto no es habitual en la vida real, por
ejemplo:

• Calidad y precio en un restaurante.


• Ingresos y nivel educativo.
Ejemplo: en la siguiente tabla se presenta un total de 200 personas que
ingresaron a una tienda de equipos de sonido clasificados por sexo y edad en
años. (estadística aplicada a la administración 8ª edición )
Sexo
Edad Total
Hombre Mujer

Menor de 30 60 50 110
30 o más 80 10 90
Total 140 60 200

En el contexto de la tabla estos valores son frecuencias absolutas, los totales


por filas o columnas se llaman totales marginales y los valores de las celdas se
llaman frecuencias conjuntas.
ejemplo: ¿cuántas mujeres hay menores de 30 años, qué frecuencia es?
R/ Para responder esto nos ubicamos en la columna de mujeres y en la fila
menor de 30. La respuesta es 50, esta es una frecuencia conjunta.
¿Cuántos hombres hay en la muestra, qué frecuencia es?
R/ nos ubicamos en la columna hombre y vemos el total. La respuesta es:
en la muestra hay 140 hombres y es una frecuencia marginal.
Frecuencias relativas dobles (o frecuencias porcentuales)

Obtenemos una nueva tabla, parecida a la anterior pero en cada celda


dividimos por el total de la muestra, de esta manera obtenemos la tabla de
contingencia relativa al total.
Sexo
Edad Total
Hombre Mujer

Menor de 30 60/200=0,30 50/200=0,25 110/200=0,55

30 o más 80/200=0,40 10/200=0,05 90/200=0,45

Total 140/200=0,70 60/200=0,30 200/200=1

Frecuencias marginales: 0,70; 0,30; 0,55; 0,95


Frecuencias conjuntas: 0,30; 0,25; 0.40; 0,05

¿Para qué sirven las frecuencias relativas doble respecto al total ?

Se usa para saber la proporción o porcentaje de individuos respecto al total


de la muestra.
Ejemplo: * ¿ Qué porcentaje de hombres hay de 30 o más años?

R/ Observemos la columna de hombre y la fila de 30 o más. Para obtener


el porcentaje multiplicamos el valor de la celda por 100. la respuesta es: el
40% de los hombres tiene 30 o más años.

* ¿ cuál es la proporción de mujeres ?


R/ Observemos la columna de mujeres y nos fijamos en el total, este valor
lo multiplicamos por 100. La respuesta es: en la muestra el 30% son
mujeres.

Frecuencias condicionales por filas y columnas


Para el ejemplo, si se divide los valores de las celdas por el total de cada fila se
obtienen las distribuciones de frecuencias relativas por filas o porcentuales de
la variable edad.

Y si se divide los valores de cada celda por el total de cada columna se obtiene
las distribuciones de frecuencias relativas por columnas o porcentuales de la
variable sexo.
Frecuencia relativa por filas

Sexo
Edad Total
Hombre Mujer

Menor de 30 60/110=0,55 50/110=0,45 110/110=1

30 o más 80/90=0,89 10/90=0,11 90/90=1

Total 140/200=0.70 60/200=0,30 200/200=1

Recordemos que esta tabla se construyó con las frecuencias por filas
que corresponden a la variable edad en años, por tanto se analiza solo
para esta variable.

Ejemplo: Entre las personas menores de 30 años hay un 55% de


hombres y el 45% restante son mujeres.
* Entre las personas de 30 o más años el 89% son hombres y el
11% son mujeres.
Frecuencia relativa por columnas
Sexo
Edad Total
Hombre Mujer

Menor de 30 60/140=0,43 50/60=0,83 110/200=0,55

30 o más 80/140=0,57 10/200=0,17 90/200=0,45

Total 140/140=1 60/60=1 200/200=1

Recordemos que esta tabla se construyó con las frecuencias por


columnas que corresponden a la variable sexo, por tanto se analiza solo
para esta variable.

Ejemplo: De los hombres el 43% tienen menos de 30 años.


* De las mujeres el 83% tienen menos de 30 años.
Nota: La diferencia en la forma de concluir respecto a las frecuencias
relativas dobles o frecuencias relativas por filas o columnas está en que en la
primer tabla siempre se hace la conclusión respecto a toda la muestra (total
fila y total columna en nuestro ejemplo es 200), mientras que las otras
conclusiones se hacen respecto al total por fila o total por columna.

¿Qué gráfico usar?


Para responder esto recordemos que las tablas de contingencia es la relación
de dos variables cualitativas, por tanto se puede hacer un gráfico de barras,
barras apiladas o gráfico de tortas (o sectores).

81 80 100,0
(11,1%)
73
(45,5%)
Edad menor de 30
Porcentajes acumulados

65 60 Edad 30 o más
75,0
57 (11%)
50
49 (45%)
50,0
40
32 (54,5%) (88,9%)

24 25,0

16 (89%)
10 (55%)
8 0,0
Menor de 30 30 o más menor de 30 30 o más Hombre Mujer
Edad Edad
Hombre Mujer
Hombre Mujer

También podría gustarte