Está en la página 1de 3

SOLUCIÓN ej. 1 Tema 2.

Análisis univariante

Ej. 1.- Se quiere conocer el sueldo medio de los vecinos de un barrio de A Coruña que tienen
actualmente trabajo. Para ello se realiza una encuesta a pie de calle a 10 vecinos, obteniéndose
los siguientes resultados: 1600, 1200, 1850, 970, 570, 2450, 1000, NS/NC, 1000, 1100, que se
han almacenado en un libro Excel. Responde a las siguientes preguntas razonando las
respuestas.

a) ¿La fuente de datos es primaria?


Sí, porque se recopila específicamente para el estudio.
b) ¿La fuente de datos es interna?
No, porque la población no forma parte de la organización que realiza el estudio.
c) ¿El método de recogida de los datos es la observación?
No, es una encuesta.
d) ¿Los datos se han almacenado en una base de datos?
No, en un fichero digital.
e) ¿Cuál es la población de estudio?
Los vecinos del barrio de A Coruña que tienen empleo actualmente.
f) ¿Será un estudio de Estadística Descriptiva o de Inferencia Estadística?
De inferencia estadística, porque la población de estudio es mayor que la de los datos
(sólo disponemos de datos para 10 vecinos).
g) ¿Cuál es la tipología de la variable recopilada?
Cuantitativa continua (los sueldos)
h) Tabula los datos
Se hará con la variable recortada de los datos faltantes, es decir, sin la respuesta NS/NC:

X
1600
1200
1850
970
570
2450
1000
1000
1100

i) Haz una partición de los datos en tres subpoblaciones con igual número de datos
No puede hacerse con el mismo número de datos para cada subpoblación:
(570,1000] incluye los datos 570, 970, 1000, 1000
(1000,1200] incluye 1100, 1200
(1200,2450] incluye 1600, 1850, 2450
j) Agrega la variable utilizando la partición anterior. ¿Cuál es la tipología de esta
variable?
Al agrupar los datos en intervalos la variable pasa a ser cualitativa ordinal. Si se agregan
las particiones del apartado i) habría que agrupar dichos en intervalos en intervalos más
amplios, con mayor número de datos cada uno.
k) Si queremos calcular el sueldo medio de los vecinos encuestados que cobran más de
1000€, ¿qué técnica de preparación de datos tendríamos que realizar? ¿Cambiaría la
tipología de la variable? ¿Cambiaría la población?
La técnica sería el filtro horizontal. No cambiaría el tipo de la variable condicionada. Sí
cambiaría la población ya que ahora sería una subpoblación condicionada a la del
estudio (solo aquellos vecinos del barrio que trabajan y cobran más de 1000€).

l) Si queremos que los datos estén en miles de euros, ¿qué técnica de preparación de
datos tendríamos que utilizar? ¿Cambiaría la tipología de la variable? ¿Cambiaría la
población?
La nueva variable sería: Y= (1/1000) * X, la técnica es la transformación de la variable
cuantitativa mediante un cambio de escala.
No cambiaría ni el tipo de variable ni la población, sólo las unidades.

m) ¿Es necesario codificar los datos?


No, porque es una variable cuantitativa.

n) ¿Hay datos faltantes?, en caso afirmativo, ¿qué propondrías?


Sí, la respuesta NS/NC. Habría que calcular los estadísticos recortados (sin ese dato).

o) ¿Hay datos atípicos?, en caso afirmativo, ¿qué propondrías?


Ordenando los datos de menor a mayor y sin tener en cuenta el dato faltante:

𝑥𝑖 𝑛𝑖 𝑁𝑖
570 1 1
970 1 2
1000 1 3
1000 1 4
1100 1 5
1200 1 6
1600 1 7
1850 1 8
2450 1 9
N=9

Calculamos el recorrido intercuartílico (RI):

𝑟∙𝑁 1∙9
𝐶1 ; = =; 𝑁𝑖 ≥ 2.25; 𝑁3 = 3 > 2.25; 𝑥3 = 1000; 𝐶1 = 1000€
4 4

𝑟∙𝑁 3∙9
𝐶3 ; = =; 𝑁𝑖 ≥ 6.75; 𝑁7 = 7 > 6.75; 𝑥7 = 1600; 𝐶3 = 1600€
4 4

𝑅𝐼 = 𝐶3 − 𝐶1 = 1600 − 1000 = 600

Calculamos las barreras interiores (BI), tanto la inferior (I) como la superior (S):

𝐵𝐼(𝐼) = 𝐶1 − 1.5 ∙ 𝑅𝐼 = 1000 − 1.5 ∙ 600 = 100€


𝐵𝐼(𝑆) = 𝐶3 + 1.5 ∙ 𝑅𝐼 = 1600 + 1.5 ∙ 600 = 2500€

Por tanto, se consideran atípicos sueldos por debajo de los 100€ o que superen
los 2500€. En este caso no hay datos atípicos por lo que no necesitamos calcular las
barreras exteriores (inferior y superior) para ver si hay datos atípicos extremos.

Si se detectasen datos atípicos la solución sería calcular parámetros recortados


(como la media recortada) o robustos (como la mediana).

También podría gustarte