Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Baldeón Sofía Actuación en Clase
Baldeón Sofía Actuación en Clase
Son los valores que los encuestados no contestan, por ejemplo, cuando se le pregunta su nivel de
ingreso se niegan a contestar o cuando el entrevistador no recoge una repuesta en la casilla adecuada
o cuando no está disponible cierta información.
Las consecuencias para la investigación de la existencia de los valores perdidos dependen del patrón
que sigan estos datos ausentes, cuando son y porque están perdidos, el patrón de los valores perdidos
es mas importantes que su cuantía.
Si su distribución es aleatoria en la matriz de datos no pueden causar mucho daño al análisis, sin
embargo, si responden a un patrón determinado si puede causar mucho daño al análisis.
CASO PRACTICO
Un investigador desea saber cuál es la actitud de los jóvenes hacia el tabaco, para ello les piden que
expresen su acuerdo o desacuerdo con un conjunto de afirmaciones, la escala de respuesta es (1 Estoy
totalmente de desacuerdo: 2 Estoy desacuerdo; 3 Ni de acuerdo ni en desacuerdo; 4 Estoy de acuerdo;
5 Estoy en total de acuerdo, además se realizan otras clasificaciones como son: Edad, género y al
hábito (si es o no fumador). En la siguiente tabla de datos se recoge un conjunto de respuestas
simuladas a este cuestionario donde la pregunta V4 deben aumentarse los impuestos sobre el tabaco
se le ha dividido en dos variables V4a asignado aleatoriamente y V4b que responden a valores
perdidos que siguen un patrón.
Los fumadores se niegan a contestar en mucha mayor medida que los NO fumadores porque pueden
pensar que la opinión dicha en la encuesta puede tener alguna influencia en la administración y puede
tener una subida de precio.
El objetivo del investigador es determinar cuál es el nivel de acuerdo con la medida de que suban los
impuestos sobre el tabaco.
Se trata de averiguar cuál de las variables ha sido asignado aleatoriamente los valores perdidos o cual
de las variables corresponden a valores perdidos generados sistemáticamente o que responden a un
patrón en este caso fumadores.
Primero Método
En este caso la variable que tiene mayor media aritmética es la V4b=3,43, por lo tanto, se dice que los
valores perdidos correspondientes a un patrón a esta variable son valores perdidos generados
sistemáticamente, que corresponden a un patrón en este caso fumadores y esta variable, si va a influir
en mi investigación, por lo que, no debo tomarlo en cuenta en el análisis.
SEGUNDO MÉTODO
Utilizando la prueba T
Regla de decisión
En nuestro caso el valor de la significancia es 0,538 que es mayor que el 5%=0,05. Entonces en
conclusión si el valor de la significancia bilateral es mayor que el 5% = 0,05
Entonces se acepta la hipótesis nula, se rechaza la hipótesis alterna esto quiere decir que las medias
aritméticas comparadas son iguales, por lo tanto, la variable de agrupación V4a no va a influir en mi
investigación, le mantenemos en la base de datos y corresponde a valores perdidos agrupados
aleatoriamente.
Para la variable V4b
En nuestro caso el valor de la significancia es 0,007 que es mayor que el 5%=0,05. Entonces en
conclusión si el valor de la significancia bilateral es menor que 5%= 0,05
Entonces se rechaza la hipótesis nula, se acepta la hipótesis alterna esto quiere decir que las medias
aritméticas comparadas NO son iguales, por lo tanto, la variable de agrupación V4a SI va a influir en
mi investigación, NO le mantenemos en la base de datos y corresponde a valores perdidos agrupados
sistemáticamente. Corresponde a un patrón en este caso fumadores.
En donde existan valores perdidos en cada una de las variables hay que remplazarle para la variable
V1
Para la variable V1 hay que remplazarle por el valor de 4,67 que es el que más se repite para la
variable V1. V2 reemplazarlo por 4,19. V3 reemplazarlo 3,80; V4a por 2,92.
Entonces esos son los métodos que se utilizan los procedimientos por listas o por parejas.
Para la variable V4a vamos a buscar los valores con los cuales tenemos que reemplazar los valores
perdidos
Coeficientesa
Coeficientes no Coeficientes
estandarizados estandarizados
Modelo B Desv. Error Beta t Sig.
1 (Constante) 𝛽0 =-,016 3,670 -,004 ,997
Fumar perjudica la salud =V1 𝛽1 = ,137 ,255 ,091 ,539 ,596
Alos poderes públicos solo les interesa 𝛽2 =-,372 ,234 -,304 -1,591 ,128
recaudar impuestos= V3
Deben informarse más sobre los efectos 𝛽5 =,926 ,377 ,472 2,457 ,024
del tabaco= V5
Edad= C1 𝛽6 =-,021 ,142 -,025 -,145 ,886
a. Variable dependiente: Deben aumentarse los impuestos sobre el tabaco
V4a= B0 + B1 * V1 + B3 * V3 + B5 * V5 + B6 * C1
MODELO PARTICULAR
V4a= 3,37
Para la fila 10
V4a= 1,89
Son aquellos casos para los que una o dos o múltiples variables toman valores extremos o
anómalos que los hacen diferir del comportamiento del resto de la muestra.
Elementos muestrales lógicos podría ser un individuo de 14 años, u sujeto con un doctorado,
pero un sujeto de 14 años con un doctorado será, casi con toda seguridad un caso atípico.
Caso Práctico Retribución de altos directivos
Un investigador desea saber cuales son las causas que explican la distinta remuneración de
los altos directivos de las empresas. Dispone de una base de datos de 100 altos directos cuyas
características se sintetizan a continuación.
Regla de Decisión
1. Si los datos son menores a 80, en la línea de referencia ponemos 2,5, y los valores de
Z mayores a 2,5 son los valores atípicos.
2. Si los datos son mayores a 80, en la línea de referencia ponemos 3 o 4, y los valores
de Z mayores a 3 o 4 son valores atípicos.
Estadísticos descriptivos
Desv.
N Mínimo Máximo Media Desviación
Edad del directivo 100 37 74 56,93 6,178
N válido (por lista) 100
Interpretación
ZEDAD= -3,336, es menor a 3 por lo tanto es un caso atípico, y por lo tanto
corresponde a un edad EDADSYS= 37
SEGUNDO MÉTODO
Interpretación
ZSYS= -3,226, es menor a 3 por lo tanto es un caso atípico, y por lo tanto corresponde
a un sueldo EDADSYS= 37