Está en la página 1de 35

RECOLECCION DE DATOS

La recolección de datos proporciona la materia prima para el proceso estadístico. La


veracidad de los resultados depende de la calidad de los datos que se recolecten. A menudo
esta actividad de recolección es la que consume mayor tiempo y costo, por lo que es lógico
concluir que es muy importante planearla y ejecutarla adecuadamente.
La recolección de datos implica tres actividades:
o Seleccionar o desarrollar un instrumento de medición.
o Aplicar ese instrumento de medición
o Codificar las mediciones obtenidas para su análisis.

FUENTES DE INFORMACION
Una fuente de

Los datos pueden reunirse a partir de fuentes de información existentes o pueden obtenerse
mediante encuestas y estudios experimentales diseñados para conseguir nuevos datos. Las
fuentes de información pueden ser:

Primarias Secundarias
Información que se obtiene Información elaborada a base de
directamente de la Unidad datos de las fuentes primarias
de observación

Fuentes de datos
internos. Reportes Financieros,
Informes, Análisis o
Reporte de operaciones,
aquellas que la empresa puede comparaciones sobre reportes
obtener y explorar por sus planificación, reportes
anteriores de la empresa
propios medios y recursos sin especiales, etc
necesidad de acudir a terceros

1
Fuentes de datos Análisis o informes basados en
Informes de Estudio de
externos los reportes del INEI,
mercado, estudio de
Información que están situadas Ministerios u otras entidades
fuera de la empresa cuya posicionamiento,
que genera información
información puede obtenerse a Reportes del INEI
estadística
través de diferentes medios

TECNICAS E INSTRUMENTOS DE RECOLECCION


DE DATOS

ENCUESTA

ENCUES OBSERV
TA ACIÓN

ENTRE ANÁLIS
VISTA IS
DOCUM
ENTAL

 Desde el inicio de la investigación se hace necesario decidir sobre el enfoque a


utilizar, lo que determina las características de todo el estudio.
 Un buen instrumento determina en gran medida la calidad de la información, siendo
esta la base para las etapas subsiguientes y para los resultados.
 La metodología utilizada en la recolección de datos debe definir el tipo de información
requerida (cuantitativa, cualitativa o ambas).
 Método: Representa la estrategia o camino a través del cual se establece la relación
entre el investigador y el consultado para la recolección de los datos, se citan la
observación y la encuesta.

2
 Técnica: conjunto de reglas y procedimientos que permiten al investigador establecer
la relación con el objeto o sujeto de la investigación.
 Instrumento: mecanismo que usa el investigador para recolectar y registrar la
información; formularios, pruebas, test, escalas de opinión, listas de chequeo.
 Las principales técnicas de recolección de datos son:
 La encuesta
 La entrevista
 La observación (no experimental y experimental)
 El Análisis documentario

1. LA OBSERVACION
Es el registro visual de lo que ocurre en una situación real, clasificado y consignando
los datos de acuerdo con algún esquema previsto y de acuerdo al problema que se
estudia.
VENTAJAS DESVENTAJAS
 Permite obtener datos cuantitativos y  Se requiere de mucha habilidad
cualitativos. y agudeza para “ver” los
 Se observan características y fenómenos estudiados.
condiciones de los individuos.  Demanda gran cantidad de
 También conductas, actividades, tiempo.
características o factores ambientales.  Tiene sesgos; el humano ve lo
 Puede ser utilizada en cualquier que quiere ver.
investigación y área del saber.  Al momento de la interpretación
 Es un método que no depende de pueden distorsionrse los hechos
terceros o de registros; con ello se e ir más allá de lo que vimos en
eliminan sesgos y ambigüedades. realidad.

PARA REDUCIR LOS PROBLEMAS SE UTILIZA


 Definir claramente los objetivos perseguidos.
 Determinar claramente la unidad de observación.
 Registrar las condiciones en que se asumirá la observación y las conductas

LOS ERRORES MAS COMUNES EN LA OBSERVACION


 Los fenómenos a observar no se dan de la misma manera en todos los sujetos

3
de observación.
 Cuando el observador tiene ideas prejuiciadas.
 Cuando el instrumento no es válido o es poco exacto o está mal definido.

TIPOS DE OBSERVACION

CLASES TIPOS CARACTERISTICAS

 El investigador se involucra total o


parcialmente con la actividad objeto de
investigación.
Observación
 La observación se hace desde el interior del
Participante
grupo.
Según el
 Pueden intervenir las emociones del
Nivel de
investigador.
participación
 El investigador no se involucra en la
Observación actividad objeto de estudio.
NO  Los datos pueden ser más objetivos.
Participante  Al no integrarse al grupo los datos pueden no
ser exactos, reales y veraces.
 Cuando el investigador se pone en contacto
Según la Observación
personalmente con el hecho o fenómeno que
forma de Directa
se quiere investigar
registrar la
Observación  A través de filmadoras u otro medios
conducta
Indirecta audiovisual
Según la  El investigador utiliza lineamientos generales
Planificación parta observar y luego escoge lo que estima
de la Simple o No relevante a los efectos de la investigación
observación estructurada propuesta.
 Fundamentalmente usada para estudios
exploratorio
Sistemática  El investigador dispone de un instrumento
o estructurado y estandarizado para medir las

4
Estructurada variables en estudio (lista de cotejos, etc).

2. LA ENTREVISTA
Es la comunicación interpersonal establecida entre el investigador y el sujeto de
estudio a fin de obtener respuestas verbales a las interrogantes planteadas sobre el
problema propuesto.

VENTAJAS
 Es aplicable a toda persona, (incluyendo a con limitaciones física o
psicológica).
 Permite estudiar aspectos psicológicos o de otra índole donde se desee
profundizar en el tema.
 Permite obtener información más completa,
 A través de ella el investigador puede: Aclarar el propósito del estudio,
especificar claramente la información que necesita, aclarar preguntas y permite
usar triangulación.
Permite captar mejor el fenómeno estudiado ya que permite observar lenguaje
no verbal.

TIPO DE ENTREVISTAS
1. ENTREVISTA ESTRUCTURADA
 Se elabora un formulario estandarizado.
 Idénticas preguntas y en el mismo orden a todos los sujetos.
 Los sujetos eligen la respuesta de 2, 3 o pocas más alternativas.
 Los comentarios y explicaciones son los mismos para todos.
VENTAJAS DESVENTAJAS
 Respuestas cortas y precisas.  La información puede ser muy
 Información fácil de procesar. superficial.
 El entrevistador no requiere  Limitada la posibilidad de
gran entrenamiento. profundizar en un aspecto

5
 Información uniforme. determinado.
 Difícil obtener información
confidencial.
2. ENTREVISTA NO ESTRUCTURADA
 Es flexible y abierta, pero regida por los objetivos de la
investigación.
 Las preguntas, su contenido, orden y formulación es controlado por
el investigador, el que puede adaptarlas dependiendo de las
situaciones y características de los sujetos en estudio.
 El entrevistado también cuenta con libertad para dar sus respuestas.
 Se utiliza un instrumento guía que contiene las orientaciones de los
temas a tratar.
 Muy útil para estudios exploratorios, descriptivos y cualitativos
VENTAJAS DESVENTAJAS
 Adaptable y aplicable  Requieren mucho tiempo.
a toda clase de  Muy costosos por el tiempo de las
sujetos en diversas entrevistas.
situaciones.  Limitado para personas con problemas de la
 Permite profundizar palabra.
en los temas de  Dificultad para tabular datos que han sido
interés. recopilados de distinta forma.
 Orienta posibles  Se requiere crear confianza y comodidad
hipótesis y variables entre el entrevistado y el entrevistador.
cuando se exploran  Se requiere habilidad técnica para obtener
áreas nuevas. la información y mayor conocimiento
respecto del tema.
 Debido a que son entrevistas en
profundidad habitualmente se utilizan
muestras pequeñas.

CONSIDERACIONES PARA LAS ENTREVISTAS


Para evitar el rechazo o atrasos al aplicar entrevistas:
 Establecer los contactos necesarios para el buen fin de las entrevistas.

6
 Entrevistador debe estar bien capacitado.
 El entrevistador debe establecer una buena comunicación con el
entrevistado, uso de vestuario adecuado, lenguaje adecuado, escuchar
adecuadamente, no apresurar al entrevistado, etc.
 Buen registro de la información a fin de poder interpretarla adecuadamente.
 El entrevistador debe:
 Dejarle un mensaje positivo al entrevistado.
 Jamás dar consejos,
 Jamás hacer juicios morales,
 Jamás rebatir al entrevistado.

3. LA ENCUESTA
 Método que utiliza un formulario impreso, destinado a obtener respuestas
sobre el problema en estudio y que el sujeto investigado llena por sí mismo.
 La encuesta puede aplicarse a grupos o individuos estando presente el
investigador. Incluso puede enviarse por correo a los destinatarios.
 Algunos instrumentos utilizado en la encuesta son: EL CUESTIONARIO, TEST
– FORMULARIOS - PRUEBAS

VENTAJAS DESVENTAJAS
 Costo relativamente bajo.  Es poco flexible, la información
 Proporciona información sobre no puede variar ni profundizarse.
un mayor número de personas  Si el cuestionario se envía por
en un período breve. correo, es posible que no sean
 Fácil para obtener, cuantificar, devueltos o que no se obtengan
analizar e interpretar datos. respuestas.
 Menores requerimientos de  No utilizable en personas que no
personal capacitado. saben leer ni escribir.
 Mayor posibilidad de mantener  No permite aclarar dudas.
anonimato de los encuestados.  Resulta difícil obtener
 Eliminación de los sesgos que cuestionarios completamente

7
introduce el encuestador. contestados.
 Se deben obtener grandes
muestras.

4. ANALISIS DOCUMENTARIO

 Este tipo de investigación es la que se realiza apoyándose en fuentes de carácter


documental (documentos que se encuentran en los archivos, como cartas, oficios,
circulares, expedientes, etc).

 Consiste en seleccionar las ideas informativamente relevantes de un documento a


fin de expresar su contenido sin ambigüedades para recuperar la información
contenida. Esta representación puede ser utilizada para identificar el documento e
identificar su contenido o para servir de sustituto del documento.

III. EJERCICIOS

3.1. De los siguientes incisos, ¿cuáles representan variables discretas y cuáles variables
continuas?
a) El número de acciones vendidas por día en la bolsa de valores.
b) Las temperaturas registradas cada media hora en un observatorio.
c) El tiempo de vida de baterías de equipos celulares con cámara y MP3.
d) El ingreso anual de los profesores universitarios.
e) La longitud de 1000 tornillos producidos por una fábrica.

3.2. Establece una correspondencia entre las variables indicadas y la clasificación que se
muestra a continuación:
VARIABLES   CLASIFICACION
1 El peso y la talla     A Cualitativa – Nominal.
Ciclos de estudios de una carrera Dependiente, independiente
2     B
profesional – Bidimensional.

8
Cuantitativa discreta –
3 El ingreso familiar en soles     C
Unidimensional.
Lugar de nacimiento de los
4     D Cualitativa – Ordinal.
estudiantes de la UCV
La raza y la religión del padre de los Cualitativa, cualitativa –
5     E
pobladores de una ciudad Bidimensional.
El Nº de libros que tiene cada una de Cuantitativa continua –
6     F
las universidades del Perú Razón.

3.3. Indica a qué clase de variable: por su naturaleza y por su escala de medición,
pertenece cada uno de los siguientes casos:
a) Cantidad de hombres y mujeres en un aula de clase.
b) La edad (en años cumplidos) de los estudiantes de la UCV.
c) Grado de instrucción de los PPFF de los alumnos de un centro educativo.
d) El nivel de autoestima.
e) Etapas del desarrollo.
f)Coeficiente intelectual.

3.4. Proporciona una definición operacional en cada uno de los siguientes casos:
a) Un buen trabajador b) Un bonito día
c) Un servicio de atención rápido d) Tiempo de estudio
e) Número de personas en el hogar f) Un buen estudiante

3.5. Un investigador que está estudiando hábitos de consumo le pregunta a cada vigésima
persona que entra en un supermercado acerca del número de veces que va de
compras semanalmente
a) Si la persona encuestada responde 2, ¿esta respuesta es una muestra, variable,
medida estadística, parámetro o dato? ¿La respuesta es un valor cuantitativo o
cualitativo?, ¿porqué?
b) A la persona encuestada también se le pregunta por su edad, estado civil e
ingresos y responde: 32, soltero, S/. 1500 respectivamente. Identifique los
elementos de cada uno de estos datos.

9
3.6. Propón las técnicas e instrumentos que se podrían utilizar en la recolección de datos
para responder las preguntas que se presentan a continuación y explica la razón de su
elección.
a) ¿Cuál es la opinión de los estudiantes de la universidad sobre la actual política
educativa?
b) ¿Qué opinan los residentes de una urbanización y del Consejo Territorial
correspondiente, sobre la seguridad ciudadana en dicha urbanización?
c) ¿Cuáles son los niveles de desempeño del docente y de rendimiento de los
alumnos del curso de Estadística General de la UCV?
d) ¿Existe relación entre el nivel de autoestima de los trabajadores de una empresa y
su nivel de satisfacción en el trabajo?
e) ¿Cuál es la opinión de los decanos de las facultades sobre las fortalezas y
debilidades de la investigación científica en la universidad y sus causas?
f)¿Cuáles son los tiempos promedio de espera y de atención de los clientes de un
banco en las colas que se forman en las ventanillas y la opinión al respecto?
g) ¿Cuál es la opinión de los residentes en el distrito de Salaverry sobre la calidad del
agua potable y la calidad de atención al cliente?
h) ¿Cuál es el pronóstico de las ventas de una empresa para los años 2009 y 2010,
teniendo en cuenta las ventas durante los últimos diez años?
i) ¿Cuál es el desgaste de los rodamientos de cierto tipo de máquinas y su relación con
el tipo de aceite que se utiliza para lubricarlas?
j) ¿Cuál es la opinión de las autoridades del sector turismo del departamento de la
Libertad sobre cómo incrementar el flujo de turistas nacionales y extranjeros hacia
el departamento?

3.7. Un profesor está interesado en analizar la relación entre el rendimiento académico de


los estudiantes de un examen con otras variables como edad, género, escuela, tiempo
de estudio fuera de clase, tiempo de diversión fuera de clase, otras actividades que
realiza fuera de clase, método de estudio, etc. Algunas de las preguntas o ítems del
primer cuestionario que elabora como instrumento para recolectar los datos son:
1) Edad 4) ¿Cuántas horas a la semana
2) Género dedica al estudio, fuera de clases?
3) Escuela a la que pertenece 5) ¿Además de estudiar, realiza otro
tipo de trabajo?

10
6) ¿Cuántas horas a la semana dedica a 9) ¿Cuál es el método de estudio que
trabajar, además de estudiar? utiliza?
7) ¿Realiza actividades de diversión? 10) ¿Cuál es tu estrato socio-económico?
8) ¿Cuántas horas a la semana dedica a
divertirse?

11
ACTIVIDADES DE REFORZAMIENTO

4.1. Propón la técnica e instrumento de recolección de datos que se podrían utilizar para
lograr los siguientes objetivos.

Objetivos Técnicas Instrumentos

Conocer la opinión de los estudiantes universitarios


sobre la política económica del gobierno

Conocer la opinión de los gerentes de las


entidades financieras sobre las últimas “medidas”
del gobierno en su sector.

Estimar el número promedio de automóviles por


hora que pasan por el cruce de dos avenidas y el
tiempo promedio entre llegadas

Evaluar el cumplimiento de las normas en el


otorgamiento de préstamos para vivienda en una
entidad financiera

Analizar si existe relación entre el nivel de


autoestima y el rendimiento académico de los
estudiantes de una facultad

12
REGRESIÓN LINEAL
Cuando la línea de regresión se asemeja a una recta (regresión lineal), puede ajustarse a
esta forma geométrica por medio de un método general conocido como método de los
mínimos cuadrados. La recta de ajuste tendrá por ecuación:

Y = β0 + β 1 X

Vamos a llamar a “X: VARIABLE INDEPENDIENTE o EXPLICATIVA”, y a la otra la


llamaremos “Y: VARIABLE DEPENDIENTE o EXPLICADA”.

Donde los coeficientes β0 y β1 se calculan teniendo en cuenta que:


 La recta debe pasar por el punto ( ).
 La separación de los puntos de la gráfica de dispersión con respecto a la recta de
regresión debe ser mínima.

13
CÁLCULO DE LOS COEFICIENTES β0 y β1:

Cov(x , y)
1° Cálculo de β1: β 1=
V (x)
2° Cálculo de β0: β 0=Y −β 1 X
Donde:
n

∑Yi: Media Aritmética de Y.


Y = i=1
n
n

∑ Xi : Media Aritmética de X.
i =1
X=
n

CORRELACIÓN (r)
El coeficiente de correlación (r) mide el grado de relación lineal (intensidad) de la relación
entre dos variables cuantitativas. El coeficiente r puede tomar valores entre -1.00 y 1.00.
Básicamente, esta información se refiere a dos características de la relación lineal: la
dirección o sentido y la cercanía o fuerza.

Correlación
Correlación nula
Correlación
perfecta perfecta
negativa Positiva
-1 0 1
Fuerte Débil Débil Fuerte
Negativa Negativa Positiva Positiva

14
 Es importante notar que el uso del coeficiente de correlación sólo tiene sentido si la
relación a analizar es del tipo lineal. Si ésta no fuera no lineal, el coeficiente de
correlación sólo indicaría la ausencia de una relación lineal más no la ausencia
de relación alguna.

El coeficiente de correlación se expresa como:


Cov ( x , y ) SC xy
R= =
σx σy √ ( SC x )( SC y )
Donde:

(∑ )(∑ )
n n
Xi Yi
n : Suma Cruzada de X e Y.
SC xy=∑ X i Y i −
i=1 i=1

i=1 n

(∑ )
n 2

Xi
n : Suma de Cuadrados de X.
SC x =∑ X i − 2 i=1

i=1 n

(∑ )
n 2

Yi
n : Suma de Cuadrados de Y.
SC y =∑ Y i − 2 i=1

i=1 n

Correlación negativa perfecta (r=-1) Correlación Positiva perfecta (r=1)

15
Correlación Nula

Correlación Positiva Fuerte

16
EL COEFICIENTE DE DETERMINACION “R2”
El coeficiente de determinación, r2 - la proporción de la variación total en la variable
dependiente Y que está explicada por o se debe a la variación en la variable independiente
X. El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma
valores de 0 a 1.

El objetivo principal del análisis de regresión es proyectar el valor de la variable dependiente


conociendo o suponiendo valores para la variable independiente. La confiabilidad de las
proyecciones está dada por la confiabilidad de la ecuación, la cual se mide a través del
coeficiente de determinación y de los errores de los coeficientes de regresión.

Una vez ajustada la recta de regresión a la nube de observaciones es importante disponer


de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste
lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad
del ajuste se utiliza el coeficiente de determinación, definido como sigue:

R %=( R ) ×100
2 2

17
Donde:
R: Coeficiente de Correlación.

EJERCICIOS

Después de haber leído la bibliografía básica propuesta en el punto 2.1, resuelve los
siguientes ejercicios:

1. Para cada uno de los siguientes conjuntos de datos bivariantes graficar sus
correspondientes diagramas de dispersión de puntos. ¿Qué tipo de relación
funcional, cree usted, se podría ajustar mejor a los datos?, ¿Por qué?

X 5 10 8 19 14 19 15 15 25 20 20
a)
Y 2 7 13 14 15 16 10 5 7 10 5

X 3 6 5 1 4 2 3 7 4
b)
Y 16 14 12 8 18 11 11 5 20

X 6 2 1 4 1 3 4 1 3 2 4
c)
Y 10 16 14 10 16 13 11 15 14 14 12

X 6 14 15 18 10 16 14 12 18 17
d)
Y 8 11 16 17 11 14 13 10 14 18

2. Se realiza un estudio para determinar el efecto de la reducción de las horas de sueño


sobre la habilidad para resolver problemas sencillos. La reducción de las horas de
sueño es de 8, 12, 16, 20 y 24 horas sin dormir. En el estudio participaron un total
de 10 individuos, con dos en cada nivel de reducción. Después de su período
específico de reducción de horas de sueño, cada individuo fue sometido a un
conjunto de problemas simples de suma, observándose el número de errores. Los
resultados fueron:

18
Número de errores (Y) 8, 6 6, 10 8, 14 14, 12 16, 12
Reducción de horas de 8 12 16 20 24
sueño (X)

a) Grafica el diagrama de dispersión de puntos.

b) Encuentra la recta de mínimos cuadrados apropiada para estos datos.

c) En el diagrama de dispersión de puntos, grafica la recta de mínimos


cuadrados.

d) Interpreta los coeficientes de regresión.

3. Los gastos semanales de publicidad y las ventas semanales de una empresa, en


dólares, para una muestra de diez semanas son:

Gastos
semanales de 41 54 63 54 48 46 62 61 64 71
publicidad
Ventas 1250 1380 1425 1425 1450 130 1400 1510 1575 1650
semanales 0

a) Establece la recta de regresión de mínimos cuadrados que permita predecir las


ventas semanales en función de los gastos en publicidad.

b) Representa gráficamente los puntos y la recta de mínimos cuadrados. Comenta.

c) Interpreta la pendiente de la recta de regresión.

d) Pronostica las ventas para gastos semanales de publicidad de 50 y 60 dólares.

e) ¿Cuáles son los errores de estimación cuando se predice las ventas semanales
para gastos semanales de publicidad de 61, 62 y 63 dólares respectivamente?

4. Las calificaciones en un examen de estadística y el número de horas de estudio para


el examen, de una muestra de doce estudiantes de una sección, se presentan en el
siguiente cuadro.

19
Tiempo de
3 3 3 4 4 5 5 5 6 6 7 8
estudio
Calificación 9 12 11 12 15 14 16 15 18 16 15 17

a) Halla la recta de regresión de mínimos cuadrados considerando la calificación


en el examen como variable dependiente.

b) Interpreta la pendiente de la recta de regresión.

c) Calcula el error estándar de estimación. ¿Para qué se utiliza esta medida?

5. En una empresa se tiene interés en pronosticar el tiempo, en minutos, que toma


atender a un cliente en caja (Y) y se decide utilizar como variable independiente el
monto de las compras en dólares (X). Se tomó una muestra de 18 clientes y se
obtuvieron los siguientes resultados: x = 861, x2 = 60323, xy = 5177.3, y =
75.4, y2 = 455.86.

a) Halla la recta de regresión que mejor se ajusta a los datos e interpreta la


pendiente.
b) Grafica la recta de regresión.
c) Utiliza el gráfico de la recta de regresión para realizar dos predicciones de la
variable dependiente.
d) Calcula el error de estimación.
e) Calcula e interpreta el coeficiente de correlación

6. Para los puntajes de ansiedad (X) y de aptitud académica (Y) de diez postulantes a
un trabajo se han obtenido los siguientes resultados:  x = 847,  x2 = 71927, 
y = 446,  y2 = 20058,  xy = 37615.

a) Halla la recta de regresión de mínimos cuadrados que se ajusta a estos datos.


Interpreta la pendiente.

b) Interpreta la pendiente de la recta de regresión.

c) Grafica la recta de regresión.

20
d) Calcula e interpreta el coeficiente de correlación

7. Se ha tomado una muestra de 16 ventas de una casa comercial. Para cada venta se
han observado el precio de venta (X) y la cantidad vendida (Y) y se han obtenido
los siguientes resultados:  x = 77.9,  y = 749, SCx = 75.53, SCy = 7114.44 y
SCxy = - 489.89.

a) Halla la recta de regresión de mínimos cuadrados.

b) Interpreta la pendiente.

c) Pronostica la cantidad vendida para precios de venta de X=3 y x=5.

d) Calcula e interpreta el coeficiente de determinación.

8. Según investigaciones, el porcentaje de desembolso por empresas manufactureras


estadounidenses en plantas y equipo que fue destinado al control de polucióín
durante el periodo 1975–1987 fue como sigue:*

1975 1980 1981 1984 1987

9.3 4.8 4.3 3.3 4.3

*Fuente: Survey of Current Business.

a) Obtenga un modelo de regresión lineal, donde X: tiempo en años desde 1975.


b) Grafique la ecuación de la Recta.
c) Use el modelo calculado en (a) para estimar el porcentaje en 1985.

3.9. La siguiente tabla muestra el beneficio neto, en millones de dólares, de la


empresa Disney durante los años 1984-1992.

21
Beneficios estimados al $5 millón más cercano.
Fuente: Informes de compañía/The New York Times, Dic. 1992.

a) Estime la ecuación de la recta de mejor ajuste para estos datos.


b) Interprete el coeficiente β1.
c) Use el modelo calculado para hacer una estimación.

9. La siguiente tabla muestra la producción de soja, en millones de toneladas, en la


región Cerrados de Brasil, como función del área cultivada en millones de hectáreas.

Área
10,1 12,1 12,9 16,2 21,0
(Millones de hectáreas)

Producción
15 25 30 40 60
(Millones de toneladas)

*Fuente: Ministerio de Agricultura de Brasil/New York Times.

a) Obtenga la ecuación de la recta de regresión lineal.


b) Interprete el coeficiente β1.

22
Use el modelo calculado para hacer una estimación.

10. Para una muestra de 20 operadores de máquinas se tienen registrados, la nota del
examen de ingreso (X) y la evaluación de eficiencia laboral (Y). A partir de estos
datos se han obtenido los siguientes coeficientes para la recta de regresión de
mínimos cuadrados: 0 = 28.64 y 1 = 1.01.

a) Escribe la recta de regresión e interpretar 1 .

b) Estima el puntaje promedio de evaluación de eficiencia laboral para los


operadores que obtuvieron 75 puntos en el examen de ingreso.

c) Grafica la recta de regresión.

11. La siguiente información corresponde a calificaciones obtenidas por 10 estudiantes


en un examen de Estadística y su calificación final promedio.

Calificación
en examen 14 18 16 12 10 15 17 11 08 12
Calificación
promedio 12 14 15 10 11 12 12 11 10 11

a) Grafica el diagrama de dispersión. Comentar

b) Halla la recta de regresión de mínimos cuadrados. Interpretar la pendiente.

c) Calcula el coeficiente de correlación lineal. Interpreta.

d) Calcula el coeficiente de determinación. Interpreta.

12. En un estudio con 15 observaciones mensuales, un analista financiero quiere


determinar la relación de la tasa porcentual de rendimiento (Y) de las acciones de

23
una empresa sobre la tasa porcentual de rendimiento (X) de un índice bursátil.
Dispone de la siguiente información:

 x = 33.8,  y = 33.5,  xy = 79.22,  x2 = 80.34,  y2 = 79.45

a) Estima la regresión lineal de Y sobre X. Realiza una predicción.

b) Calcula el coeficiente de correlación lineal. Interpreta.

c) Calcula el coeficiente de determinación. Interpreta.

13. Un vendedor de bienes desea establecer la relación entre el número de semanas que
las casas están en el mercado antes de venderse y el precio que por ellas se pide.
La información es la siguiente:

Semana 6.2 6.7 7.5 8.5 11. 9.5 12.2 9.8


5
Precio
(miles) 25 82 100 95 120 110 130 135

a) Grafica la dispersión de puntos.

b) Halla la ecuación de regresión de Y sobre X. Interpreta la pendiente.

c) Realiza dos predicciones.

d) Calcula e interpreta el coeficiente de determinación.

e) Calcula el error estándar de estimación.

14. La siguiente tabla y gráfica muestran el consumo mensual de energía en función del
área del domicilio:

24
Área 125, 207,
119,8 136,6 148,8 158,9 170,9 183,9 223,0 272,2
(m2) 4 2

Consumo
1180 1170 1260 1490 1570 1710 1800 1840 1960 1950
(kw-hrs)

a) Establezca la recta de regresión de mínimos cuadrados que permita predecir el


consumo de energía en función del área del domicilio.
b) Represente gráficamente los puntos y la recta de mínimos cuadrados. Comenta al
respecto.
c) Interprete la pendiente de la recta de regresión.
d) Calcule e interprete el Coeficiente de Correlación R.
e) Calcule e interprete el Coeficiente de Determinación R2.

15. En el servicio central de turismo del país se ha observado que el número de plazas
hoteleras ocupadas es diferente según sea el precio de la habitación. Sobre el total
de plazas ocupadas en un año se tiene:

Precio 260 650 1000 1400 210 2500 270 3300 4000
(US$./noche 0 0
)
Nº Habitac 4725 261 1872 943 750 700 700 580 500
Ocupadas 0
a) Representa gráficamente para comprobar que existe cierta dependencia lineal
entre las variables.
b) Halle la ecuación de la recta de regresión del precio sobre el número de
habitaciones.
c) ¿Cuántas habitaciones se llenarían a US$1500?

25
16. El volumen de ahorro y la renta del sector familias en billones de pesos, para el
período 77-86 fueron:

Año 77 78 79 80 81 82 83 84 85 86
Ahorro 1.9 1.8 2.0 2.1 1.9 2.0 2.2 2.3 2.7 3.0
Renta 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5

a) Encuentre la recta de regresión considerando el ahorro como variable


independiente.
b) Encuentre la recta de regresión considerando la renta como variable
independiente
c) Para el año 87 se supone una renta de 24.1 billones de pesos. ¿Cuál será el
ahorro esperado para el año 87?

17. La tabla presenta datos ficticios para un estudio de adolescentes en riesgo de


desarrollar obesidad.

N° de comidas 2 2 5 2 4 3 3 2
rápidas consumidas
la última semana
Peso (Kg.) 50,8 59,4 77,6 72,6 82,6 74,8 67,6 62,1

a) Trace un diagrama de dispersión del   peso regresionado a partir del número de


comidas rápidas consumidas en la última semana.
b) Calcule el coeficiente de correlación R de Pearson para estas dos variables, así
como la ecuación de regresión Y = β0 + β 1 X .

26
18. La tabla siguiente contiene la edad (X) y la máxima de la presión sanguínea (Y) de un
grupo de 10 mujeres:

Edad 56 42 72 36 63 47 55 49 38 42
Presión 14,8 12,6 15,9 11,8 14,9 13,0 15,1 14,2 11,4 14,1
a) Determine la recta de regresión de Y sobre X, justificando la adecuación de un
modelo lineal.
b) Interprete la pendiente.
c) Mida la bondad del modelo.
d) Realice las siguientes predicciones, sólo si tienen sentido:
 Presión sanguínea de una mujer de 51 años.
 Presión sanguínea de una niña de 10 años.
 Presión sanguínea de un hombre de 54 años.

19. El crecimiento de los niños desde la infancia a la adolescencia generalmente sigue un


patrón lineal. Se calculó una recta de regresión mediante el método de mínimos
cuadrados con datos de alturas de niñas norteamericanas de 4 a 9 años y el
resultado fue: β0 = 80 y β1 = 6. La variable dependiente Y es la altura (en cm.) y X
es la edad (en años).

a) Interprete los valores estimados del intercepto y de la pendiente.


b) Cuál será la altura predicha de una niña de 8 años.
c) Cuál será la altura predicha de una mujer de 25 años. Comente el resultado.

20. En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista


Field Crops Research, los datos usados en la investigación son:

Duración 92 92 96 100 102 102 106 106 121 143


Rendimiento 1,7 2,3 1,9 2,0 1,5 1,7 1,6 1,8 1,0 0,3

Con X = la duración de la cosecha de porotos de soya en días, Y = rendimiento


de la cosecha en toneladas por hectárea.

27
a) Estime la recta de regresión mediante el método de mínimos cuadrados.
Interprete los estimadores en el contexto de la pregunta
b) ¿Existe una relación lineal significativa entre la duración y el rendimiento de la
cosecha?
c) Estime el rendimiento si la duración de la cosecha fue de 104 días.

21. Un investigador cree que la inteligencia de los niños, medida a través del coeficiente
intelectual (CI en puntos), depende del número de hermanos. Toma una muestra
aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados aparecen
en la tabla adjunta.

CI 110 115 120 118 110 108 105 104 98 99 99 100 90 93 90


N° Hmos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6
a) Encuentre e interprete el coeficiente de correlación R.
b) Dé la ecuación de la recta de regresión. Interprete los estimadores en el contexto
de la pregunta.
¿Existe una relación lineal significativa entre el número de hermanos y el
coeficiente intelectual?

22. Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas
en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción
cuyos resultados se muestran en la tabla que sigue:

INGESTIÓN Y ABSORCIÓN DE GRASAS EN 20 LACTANTES


DESNUTRIDOS
Caso N° Ingestión Absorción Caso N° Ingestión Absorción
1 1,4 0,7 11 2,0 1,4
2 1,6 1,2 12 1,4 1,1
3 2,1 1,6 13 1,9 1,5
4 1,7 1,1 14 1,8 1,3
5 1,8 1,3 15 1,9 1,5
6 2,6 2,0 16 1,6 1,4

28
7 1,5 1,2 17 1,9 1,7
8 2,5 1,5 18 2,1 1,7
9 2,7 2,4 19 1,6 1,3
10 1,8 1,5 20 1,6 1,1

a) Estime β0 y β1 mediante el método de mínimos cuadrados. Interprete los


coeficientes de regresión.
b) Encuentre e interprete el coeficiente de correlación R.
c) ¿Existe una relación lineal significativa entre la ingestión y la absorción de
grasas?

23. La siguiente tabla presenta los datos sobre el número de cambios de aceite al año (X)
y el costo de la reparación (Y), en miles de pesos, de una muestra aleatoria de 8
autos de una cierta marca y modelo.

N° Cambios
3 5 2 3 1 4 6 4
de Aceite
Costo
(miles de 150 150 250 200 350 200 50 125
pesos)
a) Haga un gráfico de dispersión con los datos, verifique el supuesto de linealidad.
b) Encuentre la recta de regresión de mínimos cuadrados.
c) Interprete los valores estimados del intercepto y de la pendiente.
d) Estima cuál será el costo de reparación de un auto que ha tenido 4 cambios de
aceite.
e) Si cambia X por Y, ¿obtendrá la misma recta de regresión?
f) Calcule el residuo para la primera observación (X=3, Y=150).

29
24. Para la economía española, disponemos de los datos anuales redondeados sobre
consumo final de los hogares a precios corrientes (Y) y renta nacional disponible
neta (X), tomados de la Contabilidad Nacional de España base 1995 del INE , para
el período 1995-2002, ambos expresados en miles de millones de euros:

Año 1995 1996 1997 1998 1999 2000 2001 2002


Y 258,6 273,6 289,7 308,9 331,0 355,0 377,1 400,4
X 381,7 402,2 426,5 454,3 486,5 520,2 553,3 590,3

Considerando que el consumo se puede expresar como función lineal de la renta,


determine:
a) Los parámetros β0 y β1 de la recta de regresión.
b) El coeficiente de determinación de dicha regresión.
c) La predicción del valor que tomará el consumo para una renta de 650.000
millones de euros.

25. Se supone que se puede establecer cierta relación lineal entre las exportaciones de
un país y la producción interna de dicho país. En el caso de España, tenemos los
datos anuales (expresados en miles de millones de pesetas) para tales variables
correspondientes al quinquenio 2002-06 en la siguiente tabla:

Año Producción Exportaciones


2002 52,654 10,420
2003 53,972 11,841
2004 57,383 14,443
2005 61,829 16,732
2006 65,381 18,760
A partir de tal información, y considerando como válida dicha relación lineal, se pide:

a) Si la producción para el año 2007 fue de 2.210.610 millones de pesetas, ¿cual


sería la predicción de las exportaciones para este año? ¿Qué grado de precisión
tendría dicha predicción?

30
b) ¿Qué tanto por ciento de la varianza de las exportaciones no vienen explicadas
por la producción interna, y se debe a otro tipo de variables?

26. Un estudiante de la Escuela Universitaria de Estudios Empresariales de la


Universidad de Sevilla, para poder pagarse sus estudios, debe trabajar como
camarero en un bar de copas de su localidad. A este establecimiento, suelen acudir
todos los jóvenes de la zona. Este año, con los conocimientos aprendidos, decide
por fin estudiar la relación existente entre la cantidad de sal de las galletas saladas
y el consumo de bebidas, ya que es costumbre dar al cliente este aperitivo cuando
pide una consumición. Se sabe que las galletas no pueden tener una concentración
de sal superior a 3,5 gramos por cada 1000 galletas y, por ello, decide ir variando a
partir de 1 gramo la concentración de 0,5 en 0,5 gramos cada semana e ir anotando
el incremento en caja semanalmente, obteniendo la siguiente tabla:

Gramos de sal por Ingresos


1000 galletas (pesetas)
1 140,3
1,5 150
2 165
2,5 175
3 200

A partir de tales cifras, se quiere conocer:

a) ¿Considera justificado el planteamiento de un modelo lineal para expresar la


relación entre las variables?
b) Si el propietario desea unos ingresos de 160.000 pesetas, ¿qué cantidad de sal
debería aportar por cada 1000 galletas? Si aporta el máximo permitido de sal,
¿cuál sería el ingreso en caja? Explicar cuál de las dos predicciones le merece
mayor confianza.

31
¿Cuál sería la variación porcentual de los ingresos cuando la cantidad de sal
aumenta en un 1% sobre el último valor de la tabla? Si aumentamos en 1gr. la sal
por cada 1000 galletas, ¿cuánto variarán los ingresos?

27. La factura mensual del gasto telefónico de una pequeña empresa se ha incrementado
notablemente en los últimos meses. Los estudios realizados por el administrador de
la misma argumentan que el mayor uso de Internet dentro de la misma es la
principal causa del mayor gasto en teléfono, lo que ha hecho que se estudie la
posibilidad de acogerse a alguno de los múltiples bonos o tarifas especiales que
ofrecen las compañías, lo que hasta la fecha todavía no se llevó a cabo. Las últimas
cifras mensuales no hacen sino confirmar esta relación:

Mes Enero Febrero Marzo Abril Mayo


Cuantía de la factura 55 100 118 120 142
telefónica (€)
Tiempo de conexión 200 500 700 800 1000
(minutos)

De acuerdo con la información anterior, responda a las siguientes preguntas:


a) Suponiendo la existencia de una relación de tipo lineal entre tiempo de conexión y
gasto telefónico, ¿qué porcentaje de las variaciones en la cuantía de la factura
telefónica no podrían ser explicadas linealmente por el tiempo de conexión a
Internet dentro de la compañía?
b) ¿Cuál sería la cuantía de la factura telefónica de la compañía de acuerdo a esta
relación lineal si no se conectase a Internet en la empresa?
c) ¿Cuál sería el gasto telefónico estimado según esta relación lineal si el tiempo de
conexión a Internet fuera de 2000 minutos? ¿Le parece aceptable tal predicción?
Justifique su respuesta.

Se considera que un incremento del 20% en el tiempo de conexión a Internet


respecto al realizado en el mes de mayo conllevaría a que la factura telefónica se

32
elevase de forma extraordinaria. ¿Cuál sería el incremento relativo en la misma si
ello se produjese? Justifique su respuesta.

28. Una juguetería ha examinado la evolución reciente de las ventas de su muñeco “Qco”
(Y, en millones de euros) junto con los gastos de publicidad de ese muñeco (X, en
millones de euros), obteniéndose los siguientes resultados:

Año 2003 2004 2005 2006 2007 2008 2009


Y 126 135 156 156 150 150 180
X 20 25 30 32,5 35 32 34

A partir de esta información, responda a las siguientes cuestiones:


a) ¿Se puede afirmar que al aumentar los gastos en publicidad se incrementarán las
ventas? Obtenga los parámetros del ajuste lineal que explique las ventas en
función de los gastos. Interprete dichos coeficientes e indique la bondad del ajuste
realizado.
b) Si para este año 2010 aumentásemos los gastos de publicidad en un 1%, ¿en qué
porcentaje se espera que variasen las ventas, según el modelo lineal?

29. Para un conjunto de personas que están siguiendo una dieta de adelgazamiento, se
han recogido datos sobre el peso perdido desde el inicio de la misma (variable Y,
en Kg.) y el tiempo que llevan siguiendo la dieta (variable X, en semanas), los
cuales se muestran en la siguiente tabla:

Y 2,4 5,4 5,6 8,4 10,6 13,5 15 15


X 3 5 6 8 11 13 15 16

a) Estime el modelo lineal que explica el peso perdido en función del tiempo que se
lleva siguiendo la dieta e interprete los parámetros.
b) Para el modelo estimado en el apartado anterior, descomponga la varianza total
como suma de la explicada y la no explicada por el mismo y obtenga, a partir de
tal descomposición, el coeficiente de determinación.

33
c) Según el modelo considerado, ¿qué peso esperaría perder una persona que siga
la dieta durante 2 meses (8 semanas)? ¿Y una persona que esté dispuesta a
seguir la dieta durante dos años (108 semanas)? ¿Qué fiabilidad le otorga a cada
una de las estimaciones anteriores?

30. Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y el
número de unidades vendidas, se procedió a recoger datos sobre tales magnitudes
durante el pasado mes en una determinada región. Los resultados obtenidos fueron
los siguientes:

Precio
7,5 9 10,5 12 14 16 18 20,5 23,5 27
(miles de euros)
Cantidad
450 425 400 350 325 300 290 280 260 200
vendida por mes

En función a los datos recabados para esa región y mes:

a) Una empresa radicada en la región tiene previsto para el mes próximo aumentar
el precio de su modelo más vendido en 500 􀂼. Si suponemos como válida la
relación lineal entre las dos variables analizadas para los datos del pasado mes,
¿cómo afectaría este hecho a las ventas de dicho modelo?
b) Si el modelo más caro de la tabla anterior se abaratase para el mes próximo un
3%, ¿cómo variarían las ventas de dicho modelo?

31. En una muestra de familias se han analizado las variables ahorro anual (Y) y renta
anual (X), medidas ambas en miles de euros. Los datos obtenidos han sido los
siguientes:

Ahorr
1,9 1,8 2,0 2,1 1,9 2,0 2,2 2,3, 2,7 3,0
o (Y)
Renta
20,5 20,8 21,2 21,7 22,1 22,3 22,2 22,6 23,1 23,5
(X)

34
A partir de tales datos, se pide:

a) Obtener el modelo lineal que explica el ahorro de las familias en función de su


renta.
b) ¿Qué familia aumentaría en un mayor porcentaje su ahorro si su renta se viese
incrementada en un 5%, la familia que tiene la menor renta de entre todas o la
que posee la mayor renta?
c) ¿Cuál será el incremento absoluto del ahorro cuando una familia aumente su
renta anual en 500 euros?
d) ¿Qué porcentaje de varianza de la variable ahorro queda explicado por la variable
renta a través del modelo lineal planteado?

35

También podría gustarte