Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FUENTES DE INFORMACION
Una fuente de
Los datos pueden reunirse a partir de fuentes de información existentes o pueden obtenerse
mediante encuestas y estudios experimentales diseñados para conseguir nuevos datos. Las
fuentes de información pueden ser:
Primarias Secundarias
Información que se obtiene Información elaborada a base de
directamente de la Unidad datos de las fuentes primarias
de observación
Fuentes de datos
internos. Reportes Financieros,
Informes, Análisis o
Reporte de operaciones,
aquellas que la empresa puede comparaciones sobre reportes
obtener y explorar por sus planificación, reportes
anteriores de la empresa
propios medios y recursos sin especiales, etc
necesidad de acudir a terceros
1
Fuentes de datos Análisis o informes basados en
Informes de Estudio de
externos los reportes del INEI,
mercado, estudio de
Información que están situadas Ministerios u otras entidades
fuera de la empresa cuya posicionamiento,
que genera información
información puede obtenerse a Reportes del INEI
estadística
través de diferentes medios
ENCUESTA
ENCUES OBSERV
TA ACIÓN
ENTRE ANÁLIS
VISTA IS
DOCUM
ENTAL
2
Técnica: conjunto de reglas y procedimientos que permiten al investigador establecer
la relación con el objeto o sujeto de la investigación.
Instrumento: mecanismo que usa el investigador para recolectar y registrar la
información; formularios, pruebas, test, escalas de opinión, listas de chequeo.
Las principales técnicas de recolección de datos son:
La encuesta
La entrevista
La observación (no experimental y experimental)
El Análisis documentario
1. LA OBSERVACION
Es el registro visual de lo que ocurre en una situación real, clasificado y consignando
los datos de acuerdo con algún esquema previsto y de acuerdo al problema que se
estudia.
VENTAJAS DESVENTAJAS
Permite obtener datos cuantitativos y Se requiere de mucha habilidad
cualitativos. y agudeza para “ver” los
Se observan características y fenómenos estudiados.
condiciones de los individuos. Demanda gran cantidad de
También conductas, actividades, tiempo.
características o factores ambientales. Tiene sesgos; el humano ve lo
Puede ser utilizada en cualquier que quiere ver.
investigación y área del saber. Al momento de la interpretación
Es un método que no depende de pueden distorsionrse los hechos
terceros o de registros; con ello se e ir más allá de lo que vimos en
eliminan sesgos y ambigüedades. realidad.
3
de observación.
Cuando el observador tiene ideas prejuiciadas.
Cuando el instrumento no es válido o es poco exacto o está mal definido.
TIPOS DE OBSERVACION
4
Estructurada variables en estudio (lista de cotejos, etc).
2. LA ENTREVISTA
Es la comunicación interpersonal establecida entre el investigador y el sujeto de
estudio a fin de obtener respuestas verbales a las interrogantes planteadas sobre el
problema propuesto.
VENTAJAS
Es aplicable a toda persona, (incluyendo a con limitaciones física o
psicológica).
Permite estudiar aspectos psicológicos o de otra índole donde se desee
profundizar en el tema.
Permite obtener información más completa,
A través de ella el investigador puede: Aclarar el propósito del estudio,
especificar claramente la información que necesita, aclarar preguntas y permite
usar triangulación.
Permite captar mejor el fenómeno estudiado ya que permite observar lenguaje
no verbal.
TIPO DE ENTREVISTAS
1. ENTREVISTA ESTRUCTURADA
Se elabora un formulario estandarizado.
Idénticas preguntas y en el mismo orden a todos los sujetos.
Los sujetos eligen la respuesta de 2, 3 o pocas más alternativas.
Los comentarios y explicaciones son los mismos para todos.
VENTAJAS DESVENTAJAS
Respuestas cortas y precisas. La información puede ser muy
Información fácil de procesar. superficial.
El entrevistador no requiere Limitada la posibilidad de
gran entrenamiento. profundizar en un aspecto
5
Información uniforme. determinado.
Difícil obtener información
confidencial.
2. ENTREVISTA NO ESTRUCTURADA
Es flexible y abierta, pero regida por los objetivos de la
investigación.
Las preguntas, su contenido, orden y formulación es controlado por
el investigador, el que puede adaptarlas dependiendo de las
situaciones y características de los sujetos en estudio.
El entrevistado también cuenta con libertad para dar sus respuestas.
Se utiliza un instrumento guía que contiene las orientaciones de los
temas a tratar.
Muy útil para estudios exploratorios, descriptivos y cualitativos
VENTAJAS DESVENTAJAS
Adaptable y aplicable Requieren mucho tiempo.
a toda clase de Muy costosos por el tiempo de las
sujetos en diversas entrevistas.
situaciones. Limitado para personas con problemas de la
Permite profundizar palabra.
en los temas de Dificultad para tabular datos que han sido
interés. recopilados de distinta forma.
Orienta posibles Se requiere crear confianza y comodidad
hipótesis y variables entre el entrevistado y el entrevistador.
cuando se exploran Se requiere habilidad técnica para obtener
áreas nuevas. la información y mayor conocimiento
respecto del tema.
Debido a que son entrevistas en
profundidad habitualmente se utilizan
muestras pequeñas.
6
Entrevistador debe estar bien capacitado.
El entrevistador debe establecer una buena comunicación con el
entrevistado, uso de vestuario adecuado, lenguaje adecuado, escuchar
adecuadamente, no apresurar al entrevistado, etc.
Buen registro de la información a fin de poder interpretarla adecuadamente.
El entrevistador debe:
Dejarle un mensaje positivo al entrevistado.
Jamás dar consejos,
Jamás hacer juicios morales,
Jamás rebatir al entrevistado.
3. LA ENCUESTA
Método que utiliza un formulario impreso, destinado a obtener respuestas
sobre el problema en estudio y que el sujeto investigado llena por sí mismo.
La encuesta puede aplicarse a grupos o individuos estando presente el
investigador. Incluso puede enviarse por correo a los destinatarios.
Algunos instrumentos utilizado en la encuesta son: EL CUESTIONARIO, TEST
– FORMULARIOS - PRUEBAS
VENTAJAS DESVENTAJAS
Costo relativamente bajo. Es poco flexible, la información
Proporciona información sobre no puede variar ni profundizarse.
un mayor número de personas Si el cuestionario se envía por
en un período breve. correo, es posible que no sean
Fácil para obtener, cuantificar, devueltos o que no se obtengan
analizar e interpretar datos. respuestas.
Menores requerimientos de No utilizable en personas que no
personal capacitado. saben leer ni escribir.
Mayor posibilidad de mantener No permite aclarar dudas.
anonimato de los encuestados. Resulta difícil obtener
Eliminación de los sesgos que cuestionarios completamente
7
introduce el encuestador. contestados.
Se deben obtener grandes
muestras.
4. ANALISIS DOCUMENTARIO
III. EJERCICIOS
3.1. De los siguientes incisos, ¿cuáles representan variables discretas y cuáles variables
continuas?
a) El número de acciones vendidas por día en la bolsa de valores.
b) Las temperaturas registradas cada media hora en un observatorio.
c) El tiempo de vida de baterías de equipos celulares con cámara y MP3.
d) El ingreso anual de los profesores universitarios.
e) La longitud de 1000 tornillos producidos por una fábrica.
3.2. Establece una correspondencia entre las variables indicadas y la clasificación que se
muestra a continuación:
VARIABLES CLASIFICACION
1 El peso y la talla A Cualitativa – Nominal.
Ciclos de estudios de una carrera Dependiente, independiente
2 B
profesional – Bidimensional.
8
Cuantitativa discreta –
3 El ingreso familiar en soles C
Unidimensional.
Lugar de nacimiento de los
4 D Cualitativa – Ordinal.
estudiantes de la UCV
La raza y la religión del padre de los Cualitativa, cualitativa –
5 E
pobladores de una ciudad Bidimensional.
El Nº de libros que tiene cada una de Cuantitativa continua –
6 F
las universidades del Perú Razón.
3.3. Indica a qué clase de variable: por su naturaleza y por su escala de medición,
pertenece cada uno de los siguientes casos:
a) Cantidad de hombres y mujeres en un aula de clase.
b) La edad (en años cumplidos) de los estudiantes de la UCV.
c) Grado de instrucción de los PPFF de los alumnos de un centro educativo.
d) El nivel de autoestima.
e) Etapas del desarrollo.
f)Coeficiente intelectual.
3.4. Proporciona una definición operacional en cada uno de los siguientes casos:
a) Un buen trabajador b) Un bonito día
c) Un servicio de atención rápido d) Tiempo de estudio
e) Número de personas en el hogar f) Un buen estudiante
3.5. Un investigador que está estudiando hábitos de consumo le pregunta a cada vigésima
persona que entra en un supermercado acerca del número de veces que va de
compras semanalmente
a) Si la persona encuestada responde 2, ¿esta respuesta es una muestra, variable,
medida estadística, parámetro o dato? ¿La respuesta es un valor cuantitativo o
cualitativo?, ¿porqué?
b) A la persona encuestada también se le pregunta por su edad, estado civil e
ingresos y responde: 32, soltero, S/. 1500 respectivamente. Identifique los
elementos de cada uno de estos datos.
9
3.6. Propón las técnicas e instrumentos que se podrían utilizar en la recolección de datos
para responder las preguntas que se presentan a continuación y explica la razón de su
elección.
a) ¿Cuál es la opinión de los estudiantes de la universidad sobre la actual política
educativa?
b) ¿Qué opinan los residentes de una urbanización y del Consejo Territorial
correspondiente, sobre la seguridad ciudadana en dicha urbanización?
c) ¿Cuáles son los niveles de desempeño del docente y de rendimiento de los
alumnos del curso de Estadística General de la UCV?
d) ¿Existe relación entre el nivel de autoestima de los trabajadores de una empresa y
su nivel de satisfacción en el trabajo?
e) ¿Cuál es la opinión de los decanos de las facultades sobre las fortalezas y
debilidades de la investigación científica en la universidad y sus causas?
f)¿Cuáles son los tiempos promedio de espera y de atención de los clientes de un
banco en las colas que se forman en las ventanillas y la opinión al respecto?
g) ¿Cuál es la opinión de los residentes en el distrito de Salaverry sobre la calidad del
agua potable y la calidad de atención al cliente?
h) ¿Cuál es el pronóstico de las ventas de una empresa para los años 2009 y 2010,
teniendo en cuenta las ventas durante los últimos diez años?
i) ¿Cuál es el desgaste de los rodamientos de cierto tipo de máquinas y su relación con
el tipo de aceite que se utiliza para lubricarlas?
j) ¿Cuál es la opinión de las autoridades del sector turismo del departamento de la
Libertad sobre cómo incrementar el flujo de turistas nacionales y extranjeros hacia
el departamento?
10
6) ¿Cuántas horas a la semana dedica a 9) ¿Cuál es el método de estudio que
trabajar, además de estudiar? utiliza?
7) ¿Realiza actividades de diversión? 10) ¿Cuál es tu estrato socio-económico?
8) ¿Cuántas horas a la semana dedica a
divertirse?
11
ACTIVIDADES DE REFORZAMIENTO
4.1. Propón la técnica e instrumento de recolección de datos que se podrían utilizar para
lograr los siguientes objetivos.
12
REGRESIÓN LINEAL
Cuando la línea de regresión se asemeja a una recta (regresión lineal), puede ajustarse a
esta forma geométrica por medio de un método general conocido como método de los
mínimos cuadrados. La recta de ajuste tendrá por ecuación:
Y = β0 + β 1 X
13
CÁLCULO DE LOS COEFICIENTES β0 y β1:
Cov(x , y)
1° Cálculo de β1: β 1=
V (x)
2° Cálculo de β0: β 0=Y −β 1 X
Donde:
n
∑ Xi : Media Aritmética de X.
i =1
X=
n
CORRELACIÓN (r)
El coeficiente de correlación (r) mide el grado de relación lineal (intensidad) de la relación
entre dos variables cuantitativas. El coeficiente r puede tomar valores entre -1.00 y 1.00.
Básicamente, esta información se refiere a dos características de la relación lineal: la
dirección o sentido y la cercanía o fuerza.
Correlación
Correlación nula
Correlación
perfecta perfecta
negativa Positiva
-1 0 1
Fuerte Débil Débil Fuerte
Negativa Negativa Positiva Positiva
14
Es importante notar que el uso del coeficiente de correlación sólo tiene sentido si la
relación a analizar es del tipo lineal. Si ésta no fuera no lineal, el coeficiente de
correlación sólo indicaría la ausencia de una relación lineal más no la ausencia
de relación alguna.
(∑ )(∑ )
n n
Xi Yi
n : Suma Cruzada de X e Y.
SC xy=∑ X i Y i −
i=1 i=1
i=1 n
(∑ )
n 2
Xi
n : Suma de Cuadrados de X.
SC x =∑ X i − 2 i=1
i=1 n
(∑ )
n 2
Yi
n : Suma de Cuadrados de Y.
SC y =∑ Y i − 2 i=1
i=1 n
15
Correlación Nula
16
EL COEFICIENTE DE DETERMINACION “R2”
El coeficiente de determinación, r2 - la proporción de la variación total en la variable
dependiente Y que está explicada por o se debe a la variación en la variable independiente
X. El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma
valores de 0 a 1.
R %=( R ) ×100
2 2
17
Donde:
R: Coeficiente de Correlación.
EJERCICIOS
Después de haber leído la bibliografía básica propuesta en el punto 2.1, resuelve los
siguientes ejercicios:
1. Para cada uno de los siguientes conjuntos de datos bivariantes graficar sus
correspondientes diagramas de dispersión de puntos. ¿Qué tipo de relación
funcional, cree usted, se podría ajustar mejor a los datos?, ¿Por qué?
X 5 10 8 19 14 19 15 15 25 20 20
a)
Y 2 7 13 14 15 16 10 5 7 10 5
X 3 6 5 1 4 2 3 7 4
b)
Y 16 14 12 8 18 11 11 5 20
X 6 2 1 4 1 3 4 1 3 2 4
c)
Y 10 16 14 10 16 13 11 15 14 14 12
X 6 14 15 18 10 16 14 12 18 17
d)
Y 8 11 16 17 11 14 13 10 14 18
18
Número de errores (Y) 8, 6 6, 10 8, 14 14, 12 16, 12
Reducción de horas de 8 12 16 20 24
sueño (X)
Gastos
semanales de 41 54 63 54 48 46 62 61 64 71
publicidad
Ventas 1250 1380 1425 1425 1450 130 1400 1510 1575 1650
semanales 0
e) ¿Cuáles son los errores de estimación cuando se predice las ventas semanales
para gastos semanales de publicidad de 61, 62 y 63 dólares respectivamente?
19
Tiempo de
3 3 3 4 4 5 5 5 6 6 7 8
estudio
Calificación 9 12 11 12 15 14 16 15 18 16 15 17
6. Para los puntajes de ansiedad (X) y de aptitud académica (Y) de diez postulantes a
un trabajo se han obtenido los siguientes resultados: x = 847, x2 = 71927,
y = 446, y2 = 20058, xy = 37615.
20
d) Calcula e interpreta el coeficiente de correlación
7. Se ha tomado una muestra de 16 ventas de una casa comercial. Para cada venta se
han observado el precio de venta (X) y la cantidad vendida (Y) y se han obtenido
los siguientes resultados: x = 77.9, y = 749, SCx = 75.53, SCy = 7114.44 y
SCxy = - 489.89.
b) Interpreta la pendiente.
21
Beneficios estimados al $5 millón más cercano.
Fuente: Informes de compañía/The New York Times, Dic. 1992.
Área
10,1 12,1 12,9 16,2 21,0
(Millones de hectáreas)
Producción
15 25 30 40 60
(Millones de toneladas)
22
Use el modelo calculado para hacer una estimación.
10. Para una muestra de 20 operadores de máquinas se tienen registrados, la nota del
examen de ingreso (X) y la evaluación de eficiencia laboral (Y). A partir de estos
datos se han obtenido los siguientes coeficientes para la recta de regresión de
mínimos cuadrados: 0 = 28.64 y 1 = 1.01.
Calificación
en examen 14 18 16 12 10 15 17 11 08 12
Calificación
promedio 12 14 15 10 11 12 12 11 10 11
23
una empresa sobre la tasa porcentual de rendimiento (X) de un índice bursátil.
Dispone de la siguiente información:
13. Un vendedor de bienes desea establecer la relación entre el número de semanas que
las casas están en el mercado antes de venderse y el precio que por ellas se pide.
La información es la siguiente:
14. La siguiente tabla y gráfica muestran el consumo mensual de energía en función del
área del domicilio:
24
Área 125, 207,
119,8 136,6 148,8 158,9 170,9 183,9 223,0 272,2
(m2) 4 2
Consumo
1180 1170 1260 1490 1570 1710 1800 1840 1960 1950
(kw-hrs)
15. En el servicio central de turismo del país se ha observado que el número de plazas
hoteleras ocupadas es diferente según sea el precio de la habitación. Sobre el total
de plazas ocupadas en un año se tiene:
Precio 260 650 1000 1400 210 2500 270 3300 4000
(US$./noche 0 0
)
Nº Habitac 4725 261 1872 943 750 700 700 580 500
Ocupadas 0
a) Representa gráficamente para comprobar que existe cierta dependencia lineal
entre las variables.
b) Halle la ecuación de la recta de regresión del precio sobre el número de
habitaciones.
c) ¿Cuántas habitaciones se llenarían a US$1500?
25
16. El volumen de ahorro y la renta del sector familias en billones de pesos, para el
período 77-86 fueron:
Año 77 78 79 80 81 82 83 84 85 86
Ahorro 1.9 1.8 2.0 2.1 1.9 2.0 2.2 2.3 2.7 3.0
Renta 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5
N° de comidas 2 2 5 2 4 3 3 2
rápidas consumidas
la última semana
Peso (Kg.) 50,8 59,4 77,6 72,6 82,6 74,8 67,6 62,1
26
18. La tabla siguiente contiene la edad (X) y la máxima de la presión sanguínea (Y) de un
grupo de 10 mujeres:
Edad 56 42 72 36 63 47 55 49 38 42
Presión 14,8 12,6 15,9 11,8 14,9 13,0 15,1 14,2 11,4 14,1
a) Determine la recta de regresión de Y sobre X, justificando la adecuación de un
modelo lineal.
b) Interprete la pendiente.
c) Mida la bondad del modelo.
d) Realice las siguientes predicciones, sólo si tienen sentido:
Presión sanguínea de una mujer de 51 años.
Presión sanguínea de una niña de 10 años.
Presión sanguínea de un hombre de 54 años.
27
a) Estime la recta de regresión mediante el método de mínimos cuadrados.
Interprete los estimadores en el contexto de la pregunta
b) ¿Existe una relación lineal significativa entre la duración y el rendimiento de la
cosecha?
c) Estime el rendimiento si la duración de la cosecha fue de 104 días.
21. Un investigador cree que la inteligencia de los niños, medida a través del coeficiente
intelectual (CI en puntos), depende del número de hermanos. Toma una muestra
aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados aparecen
en la tabla adjunta.
22. Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas
en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción
cuyos resultados se muestran en la tabla que sigue:
28
7 1,5 1,2 17 1,9 1,7
8 2,5 1,5 18 2,1 1,7
9 2,7 2,4 19 1,6 1,3
10 1,8 1,5 20 1,6 1,1
23. La siguiente tabla presenta los datos sobre el número de cambios de aceite al año (X)
y el costo de la reparación (Y), en miles de pesos, de una muestra aleatoria de 8
autos de una cierta marca y modelo.
N° Cambios
3 5 2 3 1 4 6 4
de Aceite
Costo
(miles de 150 150 250 200 350 200 50 125
pesos)
a) Haga un gráfico de dispersión con los datos, verifique el supuesto de linealidad.
b) Encuentre la recta de regresión de mínimos cuadrados.
c) Interprete los valores estimados del intercepto y de la pendiente.
d) Estima cuál será el costo de reparación de un auto que ha tenido 4 cambios de
aceite.
e) Si cambia X por Y, ¿obtendrá la misma recta de regresión?
f) Calcule el residuo para la primera observación (X=3, Y=150).
29
24. Para la economía española, disponemos de los datos anuales redondeados sobre
consumo final de los hogares a precios corrientes (Y) y renta nacional disponible
neta (X), tomados de la Contabilidad Nacional de España base 1995 del INE , para
el período 1995-2002, ambos expresados en miles de millones de euros:
25. Se supone que se puede establecer cierta relación lineal entre las exportaciones de
un país y la producción interna de dicho país. En el caso de España, tenemos los
datos anuales (expresados en miles de millones de pesetas) para tales variables
correspondientes al quinquenio 2002-06 en la siguiente tabla:
30
b) ¿Qué tanto por ciento de la varianza de las exportaciones no vienen explicadas
por la producción interna, y se debe a otro tipo de variables?
31
¿Cuál sería la variación porcentual de los ingresos cuando la cantidad de sal
aumenta en un 1% sobre el último valor de la tabla? Si aumentamos en 1gr. la sal
por cada 1000 galletas, ¿cuánto variarán los ingresos?
27. La factura mensual del gasto telefónico de una pequeña empresa se ha incrementado
notablemente en los últimos meses. Los estudios realizados por el administrador de
la misma argumentan que el mayor uso de Internet dentro de la misma es la
principal causa del mayor gasto en teléfono, lo que ha hecho que se estudie la
posibilidad de acogerse a alguno de los múltiples bonos o tarifas especiales que
ofrecen las compañías, lo que hasta la fecha todavía no se llevó a cabo. Las últimas
cifras mensuales no hacen sino confirmar esta relación:
32
elevase de forma extraordinaria. ¿Cuál sería el incremento relativo en la misma si
ello se produjese? Justifique su respuesta.
28. Una juguetería ha examinado la evolución reciente de las ventas de su muñeco “Qco”
(Y, en millones de euros) junto con los gastos de publicidad de ese muñeco (X, en
millones de euros), obteniéndose los siguientes resultados:
29. Para un conjunto de personas que están siguiendo una dieta de adelgazamiento, se
han recogido datos sobre el peso perdido desde el inicio de la misma (variable Y,
en Kg.) y el tiempo que llevan siguiendo la dieta (variable X, en semanas), los
cuales se muestran en la siguiente tabla:
a) Estime el modelo lineal que explica el peso perdido en función del tiempo que se
lleva siguiendo la dieta e interprete los parámetros.
b) Para el modelo estimado en el apartado anterior, descomponga la varianza total
como suma de la explicada y la no explicada por el mismo y obtenga, a partir de
tal descomposición, el coeficiente de determinación.
33
c) Según el modelo considerado, ¿qué peso esperaría perder una persona que siga
la dieta durante 2 meses (8 semanas)? ¿Y una persona que esté dispuesta a
seguir la dieta durante dos años (108 semanas)? ¿Qué fiabilidad le otorga a cada
una de las estimaciones anteriores?
30. Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y el
número de unidades vendidas, se procedió a recoger datos sobre tales magnitudes
durante el pasado mes en una determinada región. Los resultados obtenidos fueron
los siguientes:
Precio
7,5 9 10,5 12 14 16 18 20,5 23,5 27
(miles de euros)
Cantidad
450 425 400 350 325 300 290 280 260 200
vendida por mes
a) Una empresa radicada en la región tiene previsto para el mes próximo aumentar
el precio de su modelo más vendido en 500 . Si suponemos como válida la
relación lineal entre las dos variables analizadas para los datos del pasado mes,
¿cómo afectaría este hecho a las ventas de dicho modelo?
b) Si el modelo más caro de la tabla anterior se abaratase para el mes próximo un
3%, ¿cómo variarían las ventas de dicho modelo?
31. En una muestra de familias se han analizado las variables ahorro anual (Y) y renta
anual (X), medidas ambas en miles de euros. Los datos obtenidos han sido los
siguientes:
Ahorr
1,9 1,8 2,0 2,1 1,9 2,0 2,2 2,3, 2,7 3,0
o (Y)
Renta
20,5 20,8 21,2 21,7 22,1 22,3 22,2 22,6 23,1 23,5
(X)
34
A partir de tales datos, se pide:
35