Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TERCER SEMESTRE
SYLLABUS DE LA ASIGNATURA
ESTADÍSTICA I
U N I V E R S I D A D D E A Q U I N O B O L I V I A
1
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
UDABOL
UNIVERSIDAD DE AQUINO BOLIVIA
Acreditada como PLENA mediante R. M. 288/01
VISIÓN DE LA UNIVERSIDAD
MISIÓN DE LA UNIVERSIDAD
El syllabus que ponemos en tus manos es el fruto del trabajo intelectual de tus docentes, quienes
han puesto sus mejores empeños en la planificación de los procesos de enseñanza para
brindarte una educación de la más alta calidad. Este documento te servirá de guía para que
organices mejor tus procesos de aprendizaje y los hagas muchos más productivos. Esperamos
que sepas apreciarlo y cuidarlo.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
2
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
SYLLABUS
Asignatura: ESTADISTICA I
Código: EFE - 212
Requisito: MAT 112C
Carga Horaria: 100 horas
Horas Teóricas: 80 Horas
Horas Prácticas: 20 Horas
Créditos: 10
1.1. Introducción
1.2. Ramas de la estadística
1.3. Fuentes de información
1.4. Finalidad de la estadística
1.5. Conceptos y variables
1.6. Preparación de investigaciones estadística
1.7. Distribución de frecuencias
U N I V E R S I D A D D E A Q U I N O B O L I V I A
3
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
3.1. Introducción
3.2. Media aritmética y sus propiedades.
3.3. La mediana.
3.4. La moda y valor modal.
3.5. Otras medidas de tendencia central
3.6. Relaciones entre las medidas de tendencia central.
4.1. Cuartiles
4.2. Deciles
4.3. Percentiles.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
4
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
La materia es del “TIPO B”, son materias que complementan el conocimiento del
estudiante y no inciden en forma directa con la práctica profesional del estudiante.
Diagnóstico de Situacional.
Al estudiante:
Desarrollar prácticas Pre -profesionales en condiciones reales guiados por sus docentes
con procesos académicos de enseñanza y aprendizaje de Brigadas y de “aula abierta”.
Trabajar en equipos habituándose a ser parte integral de un todo que funciona como
unidad, desarrollando un lenguaje común, criterios y opiniones comunes y planteándose
metas y objetivos comunes para dar soluciones en común a los problemas.
Realizar investigaciones multidisciplinarias en un momento histórico en que la ciencia
atraviesa una etapa de diferenciación y que en los avances tecnológicos conllevan a la
aparición de nuevas y más delimitadas especialidades.
Desarrollar una mentalidad crítica y solidaria con plena conciencia de nuestra realidad
nacional y local.
Visitar a instituciones recabar información referente al funcionamiento de las PyME´s.
A la comunidad.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
5
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
PROCESUAL O FORMATIVA.
Las vinculadas a la actividad de aula abierta “Servicios de Consultoría” formaran parte de las
evaluaciones procesuales, cada una de estas se evaluarán de la siguiente manera:
Constituyen parte de las evaluaciones de diagnóstico y procesuales, las mismas que serán
evaluadas con las siguientes ponderaciones:
U N I V E R S I D A D D E A Q U I N O B O L I V I A
6
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
1. Cada uno de los cuales se evaluará cada semana sobre temas de avance realizados.
2. La resolución en forma individual o grupal de los Works Paper´s y DIF´s tendrán también
una ponderación similar.
EVALUACIÓN DE RESULTADOS
Se realizarán dos evaluaciones parciales y una evaluación final con un contenido práctico y
teórico con la siguiente ponderación.
Evaluaciones Parciales.
1. Se realizarán dos evaluaciones parciales cada con una ponderación final de 50 puntos.
V. BIBLIOGRAFÍA BÁSICA.
BIBLIOGRAFÍA COMPLEMENTARIA.
SPIEGEL, M. R., “Estadística”, Editorial McGraw Hill, Segunda Edición, 1990. Sig. Top. 519.5
G24
U N I V E R S I D A D D E A Q U I N O B O L I V I A
7
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
U N I V E R S I D A D D E A Q U I N O B O L I V I A
8
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
1.1 INTRODUCCION
U N I V E R S I D A D D E A Q U I N O B O L I V I A
9
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
U N I V E R S I D A D D E A Q U I N O B O L I V I A
10
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Se denomina a la lista, mapa o cualquier otro material aceptable, que contenga todas
las unidades perfectamente identificadas y actualizadas de la cual se selecciona la
muestra
Investigación Total
Toma en cuenta la totalidad de los elementos o unidades que conforman la
población objeto de estudio
Muestra:
Es una colección de algunos de los elementos que componen una población.
Parámetro:
Describen numéricamente la característica de una población
Tamaño muestral:
Es le número de elementos u observaciones que tomamos. Se denota por n ó N.
Datos:
Cada uno de los individuos, cosas, entes abstractos que integran una
población o universo determinado. Dicho de otra forma, cada valor
observado de la variable.
Estadígrafo:
Es la descripción numérica de una característica correspondiente a los
elementos de la muestra
U N I V E R S I D A D D E A Q U I N O B O L I V I A
11
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
U N I V E R S I D A D D E A Q U I N O B O L I V I A
12
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
2. Recolección
3. Critica y codificación
4. Procesamiento
5. Analisis e interpretación
6. Publicación
CUESTIONARIO
1. Desarrolle 3 definiciones de diferentes autores sobre el concepto de estadística
2. Cuales son las ramas de la estadística
3. Mediante ejemplos explicar la diferencia entre la estadística descriptiva y la
estadística inductiva
4. Porque es útil la estadística en su carrera de estudio
5. Desarrolle la finalidad general y especifica de una situación problema
6. Plantee las variables y parámetros que se consideran en el ejemplo anterior (6)
U N I V E R S I D A D D E A Q U I N O B O L I V I A
13
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
WORK PAPER # 2
U N I V E R S I D A D D E A Q U I N O B O L I V I A
14
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
2.1.4 PUBLICACIÓN
Hay muchas maneras de clasificar los datos, podemos simplemente reunirlos y conservarlos en
orden. Si las observaciones se miden en números, también podemos listar los puntos de datos
por orden ascendente de valor numérico; pero si los datos son trabajadores calificados
( carpinteros, albañiles o electricistas) que se necesitan en sitios de construcción, si son
diferentes tipos de automóviles fabricados por todas las empresas automotrices, o si son los
diversos colores de abrigos fabricados por determinada compañía, necesitaremos organizarlos
de modo diferente: tendremos que presentar los puntos graficados de datos por orden
alfabético o por algún otro principio organizador, una forma útil de hacerlo consiste en dividir los
datos en categorías o clases similares y luego contar el número de observaciones que caen
dentro de cada categoría; conexión a la colección de datos la pondremos como:
U N I V E R S I D A D D E A Q U I N O B O L I V I A
15
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Son datos no agrupados cuando se consideran y analizan todos los valores observados tal
como se obtuvieron.
Es conveniente y mas sencillo trabajar a estos datos como no agrupados cuando la muestra
no es muy grande. De preferencia que sea una cantidad menor de 30 datos.
También resulta conveniente trabajarlos así cuando se quiere que el peso de cada
observación se ve reflejado en el resumen de los datos.
Ventajas:
Resulta más fácil y rápido trabajar con los datos no agrupados.
Desventajas:
Solo se puede aplicar en pequeñas cantidades de datos, ya que en grandes
cantidades resultaría un tanto tedioso y por lo mismo existiría más probabilidad de
equivocarse.
Son datos que están organizados (formando grupos). Podemos formar más o menos
grupos, dependiendo de que tan exacto queramos trabajar, a cada grupo le llamamos clase.
Rara vez se emplean menos de seis clases o más de quince.
Ventajas:
• Facilidad y rapidez al manejo de datos.
• Se notan rápidamente el valor mayor y el valor menor de los datos
• Se puede dividir fácilmente los datos en secciones.
• Se puede observar si algún valor aparece mas de una vez en el ordenamiento.
• Se observa la distancia entre los valores sucesivos de los datos.
Frecuencia absoluta:
Llamaremos así al número de repeticiones que presenta una observación. Se
representa por ni.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
16
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Frecuencia relativa:
Es la frecuencia absoluta dividida por el número total de datos, se suele expresar en tanto por
uno, siendo su valor -iésimo
ni
fi
n
La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad.
N1 = n 1
N2 = n1+ n2
Nn = n1 + n2 + . . . . . . + nn-1 + nn=n
De igual forma, también se puede definir a partir de la frecuencia relativa, como suma de los
distintos valores de la frecuencia relativa, tomando como referencia un individuo dado. La última
frecuencia relativa acumulada es igual a la unidad.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
17
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Para apreciar a golpe de vista la magnitud o posición de las variables, se suelen efectuar una
representación gráfica, los sistemas de gráficos más usuales son:
x5
x1
x4
x2
x3
b) DIAGRAMA DE BARRAS:
Se utiliza para frecuencias absolutas o relativas, acumuladas o no, de una variable discreta. en
el eje de abscisas, situaremos los diferentes valores de la variable. en el eje de ordenadas la
frecuencia. Levantaremos barras o columnas separadas de altura correspondiente a la
frecuencia adecuada.
8
6
ni 4
2
0
x1 x2 x3 x4 x5
variable
c) HISTOGRAMA:
Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar. La diferencia :
es para variables continuas. si la amplitud del intervalo es la misma, elevaremos columnas
unidas, a altura la frecuencia correspondiente. Si la amplitud del intervalo es diferente, el
área del rectángulo columna será proporcional a la frecuencia representada.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
18
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
d) DIAGRAMA DE ESCALERA:
Se utiliza para frecuencias acumuladas.
25
20
15
10
5
0
x1 x2 x3 x4 x5
e) POLÍGONO DE FRECUENCIAS:
Es la recta que une los extremos de las variables de una distribución, un ejemplo clásico es el
de la evolución de la temperatura de un paciente
8
6
- En el primer caso: variable discreta utilizaremos sin no piden
4
nada concreto, el diagrama de barras cuando se refiera a la 2
En cambio cuando nos estemos refiriendo a la frecuencia absoluta acumulada optaremos por el
diagrama de escalera
U N I V E R S I D A D D E A Q U I N O B O L I V I A
19
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
0 1 0 4 2 2 1 2 3 2
3 2 1 3 4 2 2 3 2 1
WORK PAPER # 3
U N I V E R S I D A D D E A Q U I N O B O L I V I A
20
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
3.1. INTRODUCCIÓN
Las medidas de tendencia central son valores promedio que reflejan la tendencia de los
datos a concentrarse en torno a un valor central o de posición representativa del conjunto de
datos ordenados.
Las tres medidas de tendencia central que más comúnmente se emplean son: la media, la
mediana y la moda.
X1 + X2 + ....Xn
X=
n
Ejemplo: Si el examen final de un curso cuenta tres veces más que una evaluación
parcial, y un estudiante tiene calificación 85 en el examen final y 70 y 90 en los dos
parciales, la calificación media es:
U N I V E R S I D A D D E A Q U I N O B O L I V I A
21
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
PROPIEDADES:
La suma algebraica de las desviaciones de un conjunto de números respecto de su
media aritmética es cero.
La suma de los cuadrados de las desviaciones de un conjunto es mínima cuando dichas
desviaciones se toman respecto a la media aritmética
La media aritmética de una constante por una variable es igual al producto de la
constante por la media aritmética de la variable
La media aritmética de una constante mas una variable es igual a la constante mas la
media aritmética de la variable
3.3 LA MEDIANA.
Es aquel valor de la variable estadística que divide en dos efectivos iguales a los datos
supuestos ordenados por valor creciente. Deja el 50% de las observaciones a la izquierda y
el otro 50% a la derecha.
Me = xi / Fi = 0’5
a) CON n IMPAR:
U N I V E R S I D A D D E A Q U I N O B O L I V I A
22
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Ej:
Edad ni Ni Fi
3 8 8 0’11
4 10 18 0’26
7 9 27 0’39
9 8 35 0’5
15 20 55 0’79
25 10 65 0’93
40 5 70 1
a) 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3
U N I V E R S I D A D D E A Q U I N O B O L I V I A
23
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Para determinar la moda de datos agrupados en clases de igual tamaño su cálculo se puede realizar
de la siguiente forma:
Donde:
Ejemplo:
10 – 20 15 8
20 – 30 25 20
30 – 40 35 14
40 – 50 45 8
50 – 60 55 2
60 – 70 65 2
70 – 80 75 1
55 enfermos
atendidos
U N I V E R S I D A D D E A Q U I N O B O L I V I A
24
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Identificamos que:
Sustituyendo tenemos:
Mo = V x1x2
Ventajas:
Se define rígidamente por una formula matemática
Se utiliza cuando se quiere dar importancia a valores pequeños de la
variable
Es sensible a cualquier cambio en los valores de distribución
Su valor no es muy influenciable por los datos extremos
Es indispensable cuando se requiere sacar el promedio de una serie de
valores que estan en progresión geométrica o aproximadamente
geométrica
Su resultado puede ser usado en trabajos estadísticos posteriores
Desventajas:
Complicación de su calculo
Si cualquier dato de la serie original es 0, el promedio geométrico toma
el valor de 0
U N I V E R S I D A D D E A Q U I N O B O L I V I A
25
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
n
M_1 =
1
X1
Ventajas:
Se usa preferencialmente para calcular la velocidad media
De gran utilidad cuando la variable esta dada en forma de tasa
Con las relaciones formadas por una constante y una variable, si
queremos tomar un promedio de tales relaciones, se debe decidir si es
mejor guardar constante en el promedio, el factor que es constante en la
relación o el factor que es variable en ella
Desventajas:
Que un valor de la variable sea 0
El promedio armónico esta rígidamente definido por una formula
matemática, su valor depende de cada uno de los datos de la distribución
y el resultado no puede ser usado en cálculos posteriores.
CUESTIONARIO
1. Defina los estadígrafos de posición central
2. Cual es la relación entre media , mediana y moda
3. Como determina la media cuadratica
4. Se sabe que la media aritmética de dos números es igual a 5 y la media geométrica de los mismos
es igual a 4 ¿cuál es la media armónica?
5. Buscar la media, la mediana y la moda de los siguientes números:
25 15 28 29 25 26 21 26 <Use las fórmulas>
6. Buscar la media, la mediana y la moda de los siguientes números:
15 16 19 15 14 16 20 15 17 < No use las fórmulas
7. Se sabe que dos obreros gastan en la ejecución de un trabajo 50 y 40 minutos respectivamente
¿cuál es el tiempo requerido para hacerlo en conjunto?
8. Un grupo de 400 empleados, que tiene una compañía se dividen en operarios y técnicos con un
saldo promedio de 260.950 $. Los salarios promedios para cada uno de los grupos son de 257.300
$ y 263.400 $ respectivamente
U N I V E R S I D A D D E A Q U I N O B O L I V I A
26
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
9. Se realiza una estadística en dos centros de enseñanza, uno público y otro privado, referente a la
nota global del bachillerato de cada uno de los alumnos que van a acudir a los exámenes de
selectividad. Las distribuciones de frecuencias son las siguientes:
CENTRO PRIVADO
Nota global de Frecuencias
cada alumno
5.5 10
6.5 15
7.5 20
8.5 30
9.5 15
CENTRO PÚBLICO
Nota global de Frecuencia
cada alumno
5 .6 250
6.7 150
7.9 100
9.10 20
Se pide:
a) A la vista de la tabla, te sugiere algún comentario de especial importancia. ¿Cuál es el
motivo de que los datos se presente en dos tablas de diferente tipo ?
b) Estudiar las diferentes medidas de tendencia central (promedios) en las dos distribuciones.
En cada distribución ¿cuál te parece más representativo? ¿por qué?
c) Hallar el porcentaje de alumnos que en cada centro tiene una nota global superior al 7.
d) Hallar los Cuartiles primero y tercero de las dos distribuciones.
e) Estudiar la representatividad de las medias obtenidas en las distribuciones por separado.
¿En cuál de las dos es más representativa?
f) Dos alumnos pertenecientes el primero al centro privado y el segundo, al centro público,
solicitan una beca para continuar sus estudios en la universidad mejicana de Acapulco. el
primero tiene una nota global de un 8.5 y el otro de un 7. Si sólo se concede una beca
¿quién sería el candidato a obtenerla aplicando el criterio estadístico de la variable
tipificada?
U N I V E R S I D A D D E A Q U I N O B O L I V I A
27
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
WORK PAPER # 4
4.1 INTRODUCCION
4.2 CUARTILES
Son 4 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente,
en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados
Donde:
posición de Q1, la cual se localiza en la primera frecuencia acumulada que la contenga,
siendo la clase de Q1, la correspondiente a tal frecuencia acumulada.
Li, faa, fi, Ic : idéntico a los conceptos vistos para Mediana pero referidos a la medida de la
posición correspondiente.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
28
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
4.3 DECILES
Son 10 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente,
en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado
por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es
superado por el 90% restante)
4.4 PERCENTILES
Son 100 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente,
en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados
U N I V E R S I D A D D E A Q U I N O B O L I V I A
29
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Cuestionario
1. Con los siguientes datos calcular el primer cuartil, tercer cuartil, sexto decil y percentilo 80
a) Variable discreta:
Yj nj Nj
2 3 3
4 6 9
6 15 24
8 8 32
10 2 34
12 6 40
14 10 50
50 ----
b) Variable continua:
Yj-1 - Yj nj Nj
3.1 – 8 14 14
8.1 – 13 15 29
13.1 – 18 8 37
18.1 – 23 6 43
23.1 – 28 7 50
28.1 – 33 10 60
60 --
WORK PAPER # 5
U N I V E R S I D A D D E A Q U I N O B O L I V I A
30
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
5.1. INTRODUCCION
Las medidas de dispersión indican si los valores están relativamente cercanos uno del otro o si
se encuentran dispersos.
Las medidas de dispersión más comunes son: rango (amplitud), desviación media, varianza,
desviación estándar y coeficiente de variación. Todas estas medidas el rango toman la media
como punto de referencia. En cada caso un valor cero indica que no hay dispersión y mientras
mayor sea el valor de estas medidas es mayor la dispersión de los datos.
5.2. VARIANZA.
Es el promedio del cuadrado de las desviaciones de los datos con respecto a la media.
Es la media aritmética de los cuadrados de las desviaciones. Se denota por S2. Este valor
cuantifica el grado de dispersión o separación de los valores de la distribución con respecto a la
media aritmética. A mayor dispersión mayor valor de la varianza, a menor dispersión menor
valor de la varianza.
La fórmula para calcular la varianza es
PROPIEDADES DE LA VARIANZA.
1) La varianza es siempre un valor positivo S2 > 0
2) Si a una variable se le suma o resta una constante, la varianza permanece igual.
3) Si una variable se le multiplica por una constante, la varianza cambia multiplicándose
por la constante al cuadrado.
4) La varianza de una constante mas una variable es igual a la varianza de la variable
5) Para el calculo de la varianza de una muestra, cuando se esta trabajando con
submuestras se aplica la siguiente formula:
X1n1 + X2n2
X=
n1 + n2
U N I V E R S I D A D D E A Q U I N O B O L I V I A
31
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
S = + V s2
La desviación estándar es mas usada que la varianza. Una de sus utilidades es medir la
concentración de los datos respecto a la media aritmética.
Las medidas de dispersión que se han estudiado anteriormente son medidas absolutas y se
expresan en las mismas unidades con las que se mide la variable.
Si se necesita comparar dos o más grupos de datos medidos con diferentes unidades, por lo
general, no es posible la comparación utilizando la dispersión absoluta. Por ejemplo, una serie
de precios en dólares con una serie de precios en pesos.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
32
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
CV = d = * 100
Xm
Donde:
CV= coeficiente de variación
S = varianza
Xm = media
Es un coeficiente que sirve para ver como deben estrecharse los datos de una serie con otra
Xm – Mo
AP =
S2
Donde:
AP: asimetría de Pearson
Xm : media
Mo: moda
S2: varianza
CUESTIONARIO
U N I V E R S I D A D D E A Q U I N O B O L I V I A
33
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
48,6 50
50,0 60
60,4 40
200
WORK PAPER´S 6
6.1 INTRODUCCIÓN.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
34
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
estudiantes; superficie y precio de las viviendas de una ciudad; potencia y velocidad de una
gama de coches deportivos.
Para representar los datos obtenidos se utiliza una tabla de correlación
Una distribución de frecuencias es una herramienta estadística muy útil para organizar un grupo de observaciones.
Distribución de frecuencias: Es una serie de datos agrupados en categorías, en las cuales se
muestra el número de observaciones que contiene cada categoría.
Para la X (xi.) sería el número de veces que se repite el valor x i sin tener en cuenta los
valores de Y, la representamos por ni. .
Para la Y (y.j) sería el número de veces que se repite el valor y j sin tener en cuenta los
valores de X, la representamos por n.j .
U N I V E R S I D A D D E A Q U I N O B O L I V I A
35
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
U N I V E R S I D A D D E A Q U I N O B O L I V I A
36
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
CUESTIONARIO
1. Sea el conjunto:
Peso 50 80 75 50 60 80 55 50 60
Edad 25 38 30 22 25 30 20 25 30
Sexo M H H M H M M M H
Calcular:
Las frecuencias absolutas, relativas por cada una de las variables , interpretar
WORK PAPER # 7
La primera forma de describir una distribución bivariante es representar los pares de valores
en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama
de dispersión
U N I V E R S I D A D D E A Q U I N O B O L I V I A
37
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca
de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una
recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de
regresión.
Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será
cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a
la recta.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
38
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
La regresión lineal simple es entonces una técnica sencilla y accesible para valorar la
relación entre dos variables cuantitativas
Tiene como objeto estudiar cómo los cambios en una variable, no aleatoria, afectan a una
variable aleatoria, en el caso de existir una relación funcional entre ambas variables que
puede ser establecida por una expresión lineal, es decir, su representación gráfica es una
línea recta. Cuando la relación lineal concierne al valor medio o esperado de la variable
aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al
valor x de la variable controlada se designa por Yx y, según lo establecido, se tendrá:
Función Lineal: Y = a + bx
Parábola de segundo grado: Y = ax2 + bx + c
Función potencial: Y = cxb
Función exponencial: Y = cbx
U N I V E R S I D A D D E A Q U I N O B O L I V I A
39
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
La obtención de los valores de a y b que minimizan esta función es un problema que se puede
resolver recurriendo a la derivación parcial de la función en términos de a y b: llamemos G a la
función que se va a minimizar:
Los valores a y b también se pueden obtener de la siguiente forma: partiendo de las ecuaciones
normales tenemos
Entonces:
U N I V E R S I D A D D E A Q U I N O B O L I V I A
40
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
7.5 PREDICCIÓN.
Cuando se verifican las hipótesis sobre las que se asienta el modelo, la recta de regresión puede
ser utilizada para predecir el valor medio de la variable Y para cada valor concreto de X.
Calculando la esperanza matemática en ambos lados de la ecuación (1) se obtendrá
de modo que la línea de regresión proporciona un estimador del valor medio de Y para cada valor
de X. Como tal estimador, debemos considerar la incertidumbre asociada a esta recta, que puede
ser reflejada mediante regiones de confianza que contienen a la recta.
La ecuación Y= a +bx se puede usar para predecir o estimar la respuesta media Esperaríamos
que el error de predicción fuese mas alto en el caso de un solo valor predicho en el caso donde
se predice una media. Esto, entonces, afectara el ancho de nuestros intervalos para valores que
se predicen
Cuestionario:
U N I V E R S I D A D D E A Q U I N O B O L I V I A
41
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
1. Dada la difícil situación por la que atraviesa actualmente la empresa QUEMALAPATA en la que
hemos empezado a trabajar, se propone la reducción de determinados gastos. Para ello se estudia
la relación que existe entre dos variables como son: los gastos en publicidad (variable X) y los
beneficios (variable Y). De ambas variables disponemos de los siguientes datos:
Se pide:
¿Se puede considerar que ambas variables guardan algún tipo de relación?
Realizando un gráfico adecuado. ¿Se puede suponer que la relación que las liga es de tipo
lineal?
Construye las dos rectas de regresión mínimo cuadrática asociada con las variables.
Si la empresa para el próximo año realizará un esfuerzo para poder invertir 11.500.000 Bs
en publicidad. ¿Cuáles resultarían ser sus beneficios? ¿Con qué fiabilidad realizaría usted
la predicción?
¿Cuáles resultarían ser sus beneficios si la predicción se efectúa considerando tan solo
como variable explicativa el tiempo? ¿Cuál sería la fiabilidad de esta otra predicción?
Comente los resultados.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
42
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Como se ha puesto de manifiesto, gran parte del trabajo de un estadístico profesional se hace con
muestras. Estas son necesarias porque las poblaciones son casi siempre demasiado grandes para
estudiarlas en su totalidad. Exigiría demasiado tiempo y dinero estudiar la población entera, y tenemos
que seleccionar una muestra de la misma, calcular el estadístico de esa muestra y utilizarlo para
estimar el parámetro correspondiente de la población.
U N I V E R S I D A D D E A Q U I N O B O L I V I A
43
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
U N I V E R S I D A D D E A Q U I N O B O L I V I A
44
FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS
Después de realizar los trabajos establecidos en los puntos 1 al 5 del DIF’s # 2; con la ayuda del
software estadístico SPPS 12.2; proceder a la introducción de datos para la obtención de un archivo
con extensión .SAV.
Será necesario estudiar el tutorial de este paquete estadístico para que usando el editor de datos se
pueda permitir la entrada de la encuesta correspondiente para poder procesar la información
pertinente.
Cuestionario:
U N I V E R S I D A D D E A Q U I N O B O L I V I A
45