Está en la página 1de 19

EJERCICIOS PROPUESTOS

Departamento de Economía Aplicada


Universidad Autónoma de Madrid
Estadística Teórica
Tema 1
Introducción a la Probabilidad

1.- A lo largo del último año se ha realizado un estudio de las diversas iniciativas legislativas
presentadas y aprobadas. Para ello, se han obtenido las probabilidades de que una iniciativa
legislativa sea aprobada o rechazada en función del grupo parlamentario que la presenta. Los
resultados se recogen en la siguiente tabla:

Resto de grupos
Gobierno Oposición
parlamentarios

Se aprueba 0,2 0,1 0,02

Se rechaza 0,12 0,35 0,21

a) ¿Cuál es la probabilidad de que una iniciativa legislativa haya sido presentada por la
oposición? Sol. 0,45

b) ¿Cuál es la probabilidad de que no se apruebe una iniciativa legislativa? Sol. 0.68

c) ¿Cuál es la probabilidad de que se apruebe una iniciativa legislativa presentada por el


gobierno o la oposición? Sol 0,39

d) ¿Cuál es la probabilidad de que una iniciativa legislativa presentada por el resto de


grupos parlamentarios no se apruebe? Sol 0,91

e) ¿Cuál es la probabilidad de que una iniciativa legislativa que no haya sido presentada
por el gobierno se apruebe? Sol. 0.18

2.- Dos carreteras salen de una cárcel. Un preso se escapa de la cárcel y elige una carretera
aleatoriamente. Si la carretera I es elegida, la probabilidad de escapar es de 0.25, si la carretera
II es elegida, la probabilidad de éxito es 0.10. Se pide:

a) ¿Cuál es la probabilidad de que el preso tenga éxito en su escapada? Sol. 0,175

b) Si el prisionero escapa con éxito, ¿Cuál es la probabilidad de que escapara utilizando la


carretera I? ¿Y la II? Sol. 0,71 y 0,28 respectivamente

3.- Según una encuesta realizada por una conocida revista, el 33% de los hombres han sido
infieles alguna vez, mientras que en el caso de las mujeres este porcentaje es del 23%.

Se pide:

a) Suponiendo que son independientes ambos sucesos en una pareja. ¿Cuál es la


probabilidad de que en una pareja heterosexual ambos hayan sido infieles alguna vez?
Sol. 0,0759
b) De la población donde se ha realizado la encuesta (en la que el 45% eran mujeres) se
elige a una persona al azar y resulta que ha sido infiel. ¿Cuál es la probabilidad de que
sea mujer? Sol. 0,3632

4.- Tres compañías de seguros copan el mercado de una ciudad. El 30% de las pólizas suscritas
corresponden a la compañía A, el 25% a la B y el 45% restante a la compañía C. El porcentaje de
pólizas de seguros de vida en cada una de ellas es del 15 y 20 y 25% respectivamente.

a) ¿Qué proporción del total de las pólizas suscritas corresponde a seguros de vida? Sol.
0,2075
b) Un individuo ha suscrito un seguro de vida ¿cuál es la probabilidad de que su póliza sea
de la compañía A? Sol. 0,2168
Estadística Teórica
Tema 2
Variables Aleatorias

1.- Sea la variable aleatoria x definida por su función de distribución:

0 x0
 2
x / 2 0  x 1

F ( x) = 
x / 2 1 x  2


 1 2 x

Se pide:

a) Obtenga la función de densidad. Sol f(x)=x para x entre 0 y 1 incluídos, ½ para entre
entre 1 (no incluido) y 2 (incluído), o resto.

b) Calcule la esperanza matemática de x. Sol. 1,08

2.- Se quiere caracterizar la variable aleatoria resultado de lanzar un dado de seis caras bien
construido. Para ello se pide:

a) Construir la función de cuantía y la función de distribución.

b) ¿Cuál es la probabilidad de obtener un valor mayor que 2 y menor o igual que 5? Sol.
0.5

c) ¿Cuál es la probabilidad de obtener un valor mayor que 4? Sol 1/3

3.- Suponga que los gastos mensuales en alimentación de una familia en miles de euros es una
variable aleatoria cuya función de densidad es:

2(1 − x) 0  x  1
f ( x) = 
0 resto
Determine:

a) El gasto medio en alimentación. Sol 1/3 miles de euros

b) La varianza de esa variable aleatoria. Sol. ≈ 0,0556 de euros2

c) La probabilidad de que el gasto en alimentación supere los 500 euros. Sol. 0,25
4.- X e Y dos variables aleatorias independientes con varianzas finitas. Se sabe, además, que la
E[X]=E[Y]. Si V[X]=V[Y]=2, determinar los valores de V[X-Y] Sol. = 4 y de V [3X-2Y+1] Sol =26

5.- Demuestre a qué es igual la varianza de una diferencia de variables aleatorias (X e Y).
Estadística Teórica
Tema 3
Modelos de Probabilidad: variables discretas y continuas

1.- Un banco sabe que solamente el 2% de las hipotecas concedidas para compra de vivienda
resultan impagadas. Si una de sus sucursales ha concedido en el mes de Abril 150 hipotecas,
¿cuál es la probabilidad de que:

a) todas ellas se amorticen? (ninguna quede impagada) Sol. 0,0483

b) menos de dos queden impagadas? Sol. 0,196

c) como máximo tres queden impagadas? Sol. 0,6953

d) Si el banco tiene 400 sucursales y cada una de ellas concedió 150 hipotecas en el mes de
abril, ¿cuál es la probabilidad de que el número total de impagadas sea superior a 1.100?
Sol. 0,9982

2.- Tres amigos que decidieron dedicarse a la venta de cd's de videojuegos pirata, han estudiado
sus ventas a lo largo de un periodo suficientemente largo y observan que las ventas diarias
medias son de 1.800 euros, con una desviación típica de 80 euros.

a) Si supiera que la distribución de las ventas sigue una normal, con la media y desviación
típica indicadas anteriormente, ¿cuál sería la probabilidad de que la diferencia en valor
absoluto entre la variable aleatoria (ventas diarias) y su esperanza matemática no
supere el valor de 150 euros? Sol. 0,9392
b) Si supone que las ventas de cada día son independientes, se distribuyen siguiendo una
normal con la media y varianza indicada anteriormente y que venden los 365 días del
año, ¿cuál es la probabilidad de que las ventas anuales superen los 655.000 euros? Sol.
0,905
c) ¿Cuándo decimos que una variable aleatoria es continua? ¿Cuándo decimos que es
discreta? En el caso de la variable aleatoria utilizada en el último apartado de este
problema (ventas anuales), ¿cómo la clasificaría? ¿Por qué?

3.- La probabilidad de que un automóvil sufra un accidente de tráfico un día cualquiera es 0,1.
Se pide:

a) En una familia que tiene cuatro coches, calcule la probabilidad de que al menos uno
sufra un accidente. Sol. 0,3439
b) En una ciudad que tiene 1.000.000 de coches calcule la probabilidad de que el número
coches accidentados sea, al menos, de 200.000. Sol. 0

4.- Una máquina produce un 10% de piezas defectuosas. Se pide:

a) ¿Cuál es la probabilidad de que en un lote de 1.000 piezas existan, como máximo 100
piezas defectuosas? Sol. 0,5
b) Si cada día la máquina fabrica 10 piezas ¿qué probabilidad hay de que en un día
cualquiera produzca como máximo un defecto? Sol. 0,73
c) Determinar la probabilidad de que en 3 días de una semana (semana de 5 días) se
produzca como máximo un defecto. Explique este resultado en términos de porcentaje.
Sol. 0,2777

5.- Una empresa aseguradora concluye, a partir de la información contenida en su base de datos,
que el número diario de accidentes en carretera de sus clientes sigue una distribución normal
de media 20 y desviación típica 15.

a) ¿Qué cifra diaria de accidentes no se superará con una probabilidad del 40%? Sol. 16,25
b) La empresa decide fusionarse con otra aseguradora en la que le número de accidentes
diarios se distribuye como una normal de media 22 y desviación típica 10. ¿Cuál será la
probabilidad de que en la fusión se superen los 50 accidentes diarios? Sol. 0,33

6.- Las calificaciones en estadística de los alumnos de una clase siguen una distribución normal
con media 5,18 y desviación típica de 1,95. Una empresa encargada de realizar estudios por
muestreo desea contratar a aquellos alumnos que hayan sacado más de 8 puntos.

a) ¿Cuál será la probabilidad que tiene un alumno de la clase de ser contratado? Sol.
0,0749
b) ¿Cuál será la probabilidad de que en una clase de 10 sean contratados menos de 2
alumnos? Sol. 0,8307

7.- A una parada llega un tren de cercanías con X viajeros. En dicha parada bajan Y viajeros y
suben Z viajeros. Sabiendo que las variables aleatorias X, Y y Z siguen una distribución normal
con los siguientes parámetros:

X→N(100,20) Y→N(30,12) Z→N(40,9)

Se pide:

a) Probabilidad de que suban entre 35 y 45 viajeros. Sol. 0,4176

b) Calcule el percentil 95 de los viajeros que descienden. Sol. 10 viajeros

c) Cuál es la probabilidad de que el número de viajeros con los que parte el tren (los que
llegan menos los que bajan más los que suben) sea inferior a 70. Sol. 0,0547
Estadística Teórica
Tema 4
Introducción a la Inferencia Estadística

1.- Se sabe que el peso de los jóvenes entre 14 y 18 años sigue una distribución normal con
media 50 kg y desviación típica 25 kg. Para llevar a cabo un estudio del control de peso se
seleccionan aleatoriamente 100 jóvenes cuyas edades se encuentran comprendidas en el
intervalo señalado. Si el peso medio muestral está entre 45 y 70 kg se considera que están dentro
de los límites normales. ¿Cuál es la probabilidad de que el peso medio esté fuera de control?
Sol. 0,0228

2.- Se ha estimado que el 43% de los recién licenciados en periodismo considera que es muy
importante tener un curso de ética en su carrera. Los rectores de las universidades de Madrid
están considerando la posibilidad de incluir una asignatura de ética en la licenciatura de
periodismo. Para asegurarse de que cuentan con el respaldo de la mayoría de los recién
licenciados encargan un estudio en el que recaban información de una muestra de 80 individuos
que han terminado periodismo en los últimos años en cualquiera de las universidades de
Madrid. ¿Cuál es la probabilidad de que más de la mitad de los individuos de la muestra opine
que se debe estudiar ética en la carrera de periodismo? Sol. 0,1038

3.- Un pediatra del Hospital Niño Jesús está haciendo un estudio sobre la dispersión de los pesos
de los recién nacidos en la Unidad de Neonatología durante un año determinado. Por los datos
de años anteriores, sabe que la distribución de dichos pesos sigue una distribución normal de
varianza 0,55. ¿Cuál es la probabilidad de que tomando una muestra aleatoria de 30 bebés la
dispersión de sus pesos sea superior a 0,305 gramos al cuadrado? Sol. 0,975

4.- Un profesor de universidad con una dilatada experiencia en corrección de exámenes sabe
que las calificaciones de los alumnos en una asignatura se distribuyen según una N (6; 1,5). En
la última convocatoria pide a sus ayudantes que obtengan una MAS de tamaño 46 y le den una
calificación media de los alumnos presentados a ese examen. Éstos le dicen que la nota media
ha sido de 6,3. El profesor sospecha que sus ayudantes no han tomado la muestra y que se han
inventado los datos. Así que les dice que sólo lo aceptará como correcto si la probabilidad de
obtener una media muestral igual o superior a la observada es mayor del 10% y que en caso
contrario les hará corregir todos los exámenes.

a) Según los datos de que dispone, ¿qué cree que deberán hacer los ayudantes? Sol. Corregir
todo

b) ¿Cambiaría su respuesta si el profesor desconociera la varianza poblacional? Los resultados


de la muestra indican que la media es de 6,3 y la desviación típica de 1,8. Sol. No corregir.
5.- Se conocen los pesos de los alumnos de dos grupos distintos (grupo A y grupo B). Se va a
tomar, de manera independiente, una muestra aleatoria simple de cada uno de los grupos. En
particular, las medias y varianzas de los pesos de los alumnos, así como el tamaño de las
muestras se han recogido en la tabla siguiente:

Grupo A Grupo B
Media de la población (kilos) 68 70
Varianza muestral 11 9,5
Tamaño de la muestra 100 75

¿Cuál es la probabilidad de que la media muestral del grupo B supere a la media muestral del
grupo A en al menos 2 kilos y 200 gramos? Sol. 0,3536
Estadística Teórica
Tema 5 Métodos de Estimación. Propiedades de los estimadores
puntuales

1.- En una distribución normal de media desconocida y varianza poblacional de 25 se toman


muestras aleatorias simples de tamaño 3. Se proponen los siguientes estimadores de la media
poblacional:

1 = 0,65 X 1 + 0,25 X 2 + 0,10 X 3

 2 = 2 X 3 − X 1

X1 + X 2 + X 3
 3 =
3
a) ¿Son estos estimadores insesgados? Sol. si
b) ¿Cuál de los tres es más eficiente? Sol. El tercero.

2.- Se sabe que las ventas en euros de un establecimiento comercial siguen una distribución
normal de media desconocida y desviación típica 10.000 euros. Se anotan las ventas a lo largo
de cinco días y resultan ser: 120.000 euros, 132.000 euros, 118.000 euros, 106.000 euros y
124.000 euros.

a) Obtenga el estimador máximo-verosímil y demuestre si es insesgado y consistente.


b) Además, sabiendo que la cota de FCR es 2/n, analice si el estimador es eficiente.
c) Calcule la estimación puntual de las ventas medias para esos 5 días. Sol. 120.000

3.- El número de estudiantes por día que atiende un profesor en sus tutorías de la Universidad
es una variable aleatoria que se comporta como una Poisson de parámetro , que es
desconocido.

a) Determine el estimador máximo verosímil del parámetro. Sol media muestral.


b) Analice si es insesgado y consistente. Sol Si.
c) Sabiendo que la cota FCR es /n, analice si el estimador es eficiente . Sol. Si.
d) El profesor ha tomado una muestra aleatoria de 50 días de tutoría y anota el número de
estudiantes que han asistido. El número total de estudiantes que asistieron a tutorías en
esos 50 días fue de 250. Con estos datos, ¿podría ofrecer una estimación del parámetro 
desconocido? Sol. 5

4.- Se propone como estimador de la proporción poblacional de una variable aleatoria → B (1,p)
la proporción muestral. Analice la bondad de este estimador desde el punto de vista de la
propiedad de insesgadez. Sol. Insesgado, eficiente, consistente
5.- El equipo de gobierno de una Universidad encarga un estudio sobre la inserción laboral de
los titulados universitarios. Una de las variables que más interés suscita es la proporción de
estudiantes que encuentra trabajo durante el año siguiente a su licenciatura. Para ello toma
una muestra aleatoria simple de 556 estudiantes de los que 428 contestan que sí han
encontrado trabajo durante el año siguiente a su licenciatura.

a) Obtenga el estimador máximo verosímil de la proporción de estudiantes que encuentra


trabajo el primer año. Sol. proporción muestral.
b) Demuestre si es insesgado. Sol. Insesgado
c) A partir de los resultados muestrales, ¿cuál sería la estimación de alumnos que encuentran
trabajo en el primer año. Sol 0,7697
Estadística Teórica
Tema 6
Estimación por intervalos

1.- El consumo diario de electricidad de las familias de una determinada comunidad de vecinos,
expresado en Kw/hora, es una variable aleatoria que se supone aproximada por una distribución
normal cuya varianza es desconocida. Se quiere estimar la media de dicha distribución y para
ello se toma una muestra de 40 familias de dicha población que ha dado los siguientes
resultados: la media muestral = 428 Kw/h y Sx = 28 Kw/h. Obtenga el intervalo de confianza del
90% para la media. Sol. (420,64; 435,35)

2.- Como consecuencia del aumento del IPC en los últimos meses, la Organización de
Consumidores y Usuarios (OCU) está elaborando un informe acerca de los gastos que los
hogares españoles van a destinar a productos navideños durante las fiestas de este año. Por
información de años pasados, la OCU sabe que este gasto puede considerarse como una
variable aleatoria que sigue una distribución normal y cuya desviación típica es de 150 €. Para
estudiar la situación en las presentes navidades, se extrae una muestra aleatoria de 1.000
hogares, a los que se les pregunta cuánto estiman que gastarán durante estas navidades. De
esta encuesta se obtiene que los hogares realizarán unos gastos medios de 600 €.

a) Construya un intervalo de confianza (a un 90% de confianza) para los gastos medios de estas
navidades. Sabiendo que durante las pasadas navidades los gastos medios fueron de 500 €, ¿se
puede afirmar que en estas fiestas los gastos medios de los hogares españoles serán distintos a
los de las anteriores? Sol. a (592,23; 607,7)

b) ¿Cómo cambiaría el intervalo anterior si el nivel de confianza aumentara al 99 %? Razone su


respuesta dando argumentos estadísticos sin necesidad de realizar cálculos.

c) Si se quisiera obtener un intervalo de confianza para los gastos medios de las actuales
navidades que fluctuara entre 593,92 € y 606,07 €, ¿cuál sería el nivel de confianza con el que
se podría ofrecer dicho intervalo? Comente los resultados. Sol. Al 80%

d) Si la OCU hubiese determinado que el tamaño de muestra anterior (1000 hogares) es


demasiado elevado en términos de coste, ¿cuál sería el tamaño de muestra que se hubiese
necesitado para conseguir, a un 90 % de confianza, un intervalo de longitud 50 €? n=96,82

3.- Una compañía de telefonía móvil desea estudiar la variable aleatoria número de horas que
cada mes usan del teléfono móvil los hombres y las mujeres. Estudios anteriores han revelado
que se trata de distribuciones normales y que la desviación típica de la variable en el caso de las
mujeres es de 10 y la de los hombres es de 8. Además, ha obtenido una muestra de 100 mujeres
y 75 hombres. Tras procesar los resultados de la encuesta, observa que el tiempo medio de uso
de las mujeres es de 31 horas, mientras que en caso de los hombres, el tiempo medio de uso es
de 25.

a) Obtenga el intervalo de confianza del 95% para la diferencia de medias del tiempo de uso de
teléfono móvil entre mujeres y hombres. ¿Cómo interpreta el hecho de que en el intervalo
anterior esté a la derecha de cero (valores por encima de cero)?
b) Si se aumenta el tamaño de ambas muestras ¿Cómo espera que sea la amplitud del intervalo
respecto al obtenido en el apartado anterior?
c) Con los datos del problema se ha obtenido un intervalo de confianza para la diferencia de
media que resulta ser (3,76; 8,23). ¿Podría decir a qué nivel de confianza se ha realizado en
intervalo? Sol. a (3,33; 8,66) c) al 90%

4.- Una variable aleatoria X se distribuye como una normal de parámetros  y σ. Se selecciona
una MAS cuyas realizaciones resultan ser:

2,7; 2,71; 2,70; 2,76; 2,74; 2,78; 2,73

Construya un intervalo de confianza para la varianza poblacional al 98%. Sol. (0,00034; 0,0065)

5.- Dos atletas que compiten en la prueba de los 200 metros lisos desean comparar los tiempos
que pueden realizar. Para ello toman muestras independientes. El atleta A corre en 200
ocasiones y obtiene una media de 20,01 segundos con una dispersión de 0,1 segundo. El atleta
B corre en 100 ocasiones con un tiempo medio de 19,9 segundos y una desviación típica de 0,4
segundos.

a) Calcule el intervalo de confianza al 95% de la diferencia de tiempos medios entre ambos


atletas e intérprete el resultado obtenido. Sol. (0,051; 0,169) En media A tarda más que B, B es
más rápido.
b) ¿De qué factores depende la amplitud del intervalo?

6.- Una productora de cine realizó una encuesta en Madrid tomando una muestra aleatoria
simple de 1.000 personas y preguntándoles si estarían dispuestas a actuar como extras en la
próxima película de Almodóvar. Resultó que 750 de ellas respondieron afirmativamente. De
manera independiente, se realizó una encuesta similar para una película de Peter Jackson y, de
los 1.500 entrevistados, 900 estarían dispuestos a actuar como extras. Construya un intervalo
de confianza al 95 % para la diferencia entre las proporciones de respuestas favorables entre los
dos directores de cine. Sol. (0,1135; 0,1865)
Estadística Teórica
Tema 7
Contrastes paramétrico de hipótesis estadísticas

1.- Existe un gran debate sobre las posibilidades de Fernando Alonso de conseguir su tercer
mundial de Fórmula 1. Los comentaristas de la cadena de TV española son grandes defensores
de Alonso, y consideran que la probabilidad de éxito es del 50%, mientras que los comentaristas
de la cadena de TV inglesa creen que las posibilidades de Alonso son menores del 50%). Para
dilucidar la cuestión, se decide realizar un muestreo aleatorio simple y preguntar a sus
espectadores. Los resultados muestran que 82 individuos, de un total de 200, creen que ganará
Alonso. ¿Qué podría decir sobre las hipótesis planteadas a un 5% de significación? Sol. Rechazo
Ho. La TV inglesa tiene razón.

2.- La DGT desea analizar si la nueva normativa del carné por puntos ha disminuido la velocidad
media a la que circulan los automóviles. Antes de la entrada en vigor de la normativa, la
velocidad media en un punto concreto de una autopista era de 140 Km/h, y además se sabía
que la variable sigue una distribución normal. Para contrastar las hipótesis se ha tomado una
muestra aleatoria simple, observando la velocidad a la que circulaban 30 vehículos. Tras
procesar los resultados de la muestra, se obtiene una velocidad media de 138 Km/h y una
desviación típica de 5. Se pide:

a) Con los resultados que aporta la muestra, y a un 5% de significación, qué podría decir sobre
las hipótesis planteadas. (Cuáles son las hipótesis nula y alternativa, y qué decisión tomaría)
b) ¿Qué decisión tomaría si el contraste lo realiza al 1%? Represéntelo gráficamente.
Sol. a) Rechazo Ho al 5%. b)No rechazo al 1%

3.- Los miembros de una asociación de estudiantes van a organizar un acto cultural. Uno de ellos
cree que la asistencia media a este tipo de actos es de 40 alumnos, en cuyo caso bastaría reservar
un seminario. Otro opina que la asistencia es habitualmente mayor, y que convendría reservar
un aula más grande. En vista de ello deciden revisar las notas que conservan de actividades
similares organizadas anteriormente, y observan que la asistencia media a los 16 últimos actos
organizados fue de 56 alumnos, con una desviación típica de 18. Decida a un nivel de
significación del 5% qué tipo de aula sería más razonable reservar (se supone que el número de
asistentes sigue una distribución normal) Sol. Rechazo Ho, reservar una mayor.

4.- En un informe presentado por un reportero a una revista feminista se afirma que el número
medio de horas semanales de conexión a Internet es el mismo para hombres que para mujeres.
Sin embargo no parece prudente publicar estos datos sin contrastarlos estadísticamente. Se
selecciona para ello una muestra de 75 hombres y 50 mujeres. Los resultados muestrales se
recogen en la siguiente tabla:

Hombres Mujeres
Tamaño muestral 75 50
Número medio de horas/semana 7,42 5,34
Desviación típica muestral 9,08 7,24
Cuasidesviación típica muestral 9,14 7,31
a) Formule el contraste a realizar y señalar los supuestos que se deben realizar para
resolver el ejercicio.
b) Determine la región crítica del contraste. Sol >1,96; <-196
c) Calcule el estadístico del contraste. Sol. 1,34
d) ¿Existe evidencia para rechazar la hipótesis nula a un nivel de significación del 5%? Sol.
No rechazo Ho al 5%.
5.- A partir de los datos proporcionados por el observatorio de empleo de la Universidad
Autónoma de Madrid https://goo.gl/FocnHg se han analizado los datos para una muestra de
titulados en ADE y otra muestra de Maestro (Infantil y Primaria). Se ha hecho un análisis
descriptivo, solicitando un intervalo de confianza al 95%. Además, se ha hecho un contraste de
diferencia de medias bajo el supuesto de varianzas desconocidas pero iguales. Los resultados
obtenidos son:

Salarios del último empleo ADE Maestros

Media 989,160839 775,531915


Error típico 31,6575628 35,40766
Mediana 1050 750
Moda 1050 300
Desviación estándar 378,569391 420,442667
Varianza de la muestra 143314,784 176772,036
Curtosis 2,1580822 0,51922882
Coeficiente de asimetría 0,2035254 0,62042583
Rango 2400 1950
Mínimo 300 300
Máximo 2700 2250
Suma 141450 109350
Cuenta 143 141
Nivel de confianza(95,0%) 62,5810173 70,0028448
Extremo Inferior IC 926,579822 705,52907
Extremo Superior IC 1051,74186 845,53476

Prueba t para dos muestras suponiendo varianzas iguales

Salarios del último empleo ADE Maestros


Media 989,160839 775,531915
Varianza 143314,784 176772,036
Observaciones 143 141
Varianza agrupada 159924,767
Diferencia hipotética de las medias 0
Grados de libertad 282
Estadístico t 4,50112003
P(T<=t) una cola 4,9492E-06
Valor crítico de t (una cola) 1,65027497
P(T<=t) dos colas 9,8984E-06
Valor crítico de t (dos colas) 1,96841184

Haz un breve informe sobre los salarios que cobran los graduados en el último empleo con los
resultados obtenidos a partir de los datos facilitados por el observatorio de empleo de la UAM.
6.- A partir de los datos proporcionados por el observatorio de empleo de la Universidad
Autónoma de Madrid https://goo.gl/FocnHg se han analizado los datos para una muestra de
titulados en ADE y otra muestra de Economía. Se ha hecho un análisis descriptivo, solicitando
un intervalo de confianza al 95%. Además, se ha hecho un contraste de diferencia de medias
bajo el supuesto de varianzas desconocidas pero iguales. Los resultados obtenidos son:

Salario del Primer Empleo ADE Economía

Media 507,831325 591,304348


Error típico 41,527918 42,5622823
Mediana 300 300
Moda 300 300
Desviación estándar 378,337339 353,548869
Varianza de la muestra 143139,142 124996,803
Curtosis 12,6507537 -1,34132386
Coeficiente de asimetría 2,86425909 0,57797731
Rango 2400 1050
Mínimo 300 300
Máximo 2700 1350
Suma 42150 40800
Cuenta 83 69
Nivel de confianza(95,0%) 82,6122564 84,9317109
Extremo Inferior IC 425,219069 506,372637
Extremo Superior IC 590,443582 676,236059

Prueba t para dos muestras suponiendo varianzas iguales

Salario del Primer Empleo ADE Economía


Media 507,831325 591,304348
Varianza 143139,142 124996,803
Observaciones 83 69
Varianza agrupada 134914,615
Diferencia hipotética de las medias 0
Grados de libertad 150
Estadístico t -1,39494935
P(T<=t) una cola 0,08254662
Valor crítico de t (una cola) 1,6550755
P(T<=t) dos colas 0,16509324
Valor crítico de t (dos colas) 1,9759053

Haz un breve informe comparando sobre los salarios que cobran los graduados en ADE y en
Economía en el primer empleo con los resultados obtenidos a partir de los datos facilitados por
el observatorio de empleo de la UAM.
7.- A partir de los datos proporcionados por el observatorio de empleo de la Universidad
Autónoma de Madrid https://goo.gl/FocnHg se han analizado los datos para una muestra de
titulados con buen expediente (notable, sobresaliente, matrícula) y otra muestra titulados con
sólo aprobado. Se desea analizar si la proporción de titulados que están trabajando difiere según
el expediente. (SE usará una variable en la que si trabaja, está codificado como 1; y si no trabaja
como 0). Para ello se ha hecho un análisis descriptivo, solicitando un intervalo de confianza al
95%. Además, se ha hecho un contraste de diferencia de proporciones bajo el supuesto de
varianzas desconocidas pero iguales. Los resultados obtenidos son:

Estadística Descriptiva
Proporción de graduados que trabaja Buen Expediente Aprobado

Media 0,622 0,587


Error típico 0,014 0,021
Mediana 1 1
Moda 1 1
Desviación estándar 0,485 0,493
Varianza de la muestra 0,235 0,243
Curtosis -1,749 -1,881
Coeficiente de asimetría -0,504 -0,355
Rango 1 1
Mínimo 0 0
Máximo 1 1
Suma 721 313
Cuenta 1159 533
Nivel de confianza(95,0%) 0,028 0,042
Extremo Inferior 0,594 0,545
Extremo Superior 0,650 0,629

Prueba t para dos muestras suponiendo varianzas iguales

Proporción de graduados que trabaja Buen Expediente Aprobado


Media 0,622 0,587
Varianza 0,235 0,243
Observaciones 1159 533
Varianza agrupada 0,238
Diferencia hipotética de las medias 0
Grados de libertad 1690
Estadístico t 1,366
P(T<=t) una cola 0,086
Valor crítico de t (una cola) 1,646
P(T<=t) dos colas 0,172
Valor crítico de t (dos colas) 1,961

Haz un breve informe explicando si la proporción de graduados que trabaja al año y medio de
terminar es diferente según su expediente.
8.- Se ha repetido el análisis en Excel con los datos del ejercicio anterior, pero usando las
fórmulas de cálculo de intervalos de confianza y contrastes de hipótesis.

Fórmula de cálculo para los intervalos de confianza:

   
 pq
 p  z 
 2
n 
 
 
z en tablas N(0,1)
2
Fórmula de cálculo el valor experimental para el contraste de diferencia de proporciones.

( pˆ x − pˆ y ) − ( p x − p y ) H 0

ˆp (1 − pˆ ) + 
1 1
n m
Los resultados se resumen a continuación.

Proporción de graduados que trabaja Buen Expediente Aprobado Todos


p* (muestral) 0,622 0,587 0,611
q* (muestral) 0,378 0,413 0,389
Tamaño muetral 1159 533
Valor tablas (95%) 1,960 1,960
Intervalo de Confianza
Extremo Inf. 0,594 0,545
Extremo Sup. 0,650 0,629
Contraste de Hipótesis
Valor Experimental 1,366
Valor Crítico 5% dos colas 1,960
Valor crítico 5% una cola 1,645
p-valor una cola 0,086
p-valor dos colas 0,172

Como se observa, los resultados son muy similares. Explica por qué crees que los cálculos con
proporciones y con medias muestrales son tan parecidos. ¿Crees que sucedería lo mismo si la
variable que indica si está trabajando o no estuviera codificada de otro modo? Argumenta tus
respuestas.

También podría gustarte