Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TP Estadistica1
TP Estadistica1
html
Mounted at /content/drive
a) Si elijo una país al azar ¿En qué intervalo de valores es más probable encontrar el total de casos
de este país?
b) Estimar la probabilidad de que, al elegir un país al azar, este tenga un total de casos dentro del
intervalo encontrado en el inciso anterior.
Histogramas
1 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
a) Al elegir un país al azar, el intervalo en el que es más probable que se encuentre el total de casos de
ese país es el primero. Ya que es el que tiene la mayor cantidad de países dentro de dicho intervalo. Que
va desde 0 a 1000000.
b) La probabilidad de que si elijo un país al azar, este tenga un total de casos dentro del intervalo antes
mencionado se calcula de la siguiente manera:
24
P (intervalo) = (2)
40
24
= 0.60 (3)
40
2 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
b) ¿Se puede distinguir algún valor atípico a partir de estos diagramas? ¿Qué característica tiene que
tener un valor para considerarse atípico?
c) Quitar los valores atípicos y mostrar el diagrama de cajas sin ellos. Indicar donde se encuentra el
primer, segundo y tercer cuartil.
Gráficos de caja
3 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
a) EL 50% de los valores centrales se concentra en el intervalo que va desde el primer cuartil hasta el
tercer cuartil. Que en este caso particular para la variable 'Total de casos' es el [24767; 2068021]
b) A partir de este diagrama, resultan fácil de detectar los valores atípicos a simple vista ya que son
aquellos que van mas allá de los 'bigotes' del gráfico. Para considerarse valor atípico, debe estar alejado
del primer o tercer cuartil en más de 1.5 Rango intercuartílico, el Rango intercuartílico se calula como:
c) Diagrama de cajas para la variable 'Total de casos' pero sin los valores atípicos.
4 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
C) El primer cuartil es el limite inferior de la caja, el tercer cuartil es el límite superior de la caja y la
mediana es la línea horizontal que divide la caja. En este caso particular los valores son: Primer cuartil:
24767, Mediana: 374371, Tercer cuartil: 2068021.
D) A diferencia de un histograma, en el cual podemos ver la distribución de los datos. El gráfico de cajas
nos permite visualizar el centro, la dispersión la simetría de los datos y la presencia de valores atípicos.
a) A partir de una muestra aleatoria cualquiera M = {X1, X2, ..., X40} de 40 valores para una
población con media μ y varianza σ2:
5 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
1. a)
A continuación se presenta gráfico de distribución de las medias muestrales de la variable total de casos.
Tomando 1000 muestras con un tamaño de muestra n=40. Si bien la distribución de la población no es
normal, por el teorema central del límite podemos observar como la distribución de las medias
muestrales se va aproximando a una campana, es decir, a una Distribución Normal.
Intervalo de confianza
• Cálculos necesarios para obtener intervalos.
6 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
1. b)
¯x
¯¯ − μ
Z= (6)
σ/√n
z0,025 = 1, 96 (10)
• Resolvemos:
[1032230; 6888791]
Para obtener un intervalo mas chico deberíamos tomar muestras mas grandes y así obtendríamos una
mayor precisión.
1. Realizar un gráfico de total de casos en función de la población. ¿Nota alguna relación entre estas
variables?. Estimar el coeficiente de correlación lineal entre ambas. ¿Qué significa su valor?
7 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
Se puede ver a simple vista como al aumentar el tamaño de la población también aumenta el número
total de casos
A partir de la estimación del coeficiente de correlación lineal podemos ver que tan lineal es la relación
entre ambas variables. Este se calcula de la siguiente manera:
cov(x,y)
ρx y = (11)
σx . σy
El coeficiente de correlación lineal puede tomar valores desde -1 a 1, siendo 1 una relación
perfectamente lineal y -1 una relación perfectamente lineal inversa. En este caso, con los datos que
tenemos nos arrojó un resultado de 0.8979.
8 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
5) Encontrar los coeficientes β0 y β1 por mínimos cuadrados de la recta que mejor ajusta a estas
variables.
b) Estimar el total de casos de COVID para una población de 400 millones de personas.
¿Qué tanta confianza tengo en esta estimación?
d) Comparar este coeficiente con la regresión para el total de casos en función del total de
vacunados. ¿A qué se debe esta diferencia?
9 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
Df Model: 1
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The condition number is large, 2.91e+07. This might indicate that there are
β1 = 0.3913
b) Debido a que el rango de nuestra variable explicativa va desde 12668 a 85341241, no podemos
estimar la cantidad de casos para una población de 400000000, ya que no sabemos como se comporta la
relación entre las dos variables fuera de nuestro rango.
10 de 11 11/12/2023, 12:55
tp_estadistica1 file:///C:/Users/54116/Downloads/tp_estadistica1.html
c) El coeficiente de determinación nos permite saber que proporción del comportamiento de la variable
dependiente puede ser explicado por el modelo de regresión lineal.
SCE
r2 = 1 − (12)
STC
Para nuestro caso particular, el valor del coeficiente de determinación es de 0.80, por lo que en
proporción el 80% de los cambios de "y" pueden ser explicados por el modelo de regresión lineal.
d) El coeficiente de determinacion para el total de casos en función del total de vacunados es de 0.93,
por lo que los cambios en la variable dependiente 'total de casos' se puede explicar en un 93% mediante
el modelo de regresión lineal.
11 de 11 11/12/2023, 12:55