Está en la página 1de 14

Introducción

En este trabajo se realizará el análisis de las variables correspondientes a una


población de empresas en EE.UU. mediante los distintos análisis de la estadística
inferencial aprendidos en la materia. Para la consigna número 1 utilizaré la variable
cuantitativa continua flujo de caja en U$S (FC) de la cual extraere una muestra de
50 elementos mediante el muestreo aleatorio para el cálculo de intervalos. También
utilizaré esta variable para el desarrollo de la consigna 2b) , junto con la variable
cuantitativa continua utilidades U$S, o margen de ganancia por ventas U$S (U).. Y
por último , para la consigna 2a) utilizaré las variables cualitativas calificación (CAL)
y sector empresarial (S). A continuación están los datos mencionados anteriormente

Datos Poblacionales

N U FC S CAL
COMUNICACIÓ
1 1092.9 2576.8 N MUY BUENA
COMUNICACIÓ
2 239.9 578.3 N MUY BUENA
3 485 898.9 ENERGÍA MUY BUENA
4 59.7 91.7 ENERGÍA MEDIA
5 74.3 135.9 ENERGÍA BUENA
6 310.7 407.9 ENERGÍA MUY BUENA
7 -93.8 173.8 ENERGÍA BUENA
8 160.9 320.3 ENERGÍA BUENA
9 84.8 130.4 ENERGÍA MEDIA
10 93.8 154.6 ENERGÍA BUENA
11 167.5 304 ENERGÍA BUENA
12 121.6 172.4 ENERGÍA BUENA
13 81.7 126.4 ENERGÍA MEDIA
14 418 1462 ENERGÍA MUY BUENA
15 146.3 209.2 ENERGÍA BUENA
16 202.7 335.2 ENERGÍA MUY BUENA
17 34.7 100.7 ENERGÍA MEDIA
FINANCIAMIEN
18 14.1 24.6 TO BAJA
19 23.5 28.9 FINANCIAMIEN BAJA
TO
FINANCIAMIEN
20 54.1 72.5 TO BAJA
FINANCIAMIEN
21 25.6 37.5 TO BAJA
FINANCIAMIEN
22 -732.5 -651.9 TO BAJA
FINANCIAMIEN
23 55.6 57 TO BAJA
FINANCIAMIEN
24 40.2 51.4 TO BAJA
FINANCIAMIEN
25 22.2 26.2 TO BAJA
FINANCIAMIEN
26 37.8 56.2 TO BAJA
FINANCIAMIEN
27 26.6 34.8 TO BAJA
FINANCIAMIEN
28 201.7 246.7 TO BUENA
FINANCIAMIEN
29 108.4 131.4 TO MEDIA
FINANCIAMIEN
30 93 119 TO MEDIA
FINANCIAMIEN
31 107.6 164.7 TO BUENA
FINANCIAMIEN
32 64.9 97.6 TO MEDIA
FINANCIAMIEN
33 92.6 118.2 TO MEDIA
FINANCIAMIEN
34 -3.1 -0.3 TO BAJA
INDUSTRIA
35 72 119.5 MILITAR MEDIA
INDUSTRIA
36 400.6 754.7 MILITAR MUY BUENA
INDUSTRIA
37 55.7 70.8 MILITAR BAJA
INDUSTRIA
38 2336 3562 MILITAR MUY BUENA
39 482 792 INDUSTRIA MUY BUENA
MILITAR
INDUSTRIA
40 6555 9874 MILITAR MUY BUENA
INDUSTRIA
41 315.2 566.3 MILITAR MUY BUENA
INDUSTRIA
42 67.1 101.6 MILITAR MEDIA
MANUFACTUR
43 100.9 164.5 A BUENA
MANUFACTUR
44 -47 26.7 A BAJA
MANUFACTUR
45 70.5 164.9 A BUENA
MANUFACTUR
46 28.7 371.5 A MUY BUENA
MANUFACTUR
47 -771.5 -524.3 A BAJA
MANUFACTUR
48 131.2 256.5 A BUENA
MANUFACTUR
49 302.7 521.7 A MUY BUENA
MANUFACTUR
50 223.6 322.5 A BUENA
MANUFACTUR
51 11.1 15.2 A BAJA
MANUFACTUR
52 312.7 710.7 A MUY BUENA
53 44.8 50.5 MÉDICO BAJA
54 283.7 524.5 MÉDICO MUY BUENA
55 61.4 77.8 MÉDICO MEDIA
56 41.7 60.6 MÉDICO BAJA
57 145.7 352.2 OTRO MUY BUENA
58 -279 83 OTRO MEDIA
59 25.6 137 OTRO BUENA
60 71.7 115.4 OTRO MEDIA
61 57.6 89.2 OTRO MEDIA
62 60.6 63.7 OTRO BAJA
63 195.3 219 OTRO BUENA
64 283.6 456.5 SERVICIOS MUY BUENA
65 66.9 106.8 SERVICIOS MEDIA
66 57 93.8 SERVICIOS MEDIA
67 56.1 134 SERVICIOS BUENA
68 180.8 390.4 SERVICIOS MUY BUENA
69 235.4 361.5 SERVICIOS MUY BUENA
70 30.3 96.9 SERVICIOS MEDIA
71 63.7 133.3 SERVICIOS BUENA
72 40.6 93.5 SERVICIOS MEDIA
73 177 288 SERVICIOS BUENA
74 345.8 682.5 TRANSPORTE MUY BUENA
75 -173.5 -108.1 TRANSPORTE BAJA
76 48.8 257.1 TRANSPORTE BUENA
77 69.2 145.7 TRANSPORTE BUENA
78 -208.4 12.4 TRANSPORTE BAJA
79 35.4 92.8 TRANSPORTE MEDIA

Muestra de FC

N FC
1 2576.8
2 578.3
3 898.9
4 91.7
5 135.9
6 407.9
7 173.8
8 320.3
9 130.4
10 154.6
11 304
12 172.4
13 126.4
14 1462
15 209.2
16 335.2
17 100.7
18 24.6
19 28.9
20 72.5
21 37.5
22 -651.9
23 57
24 51.4
25 26.2
26 56.2
27 34.8
28 246.7
29 131.4
30 119
31 164.7
32 97.6
33 118.2
34 -0.3
35 119.5
36 754.7
37 70.8
38 3562
39 792
40 9874
41 566.3
42 101.6
43 164.5
44 26.7
45 164.9
46 371.5
47 -524.3
48 256.5
49 521.7
50 322.5
Consignas y Resolución

1) Con los datos seleccionados en el trabajo de estadística descriptiva


Realizar el siguiente análisis:
Seleccione una variable de interés cuantitativa continua y construya un intervalo de
confianza
para la media poblacional suponiendo que los datos provienen de una distribución
normal.

Intervalo realizado con z

Datos:
confianza = 95%
alfa = 5%
n = 50
varianza poblacional = 1434904.331
desvío estándar poblacional = 1197,87492
media muestral = 518,758
z = 1,96
Fórmula intervalos: X +- z * (desvío poblacional/ raíz (n))
Intervalo Inferior: 518,758 - 1,96 * (1197,87492 / raíz (50)) = 186,72401
Intervalo Superior: 518,758 + 1,96 * (1197,87492 / raíz (50)) = 850,79199

Conclusión
Con una confianza del 95%, se cree que el intervalo [186,72401 ; 850,79199] contendrá al
verdadero valor de la media poblacional de la variable flujo de caja en U$S

Intervalo realizado con t

Datos:
confianza = 95%
alfa = 5%
n = 50
media muestral = 518,758
varianza muestral = 2252311.897
desvío muestral = 1500.770435
t = 2.0086
Fórmula intervalos: X +- t * (desvío muestral/ raíz (n))
Intervalo Inferior: 518,758 - 2,0086 * (1500.770435 / raíz (50)) = 92,45075
Intervalo superior: 518,758 + 2,086 * (1500.770435 / raíz (50)) = 945,06525

Conclusión
Con una confianza del 95%, se cree que el intervalo [92,45075 ; 945,06525] contendrá al
verdadero valor de la media poblacional de la variable flujo de caja en U$S
2.- Para dos variables cualitativas conjuntamente:
a-Confeccionar la tabla de frecuencias conjuntas y marginales. Analizar si existe
relación entre
ambas variables (Prueba Chi cuadrado). Interpretar. Para efectuar los cálculos puede
utilizar
cualquier software de planilla de cálculo (Ej. Excel) o un software estadístico.

1)
H0 : La calificación de las empresas es independiente de su sector empresarial
H1: La calificación de las empresas no es independiente de su sector empresarial

2) alfa = 0.05

3) Variable pivotal = Doble sumatoria de la diferencia de los valores observados contra los
esperados al cuadrado sobre los valores esperados
Grados de libertad = (columnas - 1) * (filas - 1)

4)

*La región pintada será la región de rechazo*

Grados de libertad = (4 - 1) * (3 - 1) = 3 * 2 = 6
Chi cuadrado crítico (6 ; 0.95) = 12,59158

RD
Rechazo H0 si Chi cuadrado calculado >= Chi cuadrado crítico
No rechazo H0 si Chi cuadrado calculado < Chi cuadrado crítico

5) VALORES OBSERVADOS
CALIFICACIÓN
MUY
BAJA MEDIA BUENA BUENA TOTAL

COMUNICACI
ÓN 2 0 0 0 2
ENERGÍA 0 4 7 4 15
FINANCIAMIE
NTO 11 4 2 0 17
MILITAR 1 2 0 5 8
SECTO
MANUFACTU
R
RA 3 0 4 3 10
MÉDICO 2 1 0 1 4
OTRO 1 3 2 1 7
SERVICIOS 0 4 3 3 10
TRANSPORT
E 2 1 2 1 6
TOTAL 22 19 20 18 79

VALORES ESPERADOS

CALIFICACIÓN
MUY
BAJA MEDIA BUENA BUENA TOTAL
COMUNICACI
ÓN 0.56 0.48 0.51 0.46 2.01
ENERGÍA 4.17 3.6 3.8 3.42 14.99
FINANCIAMIE
NTO 4.73 4.08 4.3 3.87 16.98
MILITAR 2.23 1.92 2.03 1.82 8
SECTO
R MANUFACTU
RA 2.78 2.4 2.53 2.28 9.99
MÉDICO 1.11 0.96 1.01 0.91 3.99
OTRO 1.95 1.68 1.77 1.6 7
SERVICIOS 2.78 2.4 2.53 2.28 9.99
TRANSPORT
E 1.67 1.44 1.52 1.37 6
TOTAL 21.98 18.96 20 18.01 78.95

VALORES OBSERVADOS AGRUPADOS

CALIFICACIÓN
MUY
BAJA MEDIA BUENA BUENA TOTAL

ENERGIA, COMUNICACION Y
TRANSPORTE 4 5 9 5 23
SECT MILITAR, FINANCIAMIENTO Y
OR OTRO 13 9 4 6 32
SERVICIOS, MANUFACTURA
Y MÉDICO 5 5 7 7 24
TOTAL 22 19 20 18 79

VALORES ESPERADOS AGRUPADOS

CALIFICACIÓN
MUY
BAJA MEDIA BUENA BUENA TOTAL

ENERGIA, COMUNICACION Y
TRANSPORTE 6.4 5.52 5.83 5.25 23
SECT MILITAR, FINANCIAMIENTO Y
OR OTRO 8.91 7.68 8.1 7.29 31.98
SERVICIOS, MANUFACTURA
Y MÉDICO 6.67 5.76 6.07 5.47 23.97
TOTAL 21.98 18.96 20 18.01 78.95

Cálculos

Chi cuadrado calculado = 8.1813

6) Como 8,1813 < 12,59158 no rechazo H0


Conclusión
Con un nivel de significación de 0.05 no tengo la suficiente información para rechazar H0,
por ende se podría considerar que la calificación de la empresa sería independiente de su
sector empresarial

b- Utilice las dos variables cuantitativas continuas indicadas para usted en el mail y
realice el
Análisis de regresión y correlación. Suponga que se cumplen los supuestos.

Como ambas variables son cuantitativas continuas y aleatorias sin fijar, podre realizar tanto
el análisis de regresión lineal como el de correlación lineal. Para el de regresión fijare las
utilidades en U$S y estableceré esta variable como mi variable predictora y usare a la
variable flujo de caja como la variable respuesta, por lo tanto intentaré establecer una recta
lineal que permita calcular los valores de FC (Y) en base a los valores de U (X).

ANALISIS DE REGRESION

Primero haré la prueba de hipótesis para el coeficiente de regresión beta para confirmar que
haya pendiente

1) H0: Beta = 0
H1: Beta =/ 0

2) a = 0,05

3) variable pivotal : t = (b - Beta ) / Sb

4)

*Las regiones pintadas serán las regiones de rechazo , mientras que la region central será
la región de no rechazo*

Tcritico = T (77 ; 0,975) = 1,9901


-Tcritico = T (77 ; 0,975) = 1,9901

RD
Rechazo H0 si -Tcritico >= Tcalculado v Tcalculado >= Tcritico
No rechazo H0 si -Tcritico < Tcalculado < Tcritico

5) b = 1,4957
Sb^2 = 0.00066221
Sb = 0.0257334
t = (1,4957 - 0 ) / 0.0257334 = 58,12291

6) Como Tcalculado es mayor a Tcritico , rechazo H0.

Conclusión

Con un nivel de significación de 0.05 , tengo la suficiente información para rechazar H0, por
ende se podría considerar que hay pendiente en la recta de regresión entre las variables U
y FC y por ello habría regresión lineal entre ambas variables

Al comprobar que hay una posible recta regresión , realizare el modelo estimado de esta:

R^2 = 0,9777 lo podemos interpretar como que el modelo explica el 98% de la variabilidad.

Finalizare con el cálculo del coeficiente de correlación para confirmar que hay correlación
lineal entre ambas variables

r = 0.98878

Como el Coeficiente de correlación = 0.98878 , al estar muy próximo a 1, podemos afirmar


que la correlación entre ambas variables es muy fuerte
Conclusión

En este trabajo se realizó sobre distintas variables de una población de empresas


estadounidenses , los distintos análisis de la estadística inferencial aprendidos en la materia
, de los cuales se obtuvieron los siguientes resultados:

Intervalos para la media poblacional de la variable cuantitativa continua flujo de caja en


U$S: realizado con la distribución t [92,45075 ; 945,06525] y con la distribución z
[186,72401 ; 850,79199] . Podemos notar que los intervalos son con límites muy amplios ya
que los datos tienen una gran varianza y también podemos destacar que el intervalo
realizado con t es más amplio que el realizado con z ya que con t se supone que no
conocemos la varianza poblacional.

Análisis de existencia de relación entre las variables cualitativas cantidad de empleados


y sector empresarial, realizado con Chi cuadrado: en este análisis se realizó la tabla de
frecuencias conjuntas y marginales.y en base a eso se llegó a la conclusión de que ambas
variables serian independientes

Analisis de Regresion y Correlacion entre las variables cuantitativas continuas utilidades


U$S, o margen de ganancia por ventas U$S y flujo de caja en U$S: En este análisis se pudo
realizar ya que ambas variables eran aleatorias sin fijar y se busco encontrar un modelo
matemático lineal que permita estimar los valores del Flujo de caja en base a los valores de
las Utilidades. Este modelo estimado se encontró de la forma ^y = 1,4957 x + 87,087 y por
ende se llegó a la conclusión que habría regresión lineal y con el cálculo del coeficiente de
correlación también se comprobó que habría correlación lineal entre ambas variables

Por último , me parece importante destacar que al haber realizado tanto los análisis
aprendidos de la estadística inferencial y la estadística descriptiva sobre la misma población
, considero que en la práctica no vamos a realizar un análisis y el otro no, sino que ambos
análisis se complementan ,en cierta medida, y aportan información importante y, sobre todo
,una visión completa de la población en estudio

También podría gustarte