Está en la página 1de 16

CLASIFICAR A CADA UNA DE LAS VARIABLES DE LA

BASE DE DATOS

X1: Gnero. Variable categrica nominal


X2: Edad. Variable numrica discreta
X3: Origen. Variable categrica nominal
X4: Colegio. Variable categrica nominal
X5: Ao de ingreso a la U. Variable categrica nominal
X6: Ingreso familiar mensual. Variable numrica discreta
X7: Tamao de la familia. Variable numrica discreta
X8: # Hermanos estudiantes. Variable numrica discreta
X9: Casa propia. Variable categrica nominal
X10: Tenencia de automvil. Variable categrica nominal
X11: Gasto mensual en educacin. Variable numrica discreta
TABLA DE FRECUENCIA Y GRFICO PARA LAS
VARIABLE COLEGIO Y TENENCIA DE AUTOMVIL

Tenencia de automvil
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlido No 26 57,8 57,8 57,8
S 19 42,2 42,2 100,0
Total 45 100,0 100,0

Segn podemos observar tanto en la tabla como en el grfico,


vemos que es mayor el nmero de personan que no tienen un
carro a los que s los poseen. Esta diferencia es de 7 personas o
tambin podramos decir que es de 15.6%, pues 26 son las
personas que no poseen un vehculo y 19 las personas que s los
tienen.
Colegio
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlido Particular 24 53,3 53,3 53,3
Nacional 21 46,7 46,7 100,0
Total 45 100,0 100,0

Por lo que podemos observar en el cuadro de frecuencia y en su


grfica de sectores es que existe un mayor nmero de personas
que estudiaron en un colegio particular a comparacin de las que
estudiaron en un colegio nacional. Esta diferencia es de 3
personas o tambin el 6.6%, pues fueron 24 las que estudiaron en
un colegio particular y 21 las que estudiaron en un colegio
nacional.
TABLA DE FRECUENCIA CONJUNTA (DOBLE
ENTRADA) Y GRFICO DE LAS VARIABLES COLEGIO
Y TENENCIA DE AUTOMVIL

Tabla cruzada Colegio*Tenencia de automvil


Tenencia de automovil
No S Total
Colegio Particular Recuento 14 10 24
% dentro de Colegio 58,3% 41,7% 100,0%
% dentro de Tenencia de 53,8% 52,6% 53,3%
automovil
% del total 31,1% 22,2% 53,3%
Nacional Recuento 12 9 21
% dentro de Colegio 57,1% 42,9% 100,0%
% dentro de Tenencia de 46,2% 47,4% 46,7%
automovil
% del total 26,7% 20,0% 46,7%
Total Recuento 26 19 45
% dentro de Colegio 57,8% 42,2% 100,0%
% dentro de Tenencia de 100,0% 100,0% 100,0%
automovil
% del total 57,8% 42,2% 100,0%
Segn la tabla cruzada o tabla de contingencia podemos
interpretar de los datos que:

De las 24 personas que estudiaron en un colegio particular,


14 o 58.3% no poseen un automvil y 10 o 41.7% s tienen
automvil.
De las 21 personas que estudiaron en un colegio nacional, 12
o 57.1% no poseen un auto y 9 o 42.9% s poseen un
automvil.

Tambin lo podramos interpretar de la siguiente manera:

De las 26 personas que no poseen automvil, 14 o 53.8%


estudiaron en colegio particular y 12 o 46.2% estudiaron en
un colegio nacional.
De las 19 personas que poseen automvil, 10 o 52.6%
estudiaron en un colegio particular y 9 o 47.4% en un colegio
nacional.

Gracias a la tabla hemos podido llegar a la conclusin que el grupo


ms grande es el de las personas que no tienen automvil y que
estudiaron en un colegio particular, y tambin que el menor grupo
es el de las personas que poseen automvil y estuvieron en un
colegio nacional.
MEDIA, MEDIANA, MODA, CUARTILES,
DESVIACIN TPICA, ASIMTRICA, PERCENTIL 80
PARA CADA UNA DE LAS VARIABLES INGRESO Y
GASTO

Estadsticos
Ingreso familiar Gasto mensual
mensual de educacin
N Vlido 45 45
Perdidos 0 0
Media 3798,22 2170,93
Mediana 3250,00 2100,00
Moda 3200 1500a
Desviacin estndar 1811,671 1200,872
Asimetra 1,046 ,482
Error estndar de asimetra ,354 ,354
Percentiles 25 2590,00 1200,00
50 3250,00 2100,00
75 4600,00 2990,00
80 5160,00 3160,00
a. Existen mltiples modos. Se muestra el valor ms pequeo.

A partir del cuadro mostrado podemos identificar dos variables, el


ingreso familiar mensual y su gasto mensual en educacin.
Primero interpretaremos los ingresos familiares:
Nos dan una media de 37980.22 de la cual podemos decir
que de la suma de todas los ingresos de los 45 estudiantes
dividido entre esta misma cantidad de personas, obtenemos
este promedio.
Obtenemos una mediana de 3250, lo que significa que es la
observacin que ocupa el lugar central del conjunto de las
45 personas y sus ingresos.
El cuadro nos da una moda de 3200, lo que significa que este
es el nmero que se repite ms entre los ingresos de los
estudiantes.
La desviacin tpica nos muestra 1118.671 es la dispersin
que presentan los datos en su distribucin respecto a la
media.
La asimetra nos dice que 1046 es la forma en la que estn
distribuidos lo datos, como la media es mayor a la mediana
y la moda, entonces esta asimetra es positiva.
El percentil de 80 nos indica que 5160 es el ingreso que se
est dejando bajo del 80% del total de estudiantes.

Ya terminado este anlisis, asamos al gasto mensual de educacin:


Nos dan una media de 2170.93 de la cual podemos
interpretar que de la suma de todas los gastos de los 45
estudiantes dividido entre esta misma cantidad de personas,
obtenemos este promedio.
Obtenemos una mediana de 2100, lo que significa que es la
observacin que ocupa el lugar central del conjunto de las
45 personas y sus ingresos.
El cuadro nos da una moda de 1500, lo que significa que este
es el nmero que se repite ms entre los gastos de los
estudiantes.
La desviacin tpica nos muestra 1200.872 es la dispersin
que presentan los datos en su distribucin respecto a la
media.
La asimetra nos dice que 482 es la forma en la que estn
distribuidos lo datos, como la media es mayor a la mediana
y la moda, entonces esta asimetra es positiva.
El percentil de 80 nos indica que 3160 es el ingreso que se
est dejando bajo del 80% del total de estudiantes.
AGRUPAR A CADA UNA DE LAS VARIABLES
INGRESO Y GASTO EN SEIS CLASES DE INTERVALOS.
HACER TABLA DE FRECUENCIA Y GRFICO A LAS
NUEVAS VARIABLES.
Ingreso familiar mensual (Agrupada)
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlido <= 2333 8 17,8 17,8 17,8
2334 - 3666 17 37,8 37,8 55,6
3667 - 5000 10 22,2 22,2 77,8
5001 - 6333 5 11,1 11,1 88,9
6334 - 7667 3 6,7 6,7 95,6
7668+ 2 4,4 4,4 100,0
Total 45 100,0 100,0

Esta agrupacin nos muestra que los ingresos familiares


mensuales tienen un pico de 17 personas y su punto ms bajo de
2 personas.
Gasto mensual de educacin (Agrupada)
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlido <= 1083 8 17,8 17,8 17,8
1084 - 1866 13 28,9 28,9 46,7
1867 - 2650 7 15,6 15,6 62,2
2651 - 3433 11 24,4 24,4 86,7
3434 - 4217 4 8,9 8,9 95,6
4218+ 2 4,4 4,4 100,0
Total 45 100,0 100,0

Esta agrupacin de los gatsos mensuales en la eduacin nos


muestra que tienen un pico de 13 personas y su punto ms bajo
de de dos personas.
GRFICO DE TALLOS Y HOJAS Y CAJA PARA CADA
UNA DE LAS VARIBLES DE INGRESO Y GASTO
CAJAS

Resumen de procesamiento de casos


Casos
Vlido Perdidos Total
Colegio N Porcentaje N Porcentaje N Porcentaje
Ingreso familiar Particular 24 100,0% 0 0,0% 24 100,0%
mensual Nacional 21 100,0% 0 0,0% 21 100,0%

En este caso, el diagrama de caja nos est indicando que existe


una mejor distribucin de los datos en las personas que
estudiaron en colegio particular, porque su mediana se aproxima
ms a la media, caso contrario de los que estudiaron en colegio
nacional.
Resumen de procesamiento de casos
Casos
Vlido Perdidos Total
Colegio N Porcentaje N Porcentaje N Porcentaje
Gasto mensual Particular 24 100,0% 0 0,0% 24 100,0%
de educacin Nacional 21 100,0% 0 0,0% 21 100,0%

En este caso vemos que est mucho ms marcada la diferencia de


distribucin entre las dos cajas, los que estudiaron en colegio
particular tiene una mejor distribucin de dadis a comparacin de
los que estudiaron en colegio nacional.
TALLOS Y HOJAS

Gasto mensual de educacin


Gasto mensual de educacin Grfico de tallo y hojas

Frecuencia Stem & Hoja

1,00 0 . 3
6,00 0 . 566789
9,00 1 . 011222233
5,00 1 . 55588
6,00 2 . 011233
7,00 2 . 5888999
5,00 3 . 00222
,00 3 .
4,00 4 . 0112
1,00 4 . 5
1,00 5 . 0

Ancho del tallo: 1000


Cada hoja: 1 caso(s)

Ingreso familiar mensual


Ingreso familiar mensual Grfico de tallo y hojas

Frecuencia Stem & Hoja

5,00 1 . 02559
12,00 2 . 133455677888
11,00 3 . 01222255789
7,00 4 . 0112557
4,00 5 . 0223
1,00 6 . 2
2,00 7 . 00
3,00 Extremos (>=7500)

Ancho del tallo: 1000


Cada hoja: 1 caso(s)

El grfico de tallos y hojas nos da una vista ms exacta y fcil de


visualizar cules son los ingresos y gastos de las familias.
En el caso de los ingresos vemos que la mayor frecuencia es 12, en
la cual tenemos al tallo 2, y los nmeros que estn de hojas
completan a esa cantidad. Por ejemplo 2100, 2300, 2300,. De la
misma manera funciona en los gatos, su mayor frecuencia es 9,
donde el nmero que est como tallo es el 1 y sus hojas
completan el nmero. Por ejemplo: 1000, 1100, 1200,
UTILIZA EL TEOREMA DE CHEVYSHEV EN UNA DE
LAS VARIABLES DE INGRESO Y GATOS USANDO
K=2.2

Estadsticos
Ingreso familiar Gasto mensual
mensual de educacin
N Vlido 45 45
Perdidos 0 0
Media 3798,22 2170,93
Desviacin estndar 1811,671 1200,872

Para calcular el chevyshev, necesitamos la media, la desviacin


tpica y un valor k, que es igual a 2.2. Primero necesitamos calcular
los puntos en los cuales el intervalo va a variar y el porcentaje del
cual estos intervalos sern mayores o iguales.
Para el ingreso vemos que entre los intervalos de -187,456 y
7783.896 vamos a encontrar al menos al 79.34% de los datos. De
igual forma en el gasto, entre -470.988 y 4812.848 vamos a
encontara al menos al 79.34% de los datos.
OBTENER LA ECUACIN DE REGRESIN LINEAL
PARA LAS VARIABLES INGRESO Y GASTO
(dependiente)

Resumen de modelo y estimaciones de parmetro


Variable dependiente: Gasto mensual de educacin
Resumen del modelo Estimaciones de parmetro
Ecuacin R cuadrado F gl1 gl2 Sig. Constante b1
Lineal ,908 423,878 1 43 ,000 -227,991 ,632
La variable independiente es Ingreso familiar mensual.

La ecuacin de regresin lineal nos muestra la relacin de


dependencia e independencia del gasto y el ingreso
respectivamente. Donde vemos que Y est representando al
valor dependiente y X al independiente.

También podría gustarte