Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ExcelED Regresion
ExcelED Regresion
Si decides imprimirlo, por favor hazlo en papel reciclado, a doble cara y con poca tinta. S ecolgico. Muchas gracias.
E!cel "##$
Mis alumnos de la %icenciatura en &ocumentacin han demandado 'ue actualizase a Excel 2007 este breve guin de Estad stica &escriptiva 'ue hice cuando a(n esta versin de Excel no estaba muy difundida. )uiz todav a haya personas 'ue traba*an con la anterior, as 'ue conservo tambin a'uel guin en este enlace E!cel##E&.pdf. )uiero de*ar claro, para 'ue lo tenga en cuenta el lector, 'ue apenas s algo de E!cel. + no slo esto sino 'ue ni utilizo Microsoft Office Excel 2007 ni el sistema operativo Microsoft Windows. Por tanto, 'uiz haya maneras ms sencillas de hacer algunos de los pasos 'ue se describen en estas ho*as.
Cargar o importar datos Frmulas programadas Cargar el mdulo para Estadstica Obtener un resumen de medidas de una muestra Dibujar el histograma de una muestra Si no indicamos las clases Si queremos indicar las clases Diagrama de dispersin entre dos variables Recta de regresin entre dos variables
"
Si los datos estn en formato de te!to, se abre un asistente 'ue va haciendo preguntas sobre cmo deben /leerse0 los datos. El asistente nos muestra los datos aba*o, pero siempre podemos abrirlos primero con un editor de te!to para ver si los datos estn dados en columnas, si estas columnas estn separadas por tabulaciones, si los decimales se indican con coma o con punto 5forma anglosa*ona6 y si en la primera fila se indica en nombre de las columnas o variables. En este caso, una vez cargados los datos4
7emos 'ue cada pa s est en una fila y cada variable en una columna. %os nombres de los pa ses estn en la segunda columna 5la primera es un ndice para numerarlos6 y los de las variables estn en la primera fila. Es importante tener esto presente para no incluir esos nombre entre las celdas de la muestra a la hora de hacer clculos con ellos.
Frmulas programadas
Excel 2007 tiene, entre otras me*oras, ms accesibles sus funciones programadas. En la pesta1a !r"ulas, son de especial inters para nosotros las funciones estad sticas4
+o he hecho4
Pulsar en
Sin embargo, esto no es suficiente 5al menos en mi caso6 para 'ue el mdulo se cargue, por lo 'ue vuelvo a hacer 'ue aparezca la ventana de opciones como antes, es decir, con
Pulsar en
y ahora
en
'ue aparece en la parte de aba*o. <hora aparece el cuadro 'ue aparec a en las anteriores versiones de Excel4
%a primera vez 'ue he hecho esto, E!cel ha iniciado un proceso de instalacin del mdulo 'ue ha llevado unos minutos. %as siguientes veces 'ue he repetido los pasos de desagregar y agregar el mdulo 5para hacer este guin6, no ha necesitado instalacin. <hora ya aparece la opcin An#lisis en la pesta1a atos.
<hora
<l pulsar
aparece
>
<l pulsar
aparece
<parece
@enemos 'ue indicar con el ratn en 'u celdas estn los datos. Pulsamos el botn 'ue est en la circunferencia ro*a del dibu*o. <parece el siguiente cuadro
.o le hacemos caso, sencillamente seleccionamos con el ratn la segunda celda de la columna <A3B:-% y e!tendemos la seleccin con el ratn hasta el final de esa columna. <l soltar el botn del ratn se introduce automticamente ese rango de valores en el cuadro anterior4
Pulsamos el botn 'ue est en el c rculo azul y automticamente se introduce la seleccin en el campo adecuado del cuadro inicial. %e indicamos tambin si los datos estn por columnas o por filas, 'ue muestre los resultados en una nueva ho*a de clculo, por e*emplo, y 'ue muestre el resumen de medidas.
<l pulsar
aparece
,#
,,
<l pulsar
aparece
%a informacin 'ue necesita Excel para hacer un histograma es la muestra y los intervalos. Si no se le indican los intervalos, l los construye. 7eamos primero este caso.
<l pulsar
,"
Es decir, en )an(o de entrada le hemos indicado el lugar donde est la muestra. En una ho*a nueva 5o en un libro nuevo, seg(n se le haya indicado6 proporciona la tabla con las clases 5indica el e!tremo inferior6 y con las frecuencias absolutas. Si no le hemos indicado 'ue haga el grfico, podemos hacerlo ahora.
,8
:omo ,8" C ,,,9? podemos considerar ,, ," intervalos 'ue cubran todo el rango. :omo =;D,, C ;,?# y =;D," C ;,9" parece 'ue es ms cmodo tomar ,, intervalos de longitud =. <hora, ,,= === * as 'ue podemos centrar los intervalos y empezar desde el E#,; al =;,;. Si tuvisemos 'ue hacer los clculos a mano, no pasar a nada grave por empezar el primer intervalo en # y terminar en ==. 7emos en el apartado anterior 'ue el programa ha tomado precisamente ,, intervalos de longitud ;,?# empezando en el #, es decir, para calcular el n(mero de clases Excel aplica la regla de la ra z del n(mero de datos, y luego redondea. 7amos a elegir una columna 'ue est en blanco y vamos a escribir en una celda el n(mero E#,;. Seleccionamos la celda de deba*o y vamos a la barra de funciones. Escribimos lo siguiente4
por'ue en mi caso la celda en 'ue he puesto la primera cantidad es la <" 5de una nueva ho*a6.
<l pulsar
se aplica la frmula en la celda <8. <hora 'ueremos 'ue Excel entienda 'ue 'ueremos hacer esa misma operacin en las celdas de deba*o, es decir, 'ue la generalice y haga 'ue cada celda sea la anterior ms =. Esto es fcil, basta seleccionar esta segunda celda y arrastrar con el ratn de la es'uina inferior hasta la fila 'ue 'ueramos. En nuestro caso, como hemos empezado en la segunda, 'ueremos 'ue lo apli'ue hasta la decimotercera. Esta seleccin se muestra a la iz'uierda en las siguientes imgenes. +a hemos generado el )an(o de clases. En )an(o de entrada le tenemos 'ue indicar, como antes, las celdas donde est la muestra4
,9
7emos 'ue ha metido los dos datos 'ue val an # en la clase del ;,;, no en la del E#,;. Esto se debe a 'ue el programa mete en cada clase los valores 'ue hay entre su l mite inferior y el del intervalo siguiente, pero para los intervalos de los e!tremos computa respectivamente el n(mero de datos 'ue hay menores y mayores 'ue sus l mites. Es decir, para la clase del E#,; ve 'ue no hay ning(n valor menor 'ue l y pone frecuencia #. Para arreglar esto, podemos empezar en #.
,;
,=
7emos 'ue claramente hay una relacin lineal entre las dos variables. %o 'ue sucede adems es 'ue cuanto mayor es la mortalidad infantil, menor es la esperanza de vida de las mu*eres, y viceversa. Esto es lgico, por'ue ambas cosas estn relacionadas con el nivel de vida del pa s.
,$
<l pulsar
aparece
<hora
,>
donde le hemos indicado bien 5Kmuy importanteL6 cul tomamos como variable independiente 5en el e*e M6 y cul como dependiente 5en el e*e +I la 'ue 'ueremos estudiar en funcin de la independiente6. Entre otros, aparecen los resultados n(mericos4
, =#,"=#=8;8"- >#,,#$=#;,>
,?
7emos 'ue la pendiente el negativa, como esperbamos. Si 'ueremos dibu*ar la recta de regresin se puede hacer agregando al diagrama de dispersin una l nea de tendencia 5'ue coincide con la recta de regresin cuando suponemos 'ue la tendencia es lineal6I hay 'ue situarse 5con cuidado, no es fcil6 encima de los datos y pulsar el botn secundario del ratn. <parece el cuadro
"#
.tese 'ue desde este cuadro se pueden e!trapolar valores, es decir, predecir valores de relacin entre las dos variables 'ue no han salido realmente en las muestras.
",