Está en la página 1de 13

Francisco Mendizbal Prem

Fase IV
Facultad de Ciencias Mdicas

Pgina

COMO USAR EXCEL PARA ANALISIS DE DATOS


Cuando llevamos a cabo investigaciones hay varios cosas en las que tenemos que
pensar. Supongamos que ya hemos pasado las boletas de recoleccin de informacin y
que tenemos ante nosotros un gran nmero de boletas (vamos a suponer que son al menos
unas 500 boletas para que valga la pena aprender a usar la computadora y un programa
como una hoja electrnica para hacerlo).
El primer paso que tenemos que hacer es averiguar la Versin de Excel que
tenemos: vamos al men y buscamos donde dice Ayuda (help) y buscamos Acerca de
Excel de Microsoft (About Microsoft Excel). En nuestro caso como estamos usando la
versin de Excel que viene con Microsoft Office 97 aparecer la informacin
Microsoft(R) Excel 97. En este punto tenemos que hacer una pequea distincin entre el
Sistema Operativo (DOS si su mquina es un tanto viejita o Windows si su mquina no
lo es tanto). Por tanto puede ser que tenga en su computadora el sistema operativo
Windows 95 o Windows 98 o Windows 2000 pero la versin de Excel 97.

El segundo paso que tenemos que hacer es cerciorarnos de que tenemos un mediano
dominio de las funciones. Suponiendo que no la tenemos las repasaremos rpidamente.
Lo primero que debemos dominar es como efectuar operaciones. La forma de indicarle a
Excel es mediante el signo igual( = ).Para practicarlo colquese en una celda cualquiera
(por ejemplo en la celda A3). Previamente en las celdas A1 y en la A2 coloque las
cantidades 25 y 15 respectivamente. Luego en la celda A3 coloque el signo = y ver

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina

algunos cambios en la presentacin en su pantalla. Coloque los caracteres A1+B1 en la


celda (con este procedimiento usted est indicando el lugar en donde est la informacin
sobre la que se efectuar la operacin que usted desea hacer y cuyo resultado desea ver en
la celda A3). Ahora haga clic en el signo de verificacin o presione en la tecla Enter. Con
la anterior accin usted ver el resultado o sea el nmero 40. Como usted se ha tomado el
trabajo de referenciar la formula podemos cambiar los nmeros de las celdas A1 y en la
A2; ahora coloque las cantidades 99 y 23 respectivamente y ver aparecer
automticamente la cantidad 122.
CREACION DE UNA TABLA DE ASIGNACION AL AZAR
Ahora que ya nos hemos recordado de cmo definir funciones en Excel podemos dar un
paso ms y aprender la creacin de una tabla de asignacin al azar. Vamos a suponer que
estamos llevando a cabo una investigacin comparativa. un ensayo clnico controlado.
por medio de un clculo de muestra para un trabajo comparativo sabemos que
necesitamos 50 pacientes. Necesitamos crear dos grupos al azar. Para este primer intento
lo haremos en forma desbalanceada es decir, nos quedarn dos grupos de tamao
desigual. Vamos a hacer un listado de 50 sujetos (es decir, de nmeros del 1 al 50 que
representarn nuestros sujetos de estudio segn se vayan presentando). En la casilla A1
colocamos el nmero 1 y en la casilla A2 colocamos el nmero 2 y luego le indicamos a
Excel que queremos seguir la secuencia hasta llegar a 50 (esto lo hacemos colocando el
ratn en la esquina inferior derecha de la casilla A2 y observando cuando cambia de
forma de cruz gruesa a una cruz delgada y negrita. Cuando llega a esa forma el puntero
del ratn debemos "arrastrar). A continuacin creamos los nmeros al azar mediante la
funcin RAND ( ) o ALEATORIO ( ). Lo hacemos en una celda (por ejemplo en B1) y
luego la extendemos a las dems.

Observemos la funcin RAND( ) arriba que


describe la generacin de nmeros aleatorios
y la marca del puntero del ratn (abajo a la
izquierda) que describe una forma alterna
de la funcin copiado.

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina

Dado que no nos sirve de mucho el tener nmeros al azar de varios decimales vamos a
redondearlos a un solo dgito entero. Las rdenes son las siguientes: en la columna C
hacemos el clculo de la columna previa multiplicado por 10 (as el nmero 0.296 se
transformar en el nmero 2.96, etc.). Luego por medio de la orden Format (Formato)
Cells (Celdas) Number (Nmero) Decimal places (Lugares Decimales)
definimos que queremos cero decimales. Finalmente, debemos decirle al programa de
que si nmero es 1,2,3,4 o 5 ese sujeto ir al grupo A y si el nmero es

Cuando hayamos terminado habremos colocado la formula IF (C1<6,A,B) con lo


cual nos transformar los nmeros aleatorios en pertenencia al grupo A o al grupo B.
Como podemos ver en la grfica de abajo esta es la forma en que nos quedar definida la
funcin lgica:

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina

ANALISIS DE DATOS
Vamos a suponer que ya hemos realizado el trabajo de campo de nuestra
investigacin y que tenemos un buen nmero de boletas (una 500 por lo menos para que
valga la pena aprender a usar la computadora y un programa de una hoja electrnica
como Excel).
Vamos a aprender a calcular estadstica descriptiva bsica (promedios como medida
de tendencia central y desviacin estndar como medida de dispersin). Vamos a suponer
que los datos son los siguientes.
Los datos son peso (en libras) de 22 personas:
123
145
167
125
189
123
145
156
186
155
176
152
157
156
198
210

158
105

111
188

176
186

146
141

Abrimos la hoja de trabajo en Excel y colocamos los datos en las casillas de la A2 a la


A23 (dejando la celda A1 sin datos para poder colocar en esa celda la etiqueta PESO).
Como todos sabemos el promedio es el resultado de dividir la suma de los valores por el
nmero de datos menos uno (n-1). Por lo tanto necesitamos calcular esas dos cantidades.
Elija para ello cuatro celdas adecuadas (en dos de ellas colocaremos la palabra SUMA y
la palabra N y en las otras dos los resultados de dicho clculo). En la celda A24 coloque
la palabra SUMA y en la celda B24 el resultado es decir la operacin o funcin. la

Observe arriba la funcin


COUNT(B2:B10) y abajo el
resultado de dicha funcin.

operacin la hacemos con la funcin SUM(B2:23) si la el programa est en ingls y con


la funcin SUMAR(B2:B23) si el programa est en espaol. Luego en la celda A25
coloque la palabra N y en la celda contigua B25 el resultado mediante la funcin

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina

COUNT(B2:B23) si el programa est en ingls y con la funcin CONTAR(B2:B23) si


el programa est en espaol. Finalmente en la celda A26 coloque la palabra promedio y
en la celda B26 el resultado mediante la funcin ( =B24/B25). Vamos ahora a hacer el
clculo de la desviacin estndar. Creamos una columna que se llame promedio y
colocamos la etiqueta de promedio en la celda C1 y en la celda C2 colocamos la funcin (
=B26). Ahora para no repetir la operacin procederemos a pegar la funcin arrastrando
la marca de crucita del puntero del ratn. Hgalo y observe que sucede. Si se posiciona
en la celda C3 posiblemente podr ver la funcin ( =B27) y en la celda C3 posiblemente
podr ver la funcin ( =B27) y as sucesivamente.
Para evitar que la referencia se corra vamos a aprender algo nuevo. Colquese en la celda
B26 y en la esquina superior izquierda podr ver la referencia de la celda (es decir B26).
Coloque el puntero del ratn en el nombre o cmbielo a PRO. Luego borre la
informacin de la columna C (borre todo excepto la etiqueta de la columna). Repita la
operacin anterior colocando la funcin ( =PRO) y luego pguela nuevamente. Observe

Observe la celda activa y arriba en la


esquina superior izquierda el nuevo
nombre de la celda PRO y en la
esquina superior la operacin descrita
previamente.

la diferencia.

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina

Ahora podemos seguir adelante con la creacin de las siguientes columnas. En la


columna D colocar las diferencias entre cada valor y el promedio (despus de todo esa
es la definicin bsica de desviacin estndar, no ?). Por tanto en la celda D2 haremos
la operacin o funcin ( =B2-C2) y luego pegaremos esa funcin al resto de las celdas. Si
observa en este caso la operacin nos sali como queramos (cercirese viendo la
definicin de la funcin en la celda D3 y en la D4). Para la siguiente columna etiquete en
E1 el nombre diferencias al cuadrado y en E2 coloque la funcin =POWER(C2,2) la
cual significa elevar C2 al cuadrado. Como siguiente punto vamos a terminar el clculo
de la desviacin estndar cuya formula es la siguiente

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina

Formula de la desviacin estandard


definida mediante la funcin de
Excel SQRT(E24/E25) es decir la
funcin Raiz Cuadrada en la parte
de arriba y abajo el resultado
numrico de dicha funcin.

Al terminar los clculos de la desviacin estndar tenemos lo siguiente.


La pregunta que ustedes posiblemente se estn haciendo en este momento es: no habr
una forma ms fcil de hacer clculos estadsticos en Excel? Y la respuesta es afirmativa:
SI existe. Vamos a aprender como usar dicha herramienta en Excel. Dicha herramienta se
llama Anlisis de datos (Data Analysis) y para ver si est disponible en su computadora
d clic al botn de Herramientas (Tools) y esta debera estar como la ltima opcin si no
est ah. De clic en Complementos (Add-Ins) y ver aparecer la caja de dialogo que
vemos ac en la izquierda. Asegrese de marcar la casilla que dice Herramientas para
anlisis(Analysis ToolPak). Una vez que haga clic en Aceptar (OK) vaya a
Herramientas(Tools)
nuevamente y en la ltima
opcin encontrar Anlisis
de Datos(Data Analysis)
cuando d clic se desplegar
una caja de dialogo en la que
Aca debemos hacer click para esconder el
deber elegir Estadstica
resto de la caja de dialogo y luego
descriptiva(Descriptive
nuevamente para mostrarla
Statistics).
Al darle clic a la orden
Estadstica
descriptiva(Descriptive
Statistics) usted ver que se

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina

despliega una caja de dialogo como la que vemos a continuacin. En ella estn
especificadas tres datos: Input range (Rango de Entrada) en el cual debemos
especificar (ya sea escribiendo de donde a donde estn los datos o dando clic y luego con
el ratn mostrar adonde van los datos). En el caso que decidamos escribir la ubicacin de
los datos y suponiendo que los datos estn en las celdas B2 a la B23 escribiramos
$B$2:$B$23 en los datos correspondientes a Input range (Rango de Entrada). Como
colocamos la palabra PESO como etiqueta debemos marcar la marca de verificacin que
dice Labels in First Row(Rtulos en la primera fila). Luego debemos completar la
segunda informacin que se refiere a donde queremos la informacin de la estadstica
descriptiva que estamos pidiendo. En la parte que dice Output Range(Rango de Salida)
colocamos o la referencia a las celdas (por ejemplo: $A$28) o la damos clic al icono y
marcamos la celda correspondiente con el puntero del ratn. Solamente nos falta
completar la parte correspondiente a Summary Statistics(Estadstica de Resumen) y
damos Aceptar(OK).
Una cosa que nos interesa sobremanera es ver la forma de la distribucin es decir hacer
un histograma. Para hacerlo
elegimos nuevamente la
herramienta Anlisis de
Datos(Data
Analysis)
solamente que esta vez al
darle
clic
elegimos
Histogram(Histograma).
En la caja de dialogo vemos
varias
cosas
que
ya
Aca pondremos las
conocamos
previamente:
referencias de las
Input
Range(Rango
de
columnas: cada
Entrada)
funciona
cinco o cada diez
exactamente igual que antes
pero hay algo nuevo: Bin
Range(Rango de Clases)
que es donde especificamos
cmo queremos dividir nuestra variable en intervalos de clase. Como an no los hemos
creado le damos cancel(Cancelar) a la caja de dialogo para ir a crearlos en ese momento.
Vamos a la hoja Excel y en la columna J ponemos como etiqueta cada 5 y luego
averiguamos cual es el dato ms pequeo y cual es el ms grande (recuerdan la orden
que le dieron en Estadstica Descriptiva ?). Por tanto ponemos por ejemplo 115,125 y
luego pegamos los otros datos. Cuando tenemos el histograma hecho nos damos
cuenta de dos cosas: una que es un poco pequeo pero eso no es problema ya que
podemos modificar su tamaao. La otra que el histograma apareci como si fuese un
diagrama de barras (con las barras separadas como si fuese una variable categrica y no
una variable cuantitativa continua). Podemos arreglar eso tambin. Le damos clic en la
parte de las barras y cuando sale una caja de dialogo elegimos Format Data Series
(Formato de serie de datos) Options(Opciones) Gap Width (Ancho del rango) y
en donde el programa coloca 150 como el ancho del rango (gap width) hay que colocar
cero. Cuando hemos terminado nos queda de esta forma:

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina

Histogram

Frequency

7
6
5
4
3

Frequency

2
1

M
or
e

5
18

5
17

5
16

5
15

5
14

5
13

5
12

11
5

cada cinco

La siguiente pregunta es: que ms podemos hacer en Excel con este mdulo de anlisis
de datos ?. Pues bien supongamos que tenemos dos grupos de datos y queremos hacer
una diferencia de medias dependientes. Es decir queremos hacer un t pareada.

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina 10

Los datos son los siguientes.


Un investigador desea saber si el fumar cigarrillos aumenta la presin
arterial diastlica en personas sanas. Con este fin elige a 15 sujetos
a los cuales les mide la presin arterial ( variable presin arterial
antes ), les pide que fumen un cigarrillo y luego les mide nuevamente
la presin arterial ( variable presin arterial despus ). Estos son
los datos:
Individuo

Presin arterial
antes

Presin arterial
despus

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

70
60
75
70
60
75
75
80
70
80
80
85
65
60
65

80
60
80
80
65
70
70
85
80
90
85
85
70
70
70

En primer lugar debemos abrir una nueva hoja (del mismo cuaderno) y colocamos ah los
datos. Luego llamamos a la herramienta Anlisis de datos para hacer una t pareada: Tools
(Herramientas) Data Analysis (Anlsis de datos) t-test: paired Two-Samples
for means(Prueba t para
medias de dos muestras
emparejadas). Cuando
le decimos Aceptar (OK)
vemos otra caja de
dialogo (la que vemos
abajo y al lado izquierdo).
En esta segunda caja de
dialogo hay que definir
las columnas o filas que
constituyen los datos.
Veamos
ms
detenidamente
esta
segunda caja de dialogo.
En el lugar que dice
Variable 1 Range (Rango para la variable 1) debemos colocar los datos de la columna
antes y en donde dice Variable 2 Range (Rango para la variable 2) debemos colocar
los datos de la columna despus. Luego debemos marcar la casilla de verificacin que
dice Label (Rtulos). Luego (como en las otras cajas de dialogo) debemos colocar la

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina 11

informacin de adonde queremos la salida. Con esto tenemos el siguiente resultado el


cual debemos interpretar (ya que esto es la parte ms importante de la estadstica.

La interpretacin de la prueba es la siguiente. Observemos las medias de la presin


arterial antes y vemos que esta es 71.33 y si observamos la media de la presin arterial
despus vemos que esta es 77.33 por tanto se ha elevado en promedio. El valor de t es de
-6.87 el cual es bastante grande y la probabilidad asociada es 0.0000076 la cual es
obviamente menor que 0.05 . Por lo tanto, concluimos que podemos rechazar la hiptesis
nula de que el promedio de las diferencias es cero.
Probemos ahora con una prueba de t con dos muestras independientes.
Un investigador desea comparar la presin arterial diastlica dos
grupos de personas sanas. Con este fin elige a 30 sujetos y a los
sujetos del grupo A les pide que hagan ejercicio durante tres meses
mientras que el grupo B (control) no hacen ejercicio. Luego de lo cual
les mide la presin arterial

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas
Individuo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Pgina 12

grupo A (de estudio)


65
60
65
70
60
75
75
80
70
70
80
75
65
60
65

Grupo B (control)
80
60
80
80
65
70
70
85
80
90
85
85
70
70
70

El resultado lo obtenemos con Tools (Herramientas) Data Analysis (Anlisis de


datos) sin embargo en este punto vemos que hay dos opciones que podemos tomar: ttest: Two-Sample Assuming Equal Variances (Prueba t para dos muestras
suponiendo varianzas iguales) y t-test: Two-Sample Assuming Unequal Variances
(Prueba t para dos muestras suponiendo varianzas desiguales). Cuando le decimos
Aceptar (OK) vemos otra caja de dialogo (la que vemos abajo y al lado izquierdo). En
esta segunda caja de dialogo hay que definir las columnas o filas que constituyen los
datos. Hicimos la opcin primera y abajo vemos los resultados.

Francisco Mendizbal Prem


Fase IV
Facultad de Ciencias Mdicas

Pgina 13

Veamos entonces la interpretacin.Como podemos ver las varianzas no son demasiado


diferentes (podramos hacer una prueba si tenemos dudas). Las medias difieren siendo la
media del grupo A 69 y la media del grupo B 76. En cuanto al valor de t este es de -2.44
con una probabilidad de 0.02099 (es decir P < 0.05). Por lo tanto, concluimos que
podemos rechazar la hiptesis nula de que el promedio de las diferencias es cero.

También podría gustarte