Está en la página 1de 10

UNIVERSIDAD CATOLICA DE TEMUCO

ESCUELA DE CS. DE LA SALUD


BIOESTADISTICA CCB1107
GUIA CATEDRA II BIOESTADISTICA

Prof.: Carola del Valle, M.V.


Diplomada Epidemiologa Clnica
Magster Epidemiologa Clnica
El empleo del software estadstico
Nadie duda que el anlisis de los datos en general y biolgicos en particular hoy en da se ha
simplificado gracias al desarrollo de software con completsimos paquetes estadsticos y al
acceso a computadores y calculadoras cientficas de bolsillo. Los avances desarrollados en
esta lnea permiten manejar grandes nmeros de datos con clculos que sin software y el
uso de computadores tardaran varias semanas y el empleo de mucha gente. Estos
programas de computador adems permiten tener la certeza absoluta que los clculos
desarrollados no tienen posibilidad de generar valores errados, el error slo podra
presentarse en la digitacin de los datos al sistema. Al contrario, si el clculo se realizara
manualmente lo ms probable que se cometan errores involuntarios en su desarrollo.
Sin embargo, ni el software ni la computadora por muy avanzados que estos sean piensan
por quien esta manejando el experimento, tampoco tienen opinin ni les preocupa si los
datos ingresados renen los requisitos para el anlisis o prueba que se ejecuta. Por
consecuencia, el paquete estadstico y la maquina solo cumplen en dar una respuesta
(resultado). En este caso, la validez del resultado slo depender de la responsabilidad y
honradez del investigador, cumplindose la premisa de que si basura se introduce como
dato basura saldr como resultado, siendo lo anterior independiente del software
estadstico y la computadora empleada.
En otros casos, siendo los datos adecuados y especulando que la prueba realizada tambin
sea la adecuada, es posible que un iniciado genere errores de interpretacin o simplemente
no saque el provecho suficiente a los datos debido, a que desconoce para que sirve o que
implican muchos de los resultados generado por la prueba estadstica. En estos casos, lo
ms importante de los resultados pasa a segundo plano o bien se ignora.
Tambin es muy posible que el resultado sea usado por quien se inicia en el anlisis de datos
como un resultado indesmentible de lo que se desea probar, al respecto se vuelve a recalcar
que, quien desarrolla el trabajo deber darle la validez que corresponda y para ello la
estadstica solo cumple un rol de herramienta al servicio del investigador o analista.

Software utilizados: Varios son los paquetes estadsticos comerciales existentes en el


mercado la mayora de los que se listan a continuacin son de uso general vlidos para
distintos campos de investigacin.
Paquete estadstico originado en las
ciencias sociales. Hoy en da es un
SPSS
completsimo programa adecuado para
varios campos disciplinarios
Paquete estadstico gigantesco, slo para
SAS avezados. Difcil de manejarlo pero es muy
poderoso y completo
Paquete estadstico derivado de SAS, si
bien su manejo se ha facilitado bastante en
JMP
relacin a SAS an es difcil de manejar,
pero bastante bueno
Paquete estadstico si bien utilizado en el
STATA rea mdica no es una herramienta muy
amigable
Programa muy simple desarrollado para
MINITAB
apoyar la enseanza de la estadstica
STATVIEW Estadstico sencillo para Macintosh. No
posee muchas opciones de anlisis pero es
fcil de usar y posee una adecuada grfica
Combina capacidades estadsticas y
STATGRAPHICS grficas para el anlisis de datos. Fcil de
usar
Completo programa estadstico al mismo
STATISTICA nivel que el SPSS. El problema es su manual
en ingles
Programa simple muy adecuado para
quienes se inician. Fcil de entender,
GRAPHPAD
tambin posee el problema de su manual
slo en ingles

La forma de recoger informacin una vez que est claro el objetivo de investigacin y
delimitada la poblacin y seleccionada una muestra, es a travs de las variables, por
esto la importancia de conocer cmo se medirn las variables y la clasificacin de las
variables.

DEFINICIN DE VARIABLES Y ESCALAS DE MEDIDA

Variable:
Caracterstica o atributo en alguna manera cuantificable que posee un individuo en
estudio o unidad de anlisis.
Las variables tienen categoras y son todas las posibles respuestas que estas pueden tomar
y cuando hablamos de datos nos referimos a los nmeros o medidas que se han recopilado
como resultado de observaciones, es cada valor observado de la variable.

Las variables se dividen bsicamente en:

Variable Cualitativa:
Es aquella cuyos valores estn formados por caractersticas
observables.
Ej.
Estado civil
Nacionalidad

Variable Cuantitativa:
Es aquella cuyos valores estn formados por cifras numricas.
Ej.
Edad
Nmero de RUT

Luego existe otra sub-clasificacin

Cuantitativas discretas
continuas

Cualitativas nominales
ordinales
Variables Cualitativas ordinales:
Se refiere a aquellas variables cualitativas en que se registra un
orden o jerarqua.
Ej.
Tamao de los aeropuertos de Chile (Grande, mediano, pequeo)
Niveles jerrquicos dentro de una empresa (Profesionales, tcnicos, obreros)

Variables Cualitativas nominales:


Se refiere a cuando en los datos no existe un orden o
jerarqua.
Ej.
Genero (masculino, femenino)
Color de pelo

Variables Cuantitativas discretas:


Corresponden al conteo de unidades.
Ej.
Nmero hijos
Nmero de matrimonios

Variables Cuantitativas continuas:


Corresponden a todos los nmeros naturales.
Ej.
Edad
Peso

ESCALA CARACTERSTICAS USOS/EJEMPLOS LIMITACIONES


Nominal Se clasifican las Denominaciones No se pueden
personas, religiosas, afiliacin precisar
eventos u objetos poltico partidista, diferencias
en categoras. codificaciones en la entre las
clasificacin de objetos, categoras.
pinturas, movimientos
literarios.
Ordinal Se clasifican u Orden de llegada de Restringida para
ordenan las atletas en una carrera, identificar
personas, objetos y puntuaciones de una diferencias
eventos en prueba, rangos relativas,
determinada militares, nivel de pero no precisa
posicin. popularidad de diferencias en
estudiantes en una cantidad absoluta
escuela. entre personas u
objetos.
Continuas Escala de medida Temperatura corporal Ninguna, excepto
en que se pesquisan (Celsius y Fahrenheit), que su uso se
nmeros con edad, peso, estatura. supedita
decimales mayormente a
medir cualidades
fsicas
Discretas Escala de medicin Nmero de hijos, Las mediciones
en que solo se nmero de matrimonios, deben poder
pueden registrar cantidad de jeringas en registrar nmeros
nmeros enteros. un laboratorio. sin decimales.

Una vez que se tiene clara la forma en que se clasifican las variables lo que
sigue es ordenar la informacin

Organizacin y presentacin de la informacin univariante y bivariante


Tabulacin

Frecuencia absoluta (fi): llamaremos frecuencia al nmero de repeticiones que


presenta una observacin.
Frecuencia relativa (fr): corresponde a la frecuencia absoluta dividida por el total
de observaciones, la suma de la totalidad de estas siempre debe ser igual a 1.
Frecuencia absoluta acumulada: es la suma de los distintos valores de la
frecuencia absoluta tomando como referencia la frecuencia anterior.
Frecuencia relativa acumulada: es el resultado de dividir cada frecuencia absoluta
acumulada tomando como referencia un individuo dado.

ORGANIZACIN Y PRESENTACIN DE LA INFORMACIN UNIVARIANTE Y


BIVARIANTE

TABULACIN

TABLA DE DISTRIBUCIN DE FRECUENCIA PARA DATOS CUALITATIVOS.

La construccin de una tabla de distribucin de frecuencia para datos


cualitativos, requiere solo del conteo de elementos o individuos que caen dentro de
ciertas clases o tienen una caracterstica determinada.

CATEGORIAS Frec. Observ. Frec. Relativa Frec. Obs. Frec. Rel.


acumulada acumulada
CATEGORIA 1 5 5/20= 0.25 5 0,25
CATEGORIA 2 7 7/20= 0.35 12 0,60
CATEGORIA 3 8 8/20= 0.40 20 1
TOTAL 20 1

Entonces diremos que:


k
Fi = f1+f2+f3+..............fk fi = n
i=1
Fr = f1/n + f2/n + f3/n + ..........fk/n
k
fi/n = 1
i=1

TABLA DE DISTRIBUCIN DE FRECUENCIA PARA DATOS


CUANTITATIVOS

En este caso las observaciones son clasificadas en clases o intervalos en las


cuales se incluyen observaciones que han alcanzado valores similares, el nmero de
intervalos depender de la cantidad y naturaleza de los datos a resumir y del
propsito que se busca con el resumen.

Ej.:
Nmero de datos Nmero de intervalos
10 a 100 4a8
100 a 1000 8 a 11
1000 a 10000 11 a 14

Otra manera de calcular el nmero de intervalos o clases es usando la regla de


Sturges:

K = 1 + 3,322 * log10 * (n)


Luego es necesario conocer la amplitud de los intervalos:

A = mximo valor mnimo valor/ nmero de intervalos


A = x mx. x mn. / k
Ej.:
100 observaciones
k = 1 + 3.322 * log10 * 100 = 7,6 8.0

en que se registro un valor mximo = 80 y un valor mnimo = 10 entonces:


A = 80 10 / 8 = 8,75 9.0

INTERVALOS fi fr FI FR
y0 y1) f1
y1 y2) f2
y2 y3) f3
y3 y4) f4
y5 y6) f5
y7 y8)
y8 y9)
yk-1 yk)
INTERVALOS fi fr FI FR
10,0 19,0) 10 10/100 = 0,1 10 0,1
19,0 28,0) 7 7/100 = 0,07 17 0,17
28,0 37,0) 20 20/100 = 0,2 37 0,37
37,0 46,0) 5 5/100 = 0,05 42 0,42
46,0 55,0) 21 21/100 = 0,21 63 0,63
55,0 64,0) 13 13/100 = 0,13 76 0,76
64,0 73,0) 17 17/100 = 0,17 93 0,93
73,0 82,0) 7 7/100 = 0,07 100 1,00

LIMITES DE CLASE DE UN INTERVALO DE CLASE Y MARCA DE CLASE,


PUNTO MEDIO O CENTRO DE CLASE:
Los lmites de clase se denominan superior e inferior establecidos en una
distribucin de frecuencia, estos indican las fronteras de cada intervalo de clase
en una distribucin. Sin embargo los lmites de clase establecidos no
necesariamente son los lmites de clase verdaderos, es aqu donde cobra
importancia la marca de clase (mi).
La marca de clase es empleada usualmente para representar un valor original,
agrupado en cada clase para objeto de anlisis adicionales. La marca de clase puede
calcularse de los lmites de clase.

Ej.:
Marca de clase = Limite de clase inferior + Limite de clase superior
2

INTERVALOS MARCA DE CLASE


[1 3) 1+3/2=2
[3 5) 3+5/2=4
[5 7 5 +7 / 2 = 6

Tablas de contingencia

Una tabla de contingencia es una tabla de clasificacin cruzada o de doble


entrada que muestra las frecuencias observadas de una muestra, cuando hay r filas
y k columnas
La tabla se llamar tabla de contingencia de
r X k.

Ej.: una tabla de contingencia de 2 X 2 tiene 2 filas y 2 columnas, o sea hay 4


celdas
Sexo Femenino Masculino Total
Nivel educacional
Tcnica 12 21 33
Universitaria 42 7 49
Total 54 28 82

Las frecuencias en las celdas son llamadas frecuencias bidimensionales.

El total de frecuencias de una fila o de una columna son llamadas totales


marginales.

Clasificacin tnica
No S Total
Media Media Media
Experiencia
88 124 96
previa (meses)

Grficos unidimensionales, bidimensionales

La representacin grfica es todo mtodo que nos permite visualizar datos


cuantitativos y cualitativos, de manera rpida y sencilla, el tipo de grficos
depender de la informacin que se maneje. Los ms usados son:

GRAFICOS DE BARRAS:

a) Grfico de barras simple:


Se utiliza para mostrar la distribucin de
frecuencias de variables cualitativas y cuantitativas discretas, esta grfica
consiste en una serie de barras del mismo ancho, una por cada categora de
la variable en estudio, la altura de la barra indica la frecuencia asociada a la
categora respectiva.

b) Grfico de barras agrupadas:


Se utiliza para mostrar la distribucin de
frecuencias de variables cualitativas, est constituido por una serie de
barras agrupadas del mismo ancho, una barra para cada variable a comparar
de cada grupo.

c) Grfico de barras subdivididas:


Muy apropiado para mostrar la
composicin proporcional de las observaciones de cada categora dentro de
un total.

d) Grfico sectorial:
Alternativos a los de barras simples, este
grfico est formado por un circulo dividido en sectores de un tamao
proporcional a la cantidad que se va a presentar.
e) Histograma:
Permite representar distribuciones de frecuencias
correspondientes a variables cuantitativas, consiste en elevar columnas
unidas, a una altura igual a la correspondiente frecuencia.

f) Polgono de frecuencia simple:


Se utilizan bsicamente
para comparar distribuciones de frecuencias de variables cuantitativas
continuas. Se construye tomando como base el histograma asociado a la
distribucin, est compuesto por la lnea poligonal que une los puntos medios
de los lados superiores de los rectngulos que forman el histograma.
g) Barras de error: Se utilizan bsicamente para comparar grupos formados
por una variable de agrupacin cualitativa, la comparacin se hace a travs
de la media o promedio de una variable de respuesta cuantitativa.
h) Cajas y rangos: Se utilizan bsicamente para comparar grupos formados
por una variable de agrupacin cualitativa, la comparacin se hace a travs
de la mediana de una variable de respuesta cuantitativa.
i) Dispersiograma o nube de puntos: Se utiliza principalmente para mostrar
posibles asociaciones entre variables cuantitativas.

Finalidad Gua Ctedra II

1.- Repasar los contenidos ya vistos en esta asignatura y en asignaturas


relacionadas.
2.- Comprender los contenidos hasta ac vistos en esta asignatura y en asignaturas
relacionadas.
3.- Resolver las dudas conceptuales y procedimentales de los contenidos hasta ac
vistos.
4.- Resumir los principales conceptos de esta gua para extraer la informacin ms
til a ocupar de aqu en adelante.
5.- Indicar las principales crticas y comentarios en general de la gua
6.- Comprender que es una tabla de distribucin de frecuencia
7.- Comprender el tipo de grafico a utilizar segn la escala de medida de las
variables

Al finalizar su lectura deber estar en condiciones de:

1.- Explique que entendi por variables


2.- Mencione dos ejemplos de variable cualitativa y dos de variable cuantitativa
3.- Mencione dos ejemplos de variable cualitativa nominal
4.- Mencione dos ejemplos de variable cualitativa ordinal
5.- Mencione dos de variable cuantitativa discreta
6.- Mencione dos de variable cuantitativa continua
7.-Explique y de dos ejemplo de datos
8.-Definir que es una tabla de distribucin de frecuencias cualitativa y cuantitativa
9.- Construya una tabla de distribucin de frecuencias cualitativa y cuantitativa
(saque los datos de alguna base de datos existente o invente los datos segn su
rea de especializacin)
10.- Construya una tabla de contingencia con variables a su eleccin
11.- Defina los conceptos; fi, fr, FI, FR.
12.- En el 2005 una nueva clnica abri sus puertas, pero antes de decidir el precio
de sus habitaciones, el director solicita un estudio de los precios de las
habitaciones en otras clnicas, los datos obtenidos fueron los siguientes:
Se muestrearon 40 clnicas en Chile, que registraron los siguientes valores:
39.000, 53.000, 33.000, 40.000, 47.000, 39.000, 43.000, 54.000, 37.000, 43.000,
41.000, 39.000, 56.000, 50.000, 58.000, 47.000, 43.000, 60.000, 44.000, 33.000,
49.000, 47.000, 48.000, 45.000, 50.000, 51.000, 61.000, 47.000, 61.000, 42.000,
43.000, 42.000, 51.000, 44.000, 53.000, 45.000, 45.000, 45.000, 58.000, 45.000.
a) Cul es la poblacin objeto de estudio?
b) Qu variable estamos estudiando?
c) Qu tipo de variable es?
d) Cuntas clnicas tienen un precio entre $53.000 y 63.000
e) Cuntos intervalos son necesarios para el tamao de la muestra?
f) Cul es la amplitud de los intervalos?
g) Determine fi, fr, FI,FR
13.- Cul es la importancia o utilidad de presentar la informacin en un grfico?
14.- Que grafico utilizara si tuviera que presentar la informacin referente al
estado civil de un grupo de 10 pacientes en que 4 eran solteras, 3 separadas, 1
viuda y 2 casadas, realice un esquema del grfico.

También podría gustarte