Está en la página 1de 47

Qu es una variable?

Las variables representan un concepto de vital importancia

Variables

dentro de un proyecto de investigacin.


Las variables se refieren a propiedades de la realidad que

cambian, en contraposicin a las propiedades constantes de


ciertos fenmenos.

Concepto y Clasificacin
segn su nivel de medicin

Las variables, son los conceptos que forman enunciados de

un tipo particular denominado hiptesis. Los conceptos


pretenden describir y explicar la experiencia y comunicar el
conocimiento obtenido.

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

Qu es una variable?

terico mientras que las variables estn


situadas en un plano concreto y perceptible
por los sentidos.
La relacin entre ambas cosas es lo que se
busca mediante el proceso de investigacin
cientfica, lo cual se logra por medio de las
definiciones operacionales de los
conceptos.

Variables dependientes: son caractersticas de

la realidad que se ven determinadas o que


dependen de los valores que asuman otros
fenmenos o variables independientes.
Variables independientes: Los cambios en los

valores de este tipo de variables determinan


cambios en los valores de otras (variable
dependiente).

que puedan ser determinadas por observacin y


que puedan mostrar diferentes valores o
categoras de una unidad de observacin a otra,
de un individuo a otro.
A partir de caracterstica o propiedad las unidades
de anlisis de una muestra o poblacin, se
pueden diferenciar o no entre si.
Ejemplo: sexo, edad, nivel educativo alcanzado,
peso, nmero de hijos, ingresos mensuales,
estado civil, etc.

Los conceptos estn situados en un plano

Dependencia entre variables

Las variables, son caractersticas de la realidad

En una investigacin se denomina variable

independiente a aqulla que es manipulada por


el investigador en un experimento con el objeto
de estudiar cmo incide sobre la expresin de la
variable dependiente.
Esto significa que las variaciones en la variable
independiente repercutirn en variaciones en la
variable dependiente.
En algunas situaciones hay co-dependencia
entre variables, por lo tanto no hay variables
independientes (ejemplo asociacin entre peso y
altura).

Por ejemplo, si un investigador desea conocer la

efectividad de un nuevo tratamiento para prevenir una


enfermedad, para ello se seleccionarn dos grupos
independientes. A uno se le aplicar un tratamiento
(casos) y otro al que no se le aplicar nada en absoluto
(controles).
Para que el experimento tenga validez ambos grupos
deben estar sometidos a las mismas condiciones para
evitar que no aparezcan influencias de otras variables
intervinientes (no controladas).
En este caso la variable independiente corresponde a
la aplicacin o no del tratamiento y la dependiente a la
aparicin o no de la enfermedad.

Clasificacin de las
variables:
Escalas de medicin
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

La escala de medida de una caracterstica o variable,


tiene consecuencias en la forma de presentacin de la
informacin y resumen estadstico.
La escala de medicin, el grado de exactitud y
precisin en la medicin de las variables, tambin
determina los mtodos estadsticos que se usan para
analizar los datos.
Por tanto, es importante definir las caractersticas que
se van a medir y que escala de medicin va a utilizar,
antes de comenzar cualquier trabajo estadstico.

Variables cualitativas:
Son las variables que expresan distintas cualidades,

caractersticas o modalidad. Cada modalidad que se


presenta se denomina atributo o categora y la
medicin consiste en una clasificacin de dichos
atributos.
Los niveles de medicin de las variables cualitativas
pueden ser nominales y ordinales.
Las variables cualitativas pueden ser dicotmicas
cuando slo pueden tomar dos categoras o atributos
posibles como s y no, hombre y mujer o son politmicas
cuando pueden adquirir tres o ms categoras.

11

Variables Cualitativas
Se denomina a cualquier variable no susceptible de ser
cuantificada. Siendo un atributo, cualidad o factor.
Ejemplos:
o
o
o
o
o

Estado Civil.
Sexo.
Profesin.
Calidad de un producto.
Evaluacin en el nivel primario.

10

12

Variables con escala de


medicin nominal

Se clasifican en:
Variables Cualitativas Nominales
Variables Cualitativas Ordinales
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

13

14

Son aquellas variables en el que los grupos

Podemos decir que es el nivel de medicin ms

se definen o diferencian por la presencia de


un atributo o caracterstica.

rudimentario.
Consiste en aplicar nmeros o smbolos para

clasificar a los objetos, personas y caractersticas

En este nivel de medicin los valores no

Las propiedades formales de la Escala Nominal,

pueden ser sometidos a un criterio


jerrquico. Estas variables no tienen ningn
orden inherente entre los atributos ni un
orden de jerarqua.

es decir, las condiciones que requiere, son que


los miembros observaciones o elementos de una
clase o categora deben se equivalentes,
idnticos respecto a la propiedad que tenemos en
cuenta.

15

La forma ms sencilla de determinar si las observaciones

16

Como estadstico descriptivo se pueden calcular

frecuencias o porcentaje para cada atributo y ver


cul es el grupo que tiene mayor frecuencia
alcanzando el concepto de Moda.

se miden con una escala nominal es peguntar si se


clasifican o se colocan en categoras equivalentes.
Con este tipo de escalas se pueden hacer algunas

Tambin

operaciones estadsticas; por ejemplo contar cuantos


elementos hay en cada uno de los grupos formados y asi
tenemos las frecuencias absolutas por categora o

obtener algunas medidas de


asociacin/independencia cuando se relacionan
variables entre s (tabla de contingencia).

Los grficos ms comunes para representar este

atributo.

nivel de medicin son los de sectores o barras.

17

18

Ejemplos de variables con escala nominal:


Clasificacin por sexo: En donde las categoras posibles

son Femenino y Masculino (dicotmica).


Presencia o ausencia de una enfermedad (dicotmica).
Especialidades mdicas en Consultorios Externos de un

Variables con escala de


medicin ordinal

hospital: Clnica Mdica, Cardiologa, etc. (politmica).


Razas de Ganado Bovino: Hereford, Shorton,

Aberdeen Angus , Charolaise (politmica).


Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

19

Si hay un orden inherente entre las categoras,

20

Son aquellas en que los grupos se establecen de

acuerdo a la intensidad con que se presente un atributo


determinado. Si las categoras, atributos o valores que
adopte una variable cualitativa poseen un orden,
secuencia o progresin natural esperable, hablaremos
de variable ordinal.

se dice que las observaciones se miden en una


escala ordinal.
Estas observaciones aun se clasifican como en

Puede establecerse orden, pero no medirse distancia

las escalas nominales, pero algunas tienen

dentro de ese orden. La medida estadstica de tendencia


central ms apropiada para estas escalas es la
"mediana y tambin las medidas de posicin como los
cuartiles, quintiles, deciles o percentiles.

ms o son ms grandes que otras.

21

22

Ejemplo: Los tumores, se clasifican en estadios o etapas

EJEMPLOS DE ESCALAS ORDINALES


Grado de un Carcinoma.

segn su grado de desarrollo:


La clasificacin internacional para valorar la etapa de un

carcinoma de cuello uterino es una escala ordinal de 0 a IV.


Donde la etapa 0 representa carcinoma in situ y la etapa IV

Nivel de ejercitacin desarrollado por semana: Alto,

medio, bajo, nulo.


Estudios cursados: Analfabetos, primarios,

secundarios, terciarios, universitarios.

carcinoma que se extiende mas all de la pelvis o que afecta

Escala de Apgar del recin nacido.

a la mucosa de vejiga y recto.

Escalas de dolor.

Desde luego, por orden inherente en esta escala ordinal, la

Escalas del Coma de Glasgow.


Escalas Likert.

etapa IV tiene peor pronstico que la 0.

23

que aunque existe un orden entre categoras la diferencia


entre dos grupos adyacentes no es la misma en la escala.
Para ilustrarlo, considrense las calificaciones APGAR, que

describen la madurez de nios recin nacidos en una


escala de 0 a 10, los valores menores indican depresin de
funciones cardiorrespiratorias y neurolgicas. Sin embargo,
es probable que la diferencia entre una calificacin de 8 y
una de 10 no sea de la misma magnitud que entre 4 y 6.

24

PUNTUACION DE APGAR

Una caracterstica importante de las escalas ordinales es


SIGNO

PUNTUACION
0

Frecuencia cardaca

Ausente

< 100

> 100

Respiracin

Ausente

Lenta, irregular

Regular, lloroso

Tono Muscular

Relajado

Flexin lenta

Motor activo

Color

Respuesta refleja al
catter en fosa nasal

Azuloso, plido

Ninguna

Cuerpo rosceo,
extremidades
azulosa
Muecas

Rosceo en su
totalidad
Tos, estornudo

LOS VALORES DE CADA UNA DE LAS CINCO CATEGORAS SE SUMAN


PARA GENERAR UN RESULTADO QUE VA DE 0 A 10.

25

IMPORTANTE:

Este tipo de escalas ordinales que se construyen sumando la

codificacin de varias variables ordinales y obteniendo un


puntaje final o total, en muchas ocasiones se pueden tratar
como si fueran variables cuantitativas (continuas o discretas,
segn el caso).

26

Las categoras de las escalas nominales y

ordinales deben poder establecerse en forma


objetiva.

Podemos denominarlas escalas de puntaje o scores para

diferenciarlas de las variables cuantitativas.

No se puede utilizan criterios arbitrarios o que

Ejemplos de este tipo de variables complejas:

puedan llevar a confusin. Estos criterios, deben

Escala de depresin de Beck, Minimental, Indice Clnico de

ser claramente estipulados, de tal forma que

Demencia, Coeficiente Intelectual, Escalas que miden la


Atencin, memoria, Escalas que miden la condicin de un
paciente (Coma de Glasgow, Apache II) y muchos otros.

cualquier persona pueda repetir la clasificacin.

27

28

Son las variables que se expresan mediante cantidades

numricas.
Las variables cuantitativas se clasifican en:
Variable discreta: Es la variable que presenta
separaciones o interrupciones en la escala de valores
que puede tomar. Estas separaciones o interrupciones
indican la ausencia de valores entre los distintos
valores especficos que la variable pueda asumir.
(Nmeros enteros)
Variable continua: Es la variable que puede adquirir
cualquier valor dentro de un intervalo especificado de
valores, siempre existe un valor entre dos cualesquiera.

Variables con escala de


medicin cuantitativa o
numrica

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

EJEMPLOS DE ESCALAS NUMERICAS

Peso.
Estatura.
Edad.
Permetro ceflico.

Nmero de hijos.
Cantidad de habitaciones.
Nmero de Partos.
Cantidad de alumnos.

Todas las escalas numricas pueden transformarse

(agruparse) en escalas nominales y ordinales. Lo


inverso no se puede realizar.
Si le asignamos un valor numrico a las categoras de

una escala ordinal o nominal, estos no deben ser

29

30

Variables Cuantitativas
Como se describi anteriormente, se denomina
a cualquier variable susceptible de ser medida
en trminos numricos.
Ejemplos:
Tensin arterial.

Peso.
Edad.

tratados como datos numricos sino como un cdigo

Temperatura.

para identificar al atributo o categora.

Nmero de hijos.

31

La propiedad mas importante que presentan, por encima

de las escalas cualitativas, es que las distancias

ESCALAS CUANTITATIVAS

32

Cuando una escala tiene todas las caractersticas de una

escala ordinal y se conoce la distancia entre dos nmeros


cualesquiera.

numricas iguales representan distancias iguales


empricas.

Discretas

As podemos decir que a dos objetos a los que se ha

asignado en este tipo de escalas los nmeros 5 y 10 estn


igualmente separados que otros dos a los que se ha

De intervalos
Continuas

asignado los nmeros 10 y 15. Que algo que mida 4 es el


De cocientes o razones

doble de otro que mide 2.

ESCALAS DISCRETAS

33

34

Variables Cuantitativas Discretas:

Cuando una observacin solamente puede

Ejemplos:

medirse en valores enteros, la escala de

Nmero de pacientes.

medicin es discontinua o discreta.

Nmero de habitaciones.
Nmero de personas que viven en un hogar.

La forma de medir en general es contando

Cantidad de mdicos por paciente.

unidades como por ejemplo hijos, embarazos,

Nmero de camas de una sala de internacin.

cantidad de personas que se necesitan para una

Frecuencia cardaca.

tarea.

N de clulas

Escalas cuantitativas contnuas

35

Una escala de medida esta caracterizada por

una medida comn y constante que asigna un


nmero real a todos los pares de objetos en
un conjunto ordenado.
Ejemplo de variables continuas:
Edad,

peso, metros cuadrados de una jaula,

concentracin de hemoglobina.

Una de las distinciones que se pueden hacer es entre


las variables cuantitativas que usan una escala de
nmeros donde cero significa que la caracterstica no
existe, y las variables cuantitativas que no atribuyen ese
significado a un punto cero.

36

Muchas de las variables cuantitativas (por ejemplo


ingresos mensuales) poseen ese punto cero, de tal
manera que quien gana $0 no gana nada, carece
completamente del atributo que estamos analizando. De
igual forma quien gana $1000 al da gana el doble que
quien gana $500 al da (Escalas cuantitativas continuas
de cociente o razn).

37

38

Variables Cuantitativas Contnuas:

Otras variables cuantitativas no poseen en punto cero,


tal es el caso de la temperatura: un objeto con
temperatura cero no carece completamente de calor;
en consecuencia un objeto cuya temperatura es 10 no
es el doble de caliente que uno con temperatura 5
sino simplemente 5 ms caliente. (Escalas
cuantitativas continuas intervalares).

Son aquellas variables que pueden tomar infinitos


valores dentro de un intervalo.
Ejemplos:
Ingresos anuales por personal
Temperatura corporal.

Muchas de las variables cuantitativas inventadas por


las Ciencias Psicolgicas y Sociales pertenecen a este
tipo.

Peso en gramos de un recin nacido.


Concentracin de Glucosa en sangre.

39

Tipos de variables

40

Discretas

Nominales

Cuantitativas

Intervalares

Ordinales

Continuas
Cociente o razn

Tipos de variables

Nivel de medicin
de las variables Discretas

Dicotmica

Intervalares

Nominales

Cualitativas

Politmica
Ordinales

Cociente o razn

Puntajes o Scores

Te paso la base de datos


CMOORDENARLOS
DATOS?

Estar queriendo decir:

Archivo de datos
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

43

Para que los datos sean tiles, es necesario organizar

Durante la recoleccin de los datos los especialistas en

las observaciones de modo tal que se pueda reconocer


y distinguir el comportamiento de las caractersticas
observadas y sus relaciones.

estadstica seleccionan sus observaciones de manera que todos


los grupos relevantes estn representados en la muestra.
Para determinar la opinin sobre poltica, por ejemplo, los

Lo importante es que del tipo de observaciones

especialistas podran estudiar a un grupo de personas que

realizadas y el nivel de medicin alcanzado (cmo se


midieron), determinarn las clases de cuadros, grficas
y tablas de resumen que exhiben y comunican mejor las
observaciones.
Tambin definir los mtodos estadsticos a utilizar.

Los datos puede provenir de observaciones hechas por el

44

tengan diferentes nivel de ingresos, nivel educativo, barrio,


grupo de edades, en las mismas proporciones que en la
poblacin estudiada y siempre y cuando estas variables tengan
(o se supone que tienen) alguna relacin sobre la opinin
poltica.

45

46

RECOLECCION DE DATOS

investigador o de registros elaborados con otros propsitos. Por

Recoleccin propia: Fuente de informacin primaria

ejemplo, con fines de facturacin y de informes mdicos, un


hospital registra el nmero de pacientes que utilizan el tomgrafo

Censo vs. Muestreo.

computado. Esta informacin cruzada con otras variables relevadas

Si es una muestra de la poblacin debe representar a todos


los grupos. Inferencia estadstica.

(patologas, edad, sexo, etc.), puede organizarse para producir


resultados que los especialistas pueden describir o interpretar.

Fuentes de terceros: Fuente de informacin secundaria

Cuando los datos se ordenan de manera compacta y til, el

procesamiento de los datos y los resultados obtenidos hace que los


responsables de la toma de decisiones pueden obtener informacin
rpida y confiable.

Fuentes de informacin
Fuentes de informacin primaria:
Aquella fuente que es creada para producir/recolectar informacin

especifica para monitorear o evaluar un indicador.


Informacin original, que se difunde por primera vez.

Los datos pueden provenir de diferentes fuentes de


informacin.

Validez y confiabilidad de las fuentes de informacin?.

47

48

Pruebas para saber si los datos son confiables:


1. De dnde provienen los datos? La fuente es tendenciosa? Es

posible que exista inters para proporcionar datos que


conduzcan a ciertas conclusiones buscadas?

Fuentes de informacin Secundaria:

2. Los datos apoyan o contradicen otras evidencias que se tienen?

Es aquella que es realizada por terceros.

3. Cuantas observaciones se tienen? Representan a todos los

Produce informacin til para medir alguno de nuestros indicadores.


No tenemos ingerencia en la metodologa ni otros procesos del estudio.
Reduce los costos.
Involucra a sectores no tradicionales en la produccin de informacin.

grupos que se desea estudiar?


4. La conclusin es lgica segn nuestra experiencia? Se ha

llegado a conclusiones que los datos no confirman?

COMO ARMAR UN
ARCHIVO DE DATOS

Organizacin de los
Datos relevados

PARA SER USO DE PROGRAMAS QUE


TIENE COMO FUNCIN
EL ANALISIS Y EL PROCESAMIENTO
ESTADSTICO
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

51

El primer paso luego de medir y relevar las

Generalmente los datos recogidos de

un relevamiento estadstico se organiza


en forma de una Matriz de Datos.

variables seleccionadas es organizar la


carga de datos en un soporte informtico,
para su posterior procesamiento y
anlisis.

Una matriz es un arreglo bidimensional

en forma de filas y columnas.

Esto se puede hacer en una planilla de

En

las columnas se colocan las variables relevadas.


En las filas se colocan a cada unidad de
observacin, unidad de anlisis o caso.

Clculo como el Excel o en programas para


el ingreso de datos (Data entry).

53

Variables

Unidades de anlisis

identificador

1
2
3
4
5
6

Var1 Var2 Var3 Var4 Var5 Var6

52

54

Como se observa en la primera fila se

escriben los nombres de las variables


En las subsiguientes filas se cargan los
valores o cdigos de cada caso o
Unidad de anlisis y para cada
variable a lo largo de la fila.
No se tienen que unir celdas.
Tampoco dejar filas o columnas vacas.

55

Si es en el programa Excel:
No se deben dejar clculos hechos a los costados

Variables cualitativas

o al final de la matriz de datos ni tampoco


grficos.
Si los hacemos tendrn que ubicarse en otra hoja.
No se tienen que unir celdas.
Tampoco dejar filas o columnas vacas.
Si no tenemos en cuenta estos detalles al
abrir/exportar en un programa para anlisis
estadstico, lo har con errores o no lo abrir.

con respuestas
Mltiples
Archivo: preguntas mltiples.xls
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

Este tipo de variables no respeta el criterio de mutuamente

57

excluyente como propiedades de una variable.


Por lo tanto para cada opcin o categora se tomar como una
variable, teniendo tantas variables dicotmicas como opciones
tenga la variable con respuestas mltiple.

Ej:

Cada categora u opcin se convertir en una columna en la

base de datos indicando: Si (1) o No(0)

58

Respuestas mltiples
ID

Intr_Inadec

Set_insuf

Asist_insuf

Imponer_impl

No_indicado

Provis_tard

59

Variables con Respuestas Mltiples


Son variables o reactivos de un cuestionario o encuesta (preguntas), en el
cual una unidad de anlisis (encuestado) puede seleccionar ms de una de
las categoras que toma la variable.
Ej: medicacin antiepilptica que toma un paciente.
Ej: tipo de literatura que le gusta leer.

60

Este tipo de variables no respeta el criterio de mutuamente

excluyente que vimos con anterioridad como propiedades de


una variable.
Por lo tanto para cada opcin o categora se tomar como una

variable, teniendo tantas variables como opciones tenga la


variable con respuestas mltiple.
Ej: Qu tipo de texto le gusta leer?:

Ej: tipo de gneros msicales que escucha.

Enciclopedia:___ Manual:___ Policial:___ Aventura:___

Para poder informatizar en una base datos se transforma a cada categora en

Ciencia ficcin:___ Terror:___ Novela:___ Poesa:___ Deporte:___

una variable. Dependiendo de cual sea la pregunta o reactivo la


categora/variable puede ser nominal dicotmica (presencia o ausencia),

Cada categora u opcin se convertir en una columna en la

base de datos indicando si lee (1) o no lee(0).

nominal politmica u ordinal.

10

DECALOGO DEL PLAN DE INVESTIGACIN

RECOLECCIN DE
DATOS PROCESAMIENTO
SITEMATIZACIN Y
ANLISIS

Identificar el problema

Buscar bibliografa

Redactar objetivos

Elegir a quienes estudiar

Elegir qu datos recolectar

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

Una vez recolectados los datos

Definir pasos (Diseo)

Planificar el registro de datos

Planificar el anlisis de datos

Evaluar la viabilidad tica y material del proyecto

10

Decidir donde se va a publicar o presentar el informe

Qu hay que disear?


1.

Procesamiento

Cmo llego desde este punto a lograr .

2.

Sistematizacin

cumplir los objetivos?

3.

Anlisis

Varan segn el
nivel de
medicin de las
variables y

contrastar la hiptesis?
responder a la pregunta de investigacin?

Presentacin

4.

1. Procesamiento
Tareas mecnicas o automatizada necesarias

Varia segn
diseo de
investigacin

2. Sistematizacin
Organizacin y volcado de la informacin en un ARCHIVO DE DATOS DIGITAL
Puede ser: Informtica, manual o mixta.
Con asistencia de programas inespecficos o especficos:
Excel, EpiInfo, Epidata, Access etc.
Datos cuantitativos
Armado de bases de datos: UA, V
Volcado de datos en la base
Asignacin de etiquetas para valores perdido y/o que no corresponden.
Reagrupar/recodificar de valores en nuevas escalas: Cuantitativo Ordinal o Nominal

para volver til la informacin para el anlisis.

Datos:
Numeracin de planillas (identificacin de Unidad de Anlisis)
Codificacin: Ej. 1=Si, 2=No.
Traduccin: Ej. Fecha de nacimiento -> Edad
Tabulacin: Ej. Escala visual de Dolor, Cuestionario de Dash,

Variable

Valor

Ejemplo:
Categora
Societaria:

Junior

Adherente

Certificado

Recertificado

Titular

Edad

Sexo

Trabaja

Residenci
a

Educacin

25

22

31

37

Vitalicio

U.A.
Traduccin y codificacin:
junior=1, Adherente=2, Certificado=3, Rectificado=4, vitalicio=5

Cdigos:

Lugar de resid 1=Cap Fed, 2=GBA, 3=Interior PBA


Modalidad: 1= Lic / 2 = CCC
Trabaja: 1=SI, 2=NO.
Mximo nivel de estudios alcanzados: 1=sin estudios, 2=primario, 3=secundario, 4= Terc./Univ.

11

Anlisis de datos:

3. Anlisis

Eleccin del tipo de anlisis estadstico


Permite resumir la informacin y comparar
los datos con herramientas estadsticas.
Estadstica descriptiva
Estadstica inferencial: Univariado, bivariado y multivariado

68

Descriptivo
Variables cualitativas: frecuencias, %, moda, cuartiles. Grficos
circular, Grficos de barras
Variables cuantitativas: media, mediana, moda, cuantiles,
varianza/desvo estndar. Grficos histograma, diagramas de caya,
barra de errores
Analtico
Comparacin de medias (test de student, Anlisis de la Varianza)
Comparacin de proporciones
Riesgo Relativo y Odds Ratio
Curvas de supervivencia

Significacin estadstica es suficiente? Significacin tcnica/clnica

4. Presentacin de resultados

4. Presentacin de resultados

Criterios en los cuales fundamenta la


eleccin de un implante

Tablas de distribucin de frecuencia


Descriptivos de tendencia central y dispersin
Grficos
Distrib. por sexo de los estudiantes de enfermera
Frecuencia

Porcentaje

Varn

40

21,4

Mujer

147

78,6

Total

187

100,0

EDAD

Estadstico

Media

28,9

Mediana

25,0

Varianza

97,3

Desv.
estndar

9,9

Mnimo

17

Mximo

63

Rango

46

ENCUESTA(n=504encuestados)

4. Presentacin de resultados

ndice de Masa Corporal

Grfico bivariado:
Sin control prenatal por Regines del Pas
NOA

10,4%

Conurbano

7,3%

NEA

7,2%

TOTAL PAIS

6,7%

Cuyo

5,4%

CABA

5,3%

Centro

Brecha 3,7
Rango: 7,6%

4,2%

PBA Interior

Estimacin de riesgo para sobrepeso y obesidad

3,7%

Patagonia

2,8%
0%

2%

4%

6%

8%

10%

Odds Ratio

Valor

Sexo (Masculino / Femenino)

2,5

Intervalo de confianza 95%


Inferior

Superior

1,8

3,3

En esta muestra, los hombres


tiene 2,5 veces mas chances
de sufrir sobrepeso u obesidad
que las mujeres,

12%

12

Madres adolescentes y NO uso de MAC


Madre
adolescente

Tasa de No uso de
MAC

70%
60%

Uso

Si

60,3%

39,7%

No

49,3%

50,7%

Adolescente

60,3%

Remplazo total de
cadera

50,7%
39,7%

40%

N=197

No Adolescente

49,3%

50%

No Uso

74

REGISTRO DE
IMPLANTES:

30%

Edad de los pacientes


por sexo

20%
10%
0%

No uso

Uso
Tasa de no uso de MAC

Odds Ratio
Madre adolescente
(No Uso / Uso)

Valor
1,71

Edad del paciente

IC 95%
Inferior
1,58

Superior
1,85

Desv.
Mediana estnda
r

Sexo

Media

Mnimo

Masculino

58,0

56,0

13,4

57

25

Mximo
87

Femenino

63,0

62,5

14,6

72

23

92

Total

61,0

59,0

14,2

129

23

92

76

La estadstica descriptiva es una gran parte de la

estadstica que propone resumir, analizar y representar los


datos.

ESTADISTICA
DESCRIPTIVA

Generalmente este anlisis es muy bsico y sirve para

caracterizar y resumir a las variable obtenidas.


Aunque hay tendencia a generalizar a toda la poblacin, las

primeras conclusiones obtenidas tras un anlisis


descriptivo, es un estudio calculando una serie de medidas
de tendencia central (Promedio, mediana y moda), para ver
en qu medida los datos se agrupan o dispersan en torno a
un valor central.
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

77

En la mayor parte de los casos, del conjunto de datos que

se obtienen en un estudio estadstico, no se desprende


ninguna informacin til de manera inmediata y evidente.
Los datos obtenidos tiene que ser organizados de tal

manera que la informacin que contienen se resuma para


mostrar patrones de variacin.
Por otro lado solamente cuando se conocen las

caractersticas de los datos se pueden decidir los


mtodos de anlisis estadstico a realizar.

78

En esta clase se ver cmo clasificar y resumir los

diferentes tipos de variables obtenidos en un trabajo


estadstico y mostrar cmo se organizan y exhiben
estos resultados.
Cualquiera que sea el estudio estadstico que se

realice, los primeros pasos del procesamiento de


datos es, en general, transformarlos en cuadros,
grficas o resmenes de cifras, como porcentajes,
ndices o parmetros que representan a una variable.

13

Exploracin y

Como resumir los


datos estadsticos

Presentacin de Datos

Anlisis Exploratorio
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

81

TABLAS DE FRECUENCIAS.

Asigna a cada categora el nmero de elementos que pertenecen a


ella.

Permite visualizar la distribucin de frecuencias de la variable.

Ejemplo

GRAFICOS.

Es la representacin grfica de los resmenes de datos presentados


en tablas.

PARAMETROS / ESTADISTICOS.

Medidas que representan o caracterizan a la variable, siendo de


tendencia central, posicin, dispersin, forma o construidos (ndices,
tasas o variables complejas).
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

83

TABLAS
Aos

Frecuencia

Porcentaje

% acum.

0,1

0,1

0,3

0,5

0,3

0,8

0,4

1,2

12

0,8

2,0

25

1,7

3,6

68

4,5

8,1

56

3,7

11,9

10

73

4,8

11

85

12

Estadgrafos

Aos

Media

12,88

Mediana

12,00

Moda

12
10

9,00

20

11,00

Formas de
resumir los
datos

84

TABLAS

Aos

Frecuencia

Porcentaje

% acum

0,1

0,1

0,3

0,5

0,3

0,8

Estadgrafos

Aos

Media

12,88

Mediana

12,00

Moda

12
10

9,00

20

11,00

0,4

1,2

12

0,8

2,0

25

12,00

25

1,7

3,6

30

12,00

68

4,5

8,1

40

12,00

50

12,00

25

12,00

30

12,00

40

12,00

50

12,00

56

3,7

11,9

16,7

60

13,00

10

73

4,8

16,7

60

13,00

5,6

22,3

70

14,00

11

85

5,6

22,3

70

14,00

461

30,5

52,8

75

15,00

12

461

30,5

52,8

75

15,00

13

130

8,6

61,5

80

16,00

13

130

8,6

61,5

80

16,00

14

175

11,6

73,0

90

16,00

14

175

11,6

73,0

90

16,00

15

73

4,8

77,9

15

73

4,8

77,9

16

194

12,8

90,7

16

194

12,8

90,7

17

43

2,8

93,6

17

43

2,8

93,6

18

45

3,0

96,6

18

45

3,0

96,6

19

22

1,5

98,0

19

22

1,5

98,0

100,0

100,0

20

30

2,0

Total

1510

100,0

Percentiles

Parmetros
Estadsticos
Tablas
Grficos

20

30

2,0

Total

1510

100,0

Percentiles

Mediana

Parmetros
Estadsticos
Tablas
Grficos

14

85

TABLAS

Aos

Frecuencia

Porcentaje

% acum

0,1

0,1

0,3

0,5

0,3

0,8

0,4

1,2

12

0,8

2,0

25

1,7

3,6

68

4,5

8,1

56

3,7

11,9

10

73

4,8

11

85

12

Estadgrafos

Aos

Media

12,88

Mediana

12,00

Moda

12

86

TABLAS

Percentil 75

Aos

Frecuencia

Porcentaje

% acum

0,1

0,1

0,3

0,5

0,3

0,8

0,4

1,2

10

9,00

20

11,00

25

12,00

12

0,8

2,0

30

12,00

25

1,7

3,6

40

12,00

68

4,5

8,1

50

12,00

56

3,7

11,9

16,7

60

13,00

10

73

4,8

5,6

22,3

70

14,00

11

85

461

30,5

52,8

75

15,00

12

13

130

8,6

61,5

80

16,00

14

175

11,6

73,0

90

16,00

15

73

4,8

16

194

17
18
19

Estadgrafos

Aos

Media

12,88

Mediana

12,00

Moda

12
10

9,00

20

11,00

25

12,00

30

12,00

40

12,00

50

12,00

16,7

60

13,00

5,6

22,3

70

14,00

461

30,5

52,8

75

15,00

13

130

8,6

61,5

80

16,00

14

175

11,6

73,0

90

16,00

77,9

15

73

4,8

77,9

12,8

90,7

16

194

12,8

90,7

43

2,8

93,6

17

43

2,8

93,6

45

3,0

96,6

18

45

3,0

96,6

22

1,5

98,0

19

22

1,5

98,0

100,0

100,0

20

30

2,0

Total

1510

100,0

Percentiles

Parmetros
Estadsticos
Tablas
Grficos

20

30

2,0

Total

1510

100,0

Percentiles

Percentil 20

Parmetros
Estadsticos
Tablas
Grficos

87

88

TIPOS DE FRECUENCIAS

Distribucin de Frecuencias

Frecuencias Absolutas
Frecuencias Relativas
Frecuencias Porcentuales
Frecuencias Absolutas Acumuladas
Frecuencias Relativas Acumuladas
Frecuencias Porcentuales Acumuladas

Cuando se trabaja con un conjunto grande de datos, la

forma de organizarlos y resumirlos es construyendo


Tablas de Frecuencias de las variables de interes.
Esto nos permitir observar como se distribuyen los
datos a lo largo del recorrido de la variable.
Podremos observar donde estn ms concentrados, si
hay datos extremos, si hay simetra en la distribucin
etc.

Adems dependiendo de cul sea el nivel de medicin de las


variables, el nmero de datos que se obtuvieron y el nmero de
variables involucradas en el resumen, se construir diferentes
tipos de tabla de frecuencia.

89

Distribucin de frecuencias es como se denomina en

estadstica a la agrupacin de datos en categoras


mutuamente excluyentes (propiedades de una variable)
que indican el nmero de observaciones en cada una de
las categoras.
Esto significa una de las cosas ms importantes de la
matemtica, su estadstica con la agrupacin de datos.
La distribucin de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el
nmero existente en cada intervalo de clase o categora
de una variable.

90

Criterios para armar una tabla de Frecuencias


Para datos medidos en escala nominal, la organizacin de

las categoras es indistinta.


Para datos medidos en escala ordinal, hay que respetar el

orden intrnseco de las categoras que toma la variable.


Para datos cuantitativos hay que agrupar los datos en

intervalos de clase, con algn criterio y teniendo el cuenta


el nmero de datos y el recorrido de la variable. En general
el nmero de intervalos de clase va entre 7 y no ms de 15.

15

91

92

Distribucin de frecuencias y porcentual del


Estado civil actual
Frecuencia

Porcentaje

Soltero

22593

44,5

Casado

22372

44,0

Divorciado

1339

2,6

Separado

977

1,9

Viudo

3486

6,9

Ns / Nr

32

0,1

50799

100,0

Total

Encuesta Educativa en Bajo Flores

Lugar de nacimiento de los nios


Frecuencia
Ciudad de Bs As

1133

83,0

Gran Bs As

49

3,6

Interior del Pas

40

2,9

121

8,9

Bolivia
Per

,4

15

1,1

Brasil

,1

Otros Pases

,1

1365

100,0

Paraguay

Base SIEMPRO 2001

Variable cualitativa nominal: el orden de las categoras de las


variables es arbitrario, por lo que no se debe calcular
frecuencias o Porcentajes acumulados.

Porcentaje

Total

93

94

Nivel Educativo alcanzado


Nivel educativo

Frecuencia

Frec.
Relativa

Encuesta Educativa en Bajo Flores 2002

Porcentaje

%
acum.

Nunca asisti

419.406

0,015

1,5%

1,5%

Preescolar

631.322

0,022

2,2%

3,6%

7.468.725

0,259

25,9%

29,5%

Primario incompleto
Primario completo

5.366.333

0,186

18,6%

48,1%

Secundario incompleto

6.778.825

0,235

23,5%

71,6%

Secundario completo

3.097.247

0,107

10,7%

82,3%

Terciario incompleto

2.842.689

0,098

9,8%

92,1%

Terciario completo

2.076.122

0,072

7,2%

99,3%

7.1610

0,002

0,2%

99,6%

125.939

0,004

0,4%

100,0%

28878218

100,0%

Posgrado incompleto
Posgrado completo

Total

Nivel educativo alcanzado


Frecuencia

5,29%

5,29%

Nivel Inicial

128

11,68%

16,97%

Nivel Primario
Nivel Medio

603
307

55,02%
28,01%

71,99%
100,00%

1096

100,00%

Total

Variable cualitativa ordinal: el orden de las categoras de las variables no es


arbitrario, por lo que se pueden calcular frecuencias o porcentajes acumulados.

% Acum.

58

Jardn Maternal

Base SIEMPRO 2001

Porcentaje

Variable cualitativa ordinal

96

95

Comentarios sobre la tabla anterior:

DISTRIBUCIN DE LA POBLACIN SEXUALMENTE ACTIVA


SEGN EDAD DE LA PRIMERA RELACIN SEXUAL

Edad

FA

Fr

12

16

0,049

13

37

0,114

14

47

0,145

15

75

0,231

16

51

4,9%

FAA

FrA

Es una variables cuantitativa continua, que se truncan los meses


%A

16

0,049

4,9%

11,4%

53

0,164

16,4%

14,5%

100

0,309

30,9%

23,1%

175

0,540

54,0%

0,157

15,7%

226

0,698

69,8%

17

35

0,108

10,8%

261

0,806

80,6%

18

29

0,090

9,0%

290

0,895

89,5%

19

16

0,049

4,9%

306

0,944

94,4%

20

18

0,056

5,6%

324

100,0%

100,0%

Total

324

Variable cuantitativa discreta

o decimales (si una persona tiene 34 aos hasta el da del


cumpleaos 35 seguir figurando la edad anterior)
En la mayora de los casos las variables se redondean,

seleccionado la cantidad de decimales segn un criterio que


esta relacionado con la precisin de la medicin.
En la tabla anterior transformamos una variable que es continua

en discreta. Como son pocas categoras no es necesario


agrupar los datos, pero generalmente en las variables
cuantitativas discretas con muchas categoras es necesario
agrupar los datos en intervalos de clase para poder resumirlos,
como observamos en la prxima tabla.

16

Frecuencia

Edad de los nios

Encuesta Educativa en Bajo Flores. Ao 2003

97

Qu hacemos
en
este caso?

Porcentaje
acumulado

Porcentaje

Distribucin de frecuencias y porcentual de la edad de los nios

0,5

,5

65

4,8

5,3

55

4,0

9,3

66

4,8

14,1

79

5,8

19,9

77

5,6

25,6

68

5,0

30,6

83

6,1

36,7

79

5,8

42,4

93

6,8

49,3

10

81

5,9

55,2

11

74

5,4

60,6

12

83

6,1

66,7

13

81

5,9

72,7

14

85

6,2

78,9

15

68

5,0

83,9

16

80

5,9

89,7

17

69

5,1

94,8

18

52

3,8

98,6

19

10

0,7

99,3

20

0,4

99,8

21
22

Total

98

0,1

99,9

0,1

100,0

1364

100,0

Frecuencia
0 a 4 aos

272

19,9

5 a 9 aos

400

29,3

49,3

10 a 14 aos

404

29,6

78,9

15 a 19 aos

279

20,5

99,3

20 a 24 aos

,7

100,0

1364

100,0

Total

Agrupar con
algn
criterio

Porcentaje
acumulado

Porcentaje

19,9

Encuesta Educativa en Bajo Flores. Ao 2003


Se agruparon las edades en intervalos de clase cada 5 aos

99

100

Distribucin de frecuencias y porcentual de la edad de los nios

Frecuencia
0 a 3 aos
4 a 5 aos
6 a 12 aos
13 a 18 aos

% acumulado

193
156
561
435

14,1
11,4
41,1
31,9

14,1
25,6
66,7
98,6

19

1,4

100,0

1364

100,0

ms de 18 aos

Total

Encuesta Educativa en Bajo Flores. Ao 2003


Edades agrupadas en intervalos de clase desiguales, que corresponden a
grupos de edades segn nivel educativo.

Cmo construimos y presentamos las frecuencias de una


variable cuantitativa numrica?
Se arman intervalos de clase, con la misma amplitud para cada
intervalo, teniendo en cuenta el recorrido o rango de la variable
(valor mximo valor mnimo).
El nmero de intervalos de clase depender del recorrido y de la
amplitud de los intervalos de clase.
Tambin el nmero de intervalos depender de la cantidad de datos
que trabaje, ya que con pocos datos no podr armar una tabla con
muchos intervalos de clase dado que pueden quedar vacos (sin
frecuencias).
Tampoco es necesario armar tablas con ms de 15 intervalos de
clase dado que se pierde la capacidad de resumir la distribucin de
los datos.

101

Ingreso total por hogar


Aqu dividimos a la variable en

intervalos de clase de $ 1000,


salvo el ltimo intervalo que es
abierto.
Para este caso en el cual
observamos que la distribucin
es muy asimtrica, en donde la
mayora de los valores esta en el
primer intervalo de clases
podemos resumir los datos segn
lo que se desee mostrar, por
ejemplo agrupado los datos
utilizando medidas de posicin

Frecuencia

Porcentaje

Hasta $ 1000

24140319

75,5

5575556

17,4

93,0

$2000 - $ 3000

1329832

4,2

97,1

$3000 - $ 4000

467138

1,5

98,6

$4000 - $ 5000

201324

,6

99,2

$5000 - $ 6000

104382

,3

99,6

$6000 - $ 7000

29842

,1

99,7

$7000 - $ 8000

37682

,1

99,8

19222

,1

75,5

99,8

$ 9000 - 10.000

10481

,0

99,9

$ 10000 - 11.000

10922

,0

99,9

$ 11000 - 12.000

10668

,0

99,9

$ 12000 - 13.000

7275

,0

100,0

$ 13000 - 14.000

1110

,0

100,0

$ 14000 - 15.000

7716

,0

100,0

$ 15000 - 16.000

3724

,0

100,0

$ 18000 - 19.000

1956

,0

100,0

Mayor a $ 20.000

276

,0

100,0

31.959.425

100,0

Total

Ingreso total por hogar: SIEMPRO 2001

% acum.

$1000 - $ 2000

$8000 - $ 9000

102

Base de datos SIEMPRO 2001

Una opcin es presentar a la

variable usando medidas de


posicin que nos divida a la
distribucin en intervalos
con igual frecuencia de
datos.
Por ejemplo dividirla en 5
grupos de igual frecuencia
(20% de datos para cada
grupo).
A esto lo llamaremos
quintiles y son medidas de
i i (
i
l )

Ingreso
hogar

Agrupa a los
Sueldos entre

Quintiles

Percentiles

20

$ 178

$ 0 - $ 178

40

$ 400

$178 $ 400

60

$ 700

$400 $ 700

80

$ 1173

$700 $ 1173

Mayor

100

Ms de $ 1173

Base de datos SIEMPRO 2001

17

103

Salarios anuales en una empresa


Salarios

FA

% acum.

Salarios

FA

% acum.

Hasta $25.000

143

30,2

30,2

Hasta $25.000

143

30,2

30,2

$25.000 -$ 50.000

260

54,9

85,0

$25.000 -$ 50.000

260

54,9

85,0

$50.000 -$ 75.000

54

11,4

96,4

Ms $50.000

71

15,0

100,0

Ms $75.000

17

3,6

100,0

Total

474

100,0

474

100,0

Total

Cmo construimos y presentamos


las frecuencias conjuntas de dos
variables cualitativas nominales u
ordinales

Segn algn criterio se puede tomar la decisin de


modificar la amplitud de los intervalos de clase.
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

106

Encuesta Educativa en Bajo Flores

Variable Sexo de los nios encuestados

VARIABLE 1

Tablas bivariadas
o
Tablas de doble entrada
o
Tablas de contingencia

Frecuencia

Porcentaje

Masculino

717

52,6

Femenino

647

47,4

1364

100,0

Total

Ver archivo: base nios flores.xls (Excel) o base nios flores.sav (SPSS)

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

107

108

Encuesta Educativa en Bajo Flores

Encuesta Educativa en Bajo Flores

VARIABLE 1 y VARIABLE 2

Lugar de nacimiento de los nios


VARIABLE 2
Frecuencia
Ciudad de Bs As

Sexo

Porcentaje
Ciudad Bs As

1133

83,0

Gran Bs As

49

3,6

Interior del Pas

40

2,9

143

10,5

1365

100,0

Otros Pases
Total

Lugar de
nacimiento

Masculino

Femenino

600

532

Total
1132

Gran Bs As

23

26

49

Interior del Pas

18

22

40

Otros Pases
Total

76

67

143

717

647

1364

Frecuencia Marginal de Sexo


Frecuencia Marginal de Lugar de nacimiento
Frecuencias conjuntas

18

109

110

Encuesta Educativa en Bajo Flores

Encuesta Educativa en Bajo Flores

VARIABLE 1 y VARIABLE 2: % por filas


(Probabilidad condicional por lugar de nacimiento)

VARIABLE 1 y VARIABLE 2: % por columna


(Probabilidad condicional por sexo)

Sexo
Masculino
Ciudad Bs As
% Lugar de
nacimiento

Sexo
Total

Femenino

53,0%

Masculino

47,0%

Gran Bs As

46,9%

53,1%

100% (49)

Interior del Pas

45,0%

55,0%

100% (40)

Otros Pases

Total

53,1%

46,9%

100% (143)

52,6%

47,4%

100% (1364)

83,7%

82,2%

83,0%

Gran Bs As

3,2%

4,0%

3,6%

Interior del Pas

2,5%

3,4%

2,9%

10,6%

10,4%

10,5%

100% (717)

100% (647)

100% (1364)

Ciudad Bs As

100% (1132)
% Lugar de
nacimiento

Total

Femenino

Otros Pases

Total

111

112

Encuesta Educativa en Bajo Flores

Encuesta Educativa en Bajo Flores

Cruzamiento entre las variable


% por filas

Cruzamiento entre las variable


Frecuencias absolutas de Edad y Sexo en nios
Grupo de
edades
0 a 4 aos
5 a 9 aos
10 a 14 aos
15 a 19 aos
20 a 24 aos
Total

Sexo
Masculino Femenino
141
131
218
182
205
199
146
132
6
3
716
647

Grupo de edades

Total
272
400
404
278
9
1363

Sexo
Masculino

Total
Femenino

- FA

0 a 4 aos

51,8%

48,2%

100 % (272)

5 a 9 aos

54,5%

45,5%

100 % (400)

10 a 14 aos

50,7%

49,3%

100 % (404)

15 a 19 aos

52,5%

47,5%

100 % (278)

20 a 24 aos

66,7%

33,3%

100 %

Total

52,5%

47,5%

100 % (1363)

(9)

Cuando se presenta una tabla de porcentajes por fila (probabilidad


condicional), es necesario poner el nmero de datos de la frecuencia
marginal de cada fila.

113

114

Encuesta Educativa en Bajo Flores

Encuesta Educativa en Bajo Flores

Cruzamiento entre las variable


% por columnas
Grupo de edades

Sexo
Masculino

Femenino

Cruzamiento entre las variable


% sobre el total
Grupo de edades

Total

0 a 4 aos

19,7%

20,2%

20,0%

0 a 4 aos

5 a 9 aos

30,4%

28,1%

29,3%

5 a 9 aos

10 a 14 aos

28,6%

30,8%

29,6%

10 a 14 aos

15 a 19 aos

20,4%

20,4%

20,4%

15 a 19 aos

20 a 24 aos

,8%

,5%

,7%

100 % (716)

100 % (647)

100% (1363)

Total

Cuando se presenta una tabla de porcentajes por columnas


(probabilidad condicional), es necesario poner el nmero de datos de la
frecuencia marginal de cada columna.

20 a 24 aos
Total

Sexo
Masculino

10,3%
16,0%
15,0%
10,7%
,4%
52,5%

Total

Femenino

9,6%
13,4%
14,6%
9,7%
,2%
47,5%

20,0%
29,3%
29,6%
20,4%
,7%
100 % (1363)

Un porcentaje de la tabla sobre el total, no da mucha informacin sobre la


distribucin bivariada, igualmente en la celda total se debe mostrar cul es
el N de la muestra o de la poblacin.

19

115

116

Encuesta Educativa en Bajo Flores

Encuesta Educativa en Bajo Flores

Edad de los nios segn Nivel Educativo


por Concurrencia (% filas)

Nivel Educativo
por Concurrencia a la escuela
Va a la escuela
No

Grupo de
edad segn
Nivel
educativo

Si

0 a 3 aos

158

35

193

4 a 5 aos

28

128

156

6 a 12 aos

10

551

561

13 a 18 aos

48

387

435

ms de 18
aos

16

19

247

1117

1364

Total

Va a la escuela

Total

Grupo de
edad segn
Nivel
educativo

Total

No

Si

0 a 3 aos

81,9%

18,1%

100% (193)

4 a 5 aos

17,9%

82,1%

100% (156)

6 a 12 aos

1,8%

98,2%

100% (561)

13 a 18 aos

11,0%

89,0%

100% (435)

mas de 18 aos

15,8%

84,2%

100% (19)

18,1%

81,9%

100,0%

Total

118

Presentacin Grfica de Datos


Representacin de actos numricos por medio de un dibujo
esquemtico que hace visible la relacin o gradacin que

GRAFICOS

guardan entre s:
Es la manera ms usual de presentacin de datos
Retrato grfico de informacin cuantitativa
Provee de una mirada la idea general de los datos
Ms fciles de interpretar
Menos grado de detalle

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

119

120

Grfico

Utilidades

Eje y

1.

Tener una primera impresin de los datos antes de comenzar el anlisis


(explorar).

Or
de
na
da

Eje x

Abscisa

2.

Eleccin de tests estadsticos a realizar.

3.

Poder del Test de la ojeada.

4.

Mostrar los valores que asumen los datos.

5.

Detectar patrones.

6.

Comparar distintas muestras, o comparar en el tiempo.

7.

Evaluar la distribucin de los datos.

20

122

Distribucin porcentual de sexo


Base de datos de adultos sanos

Grficos de Sectores
Es exclusivo para variable cualtitativa
nominales
N= 585
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

123

124

Grfico de Sectores o Circular (EPH GBA)

Grfico de Sectores o Circular (EPH Corrientes)


Vivienda en villa
1,1%

Otro
1,5%

Sin fines habitacin


,1%

Esto no conviene!!

Vivienda en lugar de
,2%
Inquilinato
,1%
Departamento
34,2%

Departamento

34,2%
Casa
64,3%
Casa
64,3%

125

Grfico de Sectores o Circular (EPH GBA)


Inquilinato

126

Grfico de Sectores o Circular


Encuesta Anual de Hogares 2009
Ciudad de Buenos Aires

7,4%
Vivienda en lugar de

14,8%

Sin fines habitacion

7,4%

Otros
1,5%

Vivienda en villa

70,4%

Se entiende?

Otros (1,5%) se puede


Graficar a parte

21

127

128

Que asco de
grfico!!

Est rereremal!!!

130

ndice de necesidad de tratamiento de caries en nios


de 5 a 7 aos

Esta bien?

ndice de necesidad de tratamiento de caries en nios


de 5 a 7 aos

n:811

Es un desastre

131

ndice de necesidad de tratamiento de caries en nios


de 5 a 7 aos

Y este????
Vamos eleg uno!!!

O mejor asi?

ndice de necesidad de tratamiento de caries en nios


de 5 a 7 aos

132

22

133

Grficos de Barras
Es exclusivo para variable cualitativas nominales
y ordinales.
Tambin se puede usar para variables
cuantitativas discretas con poco recorrido de la
variable.

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

135

Diagrama de Barras

Mejor para atributos no numricos.

Datos Nominales.

Datos Ordinales (eje no arbitrario).

Altura proporcional al nmero de casos.

Barras del mismo ancho.

Distancias entre barras iguales.

Se puede utilizar frecuencias absolutas, relativas y

Grfico de Barras
Verticales
Variables cualitativas nominales

porcentuales.
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

137

Grfico de barras verticales con frecuencias absolutas

138

Grfico de barras verticales con Porcentajes

Base SIEMPRO 2001


Base SIEMPRO 2001

23

139

140

Producciones Extendidas 1996/97

Producciones Extendidas 1996/97


Grfico de barras verticales con frecuencias absolutas

Grfico de barras verticales con %

Fuente: Direccin de Coordinacin de Delegaciones de la Secretaria de Agricultura, Ganadera,


Pesca y Alimentacin, SAGPyA, 2003.

Fuente: Direccin de Coordinacin de Delegaciones de la Secretaria de Agricultura, Ganadera,


Pesca y Alimentacin, SAGPyA, 2003.

142

Grfico de Barras
Verticales
Variables cualitativas ordinales

Grfico de barras verticales para variables cualitativas ordinales.


En el eje de las x (variables) hay que respetar el orden.

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

144

Ingreso promedio mensual de los ocupados de 10 aos y ms por mximo nivel


educativo alcanzado. Ciudad de Buenos Aires. Ao 2008

Distribucin porcentual del nivel de instruccin alcanzado


Base de datos de adultos sanos

3.500

3.189
3.000

2.500

Pesos

2.161
1.898

2.000

1.383

1.500

1.189
1.000

500

0
Total

Hasta primario
incompleto

Primario completo/
Secundario
Superior completo y
secundario
completo/ superior
ms
incompleto
incompleto

N= 585

Fuente: Direccin General de Estadstica y Censos (Ministerio de Hacienda GCBA). EAH 2008.

24

145

146

Porcentaje de pacientes con exceso de peso que


atienden los profesionales de la salud

Distribucin porcentual del indice de masa corporal

Base de datos de adultos sanos

n=1254

N= 585

148

EPH: Provincia de Corrientes


20

Grafico de barras para

variables cuantitativas
discretas.
No estn los datos
agrupados.

16
14

Porcentaje

Grfico de Barras Verticales

18

12
10
8
6

Variables cuantitativas discretas

4
2
0
1

10 11 12 14 16

Cantidad de personas en el hogar

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

149

EPH: Provincia de Corrientes


40

150

ndice de necesidad de tratamiento de caries en nios


de 5 a 7 aos

Porcentaje

30

20

10

0
1

11

Cantidad de habitaciones que tiene en el hogar

25

151

152

Pas de Origen de los que respondieron la encuesta


n=836

Grfico de Barras
Horizontales

154

Indicadores por Regin de base poblacional: Tasa de cesreas


Patagonia

37,3%

Cuyo

31,1%

Centro

30,0%

NOA

27,8%

TotalPas

27,5%

NEA

Brecha 1,5
Rango: 12,8%

26,9%

CABA

24,8%

PBA

Estimacin estadstica obtenida de las oficinas locales del SENASA ao 2002.

Grfico de barras horizontales para variables cualitativas


nominales ordenados de mayor a menor frecuencia (si la variable
es ordinal, no se puede cambiar el orden de las categoras de la
variables).

24,5%
0%

5%

10%

15%

20%

25%

30%

35%

40%

155
156

Distribuciones Bivariadas
Grfico de Barras Adyacentes

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

26

157

158

Evolucin de la soja durante el quinquenio 1996/97 2001/02


respecto a otras producciones extensivas.

Diagrama de barras adyacentes. Es la representacin grfica de


una tabla de contingencia. Este tipo de grafico permite visualizar
si hay relacin entre variables.

Fuente: Direccin de Coordinacin de Delegaciones de la Secretaria de Agricultura, Ganadera, Pesca y


Alimentacin, SAGPyA, 2003.

159

Evolucin de la soja durante el quinquenio 1996/97 2001/02


respecto a otras producciones extensivas.

160

Distribucin porcentual del indice de masa corporal por sexo

Base de datos de adultos sanos

Fuente: Direccin de Coordinacin de Delegaciones de la Secretaria de Agricultura, Ganadera, Pesca y


Alimentacin, SAGPyA, 2003.

N= 585

161

Distribucin porcentual del indice de masa corporal por sexo

Base de datos de adultos sanos

162

Porcentaje de pacientes atendidos con exceso de peso por Especialidad Mdica

n=1254

N= 585

27

164

Grfico de Barras Superpuestas


80

Distribuciones
Bivariadas

70

60

50

40

30

Va a la escuela

20

Grfico de Barras Superpuestas

10

Si
No

0
0 a 3 aos

6 a 12 aos

4 a 5 aos

mas de 18 aos

13 a 18 aos

Grupo etreo segn Nivel educativo

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

165

Grfico de Barras Superpuestas Al 100%

166

Evolucin de la soja durante el quinquenio 1996/97 2001/02


respecto a otras producciones extensivas.

Compara como contribuye cada categora al total

167

Grfico de Barras Superpuestas Al 100%

Tasa neta de escolarizacin de la poblacin de 13 a 17 aos. Nivel de enseanza Secundario,


segn zona. Ciudad de Buenos Aires. Ao 2009.

Compara como contribuye cada categora al total


100

13
12

95,4

14
15

11
6

86,0

84,0

82,8

1
80

10
7

88,2

90

73,8

70

8
60

Zona A (norte)
Zona B (este)
Zona C (sur)
Zona D (oeste)
Zona E (centro)

50

Total

A (norte)

B (este)

C (sur)

D (oeste) E (centro)

Fuente: Direccin General de Estadstica y Censos (Ministerio de Hacienda GCBA). EAH 2009.

28

169
170

En general, los datos nominales se describen en

trminos de porcentajes o proporciones (frecuencias


relativas).
Las tablas de contingencia, grficos circulares y
grficas de barras son las mas comunes para mostrar
esta clase de informacin.
Las mismas clases de cuadros y grficas que se
utilizan pare exhibir datos nominales se usan tambin
con datos ordinales, salvo el diagrama circular que
podramos decir que es exclusivo de los datos
nominales.

Grficos para Variables


Continuas

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

171

Histogramas

172

Histograma con 25 intervalos de clase

Se usa para distribuciones de frecuencias de variables

cuantitativas discretas o continuas.


Eje Horizontal: Lmites de cada intervalo (en general de

Sujetos Adultos sanos:

igual tamao)
Eje Vertical: frecuencia absoluta, relativa o porcentual;
comenzando en el en origen (cero).
La frecuencia asociada a cada intervalo est dada por el
rea de la barra.
Area total: 100% 1

174

173

Histograma con 9 intervalos de clase

EPH Corrientes

35000

30000

25000

Sujetos Adultos sanos:


20000

15000

10000

5000

0
0

500
250

1000
750

1500

1250

2000

1750

2500

2250

3000

2750

3500

3250

4000

3750

4500

4250

5000

4750

5500

5250

Monto de ingreso total familiar

29

175

Minimental Test

176

Distribucin de edades de los encuestados


n=1254

177

Distribucin de edades de los encuestados

Grficos bivariados:

n=1254

para un variable cualitativa y una


variables cuantitativa continuas

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

180

179

Pirmide de Poblacin

Box-Plots (Diagrama de Cajas)


Variables Discretas/Contnuas
Muy tiles para tener una idea general de todos los

datos
Simetra
Diagnstico de distribucin normal vs. no normal
Comparar distribuciones en varios grupos

30

181

Box-Plots (Construccin)

BOXPLOT: Variables Continuas/Discretas

Ordenar los datos y obtener Max, Min, Q1, Q2 y Q3

Valores adyacentes

Percentilo 75

=Media

Percentilo 25

Dibujar un rectngulo con Q1 y Q3.

Percentilo 75

Mediana
=Media

Mediana

Dibujar la mediana (Q2)


La caja contiene
El 50% de los
valores centrales

Calcular los lmites inferior y superior:


Li = Q1 - 1,5 (Q3 - Q1)
Ls= Q3 + 1,5 (Q3 - Q1)

Percentilo 25

Considerar como atpicos los valores exteriores al intervalo

Valor atpicos

Dibujar una lnea desde los extremos del rectngulo hasta los
valores lmites.

Valores Extremos

Grupo A

182

Identificar los datos fuera del intervalo como atpicos

Grupo B

183

184

Diagrama de Cajas:
Variable: permetro de cintura

Diagrama de cajas: Edad por Gnero


n=1254

n= 585

186

185

ndice de necesidad de tratamiento de caries en nios


de 5 a 7 aos por escuela

Barras de errores
Variables Continuas.
Muy tiles para comparar y graficar diferencias entre

variables teniendo en cuenta el promedio y alguna medida


de dispersin (desvi estndar, error estndar o intervalo de
confianza).
Como condicin las variables deben ser simtricas y

aproximarse a la distribucin normal.


Comparar distribuciones en varios grupos.

31

187

188

Diagrama de Barras de Errores


10,2

Lmite superior del IC al 95%

95% IC Edad

10,0

9,8

Promedio
9,6

9,4

Lmite inferior del IC al 95%


9,2

9,0
N=

716

648

Masculino

Femenino

Sexo

189

Algunos consideraciones entre:


Diagramas de caja
Barra de errores
190

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

191

El diagrama de barra de errores, utiliza para graficar la tendencia

192

Histograma y Diagrama de cajas: Variable Asimtrica no gausiana

central y la dispersin medidas de posicin (mediana, cuartiles y


desvos intercuartiles), lo que permite apreciar la simetra de la
distribucin de la variable y los valores atpicos y extremos.
En los grficos de barra de errores, se utiliza el promedio y los

derivados del desvo estndar (error estndar). Si la variable es


asimtrica este grfico no lo muestra como tampoco los valores
atpicos y extremos. Se recomienda utilizarlos en caso que se
tenga la certeza de que la variables con la que estamos
trabajando tenga una distribucin cercana a la Distribucin
Normal o de Gauss.

32

193

194

Barra de errores y Diagrama de cajas: Variable muy Asimtrica no gausiana

Diagrama
de cajas

Barra de errores con distintos intervalos:

Intervalo de confianza al 95%, un y dos desvos estndar

195

196

197

198

Percentiles

Distribucin z score

Diagrama de cajas

Distribucin Normal

33

199

200

Minimental Test
90000

90000

80000

80000

70000

70000

60000

60000

30

SALARIO

Minimental Test

29

28

27

38
19

26

SALARIO

31

50000

50000

40000

40000

30000

30000

20000

20000
Mediana

10000

25

Hombre
N=

54

Olvido Benigno

42

Mujer

Gnero del empleado

Normal

25%-75%
Rango

Mean
10000
Hombre

Mujer

MeanSE
MeanSD

Gnero del empleado

202

201

204

Grficos para bivariado


Variables Cuantitativas Continuas

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

34

205

Tasa de mortalidad infantil anual (muertos por mil nacidos). Ciudad de Buenos Aires.
Ao 2010
20

Tasa de mortalidad infantil anual (muertos por mil nacidos). Ciudad de Buenos Aires.
Ao 2010

18,3

Curva de regresin ajustada

20

19,0

19,0

18

206

18,2

18

17,1
16,4

16,0

16,0 16,0

16

16
15,2

14,4 14,3

15,5

14,3

14,0

14

12,6

13,5

12

TMI anual

14

12

12,5
11,8

10

10,3

9,9 10,1

10

9,0 9,2
8,5

8,3

7,8 7,9 7,9

7,3
6,7

4
1980

1982

1984

1986

1988

1990

1992

1994

1996

1998

2000

2002

2004

2006

2008

2010

Ao

TMIDGEyC

TMI DGEyC

207
Peso = - 58 + 80 x Talla
R cuadrado = 0,263

208
IMC = 3,4 + 0,26 x PC
R cuadrado = 0,55

210

Resumen sobre estadsticos

Estadgrafos

Tendencia Central:

de Tendencia
Central

Indican valores con respecto a los que los datos parecen agruparse:
Media, mediana y moda

Posicin:
de Posicin

Dividen un conjunto ordenado de datos en grupos con la misma


cantidad de individuos: Cuantiles, percentiles, cuartiles, deciles,...
Dispersin:
Indican la mayor o menor concentracin de los datos con respecto a las
medidas de centralizacin: Desviacin tpica, coeficiente de variacin, rango,

de
Dispersin

varianza

De Formas

Forma: Asimetra y Curtosis


Especificas

209

35

212

211

MEDIDAS DE TENDENCIA CENTRAL


Una descripcin que simplifica y que representa

apropiadamente a la variable, o al conjunto de


datos recolectados de una variable, son las
medidas de tendencia central como el promedio,
la mediana y la moda.

213

214

La media o promedio es una estimacin del valor

Promedio o Media aritmtica

central, en torno al cual fluctan los valores hallados.


Es importante marcar que la media contiene
solamente una parte de la informacin que los datos
proporcionan. No da ninguna indicacin sobre la
variabilidad de las mediciones, y esta es una
informacin esencial sobre todo en el momento en que
es necesario comparar por ejemplo si dos o ms
muestras pertenecen a la misma poblacin.

Poblacin:

Muestra:

215

216

Mediana
Corresponde a la observacin central; es decir es el valor de la

variable que supera a la mitad de las observaciones (o es


menor a la otra mitad).
En variables cualitativas nominales no se puede utilizar.
En variables cualitativas ordinales es la categora de la variable

que contiene al 50 % de la frecuencia porcentual acumulada.

Altura mediana

36

218

217

Para datos cuantitativos discretos:


La mediana de un conjunto de nmeros naturales
ordenados en magnitud es:

Altura mediana

El

valor central si el conjunto es impar

La

media de los dos valores centrales si el

conjunto es par.

220

Ejemplo con N impar:


El conjunto de nmeros

Modo o Moda
Es el valor o categora de la variable que se presentan
con mayor frecuencia.
Para variables cualitativas (nominales u ordinales),
la moda es la categora de mayor frecuencia.
Para variables cuantitativas en general es el punto
medio del intervalo de clases de mayor frecuencia.

tiene mediana = 6.

Ejemplo con N par:


El conjunto de nmeros 5,5,5,9,11,12,15, 18, 19 y 21

219

221

La moda puede no existir, e incluso no ser nica en

caso de existir.
Es la nica medida de centralizacin que tiene sentido

estudiar en una variable cualitativa, pues no precisa de


realizar ningn clculo.
Por su propia definicin, la moda no es nica, pues

puede haber dos o ms valores de la variable que


tengan la misma frecuencia, en cuyo caso tendremos
una distribucin bimodal o polimodal segn el caso.

222

Ejemplo 1:
El conjunto 2,2,5,7,9,9,9,10,10,11,12 y 18

Moda=9
Ejemplo 2:
El conjunto 3,5,8,10,12,15 y 16
no tiene moda.
Ejemplo 3:
Conjunto 2,3,4,4,4,5,5,7,7,7 y 9
tiene dos modas, 4 y 7 (bimodal).

37

223

Posiciones relativas de la
media, la mediana y la moda
para distribuciones de
frecuencias asimtricas
Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

225

Cuando la distribucin de frecuencias de la variable es

simtrica, coinciden ( o son muy parecidas) las medidas de


tendencia central.
Cuando hay una asimetra en la distribucin de las frecuencias,
indica que hay valores extremos hacia una direccin de la
variable y una acumulacin de datos en la otra direccin de la
variable.
El promedio esta influenciado por los valores extremos, en
cambio la mediana no y la moda se encontrar en un extremo
de la distribucin (datos acumulados).
Siendo distintos los valores de las tres medidas de posicin.

Ejemplo de una distribucin de


frecuencias asimtricas

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

227

228

700
14000

Estadsticos
Media:
$ 1212
Mediana:
$ 800
Moda:
$ 600
n=1159

600

500

400
300

12000

10000

n=1159

8000

200
6000

100
4000

13750 - 14500

13000 - 13750

11500 - 12250

10750 - 11500

12250 - 13000

10000 - 10750

8500 - 9250

9250 - 10000

7750 - 8500

7000 - 7750

6250 - 7000

5500 - 6250

4750 - 5500

4000 - 4750

3250 - 4000

2500 - 3250

1750 - 2500

250 - 1000

1000 - 1750

Monto de ingreso total familiar CBA y Conurbano BA

2000

Monto de ingreso total familiar CBA y Conurbano BA

38

229

Ejemplo de una distribucin de


frecuencias simtricas

Monto de ingreso total familiar CBA y Conurbano BA


Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

231

232

100
90

Estadsticos
Media:
Mediana:
Moda:
n=

80
70
60

Edad

60

40

50
40
30

20

20
10

0
77 - 83

72 - 77

61 - 66

66 - 72

50 - 56

56 - 61

45 - 50

40 - 45

34 - 40

29 - 34

24 - 29

18 - 24

8 - 13

13 - 18

Frecuencia

80

37,5
37,0
38,0
507

N=

507

Edad del Encuestado

Edad del Encuestado

233

234

Medidas de posicin
Las medidas de posicin son ndices diseados para

revelar la situacin de una puntuacin con respecto a


un grupo, utilizando a ste como marco de referencia.
Indican para cierto puntaje de la variable qu cantidad

de valores estn por debajo de l (cuantiles o fractiles).

Edad del Encuestado

39

236

235

Las medidas de posicin dividen la distribucin en

Se define el cuantil de orden como un valor de la variable por debajo

del cual se encuentra una frecuencia acumulada


Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

partes iguales, sirven para clasificar a un individuo


o elemento dentro de una determinada poblacin o
muestra.
As en psicologa los resultados de los Test o

pruebas que realizan a un determinado individuo,


se clasifican segn el percentil correspondiente a
la puntuacin obtenida por el sujeto.

237

Si un conjunto de datos ordenados (por ejemplo, de

238

Hay diferentes tipos de cuantiles, pero en

menor a mayor) es dividido en cuatro partes iguales,


obtenemos la medida de posicin denominada cuartil;

general son valores que dejan por debajo

si dividimos a ese mismo conjunto en 10 partes

de l una cierta fraccin de los datos

iguales, obtenemos los deciles; y si se divide la

ordenados en forma creciente y el resto por

distribucin en 100 secciones iguales, obtenemos 99

encima.

valores llamados percentiles

239

Cuando la fraccin es la mitad, se trata de la mediana.


- Cuartiles: Dividen a la distribucin en 4 partes iguales. El
primer cuartil Q1 deja el 25% de los valores por debajo. El
segundo cuartil es igual a la mediana y el tercero Q3 deja el
75%.
- Deciles: Dividen a la distribucin en 10 partes iguales. El primer
decil D1 deja el 10% de los valores por debajo y el resto por
encima. El quinto decil es la mediana.
- Percentiles: Dividen a la distribucin en 100 partes del total.
As, el percentil veinticuatro ( P24 ) deja el 24% de los valores
por debajo. El percentil cincuenta es la mediana, o el quinto
decil.

240

Variable cuantitativa contnua

40

242

Ejemplo: aplicacin en
el crecimiento de nios

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

243

244

245

246

41

248

247

Edad del Encuestado


5
10
25
50
75
90
95

Percentiles
19,00
21,80
28,00
37,00
46,00
53,00
59,00

249

Ejemplo

Ejemplos
El 5% de los recin nacidos tiene un peso demasiado bajo.
Qu peso se considera demasiado bajo?

Qu peso no llega a alcanzar el 25% de los individuos?

Percentil 5 o cuantil 0,05


Qu peso es superado slo por el 25% de los individuos?
Percentil 75
El colesterol se distribuye simtricamente en la poblacin. Se

Qu peso es superado por el 25% de los individuos?

Entre el percentil 5 y el 95
Entre qu valores se encuentran la mitad de los individuos

50%

Tercer cuartil= percentil 75= 80 kg.

Entre qu valores se encuentra el 50% de los individuos


con un peso ms normal?

considera patolgico los valores extremos. El 90% de los


individuos son normales Entre qu valores se encuentran los
individuos normales?

Primer cuartil = percentil 25 = 60 Kg.

Entre el primer y tercer cuartil = entre 60 y 80 kg.


Observar que indica cmo de dispersos estn los
individuos que ocupan la parte central de la muestra.
Ver ms adelante rango intercuartlico.
Los diagramas de caja (boxplot) sintetizan esta
informacin (y algo ms).

ms normales de una poblacin?

Entre el cuartil 1 y 3
250

251

Medidas de Dispersin o Variabilidad


Las medidas de dispersin son ndices que establecen el

252

Por qu estudiar la dispersin?


Es posible evaluar la confiabilidad del promedio que se est

grado en que se parecen o se diferencian entre s un conjunto

utilizando. Si los valores se concentran en torno a la media,

de datos.

esta ltima se considera representativa de los datos. Por el

Una distribucin de frecuencias ser homognea o poco

variable si los datos difieren poco entre s y, por tanto, se


concentran en torno a su promedio. Ser heterognea o muy
variable si los datos se dispersan mucho con respecto al

contrario, una dispersin grande indica que la media no es


confiable.
Una medida de dispersin permite apreciar cun dispersas

son dos o ms distribuciones.

promedio.

42

253

Por ejemplo, supngase que un nuevo modelo de

254

Pero si las dispersiones varan de una muestra a

computadora se ensambla en dos plantas de una

la otra, esta conclusin no es correcta (por

fbrica: la Planta A y B. La media aritmtica de la


produccin diaria en ambas plantas es 50. Con base en

ejemplo, si la produccin en la Planta A vara de

las dos medias se podr llegar a la conclusin de que

48 a 52 ensambles por da, mientras que en la

las distribuciones de las producciones diarias son

Planta B vara de 40 a 60, diremos que en esta

idnticas.

segunda Planta la produccin es ms errtica).

255

Las medidas de tendencia central tratan de describir un valor


representativo o tpico de los dato. Otro aspecto que hay que tener

256

Las medidas para evaluar la dispersin son las siguientes:

en cuenta es como se distribuyen los datos alrededor de la media.

1. Amplitud Total o extensin (recorrido o rango)

Por ejemplo decir que el promedio del colesterol total es 5,81 nos

2. Desviacin semiintercuartil

indica el valor tpico de los datos. Es una informacin til, pero


para lograr una idea mejor de la distribucin de los valores de
estos pacientes se requiere conocer algo acerca de la dispersin

3. Desviacin tpica o Standard


4. Variancia (o varianza)
5. Coeficiente de variacin

de datos. Qu podemos decir si un paciente tiene 5,92 o 5,25 ?

257

MEDIDAS QUE CALCULAN LA DISPERSION


RANGO: Es la diferencia entre la observacin ms grande y la menor. Por
ejemplo el valor ms pequeo de colesterol total es 3,8 y el ms alto es
8,8.

258

Amplitud Total (o rango)


El rango es la medida de dispersin ms sencilla.
Es la diferencia entre el valor ms alto y el ms bajo de un conjunto de datos.
Rango = valor ms alto valor ms bajo
Consideremos los siguientes grupos de calificaciones en tres cursos diferentes:

Por lo tanto el Rango:


RM = x mximo - x mnimo
RM = 8,8 - 3,8 = 5
Muchos autores dan los valores mnimos y mximos en lugar del rango y
en algunos casos estos valores son de informacin ms til desde el
punto de vista descriptivo.

A: 6, 6, 6, 6, 6, 6
B: 5, 6, 7, 8, 7, 3
C: 2, 3, 4, 7, 9, 11
Los tres grupos poseen la misma media aritmtica, pero mientras en el curso A no hay
variaciones (todos los alumnos obtuvieron un 6), el curso B (rango = 5) y C (rango
= 9) ha mostrado importantes variaciones, siendo este ltimo el de mayor
variabilidad.

43

Varianza (variancia)

Desviacin tpica o estndar

La varianza es el promedio de las desviaciones cuadrticas con


respecto a la media. Es un ndice basado en la idea de que, al
elevar al cuadrado las distancias con respecto a la media antes
de hallar su promedio, no suman cero. Adems los cuadrados
son siempre positivos.

Resulta difcil interpretar la varianza para un

solo conjunto de observaciones.


La variancia de 106.8 para las edades de

los pacientes no est en trminos de aos,


sino ms bien en aos al cuadrado.

Para los datos sin agrupar, la frmula es:

Por ello resulta til retomar las unidades de

medicin originales.

Para datos agrupados:


260

259

Coeficiente de Variacin

Desviacin tpica o estndar

El coeficiente de variacin sirve para comparar la variabilidad

Esto es lo que hace la desviacin estndar, al calcular la

raz cuadrada de la varianza. As, se establece con mayor


precisin una separacin promedio de las distancias de

de grupos cuya media es claramente distinta. Se relativiza la


desviacin tpica con respecto a la media y se expresa como un
porcentaje.

cada uno de los valores de la variable a la media.


Es un mejor descriptor de la variabilidad y siempre es

positiva. En el ejemplo anterior, la raz cuadrada de 106.8


aos2 es de 10.3 aos.

Por ejemplo, un grupo de nios de 7 aos mide una talla media

261

= 1.3 con una s = 0.05. Por otro lado, sabemos que su peso
medio es = 25 con una s = 2 Kg. La pregunta que nos hacemos
262
es: qu es ms variable: el peso o la talla?

264

Es la razn entre la desviacin tpica y la media.


Mide la desviacin tpica en forma de
qu tamao tiene con respecto a la media

Tambin se la denomina variabilidad relativa.

Es frecuente mostrarla en porcentajes

Mientras en la Ciencias Exactas, un sistema de medicin con

coeficientes superiores al 10% es inaceptable, en Clnica,


donde las variabilidades inherentes al material de trabajo son
mucho ms grandes, no se puede ser tan estricto.

Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.

Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan ms dispersin en peso
que en altura.

No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad

fijada arbitrariamente

Por ejemplo 0C 0F

Por eso se sugiere usar :

25% < CV% < 50% poco aceptables


10% < CV% < 25% aceptable
CV% < 10% muy aceptable

Los ingenieros electrnicos hablan de la razn seal/ruido (su inverso).

263

44

265

Medidas de asimetra

266

Lo que esperamos, para tratar a una distribucin como

simtrica, es que el grado de asimetra sea lo ms cercano a 0


posible.

Las medidas de asimetra determinan si las frecuencias se

concentran ms hacia los valores bajos (asimetra positiva) o

El coeficiente de asimetra (C.A.) se encuentra generalmente

hacia los valores altos de la variable (asimetra negativa). Si

entre 3 y +3.

una distribucin de frecuencias es simtrica, el sesgo es nulo

La frmula para calcular el sesgo de una distribucin es:

(es decir, igual a 0). En las distribuciones simtricas, el


promedio, la mediana y la moda coinciden (caen en el mismo

C.A. = 3 * (X - Mediana)

punto de la distribucin). Pero, casi todas las distribuciones

Desvo estndar

tomadas de datos reales tiene algn grado de asimetra.

268

267

270

Estadsticos para detectar asimetra

Asimetra o Sesgo

Una distribucin es simtrica si la mitad

izquierda de su distribucin es la imagen


especular de su mitad derecha.

En las distribuciones simtricas media y

mediana coinciden. Si slo hay una moda


tambin coincide

La asimetra es positiva o negativa en

Hay diferentes estadsticos que sirven para detectar


asimetra.

Basado en diferencia entre estadsticos de tendencia


central.

Basado en la diferencia entre el 1 y 2 cuartiles y 2 y


3.

Basados en desviaciones con signo respecto a la


media.

funcin de a qu lado se encuentra la cola


de la distribucin.

En funcin del signo del estadstico diremos que la


asimetra es positiva o negativa.

Distribucin simtrica asimetra nula.

La asimetra es adimensional.

La media tiende a desplazarse hacia las

valores extremos (colas).

Las discrepancias entre las medidas de

centralizacin son indicacin de asimetra.

En este se basa SPSS. No lo calcularemos


manualmente en este curso.

269

45

271

272

Curtosis
La curtosis se refiere a la altura o aplanamiento del polgono de

frecuencia.
Cuando la curva es muy puntiaguda, se la denomina leptocrtica, si

es muy chata, platicrtica, y si es normal, mesocrtica.


La asimetra y la curtosis son medidas independientes, por lo que

una distribucin puede ser simtrica y, por ejemplo, leptocrtica. O,


por el contrario, ser asimtrica y mesocrtica.
De cualquier modo, si la distribucin de frecuencias es cercana a la

normal, el sesgo deber tender a 0 y la curva deber tender a ser


mesocrtica.

273

274

Apuntamiento o curtosis

La curtosis nos indica el grado de apuntamiento aplastamiento) de una


distribucin con respecto a la distribucin normal o gaussiana. Es
adimensional.

Platicrtica: curtosis < 0


Mesocrtica: curtosis = 0
Leptocrtica: curtosis > 0

Los grficos poseen la misma media


y desviacin tpica, pero con
diferente grado de apuntamiento.
En el curso sern de especial inters
las mesocrticas y simtricas
(parecidas a la normal).

275

Distribucin Normal
Esta distribucin es frecuentemente utilizada en las

aplicaciones estadsticas.
Su propio nombre indica su extendida utilizacin,

justificada por la frecuencia o normalidad con la


que ciertos fenmenos tienden a parecerse en su
comportamiento a esta distribucin.

276

La importancia de la distribucin normal se debe principalmente a que hay muchas


variables asociadas a fenmenos naturales que siguen el modelo de la normal:

Caracteres morfolgicos de individuos (personas, animales, plantas,.. de una


especie, peje. tallas, pesos, envergaduras, dimetros, permetros,... )

Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco, o


de una misma cantidad de abono.

Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo


grupo de individuos, puntuaciones de examen.

Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de adaptacin a


un medio,...

Errores cometidos al medir ciertas magnitudes.

Valores estadsticos muestrales, por ejemplo : la media.

46

277

Campana de Gauss

Proporciones y porcentajes
Razones
ndices y Tasas

Media 2 DS

Media - DS

Media

Media + DS

Media + 2 DS

Pablo Salgado EMAIL: estadisticaymetodologia@gmail.com

279

280

Una razn es el nmero de observaciones en un grupo dado con

Una proporcin es el nmero de

una caracterstica dada dividido entre el nmero de

observaciones con una caracterstica

observaciones sin la caracterstica dada (como no haber

dada (cualidad) dividido entre el

muerto):

nmero total de observaciones.

Una razn se define siempre, como una parte dividida entre otra
parte. Por ejemplo, entre pacientes que recibieran una

Un porcentaje es una proporcin

medicacin, la razn de los que murieron a los que sobrevivieron

multiplicada por 100

es:

muertos / vivos

281

ndices o Tasas son semejantes a las


proporciones excepto porque se usa un
multiplicador (por ejemplo, 1.000, 10.000 o
100.000) y se calculan por un espacio
especifico de tiempo.

47