Está en la página 1de 107

Estadstica para la

investigacin Cientfica I

Manuel Hurtado Snchez

La Estadstica y la
Investigacin cientfica
La Investigacin cientfica es
Conjunto de Actividades
Que se realizan de manera sistemtica
y organizada para
Crear y construir
Conocimiento cientfico

aplicando
Mtodos cuantitativos
(Mtodos Estadsticos)

Mtodos cualitativos

ESTADSTICA:
Ciencia encargada de desarrollar mtodos,
tcnicas y procedimientos para la obtencin del
conocimiento a partir de los datos obtenidos en
la investigacin cientfica y facilitar as la toma
de decisiones en condiciones de incertidumbre.

La estadstica en el Planteamiento del


problema
Qu tipo de
datos son
necesarios?

Qu Informacin
estadstica hay
en
antecedentes?

Tcnicas de
recoleccin de
datos?
Mtodos
de anlisis
estadstico?

Las tcnicas estadsticas


son adecuadas para abortar
el problema?

Se requiere
apoyo de la
ciencia
Estadstica

La Estadstica en la
formulacin de la Hiptesis
Con qu tcnicas
estadsticas se
contrastar?

Ho: = o

Debe haber coherencia


entre la Teora, la hiptesis
y el anlisis estadstico de
contrastacin

En investigaciones cuantitativas las Hiptesis


suelen formularse en trminos estadsticos
para facilitar su contrastacin

La Estadstica en el diseo de
contrastacin
La Estadstica forma parte de los
diseos de investigacin experimental

- Comparar que el grupo


control es igual al
experimental antes de aplicar
un tratamiento.
- En la seleccin de la muestra
desde la poblacin en estudio
- Elaboracin de instrumentos
de recoleccin de datos como
test, cuestionarios, etc., y su
verificacin de validez y
confiabilidad.

Diseos de investigacin
Una sola casilla

Clsico

GE. Antes

GE. Despus

GC. Antes

GC. Despus

Un solo grupo despus

Estmulo creciente

G.E. 1

GE. Despus

G.E. 2

G.E. 3

La Estadstica en el anlisis de datos


A la Estadstica le
corresponden las
tareas de organizacin,
descripcin, anlisis y
presentacin de datos
acerca de las muestras
estudiadas, y tambin
la generalizacin de los
resultados a las
poblaciones de donde
las muestras fueron
extradas

La estadstica en las
investigaciones cuantitativas

Paradigma positivista
Concepto =
Conocimiento
cientfico.

Mtodo Cientfico
Objeto de
estudio

Sujeto
investigador

El conocimiento
es objetivo,
elimina
cualquier
influencia o
prejuicio
personal

La metodologa cuantitativa se caracteriza, entre otros aspectos,


por su asociacin a las concepciones epistemolgicas positivistas y
por el uso de la Estadstica en el anlisis de datos

Enfoque cualitativo

Paradigma dialctico

Interaccin hermenutica
y dialctica

Sujeto investigador:
Sujeto investigado
Muchos investigadores interpretativos o
crticos, en algn momento de su proceso
analtico, recurren a tcnicas estadsticas,
para complementar o contrastar las
conclusiones obtenidas por otras vas

El conocimiento es construido a
travs de la interaccin
hermenutica y dialctica entre el
investigador y los investigados

Usos incorrectos de la Estadstica


a. Fines cuestionables:
- Enmascarar conscientemente la realidad.

- Justificar el rigor de un trabajo, con el uso de sofisticados


procedimientos estadsticos.

Usos incorrectos de la Estadstica


b. Subordinacin del problema al mtodo
La eleccin de las tcnicas estadsticas estn
subordinadas al objetivo de investigacin; es decir,
es incorrecto hacer depender el problema de
investigacin del mtodo estadstico.

Usos incorrectos de la Estadstica


c. Violacin de supuestos

Cada tcnica de anlisis estadstico requiere el


cumplimiento de unas condiciones para poder ser
aplicada, a fin de que las conclusiones sean
vlidas.

Usos incorrectos de la Estadstica


d. Conocimiento insuficiente de las tcnicas
La carencia de una suficiente formacin
estadstica podra llevar a algunos investigadores
a limitar su uso a tcnicas relativamente simples e
insuficientes para abordar y resolver problemas
relevantes.

Limitaciones intrnsecas de la
Estadstica

El conocimiento al que llegamos a travs de


la Estadstica y en general de cualquier
investigacin cientfica - no es exacto sino
probable

Relacin entre el Mtodo Estadstico y las


etapas de la Investigacin cientfica
Conocimiento

Problema

Hiptesis
Deduccin de
consecuencias
verificables
Diseo de
investigacin

Mtodo Estadstico
1. Planeamiento
2. Recopilacin de datos
3. Organizacin y presentacin de datos
4. Anlisis e interpretacin de resultados
5. Obtencin de conclusiones y
preparacin del informe

Realidad

Conocimiento

El mtodo estadstico
Planeamiento

Recopilacin de datos
Organizacin y
Presentacin de datos

Anlisis e interpretacin
de resultados
Obtencin de conclusiones y
preparacin del informe

Conceptos bsicos de la
estadstica

Poblacin
Es el conjunto de todas las unidades de
anlisis cuyas caractersticas se van a
estimar

Una poblacin debe definirse sin


ambigedad en trminos de su
contenido, extensin y tiempo.

Ejemplo de poblacin
Estudiantes de
la UNSP de
Chimbote
matriculados
en el ciclo
acadmico
2012-I.

Marco muestral
El Marco Muestral es la relacin de unidades de la
poblacin indicando plenamente su identificacin.
La poblacin a quien se desea investigar se denomina Poblacin
Objetivo
La poblacin contenida en el marco muestral se denomina Poblacin
Muestral o bajo muestreo.
Un buen marco muestral es aquel que hace que la poblacin muestral
sea lo ms cercana posible a la poblacin objetivo
Poblacin Objetivo
Poblacin muestral
Contenida en el Marco
Muestral

Ejemplos de marcos muestrales

1. La gua telefnica
2. Padrn de empresas pblicas y privadas

3. Un plano de la ciudad.
4. Mapa de un pas.
5. El listado de alumnos.
6. rea de un terreno de cultivo.

Muestra
Es un subconjunto de la poblacin que tiene
dos cualidades fundamentales:
- Representativa
- Tamao adecuado

Variable

Es una caracterstica de una unidad elemental


que puede tomar diferentes valores,
dependiendo de la unidad que est siendo
observada. Si la unidad es seleccionada en
forma aleatoria, decimos que la variable es
Variable
aleatoria
Re

Variable:
temperatura

T = 28 C
(Dato)

Clasificacin de las variables


I. Por su naturaleza
1. Cualitativas: (Estado civil, Sexo, Lugar de Procedencia,
Carrera profesional, Ocupacin, etc.)

2.

Cuantitativas
1.

Discretas: (Nmero de estudiantes por aula, Nmero de


artculos defectuosos por lote, Nmero de clientes por hora
que visitan un establecimiento, , etc.)

2.

Continuas: (Peso, estatura, presin, voltaje, .. Etc.)

Clasificacin de las variables


I. Por su escala de medida
1. Nominales
2. Ordinales
3. De intervalo
4. De razn

ESCALAS DE MEDICIN
Escalas mtricas
ESCALA DE
RAZON

Escalas no mtricas
ESCALA DE INTERVALO
ESCALA ORDINAL

ESCALA NOMINAL
D
E
S
C
R
I
P
C
I

Los nmeros u
otros smbolos se
usan simplemente
para clasificar,
para identificar los
grupos a los cuales
pertenecen los
objetos, las
personas o unas
caractersticas.
Esta escala solo
permite
CLASIFICAR

Los nmeros o
smbolos que se
usan no slo
clasifican a los
objetos o personas,
sino adems, existe
una relacin de
orden.
Esta escala permite
CLASIFICAR Y
ORDENAR

Con los nmeros, adems


de ordenarse, (escala
ordinal), puede
determinarse la distancia
entre ellos mediante una
unidad comn y constante
de medida.
En esta escala la razn de
dos intervalos
cualesquiera son
independientes de la
unidad de medida.
En esta escala, la unidad
de medida y el punto
cero son arbitrarios.

Los nmeros,
adems de
tener todas las
propiedades de
una escala de
intervalo, posee
un cero real,
no arbitrario,
es decir que
indica la
ausencia de la
caracterstica
que se
pretende
medir.

PROPIEDADES DE LAS ESCALAS


Escalas mtricas
ESCALA DE RAZON

Escalas no mtricas

ESCALA DE
INTERVALO

ESCALA ORDINAL
ESCALA NOMINAL
P
R
O
P
I
R
D
A
D
E
S

Propiedades:
Equivalencia
Operaciones
Aritmticas
admisibles: ninguna.
Slo es posible
contar

Propiedades:
Relacin de Orden

< , >,
Operaciones
aritmticas
admisibles:
ninguna.
Slo es posible
contar y ordenar los
valores

Propiedades:
0 (cero) arbitrario,
Relacin de orden <
Equivalencia
Operaciones
aritmticas
admisibles: Todas,
excepto la divisin.

Propiedades:
0 (cero) absoluto,
Relacin de orden

< >, ,
Equivalencia,
Operaciones
aritmticas
admisibles: Todas.

OBJETOS

CARACTERSTICA

INSTRUMENTO

PROCESO

REGLA PARA ASIGNAR NMEROS

Personas

Peso

Balanza

Pesado

Asignar los valores de los pesos, en


kilogramos.

Personas

Estado civil

Cuestionario

Clasificacin

Soltero=1, casado=2, viudo=3, otro=4

Personas

Cociente
Intelectual

Test de IQ

Aplicacin del test

Asignar puntuacin,..., 50,51,


...,100,...,140, ...
Puntuacin alta = ms inteligente

Personas

Ingreso mensual

Cuestionario

Cuantificacin del
ingreso en unidades
monetarias

Asignar el valor del ingreso mensual en


nuevos soles.

Hogares

Nmero de
miembros

Cuestionario

Conteo del nmero


de personas en el
hogar

Un miembro=1, dos miembros=2..., 10


miembros=10, ms de 10 miembros=11.

Hogares

Gasto mensual en
educacin

Cuestionario

Cuantificacin en
unidades
monetarias

Asignar el valor del gasto mensual por


concepto de, en nuevos soles.

Comunid
ades

Porcentaje de
catlicos

cuestionario

Conteo

Asignar la frecuencia de casos


registrados en la comunidad.

QUE ES LA MEDICIN?
Es un proceso de asignacin de nmeros u otros signos a las
caractersticas de los objetos (unidades de anlisis), de acuerdo
con ciertas reglas especificadas con anticipacin

MEDIR EN LA PRCTICA ES:

Usar un instrumento

Contar

Registrar
categoras

QUE ES UN DATO
ESTADSTICO?
Dato estadstico. Es el resultado de practicar una medicin del
valor de una variable cuantitativa o el resultado
de determinar la modalidad si la variable es cuantitativa,
en una unidad de anlisis.

Operacionalizacin de variables

Definicin
conceptual
DIMENSIONES

Definicin operacional
de cada dimensin
INDICADORES

Variable
Terica
OPERACIONALIZACIN

CONCEPTO

Variable
Emprica

Categoras de la Variable:
A:
B:

C:
D:
.
.

Cuadro de categorizaciones de
la variable principal a partir de
los indicadores

Ejemplo del cuadro de operacionalizacin de la variable


Nivel Socioeconmico (NSE)
CONCEPTO
(Variable terica)

DIMENSIN

INDICADOR
(Variable Emprica)
I1: Nmero de aos de estudio
del jefe del hogar

D1: Nivel Social:

Nivel Socioeconmico
Es el entorno en que el
(NSE):

I2: Grado acadmico del jefe del


hogar
I3: Ocupacin del Jefe del hogar

hogar se mueve (los


Es una caracterstica de un
dems hogares con los que
I4: Zona de residencia
hogar. El hogar obtiene su
interacta; La ocupacin
NSE a partir de
que tienen, las escuelas a
caractersticas propias del
que se asiste, el club
mismo y el entorno en que
deportivo al que pertenece,
se mueve. La primera forma
I5: Turismo
la parte econmica del NSE las actividades culturales).
y la segunda la parte socio
del NSE. Adems, el NSE
incorpora tanto
caractersticas fsicas de la
vivienda que habita el hogar,
como de las personas que
integran al hogar.

D2: Nivel econmico:


Est determinado por la
capacidad econmica del hogar
(cmo est constituido y cmo
son las personas que lo
conforman; qu artculos o
posesiones tiene)

Valores o
cualidades
Nmero

Ninguno, Br., Mg., Dr.


Gerente, , obrero
eventual o ambulante

Urb. Santa Victoria,


, P.J. El Bosque
Turismo
Internacional,
Turismo nacional,
Turismo local,
No hace turismo

I6: Ingreso econmico familiar


mensual

En nuevos soles

I7: Gasto en alimentacin

En nuevos soles

I8: Vehculos

Uso particular del ao


Uso Partic. No del
ao
Para trabajo

CUADRO DE CATEGORIZACIONES- PERFIL DE LOS NIVELES SOCIO ECONOMICOS

INDICADOR
(dominante)
% de hogares en
Lima Metropolitana

A1

A2

B1

B2

C1

C2

Alto

Medio
superior

Medio
Tpico

Medio
inferior

Bajo
superior

Bajo
inferior

Muy Bajo

Bajo
Extremo

0.8

3.5

6.5

8.8

10.9

21.5

36.1

11.9

Superior
universitaria /
Postgrado
17.5
Aos de estudio del

Educacin del jefe


del hogar

Superior
universitaria

Superior
universitaria

Superior
Superior no
universitaria /
universitaria /
no universitaria secundaria
15.1
13.1

Secundaria

Pequeo
comerciante /
Trabajador
Especializado

10.6

Secundaria /
Primaria
8.8

Primaria /
Secundaria

16.8

16.7

6.2

Profesional
Independiente /
Dependiente

Profesional
Independiente /
Dependiente

Trabajador
especializado /
Profesional
Independiente

+ us$ 5,000

+ us$ 2,800

Us$ 1,000

Us$ 780

Us$ 400

Us$ 320

Us$ 230

Us$ 150

Us$ 750

Us$ 450

Us$ 280

Us$ 235

Us$ 180

Us$ 150

Us$ 135

Us$ 105

100%

100%

92%

82%

77%

61%

42%

16%

100%

100%

96%

92%

73%

56%

25%

7%

100%

100%

67%

32%

8%

2%

1%

0%

Del ao

De 1 ao

De 3 aos

De 4 aos

jefe del hogar


Ocupacin del jefe
del hogar
Ingreso familiar
mensual bruto
Promedio
(aproximado) gasto
mensual en
alimentos
Promedio
(aproximado)
tenencia de TV
LSD / PLASMA
Tenencia de
telfono/Internet
Tenencia de TV
Cable
Servicio domstico
Vehculo de uso
particular

Empresario /
Gerente
General

Pequeo
comerciante /
Trabajador
Especializado

Fuente: Apoyo Opinin y Mercado S.A. Actualizado por M. Hurtado S. Junio/2006

Empleado
Obrero
poco
eventual /
especializado ambulante
/ Obrero

Muestreo

El muestreo es, una herramienta de la


investigacin cientfica que tiene como
objetivo desarrollar mtodos de seleccin
de muestras y de estimacin, para que
proporcionen al menor costo posible,
estimaciones con la suficiente exactitud
Propiedades de una muestra estadstica:
1. Representativa : Se consigue con un diseo de muestra apropiado
2. Tamao adecuado: Se consigue realizando un al clculo del tamao mnimo
para el propsito deseado

Propiedades de una muestra


estadstica
1. Representativa: Significa que la muestra
debe contener todas las clases de unidades
diferentes que existen en la poblacin, en
aproximadamente la misma proporcin. Se
consigue utilizando un diseo de muestra
apropiado

Propiedades de una muestra


estadstica

2. Tamao adecuado: Significa que el


nmero de elementos de la muestra debe ser el
mnimo necesario para las inferencias hacia la
poblacin sean lo suficientemente precisas y
confiables. Se consigue realizando un clculo,
para lo cual existe una frmula para cada
diseo de muestreo y para propsito de
inferencia.

Diseos estadsticos de muestreo


Simple

Probabilstico

Estratificado

Proporcional
ptimo
Neyman

Conglomerado

Una etapa
Dos etapas
Multirtpicas

nico

Tipos de
Muestreo

Sistemtico
Doble
Mltiple
Secuencial

No
Probabilstico

Casos tpicos
Conveniencia
Voluntarios
Bola de nieve

Con reemplazo
Sin reemplazo

Diseo de muestreo aleatorio simple (MAS)


En este diseo, cada una de la unidades elementales de
la poblacin tienen la misma probabilidad de ser incluidas
en la muestra. Es apropiado en poblaciones homogneas

Poblacin N

Parmetro
Inferencia:

Muestreo

Muestra

Estimador

Confianza:

1-

Precisin:

Ejemplo: Para estimar una


Media en el M.A.S.
( z )
2

( z )
2

d
2

Para Estimar una proporcin


P en el M.A.S.
2

( z ) pq
2

d2

( z ) pq
2

Por ejemplo:

Si el propsito comparar dos


medias en un muestreo
aleatorio simple:

Para probar Hiptesis sobre la


igualdad de dos medias

Tamao de muestra para prueba de


hiptesis.
Ho: 1 = 2
Ha: 1 2
Con la potencia , y
Nivel de significancia

Ho: 1 = 2
Ha: 1 2

( z z ) ( 2 )
2

Significancia:
Potencia
:1-

2
1

1 2

Ho: 1 = 2
Ha: 1 < 2

Ha: 1 > 2

( z z ) (
2

2
1

2)
2

1 2
Significancia:
Potencia
:1-

Ho: = o
Ha: o
( z z )
2

Significancia:
Potencia
:1-

Ho: = o
Ha: < o

Ha: > o

( z z )
2

Significancia:
Potencia
:1-

Ho: P = P0
Ha: P P0

( z

P0 (1 P0 ) z
( p P0 )

Significancia:
Potencia
:1-

p(1 p ) 2

Ho: P = Po
Ha: P < Po

Ha: P > Po

( z P0 (1 P0 ) z
( p P0 )
Significancia:
Potencia
:1-

p(1 p )

Ho: P1 = P2
Ha: P1 P2

( z

( p1 p2 )(q1 q2 ) / 2 z
( p1 p2 ) 2

Significancia:
Potencia
:1-

p1q1 p2 q2 ) 2

Tamao de muestra para estudios de Casos y


controles

( z1

2 p(1 p) z1
( p1 p2 ) 2

p1q1 p2 q2 )

Ho: P1 = P2
Ha: P1 < P2

Ha: P1 > P2

( z ( p1 p2 )(q1 q2 ) / 2 z
n
( p1 p2 ) 2

Significancia:
Potencia
:1-

p1q1 p2 q2 ) 2

Diseo de muestreo aleatorio


estatificado (MAE)

N1

Poblacin:

Nh

NL

1-

n1

nh

Muestra estratificada: n

nL

st

Tamao de muestra para


estimar una media en el M. A. E.
Tamao general de
Muestra con asignacin
de Neyman

WS

n
W S

h
2
h

2
h

Asignacin de la
muestra a los estratos

Wh Sh
nh
n
2
Wh Sh

Tamao de muestra para estimar una


proporcin en el M. A. E.

Tamao general de
muestra con
asignacin de Neyman

Asignacin de la
muestra a los
estratos

ph qh

2
W
h ph qh

Wh ph qh
nh
n
Wh ph qh

Qu elementos Seleccionar?

El diseo muestral no termina con el


clculo del tamao de muestra:

Es preciso saber cules son esos


elementos

Muestreo por conglomerados

Poblacin N

1 Etapa

2 Etapa

Muestra n

Muestreo por conglomerados en dos


etapas con probabilidades al tamao

Supongamos que se tiene una


poblacin de N unidades de anlisis
divididas en M conglomerados de
tamaos N1, N2, ... , NM conocidos.

Marco muestral de Conglomerados o


Unidades Primarias
Por ejemplo tenemos un censo actualizado de
un sector de la poblacin tiene 2 189
individuos distribuidos en 8 manzanas del
siguiente modo:

Manzana: 1
2
3
4
5
6
7
8
Tamao : 114 222 525 308 205 191 414
210

La idea es seleccionar una


muestra de exactamente n
elementos en dos etapas:

obtener m conglomerados o unidades de


primera etapa (UPE) de modo que a las
mayores les correspondan mayores
probabilidades de seleccin y luego tomar
exactamente c individuos en cada UPE
(n=mxc)

Por ejemplo;
n = 200,

m = 4 y c = 50.

Pasos
1.

Crear una lista de las UPE y


obtener los tamaos acumulados
Di = N1 + N2 + ... + Ni a lo largo de
la misma:

Marco muestral de UPE


Manzana i Tamao Ni

Tamao acumulado Di

114

114

222

336

525

861

308

1169

205

1374

191

1565

414

1979

210

2189

2 Calcular el intervalo de
seleccin I.

N
I
m
En el ejemplo I = 547,25 547

3. Seleccionar un nmero
aleatorio R entre 1 e I.

Supongamos que usamos al


seleccionar un nmero
aleatorio se obtiene R = 369

Se calculan los nmeros


Z1 =R,

Z2 =R+I,

Z3 = R+2I . Zm = R+(m-1)I

En nuestro caso estos m = 4 nmeros son:


369, 916, 1 463, 2 010

Asociar cada uno de estos


nmeros con una UPE del
modo siguiente: se selecciona
en cada caso la primera UPE
cuyo tamao acumulado supere
o iguale al nmero en cuestin.

Manzanas seleccionadas
Manzana i Tamao N i

1
2
3
4
5
6
7
8

114
222
525
308
205
191
414
210

Tamao
acumulado
Di

114
336
861
1169
1374
1565
1979
2189

Indicador de
seleccin de
la UPE: Zi

369
916
1463
2010

De este modo, 369 identifica a la


manzana 3 ( pues C3 = 861 es el
primer valor que supera 369); 916
identifica a la UPE nmero 4 por
ser 1 169 el primer acumulado
que lo supera; 1 463 a la manzana
6 y 2 010 a la ltima.

As en el ejemplo han quedado


elegidos los conglomerados
que ocupan los lugares 3, 4, 6
y 8 del listado

Hacer una seleccin simple


aleatoria de exactamente c
individuos de cada UPE elegida
en el paso anterior.

En nuestro caso se toman 50


individuos en cada manzana
elegida.

Tcnicas estadsticas
descriptivas

Ejemplo de base de datos


Jefe de
hogar
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Lugar de Procedencia
Chiclayo
= 1 Lambayeque= 2 N Personas por
Ferreafe = 3 Cajamarca = 4
hogar
Piura
= 5 Otros
=6
1
1
6
1
2
1
1
1
1
2
1
1
3
1
1
2
4
1
1
2

1
3
6
1
4
2
2
3
3
4
3
2
5
2
2
4
5
3
4
4

Edad (aos)

Peso (Kgr.)

Cuenta

42
39
35
41
50
39
33
30
26
32
35
26
43
40
30
46
47
38
38
45

66.6
59
69.2
73
66.3
58.6
67.5
66.1
63.1
55.8
69.1
53.9
64.4
72.2
64.4
68.1
73.2
60.5
66.4
61.9

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

ANLISIS DE DATOS ESTADSTICOS

ANLISIS A NIVEL DESCRIPTIVO


PROPSITO: resumir los datos mediante
tcnicas tabulares, grficas y numricas

ANLISIS A NIVEL INFERENCIAL


PROPSITO: Generalizar los resultados
de la muestra a la poblacin

ANLISIS DESCRIPTIVO: Tcnicas tabulares


Tabla N 2 Lugar de procedencia de los jefes de hogar
residentes en el distrito de Chiclayo. Marzo 2011

Lugar de
procedencia

N de jefes de
hogar

Proporcin de
jefes de hogar

% de jefes de
hogar

Chiclayo

25

0.625

62.5

Lambayeque

0.175

17.5

Ferreafe

0.075

7.5

Cajamarca

0.05

5.0

Piura

0.025

2.5

Otros

0.050

5.0

Total

40

100

Fuente: Encuesta a hogares, Marzo 2011

Tabla N 2 Nmero de miembros por hogar en el


distrito de Chiclayo. Marzo 2011
Nmero de
miembros
por hogar

N de Proporcin
hogares de hogares

N
% de Acumulado
hogares
de
hogares

0.0500

5.00

0.1750

17.50

12

0.3000

30.00

10

0.2500

25.00

0.1500

15

6
3
0.0750
7.5
Total
40
1
100
Fuente: Encuesta a hogares, Marzo 2011

%
Acumulado
de
hogares

N
Acumulado
de
hogares

%
Acumulado
de
hogares

5.00

40

100

22.50

38

95

21

52.50

31

77.5

31

77.50

19

47.5

37

92.50

22.5

40

100.00

7.5

Tablas de frecuencia para variables cuantitativas


con muchos valores diferentes

1 Paso: Determinacin del Rango R = Mx - Mn


2 Paso: Elegir o calcular el nmero de clases m
Si se opta por calcular, se puede utilizar una frmula Stugers para
determinar el nmero mximo de intervalos de clase:

m 1 3.322Log(n)
3 Paso: Calcular la amplitud de clase C

R
C
m

4 Paso: Construir los intervalos de clase


Mn.

Mx.

Tablas de frecuencia para variables cuantitativas


con muchos valores diferentes

5 Paso: Determinacin de las frecuencias absolutas simples.


Es decir contar cuantos datos estn contenidos en cada una de los intervalos
de clase. Este paso puede hacerse manualmente con tcnicas del paloteo o
con ayuda de un computador usando el Excel o algn software estadstico
Tcnica del paloteo

Clases

Conteo (ejemplo de conteo)

IIII

IIIII IIIII II

= 12 = n2

IIIII II

7 = n3

III

3 = n4

Total

4 = n1

16 = n

6 Paso: Construir la tabla de frecuencia

Ejemplo Usando los datos de la base que aparece en


la tabla N 1, construya una tabla de frecuencia para la
variable edad.

1 Paso: Determinacin del Rango


R = Mximo Mnimo = 54 25 = 29

2 Paso: Clculo del nmero de clases m


Usaremos la regla de Sturges

3 Paso: Clculo de la amplitud de clase C.

4 Paso: Construccin de los intervalos de clase


Clculo de la cobertura:
Obtencin el exceso de la cobertura respecto al rango R
Mnimo
25

30
C=5

35

40

45

50

55

5 Paso: Conteo del nmero de datos contenidos


en cada intervalo de clase

Conteo manual
Edad
(aos)
[ 25 - 30)
[30 - 35)
[35 - 40)
[40 - 45)
[45 - 50)
[50 - 55)
Total

Nmero de jefes de hogar


IIII
IIIII III II
IIIII IIIII II
IIIII III
IIII
II

=
=
=
=
=
=

n1 = 4
n2 = 10
n3 = 12
n4 = 8
n5 = 4
n6 = 2

n = 40

Conteo con el Excel (Complemento Megastat)


Frequency Distribution - Quantitative

Edad (aos)
cumulative
lower
25
30
35
40
45
50

upper midpoint width frequency


<
30
28
5
4
<
35
33
5
10
<
40
38
5
12
<
45
43
5
8
<
50
48
5
4
55
53
5
2

percent
10.0
25.0
30.0
20.0
10.0
5.0

40

100.0

frequency percent
4
10.0
14
35.0
26
65.0
34
85.0
38
95.0
40 100.0

6 Paso: Construir la tabla de frecuencia


Tabla N 3 Edad de 40 jefes de hogar en el distrito de
Chiclayo. Marzo 2011
Edad del
jefe del
hogar
[ 25 - 30)

N de
jefes Proporcin
de de jefes de
hogar hogar

% de
jefes
de
hogar

N
%
N
%
Acumulado Acumulado Acumulado Acumulado
de jefes de jefes de jefes
de jefes de
de hogar
de hogar
de hogar
hogar
4
10
40
100

0.10

10

[30 - 35)

10

0.25

25

14

35

36

90

[35 - 40)

12

0.30

30

26

65

26

65

[40 - 45)

0.20

20

34

85

14

35

[45 - 50)

0.10

10

38

95

15

[50 - 55)

0.05

40

100

Total

40

100

ANLISIS DESCRIPTIVO: Tcnicas grficas

a
80.0

60.0

70.6
b

% 40.0
20.0
a

b 6.6
a

1.6

Aguadita
San Nicols
General

0.0
Prevalenc.

Incid. Posit.

Inc. Neg. Rec.

Indices

Grfico # 1 :Indices Epizootilgicos de la


mastitis bovina. Comparacin entre UBPC.

ANLISIS DESCRIPTIVO: Tcnicas numricas


Medidas de Posicin

Moda
M o LRI

1 C
1 2

Quintiles

in

Fi1 C

qi LRI
fi

Mediana
n

Fi 1 C
2

M e LRI
fi

Deciles
in

Fi 1 C

10

Di LRI
fi

Cuartiles
in

Fi 1 C

Qi LRI
fi

Percentiles

in

Fi 1 C

100

Pi LRI
fi

Moda:

Mo

Moda para datos sin agrupar

Moda para
datos
agrupados

Mediana:

Me

Mediana

D1

D9

ANLISIS DESCRIPTIVO: Tcnicas numricas


Medidas de resumen
Promedio

Coeficiente de asimetra

Desviacin
Estndar

Coeficiente de
correlacin

Coeficiente
de variacin

Coeficiente de curtosis

Ejemplo de Medidas de
resumen de la variable: Edad
(Salida del Excel)
Edad (aos)

Media

37.35

Error tpico

1.080

Mediana
Moda
Desviacin estndar

36.5
35
6.833

Varianza de la muestra

46.695

Curtosis

-0.224

Coeficiente de asimetra

0.315

Rango

29

Mnimo

25

Mximo

54

Suma
Cuenta

1494
40

Nota:
Si utilizamos
tablas y grficos
de frecuencia
adems de las
medidas de
posicin y de
resumen, ya es
posible realizar un
anlisis descriptivo

ANLISIS DE CORRELACIN
Dos variables medidas con escala nominal

Variables dicotmicas

Tipos de Coeficientes
De correlacin
Coeficiente Phi
Coeficiente de Yule

Variables politmicas

Coeficiente de:
. Contingencia
. Cramr
. Kappa
. Lambda

ANLISIS DE CORRELACIN

Dos variables medidas


con escala Ordinal

Coeficiente de correlacin:
. De Spearman
. De Kendall
. Parcial de Kendall
. De Concordancia de Kendall
. De Acuerdo de Kendall
. De Somers
. Gamma

Dos variables medidas


con escala de intervalo
o de razn

Coeficiente de correlacin de:


. Pearson
. Spearman
. Kendall
. Parcial de Kendall

ANLISIS A NIVEL INFERENCIAL


PROPSITO: Generalizar los resultados
De muestra a la poblacin

ESTIMACIN DE PARMETROS

Estimacin puntua y de Intervalo:


. Una media
. Una proporcin
. Una varianza
. Diferencia de dos medias
.diferencia de dos proporciones
.razn de dos varianzas, etc

Pruebas paramtricas
PRUEBAS DE HIPTESIS
Pruebas no paramtricas

PRUEBAS DE HIPTESIS
Tcnicas paramtricas

Para una muestra

Prueba:
. Normal Z
. Chi-cuadrado
. T de Student

Para dos muestras

Prueba:
. Normal Z
. F de Fisher
. T de Student

Para una k muestras

Prueba:
. Anova
. De Levene
. De Cochran
.

PRUEBAS DE HIPTESIS
Tcnicas no paramtricas

Para una muestra

Prueba
. Chi-cuadrado
. Binomial
. Kolmogorov- S.
. De aleatoriedad
. Del momento
de cambio

Para dos muestras

Prueba:
. Del cambio de McNemar
. De signos de Wilcoxon
. Le las permutaciones
. De Fisher
. De independencia
. De la mediana
. De Mann-Whitney
. De SidneyTukey
. De Moses

Para una k muestras

Prueba:
. Q de cochran
. Anlisis de varianza
de Friedman
. De Page
. Ji-C de homogeneidad
. De la mediana Ext.
. Anova de Krusksl-Vallis
. De Jhonckeere

Tcnicas multivariantes
Dependencia

Qu tipo de relaciones
Estn siendo
examinadas

Interdependencia
Es la estructura
de relaciones
entre:

Cuntas variables
Estn prediciendo
o explicando?

Mltiples relaciones de
variables dependientes e
independiente

Varias variables
dependientes en
una relacin nica

Cul es la escala
De medida de las
Var. Dependientes?

Modelo de
Ecuaciones
estructurales
Mtrica

Una variable
dependiente
en una
relacin nica

Cul es la escala
de medida de las
Var. Dependientes?

Cul es la
Escala de
Medida de las
Var. Predictor?

Anlisis de
Correlacin
cannica

Casos
Encuestados

Anlisis
Factorial

Anlisis
Cluster

Objetos

Cmo
son los
atributos?

No mtrica
Mtrica

Mtrica

Variables

Anlisis de
Correlacin
Cannica con
Var. ficticias
No mtrica

Anlisis multivariante
De variables

No
Mtrica

Mtrico

Regresin
mltiple

Anlisis
Discriminante
mltiple

Anlisis
Multidimensional

No
Mtrico

Anlisis de
correspondencias

gracias