Está en la página 1de 50

Estadstica Aplicada: Didctica de la

Estadstica y Mtodos Estadsticos en


Problemas Socioeconmicos.
Universidad Nacional de Colombia.
Sede Medelln

Enseanza de la Estadstica como parte de la


Metodologa de Investigacin
Dr. Ignacio Mndez Ramrez.
IIMAS-UNAM y IASI
Medelln Colombia 20 de julio de 2010
1

Panorama de la Pltica
1. Tres Preguntas Bsicas:
2. Filosofa de la ciencia. Mtodo cientfico. Objetividad
3. Modelos estadsticos.
4. Papel de la estadstica y el diseo en el Apoyo a
relaciones causales
1. Contrastacin de hiptesis.
2. Explicaciones Alternativas.
3. Factores de Confusin.
4. Significancia Estadstica.
5. Estrategia de modelado.
5. Consideraciones Didcticas
Universidad Nacional de
Colombia . sede Medelln

Universidad Nacional de
Colombia . sede Medelln

1.- Hacer ciencia es ser totalmente


objetivo

Universidad Nacional de
Colombia . sede Medelln

2.- Las estaturas de los seres


humanos tienen distribucin
normal

Universidad Nacional de
Colombia . sede Medelln

3.- En una investigacin se tienen dos grupos de


personas, uno realiz ejercicio fsico vigoroso EFV,
durante un ao y el otro (testigo o control) no lo
hizo. Al trmino del ao se midieron los cidos
grasos en suero.
Los resultados son:
Grupo

Media

Desv. Est.

EFV
Control

100
100

12.3
18.6

2.8
3.1

Se efecta una prueba de t y se tiene P <0.001.


Se concluye el EFV disminuye los valores de
6
cidos grasos.
Universidad Nacional de Colombia . sede Medelln

La respuesta en las tres


preguntas es .
NO
Es necesario evaluarlas a la luz de
consideraciones filosficas,
metodolgicas y estadsticas.

Universidad Nacional de
Colombia . sede Medelln

1.- No se puede ser totalmente objetivo.


En todo trabajo de Investigacin, se
tiene un marco epistmico.
En muchas reas de investigacin
tradicionales
como
la
Biologa,
Medicina, Agronoma, etc., este marco
es
tcito,
es
decir,
se
asume
inconscientemente.
Universidad Nacional de
Colombia . sede Medelln

Adems es muy comn que sea un marco


totalmente errneo,a partir de la filosofa del
Positivismo o Empirsmo Lgico.
El uso de este marco hace que la
investigacin sea muy rgida, pretendiendo
ser totalmente objetiva y racional.

Los filsofos modernos han rechazado


unnimemente este marco epistmico, y han
postulado entre otras cosas, que la ciencia
no es totalmente objetiva, que hay actos en
el proceso de investigacin cientfica, que no
pueden ser justificados totalmente de forma
Universidad Nacional de
9
racional.
Colombia . sede Medelln

<Positivismo>

<Nueva Filosofa>

*Objetivo

*Objetividad intersubjetiva

*Emprico

*Constructivismo

*Racionalidad en el mtodo

*Racionalidad en el cientfico

*Reduccionista

*Sistmico

*Certeza.

*Minimizar errores

*La Matemtica es la realidad

*La matemtica aproxima la realidad

*Causalidad Determinstica

*Causalidad Probabilstica

Ya s
como
es!

As se
debe
hacer!

Tengo una
teora que
funciona
bien.

Este
mtodo
funciona
10

La estadstica cuando se aplica a otra disciplina, lo


que pretende es contribuir a que el conocimiento
que se adquiere sobre un aspecto de la realidad, est
en la medida de lo posible libre de errores, o que
stos sean pequeos.
Representacin

Universidad Nacional de
Colombia . sede Medelln

11

Epistemologa, Metodologa
Estadstica y las Ciencias Fcticas
Para contribuir al objetivo de tener conocimiento
vlido (libre de errores y sancionado por la
comunidad de cientficos), es necesario contemplar
los aspectos epistemolgicos de las disciplinas
involucradas, disear la forma de captar la
informacin ms econmica, factible y adems que
sea cientfica en el sentido de minimizar errores.
Universidad Nacional de
Colombia . sede Medelln

12

Cita
"Modern statistics--concerned with discovering
patterns and structures in nature, with unearthing
relationships which defy unaided perception and
with providing powerful tools for us to improve our
understanding of the world around us-- ought to
be regarded by the general public as one of the
most exciting of disciplines."
David J. Hand. Breaking misconceptions-statistics and its relationship to mathematics

The Statistician, 1998: 47, pert2, pp. 245-250


Universidad Nacional de
Colombia . sede Medelln

13

La estadstica moderna encargada de descubrir


patrones y estructuras en la naturaleza, de
desenterrar relaciones que desafan la percepcin
normal y de proveernos con herramientas
poderosas para que mejorar el entendimiento del
mundo que nos rodea debera ser considerada
por el pblico en general como la ms excitante
de las disciplinas

Universidad Nacional de
Colombia . sede Medelln

14

Los razonamientos con consideraciones


estadsticas intervienen en todas las
etapas del proceso.
El estadstico debe entender y colaborar
en todos los aspectos de la investigacin.
Es un cientfico ms de un grupo de
trabajo
Universidad Nacional de Colombia . sede Medelln

15

ASPECTOS EPISTEMOLGICOS
.- Interesa principalmente cmo es el mundo y no
tanto por qu es as.

.- El encontrar, cmo es el mundo, tiene relacin


con la explicacin de por qu es as.
.- En la medida de tener mejores explicaciones, se
pueden encontrar nuevas regularidades, esto
constituye el complejo terico metodolgico con el
que construimos el conocimiento.

.- No hay objetividad Absoluta. Hay Objetividad


intersubjetiva.
.- La matemtica est en la mente, no en la
realidad. Ningn modelo es verdadero, pero hay
16
algunos muy tiles. Universidad Nacional de
Colombia . sede Medelln

.- No existe un mtodo cientfico infalible


y obligado.
El enfoque cientfico
consiste en una bsqueda comprometida,
exhaustiva
e integral de metodologas
que minimicen o eviten los errores en la
adquisicin del conocimiento
.- No se puede ser totalmente racional,
en el sentido de que todo los que se hace
esta basado en premisas lgicas
.No
hay
hechos
puros.
Hay
interpretaciones de hechos a la luz de
teoras
y
subjetividad,
considerando
siempre el diseo de investigacin.
Universidad Nacional de
Colombia . sede Medelln

17

Elaboracin de proyectos
.- Se pueden considerar dos ciclos ligados en el
proceso de elaboracin de un proyecto (protocolo).
C1.- Problema Marco Terico Hiptesis
Variables.
C2.- Hiptesis DiseoDiseo: Poblaciones, mtodos de
mediciones, intervenciones, seguimiento.

muestreo,

Antes de realizar una investigacin, se debe efectuar


una critica fuerte a todo el proyecto. Se busca
coherencia entre las partes y la minimizacin 18de
errores.
Universidad Nacional de Colombia . sede Medelln

Tipos de diseos, mediciones,


modelos, supuestos, anlisis,
etc..
Encuestas, cohortes,
experimentos, etapas,
estratos, bloques,
apareamiento, modelos de
regresin logsticos,
generalizados, discriminante,
factores, ecuaciones
estructurales, etc

Problema, marco terico,


hiptesis. Conceptos, objetivos,
poblaciones, elementos, etc.
Instrumentos, limitaciones
prcticas, trabajo de campo,
tiempo, dinero, etc.

Universidad Nacional de
Colombia . sede Medelln

19

Realizacin de la investigacin
Conduccin Obtencin de Informacin- Anlisis
Exploratorio Construccin, verificacin y seleccin
de modelos Interpretacin Discusin
Conclusiones y recomendaciones Reporte.
Hay indivisibilidad del mtodo de estudio con las
explicaciones (teora) que se tienen sobre el propio
objeto estudiado.
Mtodo

Teora

Objeto
Universidad Nacional de
Colombia . sede Medelln

Teora

Interpretacin

20

La visn rgida de la ciencia positiva y su


adhesin en forma acrtica produce:
.- Poca creatividad en la metodologa.
.- Se copian diseos y procedimientos.
.- Bsqueda de objetividad, que puede paralizar.
.- Fe ciega en la matemtica.

logP/(1-P) = XB
21
Universidad Nacional de Colombia . sede Medelln

Enfoque dogmtico en Agronoma:

n=4 es parte del mtodo cientfico.

Buen
Experimento!

Un experimento busca minimizar el error experimental


Uso de bloques frecuentemente inadecuado
Para cualquier experimento un coeficiente de
variacin mayor a 20% indica que est mal el estudio.

Un tamao ptimo de parcela experimental para un


cultivo, vlido para todo tipo de tratamientos y
condiciones de experimentacin. Pseudorepeticin
Uso dogmtico (mgico) del 5% de significacin
No hay crtica para los diseos y los anlisis
La distribucin normal existe en la naturaleza
Universidad Nacional de Colombia . sede Medelln

22

2. Las estaturas de los seres humanos tienen distribucin


normal
Con elevada frecuencia bilogos, matemticos,
agrnomos, etc. ; con menor frecuencia siclogos,
socilogos, etc., contestan Verdadero
La Normal es una propiedad
objetiva de la naturaleza,
existe por si sola. Slo hay
P(Y 0) 0
que descubrirla.
Existe una estatura negativa! Se ignora el diseo, a qu
Nios
Mujeres

Hombres

poblacin de humanos se
refiere? todos los que
existen? a mujeres de 30 a
50 aos , clase media, que
23
viven en Mxico, D.F.?
Basquetbolistas

X1
X2

Y1
Y2

X3

Y3

Xk

Yp

P(Y / X ) P(Y / noX )


24

Universidad Nacional de Colombia . sede Medelln

H ~ Hiptesis
D ~ Diseo
E ~ Esperado ( condicionado a H , D y SA)

SA ~ Supuestos Adicionales para el funcionamiento de H


con diseo D.
Universidad Nacional de Colombia . sede Medelln

25

* Teora: H, D, SA

* Prctica: D: ocurre O (Resultado Observado)

Concordancia (contrastacin) E con O?


a).- Concuerdan E con O : se apoya H
b).- No concuerdan E con O : No se apoya H

Cmo se define
la concordancia?
Universidad Nacional de
Colombia . sede Medelln

26

3. En una investigacin se tienen dos grupos de


personas, uno realiz ejercicio fsico vigoroso EFV,
durante un ao y el otro (testigo o control) no lo
hizo. Al trmino del ao se midieron los cidos
grasos en suero.
Los resultados son:
Grupo

Media

Desv. Est.

EFV
Control

100
100

12.3
18.6

2.8
3.1

Se efecta una prueba de t y se tiene P <0.001.


Se concluye el EFV disminuye los valores de
27
cidos grasos
Universidad Nacional de Colombia . sede Medelln

Con elevada frecuencia bilogos, matemticos,


agrnomos, etc. ; con menor frecuencia siclogos,
socilogos, etc., contestan en pregunta 3:
Verdadero

Universidad Nacional de
Colombia . sede Medelln

28

3. En una investigacin se tienen dos grupos de personas, uno


realiz ejercicio fsico vigoroso EFV, durante un ao y el otro
(testigo o control) no lo hizo. Al trmino del ao se midieron
los cidos grasos en suero. Preguntas Bsicas
Cmo eran las personas en caractersticas
inherentes a ellas, tales como sexo, edad, tipo de
alimentacin, raza, estado de salud, etc.?
Cmo se asign el EFV? Lo eligieron las
personas, fue con incentivos, fue al azar, etc.?

Cmo se define EFV y NoEFV?


En qu condiciones se realiz el EFV y el noEFV,
cambios climticos, de salud, de organizacin,
sociales, alimenticios, etc.?
Cmo se midieron los cidos grasos, fue igual29
para ambos grupos? Universidad Nacional de Colombia . sede Medelln

Grupo

Media

EFV

12.3

Control

18.6

P <0.001
qu
papel
juega?

30

Explicaciones alternativas A, B,...Q. Niegan


H, y explican la cercana de E con O de otro
modo. Son de Nulidad
Teora:
Prctica:

H, D, SAH
A, D, SAA
B, D, SAB

E
E
E

Q, D, SAQ

.................

D ocurre O

a) Concuerdan O con E. Se apoyan por igual H, A, B, ... Q


b) No concuerdan O con E. No se apoyan H, A, B, ... Q. 31
Universidad Nacional de Colombia . sede Medelln

Explicaciones alternativas A, B,...Q. Niegan H, y explican


la cercana de E con O de otro modo. Son de Nulidad
Grupo

Edad

Media

EFV

20-25 aos

12.3

Control

47-62 aos

18.6

SA: Supuestos adicionales:


La edad y el EFV estn
asociados. La edad produce
cambios en c. Grasos.
La edad es un Factor de
Confusin en la relacin
EFV
Ac grasos

edad

Universidad Nacional de Colombia . sede Medelln

Explicacin
alternativa: Las
diferencias en ac.
grasos de deben
a la edad y no al
EFV
Ac.
grasos

EFV
o no

32

33
Universidad Nacional de Colombia . sede Medelln

Etapa de planeacin: Cambiar el diseo D o


cambiar la hiptesis emprica H, de manera
que los SA de las explicaciones alternativas,
no operen, o sean improbables.
Etapa de anlisis y discusin: Mostrar
debilidad terica, poca plausibilidad o
imposibilidad de los SA de las explicaciones
alternativas.
Universidad Nacional de
Colombia . sede Medelln

34

Control de factores de confusin


1. Homogeneizacin.- Que los factores de confusin
no varen en todos los elementos del estudio.
2. Formacin de bloques o estratos homogneos.Comparaciones dentro de los bloques y sus
promedios. No interaccin.
3. Aleatorizacin.Se asignan al azar a los
elementos de estudio las variantes del posible factor
causal o tratamientos. Tiende a homogenizar la
distribucin de todas las variables presentes en los
elementos de estudio.
4. Anlisis estadstico:- Se modela la influencia
conjunta de tratamientos y factores de confusin. Se
obtienen los Efectos ajustados
35
Universidad Nacional de Colombia . sede Medelln

3. En una investigacin se tienen 200 hombres de 2550 aos, se asignan al azar 100 de ellos para que
se sometan a ejercicio fsico vigoroso (EFV),
durante un ao y el resto (testigo o control) no lo
haga (noEFV).
Se vigila que las condiciones de vida sean
semejantes en ambos grupos durante el ao.
Al trmino del ao, de cada individuo se toma una
muestra de sangre y se congela de inmediato, para
que en todas despus del mismo tiempo de fro y
con los mismos instrumentos se miden los cidos
grasos en suero.
36
Universidad Nacional de Colombia . sede Medelln

3. En una investigacin se tienen dos grupos de


personas, uno realiz ejercicio fsico vigoroso EFV,
durante un ao y el otro (testigo o control) no lo
hizo. Al trmino del ao se midieron los cidos
grasos en suero.
Los resultados son:
Grupo

Media

Desv. Est.

EFV
Control

100
100

12.3
18.6

2.8
3.1

Se efecta una prueba de t y se tiene P <0.001.


Se concluye el EFV disminuye los valores de
37
cidos grasos
Universidad Nacional de Colombia . sede Medelln

Con elevada frecuencia bilogos, matemticos,


agrnomos, etc. ; con menor frecuencia siclogos,
socilogos, etc., contestan en 3 : Verdadero

Universidad Nacional de
Colombia . sede Medelln

38

Explicacin alternativa A.Hiptesis de Nulidad Estadstica


No es cierta H y ocurre O cercano a E por azar.
SAA: Hay variacin natural en c. grasos en los
humanos, aunque sean semejantes (la misma
poblacin), pueden darse por azar promedios bajos en
los de EFV y altos en los de noEFV. Bajo A, ambos
39
grupos son muestras de la misma poblacin de sujetos.

Se mide
Yi
Ac graso

.....

.....

noEFV

EFV

Se mide
Yi
Ac graso

(Riqueza conceptual: poblaciones,


medias poblacionales, etc.)

Explicacin alternativa A:

EFV noEFV

Se espera que los promedios muestrales sean iguales, EA

YEFV YnoEFV
Se efecta el diseo, D y se obtiene O (observado):

YEFV YnoEFV Dif (O E A ) Dif (O E )


40
Universidad Nacional de Colombia . sede Medelln

La discrepancia entre O y EA, Dif, es compatible


con la hiptesis alternativa del Azar , A?
La discrepancia entre YEFV y YnoEFV es factible o
probable por azar o es improbable.?

Fisher: 0.05 o 0,01


Universidad Nacional de
Colombia . sede Medelln

41

De las posibles Explicaciones alternativas A,


B,...Q. Niegan H, y esperan E de otro modo.
Son de Nulidad, si hay significancia estadstica,
se considera que A: El azar produce E esta
eliminada, pero subsisten B,...Q
Universidad Nacional de
Colombia . sede Medelln

42

Teora:

H, D, SAH

A, D, SAA

E Improbable

B, D, SAB
..........
Q, D, SAQ

E
E

La significancia estadstica slo elimin una


explicacin alternativa, el azar. Slo esto!

Se puede decir que EFV noEFV , pero no a que se


debe la diferencia , ya que subsisten explicaciones
43
alternativas (B, , Q)

En la bsqueda de apoyo a hiptesis de causalidad


probabilstica, se buscan diseos y modelos que
representen bien la realidad, y que permitan valorar si
hay cambios en la distribucin de la variable de
respuesta o efecto Y, al cambiar los valores de la
variable causal, condicionado a valores fijos de
variables que representan explicaciones alternativas.

f (Y / X , A, B....Q) f (Y / X * , A, B....Q)
Donde X y X* son diferentes valores de la variable
causal y A,B,...Q son situaciones fijas de las
explicaciones alternativas. Son los efectos corregidos o
44
efectos de X sobre Y ajustados por A, B, ...Q
Universidad Nacional de Colombia . sede Medelln

En estadstica es comn que se plantee un modelo para


explicar las caractersticas de generacin de los datos.
El modelo puede representar la situacin esperada de
una hiptesis de causalidad, o puede ser el modelo de
negacin de una hiptesis.
Se evala la concordancia entre los datos observados, O
y los esperados E, si el modelo es cierto.

Usualmente esta discordancia se valora de acuerdo a la


probabilidad de una discordancia como la obtenida o
an mayor suponiendo cierto el modelo.
Es el Valor de P.

Universidad Nacional de
Colombia . sede Medelln

45

M1. Modelo mayor, con ms parmetros


M2.- Modelo menor, o modelo reducido, con menos
parmetros.
Se obtiene a partir de M1, al especificar el valor de
uno o ms parmetros, o establecer relaciones entre
ellos.

Se obtiene una medida de la discrepancia entre E1 y


O, Disc (M1); tambin la discrepancia entre E2 y O,
Disc (M2).
Universidad Nacional de
46
Colombia . sede Medelln

Disc (M2) es mayor que Disc (M1), pero es mucho


mayor o no?

La diferencia entre el ajuste de ambos modelos, se


valora en trminos de la probabilidad (P) de una
diferencia como esa o mayor si M2 es cierto.
Si P< 0.05 se adopta M1, si P>0.05 se considera M2
como bueno. (Principio de Parsimonia o Navaja de
Ockam)
Universidad Nacional de
Colombia . sede Medelln

47

La gran dificultad en la enseanza es que se dan los


conceptos de probabilidad y de estadstica desligados entre
si. Vg. despus de 3 o 4 clases sobre probabilidades de
ciertos resultados en juegos de azar, o urnas, (espacios
equiprobables), se pasa a la prueba de hiptesis sobre una
media, a comparar dos medias, donde ahora se usa otro
concepto de probabilidad. !Con razn los alumnos sufren y
no entienden. Otro gravsimo problema es que no se toca
el hecho de que la estadstica se usa como parte del
proceso de adquisicin de conocimientos en muchas
disciplinas y como tal, deben contemplarse los diseos de
investigacin de donde surgen los datos. Los datos nunca
son datos puros, estn ligados a un propsito y a un
diseo. Debe contemplarse la estadstica como parte de la
48
metodologa de investigacin

1. Enfatizar que la estadstica aplicada se convierte en


parte de la metodologa de investigacin.
2. Minimizar temas de Estadstica descriptiva. Si es
importante, pero se debe ligar a la caracterizacin
de una poblacin. El concepto de poblacin(es) en
estudio es fundamental .
3. Presentar los conceptos de probabilidad clsica y
subjetiva, pero con mas nfasis el de probabilidad
frecuentista.
Regularidad
Estadstica
como
estabilizacin de frecuencias relativas al incrementar
el tamao de la muestra. Limite de frecuencias
relativas. Ley de los grandes nmeros. Modelos de
distribucin de eventos en las poblaciones.
49
Universidad Nacional de Colombia . sede Medelln

4.-Distribuciones derivadas del muestreo .


Distribuciones para estadsticos, estimadores y
estadsticas de prueba. Teorema Central del
Limite. Regularidad Estadstica de segundo nivel.
Error estndar
5.- Intervalos de confianza y pruebas de hiptesis.
6.-Liga de los conceptos con investigaciones reales.
7.-Debe quedar muy claro que la inferencia es para
conocer algo de la regularidad estadstica de una
medicin en una o ms poblaciones. Esto se
inserta en las hiptesis de la investigacin

Universidad Nacional de
Colombia . sede Medelln

50