Está en la página 1de 50

Estadística Aplicada: “Didáctica de la

Estadística y Métodos Estadísticos en


Problemas Socioeconómicos.
Universidad Nacional de Colombia.
Sede Medellín

Enseñanza de la Estadística como parte de la


Metodología de Investigación
Dr. Ignacio Méndez Ramírez.
IIMAS-UNAM y IASI

Medellín Colombia 20 de julio de 2010


1
Panorama de la Plática
1. Tres Preguntas Básicas:
2. Filosofía de la ciencia. Método científico. Objetividad
3. Modelos estadísticos.
4. Papel de la estadística y el diseño en el Apoyo a
relaciones causales
1. Contrastación de hipótesis.
2. Explicaciones Alternativas.
3. Factores de Confusión.
4. Significancia Estadística.
5. Estrategia de modelado.

5. Consideraciones Didácticas

Universidad Nacional de 2
Colombia . sede Medellín
Universidad Nacional de 3
Colombia . sede Medellín
1.- Hacer ciencia es ser totalmente
objetivo

Universidad Nacional de 4
Colombia . sede Medellín
2.- Las estaturas de los seres
humanos tienen distribución
normal

Universidad Nacional de 5
Colombia . sede Medellín
3.- En una investigación se tienen dos grupos de
personas, uno realizó ejercicio físico vigoroso EFV,
durante un año y el otro (testigo o control) no lo
hizo. Al término del año se midieron los ácidos
grasos en suero.
Los resultados son:
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1
Se efectúa una prueba de “t” y se tiene P <0.001.
Se concluye “el EFV disminuye los valores de
ácidos grasos”. 6

Universidad Nacional de Colombia . sede Medellín


La respuesta en las tres
preguntas es .
NO

• Es necesario evaluarlas a la luz de


consideraciones filosóficas,
metodológicas y estadísticas.

Universidad Nacional de 7
Colombia . sede Medellín
1.- No se puede ser totalmente objetivo.

En todo trabajo de Investigación, se


tiene un marco epistémico.

En muchas áreas de investigación


“tradicionales” como la Biología,
Medicina, Agronomía, etc., este marco
es tácito, es decir, se asume
inconscientemente.

Universidad Nacional de 8
Colombia . sede Medellín
Además es muy común que sea un marco
totalmente erróneo,a partir de la filosofía del
Positivismo o Empirísmo Lógico.
El uso de este marco hace que la
investigación sea muy rígida, pretendiendo
ser totalmente objetiva y racional.
Los filósofos modernos han rechazado
unánimemente este marco epistémico, y han
postulado entre otras cosas, que la ciencia
no es totalmente objetiva, que hay actos en
el proceso de investigación científica, que no
pueden ser justificados totalmente de forma
racional. Universidad Nacional de
Colombia . sede Medellín
9
<Positivismo> <Nueva Filosofía>
*Objetivo *Objetividad intersubjetiva
*Empírico *Constructivismo
*Racionalidad en el método *Racionalidad en el científico
*Reduccionista *Sistémico
*Certeza. *Minimizar errores
*La Matemática es la realidad *La matemática aproxima la realidad
*Causalidad Determinística *Causalidad Probabilística

¡Ya sé Tengo una Este


¡Así se
como teoría que método
debe
es! funciona funciona
hacer!
bien.

10
La estadística cuando se aplica a otra disciplina, lo
que pretende es contribuir a que el conocimiento
que se adquiere sobre un aspecto de la realidad, esté
en la medida de lo posible libre de errores, o que
éstos sean pequeños.

Representación

Universidad Nacional de 11
Colombia . sede Medellín
Epistemología, Metodología
Estadística y las Ciencias Fácticas
Para contribuir al objetivo de tener conocimiento
válido (libre de errores y sancionado por la
comunidad de científicos), es necesario contemplar
los aspectos epistemológicos de las disciplinas
involucradas, diseñar la forma de captar la
información más económica, factible y además que
sea “científica” en el sentido de minimizar errores.

Universidad Nacional de 12
Colombia . sede Medellín
Cita
"Modern statistics--concerned with discovering
patterns and structures in nature, with unearthing
relationships which defy unaided perception and
with providing powerful tools for us to improve our
understanding of the world around us-- ought to
be regarded by the general public as one of the
most exciting of disciplines."
David J. Hand. ”Breaking misconceptions--
statistics and its relationship to mathematics”
The Statistician, 1998: 47, pert2, pp. 245-250
Universidad Nacional de 13
Colombia . sede Medellín
“La estadística moderna  encargada de descubrir
patrones y estructuras en la naturaleza, de
desenterrar relaciones que desafían la percepción
normal y de proveernos con herramientas
poderosas para que mejorar el entendimiento del
mundo que nos rodea  debería ser considerada
por el público en general como la más excitante
de las disciplinas”

Universidad Nacional de 14
Colombia . sede Medellín
Los razonamientos con consideraciones
estadísticas intervienen en todas las
etapas del proceso.
El estadístico debe entender y colaborar
en todos los aspectos de la investigación.
Es un científico más de un grupo de
trabajo Universidad Nacional de Colombia . sede Medellín
15
ASPECTOS EPISTEMOLÓGICOS
.- Interesa principalmente cómo es el mundo y no
tanto por qué es así.
.- El encontrar, cómo es el mundo, tiene relación
con la explicación de por qué es así.
.- En la medida de tener mejores explicaciones, se
pueden encontrar nuevas regularidades, esto
constituye el complejo teórico metodológico con el
que construimos el conocimiento.
.- No hay objetividad Absoluta. Hay Objetividad
intersubjetiva.
.- La matemática está en la mente, no en la
realidad. Ningún modelo es “verdadero”, pero hay
algunos muy útiles. Universidad Nacional de 16
Colombia . sede Medellín
.- No existe un método científico infalible
y obligado. El “enfoque científico”
consiste en una búsqueda comprometida,
exhaustiva e integral de metodologías
que minimicen o eviten los errores en la
adquisición del conocimiento
.- No se puede ser totalmente racional,
en el sentido de que todo los que se hace
esta basado en premisas lógicas
.- No hay hechos puros. Hay
interpretaciones de hechos a la luz de
teorías y subjetividad, considerando
siempre el diseño de investigación.
Universidad Nacional de 17
Colombia . sede Medellín
Elaboración de proyectos
.- Se pueden considerar dos ciclos ligados en el
proceso de elaboración de un proyecto (protocolo).
C1.- Problema – Marco Teórico – Hipótesis –
Variables.
C2.- Hipótesis – Diseño-
Diseño: Poblaciones, métodos de muestreo,
mediciones, intervenciones, seguimiento.
Antes de realizar una investigación, se debe efectuar
una critica fuerte a todo el proyecto. Se busca
coherencia entre las partes y la minimización 18de
errores. Universidad Nacional de Colombia . sede Medellín
Tipos de diseños, mediciones,
modelos, supuestos, análisis, Problema, marco teórico,
etc.. hipótesis. Conceptos, objetivos,
poblaciones, elementos, etc.
Encuestas, cohortes,
experimentos, etapas, Instrumentos, limitaciones
estratos, bloques, prácticas, trabajo de campo,
apareamiento, modelos de tiempo, dinero, etc.
regresión logísticos,
generalizados, discriminante,
factores, ecuaciones 19
Universidad Nacional de
estructurales, etc Colombia . sede Medellín
Realización de la investigación
Conducción – Obtención de Información- Análisis
Exploratorio – Construcción, verificación y selección
de modelos – Interpretación – Discusión –
Conclusiones y recomendaciones – Reporte.
Hay indivisibilidad del método de estudio con las
explicaciones (teoría) que se tienen sobre el propio
objeto estudiado.
Método Teoría

Objeto Teoría

Universidad Nacional de 20
Colombia . sede Medellín
Interpretación
La visón rígida de la ciencia positiva y su
adhesión en forma acrítica produce:
.- Poca creatividad en la metodología.
.- Se copian diseños y procedimientos.
.- Búsqueda de objetividad, que puede paralizar.
.- Fe ciega en la matemática.

logP/(1-P) = XB
21

Universidad Nacional de Colombia . sede Medellín


Enfoque dogmático en Agronomía: ¡Buen
Experimento!
n=4 es parte del método científico.
Un experimento busca minimizar el error experimental
Uso de bloques frecuentemente inadecuado
Para cualquier experimento un coeficiente de
variación mayor a 20% indica que está mal el estudio.
Un tamaño óptimo de parcela experimental para un
cultivo, válido para todo tipo de tratamientos y
condiciones de experimentación. Pseudorepetición
Uso dogmático (mágico) del 5% de significación
No hay crítica para los diseños y los análisis
La distribución normal existe en la naturaleza 22
Universidad Nacional de Colombia . sede Medellín
2. Las estaturas de los seres humanos tienen distribución
normal
Con elevada frecuencia biólogos, matemáticos,
agrónomos, etc. ; con menor frecuencia sicólogos,
sociólogos, etc., contestan Verdadero
La Normal es una propiedad
objetiva de la naturaleza,
P(Y  0)  0 existe por si sola. Sólo hay
que descubrirla.
¡Existe una estatura negativa! Se ignora el diseño, ¿a qué
población de humanos se
refiere? ¿todos los que
Niños existen? ¿a mujeres de 30 a
Mujeres
Hombres 50 años , clase media, que
viven en México, D.F.?
23
Basquetbolistas
X1 Y1
X2 Y2
X3 Y3
Xk Yp

P(Y / X )  P(Y / noX ) 24


Universidad Nacional de Colombia . sede Medellín
H ~ Hipótesis
D ~ Diseño
E ~ Esperado ( condicionado a H , D y SA)
SA ~ Supuestos Adicionales para el funcionamiento de H
25
con diseño D.
Universidad Nacional de Colombia . sede Medellín
* Teoría: H, D, SA E

* Práctica: D: ocurre O (Resultado Observado)

¿Concordancia (contrastación) E con O?

a).- Concuerdan E con O : se apoya H

b).- No concuerdan E con O : No se apoya H

¿Cómo se define
la concordancia?
Universidad Nacional de 26
Colombia . sede Medellín
3. En una investigación se tienen dos grupos de
personas, uno realizó ejercicio físico vigoroso EFV,
durante un año y el otro (testigo o control) no lo
hizo. Al término del año se midieron los ácidos
grasos en suero.
Los resultados son:
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1
Se efectúa una prueba de “t” y se tiene P <0.001.
Se concluye “el EFV disminuye los valores de
ácidos grasos 27

Universidad Nacional de Colombia . sede Medellín


Con elevada frecuencia biólogos, matemáticos,
agrónomos, etc. ; con menor frecuencia sicólogos,
sociólogos, etc., contestan en pregunta 3:
Verdadero

Universidad Nacional de 28
Colombia . sede Medellín
3. En una investigación se tienen dos grupos de personas, uno
realizó ejercicio físico vigoroso EFV, durante un año y el otro
(testigo o control) no lo hizo. Al término del año se midieron
los ácidos grasos en suero. Preguntas Básicas
¿ Cómo eran las personas en características
inherentes a ellas, tales como sexo, edad, tipo de
alimentación, raza, estado de salud, etc.?
¿Cómo se asignó el EFV? ¿Lo eligieron las
personas, fue con incentivos, fue al azar, etc.?
¿Cómo se define EFV y NoEFV?
¿En qué condiciones se realizó el EFV y el noEFV,
cambios climáticos, de salud, de organización,
sociales, alimenticios, etc.?
¿Cómo se midieron los ácidos grasos, fue igual29
para ambos grupos? Universidad Nacional de Colombia . sede Medellín
Grupo Media P <0.001
EFV 12.3
¿ qué
Control 18.6 papel
juega?

30
Explicaciones alternativas A, B,...Q. Niegan
H, y explican la cercanía de E con O de otro
modo. Son “de Nulidad”
H, D, SAH E
A, D, SAA E
Teoría: B, D, SAB E
.................
Q, D, SAQ E

Práctica: D ocurre O

a) Concuerdan O con E. Se apoyan por igual H, A, B, ... Q


b) No concuerdan O con E. No se apoyan H, A, B, ... Q. 31
Universidad Nacional de Colombia . sede Medellín
Explicaciones alternativas A, B,...Q. Niegan H, y explican
la cercanía de E con O de otro modo. Son “de Nulidad”

Grupo Edad Media


Explicación
EFV 20-25 años 12.3 alternativa: Las
diferencias en ac.
Control 47-62 años 18.6 grasos de deben
a la edad y no al
EFV
SA: Supuestos adicionales:
La edad y el EFV están edad Ac.
asociados. La edad produce
grasos
cambios en ác. Grasos.
La edad es un Factor de
Confusión en la relación
EFV
EFV Ac grasos 32
o no
Universidad Nacional de Colombia . sede Medellín
33
Universidad Nacional de Colombia . sede Medellín
Etapa de planeación: Cambiar el diseño D o
cambiar la hipótesis empírica H, de manera
que los SA de las explicaciones alternativas,
no operen, o sean improbables.

Etapa de análisis y discusión: Mostrar


debilidad teórica, poca plausibilidad o
imposibilidad de los SA de las explicaciones
alternativas.
Universidad Nacional de 34
Colombia . sede Medellín
“Control” de factores de confusión
1. Homogeneización.- Que los factores de confusión
no varíen en todos los elementos del estudio.
2. Formación de bloques o estratos homogéneos.-
Comparaciones dentro de los bloques y sus
promedios. No interacción.
3. Aleatorización.- Se asignan al azar a los
elementos de estudio las variantes del posible factor
causal o tratamientos. Tiende a homogenizar la
distribución de todas las variables presentes en los
elementos de estudio.
4. Análisis estadístico:- Se modela la influencia
conjunta de tratamientos y factores de confusión. Se
obtienen los “Efectos ajustados”
35
Universidad Nacional de Colombia . sede Medellín
3. En una investigación se tienen 200 hombres de 25-
50 años, se asignan al azar 100 de ellos para que
se sometan a ejercicio físico vigoroso (EFV),
durante un año y el resto (testigo o control) no lo
haga (noEFV).
Se vigila que las condiciones de vida sean
semejantes en ambos grupos durante el año.
Al término del año, de cada individuo se toma una
muestra de sangre y se congela de inmediato, para
que en todas después del mismo tiempo de frío y
con los mismos instrumentos se miden los ácidos
grasos en suero.
36
Universidad Nacional de Colombia . sede Medellín
3. En una investigación se tienen dos grupos de
personas, uno realizó ejercicio físico vigoroso EFV,
durante un año y el otro (testigo o control) no lo
hizo. Al término del año se midieron los ácidos
grasos en suero.
Los resultados son:
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1

Se efectúa una prueba de “t” y se tiene P <0.001.


Se concluye “el EFV disminuye los valores de
37
ácidos grasos Universidad Nacional de Colombia . sede Medellín
Con elevada frecuencia biólogos, matemáticos,
agrónomos, etc. ; con menor frecuencia sicólogos,
sociólogos, etc., contestan en 3 : Verdadero

Universidad Nacional de 38
Colombia . sede Medellín
Explicación alternativa A.-
Hipótesis de Nulidad Estadística
No es cierta H y ocurre O “cercano” a E por azar.
SAA: Hay variación natural en ác. grasos en los
humanos, aunque sean semejantes (la misma
población), pueden darse por azar promedios bajos en
los de EFV y altos en los de noEFV. Bajo A, ambos
39
grupos son muestras de la misma población de sujetos.
Se mide
Yi
Ac graso ..... .....
μEFV μnoEFV Se mide
Yi
(Riqueza conceptual: poblaciones, Ac graso
medias poblacionales, etc.)

Explicación alternativa A: μEFV  μnoEFV


Se espera que los promedios muestrales sean iguales, EA

YEFV  YnoEFV
Se efectúa el diseño, D y se obtiene O (observado):
YEFV  YnoEFV  Dif  (O  E A )  Dif (O  E )
40
Universidad Nacional de Colombia . sede Medellín
¿La discrepancia entre O y EA, Dif, es compatible
con la hipótesis alternativa del Azar , A?
¿La discrepancia entre YEFV y YnoEFV es factible o
probable por azar o es improbable.?
Fisher: 0.05 o 0,01
Universidad Nacional de 41
Colombia . sede Medellín
De las posibles Explicaciones alternativas A,
B,...Q. Niegan H, y esperan E de otro modo.
Son “de Nulidad”, si hay significancia estadística,
se considera que A: “El azar produce E” esta
eliminada, pero subsisten B,...Q

Universidad Nacional de 42
Colombia . sede Medellín
H, D, SAH E
A, D, SAA E Improbable
Teoría: B, D, SAB E
..........
Q, D, SAQ E

La significancia estadística sólo eliminó una


explicación alternativa, el azar. ¡Sólo esto!
Se puede decir que  EFV  noEFV , pero no a que se
debe la diferencia , ya que subsisten explicaciones
alternativas (B, …, Q) 43
En la búsqueda de apoyo a hipótesis de causalidad
probabilística, se buscan diseños y modelos que
representen bien la realidad, y que permitan valorar si
hay cambios en la distribución de la variable de
respuesta o efecto Y, al cambiar los valores de la
variable causal, condicionado a valores fijos de
variables que representan explicaciones alternativas.
f (Y / X , A, B....Q)  f (Y / X * , A, B....Q)
Donde X y X* son diferentes valores de la variable
“causal” y A,B,...Q son situaciones fijas de las
explicaciones alternativas. Son los “efectos corregidos” o
“efectos de X sobre Y ajustados por A, B, ...Q 44
Universidad Nacional de Colombia . sede Medellín
En estadística es común que se plantee un modelo para
explicar las características de generación de los datos.
El modelo puede representar la situación esperada de
una hipótesis de causalidad, o puede ser el modelo de
negación de una hipótesis.
Se evalúa la concordancia entre los datos observados, O
y los esperados E, si el modelo es cierto.
Usualmente esta discordancia se valora de acuerdo a la
probabilidad de una discordancia como la obtenida o
aún mayor suponiendo cierto el modelo.
Es el ”Valor de P”. Universidad Nacional de
Colombia . sede Medellín
45
M1. Modelo mayor, con más parámetros
M2.- Modelo menor, o modelo reducido, con menos
parámetros.
Se obtiene a partir de M1, al especificar el valor de
uno o más parámetros, o establecer relaciones entre
ellos.
Se obtiene una medida de la discrepancia entre E1 y
O, Disc (M1); también la discrepancia entre E2 y O,
Disc (M2). Universidad Nacional de 46
Colombia . sede Medellín
Disc (M2) es mayor que Disc (M1), pero ¿es mucho
mayor o no?
La diferencia entre el “ajuste” de ambos modelos, se
valora en términos de la probabilidad (P) de una
diferencia como esa o mayor si M2 es cierto.
Si P< 0.05 se adopta M1, si P>0.05 se considera M2
como bueno. (Principio de Parsimonia o “Navaja de
Ockam”)
Universidad Nacional de 47
Colombia . sede Medellín
La gran dificultad en la enseñanza es que se dan los
conceptos de probabilidad y de estadística desligados entre
si. Vg. después de 3 o 4 clases sobre probabilidades de
ciertos resultados en juegos de azar, o urnas, (espacios
equiprobables), se pasa a la prueba de hipótesis sobre una
media, a comparar dos medias, donde ahora se usa otro
concepto de probabilidad. !Con razón los alumnos sufren y
no entienden¡. Otro gravísimo problema es que no se toca
el hecho de que la estadística se usa como parte del
proceso de adquisición de conocimientos en muchas
disciplinas y como tal, deben contemplarse los diseños de
investigación de donde surgen los datos. Los datos nunca
son “datos puros”, están ligados a un propósito y a un
diseño. Debe contemplarse la estadística como parte de la
48
metodología de investigación
1. Enfatizar que la estadística aplicada se convierte en
parte de la metodología de investigación.
2. Minimizar temas de Estadística descriptiva. Si es
importante, pero se debe ligar a la caracterización
de una población. El concepto de población(es) en
estudio es fundamental .
3. Presentar los conceptos de probabilidad clásica y
subjetiva, pero con mas énfasis el de probabilidad
frecuentista. Regularidad Estadística como
estabilización de frecuencias relativas al incrementar
el tamaño de la muestra. Limite de frecuencias
relativas. Ley de los grandes números. Modelos de
distribución de eventos en las poblaciones. 49
Universidad Nacional de Colombia . sede Medellín
4.-“Distribuciones derivadas del muestreo” .
Distribuciones para “estadísticos”, estimadores y
estadísticas de prueba. Teorema Central del
Limite. Regularidad Estadística de segundo nivel.
Error estándar
5.- Intervalos de confianza y pruebas de hipótesis.
6.-Liga de los conceptos con investigaciones reales.
7.-Debe quedar muy claro que la inferencia es para
conocer algo de la regularidad estadística de una
medición en una o más poblaciones. Esto se
inserta en las hipótesis de la investigación

Universidad Nacional de 50
Colombia . sede Medellín

También podría gustarte