Documentos de Académico
Documentos de Profesional
Documentos de Cultura
01 La Ciencia y La Investigacion
01 La Ciencia y La Investigacion
La ciencia y la investigación
Estudio de Hipótesis
Estimación de parámetros
Control de calidad
20
Estimación de parámetros
En el caso de que el estudio de un problema se haga a partir de
datos obtenidos de muestras aleatorias estadísticamente
correctas o que puedan considerarse como tales, puede
evaluarse el margen de error estadístico a los resultados
obtenidos.
Por ejemplo si se obtiene una muestra aleatoria de individuos y el
30% tiene una determinada característica, el objetivo del estudio
es conocer, a partir de la muestra, el % en el total de la población.
La estadística inferencial o analítica permite estimar el valor
poblacional con un margen de error determinado por el
investigador.
24
2.000.000
1914
1.500.000
1909
1.000.000 1904
1895
500.000
1887
1869
1855
0
1850 1860 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 2010
1887
1895
50% 1914
1869
1909
1904
40%
1936
1855
30% 1947
1960
20%
1970 1980 2010
1991
10%
2001
0%
1850 1870 1890 1910 1930 1950 1970 1990 2010
Zonas Comunas
N
13
12
14
15 2
11
1
6 5 3
10
7
4
9
Zona A (norte) 8
Zona B (este) N
Zona C (sur)
Zona D (oeste)
Zona E (centro)
56
Las tablas anteriores describen (resumen) los valores tomados por un
indicador muy utilizado en la Estadística sociodemográfica (IPCF:
ingreso total del hogar/N° de individuos del hogar). Como es una
variable que toma valores cuantitativos se puede resumir en medidas
de tendencia central (promedio, mediana y moda), en medidas de
dispersión (desvío estándar) y medidas de posición (Percentil 25,
percentil 50 o mediana y percentil 75).
Además está descripto por Zonas geográficas de la Ciudad Autónoma
de Bs As (variable cualitativa), permitiendo comparar sus variaciones.
Por ultimo muestra dos momentos en el tiempo (EAH del año 2009 y
EAH del año 2016).
Todos esto en forma descriptiva sin ninguna significancia estadística,
que evaluaría si hay diferencias entre Zonas o Años.
Distribución porcentual de la población en viviendas ubicadas en
inquilinatos, hoteles familiares y villas por Zona. Ciudad de
Buenos Aires. Año 2013.
44,4%
N
3,1% 29,3%
18,1%
3,1% 5,1%
29,3%
Zona Norte Zona Este Zona Sur Zona OesteZona Centro
5,1% 18,1% El 85,3% de la población que
habita en este tipo de viviendas
Zona A (norte)
se ubican en las siguientes 5
44,4% Zona B (este) Comunas:
Zona C (sur) 1, 3, 4, 7 y 8
Zona D (oeste)
Zona E (centro)
Fuente: Dirección General de Estadística y Censos (Ministerio de Hacienda GCBA). EAH 2013.
Distribución porcentual de personas bajo la línea de pobreza
según comuna
FUENTE: Dirección General de Estadística y Censos (G.C.B.A.) 2011 – INDEC: Encuesta Permanente de hogares 2011.
Distribución porcentual de la población mayor de 10 años y
analfabeta por Comuna
Ciudad Autónoma de Buenos Aires. Año 2010.
13
12 0,00 – 0,35%
14
0,36 – 0,50%
15 2
0,51 – 0,70%
11
1 0,71 – 1,12%
6 5 3
10
7
4
9
8
N
Zona A (norte)
Zona B (este)
Zona C (sur) Total A (norte) B (este) C (sur) D (oeste) E (centro)
Zona D (oeste)
Zona E (centro)
Fuente: Dirección General de Estadística y Censos (Ministerio de Hacienda GCBA). EAH 2013.
Tasa neta de escolarización de la población de 13 a 18 años.
Nivel de enseñanza Secundaria, según zona.
Ciudad de Buenos Aires. Año 2013
99,0 97,3 96,8
96,3 95,2
13 92,3
12
14
15 2
11
1
6 5 3
10
7
4
9
Zona A (norte)
Zona B (este)
Zona C (sur) Total A (norte) B (este) C (sur) D (oeste) E (centro)
Zona D (oeste)
Zona E (centro)
Fuente: Dirección General de Estadística y Censos (Ministerio de Hacienda GCBA). EAH 2013.
62
63
Tasa de Mortalidad Infantil componentes por ‰ nacidos vivos
Residentes en CABA 1990 – 2016
Infantil Neonatal Postneonatal
18,0
16,0 16,0
14,0
12,0
10,8
Tasa ‰
10,0
8,0
7,2
6,0
5,2 5,4
4,0
2,0 1,8
0,0
1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 2016
Difference (ARM1 - ARM2) and 95%CI 64
Este gráfico muestra uno de los estudio con mayor evidencia científica (Estudio de Meta
análisis, que compara varios trabajos científicos y sus resultados). Se observa además
las chances (OR) de cuales estuvieron a favor del tratamiento o del placebo, con su
intervalo de confianza al 95%.
66
NEA 28,3%
Centro 26,1%
NOA 24,4%
Cuyo 22,7%
Patagonia 22,4%
Conurbano 22,3%
CABA 17,6%
FUENTE: Sistema de Información Perinatal – Dirección Nacional de Maternidad e Infancia. Ministerio de Salud de la Nación. 2011
67
Distribución porcentual de los hogares que sólo cuenta con Sistema
Público de Salud según Nivel Educativo alcanzado por el jefe de hogar.
30%
24,8% 24,5%
25%
20%
16,9% 16,5%
15%
9,8%
10%
5% 3,4%
0%
Primario Primario Completo Secundario Secundario Superior / Superior /
Incompleto Incompleto Completo Universitario Universitario
Incompleto Completo
12,4%
8,4%
4,7%
3,8%
3,4%
1,9%
Total CABA Zona A (norte) Zona B (este) Zona C (sur) Zona D (oeste) Zona E (centro)
Gráfico de sobrevida para una cohorte de pacientes con seguimiento en el tiempo, que
describe y compara la sobrevida en cada momento temporal para los dos grupos.
Principales causas de defunción en dos periodos
Grupo de Causas:
Enfermedades transmisibles, maternas, neonatales y nutricionales
Enfermedades no transmisibles
Lesiones
Apoyándose en el cálculo de
probabilidades y a partir de datos de
muestras de poblaciones, efectúa
estimaciones, decisiones,
predicciones u otras generalizaciones
sobre un conjunto mayor de datos,
con cierto grado de certeza o nivel de
confianza.
76
9,0%
8,0%
Porcentaje - IC 95%
7,0%
6,0%
5,0%
4,0%
70
60
50
40
30
20
1855 1868-70 1887 1894-96 1903-05 1908-10 1913-15 1935-37 1947 1959-61 1969-71 1980-81 1990-92 2000-01
Fuente: Dirección General de Estadística y Censos (Ministerio de Hacienda GCBA) e INDEC. Serie Análisis
Demográfico N° 10 y 31.
Etapas de un estudio
estadístico
forma paralela.
82
1. Planteamiento del problema.
LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar,
debemos evaluar hasta dónde se pretende llegar;
debemos fijar cuales son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya
lugar a confusiones o ambigüedades y debe, además,
establecerse diferenciación entre lo de corto, mediano
y largo plazo, así como entre los objetivos generales
y los objetivos específicos.
Marco Teórico
Exposición sistemática de las definiciones conceptuales,
relaciones y proposiciones implicadas en problema (hipótesis –
objetivos).
Configuración particular de las ideas del Investigador.
Debe relacionarse con el Estado del Arte (se explicitan
conocimientos, definiciones, clasificaciones, planteos de estudios
anteriores y se extraen correspondencias, contradicciones,
omisiones etc. Fundamentadas y bien citadas)
Exige Coherencia local y total.
Opera con:
- Lenguaje específico y formal
- Sistemas Conceptuales Complejos (Modelos)
86
LA RECOLECCION
La recolección de la información, la cual ha de partir, a menos que se
tenga experiencia con muestras análogas, de una o varias muestras
piloto en las cuales se pondrán a prueba los diferentes métodos de
recolección (encuestas, mediciones de características etc.) y se obtendrá
una aproximación de la variabilidad de la población, con el fin de
calcular el tamaño exacto de la muestra que conduzca a una estimación
de los parámetros con la precisión establecida.
El establecimiento de las fuentes de información, así como la cantidad y
complejidad de la toma de los datos (según los objetivos de la
investigación), son decisiones que se han de tomar teniendo en cuenta la
disponibilidad de los recursos financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona geográfica, el grado de desarrollo,
la ausencia de técnica, etc.
91
DEPURACION, PROCESAMIENTO DE LOS DATOS
Después de haber reunido toda la información pertinente, se necesita la
depuración de los datos recogidos. Para hacer la crítica de una
información, es fundamental el conocimiento de la población por parte de
quien depura para poder detectar falsedades o incongruencias en los
datos.
Separado el material de "desecho" con la información depurada se
procede a establecer el procesamiento estadístico a realizar (análisis
estadísticos que se quieren realizar como frecuencias, gráficos, cruces
necesarios entre las variables).
Se ordenan las respuestas y se preparan los modelos de tabulación de
las diferentes variables que intervienen en la investigación.
El avance tecnológico y la popularización de la informática hacen que
estas tareas, manualmente dispendiosas, puedan ser realizadas en corto
tiempo.
92
CONCLUSIONES Y PUBLICACION
A partir del análisis de los resultados se redactan las
conclusiones, directamente relacionadas a los
objetivos e hipótesis planteadas. Además toda
conclusión es importante de ser comunicada a través
de publicaciones, en congresos o en
comunicaciones.
Si los autores lo consideran, lo ideal es publicarlo en
una revista indexada, dado que va a tener que ser
evaluada para ser aceptada y en caso de ser
publicada, el acceso a la misma estará al alcance de
otros grupos de investigación, a quienes se les
puede aportar información, conocimientos y otros
puntos de vista.
95
UTILIDADES DE LA ESTADISTICA
Es una herramienta político/administrativa
importante ya que al disponer de información
numérica fidedigna se puede controlar, evaluar,
organizar y optimizar los recursos.
Ejemplo Epidemiológico
Interesa saber por ejemplo: cuantas personas
enferman, cuales son las causas y en que
circunstancias ocurrieron, edad, si es más
frecuentes en hombres o en mujeres, si está
circunscripto a distintas áreas geográficas, si hay
variaciones estacionales, que grupos son los mas
expuestos, si está relacionada con las condiciones
sanitarias.
96
Algunos
Conceptos
99
Magnitud Muestra
Variable:
Entendemos por variable cualquier característica o cualidad de
la realidad que es susceptible de asumir diferentes valores, es
decir, que puede variar, aunque para un objeto determinado
que se considere puede tener un valor fijo.
Una variable es una propiedad, característica o atributo que
puede darse en ciertos sujetos o pueden darse en grados o
modalidades diferentes. . . son conceptos clasificatorios que
permiten ubicar a los individuos en categorías o clases y son
susceptibles de identificación y medición.
103
Variable Aleatoria
Una variable aleatoria o variable estocástica es una variable
estadística cuyos valores se obtienen de mediciones en un
experimento aleatorio. Los ejemplos de variables vistos son
variables estadísticas. Son las características o cualidades
seleccionadas de una población para medir en un determinado
experimento aleatorio.
Los valores o categorías posibles de una variable aleatoria
pueden representar los posibles resultados de un experimento
aún no realizado, o los posibles valores de una cantidad cuyo
valor actualmente existente es.
Una distribución de probabilidad se usa para describir la
probabilidad de que se den los diferentes valores.
106
Como ejemplo, defino un experimento aleatorio como medir el
peso del recién nacido.
La variable estadística elegida es “Peso del recién nacido”.
Como el experimento es aleatorio (selecciono a las unidades de
análisis al azar), la variable es aleatoria y como la elegí como
propiedad para evaluar en mi experimento, es una variable
estadística, que como veremos después se podrá clasificar
según en nivel de medición a partir de la forma en que evalúo a
esta variable (operacionalización de la medición). Podría
medirla en gramos, entonces la variable estadística es
cuantitativa con valores reales continuos (toma cualquier valor
entre limites máximos y mínimos).
Luego de terminado el experimento podría describir la
distribución de probabilidades de los pesos de los recién
nacidos.
107
Diseño experimental:
Es una técnica estadística que permite identificar y
cuantificar las causas de un efecto dentro de un estudio
experimental. En un diseño experimental se manipulan
deliberadamente una o más variables, vinculadas a las
causas, para medir el efecto que tienen en otra variable de
interés.
El diseño experimental describe una serie de pautas
relativas qué variables hay manipular, de qué manera,
cuántas veces hay que repetir el experimento y en qué
orden para poder establecer con un grado de confianza
predefinido la necesidad de una presunta relación de causa-
efecto.
113
Ejercicios
Ejercicios resueltos
119
Exhaustivas Excluyentes
Si los valores o las categorías de Si una unidad de análisis pueda
las variables abarcan todos los ubicarse en una y sólo en una de
casos que puedan presentarse, de las categorías. No debe darse la
modo que ninguna unidad de posibilidad de inclusión de una
análisis sea dejada de lado por no respuesta en dos categorías
poder ubicarse en alguna distintas.
alternativa.
Estadígrafos
125
Después de haber ordenado y descripto un conjunto de
datos, aún el análisis resulta todavía un tanto incompleto; es
necesario entonces resumir la información y facilitar así su
análisis e interpretación utilizando ciertos indicadores.
A estos indicadores se les denomina también estadígrafos o
medidas de resumen, permiten hallar un valor numérico, el
mismo que representa a toda la población o muestra en
estudio.
Valores que cuantifican características de un grupo de
datos, tales como la dispersión de los mismos, la tendencia
a concentrarse alrededor de un cierto valor, etc
Estos índices muestran las características más salientes del
conjunto de datos con un solo número, a los que
tradicionalmente se los llama “parámetros” (población) o
“estadísticos” (muestra).
126
Estadígrafos
de Tendencia Central
de Posición
de Dispersión
De Formas
Específicas
130
131
Habitualmente se agrupan los parámetros en las siguientes
categorías:
Las medidas de tendencia central: medias, moda y mediana.
Medidas de posición: Se trata de valores de la variable estadística que
se caracterizan por la posición que ocupan dentro del rango de valores
posibles de esta. Cuantiles (cuartiles, deciles y percentiles).
Medidas de dispersión: Resumen la heterogeneidad de los datos, lo
separados que estos están entre sí. Hay dos tipos, básicamente:
Medidas de dispersión absolutas, que vienen dadas en las mismas unidades
en las que se mide la variable: recorridos, desviaciones medias, varianza,
desviación típica.
Medidas de dispersión relativa, que informan de la dispersión en términos
relativos, como un porcentaje. Se incluyen entre estas el coeficiente de
variación, el coeficiente de apertura, los recorridos relativos y el índice de
desviación respecto de la mediana.
132
133