Resumen General Estadística

1- La Estadística se divide en dos ramas principales:
Básica e Inferencial
La Estadística Básica se ocupa de presentar los distintos tipos de instrumentos para

resumir los datos. Se divide en dos sub-ramas: una dedicada al tratamiento estadístico de
las variables métricas (Estadística de Atributos) y otra dedicada a las variables métricas
(Estadística Descriptiva). En la primera sólo se permite emplear el nombre o el orden de
los números, mientras que la segunda hace uso pleno de todas las operaciones. Estos
resúmenes pueden involucrar a una sola variable o varias variables en cada análisis, por
lo que debemos distinguir entre Estadística Univariada y Estadística Multivariada. La
Estadística Inferencial comienza exponiendo la Teoría de la Probabilidad como
fundamento de la selección y de la prueba de hipótesis, e incluye la Inferencia
Estadística, el Muesteo, la Econometría, la Epidemiología y la Psicometría entre otras
subdisciplinas aplicadas.
2- La Estadística Básica no problematiza la construcción del dato y lo asume como

“dado”. ¿Podría indicar qué se indica con esta afirmación?.
La Estadística Básica no se ocupa de la verificación del dato, es decir de investigar

cómo fue obtenido sino que lo toma como punto de partida y a partir de ahí, realiza los
cálculos o lo que corresponda a la disciplina. Es decir, toma los datos como
a-problemáticos. Supone que no existe el error o que si existe es “ignorable”.
3- La Estadística Inferencial se caracteriza por:
Trabajar con una muestra tomada al azar.
Asociada a la Teoría de la Probabilidad que es el fundamento para seleccionar una

muestra y realizar inferencias. Supone que los datos conforman una muestra
probabilística de una población que para todos los efectos no se conoce pero que se
quiere conocer estimando los valores que podrían tener ciertos indicadores computados
en la muestra.
4- En la siguiente lista de tareas, indique cuáles se corresponden (SÍ) y cuáles (NO) con
aquellas que hace la Estadística Básica:
Generar gráficos para variables métricas y no métricas. Resumir la información a través

de tablas de contingencia. Generar nuevas variables partiendo de la información
existente en la matriz de datos. Elaborar tipologías de las observaciones combinando
información de dos o más variables. Resumir la información de una o más variables
usando tablas, estadísticos y gráficos.
Estimar cómo se distribuye la población, una variable que fue observada en la muestra
(NO). Calcular frecuencias esperadas para una tabla de contingencia (NO). Computar el
error estándar y los intervalos de confianza respectivos a los coeficientes de asociación
(NO). Calcular el error de los estadísticos estimados (NO). Tareas que realiza la
Estadística Inferencial: Calcular la cantidad de observaciones que debieran hacerse dado
el problema. Seleccionar las observaciones (por ejemplo mediante un procedimiento
aleatorio). Calcular el error de las observaciones. Elaborar modelos explicativos.
Simular escenarios futuros (o pasados, contra-fácticos) a partir de los datos registrados.
5- El error tiene un lugar importante en la Estadística desde finales del siglo XIX y ha
especializado la enseñanza de la misma en dos ramas. ¿Qué tipos de error trabaja la
Estadística?.
El corazón de la Estadística es la cuantificación del error que se comete al realizar

inferencias. El error proviene de (al menos) tres fuentes: la selección de las
observaciones, el registro de las variables en los casos seleccionados y la selección de
variables para representar a los conceptos. La Estadística formaliza a partir del siglo
XIX que toda observación está sometida a errores: de muestreo, en la selección de
unidades y de medición, en la aplicación de los instrumentos. La estimación debe
calcular cuál es la “probabilidad del error”. Las distintas tareas que desempeñe no
disminuyen el error (de medición, de inferencia) sino que lo hacen explícito, conocido,
para realizar los contrastes.
6- En la siguiente lista, indique cuáles SI y cuáles NO son tareas de la Estadística en un

proceso de investigación:
Seleccionar los casos a observarse (por ejemplo mediante un procedimiento aleatorio).

Calcular el error que se puede cometer al usar muestras para estimar valores en las
poblaciones. Formular las hipótesis conforme al marco teórico y a los antecedentes
(NO). Analizar si existe una explicación causal en la relación entre variables (NO).
La Estadística es convocada en una investigación cuando esté definido un problema y se

tiene decidida una estrategia coherente con aquél. Sus tareas incluirán entre otras, la
selección aleatoria de casos (“muestra estadística”), ciertos controles en el trabajo de
campo (“monitoreo”) y la realización de resúmenes y pruebas estadísticas en la etapa de
análisis. Se puede identificar cuatro grandes tipos de tareas en que la Estadística podría
tener
participación: contribuye a la formalización de hipótesis empíricas; aporta reglas y
procedimientos de selección de casos; aporta instrumentos para resumir la información
producida; y permite realizar estimaciones o prueba de hipótesis.
7- ¿Cuál de las siguientes oraciones define mejor la Estadística Básica?
Computar estadísticos uni, bi y multivariados que demuestren la objetividad de la

realidad.
8- Indique para cada una de las siguientes afirmaciones sobre la ECH si son correctas e
incorrectas:
Una Encuesta de Hogares que se comenzó a realizar a partir de 1981. A partir del año
2006 su muestra representa todas las zonas del país, tanto urbanas como rurales. Una
Encuesta de Hogares que se hace cada dos años (NO). Es un programa reiterado año a
año. Aplica el módulo de actividad laboral a los mayores de 18 años (NO). Activo
persona de 14 o más años que tiene una ocupación en la que vierte su esfuerzo
productivo a la sociedad o que sin tenerlo lo busca activamente en el período de
referencia considerado por la encuesta. Está a cargo del Ministerio de Desarrollo Social
(NO). Está a cargo del INE. Define un hogar como un conjunto de personas vinculadas
entre sí por lazos familiares (NO). Se define a un hogar particular que es una persona o
grupo de personas que habitan bajo un mismo techo y al menos para su alimentación
dependen de un fondo común. Suelen efectuar la unificación de sus ingresos mediante la
construcción de un presupuesto común y establecen el uso compartido de bienes
durables y no durables. Este grupo suele estar conformado por personas vinculadas entre
sí por lazos familiares aunque no necesariamente tienen que ser parientes para cumplir
con la definición de hogar. También puede estar conformado por una sola persona. Cada
año, el INE hace pública una base de datos de personas y una de municipios a partir de
la ECH (NO). La página web del INE tiene dos bases de datos o microdatos (matrices)
para cada año: una corresponde a los módulos del cuestionario que indagan sobre
aspectos de cada individuo integrante del hogar (“base de personas”) y la otra base
refiere a los atributos del hogar y de la vivienda que ocupa (“base de hogares”).
9- Desde el punto de vista de la clasificación en tipos, Cortés, Rubalcaba y Fernández

(2014) sostienen que las variables dicotómicas son:
Una clase especial que pueden interpretarse tanto como métricas como no métricas.
Las variables no métricas son aquellas que para su medición requieren ser codificadas
para expresarlas en números (u otro lenguaje estándar). Dentro de las variables no
métricas podemos distinguir dos clases:
Nominales. La operación empírica que se debe realizar para satisfacer la exigencia
lógica (clasificar) tiene que permitir, dadas dos unidades, si son iguales o diferentes con
relación al indicador en cuestión. Para llevar a cabo la operación de clasificación, la
única propiedad de los números reales que necesitamos emplear es la que permite
diferenciarlos, para ello basta con utilizar sus nombres (numerales). A las unidades que
en virtud del indicador puedan considerarse iguales se les asigna el mismo número y a
unidades registro que se consideren distintas se les adjudican números diferentes. Por
ejemplo sexo, estado civil, deparamento de residencia, etc. Ordinales. La comparación
de orden implica que se pueda establecer una jerarquización entre dos o más unidades en
función de la propiedad observable que se mide. Para satisfacer la exigencia lógica que
subyace a la escala ordinal no basta con poder decir que dos unidades son iguales o
diferentes respecto a un indicador; en el caso que sean diferentes tenemos que precisar
cuál es mayor (o menor). Se utilizan dos propiedades de los números reales: el nombre y
la posición en la recta. La asignación de números a categorías no es arbitraria, debe
existir isomorfía entre ambos conceptos. Por ejemplo nivel educativo (Inicial, Primaria,
Ciclo Básico, Media Superior). Las variables métricas son aquellas que en la condición
se han expresado la propiedad que representan con un número. La exigencia lógica pide
medir la distancia que separa los valores que asumen los indicadores en las unidades de
registro; vale decir, no sólo ordenarlos sino usar la información sobre el tamaño de esa
distancia. La medición realizada a nivel métrico no solamente nos dice si dos unidades
de registro son iguales o diferents en relación a un indicador y cuál es mayor, sino
también cuanto es mayor. La exigencia lógica de cuantificación métrica origina dos
escalas: de intervalo y de razón. La escala interval no tiene cero absoluto, esto es, no
tiene un origen sino que éste se define de manera convencional.
10- Las variables ordinales no hacen uso de la propiedad de los números relativa a:
El ángulo
11- La transformación de la matriz de datos por el lado de las columnas se caracteriza
por:
Aumenta el número de columnas
Una matriz de datos es un arreglo rectangular que despliega a las unidades en las filas y
a las variables en las columnas. Las celdas formadas por la intersección de las filas
(también llamadas renglones) y las columnas contienen los valores específicos que
asumen las variables en cada observación (dato). Se pueden realizar dos grandes tipos de
transformaciones por el lado de las columnas: la recodificación que en algunos casos
implica una transformación a una escala de medida menor a la que originalmente se
registró la información y generación que es el resultado de aplicar una función que
modifica los datos originales contenidos en la matriz, aunque no necesariamente supone
un cambio en la escala de medida. Ambos implican crean nuevas columnas en la matriz
de datos, sin modificar las (cantidades de) unidades.
12- La tabla de frecuencia es un instrumento de análisis estadístico que permite:
Resumir la información de una variable
13- Indique para cada una de las siguientes afirmaciones si son correctas o incorrectas:
Una tabla de frecuencias se utiliza para resumir información sobre la distribución de una
variable. La celda de una matriz de datos informa del valor que asume una variable en
una unidad. La tabla de contingencia muestra la distribución de una variable para todos
los casos de la matriz. En una tabla de contingencia, el total del marginal columna es
igual al total del marginal fila. El marginal columna de la tabla de contingencia informa
la distribución univariada de la variable que está colocada en los renglones
(INCORRECTO). Cada celda de una tabla de contingencia bivariada informa la
distribución conjunta de las dos variables. En una tabla de contingencia sólo puedo
conocer la distribución conjunta de dos variables (INCORRECTO). En una matriz de
datos puedo resumir la información de la distribución de todas las variables que contiene
(INCORRECTO).
14- ¿Qué significa X2 (ji-cuadrada) sea igual a 0?.
Las variables son estadísticamente independientes.

15- La X2 (ji-cuadrada) tiene algunas limitaciones cuando se desea conocer la
asociación entre variables nominales con varias categorías.
Su valor depende del número de casos. Cuanto mayor es N, mayor es Ji-cuadrada.

Valores grandes de Ji-cuadrada no pueden ser interpretados directamente como:
existencia de asociación, fuerza de asociación.
Valores de Ji-cuadrada calculados en distintas tablas no pueden ser comparados. A

menos que los totales, N, sean iguales en ambas tablas.
16- ¿Qué valor debería tomar el estadístico X2 (ji-cuadrada) para que sin dudas
debieramos concluir que no existe asociación alguna entre dos variables?.
a) escriba el valor esperado: 0.
b) ¿Por qué es que da ese resultado?. Fundamente su respuesta incorporando los

elementos contenidos en la fórmula del estadístico. Asume el valor 0 porque hay
independencia estadística. Será como mínimo igual a 0 si coinciden las frecuencias
observadas y las frecuencias esperadas y su valor aumentará en tanto más grandes sean
las diferencias entre ellas. Si las variables no están asociadas entonces la doble suma
será igual a 0 y que se alejará de 0 que más se distancian las frecuencias observadas de
las esperadas.
17- La asociación se define por oposición a la independencia estadística. Escriba la

expresión formal (matemática) que representa esta idea de dependencia:
P (A) = P (A/B)
P (A) ≠ P (A/B) Entonces tendríamos que enunciar que no hay independencia, o más
claramente, que las variables están asociadas. El análisis de asociación es la rama de la
Estadística que se dedica al estudio de la existencia y fuerza con que se vinculan las
variables no métricas (nominales y ordinales). El análisis de la existencia de una
asociación entre variables es el objetivo mínimo común para cualquier estudio. Puede
aplicarse a cualquier tipo de variable. La conclusión de que existe asociación supone
lógicamente rechazar la idea de que las variables son independientes. El análisis de la
fuerza de la relación implica calcular la magnitud con que la presencia de un atributo de
una variable está asociada a la presencia de un atributo de la otra variable. Establecer el
sentido de una relación es la traducción empírica de una hipótesis del tipo “a más de A,
más de B” (sentido o signo positivo) y “a menos de A, menos de B” ( (sentido o signo
negativo), si las relaciones son inversas. Sólo para las variables métricas es posible
establecer la forma de la
relación. Cuando en la gráfica se puede identificar una línea recta que guarda
equidistancia entre todos los puntos, entonces es razonable también que una función de
primer grado represente la relación (forma lineal), cuando la gráfica que representa la
relación tiene forma acampanada o de “U”, o de “U” invertida, entonces la relación tiene
forma cuadrática y una función de grado la representará en forma más apropiada.
Existe asociación cuando se puede descartar que las variables sean estadísticamente
independientes. En consecuencia mientras más alejadas de cero se encuentren los
valores de estos estadísticos podemos afirmar con mayor confianza que las variables no
son independientes.
18- El coeficiente de Q2 ha sido propuesto para analizar:
Determinar si la X2 (ji-cuadrada) indica independencia.
Corrige el hecho que el valor ji-cuadrada aumenta en la misma proporción que crece el
número total de observaciones, sin que haya habido cambios en la asociación entre las
dos variables.
19- En el caso de un coeficiente de asociacióon que pueda alcanzar como límite superior
el valor de la unidad (por ejemplo V=1), ¿cómo se interpreta este resultado?.
Asociación perfecta entre las variables.
Es un coeficiente que tiene un recorrido determinado, de 0 a 1 y que por tanto permite

identificar con claridad la magnitud de la asociación entre las variables en juego. Donde
0 significa que hay independencia estadística (al igual que sucedía con el ji-cuadrado y
con el fi-cuadrado) y el 1 es asociación perfecta entre las dos variables. Interpretación de
los coeficientes con recorrido [0, 1]:
Valor del coeficiente Interpretación de la magnitud de la

asociación
Menor a 0,10 Despreciables

Entre 0,10 y 0,29 Baja
Entre 0,30 y 0,49 Moderada
Entre 0,50 y 0,69 Sustancial
Desde 0,70 y más Muy fuerte
La medida de asociación , riesgo relativo o RR, surge de la comparación de los riesgos

calculados dentro de distintas categorías de la variable independiente. La proporción de
que cierta situación suceda en un grupo con determinadoa atributo de la variable
independiente, se denomina genéricamente riesgo. Toma valores de 0 a más infinito.
Valor del RR Interpretación
RR= 1 No hay asociación entre los variables
RR > 1 Hay asociación positiva (cuando se da la

causa (A) se da el efecto (B))
RR < 1 Hay asociación negativa (cuando se da la

causa (A), no se da el efecto (B')
El concepto de momios corresponde a la razón entre la probabilidad de que un evento
ocurra y la probabilidad de que no ocurra. Mientras que usamos la razón de momios
como instrumento para analizar asociación, esta razón establece una comparación entre
momios calculados para distintas categorías de la variable independiente. Relaciona las
chances para cada grupo de la variable independiente de que ocurra un evento frente a
que no ocurra. Las frecuencias esperadas se contraponen a las frecuencias observadas y
con base a esta comparación se procede a realizar el análisis de asociación. Si hay
independencia estadística entonces la frecuencia conjunta es igual al producto de las
marginales del renglón y columna correspondientes a esa casilla, dividido entre el total
de casos. Si dos variables dicotómicas fuesen independientes entonces deberíamos
esperar que la frecuencia en la casilla (1,1), es decir, la celda formada por la intersección
de la primera línea y primera columna, fuese igual al produto de sus correspondientes
frecuencias marginales, dividido entre el númemro de observaciones de la tabla.
Denominemos frecuencia esperada a la que surge de este cálculo, subentendiéndose que
sería la frecuencia esperada que esperaríamos si las variables fuesen independientes.
Podríamos también definir la asociación como lejanía respecto a la independencia
estadística. La frecuencia esperada nos dice cuántos casos deberíamos observar en la
casilla (1,1) si las variables fuesen estadísticamente independientes. Por otra parte,
tenemos la frecuencia que realmente observamos en esa casilla. Con estos elementos se
define la discrepancia observado a esperado, D11, sea la diferencia entre ambos
valores en la primera casilla de la tabla, formada por el primer renglón y la primera
columna. D11 será mayor en la medida que sea mayor la diferencia entre la frecuencia
observada y esperada, es decir, mientras más se alejen o discrepen las frecuencias
observadas de las esperadas. D11 será igual a 0 si las dos frecuencias coinciden, en cuyo
caso las variables serían estadísticamente independientes. En la medida que difiera de
cero, las frecuencias observadas se alejan de las frecuencias que esperaríamos si las
variables fuesen independientes y, en consecuencia (como no son independientes) se
dice, que están asociadas relacionadas.
20- En términos clásicos, la explicación causal debe satisfacer cuatro requisitos. ¿Podría
usted indicar al menos cuatro presentes en la bibliografía de este curso?.
Establecer la asociación, a través de un estadístico o de un conjunto de estadísticos que
informen sobre la existencia de la relación, y si corresponde, también la magnitud,
sentido y forma. Establecer que una variable postulada como causa antecede
temporalmente a la otra, postulada como efecto. Controlar la incidencia que pudieran
tener otras variables en la relación analizada. Proponer un vínculo conceptual, un
mecanismo, entre la causa y el efecto tal que permita entender cómo la primera
“produce” el segundo.
21- Desde la obra de David Hume en el siglo XVIII, es aceptado el requisito de la

precedencia temporal para elaborar una explicación causal.
La variable postulada como causa haya ocurrido antes de que el efecto haya ocurrido. Si
este requisito se cumple, la variable establecida como antecedente en la hipótesis será
denominada como variable independiente o explicativa, en tanto, que la variable
establecida como efecto será trabajada como variable dependiente o explicada.
El análisis de correlación por su parte, se ocupa de las relaciones entre variables

métricas. Se denomina covariación o correlación al análisis de las relaciones entre dos
variables métricas y entre una variable métrica y una dicotómica. El análisis de
correlación es la forma que tendremos de establecer la existencia de asociación entre dos
variables métricas.
22- ¿Cuáles de los siguientes procedimientos son correctos o incorrectos para investigar
si existe asociación entre ambas variables?.
Drc X2
n11/n1=n12/n2=n1/1 Q/
x2 (INCORRECTO)
23- La marca de clase se define como:

La semi suma de los límites inferior y superior de cada intervalo.
24- La recodificación en “intervalos de clase” de una variable métrica para representar
su distribución de frecuencias es apropiado cuando:
El recorrido de la variable es muy amplio.
25- Una matriz de correlaciones de Pearson permite: Agrupar el estadístico de cada

relación bi-variada en una sola representación para que sea más sencillo compararlas.
En la matriz de correlaciones, las variables están tanto en las filas como en las columnas.
Las celdas de la matriz de correlaciones no contienen datos, sino valores de un
estadístico particular, el coeficiente de correlación de Pearson. En la diagonal mayor o
principal de la tabla, se encuentran una serie de “1”, ya que se trata de la correlación de
cada variable consigo misma. Obsérvese en particular que se han suprimido los valores
que están sobre la diagonal. La razón de esto es que la información que aportarían estos
valores es redundante ya que por la propiedad de simetría el orden de las variables no
altera el valor del coeficiente de correlación. La matriz permite hacer una lectura de los
coeficientes que una variable independiente tiene con otras variables.
26- En la siguiente lista de propiedades sobre la correlación de Pearson, indique cuáles

son correctas y cuáles son incorrectas:
Un valor de -1 indica que las variables no tienen relación lineal. Un valor de =1 indica
relación lineal positiva y perfecta. Normaliza la covarianza con el producto de los
desvíos estándares de las variables x1 y x2. La covarianza nos indica el sentido de la
asociación (INCORRECTA) porque indica la existencia de asociación entre dos
variables métricas. El coeficiente de correlación R de Pearson cumple con los tres
primeros objetivos del análisis de asociación (existencia, magnitud, sentido) y supone el
cuarto objetivo (la forma). Cuando la covarianza es igual a 1 las dos variables tienen una
asociación perfecta (INCORRECTO). Si obtenemos un valor sumamente alto no
informa sobre la magnitud de la correlación debido a que no conocemos el límite
superior por lo que no podemos calibrar la fuerza de la relación. Toma valores positivos
o cero (INCORRECTO). El valor que puede asumir la covarianza va entre -1 y +1
(INCORRECTO). No tiene un valor superior ni inferior (recorrido abierto), más allá de
que si su valor es 0, no es posible conocer si hay correlación o qué magnitud tiene.
Depende del número de casos de la muestra (INCORRECTO). Su cuadrado es igual a la
covarianza (INCORRECTO).
Dos instrumentos que permite resumir cómo se relacionan dos variables métricas son: la
covarianza y el coeficiente de correlación, también denominado “r de Pearson”. La
covarianza es una medida estadística específicamente diseñada para establecer la
relación entre dos variables métricas. Cuando las dos variables métricas son
independientes, la covarianza es cero; es positiva y grande cuando la relación es directa;
y negativa y grande (en valor absoluto) si es inversa. Cuando las variables están
relacionadas el valor de la covarianza no tiene límite superior ni inferior. Pero aún, pues
su valor puede aumentar (en términos absolutos) aun cuando la relación entre las
variables no se modifique: la covarianza es sensible a los cambios de escala de
medición. Los dos inconvenientes que tiene el estadístico de covarianza se los corrige
mediante una transformación algebraica de la covarianza, que es denominada coeficiente
de correlación, también llamado “producto momento” o “r” de Pearson. Es igual a la
covarianza dividida entre el producto de las desviaciones estándar de las dos variables.
El denominador opera como un factor de normalización: su valor es el máximo teórico
que puede tomar la covarianza. De esta construcción se deducen los valores máximos y
mínimos que pueda tener el coeficiente. Si la covarianza calculada es la máxima en
valor absoluto para estos datos, el coeficiente tendrá valor 1 indicando una correlación
perfecta. Es insensible a los cambios en la escala, puesto que si multiplicamos los
valores de x1 por 1000, la covarianza y la desviación estándar de x también se
multplican por 1000, es decir, el numerador y denominador aumentan en la misma
proporción, y se cancelan. Lo mismo ocurre si se multiplica x2 por una constante. Por
construcción, el coeficiente de correlación asume valores en el intervalo: -1 ≤ r ≤ 1.
Cuando las variables no están relacionadas, sucede que r=0; si hay relación positiva
perfecta asume el valor de 1 y si la relación es negativa perfecta, entonces asume el
valor -1. Tiene cuatro propiedades: es simétrico (si se invierten las posiciones de las
variables para los cálculos su valor final no se altera, más allá de cual sea el valor del
coeficiente no podemos inferir de éste que exista una relación de causalidad, la
causalidad no viene de los datos sino de la hipótesis, correlación no es causalidad); es
lineal (no permite captar una relación entre variables métricas que tenga forma funcional
de un círculo); es idéntico (la correlación de una variable consigo misma es igual a la
unidad); y su cuadrado es denominado como “coeficiente de determinación” y
simbolizado como R2 (proporción de la varianza total que sería explicable por las
variables involucradas en su cálculo). Para interpretarlo se pueden usar cinco estrategias
distintas: comparar el resultado de interés con otros computados sobre la misma base;
para la misma relación pero con otras bases; con la tabla convencional de valores
propuesta por Sierra Bravo; calcular una tasa de cambio; o contrastar el valor observado
con el esperado según la hipótesis.
27- Una forma de interpretar una correlación de Pearson en variables dicotómicas es

calcular el Beta (B) que informa cuál es la diferencia en la variable definida como
dependiente entre las unidades codificadas como “0” y las unidades codificadas como
“1” en la variable independiente. Indique cuál de las siguientes fórmulas es la correcta
para este propósito:
B= r* Sy/Sx
El cómputo del coeficiente B para una variable dicotómica independiente permite hallar
la brecha entre los promedios de x1 entre las dos categorías de x2 definidas.
28- Indique si las siguientes características de la media aritmética son correctas o

incorrectas:
Es una medida sensible a los valores extremos. Se define como una medida que
captura el centro de gravedad de una distribución. La sumatoria de los desvíos de
cada valor a la media es igual a cero. Su valor representa a una alta cantidad de
unidades (INCORRECTO).
Específicamente, presentaremos tres estadísticos que nos brindarán información sobre

en torno a qué valor tienden a gravitar los datos (media aritmética o promedio de la
variable), sobre cuál es el valor que está en la posición central de la distribución de una
variable (mediana de la variable), y cuál es el valor más frecuente en la distribución
(moda o modo). La media aritmética o promedio brinda información sobre el valor de
variable correspondiente al centro de gravedad de la distribución. Debemos enfatizar la
discrepancia informacional crucial que hay entre ambas situaciones en los casos que
tabulamos por valores de variable el promedio que se obtiene es exactamente igual al
que habríamos calculado con los datos originales, dado que da lo mismo sumar un valor
repetido que multiplicar ese valor por el número de repeticiones. Sin embargo, cuando
los datos se tabulan en intervalos de clase esta igualdad se rompe. Las marcas de clase,
que intervienen en el cálculo de promedios ponderados, son valores que representan a la
clase pero no pueden dar cuenta de la diversidad de valores dentro del intervalo (la
diversidad que proporcionan todos y cada uno de los casos que están clasificados en un
mismo intervalo de clase). La pérdida de información será mayor cuando más amplios
sean los intervalos, mientras la pérdida de información será menor si los intervalos
tienen menor amplitud, menor frecuencia, y si hay mayor número de intervalos. La
diferencia entre el promedio calculado a partir de los datos originales calculado a partir
de los datos agrupados en intervalos responde precisamente a la pérdida de información
resultante de agrupar los datos. Propiedades de la media: uno la suma de las
desviaciones de los valores de variable respecto a la media aritmética es igual a cero,
dos el promedio de una constante es igual a la constante, tres al sumar una constante a
una variable el promedio será igual al de la variable más la contante, cuatro si se
multiplican los valores de variable por una constante, el promedio de la variable
resultante es igual al promedio antiguo multiplicado por la constante, cinco si a todos los
valores de una variable se los multiplica por una constante (k2) y se le suma otra
constante (k1), la nueva media
aritmética resultará de multiplicar la medida por k2 y sumarle k2 y seis, el promedio
general de un conjunto de observaciones mutuamente excluyentes y exhaustivas, es
igual a la media ponderada de los promedios en cada categoría, ponderados por sus
tamaños relativos. La mediana es un estadístico que nos informa sobre el valor de la
variable ubicado en la posición central de una distribución. La mediana (Me) se define
como el valor de variable que se sitúa en el centro de la distribución, o alternativamente,
como aquel valor de variable que divide la distribucion en dos partes iguales. Para
calcular la mediana será imprescindible previamente, ordenar las observaciones según
los valores de la variable. La moda o modo es otra medida de la posición de una
distribución y se define como el valor de variable que tiene mayor frecuencia. Es posible
que una distribución de frecuencias tenga dos, tres, o incluso más valores “más
frecuentes”. En estos casos estaremos ante distribuciones de frecuencias bi-modal,
tri-modal. Ambos estadísticos pueden verse con formas diferentes de dar cuenta de la
posición de una distribución. El promedio se aproxima al centro de gravedad y la
mediana con la noción “valor de en medio”. La media aritmética es un estadístico
sensible a los valores extremos. Para determinar el promedio de la distribución de una
variable es necesario que ésta sea métrica. La mediana por su parte, sólo exige que la
variable tenga categorías ordenables (el caso de algunas no métricas y de todas las
métricas). Para calcularla debemos ordenar las observaciones, encontrar la que tiene la
posición central y luego identificar el valor de variable que le corresponde.
29- Si el promedio de una distribución del ingreso en una organización es de $6096 y a

través de un nuevo convenio salarial los trabajadores obtienen un aumento de $800, ¿a
cuánto ascenderá el nuevo promedio del ingreso?.
Aumenta a $6896.
30- En el caso anterior, la varianza de la distribución del ingreso es 3987348 ¿A cuanto

ascenderá la varianza con el incremento de $800 que obtiene cada trabajador?. Indique
cuál de las siguientes propiedades de la varianza aplicaria para hallar la respuesta.
Al sumar una constante a los valores de variable el valor de la varianza no se modifica la

varianza original.
31- ¿Por qué no se pueden comparar varianzas tomadas de dos distribuciones diferentes
de una misma variable (por ejemplo, el ingreso per cápita de los residentes en Salto y de
los residentes de Maldonado)?.
Porque difieren en los promedios.
En la Estadística se encuentra una clase de medidas que caracterizan una distribución

de frecuencias y no son de “tendencia central”. En general reciben el nombre de
cuantiles. Los cuantiles suelen usarse por grupos que dividen la distribución en partes
iguales; entendidas estas como intervalos de valores de variable que comprenden la
misma proporción de valores. Los más usados son: cuartiles son los tres valores que
dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales (0,25,
0,50 -coincide con la mediana- y 0,75); los deciles refiere a cada uno de los valores que
dividen un conjunto de datos (clasificados con una relación de orden) en diez partes
iguales, de manera que cada parte representa un décimo de la población; percentiles son
cuantiles que fraccionan la distribución en cien partes iguales o proporciones, cada una
de ellas equivale al 1% de las unidades y los quintiles dividen a la distribución en cinco
partees (0,20, 0,40, 0,60 y 0,80). Hemos visto ya que la Estadística Básica para variables
métricas contempla medidas para una segunda dimensión en que se se es posible y
necesario describir la distribución de una variable; la dispersión, heterogeneidad o
variabilidad de los valores. Una primera medida de dispersión a ser considerada es la
que llamamos rango o recorrido, que es la distancia que separa a los valores máximo y
mínimo de la variable. Cuanto mayor sea el valor del estadístico mayor será la
dispersión; en tanto, cuanto más cercano a 0 se halle el rango, menor será la dispersión
de la distribución. Aunque tiene un límite inferior fijo (0), el rango no presenta un valor
máximo único, dependiento tanto de la unidad de medida de la variable, como de la
distribución de que se trate. A efecto de superar algunas de las debilidades del rango, en
ocasiones se usa el rango o recorrido intercuartílico que se define como la diferencia
entre el tercer y primer cuartil de la distribución. Tiene la ventaja sobre el rango de dejar
por fuera de su consideración el 50% más extremo de las observaciones, tomando sólo el
50% central. La varianza es una de las medidas de dispersión más empleadas en la
Estadística. Resulta poco práctico presentar sus resultados en los estudios descriptivos, y
su interpretación puede ser poco intuitiva, a pesar de ello es utilizada a la hora de la
construcción de otros estadísticos como el desvío estándar y el coeficiente de
variabilidad, cuyos resultados sí son pasibles de una interpretación directa. Dado que el
valor de la varianza corresponde a la unidad de medida de la variable elevada al
cuadrado, resultaría absurdo interpretar nuestras dispersiones en términos de número de
habitantes elevados al cuadrado o de número de hijos elevado al cuadrado. La varianza
tiene la apariencia de un promedio sofisticado: informa el promedio de las desviaciones
a la media elevadas al cuadrado. Se evita la interpretación del resultado que arroja la
varianza y se acude a presentar otros estadísticos, que se basan en la varianza, y que
permiten superar las dificultades de interpretación recién engrimidas: el desvío estándar
y el coeficiente de variación. Sus propiedades son: uno los valores de la varianza son
siempre positivos o bien 0; dos la varianza de una constante es cero; tres al sumar una
constante a los valores de variable el valor de la varianza no se modifica; cuatro si se
multiplican (o dividen) los valores de la variable por una constante, la varianza de la
variable resultante es igual al producto del cuadrado de la constante por la varianza
original; cinco si a los valores de la variable se los multiplica por una constante (k2) y se
les suma otra constante (k1), la varianza
resultante es igual al cuadrado del factor contante por la varianza y seis la varianza de un
conjunto de observaciones clasificadas en categorías mutuamente excluyentes y
exhaustivas, es igual a la suma de la intervarianza (o varianza entre grupos, B) y la
intervarianza (varianza dentro de los grupos, W). No es fácil interpretar el valor de la
varianza debido a que queda expresada en unidades de medición elevadas al cuadrado.
La desviación estándar corrige esta dificultad pues se define como la raíz cuadrada
positiva de la varianza. Su unidad de medida coincide con la de la variable. Existen otras
estrategias alternativas a la varianza orientadas a garantizar que los desvíos positivos y
negativos no se cancelen al sumarlos. La varianza surge de elevar al cuadrado las
diferencias respecto al promedio. Otra manera de evitarlo consiste en tomar el valor
absoluto, es decir, calcular la diferencia sin tomar en cuenta el signo. Se toma en cuenta
el valor de los desvíos respecto a la media, ignorando el signo, lo cual se denomina
como desviación media. Además de superar el problema de la anulación de los desvíos
positivos y negativos, tiene frente a la varianza la ventaja de proporcionar resultados
fácilmente interpretables, pues su unidad de medida coincide con la de la variable. Y se
suele usar la desviación mediana como una medida de dispersión de una distribución. Se
define como el promedio ponderado de estas diferencias. Es conveniente tener una
medida de dispersión que sea independiente de las unidades de medida de la variable. La
solución para hacer comparables distribuciones, bien con distintas unidades de medida,
bien con distinta media, consiste en dividir el desvío estándar entre la media, de forma
tal de obtener un valor independiente de la unidad de medida de la variable. El CV se
puede presentar en términos porcentuales, resultado de multiplicar por 100 su valor.
32- Las consideraciones éticas están presentes en varios aspectos del análisis estadístico,
por lo general, en el momento de valorar o cuantificar ciertos resultados, concluir
informes o hacer recomendaciones de política. Sin embargo, en la medición de la
desigualdad, se dice que los juicios ingresan en la construcción misma de la medida.
Indique por qué y de algún ejemplo de medida en que esto sea así.
Los criterios éticos ingresan cuando se postula que un mejoramiento de la situación de

los pobres debe tener mayor peso en una medida de desigualdad que una transferencia
entre los ricos (cambio relativo).
33- La condición de Pigou-Dalton significa que el estadístico calculado es sensible a:
Transferencias de cantidades desde ricos a pobres sin modificar sus posiciones relativas.
34- La condición de cambio relativo significa que el estadísico es sensible a:
Mayor peso a las transferencias hacia los pobres que entre los ricos.
35- La condición de inferencia a la escala significa que el estadístico calculado no es
sensible a:
Cambios en la escala de medida en la variable.
Las propiedades mínimas que caracterizan a los buenos indicadores de desigualdad son:
la medida debe ser invariable a las transformaciones proporcionales o cambios de escala
(indiferencia); la medida debe cumplir con la propiedad de Pigou-Dalton (axioma débil
de transferencia) si se observa en dos momentos del tiempo, t=1 y t=2, la distribución
del ingreso y se registra que una proporción p= 0,10 de hogares, los más favorecidos,
transfieren ingresos a una proporción igual, p=0,10, de los hogares menos favorecidos
(manteniéndose el nivel de ingreso constante) debería registrar este cambio y presentar
un valor para t=2; y debería satisfacer el denominado axioma fuerte de transferencias
propiedad de cambio relativo, se exige una sensibilidad diferencial para marcar cambios
de la concentración según el nivel en que se realicen las transferencias entre hogares.
Otras propiedades son: la descomposición (el valor del indicdor calculado para toda la
población fuera igual a una suma algebraica conocida de los valores que el indicador
asuma en cada una de las categorías de otra variable que pueda usarse par dividir la
población estudiada); la propiedad de población establece que las medidas deberían ser
insensibles al tamaño de la población analizada, permitiendo así comparar distribucines
formadad de distinto tamaño de N; la propiedad del rango asume vaores dentro de un
recorrido cerrado entre valores limites conocidos y estandarizados, a los que se les
asigna un contenido significativo (0 denota equidistribución y el 1 concentración total);
y la propiedad del anonimato indica que para todos los efectos del análisis, resultan
indiferentes las otras propiedades que caracterizan las unidades analizadas.
Estadístico Fortalezas Debilidades

del promedio) Difícil
Varianza (V) Pigou-Dalton,
comunicación de resultados
descomposición
No tiene recorrido cerrado
Sensible a la escala (depende
Desvío (S) Pigou-Dalton Sensible a la escala

(depende del promedio)
Difícil comunicación de
resultados No tiene recorrido
cerrado No se puede
descomponer
Coeficiente de variación Pigou-Dalton e Es más sensible a los

(CV) indiferencia a la escala cambios observados en la parte alta de la distribución No
tiene recorrido cerrado No se puede descomponer
Razón de cuantiles Ninguna Desvío de los logaritmos Indiferencia a la escala

Fácil comunicación de Cambio relativo
resultados Teóricamente no cumplir
Sensible a la escala No con Pigou-Dalton
cumple Pigou-Dalton para Difícil comunicación de
valores intermedios No resultados No tiene recorrido
cumple cambio relativo No se cerrado
puede descomponer
En el estudio de la desigualdad suele recurrirse a dos tipos de estadísticos: por un lado

los denominados estadísticos “positivos”, que no se diseñaron originalmente para
estudiar la concentración de la variable y que por tanto, solo implícitamente se identifica
un patrón de desigualdad. Tal es el caso de la varianza, el desvío, el coeficiente de
variación y la razón cuantílica. Un segundo tipo de indicadores de desigualdad son los
“específicos”, estos explicitan criterios de desigualdad y se han desarrollado ex profeso
con el requerimiento de resumir la concentración de una distribución contrastándolo con
un patrón (Gini, Theil y la Curva de Lorenz). Dentro de las medidas “positivas” (no
explicitan cuál es la norma distributiva) presentadas (varianza, desvío estándar,
coeficiente de variación, razón de cuantiles y desvío de los logaritmos), existe consenso
en la literatura que sólo el coeficiente de variación y los desvíos de los logaritmos
resultan aceptables para el estudio de la desigualdad. La razón de cuantiles es un
indicador intuitivo, empírico y sin ajuste a una norma previa, de cómo es la
concentración de la variable, que además es muy sencillo de calcular y también de
comunicar su significado a un público no especializado. Por lo general se utiliza el
ingreso promedio de los deciles 10 y 1. Si denominamos a este indicador como RD, y
tomamos el ingreso del último decil y el ingreso del primer decil, entonces podemos
construir una razón decílica. Nos dice qué proporción del ingreo del primer decil es el
ingreso del décimo; o más sencillamente, cuántos pesos concentra los individuos u
hogares del décimo decil por cada peso que concentran los individuos u hogares del
primer decil. Y el desvío de los logaritmos (H) la contribución que harán los (pocos)
hogares con altos ingresos a la sumatoria es sensiblemente menor a la que harán los
(muchos) hogares de bajos ingresos. Esto permitirá contar con una medida más sensible
al mejoramiento o empeoramiento de los hogares más pobres que a los hogares más
ricos, cumpliendo así con el axioma fuerte de transferencias. De todas las medidas
positivas presentadas, H es la única que cumple con esta propiedad. Además es
insensible a la escala y salvo en casos excepcionales pero teóricamente identificables,
también cumple Pigou-Dalton.
36- La medida de la desigualdad propuesta por Henry Theil en 1967, también
denominada entropía generalizada tiene al menos tres características que son deseables
para un estadístico de este tipo. Por favor indiquelas:
Pigou-Dalton. Axioma fuerte de transferencias o

cambio relativo. Propiedad de descomposición.
37- Teniendo presentes las fórmulas de entropía y del índice de Theil, indique:
E(x)= xi ei
T= logN- E(x)
El valor máximo de T cuando es total la concentración del ingreso: 1 (la entropía

alcanza su valor máximo cuando todos los eventos tienen la misma probabilidad de
ocurrencia).
El valor que asume T cuando existe equidistribución: 0.
El índice de Theil conforma una famiilia de medidas de desigualdad fundamentada en el

concepto de entropía. Una sociedad igualitaria es una sociedad entrópica respeto de la
distribución del bien que se está evaluando. El índice mide la distancia entre la
distribución observada y la situación ideal de igualdad. Ahora bien, en la aplicación de
la medida de la desigualdad que Theil hizo, la entropía tiene una connotación positiva: la
entropía y la igualdad tienen una relación positiva. La entropía alcanza su valor máximo
cuando todos los eventos tienen la misma probabilidad de ocurrencia. Si entonces
restamos a este valor máximo la entropía observada, obtendremos la medida de
desigualdad propuesta por Theil. Una transferencia de una persona más rica a otra más
pobre, disminuye T, es decir, satisface la condición de Pigou-Dalton. Es insensible a la
escala en que se restringe X. Finalmente, cumple con el axioma fuerte de transferencias
o cambio relativo. También satisface la propiedad de descomposición en su forma
aditiva simple: su valor puede ser desagregado como la suma de dos componentes: uno
da cuenta de la contribución de la desigualdad dentroo de los grupos de población y otro
de la contrucción de la desigualdad entre grupos. Entropía máxima: Theil mínimo
(situación de equi-distribución. Entropía mínima: Theil máximo (situación de máxima
concentración
38- La curva de Lorenz es un instrumento:

Gráfico para describir la concentración de una variable métrica.
La curva de Lorenz es una representación gráfica utilizada frecuentemente para plasmar
la distribución relativa de una variable (métrica) en un dominio o universo determinado.
El coeficiente de Gini se diferencia de los presentados con anterioridad en la manera
como formaliza la norma democrática (en lugar de comparar los valores observados con
el promedio, utiliza el mismo criterio de Lorenz para construir la línea de igualdad en su
gráfica). Se define como la suma normalizada de las discrepancias entre las frecuencias
relativas acumuladas de ambas distribuciones (la observada y la teórica). Se mueve
dentro de los límites ideales de 0 y 1. El valor 0 corresponde a una equidistribución en
tanto que el valor 1 se alcanza cuando una unidad retiene para sí la totalidad de la
variable. Gini cumple con Pigou-Dalton e indiferencia, no depende del promedio pero
no es sensible a los cambios entre pobres.

Resumen General Estadística

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen General Estadística

Cargado por

Copyright:

Formatos disponibles

1- La Estadística se divide en dos ramas principales:

La Estadística Básica se ocupa de presentar los distintos tipos de instrumentos para

2- La Estadística Básica no problematiza la construcción del dato y lo asume como

La Estadística Básica no se ocupa de la verificación del dato, es decir de investigar

3- La Estadística Inferencial se caracteriza por:

Trabajar con una muestra tomada al azar.

Asociada a la Teoría de la Probabilidad que es el fundamento para seleccionar una

Generar gráficos para variables métricas y no métricas. Resumir la información a través

El corazón de la Estadística es la cuantificación del error que se comete al realizar

6- En la siguiente lista, indique cuáles SI y cuáles NO son tareas de la Estadística en un

Seleccionar los casos a observarse (por ejemplo mediante un procedimiento aleatorio).

La Estadística es convocada en una investigación cuando esté definido un problema y se

7- ¿Cuál de las siguientes oraciones define mejor la Estadística Básica?

Computar estadísticos uni, bi y multivariados que demuestren la objetividad de la

9- Desde el punto de vista de la clasificación en tipos, Cortés, Rubalcaba y Fernández

Aumenta el número de columnas

12- La tabla de frecuencia es un instrumento de análisis estadístico que permite:

Resumir la información de una variable

14- ¿Qué significa X2 (ji-cuadrada) sea igual a 0?.

Las variables son estadísticamente independientes.

Su valor depende del número de casos. ​Cuanto mayor es N, mayor es Ji-cuadrada.

Valores de Ji-cuadrada calculados en distintas tablas no pueden ser comparados. A

a) escriba el valor esperado: ​0.

b) ¿Por qué es que da ese resultado?. Fundamente su respuesta incorporando los

17- La asociación se define por oposición a la independencia estadística. Escriba la

18- El coeficiente de Q2 ha sido propuesto para analizar:

Determinar si la X2 (ji-cuadrada) indica independencia.

Asociación perfecta entre las variables.

Es un coeficiente que tiene un recorrido determinado, de 0 a 1 y que por tanto permite

Valor del coeficiente Interpretación de la magnitud de la

Menor a 0,10 Despreciables

Entre 0,30 y 0,49 Moderada

Entre 0,50 y 0,69 Sustancial

Desde 0,70 y más Muy fuerte

La medida de asociación , riesgo relativo o RR, surge de la comparación de los riesgos

Valor del RR Interpretación

RR= 1 No hay asociación entre los variables

RR > 1 Hay asociación positiva (cuando se da la

RR < 1 Hay asociación negativa (cuando se da la

21- Desde la obra de David Hume en el siglo XVIII, es aceptado el requisito de la

El análisis de correlación por su parte, se ocupa de las relaciones entre variables

23- La marca de clase se define como:

El recorrido de la variable es muy amplio.

25- Una matriz de correlaciones de Pearson permite: ​Agrupar el estadístico de cada

26- En la siguiente lista de propiedades sobre la correlación de Pearson, indique cuáles

27- Una forma de interpretar una correlación de Pearson en variables dicotómicas es

28- Indique si las siguientes características de la media aritmética son correctas o

Específicamente, presentaremos tres estadísticos que nos brindarán información sobre

29- Si el promedio de una distribución del ingreso en una organización es de $6096 y a

30- En el caso anterior, la varianza de la distribución del ingreso es 3987348 ¿A cuanto

Al sumar una constante a los valores de variable el valor de la varianza no se modifica la

Porque difieren en los promedios.

En la Estadística se encuentra una clase de medidas que caracterizan una distribución

Los criterios éticos ingresan cuando se postula que un mejoramiento de la situación de

33- La condición de Pigou-Dalton significa que el estadístico calculado es sensible a:

34- La condición de cambio relativo significa que el estadísico es sensible a:

Cambios en la escala de medida en la variable.

Estadístico Fortalezas Debilidades

Desvío (S) Pigou-Dalton Sensible a la escala

Coeficiente de variación Pigou-Dalton e Es más sensible a los

Razón de cuantiles Ninguna Desvío de los logaritmos Indiferencia a la escala

En el estudio de la desigualdad suele recurrirse a dos tipos de estadísticos: por un lado

Su valor depende del número de casos. Cuanto mayor es N, mayor es Ji-cuadrada.

a) escriba el valor esperado: 0.

25- Una matriz de correlaciones de Pearson permite: Agrupar el estadístico de cada

El valor máximo de T cuando es total la concentración del ingreso: 1 (la entropía

El valor que asume T cuando existe equidistribución: 0.