Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Glosario Estadistico
Glosario Estadistico
ESTADSTICO
Aleatorio(a):
Fundado sobre la intervencin del azar o independientemente de otros
acontecimientos.
Anlisis de perfil. Mtodo para analizar datos del diferencial semntico, en
el cual una media aritmtica o mediana se calcula para cada conjunto de
opuestos polares y para cada objeto evaluado.
Anlisis de regresin simple. Procedimiento para derivar una relacin
matemtica, en forma de ecuacin, entre una variable dependiente mtrica
y una variable independiente mtrica.
Anlisis de regresin:
Procedimiento estadstico para analizar las relaciones de asociacin entre
una variable dependiente mtrica y una o ms variables independientes.
Atributos:
Variables cualitativas que slo poseen categoras.
Autocorrelacin:
Es la correlacin que existe entre una variable desfasada uno o ms
periodos y la misma variable.
Beta:
Probabilidad de cometer un error de tipo II.
Censo:
Conteo completo de los elementos de una poblacin u objetos de estudio.
Certidumbre:
Ambiente de decisin en el que slo existe un estado de naturaleza.
Coeficiente de correlacin parcial:
Medida de la asociacin entre dos variables despus de controlar o ajustar
los efectos de una o ms variables adicionales.
Coeficiente de correlacin:
Raz cuadrada del coeficiente de determinacin. Su signo indica la direccin
de la relacin entre dos variables, directa o inversa.
Coeficiente de determinacin mltiple:
Porcentaje de la variacin de la variable dependiente que es explicado por la
regresin. R2 mide qu tan bien la regresin mltiple se ajusta a los datos.
Coeficiente de determinacin:
Medida de la proporcin de variacin en Y, la variable dependiente, que es
explicada por la lnea de regresin, esto es, por la relacin de y con la
variable independiente.
Coeficiente de variacin:
Medida relativa de la dispersin, comparables por medios distribuciones
diferentes, que expresa la desviacin estndar como porcentaje de la
media.
Correlacin de rango:
Mtodo para hacer anlisis de correlacin cuando los datos no estn
disponibles en forma numrica, pero cuando la informacin es suficiente
para clasificar los datos.
Correlacin serial:
Existe cuando las observaciones sucesivas a travs del tiempo se relacionan
entre s.
Correlacin:
Es una medida de la relacin entre dos o ms variables. La correlacin puede
tomar valores entre 1 y +1. El valor de 1 representa una correlacin
negativa perfecta mientras un valor de +1 representa una correlacin
perfecta positiva. Un valor de 0 representa una falta de correlacin.
Covarianza:
Relacin sistemtica entre dos variables, en la cual el cambio en una implica
un cambio correspondiente en la otra.
Cuartil:
Percentil cuyo valor que indica su proporcin es un mltiplo de 25. Primer
cuartil es el percentil 25, segundo cuartil es la mediana, tercer cuartil es el
percentil 75.
Cuestionario:
Tcnica estructurada para recopilar datos, que consiste en una serie de
preguntas, escritas u orales, que debe responder un entrevistado.
Curtosis:
El grado de agudeza de una distribucin de puntos.
Datos continuos:
Datos que pueden pasar de una clase a la siguiente sin interrumpirse y que
pueden expresarse mediante nmeros enteros o fraccionarios.
Datos discretos:
Datos que no pasan de una clase a la siguiente sin que haya una interrupcin;
esto es, en donde las categoras representan valores o cuentas distintas que
pueden representarse mediante nmeros enteros.
Datos externos:
Datos que se obtienen de una fuente diferente de la organizacin para la
cual se est llevando a cabo la investigacin.
Datos primarios:
Datos que origina el investigador para aplicarse, especficamente, al
problema de investigacin.
Datos secundarios:
Datos recopilados para un propsito diferente al problema que se est
manejando.
Datos sin procesar:
Informacin antes de ser organizada por mtodos estadsticos.
Datos. Coleccin de Cualquier nmero de observaciones relacionadas sobre
una o ms variables.
Decil:
Percentil cuyo valor que indica su proporcin es un mltiplo de diez.
Percentil 10 es el primer decil, percentil el segundo decil, etc.
Deflacin de precios:
Es el proceso mediante el cual se expresan trminos de una serie en colones
constantes.
Distribucin de la muestra:
La distribucin de los valores de la estadstica de una muestra (calculada
para cada muestra posible), que pueda tomarse de la poblacin meta de
acuerdo con un plan de muestreo especfico.
Distribucin de muestreo de la media:
Una distribucin de probabilidad de todas las medias posibles de muestras
de un tamao dado, n, de una poblacin.
Distribucin de muestreo de una estadstica:
Para una poblacin dada, distribucin de probabilidad de todos los valores
posibles que puede tomar una estadstica, dado un tamao de muestra.
Distribucin de Poisson:
Distribucin discreta en la que la probabilidad de presentacin de un evento
en un intervalo muy pequeo es un nmero tambin pequeo, la probabilidad
de que dos o ms de estos eventos se presenten dentro del mismo intervalo
es efectivamente igual a cero, y la probabilidad de presentacin del evento
dentro del periodo dado es independiente de cundo se presenta dicho
periodo.
Distribucin de probabilidad:
Lista de los resultados de un experimento con las probabilidades que se
esperaran ver asociadas con cada resultado.
Distribucin discreta de probabilidad:
Distribucin en la que la variable tiene permitido tomar solamente un
nmero limitado de valores.
Distribucin F:
Familia de distribuciones diferenciadas por dos parmetros (grados de
libertad del numerador, grados de libertad del denominador), utilizada
principalmente para probar hiptesis con respecto a variancias.
Distribucin hipergeomtrica:
La distribucin correcta para calcular el riesgo del consumidor; a menudo se
le aproxima mediante la distribucin binomial.
Distribucin Ji-cuadrada:
Familia de distribuciones de probabilidad, diferenciadas por sus grados de
liberta, que se utiliza para probar un cierto nmero de hiptesis diferentes
acerca de varianzas, proporciones y bondad de ajuste de distribuciones.
Distribucin normal estndar:
Distribucin normal de probabilidad con media cero y una desviacin
estndar de 1.
Distribucin normal:
Distribucin de una variable aleatoria continua que una curva de un solo pico
y con forma de campana. La media cae en el centro de la distribucin y la
curva es simtrica con respecto a una lnea vertical que pase por la media.
Los dos extremos se extienden indefinidamente, sin tocar nunca el eje
horizontal. Base para la inferencia estadstica clsica que tiene forma de
campana y apariencia simtrica. Todas sus medias de tendencias central son
idnticas.
Distribucin t de Student:
Familia de distribucin de probabilidad que se distinguen por sus grados de
libertad individuales; es parecida, en forma, a la distribucin normal; y se
utiliza cuando se desconoce la desviacin estndar de la poblacin y el
tamao de la muestra es relativamente pequeo (< 30).
Distribucin uniforme:
Es una distribucin de frecuencia del conjunto de los enteros no negativos.
La frecuencia asignada a cualquiera de los enteros no negativos es 1, y la
medida de la frecuencia cualquier conjunto A de enteros no negativos es su
medida de conteo.
Distribuciones de frecuencias acumuladas:
Despliegue de datos en forma de tabla que muestra cuntos datos estn por
encima o por debajo de ciertos valores.
Distribuciones de frecuencias:
Despliegue organizado de datos que muestran el nmero de observaciones
del conjunto de datos que entran en cada una de las clases de un conjunto
de clases mutuamente exclusivas y colectivamente exhaustivas.
Estadstica de prueba:
Medida de cunto se acerca la muestra a la hiptesis nula. Con frecuencia,
sigue una distribucin muy conocida, como la normal, t de Student o ji
cuadrada.
Estadstica descriptiva:
Es la ciencia que analiza, organiza, recopila e interpreta informacin
cualitativa en grficas o tablas y se encarga de establecer los parmetros
que definen una poblacin.
Estadstica inferencial:
Es el tipo de estadstica que interpreta la informacin de tal manera que
nos pueda llevar a sacar conclusiones vlidas, a partir del estudio de una
muestra.
Estadstica F:
Relacin de las varianzas de dos muestras.
Estadstica t:
Estadstica que supone que la variacin tiene una distribucin simtrica en
forma de campana, que se conoce la media (o se supone que se conoce) y que
la varianza de la poblacin se estima a partir de la muestra.
Estadstica:
Ciencia que trata del desarrollo y aplicacin de mtodos eficientes de
recoleccin, elaboracin, presentacin, anlisis e interpretacin de datos
numricos. Mediciones que describen las caractersticas de una muestra.
Estadstico:
Descripcin resumida de una medida en la muestra seleccionada.
Evento:
Uno o ms de los resultados posibles de hacer algo, o uno de los resultados
posibles de realizar un experimento.
Eventos independientes:
Dos eventos evento son independientes si el conocimiento de que uno
ocurrir o ya ha ocurrido no afecta la probabilidad del otro; ms
precisamente, si la probabilidad condicional de cada uno dada por el otro es
la misma que la probabilidad incondicional.
Grfica lineal:
Presentacin grfica de magnitud en el conjunto de datos mostrado por la
pendiente de una lnea (o lneas) que ha sido situada con respecto a una
escala horizontal o vertical.
Grfico circular:
Crculo que divide en secciones de tal manera que el tamao de cada una de
stas corresponde a una proporcin del total.
Grfico de barras:
Presentacin grfica de magnitud en el conjunto de datos, representada por
la longitud de diferentes barras trazadas con referencia a una escala
horizontal o vertical.
Grfico de histogramas:
Representacin grfica de un conjunto de datos formada por rectngulos,
de una tabla de frecuencias cuya variable es numrica, de modo que cada
dato de la muestra ocupa igual rea que los dems.
Heteroscedasticidad:
Se presenta cuando los errores o residuos no tienen una varianza constante
a travs de un rango completo de valores.
Hiptesis alternativa:
Afirmacin de que se espera alguna diferencia o efecto. La aceptacin de la
hiptesis alternativa dar lugar a cambios en las opiniones o acciones.
Hiptesis nula:
Afirmacin en la cual no se espera ninguna diferencia ni efecto. Si la
hiptesis nula no se rechaza, no se har ningn cambio.
Hiptesis simple:
Es aquella que especifica completamente la distribucin de la poblacin
principal
Hiptesis:
Enunciado o proposicin no probados acerca de un factor o fenmeno de
inters para el investigador. Una hiptesis estadstica a un enunciado
respecto a una poblacin y usualmente es un enunciado respecto a uno a ms
parmetros de la poblacin.
Indicador:
Se trata de un nmero o de un ndice (un valor sobre una escalera de
medida) derivado de la observacin de un conjunto de fenmenos. Variable
que permite evaluar ciertos cambios en el curso del tiempo.
Incertidumbre:
Falta de un conocimiento completo acerca de los posibles resultados de las
acciones, con desconocimiento de las probabilidades de los posibles
resultados.
Inferencia estadstica:
Proceso de generalizar los resultados de la muestra a los resultados de la
poblacin.
Informacin de clasificacin:
Caractersticas socioeconmicas y demogrficas que se utilizan para
clasificar a los entrevistados.
Informacin de identificacin:
Tipo de informacin que se obtiene en un cuestionario y que incluye el
nombre, domicilio y nmero telefnico.
Informe de investigacin:
Presentacin de los resultados de la investigacin dirigido a una audiencia
especfica para obtener un determinado propsito.
Intervalo de confianza:
Intervalo de valores que tiene designada una probabilidad de que incluya el
valor real del parmetro de la poblacin.
Intervalo muestral:
Tamao de la distancia ente los elementos seleccionados en un muestreo
sistemtico; el reciproco de la fraccin muestral.
Lmites de confianza:
Lmites inferior y superior de un intervalo de confianza.
Lnea de regresin:
Una lnea ajustada a un grupo de puntos para estimar la relacin entre dos
variables.
Media:
El promedio; valor que se obtiene al sumar todos los elementos en un
conjunto y dividirlos entre el nmero de elementos.
Mediana:
Medida de tendencia central que se da como el valor arriba del cual caen la
mitad de los valores y abajo del cul cae la otra mitad.
Medidas de dispersin:
Estadsticas que expresan criterios para describir la ubicacin relativa de
los datos.
Medidas de localizacin:
Estadsticas que describen caractersticas generales de la ubicacin de los
datos dentro de un conjunto de valores posibles.
Medida de distancia:
Medida de dispersin en trminos de la diferencia entre dos valores del
conjunto de datos.
Medidas de tendencia:
Estadstica que describe una ubicacin dentro de un conjunto de datos. Las
medidas de la tendencia describen el centro de la distribucin.
Medidas de variabilidad:
Estadstica que indica la dispersin de la distribucin.
Moda:
Medida de tendencia central que se da como el valor que ocurre con mayor
frecuencia en la distribucin de una muestra.
Muestra:
Es una parte representativa que refleja las similitudes y diferencias de la
poblacin y que son importantes para la investigacin, se podra decir que es
el subconjunto seleccionado de la poblacin; por eso se suele seleccionar un
subgrupo que sea suficientemente representativo, pero tiene que tener
datos que puedan servir para conclusiones generalizadas.
Muestra aleatoria / muestra de probabilidad:
Tipo de muestra caracterizada por una seleccin de sujetos basada en la ley
de las probabilidades; un procedimiento de preparacin de muestras es
Muestreo aleatorio:
Las tcnicas de muestreo aleatorio aseguran que cada elemento en la
poblacin de inters tenga una probabilidad (no nula) de ser incluido en la
muestra.
Muestra aleatoria / muestra de probabilidad:
Tipo de muestra caracterizada por una seleccin de sujetos basada en la ley
de las probabilidades; un procedimiento de preparacin de muestras es
aleatorio, o probabilista, cuando todos los elementos de la poblacin tienen
una posibilidad de ser recuperados en la muestra: la probabilidad de
eleccin de cada elemento de la poblacin debe ser conocida por progreso.
Se trata del nico mtodo general capaz de atribuir un valor numrico
preciso a la estimacin.
Muestreo con reemplazo:
Procedimiento de muestreo en el que los elementos se regresan a la
poblacin despus de ser elegidos, de tal forma que algunos elementos de la
poblacin pueden aparecer en la muestra ms de una vez.
Muestreo sin reemplazo:
Procedimiento de muestreo en el que los elementos no se regresan a la
poblacin despus de ser elegidos, de tal forma que ningn elemento de la
poblacin puede aparecer en la muestra de una vez.
Multicolinealidad:
Problema estadstico que se presenta en el anlisis de regresin mltiple, en
el que la confiabilidad de los coeficientes de regresin se ve reducida
debido a un alto nivel de correlacin entre las variables independientes.
Nivel de confianza:
Probabilidad que los estadsticos asocian con una estimacin de intervalo de
un parmetro de poblacin. sta indica qu tan seguros estn de que a
estimacin de intervalo incluir al parmetro de la poblacin.
Nivel de significancia:
Valor que indica el porcentaje de valores de muestra que estn fuera ce
ciertos lmites, suponiendo que la hiptesis nula es correcta, es decir, se
trata de la probabilidad de rechazar la hiptesis nula cuando es cierta.
Observacin:
El registro en forma sistemtica, de patrones conductuales de personas,
objetos y sucesos a fin de obtener informacin sobre el fenmeno de
inters. Hecho de comprobar, describir, medir algo, particularmente un
fenmeno, por medio de instrumentos.
Ojiva:
Grfica de una distribucin de frecuencias acumuladas.
Parmetro:
Elemento variable en funcin del cual se explicitan las caractersticas
esenciales de un fenmeno. Se trata de una unidad de medida desconocida y
cuantitativa (tal como la renta total, la renta media, la produccin total, el
nmero de desempleados) utilizada por los investigadores para estudiar a
una poblacin entera u otros mbitos de inters. Valores que describen las
caractersticas de una poblacin.
Pendiente:
Constante para cualquier recta dada cuyo valor representa qu tanto el
cambio de unidad de la variable independiente cambia la variable
dependiente.
Poblacin de encuesta:
Representa la poblacin de estudio menos la no respuesta y cobertura
deficiente.
Poblacin finita:
Poblacin que tiene un tamao establecido o limitado.
Poblacin infinita:
Poblacin en el que es tericamente imposible observar todos los elementos.
Poblacin meta:
Conjunto de elementos u objetos que posee la informacin que busca el
investigador y acerca del cual deben hacerse las inferencias.
Poblacin:
Conjunto de todos los elementos que comparten un grupo comn de
caractersticas, y forman el universo para el propsito del problema de
Poblacin muestral:
Subconjunto de la Poblacin Objetivo cuyos elementos son susceptibles de
ser escogidos para su estudio. Usualmente denominada poblacin.
Polgono de frecuencias:
Lnea que une los puntos medios de cada clase de un conjunto de datos,
trazada a la altura correspondiente a la frecuencia de los datos.
Ponderacin:
Ajuste estadstico a los datos en el cual a cada caso o entrevistado en la
base de datos se asigna un valor relativo a fin de reflejar su importancia
relativa para otros casos o entrevistados.
Porcentaje:
Cociente de un valor actual entre un valor base cuyo resultado es
multiplicado por cien.
Potencia de la prueba de hiptesis:
Probabilidad de rechazar la hiptesis nula cuando es falsa, es decir, una
medida de que tan bien funciona la prueba de hiptesis.
Porcentaje:
Cociente de un valor actual entre un valor base cuyo resultado es
multiplicado por cien.
Potencia de la prueba de hiptesis:
Probabilidad de rechazar la hiptesis nula cuando es falsa, es decir, una
medida de que tan bien funciona la prueba de hiptesis.
Probabilidad:
La posibilidad de que algo suceda.
Promedio mvil:
Se obtiene encontrando la media de un conjunto especfico de valores y
usndola despus para pronosticar el siguiente periodo.
Promedio:
Medida de tendencia central que se obtiene sumando los datos y
dividindolos por el nmero de ellos.
Promedio Ponderado:
Promedio de datos a los que se asigna distinta importancia relativa.
Quintil:
Percentil cuyo valor que indica su proporcin es un mltiplo de veinte. Primer
quintil es el percentil 20, segundo el percentil 40, etc.
Rango intercuartlico:
Rango de una distribucin que indica el 50% intermedio de
observaciones.
las
Rango:
Diferencia entre los valores ms bajo y ms alto de una distribucin.
Regresin curvilnea. Asociacin entre dos variables que es descrito por una
lnea curva.
Regresin discriminante:
Procedimiento de regresin en el cual las variables de prediccin entran o
salen de la ecuacin de regresin una a la vez.
Regresin mltiple:
Tcnica estadstica que desarrolla simultneamente una relacin
matemtica entre dos o ms variables independientes y una variable
dependiente con escala de intervalo.
Regresin:
Proceso general que consiste en predecir una variable a partir de otra
mediante medios estadsticos, utilizando datos anteriores.
Relacin inversa:
Relacin entre dos variables en la que, al incrementares la variable
independiente, decrece la variable dependiente.
Relacin lineal:
Tipo particular de asociacin entre dos variables que puede describirse
matemticamente mediante una lnea recta.
Residual:
Diferencia entre el valor observado de la variable dependiente y el valor
proyectado por la ecuacin de regresin.
Seleccin del sesgo:
Variable extraa que se atribuye a la asignacin inadecuada de las unidades
de prueba a las condiciones de tratamiento.
Seal de rastreo:
Comprende el clculo de alguna medicin de error a travs del tiempo y el
establecimiento de lmites, de modo que cuando el error acumulativo rebase
dicho lmite, se alerte al pronosticador.
Serie de tiempo:
Consiste en datos reunidos, registrados u observados en incrementos
sucesivos de tiempo.
Serie estacionaria:
Es aquella cuyo valor estacionario no cambia a travs del tiempo.
Serie temporal:
Informacin acumulada a intervalos regulares, y mtodos estadsticos
utilizados para determinar patrones en dichos datos.
Sesgo:
Es el error humano, intencional o no intencional que se comete al ejecutar el
muestreo y que generalmente es sistemtico. Este error se minimiza a
travs de programas de entrenamiento, capacitacin y motivacin de
inspectores y recolectores de informacin estadstica.
Sistema de informacin geogrfica (SIG):
Un Sistema de Informacin Geogrfica (SIG) permite reunir, almacenar,
manipular y difundir informaciones geogrficas.
Tablas de Frecuencias:
Tabla que muestra el nmero de veces que en un conjunto de datos aparece
cada una de las clases de inters especificadas en el recorrido de los datos.
Tabulacin:
Es el procedimiento mediante el cual el conjunto de datos se ordenan segn
las categoras de determinada caracterstica.
Tamao de la muestra:
Nmero de unidades que se incluirn en un estudio.
Tasa de fecundidad:
Nmeros de nacimientos ocurridos en cierta poblacin durante un perodo,
entre la poblacin femenina en edad frtil.
Teorema bayes:
Frmula para el clculo de la probabilidad condicional bajo condiciones de
dependencia estadstica.
Teorema de Chebyshev:
No importa que forma tenga la distribucin, al menos 75% de los valores de
la poblacin caern dentro de dos desviaciones estndar a partir de la
media, y al menos 89% caer dentro de tres desviaciones estndar.
Teorema del lmite central:
Resultado que asegura que la distribucin de muestreo de la media se
acerca a la normalidad cuando el tamao de la muestra se incrementa, sin
importar la forma de la distribucin de la poblacin de la que se selecciona
la muestra.
Variable:
Propiedad o rasgo de un hecho u objeto (no constante) por la que puede ser
caracterizado o clasificado. Representacin de una caracterstica, de un
atributo, que posee alguna realidad.
Valor crtico:
Valor de la estadstica estndar(z o t) ms all del cual rechazamos la
hiptesis nula; el lmite entre las regiones de aceptacin y de rechazo.
Valor de la muestra:
Es una estimacin que se calcula a partir de los (n) elementos en la muestra.
Es una variable aleatoria, que depende del diseo de la muestra y de la
combinacin particular de los elementos que resultaron seleccionados.
Valor de la poblacin:
Es una expresin numrica que sintetiza los valores de una o varias
caractersticas de los N elementos de una poblacin completa; es una
medida resumida de una cualidad de la distribucin de la variable o variables
en la poblacin definida.
Valor esperado:
Es el valor promedio de una variable aleatoria en muchas pruebas u
observaciones.
Valor z:
Nmero de errores estndar en que un punto se encuentra alejado de la
media.
Variables cualitativas:
Son las que expresan distintas cualidades, caractersticas o modalidad
(cada modalidad que se presenta se denomina categora o atributo) . La
medicin consiste en la medicin de estos atributos. Las variables
cualitativas se dividen:
Variable cualitativa ordinal: Cuanto toman distintos valores
ordenados, que siguen una escala establecida. Las variables ordinales
pueden ser dicotmicas (Solo pueden tomar dos valores posibles,
ejemplo: "S" o NO" u "HOMBRE" o "MUJER") o tambin puede ser
politmicas (cuando pueden tomar 3 o ms valores, ejemplo: leve,
moderado, grave).
Variable cualitativa Nominal: Cuando los valores que toma no pueden
estar sometidos a un criterio de orden (Como los colores o lugar de
residencia).
Variables cuantitativas:
Son las que se expresan mediante cantidades numricas que resultan de
medir o de contar, pueden ser:
Variable discreta: Presenta interrupciones o separaciones, en la
escala de valores que puede tomar esta variable, que indican la
ausencia de valores entre los distintos valores especficos que la
variable puede tomar. Solo puede tomar valores enteros.
Variable continua: Esta variable adquiere cualquier valor, dentro de
un intervalo de valores especficos. Puede tomar cualquier valor real
dentro de un intervalo.
Variable aleatoria:
Es una funcin real en un espacio probabilstico: hace corresponder a cada
evento elemental con un nmero real, el valor de la variable aleatoria en ese
evento elemental.
Variable dependiente:
La variable que tratamos de predecir en el anlisis de regresin.
Variables dependientes:
Variables que miden el efecto de las variables independientes sobre las
unidades de prueba.
Variables independientes:
Variables (s) conocida(s) en el anlisis de regresin.
Varianza:
Desviacin cuadrada media de todos los valores de la media.