Está en la página 1de 8

CUARTILES:

Los cuartiles son los tres valores que dividen un conjunto de datos ordenados en
cuatro partes porcentualmente iguales
Dada una serie de valores X1,X2,X3 ...Xn ordenados en forma creciente, podemos
pensar que su cálculo podría efectuarse:
 Primer cuartil (Q1) como la mediana de la primera mitad de valores;
 Segundo cuartil (Q2) como la propia mediana de la serie;
 Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.

COEFICIENTE DE ASIMETRIA

En teoría de la probabilidad y estadística, la medida de asimetría más utilizada parte del uso del
tercer momento estándar. La razón de esto es que nos interesa mantener el signo de las
desviaciones con respecto a la media, para obtener si son mayores las que ocurren a la derecha de
la media que las de la izquierda. Sin embargo, no es buena idea tomar el momento estándar con
respecto a la media de orden 1. Debido a que una simple suma de todas las desviaciones siempre
es cero. En efecto, si por ejemplo, los datos están agrupados en clases, se tiene que:

COEFICIENTE CURTOSIS
La medida de curtosis trata de estudiar la proporción de la varianza que se explica por la
combinación de datos extremos respecto a la media en contraposición con datos poco alejados de
la misma.

En la fórmula se resta 3 porque es la curtosis de una distribución Normal. Entonces la curtosis


valdrá 0 para la Normal, tomándose a ésta como referencia.

COEFIICENTE DE CORRELACION:

La correlación es, pues una medida de covariación conjunta que nos informa del sentido de esta y
de su relevancia, que está acotada y permite la comparación entre distintos casos.
El coeficiente de correlación entre dos variables puede definirse como la covarianza existente
entre sus dos variables tipificadas y tiene por expresión de cálculo:

 
Interpretación:
**Si r < 0 Hay correlación negativa : las dos variables se correlacionan en sentido inverso. A
valores altos de una de ellas le suelen corresponder valor bajos de la otra y viceversa. Cuánto más
próximo a -1 esté el coeficiente de correlación más patente será esta variación extrema. Si r= -1
hablaremos de correlación negativa perfecta lo que supone una determinación absoluta entre las
dos variables ( en sentido inverso): Existe una relación funcional perfecta entre ambas(una
relación lineal de pendiente negativa).
** Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido directo. A
valores altos de una le corresponden valores altos de la otra e igualmente con los valores bajos.
Cuánto más próximo a +1 esté el coeficiente de correlación más patente será esta covariación.Si r
= 1 hablaremos de correlación positiva perfecta lo que supone una determinación absoluta entre
las dos variables (en sentido directo):Existe una relación lineal perfecta ( con pendiente positiva).
** Si r = 0 se dice que las variables están incorrelacionadas: no puede establecerse ningún
sentido de covariación.
Propiedad importante: Si dos variables son independientes estarán incorrelacionadas aunque
el resultado recíproco no es necesariamente cierto.   Matriz de correlaciones
ir a análsis multidimensional
CUASICUANTITATIVA:

Una variable cuasicuantitativa o variable cualitativa ordinal presenta modalidades no númericas,


en las que existe un orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.

CUALITATIVA:

Una variable, en el ámbito de la matemática, es un símbolo que puede aparecer en una función,
un algoritmo, una proposición o una fórmula, adoptando distintos valores. Al establecer vínculos
con otras variables, pueden contribuir al desarrollo de una teoría o de una hipótesis, adquiriendo
la denominación de constructos.

CALCULO:

El uso más extendido del término se encuentra en el ámbito de la lógica o de la matemática,


donde el cálculo consiste en un algoritmo (un conjunto de instrucciones preestablecidas) que
permite anticipar el resultado que procederá de ciertos datos que se conocen con anticipación. El
origen etimológico de la palabra tiene que ver con las rocas que se empleaban en la antigüedad
para realizar este tipo de cálculos.

CALCULO DE AMPLITUD:

La amplitud total (AT) es la diferencia entre la puntuación de mayor valor y la de


menor valor:

La amplitud total es un estadístico muy


sencillo y fácil de calcular, pero a menudo esta simplicidad es un inconveniente.
Consideremos el siguiente ejemplo:

Los grupos A y B son bastante


semejantes, pero no los coeficientes de amplitud. La diferencia en los coeficientes
es ocasionada por la variación introducida por una sola puntuación con valor
extremo, el 1000. Por esta razón es conveniente disponer de otras medidas más
adecuadas.

Principales características: Además de la ya señalada, el coeficiente de amplitud


total no tiene en cuenta los valores entre extremos, que son los que determinan su
valor.

DATOS DETERMINISTICOS:

Datos en forma determinística


A diferencia de los procesos de toma de decisiones determinísticas tal como, optimización lineal
resuelto mediante sistema de ecuaciones, sistemas paramétricos de ecuaciones y en la toma de
decisión bajo pura incertidumbre, las variables son normalmente más numerosas y por lo tanto
más difíciles de medir y controlar. Sin embargo, los pasos para resolverlos son losmismos.
Estos son: Simplificar, Construir un modelo de decisión, Probar el modelo, Usar el modelo para
encontrar soluciones.
El modelo es una representación simplificada de la situación real o No necesita estar completo o
exacto en todas las relaciones o Se concentra en las relaciones fundamentales e ignora las
irrelevantes. Este es entendido con mayor facilidad que un suceso empírico(observado), por lo
tanto permite que el problema sea resuelto con mayor facilidad y con un mínimo de esfuerzo y
pérdida de tiempo.
DATOS PROBABILISTICOS

Una base de datos probabilística es una base de datos en la que los campos tienen
asociados valores de probabilidad. Los gestores de bases de datos probabilísticas son un
área de investigación muy activa en la actualidad. Si bien aún no hay productos
comerciales, existen diversos prototipos.
En las bases de datos probabilísticas se distingue entre el modelo de datos y su
representación física, de un modo similar al de una base de datos relacional. En las
probabilísticas esta distinción es crucial porque tienen que representar números muy
grandes de posibles valores, a veces exponencial

DECILES
En estadística descriptiva, el concepto decil se refiere a cada uno de los 9 valores que dividen un
grupo de datos (clasificados con una relación de orden) en diez partes iguales, y de manera que
cada parte representa un décimo de la población. En resumen, los deciles son cada uno de los
nueve valores que dividen un conjunto de datos en diez grupos con iguales efectivos. Son los
nueve valores que dividen la serie de datos en diez partes

DESVIACION ESTANDAR:

La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la


procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables
cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la
varianza de la variable.
Para conocer con detalle un conjunto de datos, no solo basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en
su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una
visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para
la toma de decisiones.
DISTRIBUCION DE PROBABILIDAD

En teoría de la probabilidad y estadística, la distribución de probabilidad de una variable aleatoria


es una función que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que
dicho suceso ocurra. La distribución de probabilidad está definida sobre el conjunto de todos los
sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria. También se dice
que tiene una relación estrecha con las distribuciones de frecuencia. De hecho, se puede entender
que una distribución de probabilidades sería una frecuencia teórica, ya que ésta última es aquella
que describe cómo se espera que varíen los resultados.

DISTRIBUCION DE PROBABILIDAD DE POISSON

En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de


probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad
de que ocurra un determinado número de eventos durante cierto período de tiempo.
Concretamente, se especializa en la probabilidad de ocurrencia de sucesos con probabilidades
muy pequeñas, o sucesos "raros".
DISTRIBUCION BINOMIAL:En estadística, la distribución binomial es una distribución de
probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli
independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un
experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos
resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro,
fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se
repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado
número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.

Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p,
se escribe:

DISTRIBUCION NORMAL

En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución


gaussiana, a una de las distribuciones de probabilidad de variable continua que con más
frecuencia aparece aproximada en fenómenos reales. [cita  requerida]
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un
determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico
de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos
naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este
tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en
ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se
obtiene como la suma de unas pocas causas independientes.

Tipificación de la variable

Para poder utilizar la tabla tenemos que transformar la variable X que sigue una
distribución N(μ, σ) en otra variable Z que siga una distribución N(0, 1).

DESVIACION MONETARIA:
Existen diferentes explicaciones sobre las causas de la desviación monetaria, probablemente
existen diversos tipos de procesos económicos que producen inflación, y esa es una de las causas
por las cuales existen diversas explicaciones: cada explicación trata de dar cuenta de un proceso
generador de inflación diferente, aunque no existe una teoría unificada que integre todos los
procesos.

DATOS AGRUPADOS:
Los datos agrupados son aquellos que se encuentran ordenados y clasificados. Cuando la muestra
consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas
determinar las características de las muestras y por consiguiente las de la población de donde fue
tomada. Antes de pasar a definir cuál es la manera de determinar las características de interés,
cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos cómo se
agrupan los datos, esto se determinara de acuerdo al tipo de muestra que se esté realizando y de
acuerdo al tipo de datos obtenidos.

DATOS NO AGRUPADOS:
Los datos no agrupados son el conjunto de observaciones que se presentan  en su forma original
tal y como fueron recolectados, para obtener información directamente de ellos.
Cuando en la muestra que se ha tomado de la población o proceso que se desea analizar se tienen
menos de 30 datos, estos son analizados sin necesidad de formar clases con ellos y a esto es a lo
que se le llama tratamiento de datos no agrupados.

ESTADIGRAFOS:
Después de haber ordenado y descrito un conjunto de datos, aún el análisis resulta
todavía un tanto incompleto; es necesario entonces resumir la información y facilitar así
su análisis e interpretación utilizando ciertos indicadores.
 
A estos indicadores se les denomina también ESTADIGRAFOS o MEDIDAS DE RESUMEN,
permiten hallar un valor numérico, el mismo que representa a toda la población o
muestra en estudio.
 
2.   CLASIFICACIÓN:
 
Las medidas de resumen más importantes se clasifican en tres grupos:
 
- Medidas de tendencia central : Media, mediana, moda
- Medidas de posición : Deciles, cuartiles, percentiles
- Medidas de dispersión : Desviación standard, varianza,
                                                              coeficiente de variación

También podría gustarte