Documentos de Académico
Documentos de Profesional
Documentos de Cultura
A pesar del hecho de que los parámetros estadísticos mencionados describen una secuencia
en detalle, a menudo puede caracterizar una secuencia más fácilmente, en base al resultado
de cálculos representados de forma gráfica. Por ejemplo, un gráfico ordinario de una secuencia
puede completar en gran medida una visualización obtenida al analizar los parámetros
estadísticos.
Anteriormente en el artículo mencioné las funciones dHist() y dRankit(), que nos permiten
preparar datos para dibujar un histograma o un gráfico con la escala de probabilidad normal.
La posibilidad mostrar el histograma y el gráfico de distribución normal junto con el gráfico
ordinario en la misma hoja le permitirá determinar visualmente las principales prestaciones de
la secuencia analizada.
Estos tres gráficos alistados deberían ser complementados con un cuarto: el gráfico con los
valores actuales de la secuencia en el que Y su sus valores previos en el eje X. Este gráfico se
llama "Lag Plot". Si hay una correlación fuerte entre indicaciones adyacentes, los valores del
muestreo se extenderán en línea recta. Y si no hay correlación entre indicaciones adyacentes,
por ejemplo al analizar una secuencia aleatoria, entonces los valores se dispersarán por todo el
gráfico.
GRÁFICOS DE DISPERSIÓN
XY PLOTS
Los gráficos de dispersión, también denominados diagramas de dispersión o scatter plots en la
literatura en inglés, se utilizan para comparar los valores que toman dos variables distintas,
una de las cuales se representa a lo largo del eje x y la otra a lo largo del eje y. La gráfica
resultante nos permite identificar visualmente la posible correlación entre las dos variables.
Ejercicio: A una fiesta van 200 invitados, 80 solteros, 90 casados, 20 divorciados, 10 viudos
PROBABILITY PLOTS
El gráfico de probabilidad normal es una técnica gráfica, utilizada para contrastar la normalidad
de un conjunto de datos. Permite comparar la distribución empírica de una muestra de datos,
con la distribución normal. Es un caso pàrticular de gráfico de probabilidad.
Ejemplo de un gráfico de probabilidad normal.
La idea básica consiste en representar, en un mismo gráfico, los datos empíricos observados,
frente a los datos que se obtendrían en una distribución normal teórica. Si la distribución de la
variable es normal, los puntos quedarán cerca de una línea recta. Es frecuente observar una
mayor variabilidad (separación) en los extremos. Las desviaciones de una línea recta indican
desviaciones de la normalidad.
El gráfico de probabilidad normal es un caso especial de gráfico de probabilidad.
El hecho de que los puntos en los extremos inferior y superior de la gráfica no se desvíen
significativamente del patrón de línea recta indica que no hay valores atípicos significativos (en
relación con una distribución normal)
VARIANZA: Representa la distancia a la que los datos en tu muestra están agrupados alrededor
de la media, esta cifra te dará una idea de cuán dispersos están los datos. Las muestras con
una varianza baja tienen datos que están agrupados muy de cerca alrededor de la media. Las
muestras con una varianza alta tienen datos que están agrupados lejos de la media. La
varianza a menudo se usa para comparar la distribución de dos sets de datos. Es el promedio
de los cuadrados de las desviaciones medidas alrededor de la media.
Tengo 5 datos de valores de cobre en ppm:
0.3, 0.5, 0.9, 1.2, 1.8
1. Calculo la media: 4.7/5: 0.94
2. Resto la media a cada uno de los valores: 0.3-0.94: 0.64
3. 0.64, 0.44, 0.04, 0.26, 0.86 significa cuanto difiere cada punto de datos de la media
4. Ahora elevamos al cuadrado cada resultado 0.4, 0.19, 0.0016, 0.07, 0.74
5. Sumamos todos los valores al resultado le llamamos la suma de lo cuadrados: 1.4
6. Calculamos la Varianza que resulta de la suma de lo cuadrados: 1.4 dividido para el
numero de datos menos 1: 1.4/5-1: 0.35
7. Calculamos la Desviación Estándar que resulta de la raíz cuadrada de la varianza: 0.59
DESVIACIÓN ESTANDAR
La deviación estándar es una medida del grado de dispersión de los datos con respecto al valor
promedio. Mientras más dispersión de datos exista más alta va a ser la desviación estándar y
resulta de la raíz cuadrada de la varianza
Histograma-Distribución Normal
Cuando una dispersión es muy pequeña la desviación estándar también va a tener un valor
muy pequeño y que los datos en la gráfica de la campana de gaus van a estar muy agrupados a
la media formando una campana muy pronunciada indicando una baja dispersión de los datos.
Distribución simetrica
Cuando tenemos una dispersión muy alta la campana se abre y los valores se van a ir hacia los
extremos
Distribución Asimétrica
TERMINOLOGÍA
N score: Desviación estándar: dispersión
Progresive Half: percentiles
(outliers): muestreo contiene errores grandes