Está en la página 1de 24

PROCESAMIENTO

DE DATOS
Ing. Adela Cruz C.
Clase 2
VARIABLE REGIONALIZADA (V R)
 De manera general, un fenómeno es regionalizado
cuando se desplaza en el espacio, manifestando una

Variable regionalizada
cierta estructura.
 Las ciencias de la tierra, nos proporcionan numerosos
ejemplos. Si f(x) designa el valor en el punto x de
una característica “f” de este fenómeno, diremos
que f(x) es una V R. Se trata de un término neutro,
descriptivo, anterior, en particular a toda
interpretación probabilística. Del punto de vista
matemático, una V.R. es simplemente una función
f(x) del punto x, pero es, en general, una función
muy irregular: ejemplo: una ley en un depósito
minero.
 Una variable regionalizada se presenta bajo dos
aspectos contradictorios (o complementarios):
 un aspecto aleatorio (alta irregularidad, y

Variable regionalizada
variaciones imprevisibles de un punto a otro)
 un aspecto estructurado (la V.R. debe sin
embargo reflejar a su manera las características
estructurales de un fenómeno regionalizado)
 La teoría de las V.R. se propone entonces dos

Variable regionalizada
objetivos principales:
• en el plano teórico, expresar estas
características estructurales en una forma
matemática adecuada
• en el plano práctico, resolver el problema de
la estimación de una V.R. a partir de un
muestreo fragmentario.
AN
ALI
SIS
EXP
LO MEDIDAS DE
RA
TO
POSICIÓN
RIO
DE
DA
TO
S
Medidas de posición

ANALISIS EXPLORATORIO DE DATOS


ESTADÍSTICA BÁSICA
 Media: Suma de datos dividido entre la cantidad
de los mismos (promedio).
Medidas de posición

Media ponderada: se presenta cuando hay varias

ANALISIS EXPLORATORIO DE DATOS


observaciones del mismo valor; en un conjunto de
datos cada uno de ellos tiene una importancia
relativa (o peso).
por ejemplo, la nota de una asignatura donde el
examen final tiene un peso mayor al de un trabajo.
Medidas de posición

 Mediana: Dato central de un conjunto de valores

ANALISIS EXPLORATORIO DE DATOS


ordenados, si el conjunto de valores es par, se
saca la media de la pareja central.

157368
 Moda: Datos que mas se repite. Si son dos es
BIMODAL.
Medidas de posición
 Desviación estandar:

ANALISIS EXPLORATORIO DE DATOS


 Es la sumatoria al cuadrado de la resta de cada valor
con la media, dividido entre el número de valores
existente menos uno.

 La desviación estándar, al igual que la media y la


varianza, es un índice muy sensible a las
puntuaciones extremas.
 Cuanta más pequeña sea la desviación
estándar mayor será la concentración de datos
alrededor de la media.
 La desviación estándar (σ) es la raíz cuadrada de
la varianza.
Medidas de posición

ANALISIS EXPLORATORIO DE DATOS


"¿qué es la varianza?"
 Varianza es el cuadrado de la desviación
estándar: σ2
 Describe la variabilidad de la distribución.
Es la desviación o dispersión de la
distribución
 la desviación sirve para analizar el
comportamiento de los valores
alrededor de su promedio
Medidas de posición

ANALISIS EXPLORATORIO DE DATOS


EJEMPLO 1
CALCULAR MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR

394 mm

600 mm
470 mm
430 mm

170 mm 300 mm
Medidas de posición

ANALISIS EXPLORATORIO DE DATOS


EJEMPLO
CALCULAR MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR

Es correcto?

394 mm

Desviación promedio que existe entre las muestras


Medidas de posición

ANALISIS EXPLORATORIO DE DATOS


EJEMPLO
CALCULAR MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR

394 mm

Usando la desviación estándar tenemos una manera "estándar"


de saber qué es normal, o extra grande o extra pequeño.
Medidas de posición

ANALISIS EXPLORATORIO DE DATOS


 Coeficiente de variación: indica la relación existente
entre la desviación estándar de una muestra y su media.

 Error relativo: Es el cociente (la división) entre el error


absoluto y el valor exacto.
 Error absoluto: Es la diferencia entre el valor de la
medida y el valor tomado como exacto
 La Probabilidad propone modelos para los fenómenos
aleatorios, es decir, los que se pueden predecir con
certeza, y estudia sus consecuencias lógicas
Medidas de posición
 El tratamiento de la probabilidad básica como un proceso de

ANALISIS EXPLORATORIO DE DATOS


conteo discreto, es satisfactorio si tratamos con números
razonablemente pequeños, como en el caso anterior. Pero si
el número de eventos es muy grande, entonces se puede
calcular la probabilidad por medio de una variable continua,
de modo que podemos usar métodos del cálculo.
 Para esto debemos entender como es que se distribuye o
comporta la variable. Existen diferentes funciones de
distribución:
Medidas de posición

ANALISIS EXPLORATORIO DE DATOS


CURVA NORMAL, CAMPANA DE GAUSS
 Se introdujo por Gauss para
estimar los errores en
observaciones enormes. En el
que la campana en forma de
curva conocida como función
gaussiana o curva de Bell se
utiliza para representar la
distribución de la función de
densidad de probabilidad.

Cuando se trabaja con una variable de muchos individuos, los


valores se deben repartir en una curva simétrica en la cual la
mayoría de los datos se encuentran en la mitad, se encuentra
elevada con forma de campana y disminuye a medida que se alejan
de la media.
En la curva normal la mediana, moda y media son iguales.
Medidas de posición

DISTRIBUCIÓN LOGNORMAL

ANALISIS EXPLORATORIO DE DATOS


 Ocurre cada vez que existe una variable
aleatoria X tal que su logaritmo natural es
una nueva variable aleatoria Y con
distribución normal, entonces X sigue el
modelo probabilístico llamado logaritmo
normal.
Medidas de posición
HISTOGRAMA
Un histograma es una representación gráfica de una

ANALISIS EXPLORATORIO DE DATOS



variable en forma de barras. En el eje abscisas se
construyen unos rectángulos que tienen por base la
amplitud del intervalo, y por altura, la frecuencia
absoluta de cada intervalo.
 La superficie de cada barra es proporcional a la
frecuencia de los valores representados.
Para que sirve el histograma?
 Tipo de distribución (Normal, lognormal,..)
 Distribución uni-modal, multi-modal
 Aparición de valores extremos y outliers
 El estudio del histograma permite extraer conclusiones
sobre el tipo de distribución que siguen los datos, la
presencia de valores huracanados y la posible existencia
de poblaciones complejas (bimodalidad).
Medidas de posición
 Distribución en
campana, normal, HISTOGRAMA PLANAR

ANALISIS EXPLORATORIO DE DATOS


esperada.

Muchos procesos distinto

Distribución de peine

Error en datos o poco datos


Medidas de posición

ANALISIS EXPLORATORIO DE DATOS


Sesgo positivo, una gran cantidad de datos
presenta valores muy bajos, representación
típica de datos que responden a una
transformación lognormal.
Medidas de posición

 Determinar el tamaño del Dato mayor + (1) – Dato menor

ANALISIS EXPLORATORIO DE DATOS



intervalo en el Histograma:
Num. De clases

Ejercicio 3
 Se tiene datos de velocidad de 45 conductores, los datos de
velocidad son:
DETERMINAR EL TAMAÑO DELde posición
Medidas

INTERVALO

ANALISIS EXPLORATORIO DE DATOS


DETERMINAR EL TAMAÑO DELde posición
Medidas
INTERVALO

ANALISIS EXPLORATORIO DE DATOS


ANALISIS EXPLORATORIO DE DATOS

También podría gustarte