Está en la página 1de 8

Tema 4

Análisis estadístico
exploratorio
Presentado por Christian Tavira Valdez
Análisis univariado
En el análisis univariado, se analizan los datos de una sola variable. Una
variable en su conjunto de datos se refiere a una sola
característica/columna. Puede hacer esto con medios gráficos o no
gráficos encontrando valores matemáticos específicos en los datos.

Algunos métodos visuales incluyen:


Histogramas: Gráficos de barras en los que la frecuencia de los datos
se representa con barras rectangulares.
Box-plots: Aquí la información se representa en forma de cajas.
Ejemplo de análisis univariado
Se puede registrar la altura de diez estudiantes en una clase y esto es un
dato univariado. Solo hay una variable que es la altura y, por lo tanto, no
tiene ninguna relación ni causa asociada. La descripción del patrón que
se encuentra en este tipo de datos se realiza extrayendo conclusiones
en base a la dispersión, medidas centrales de tendencia, spread o data,
y esto se realiza a través de los histogramas, tabla de distribución de
frecuencias, gráficos de barras, etc.
Análisis bivariado
Aquí, usas dos variables y las comparas. De esta manera, puede encontrar cómo una característica afecta a
la otra. Se realiza con diagramas de dispersión, que trazan puntos de datos individuales o matrices de
correlación que trazan la correlación en tonos. También puede usar diagramas de caja.

Tracemos un diagrama de dispersión de la mayor superficie habitable y los precios de venta. Aquí puede ver
que la mayoría de los valores siguen la misma tendencia y se concentran alrededor de un punto, excepto por
dos valores aislados en la parte superior.

Ejemplo:

Se está estudiando un grupo de estudiantes universitarios. Para averiguar su puntaje de examen promedio y
su edad, tiene que encontrar dos piezas del rompecabezas (puntaje examen y edad). Tanto el examen como
la edad son variables. Los datos bivariados también podrían ser dos conjuntos de elementos que dependen
el uno del otro.
Análisis multivariado
El análisis multivariado es uno de los métodos más útiles para determinar relaciones y analizar patrones
entre grandes conjuntos de datos.

Es particularmente efectivo para minimizar el sesgo si se emplea un diseño de estudio estructurado. Sin
embargo, la complejidad de la técnica la convierte en un modelo menos buscado por los entusiastas de la
investigación novatos. Por tanto, aunque el proceso de diseño del estudio e interpretación de los
resultados es tedioso, las técnicas destacan por encontrar las relaciones en situaciones complejas.

Ejemplo:
Un médico ha recopilado datos sobre el colesterol, la presión arterial y el peso. También recopiló datos
sobre los hábitos alimenticios de los sujetos (por ejemplo, cuántas onzas de carne roja, pescado,
productos lácteos y chocolate consumían por semana). Ella quiere investigar la relación entre las tres
medidas de salud y los hábitos alimenticios.
Calidad de datos de naturaleza
continua y discreta
La información cuantitativa trata de números e información que
puede medir objetivamente: dimensiones como altura, ancho y
longitud, temperatura y humedad, precios, área y volumen. En
términos generales, cuando mides algo y le das un valor numérico,
creas datos cuantitativos.

Hay dos tipos de datos cuantitativos, que también se conocen como


datos numéricos: continuo y discreto. Como regla general, los
recuentos son discretos y las mediciones son continuas. Los datos
continuos podrían dividirse y reducirse a niveles cada vez más finos.
Los datos discretos son un conteo que no se puede hacer más preciso.
Por lo general, implica números enteros. Los datos continuos, por otro
lado, podrían dividirse y reducirse a niveles cada vez más finos.
Calidad de datos de naturaleza continua y discreta
¡Gracias!

Hawkins, D. M. 1980. Identification of outliers. Ed. Chapman and Hall.Londres.


Uriel, E. & Aldás, J. 2005. Análisis Multivariante Aplicado. Thomson Ed. Madrid, España.

También podría gustarte