Está en la página 1de 10

Métodos gráficos:

Representar información

Análisis exploratorio: El análisis exploratorio de datos consiste básicamente en realizar


un análisis preliminar de los datos disponibles, que consiste en describir y organizar la
información.Las herramientas que se utilizan para este fin son las que proporciona la
estadística descriptiva como: métodos gráficos y medidas numéricas.

Métodos gráficos:
Una vez que has identificado el tipo de variables con las que estas trabajando y su
escala de medición, puedes comenzar a realizar un análisis gráfico con la finalidad de
presentar la información,

resumir datos

-Tabla de frecuencias: frecuencias relativas o sea las frecuencias entre el total


-Gráfica de pastel: frecuencia relativa/ 360

-Tabla de distribución frecuencias para variables relativas: una tabla que muestre las
clases y el número de observaciones que hay en cada una de ellas.
1. Determina el número de clases.
El número de intervalos recomendado es de no menos de 5 y cuando mucho
20, dependiendo de la cantidad de datos. Calcula √n (donde n es el número
de datos de la muestra), y redondea a un número entero para determinar el
número adecuado de clases (k).
2. Calcula el ancho del intervalo.
Resta el valor máximo menos el valor mínimo del conjunto de observaciones.
Luego divide entre el número de clases elegido en el inciso (1).
i = H − L / k
donde i es el ancho del intervalo, H es el valor máximo, L es el valor mínimo y k
es la cantidad de clases o intervalos a construir. Si los datos de la muestra son
enteros, redondea esta cifra a un entero; si los datos tienen un decimal,
redondea esta cifra a un decimal, etc.
3. Define los límites de cada clase.
El límite inferior del primer intervalo será el valor mínimo de los datos; suma a
este valor el ancho del intervalo definido en el inciso (2) para determinar el
límite superior. Construye de esta forma el resto de los intervalos, cuidando que
exista continuidad entre ellos, pero sin traslape de valores entre los límites
superior e inferior de las clases sucesivas.
4. Verifica los intervalos.
Revisa que el número de clases sea el que se determinó en el inciso (1) y que el
valor máximo de los datos quede incluido en el último intervalo.
Construye la tabla de frecuencias siguiendo el procedimiento indicado para
datos cualitativos. (tema anterior).

Histograma:
representar las frecuencias de los valores observados de una variable cuantitativa. De
forma similar a una gráfica de barras, el histograma se construye a partir de una tabla
de frecuencias, y constituye una forma gráfica de visualizar.

Dependiendo de cuantas crestas tenga el histograma va a ser unimodal, bimodal o


multimodal.
Además, es de interés conocer hacia dónde existen datos atípicos o poco comunes,
situación que se denomina sesgo, pudiendo éste ser positivo si los datos atípicos están
del lado derecho de la gráfica, o negativo si los datos atípicos están hacia la izquierda.
Un histograma simétrico o insesgado,

Las frecuencias relativas van en el eje vertical.


Diagrama de puntos:
Es el diagrama que se construye de una manera sencilla y rápida, con el objeto de
presentar información visual sobre la localización y dispersión de un conjunto de datos.
Por último, cómo pudiste revisar si cuentas con pocos datos de una variable
cuantitativa, el uso del diagrama de puntos te será de gran utilidad para expresarlos.

Diagrama de tallo y hojas:


Es una forma de representar el conjunto de datos observados para identificar valores
representativos, grado de dispersión, datos atípicos y sesgo. Para construir este
diagrama se requiere que los datos tengan por lo menos dos dígitos.

Por lo tanto, si se desea hacer puntualizaciones respecto a los valores obtenidos, es


importante emplear las gráficas tipo diagrama de tallo y hojas.
Diagrama de dispersión:

Existen situaciones en las que se estudia y representa visualmente la relación entre dos
variables. Al estudiar la relación entre ellas, se hace referencia a los datos como
bivariados.
Una técnica gráfica útil para mostrar la relación entre dos variables es el Diagrama de
dispersión.
El tipo de relación entre un par de variables puede ser positiva o negativa: se trata de
una relación positiva si a medida que una de las variables incrementa su valor la otra
también lo hace, es decir, existe una relación directa entre ellas; si por el contrario,
cuando una de las variables incrementa su valor la otra disminuye (relación inversa), se
dice que la relación es negativa.
Por otro lado, el grado de la relación determina la fuerza con la que las variables se
relacionan entre sí, pudiendo ir desde una relación nula o muy baja, hasta una relación
muy alta o perfecta.
MEDIDAS NUMÉRICAS:

Las medidas numéricas nos permiten describir y resumir nuestros conjuntos de datos,
existen medidas de tendencia central (media, mediana y moda), medidas de dispersión
(varianza y desviación estándar) y medidas de posición (percentiles y cuartiles).

Medidas de tendencia central:


-media
-mediana
-moda
Medidas de posición:

-Percentil:
indica el valor por debajo del cual se encuentra un porcentaje del conjunto de datos. Por ejemplo,
el valor del percentil 35 es más grande que el 35% de los datos pero más pequeño que el resto
de los datos.

cuartil:

Es el que divide al conjunto de datos en cuatro partes iguales, cada parte contiene un
25% de las observaciones.
Cuartil 1= percentil 25
Cuartil 2 = percentil 50= mediana
Cuartil 3 = percentil 75
Medidas de dispersión:
Conocer la variabilidad o dispersión de los datos nos ayuda a comprender qué tan
alejados están respecto a su valor promedio, entre más pequeña sea esa dispersión
podemos decir que los datos son más precisos.

1-Varianza: Es el promedio de las diferencias entre cada observación y la media


elevadas al cuadrado. Las unidades de la varianza no son las mismas que las de la
muestra. La varianza siempre es positiva y es nula cuando todos los valores coinciden
con la media.

si se utilizan todos los datos de la población tendremos la varianza poblacional y si se


usa una muestra tenemos la varianza muestral.

2-Desviación estándar:
Es la raíz cuadrada positiva de la varianza
● Si a todas las observaciones se les suma la misma constante, la varianza y la
desviación estándar no varían.
● Si a todas las observaciones se les multiplica por la misma constante positiva, la
varianza se multiplica por el cuadrado de la constante y la desviación queda
multiplicada por dicha constante.
● Recuerda que entre más pequeña sea esa dispersión de los datos podemos decir
que son más precisos y que todos ellos están cercanos, disminuyendo la
incertidumbre.

3-Coeficiente de variación:
Es el que indica que tan grande es la desviación estándar en relación al promedio.
Los valores pequeños del coeficiente de variación indican poca dispersión (esto es que
los datos son precisos). Cuanto más elevado sea el CV más dispersión o variabilidad
tienen los datos. Asimismo permite comparar la dispersión entre dos poblaciones
distintas aunque ellas tengas diferentes unidades de medición.

Para las medidas de dispersión aplica la población y muestra

También podría gustarte