Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL POLITECNICA
“ANTONIO JOSÉ DE SUCRE”

VICERRECTORADO BARQUISIMETO
DIRECCIÓN DE INVESTIGACIÓN Y POSTGRADO
ESTADÍSTICA DESCRIPTIVA
Ing. Greiza Lucena

CONCEPTOS BÁSICOS
DIVISIÓN DE LA ESTADÍSTICA
 Estadística Descriptiva:
Es la rama de la estadística que se dedica a la organización, síntesis y descripción
de un conjunto de datos. También se puede decir que consiste en la recopilación,
ordenación, resumen, tabulación, manipulación, representación gráfica, análisis... de
la muestra para extraer la información primaria sobre la variable contenida en la
misma. Sus conclusiones se quedan en el ámbito de los propios elementos con los
que experimenta, es decir la muestra.
 Estadística Inferencial:
La rama que se ocupa de utilizar datos de muestra para inferir algo acerca de una
población. En este caso se esta en presencia de una población hipotética
(desconocida) y estaremos en la necesidad de diseñar una muestra y a partir del
estadístico encontrado hacer una inferencia del parámetro .
θ
Universo
Población
Objetivo
Muestra
Variable
Población: es el conjunto de características o conjunto de medidas que pueden

formarse a partir de los entes de interés.
Muestra: Es un subconjunto de la población y por tanto será también un conjunto

de “medidas”, a partir del cual se hará inferencia sobre el comportamiento de la
población.
Estadístico, Estadística o Estadígrafo: es una función de la muestra y se calcula

sólo con una parte de la población analizada. 
Parámetro: es un valor que recoge un comportamiento específico de la población,

por lo tanto se calcula sobre toda la población. θ
Variable: Es toda medida discreta o continua definida a partir del universo

estadístico definido. Las variables de interés son aquellas características que
desean medirse y que fueron establecidas en los objetivos de la investigación.
Clasificación de una variable:
De acuerdo a su naturaleza :
 Cualitativa:
Se presenta cuando la característica asigne a la unidad de investigación una
condición no numérica (un ATRIBUTO). Ejemplo: Sexo, estado civil, nacionalidad,
color de ojos, color de cabello, etc.
 Cuantitativa:
Se presenta cuando la característica asigne a la unidad de investigación un número.
Ejemplo: Peso, estatura, edad, promedio de notas, etc.
Las variables cuantitativas se clasifican en:
 Discretas: Es aquella que no acepta valores intermedios entre dos puntos
consecutivos cualesquiera. Esto significa que el instrumento de medición es de
valores fijos no significando que una variable discreta NO PUEDA TOMAR VALORES
DECIMALES.
Continuas: Es aquella que acepta valores intermedios entre dos puntos
consecutivos cualesquiera.
DISTRIBUCIÓN DE FRECUENCIAS
Una distribución de frecuencia es una tabla en la que
aparecen todos los valores o intervalos de clases de los datos
observados y las frecuencias de datos correspondientes a
cada intervalo o valor. Esta agrupación de datos numéricos
se llama una distribución de frecuencia porque en ella se
indica cuan frecuentemente aparecen los datos. Por lo
general, es deseable que todos los IC de una distribución de
frecuencias sean iguales.
La Distribución de Frecuencias: Consiste en agrupar

los datos por frecuencia de aparición, de acuerdo con la
escala que más se ajusta a tus necesidades. Permite
representar el modo en que se distribuyen las unidades de
análisis entre las clases o categorías que conforman la escala
de clasificación de la variable en cuestión.
CONCEPTOS BÁSICOS
Para saber cómo presentar y describir la información en

forma adecuada es necesario organizar los datos en tablas
y gráficas, y a partir de ellas extraer las características
importantes del problema estudiado. Para realizar un buen
análisis e interpretación de los datos, es necesario conocer
los siguientes conceptos:
 Datos sueltos: son los datos recolectados que no han sido

organizados numéricamente. Ej: estaturas.
 Ordenación: es un conjunto de datos numéricos en orden

creciente o decreciente de magnitud.
CONCEPTOS BÁSICOS
 Rango o recorrido: Es la diferencia entre el mayor
valor y el menor encontrado en un conjunto de
datos ordenados. Se calcula:
X max
 X min
 Datos agrupados: son los datos organizados y

reunidos en clases o categorías.
 Clases o categorías: Es una escala de clasificación

compuesta por varias divisiones ordenadas
numéricamente llamadas intervalos de clase (IC),
los cuales están delimitados por límites de clases
que son los valores mayor y menor que los
enmarcan. El IC identifica el rango de valores
incluidos dentro de una clase y se calcula: L.
Exacto Superior – L. Exacto Inferior.
CONCEPTOS BÁSICOS
 Límites de clases declarados Tabla 1. Salarios semanales de 110

o nominales: Son los puntos trabajadores no calificados
que indican los valores
incluidos dentro de la clase. Salario Número de
Ejemplo: 240-259, …, 340-359 semanal ($) trabajadores
240-259 7
 Límites de clases verdaderos 260-279 20
o exactos: Son los puntos 280-299 33
específicos que sirven para
separar clases adyacentes 300-319 25
en una escala de medición 320-339 11
de variables continuas. 340-359 4
CONCEPTOS BÁSICOS
 Establecimiento de los límites de clase:
 Delimita los límites inferiores (LI) de los

intervalos. Partiendo del valor mínimo de la
serie, añádele la amplitud y tendrás el LI del
intervalo siguiente, así se continua hasta
llegar al último LI de la escala.
 Delimita los límites superiores (LS): los límites

verdaderos o exactos, LS se obtienen
sumándole la amplitud a los LI respectivos.
CONCEPTOS BÁSICOS
 Amplitud del intervalos: Es la longitud que tiene un Intervalo de clase
(IC). Su cálculo puede hacerse de tres maneras cuando ya están
declarados los límites:
1. Una vez determinados los límites exactos, se restan los límites

verdaderos de una clase.
2. Cuando no es posible identificar límites exactos, la amplitud del IC
puede determinarse restando el límite declarado inferior de
cualquier clase a el límite declarado inferior de la clase adyacente
siguiente. Ejemplo: 260-240,…,340-320.
3. Por último, se puede calcular la amplitud contando los números
enteros que se encuentran entre los valores límites declarados de
cualquiera clase, incluyendo éstos.
 Marca de Clase: Es el punto medio de dicho intervalo, que se

computa mediante la semisuma de los límites de clase del intervalo
referido. También puede determinarse sumando la mitad del
intervalo de clase al límite exacto inferior de la clase.
xi  xs Li  L s
xm  
2 2
EJEMPLO
Construya una tabla de distribución de frecuencias
considerando las definiciones anteriores.
 Un investigador desea determinar cómo varían las estaturas de las

obreras de una empresa y toma un grupo de mujeres y registra en
pulgadas las estaturas. Los datos son:
63 65 63 69 67 53 58 60 61
65 64 72 68 66 55 57 60 62
65 64 71 68 66 56 59 61 62
65 63 70 67 66 57 59 61 62
Construir una tabla de distribución de frecuencias de los diámetros y

grafique:
a. Un histograma.
b. Un polígono de frecuencias relativas.
c. Una ojiva y una ojiva porcentual.
FRECUENCIAS
En la mayoría de las situaciones prácticas de la investigación,
se hace imprescindible echar mano de un recurso
sumamente útil: la agrupación de las unidades de análisis de
acuerdo a su frecuencia de aparición. Las frecuencias
pueden clasificarse en:
 Absolutas: indican la cantidad de elementos

 Relativas: indican la proporción o porcentaje de elementos.
Cada una de estas pueden ser simples o acumuladas.
Las frecuencias absolutas o relativas simples se usan cuando
se tratan variables en cualquier escala, en tanto que las
acumuladas se emplean cuando se estudian variables en
una escala cuantitativa o dimensional.
FRECUENCIAS
 Frecuencias absolutas simples: Indican la cantidad de
elementos que se encuentran en cada intervalo de clases o
categoría. (fi)
 Frecuencias absolutas acumuladas (Fa): indican la cantidad

de datos que se encuentran acumulados. Pueden ser:
a) Ascendentes (Fa↑): es la cantidad de datos acumulados

hasta un cierto valor de la variable o menor que el límite
superior verdadero. Se obtiene sumando sucesivamente las
frecuencias absolutas simples hasta el valor de la variable.
b) Descendente (Fa↓): es la cantidad de datos acumulados

a partir de un cierto valor de la variable (límite inferior) mayor
que este valor. Se determina restando al total de los datos
las frecuencias absolutas simples sucesivamente.
FRECUENCIAS
 Frecuencias relativas simples (hi): indican la proporción de veces que
se repite un valor de la variable o la proporción de elementos que se
encuentran en un intervalo o categoría según los datos analizados se
determina dividiendo cada frecuencia absoluta simple entre el total
de los datos (n).
 Frecuencias relativas acumuladas: indican la proporción de datos

que se encuentran acumulados. Pueden ser:
a) Ascendentes (Ha↑): es la proporción de datos acumulados hasta un
cierto valor de la variable o menor que el límite superior verdadero. Se
obtiene dividiendo las frecuencias absolutas acumuladas ascendente
entre el total de los datos
b) Descendente (Ha↓): es la proporción de datos acumulados a partir

de un cierto valor de la variable (límite inferior) mayor que este valor.
Se determina dividiendo las frecuencias absolutas acumuladas
descendente entre el total de los datos.
fi Fa  Fa 
hi  H a
 H a

n n n
EJEMPLO
Tabla 2. Salarios semanales de 110 trabajadores no calificados
Salario Límites verdaderos Número de Frecuencia Frecuencia

semanal o exactos de clase* trabajadores Relativa Absoluta
($) (Frecuencia
absoluta)
Proporc. % Proporc. %
240-259 239.50-259.50 7 0.06 6 0.06 6
260-279 259.50-279.50 20 0.18 18 0.24 24
280-299 279.50-299.50 33 0.30 30 0.54 54
300-319 299.50-319.50 25 0.23 23 0.77 77
320-339 319.50-339.50 15 0.14 14 0.91 91
340-359 339.50-359.50 10 0.09 9 1 100%
110 1 10
0%
REPRESENTACIÓN DE DATOS PEQUEÑOS
Los datos pequeños o tabulados o pocos variables se pueden

representar a través de los siguientes gráficos:
Gráficos de barras simples: son aquellos que representan una sola

característica. A continuación se presentan los pesos de unos paquetes
de harina pan que fueron medidos
REPRESENTACIÓN DE DATOS PEQUEÑOS
 Gráfico de trazos o líneas:
Es un gráfico en donde se localizan los puntos en un sistema de
coordenadas y luego se conectan los puntos sucesivos con trazos
rectos.
Ejemplo El número de empleados por tiendas que hay en una empresa se
muestra a continuación
Se debe indicar el cero siempre que sea posible; en caso de que no lo sea, y
si tal omisión pudiera provocar alguna conclusión errónea, es aconsejable
advertirlo de algún modo (por lo general, con un corte en el eje)
REPRESENTACIÓN DE DATOS
La distribución de frecuencias por intervalos, datos grandes o muy
variables, se representa gráficamente por medio de un
HISTOGRAMA, o de un polígono de frecuencias. A partir del polígono
de frecuencias se puede trazar la curva de frecuencias.
 HISTOGRAMA: Es una gráfica de barras rectangulares verticales

juntas. La base de cada barra es proporcional a la amplitud del
intervalo, y la altura es proporcional a su frecuencia (absoluta, o
relativa, o porcentaje). Permite visualizar tres características de los
datos: forma, acumulación o tendencia posicional y la dispersión o
variabilidad.
Pasos para la construcción:

- Se trazan dos ejes de coordenadas sobre un plano.
- Se llevan sobre el eje horizontal a los límites de clase.
- En el eje vertical, se puede representar tanto el número de
frecuencias, como la proporción y el porcentaje de observaciones
para cada IC.
Los histogramas pueden ser:
Eje vertical Nombre

Número de observaciones Histograma de frecuencias
Proporción de observaciones Histograma de frecuencias
relativas
Porcentaje de observaciones Histograma porcentual
4. Se levantan perpendiculares por los límites de cada clase hasta la

frecuencia de clase respectiva.
5. Se unen las dos perpendiculares que representan cada clase.
Observaciones:
1. Los histogramas no se pueden utilizar con respecto a distribuciones de
frecuencias abiertas.
2. El histograma representa las frecuencias de los intervalos mediante
áreas y no mediante alturas, pero si todos los IC tienen igual tamaño
entonces el área de los rectángulos representa las frecuencias.
Grafica 1. Histograma de estaturas en pulgadas

 Polígono de frecuencias
Son gráficos de línea trazados sobre las marcas de clase de
cada intervalo, puede obtenerse uniendo los puntos medios de los
techos de los rectángulos del histograma y tomando en cuenta que se
deben extender ambos extremos del polígono hasta el eje horizontal
en aquellos puntos que serán las marcas de clase adyacentes a cada
extremo.
A medida que crece el número de clases y de observaciones,
el polígono se vuelve cada vez más suave y curvo. Este polígono
suavizado recibe el nombre de curva de frecuencia.
Tipos de polígonos:
• Polígonos de frecuencia absoluta.
•Polígonos de frecuencia relativa.
•Polígono porcentual.
Ventajas:
• Una de las ventajas del uso de polígonos es que permite hacer
comparación entre dos o más conjuntos de datos.
• Representa realmente el tipo de población de la que vienen los
datos.
• Describe características de la población tales como: simetría,
asimetría, tipos como: Binomial, Normal, Uniforme.
Grafica 2. Polígono de estaturas en pulgadas.

MEDIDAS ESTADÍSTICAS DESCRIPTIVAS
Las medidas estadísticas descriptivas pueden son:
MEDIDAS DE MEDIDAS DE
MEDIDAS DE
TENDENCIA TENDENCIA NO MEDIDAS DE VARIABILIDAD
DISTRIBUCIÓN
CENTRAL CENTRAL
•MEDIA •DECIL •RANGO O AMPLITUD •CURTOSIS
•MEDIANA •QUARTIL •RANGO INTERCUARTIL •ASIMETRÍA
•MODA •PERCENTIL •VARIANZA
•DESVIACIÓN ESTÁNDAR
Medidas de Tendencia Central
o de posición
Los datos organizados en una distribución de frecuencias destacan sus
características más esenciales, sin embargo los indicadores que describen a
los datos en forma más precisa, deben calcularse. Estos indicadores
resumen los datos en medidas descriptivas que se refieren a la
centralización o posición, a la dispersión o variación, a la asimetría, y a la
curtosis de los datos.
1. Media aritmética: X
Denominada simplemente media, representa el valor hacia donde tiende un

conjunto de datos; es la suma de los valores observados de la variable,
dividido por el número de observaciones. Se denota:
n
a) Media aritmética para datos no tabulados:
 Xi
i 1
X 
n
o de posición
3. Mediana
Es el valor mediano de una serie de datos, es el número que separa a
la serie de datos ordenados en forma creciente o decreciente en dos partes
de igual número de datos.
Es una medida promedio que depende del número de datos ordenados
y no de los valores de estos datos. Se denota con Me.
EJEMPLO:
Calcular la mediana para los siguientes datos:
120, 3, 14, 1, 99, 7, 30, 2000, 16.
30, 77, 3, 300, 36, 11, 1000, 29.
Medidas de Tendencia
Central o de posición
 Propiedades de la Mediana:
1. Sólo depende del número de datos ordenados y no de la magnitud de los

datos. No es afectada por algún valor grande o pequeño.
2. La mediana siempre se puede calcular para distribuciones de frecuencia con

intervalos de diferente amplitud, siempre que se pueda Determinar el límite
inferior del intervalo de la mediana.
3. Puede ser calculada para variables con valores en escala ordinal.

Medidas de Tendencia
4. Moda:
Central o de posición
La moda de una serie de datos es el valor Mo, que se define como el dato
que más se repite. La moda no siempre existe y si existe, no siempre es
única. En matemática, la moda es el valor de la variable en el que existe un
máximo absoluto.
La moda es el promedio menos importante debido a su ambigüedad.
Ejemplo 5.
Encontrar la moda en los siguientes conjuntos de datos:

a) 7, 9, 7, 8, 7, 4, 7, 13, 7
b) 5, 3, 4, 5, 7, 3, 5, 6, 3
c) 31, 11, 12, 19
o de posición
5. Relación entre media, mediana y moda
• Si la distribución de frecuencias es simétrica, entonces, la media, la
mediana y la moda tienen el mismo valor.
2. Si la distribución es asimétrica de cola a la derecha, entonces, la moda es

menor que la mediana y esta a su vez es menor que la media.
o de posición
3. Si la distribución es asimétrica de cola a la izquierda, entonces, la media es
menor que la mediana y esta a su vez es menor que la moda.
4. Para distribuciones unimodales y asimétricas, se tiene la siguiente relación

empírica:
X  Mo  3 ( X  Me )
5. Los tres promedios pueden calcularse para distribuciones de frecuencias
con intervalos de diferente longitud, siempre que puedan determinarse las
marcas de clase.
Medidas de Tendencia Central o de
posición
Ejemplo.
Los ingresos quincenales en dólares (variable X) de 45 personas son:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
a) Construir la distribución de frecuencias (Límites declarados, Límites
exactos, marcas de clase, frecuencias relativas y frecuencias acumuladas).
b) Calcular la media aritmética para datos no tabulados y tabulados.
c) Calcular la mediana para datos no tabulados y tabulados.
d) Calcular la moda para datos no tabulados y tabulados.
e) Interprete estas medidas, qué puede decir.
Medidas de Tendencia Central o de
posición
La inversión anual, en miles de bolívares, de una muestra de 40
pequeñas empresas fueron:
31 17 27 20 28 10 34 25 4 24
15 39 18 30 41 26 12 46 18 23
36 19 29 37 33 27 27 24 26 31
25 28 33 28 22 23 31 29 35 21
a) Construir la distribución de frecuencias considerando 8 clases (Límites

declarados, Límites exactos, marcas de clase, frecuencias relativas y
frecuencias acumuladas).
b) Calcular la media aritmética para datos no tabulados y tabulados.
c) Calcular la mediana para datos no tabulados y tabulados.
d) Calcular la moda para datos no tabulados y tabulados.
e) Interprete estas medidas, qué puede decir.
Medidas de Posición
Las medidas de posición, son aquellas que localizan la posición de
algún dato en relación a otros. Entre estas medidas están: Percentiles, Deciles y
Cuartiles.
Estas medidas son conocidas como Cuantiles, ya que dividen al conjunto de

datos en 2, 4, 10 ó 100 partes iguales.
Definición 1.
Percentil:
Se obtienen al dividir la serie o distribución de datos en 100 partes iguales. Esta

división se hace a partir de los porcentajes acumulados. Un Percentil es un punto
por debajo del cual se encuentra un determinado porcentaje de casos.
Medidas de Variabilidad o Dispersión
¿Por qué se necesitan las medidas que estudiaremos?
Las medidas de tendencia central no son suficientes para describir un conjunto

de valores de alguna variable estadística.
En primer lugar se necesita una medida del grado de dispersión o variabilidad

con respecto al centro con la finalidad de ampliar la descripción de los datos o de
comparar dos o más series de datos.
En segundo lugar se necesita una medida del grado de asimetría o deformación

en ambos lados del centro de una serie de datos, con el fin de describir la
distribución de los datos. Esta medida se denomina índice de asimetría.
En tercer lugar se necesita una medida que nos permita comparar el

apuntamiento o curtosis de distribuciones simétricas con respecto a la
Distribución simétrica Normal. Esta medida se denomina índice de apuntamiento
o curtosis.
Medidas de Variabilidad o
Dispersión
Definición 1.
Rango o recorrido de una variable:

El Rango de una serie de datos, es la diferencia entre sus valores
máximo y mínimo.
R  X max  X min
Es una medida fácil de calcular, pero muy inestable ya que depende de los
valores extremos. Su valor puede cambiar grandemente si se añade o elimina
un solo dato. Muchas veces no da una verdadera idea de la dispersión de los
datos.
Definición 2.
Rango Intercuartil:
El RI en un conjunto de datos, es la diferencia entre los cuartiles
tercero y primero.
RI  Q 3  Q 1
Es una medida que excluye el 25% más alto y el 25% más bajo,
dando un rango dentro del cual se encuentra el 50% central de los datos y a
diferencia del rango total no se encuentra afectada por valores extremos.
Si RI es pequeño describe alta uniformidad o poca variabilidad en los
datos respecto a los valores centrales.
Desviación estándar (s):
s 
2
Es la raíz cuadrada positiva de la varianza s . Es el
índice de dispersión o variabilidad más común y de mayor confianza.
Cálculo de la varianza:
1. Varianza para datos no tabulados:
n n N N
 x  x   x  
2 2
 
2 2
i
x i
x
i i
i 1 i 1 i 1 i 1
    
2 2
s    x
2 2
n 1 n N N
2. Varianza para datos tabulados:

n n
 xi x 
2

2
fi fi xi
s    x
2 i 1 i 1 2
n 1 n
Medidas de Variabilidad o
Dispersión
3. Varianza de datos por intervalos de clases:
K K
 fi xm i  x  
2 2
fi xm i
s    x
2 i 1 i 1 2
n 1 n
Medidas de variabilidad o
dispersión
Definición 5.
Coeficiente de variación:
Es una medida de dispersión relativa (libre de unidades de
medidas), que se define como la desviación estándar dividido por la
media aritmética.
s
C .V  ó en %
x
El C.V se utiliza para comparar la variabilidad de dos o más datos
que tengan medias iguales o diferentes o que tengan unidades de
medidas iguales o diferentes.
Medidas de Asimetría o de Sesgo
Una distribución de datos puede ser simétrica, asimétrica o sesgada. Es simétrica
cuando queda dividida en dos partes iguales a ambos extremos de la media
aritmética.
Es asimétrica cuando los datos se concentran en forma desproporcionada a

ambos lados de la media aritmética.
La asimetría o sesgo, es un coeficiente que indica en que medida y hacia que

extremo del promedio de los datos se concentra el mayor porcentaje de
datos.
El coeficiente o índice de asimetría se puede calcular de la siguiente forma:
3  X  Me 
1. Formula de Pearson:
As 
s
Medidas de Asimetría o de Sesgo
El coeficiente o índice de asimetría se puede calcular de la siguiente forma:
2. Formula usando percentiles:
X P  2X p  X p
As 
90 50 10
XP  X p
90 10
Interpretación:
 Si As = 0 la distribución de los datos es simétrica.
 Si As > 0 la distribución es asimétrica positiva o sesgada a la derecha.
 Si As < 0 la distribución es asimétrica negativa o sesgada a la izquierda.
Simétrica Asimetría positiva Asimetría negativa

Curtosis
Coeficiente de curtosis:
Es un estadístico que señala el mayor o menor grado de elevación o
aplastamiento de una distribución, en su centro, comparándola con la distribución
normal. Por lo tanto, la curtosis indica el grado de dispersión o concentración de
los datos alrededor de la mediana en cualquier distribución.
Tipos de curtosis:
1. Cuando la distribución tiene mayor punta en el centro que una curva normal
se denomina Leptocúrtica.
2. Cuando la distribución sea más aplastada que la normal se denomina
Platicúrtica.
3. Cuando la distribución de los datos tenga la misma forma que la normal, se
denomina Mesocúrtica.
Curtosis
La curtosis se puede calcular de la siguiente forma:
Formula usando percentiles:

XP  X p
Cu 
75 25

2 XP  X p
90 10

Esta medida sólo puede usarse cuando la distribución de los datos es
simétrica, si existe asimetría en los datos su uso carece de sentido.
Una vez encontrado el valor de la curtosis, se compara con el valor

correspondiente al de una distribución normal (0.263).
Interpretación:
 Si Cu < 0.263 la distribución es Leptocúrtica.
 Si Cu > 0.263 la distribución es Platicúrtica.
 Si Cu = 0.263 la distribución es Mesocúrtica.
BOXPLOT – DIAGRAMA DE CAJA
 Es un gráfico representativo de las distribuciones de un conjunto de
datos en cuya construcción se usan cinco medidas descriptivas de
los mismos, a saber: mediana, primer cuartil, tercer cuartil, valor
máximo y valor mínimo.
 Esta presentación visual, asocia las cinco medidas que suelen

trabajarse de forma individual. Presenta al mismo tiempo,
información sobre la tendencia central, dispersión y simetría de
los datos de estudio. Además, permite identificar con claridad y de
forma individual, observaciones que se alejan de manera poco
usual del resto de los datos. A estas observaciones se les conoce
como valores atípicos.
 Por su facilidad de construcción e interpretación, permite también

comparar a la vez varios grupos de datos sin perder información ni
saturarse de ella. Esto ha sido particularmente importante a la hora
de escoger esta representación para mostrar la opinión de los
estudiantes respecto a la actuación docente a través de las diversas
preguntas del instrumento utilizado.
BOXPLOT – DIAGRAMA DE CAJA
1.-Límite superior: Es el extremo superior del bigote. Las opiniones por
encima de este límite se consideran atípicas.
2.-Tercer cuartil (Q3): Por debajo de este valor se encentran como máximo
el 75% de las opiniones de los estudiantes.
3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos

partes iguales. De este modo, 50% de las observaciones están por
debajo de la mediana y 50% está por encima.
4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como máximo
el 25% de las opiniones de los estudiantes
5.-Límite inferior: Es el extremo inferior del bigote. Las opiniones por

debajo de este valor se consideran atípicas.
6 .-Valores atípicos: Opiniones que están apartadas del cuerpo principal de

datos. Pueden representar efectos de causas extrañas, opiniones
extremas o en el caso de la tabulación manual, errores de medición o
registro.
7.-Media aritmética: Originalmente no forma parte del boxplot, sin

embargo, se consideró su inclusión para dar una idea del puntaje
general obtenido por pregunta.
BOXPLOT – DIAGRAMA DE
CAJA

Estadistica Descriptiva

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Descriptiva

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL EXPERIMENTAL POLITECNICA

“ANTONIO JOSÉ DE SUCRE”

Ing. Greiza Lucena

Población: es el conjunto de características o conjunto de medidas que pueden

Muestra: Es un subconjunto de la población y por tanto será también un conjunto

Estadístico, Estadística o Estadígrafo: es una función de la muestra y se calcula

Parámetro: es un valor que recoge un comportamiento específico de la población,

Variable: Es toda medida discreta o continua definida a partir del universo

La Distribución de Frecuencias: Consiste en agrupar

Para saber cómo presentar y describir la información en

 Datos sueltos: son los datos recolectados que no han sido

 Ordenación: es un conjunto de datos numéricos en orden

 Datos agrupados: son los datos organizados y

 Clases o categorías: Es una escala de clasificación

 Límites de clases declarados Tabla 1. Salarios semanales de 110

 Delimita los límites inferiores (LI) de los

 Delimita los límites superiores (LS): los límites

1. Una vez determinados los límites exactos, se restan los límites

 Marca de Clase: Es el punto medio de dicho intervalo, que se

 Un investigador desea determinar cómo varían las estaturas de las

Construir una tabla de distribución de frecuencias de los diámetros y

 Absolutas: indican la cantidad de elementos

 Frecuencias absolutas acumuladas (Fa): indican la cantidad

a) Ascendentes (Fa↑): es la cantidad de datos acumulados

b) Descendente (Fa↓): es la cantidad de datos acumulados

 Frecuencias relativas acumuladas: indican la proporción de datos

b) Descendente (Ha↓): es la proporción de datos acumulados a partir

Salario Límites verdaderos Número de Frecuencia Frecuencia

Los datos pequeños o tabulados o pocos variables se pueden

Gráficos de barras simples: son aquellos que representan una sola

 HISTOGRAMA: Es una gráfica de barras rectangulares verticales

Pasos para la construcción:

Eje vertical Nombre

4. Se levantan perpendiculares por los límites de cada clase hasta la

Grafica 1. Histograma de estaturas en pulgadas

Grafica 2. Polígono de estaturas en pulgadas.

Denominada simplemente media, representa el valor hacia donde tiende un

1. Sólo depende del número de datos ordenados y no de la magnitud de los

2. La mediana siempre se puede calcular para distribuciones de frecuencia con

3. Puede ser calculada para variables con valores en escala ordinal.

Encontrar la moda en los siguientes conjuntos de datos:

2. Si la distribución es asimétrica de cola a la derecha, entonces, la moda es

4. Para distribuciones unimodales y asimétricas, se tiene la siguiente relación

a) Construir la distribución de frecuencias considerando 8 clases (Límites

Estas medidas son conocidas como Cuantiles, ya que dividen al conjunto de

Se obtienen al dividir la serie o distribución de datos en 100 partes iguales. Esta

¿Por qué se necesitan las medidas que estudiaremos?

Las medidas de tendencia central no son suficientes para describir un conjunto

En primer lugar se necesita una medida del grado de dispersión o variabilidad

En segundo lugar se necesita una medida del grado de asimetría o deformación

En tercer lugar se necesita una medida que nos permita comparar el

Rango o recorrido de una variable:

2. Varianza para datos tabulados:

Es asimétrica cuando los datos se concentran en forma desproporcionada a

La asimetría o sesgo, es un coeficiente que indica en que medida y hacia que

El coeficiente o índice de asimetría se puede calcular de la siguiente forma:

2. Formula usando percentiles:

Simétrica Asimetría positiva Asimetría negativa

Formula usando percentiles:

Una vez encontrado el valor de la curtosis, se compara con el valor

 Esta presentación visual, asocia las cinco medidas que suelen

 Por su facilidad de construcción e interpretación, permite también

3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos