Está en la página 1de 23

1.

3 Estadística descriptiva

 000016993@alumnos.univer-gdl.edu.mx
 Ingeniería en Sistemas Computacionales.
 Adrian Zuno Gomez.
 Universidad Univer Tlaquepaque.
 Tercer Cuatrimestre.
 Probabilidad y estadística
Objetivo:

Participar en el aprendizaje de la implementación de las estadísticas descriptivas

Instrucciones:

1. Participa con base en la lectura y el estudio, previos a la actividad


de buscar en biblioteca digital lo referente a estadística descriptiva
2. Realizar un resumen

 Varianza
 Desviación estándar
 Gráficas
 Diagrama de barras
 Diagrama de dispersión
 Diagrama circular
 Histograma

1. Convierte tu documento a formato PDF y nómbralo con Apellido_Nombre


2. Por último, sube tu documento a la plataforma en la fecha señalada
¿Qué es la estadística descriptiva?

La estadística descriptiva es un tipo de estadística que trata


de condensar o resumir todos los datos o características de una serie de valores,
para describir determinados aspectos de la serie, siendo también identificada como
estadística deductiva.

Este método constituye un modo relativamente sencillo y eficiente de resumir y


caracterizar datos, ofreciendo una manera adecuada de presentar la información
recopilada.

La estadística descriptiva formula recomendaciones de cómo resumir, de


forma clara y sencilla, los datos de una investigación en cuadros, tablas, figuras o
gráficos. Antes de realizar un análisis descriptivo, es primordial precisar el o
los objetivos de la investigación, así como identificar las escalas de medición de las
distintas variables objeto de estudio.

En la estadística descriptiva, cuando se obtienen los datos de una investigación, es


necesario condensar los mismos y resumirlos a través de uno o varios valores que
determinen los principales caracteres del fenómeno que se estudia. Las medidas
que forman este tipo de métodos estadísticos son las que logran dicho resumen.

Instrumentos o medidas de la estadística descriptiva

Las principales medidas de la estadística descriptiva son las siguientes:

 Razones, tasas y porcentajes: son medidas relativas que condensan


información sobre la incidencia de una característica entre un grupo
de unidades
 Distribución de frecuencia: forma de agrupación de los datos, en la cual
estos se presentan en clases y cada clase exhibe su respectiva frecuencia.
 Medidas de posición o de tendencia central: se dividen en promedios
matemáticos: el aritmético, el geométrico y el armónico; y promedios
no matemáticos: la mediana y la moda.
 Medidas de dispersión: para las variables cuantitativas, las medidas de
dispersión que se pueden identificar son la desviación media, la desviación
estándar o desviación típica, los rangos intercuartílicos y los valores
mínimos y máximos.
 Varianza

Se conoce como varianza a la raíz cuadrada que se desprende de una desviación


estándar, la cual permite que las industrias de manufactura puedan trabajar con
precisión en su producción y reduzcan su índice de errores.

La varianza toma los datos dispersos de la media y, luego de medirlos, le da valor a


las variaciones y desviaciones. Además, permite contabilizar y prevenir posibles
errores.

La varianza en estadística es la media de dispersión utilizada para representar las


desviaciones existentes entre un conjunto de datos con relación al promedio o la
media de los mismos, es decir, la sumatoria de estos elevados al cuadrado dividido
entre el total de observaciones.

La varianza, junto con la desviación estándar, son medidas de dispersión de datos u


observaciones. La dispersión de estos datos indica la variedad que estos presentan,
es decir, si todos los valores en un conjunto de datos son iguales, entonces no hay
dispersión, pero en cambio, si no todos son iguales entonces hay dispersión.

Fórmula para calcular la varianza

Ejemplo de varianza

Para entender mejor este concepto, proponemos el ejemplo de una empresa que
quiere calcular la varianza de las toneladas de alimento que ha vendido en los
últimos 6 meses
MES CANTIDAD VENDIDA
ENERO 18
FEBRERO 20
MARZO 20
ABRIL 22
MAYO 20
JUNIO 20

El primer paso para calcular la varianza consiste en calcular la media aritmética


(el promedio). Esta se obtiene teniendo en cuenta que la cantidad de valores a
analizar son 6 (los últimos 6 meses):

(18 + 20 + 20 + 22 + 20 + 20) / 6 = 20

Una vez obtenida la media aritmética, en este caso 20, procedemos a calcular
la varianza, utilizando la fórmula antes mencionada:

2 2 2 2 2 2
σ²= [(18-20) + (20-20) + (20-20) + (22-20) + (20-20) + (20-20) ] / 6 = 1,33

De esta manera, obtenemos una varianza (σ²) de 1,33.

 Desviación Estándar

La desviación estándar, también conocida como desviación típica, es una medida


que se utiliza en la estadística para indicar la dispersión o variación de un conjunto
de datos.

Específicamente, su cálculo se basa en medir la relación de los datos con respecto a


la media, para lo cual se usa la raíz cuadrada de la varianza.

Se trata de la medida de dispersión más común, por lo que se emplea con


frecuencia en distintos ámbitos como en la medicina, para estadísticas
poblacionales, entre muchas otras aplicaciones.

En el campo de las finanzas es un método que ayuda a comprender y medir los


niveles de volatilidad del mercado para predecir las tendencias en los movimientos
financieros.

Matemáticamente, su significado es que, a mayor distancia de los datos con


respecto a la media, mayor será la dispersión de la población.
Formulas

La fórmula general para conocer la desviación estándar es la siguiente:

 Desviación estándar poblacional:

 Desviación estándar muestral:

En esta fórmula se puede sustituir “DE” por σ si el cálculo se basa en la población o


por S si se basa en la muestra.

Además, cada expresión tiene el siguiente significado:

 ∑ = es la sumatoria de todos los datos.


 X = es cada uno de los datos del conjunto.
 X̅ = se refiere a la media de los datos.
 N = es el número total de los datos analizados.
 σ: Desviación estándar Poblacional.
 s: Desviación estándar Muestral.
Ejemplo Desviación estándar muestral

Un profesor enseña a dos grandes grupos de introducción al marketing


y selecciona aleatoriamente una muestra de calificaciones de los
exámenes realizados por los dos grupos. Halle la desviación típica de
cada muestra:

1. Grupo 1: 50, 60, 70, 80, 90


2. Grupo 2: 72, 68, 70, 74, 66

De acuerdo a los datos del problema tenemos:

Datos = 50, 60, 70, 80, 90


Σxᵢ = 350
N=5
x̄ = 350/5 = 70

xi xi – x̄ (xi – x̄ )2
50 -20 400
60 -10 100
70 0 0
80 10 100
90 50 400
Σxᵢ = 350 x̄ = 350/5 = 70 Σ (xᵢ – x̄ ) ² = 1000

Finalmente calculamos la desviación estándar muestral:

Ejemplo Desviación estándar poblacional


Un maestro quiere saber si la mayoría de los estudiantes se están desempeñando
al mismo nivel o si hay una desviación estándar alta, para lo cual tomó un examen
sorpresa con los siguientes resultados: 85, 86, 100, 76, 81, 93, 84, 99, 71, 69, 93,
85,
81, 87 y 89.

De acuerdo a los datos del problema tenemos:

Σxᵢ = 1279
N = 15
x̄ = 1279/15 = 85.2667

xi xi – x̄ (xi – x̄ )2
85 -0.2667 0.0711
86 0.7333 0.5377
100 14.7333 217.0701
76 -9.2667 85.8717
81 -4.2667 18.2047
93 7.7333 59.8039
84 -1.2667 1.6045
99 13.7333 188.6035
71 -14.2667 203.5387
69 -16.2667 264.6055
93 7.7333 59.8039
85 -0.2667 0.0711
81 -4.2667 18.2047
87 1.7333 3.0043
89 3.7333 13.9375
Σxᵢ = 1279 x̄ = 1279/15 = 85.2667 Σ(xᵢ – x̄ )² =
1134.9329

Finalmente calculamos la desviación estándar poblacional:


 Gráficas

Las gráficas son una forma de mostrar información mediante la utilización de un


dibujo, que le concede al espectador una manera fácil de comprender lo que se
intenta exponer. Además, son de gran utilidad cuando se tienen que publicar
estadísticas, comparar cantidades y expresar tendencias, dado que los datos que
presentan son usualmente numéricos.

En términos generales, la palabra gráfico se refiere a la escritura o impresión y todo


lo relacionado con ellos. Pero también, por gráfico, se entiende la representación
de datos, casi siempre numéricos, aunque también pueden ser figuras o signos, a
través de líneas superficiales o símbolos para determinar la relación que mantienen
entre sí.

¿Para qué sirve una gráfica?

Las gráficas sirven para presentar de forma visual datos sobre el comportamiento
de una o más variables, de las cuales se tiene una gran cantidad de información
numérica recolectada, en relación a un margen de tiempo u otro tipo de datos.

La facilidad con la cual se interpretan los datos representados en un gráfico, con


respecto a una tabla numérica, hace que sean de gran utilidad para muchos
sectores, que van desde el estudiantil hasta el empresarial. Esto se debe en gran
medida a la posibilidad que ofrecen de acceder a grandes bloques de información
de manera rápida, por medio de una representación visual.

Características de las graficas

Estas son algunas características de las gráficas:

 Logran captar la atención del lector fácilmente, debido a que presentan gran
cantidad de información numérica en un formato fácil de interpretar por
cualquier lector.
 Generalmente se componen, como mínimo, de un gráfico y un texto. El
gráfico representa las variables, y el texto la escala de valores o datos,
así como también describe la razón por la cual fue creada la gráfica.
 La mayoría de las gráficas se construyen sobre dos ejes, uno horizontal
llamado X, y otro vertical llamado Y, sobre los cuales se dispone una
escala de valores dividida gradualmente.
 En algunos casos se pueden agregar líneas entre los ejes para facilitar
la visualización del gráfico.
 El nombre de la variable medida se indica en cada uno de los ejes. Esto
se hace para dar claridad sobre la información presentada.
 Facilitan la comparación de datos, además son de utilidad a la hora
de indicar tendencias y diferencias estadísticas.

Tipos de graficas con ejemplos

Los tipos de gráficas más comúnmente utilizados son:

Barras

Su lectura y comprensión es sencilla, dado que únicamente se componen de dos


ejes, uno vertical o eje Y, y otro horizontal o eje X. Sobre uno de los ejes se ubican
los artículos que se desea comparar, y sobre el otro se presentan los valores de
cada uno.

Histograma
Son una derivación de los gráficos de barras, la diferencia que tienen es que en
este tipo de gráfico se ve solamente la alteración de una variable con respecto a
los datos que se estén analizando.
Circular

Los gráficos circulares, también llamados de torta, representan los porcentajes de


un total. Se realizan dividiendo una circunferencia en porciones, donde el tamaño
de cada porción está proporcionalmente relacionado con el porcentaje que se
desea mostrar.

Gráfico de líneas
Al igual que los gráficos de barras, estos se construyen sobre dos ejes.
Normalmente, el eje X corresponde a una medida de tiempo, y el eje Y a los
cambios de la otra variable.

Se confeccionan marcando puntos en las alturas correspondientes al cruce de las


dos variables de análisis. Estos puntos se unen mediante una línea, lo que facilita al
observador su lectura.

 Diagramas de barras

Un diagrama de barras es una forma de representar gráficamente un conjunto de


datos. Un diagrama de barras es una representación en dos dimensiones de la
frecuencia, ya sea absoluta o relativa, de una variable cuantitativa o cualitativa pero
siempre discreta y distribuida en filas.

Este tipo de gráficos están formados por barras rectangulares de longitudes


proporcionales a los valores que representan.

En otras palabras, un diagrama de barras es la representación de una variable


discreta a través de columnas horizontales o barras.

¿Para que sirve un diagrama de barras?

Los diagramas de barras sirven para comparar dos o más valores.

Elementos que lo componen, está compuesto por dos ejes:

 Eje de abscisas o eje horizontal, representado con la letra x;


 Eje de ordenadas o eje vertical, representado con la letra y.

En el eje de abscisas se colocan los valores de la variable. Una variable es una


característica o cualidad de un individuo o elemento que puede adquirir diferentes
valores que pueden medirse. Por ejemplo, la edad de una persona, su color de
pelo, el lugar de nacimiento, su estatura, etc. Las variables pueden
ser cualitativas, si no pueden ser calculadas con números: por ejemplo, el color de
pelo (rubio, moreno, etc.), el lugar de nacimiento (Madrid, Barcelona, Valencia, etc.).
Si pueden ser medidas con números, se llaman cuantitativas (la altura, el peso, la
cantidad de personas que viven en un lugar, etc.)
En el eje de ordenadas se colocan las barras proporcionales a la frecuencia del
dato. La frecuencia es la cantidad de veces que la variable se repite durante un
experimento o muestra estadística. Pongamos un ejemplo: hacemos una
encuesta a un grupo de 110 personas y les preguntamos su color de pelo; 50
nos responden que tienen el pelo negro, 3o castaño, 20 rubio y 10 son
pelirrojos.
Entonces tendremos que la frecuencia de la variable «negro» es 50; la de la
variable «castaño» es 30, etc. El diagrama sería así:

Tipos de diagrama de barras

Existen diferentes tipos de gráficas de barras:

 Gráfico de barras sencillo

Representa los datos de una única serie o conjunto de datos. Los ejemplos que
hemos visto hasta ahora son de este tipo.

Gráfico de barras agrupado


Compara los datos de dos o más series o conjuntos de datos. Supongamos que
hemos hecho la encuesta sobre los deportes favoritos en dos clases de primaria,
la segunda y la tercera.

 Diagrama de dispersión

El diagrama de dispersión, o gráfico de dispersión, es un tipo de diagrama


estadístico en el que se representa gráficamente un conjunto de datos de
dos variables en dos ejes de coordenadas cartesianas.

Por lo tanto, los diagramas de dispersión sirven para analizar la relación entre dos
variables estadísticas.

Los diagramas de dispersión reciben varios nombres diferentes, tales


como diagrama de correlación o nube de puntos.

Cabe destacar que el diagrama de dispersión se considera como una de las


herramientas básicas de control de calidad, junto con el diagrama de Pareto, el
diagrama de causa-efecto, el diagrama de flujo, etc.

 Como hacer un diagrama de dispersión


1) Recolectar los datos estadísticos de la muestra que se quiere analizar. Ten
en cuenta que para poder hacer un diagrama de dispersión debe haber
como mínimo dos variables cuantitativas.
2) Representar los dos ejes del gráfico de dispersión.
3) Determinar las dos variables estadísticas que se representarán gráficamente.
4) Calibrar la escala de cada eje de la gráfica. Para ello, se recomienda
encontrar primero el mínimo y el máximo de cada variable y, a partir
de estos valores, graduar cada eje.
5) Representar cada pareja de datos en el diagrama de dispersión con
un punto.
6) Analizar e interpretar el diagrama de dispersión obtenido.

Ejemplo de diagrama de dispersión

Después de ver la definición de diagrama de dispersión y la teoría sobre cómo se


hace, en este apartado se representa un diagrama de este tipo a modo de ejemplo.

En la siguiente tabla de frecuencia, se han recogido como datos las notas de


matemáticas y estadística de una muestra de 20 alumnos. Representa el conjunto
de datos en un diagrama de dispersión y analízalo.

Para representar la serie de datos en un diagrama de dispersión simplemente


debemos dibujar dos ejes, calibrarlos y representar un punto en la gráfica para
cada pareja de datos. Recuerda que un punto en una gráfica se pone donde se
cortan las rectas imaginarias correspondientes a cada uno de sus valores.
Cada eje del diagrama de dispersión representa una variable. En concreto, el eje
horizontal pertenece a la nota conseguida en matemáticas y, por otro lado, el eje
vertical corresponde a la nota obtenida en estadística.

Ventajas y desventajas del diagrama de dispersión

Ventajas

 Resulta bastante fácil representar una serie de datos en un diagrama de


dispersión.
 El diagrama de dispersión permite analizar de manera visual la relación entre
dos variables, lo que facilita extraer conclusiones.
 Los gráficos de dispersión también pueden utilizarse en un
estudio estadístico exhaustivo como una exploración previa de los
datos.
Desventajas

 Este tipo de diagramas no son útiles para representar variables cualitativas.


 La interpretación de un diagrama de dispersión puede llevar a
una conclusión errónea de causa-efecto entre dos variables.
 Los diagramas de dispersión no permiten analizar la relación entre más
de dos variables.

 Diagrama circular

Un gráfico circular es una representación en una dimensión utilizada para percibir


de una forma más rápida el peso o la proporción de las categorías sobre la
frecuencia total.

En otras palabras, un gráfico circular es la representación de la frecuencia


relativa de las categorías de una variable, tanto cualitativa como cuantitativa. No
obstante, y a pesar de lo mencionado anteriormente, debemos destacar que el
gráfico circular puede representar también frecuencias absolutas.

Consiste en partir el circulo en porciones proporcionales a la frecuencia relativa


entiéndase como porción la parte del circulo que representa a cada valor que toma
la variable.

Los diagramas circulares muestran la importancia relativa de las diferentes


cantidades. Cada elemento o categoría recibe un segmento en proporción de
su importancia relativa.

Ejemplo:

ventajas del grafico circular

Se identifica mucho más rápido las proporciones de las categorías mediante este
gráfico que empleando una tabla.

Desventajas del grafico circular

Si hay muchas categorías nos puede resultar difícil diferenciar entre ellas y puede
llegar al punto de no ser agradable para la vista. El siguiente gráfico es un ejemplo
de esta desventaja, aunque añadimos los porcentajes de representación de cada
categoría, no es agradable y está lejos de ayudarnos a comprender la información.
 Histograma

El histograma es la representación gráfica de un grupo de datos estadísticos. Estos,


agrupados en intervalos numéricos o en función de valores absolutos.

El histograma es entonces un gráfico que permite mostrar cómo se distribuyen los


datos de una muestra estadística o de una población. Esto, respecto a alguna
variable numérica.

Un histograma es tipo de diagrama estadístico en el que se representa un conjunto


de datos estadísticos mediante barras rectangulares, de manera que cada barra del
histograma es proporcional a su frecuencia correspondiente.

Como hacer un histograma

 Dividir el eje horizontal del histograma en intervalos según la serie


de datos.
 Representar los valores de las frecuencias de los intervalos en el
eje vertical del histograma.
 Para cada intervalo, dibujar una barra rectangular con una altura
equivalente a la frecuencia del intervalo. Ten en cuenta que las barras
de dos intervalos consecutivos deben tocarse.

Ejemplo de histograma

Supongamos que tenemos los siguientes datos de los alumnos de un salón de


clase en la universidad.

Estatura Número de alumnos


Menos de 1.50 cm 2
1,50-1,60 12
1,60-1,70 20
1,70-1,80 22
1,80-1,90 10
más de 1,90 2

Entonces, el histograma se podría construir de la siguiente manera:


Características de un histograma

Cabe señalar que el histograma se construye cuando la variable de estudio (la del
eje horizontal) es cuantitativa. En cambio, si fuera cualitativa, se elaboraría de
preferencia un diagrama de barras o un gráfico circular.

Debemos tomar en cuenta además que la variable de estudio u observación no


necesariamente es continua, como el peso o la altura. Así, puede ser, como en el
caso de la edad, que solo toma valores enteros (No se suele decir que alguien tiene
1,5 años).

El histograma de frecuencia relativa es un tipo de histograma en el cual se


representan las frecuencias relativas del conjunto de datos. Es decir, en lugar de
graficar las frecuencias absolutas se representan las frecuencias relativas.
Histograma de frecuencias absolutas acumuladas.

Evidentemente, para graficar un histograma de frecuencias absolutas acumuladas,


primero tenemos que determinar las frecuencias absolutas acumuladas de cada
intervalo. Para ello, sumamos todas las frecuencias absolutas anteriores a cada
intervalo más la frecuencia absoluta del intervalo en cuestión:

Combinar el histograma con un polígono de frecuencias

En ocasiones, en estadística se combina el histograma con un polígono de


frecuencias, que es un conjunto de puntos unidos por líneas rectas. De este modo,
se indica con mayor claridad la evolución de los datos, ya que la línea del polígono
de frecuencias permite visualizar mejor la progresión de la serie de datos.
Para combinar estos dos tipos de diagramas estadísticos, simplemente se debe
marcar un punto en el medio de la cima de cada barra rectangular del histograma y
luego unir los puntos consecutivos mediante líneas rectas.

Conclusión

En el análisis de varianzas se estudian las diferencias significativas entre dos o más


medias de una muestra. Este análisis comúnmente nos permite determinar también
si esas medias provienen de una misma población (puede ser el número total de
empleados de una empresa), o si las medias de dos poblaciones son iguales.

Al denominar las medidas de dispersión que son calculo del rango, varianza
desviación estándar coeficiente de variación para la elaboración mas
detalladamente de problemas mas complicados y se concluyeron la
correspondiente solución de problemas mas complicados y se concluyeron la
correspondiente solución de problemas de medidas de dispersión haciendo énfasis
también es sus conceptos se debe recordar estas teorías para la solvencia de
problemas mas complicados y algunos de origen laboral.

Pese a que el análisis estratégico es olvidado cuando nos proponemos iniciar un


nuevo proyecto, es el área que facilitará la supervivencia del negocio en el
mercado, por lo que nunca debemos dejar de lado este análisis
El gráfico de barras nos permite observar de forma sencilla el comportamiento de
una variable, por ejemplo, en un grupo de datos cual fue el más frecuente, que más
tuvo más ingresos, cual fue una tendencia mayor o menor.

El diagrama circular este método se basa en algunas aproximaciones que hemos


utilizado para dibujar el diagrama circular y, además, también hay algún redondeo
de los valores. Entonces, aunque hay algún error en este método, aún nos puede
dar una buena aproximación de los resultados.

En conclusión, podemos decir que el histograma es una de las herramientas


gráficas más útiles que tenemos a nuestro alcance, ya que nos permite analizar
rápidamente una gran cantidad de datos. Es muy fácil de entender e interpretar.
Además, también es posible realizar muchas estadísticas en ellos.
Referencias

Ricardi, F.Q (2011) (s. f.). https://enciclopediaeconomica.com/varianza/

Desviación estándar (Investopedia (2022)., Trad.). (s. f.).


https://conceptoabc.com/desviacion-estandar-tipica/

EJEMPLOS DE LA DESVIACIÓN ESTÁNDAR. (s. f.).


https://www.plandemejora.com/ejemplos-desviacion-estandar/

Graficas. (2020, 22 julio). Recuperado 22 de septiembre de 2022, de


https://www.lifeder.com/graficas/

Diagrama de barras: ¿qué es y cómo se hace? (2022, 30 julio). Recuperado 22 de


septiembre de 2022, de https://www.pequeocio.com/diagrama-de-barras/

Diagrama de dispersión. (2022, 3 marzo). Recuperado 22 de septiembre de 2022,


de https://www.probabilidadyestadistica.net/diagrama-de-dispersion/

Gráfico circular. (2021, 6 enero). Recuperado 22 de septiembre de 2022, de


https://economipedia.com/definiciones/grafico-circular.html

Histograma. (2020, 29 julio). Histograma. Recuperado 22 de septiembre de 2022,


de https://economipedia.com/definiciones/histograma.html

También podría gustarte