Está en la página 1de 34

Escuela de Postgrado

Maestría:
Maestría en dirección financiera
Participantes:
Vanessa Báez 2020-
Laura Duran 2020-
Adonay Núñez 2020-
Lorena Navarro 2020-01232
Enmanuel Contreras 2020-
Kiancy Medina 2020-
Facilitador:
Elvis Quirino García
Tema:
Probabilidades y estadística
11/03/2020
Estadística

1- Realizar una encuesta con los empleados de UAPA donde muestre la intención de
votos para las elecciones de este 15 de marzo.

Según nuestra investigación decidimos seleccionar el personal de UAPA donde se


mostrará la cantidad de empleados, que cantidad de hombres y mujeres van a votar, la
investigación entre cada uno de ellos de quienes van a votar, una muestra del personal
y las respuestas obtenidas.

Nombre Sexo Votará PARTIDO


Lorena F SI PRM
Emely F SI PLD
Jennifer F NO
Mercedes F SI PRM
Gerald M NO
Perla F SI PLD
Edward M NO
Johan M SI PLD
Noely F SI PLD
Altagracia F SI PRM
Vanesa F SI PRM
Luisa F NO
Gabriela F SI PRM
Erick M SI PLD
Eula F SI PRM
Carmen F SI PRM
Luz F SI PRM
Jessica F SI PRM
18 14 4 14 4 9 5
Gráfico

Mujeres que votarán


Hombres que votará
Personas que votarán
Personas que no votarán
PRM
PLD

Según el grafico muestra:

Las personas que votaran un 30%

Mujeres 26% -Los hombres 4%

Personas que no votaran 9%

Partido con más voto PRM 20% - PLD 11%

Fundamentos de estadística
Fundamentos de Estadística
Sobre estadística se presentan diversos conceptos; por tal razón les presento los
siguientes conceptos sobre estadística:
 La estadística es una rama de las matemáticas que se ocupa de reunir,
organizar y analizar datos numéricos y que ayuda a resolver problemas como
el diseño de experimentos y la toma de decisiones.
 La Estadística es la parte de las Matemáticas que se encarga de recoger datos,
organizarlos, tabularlos, representarlos gráficamente, interpretarlos y analizarlos,
para sacar conclusiones, tomar decisiones o predecir, a partir del estudio
o investigación que se esté realizando sobre alguna característica, propiedad o
situación en una población determinada.
División de la estadística

La estadística se divide en dos grandes partes:


Estadística descriptiva: Se encarga de la recolección, descripción, visualización y
resumen de los datos, y que se pueden presentar de forma numérica o de forma
gráfica.
La Estadística descriptiva, se encarga del "estudio sobre la población completa,
observando una característica de la misma y calculando unos parámetros que
den información global de toda la población".
Estadística inferencial: Se encarga de las predicciones relacionadas a los fenómenos
estudiados, considerando la selección de tipo aleatoria y la incertidumbre en las
observaciones.
La Estadística inferencial, "realiza el estudio descriptivo sobre un subconjunto de la
población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda
la población".
Bosquejo histórico de la estadística
Hablar de la historia de la estadística, implica hablar del inicio de la civilización. Existe
una gran diversidad sobre los inicios de la estadística. En este texto, haremos un
recorrido breve sobre el desarrollo de la Estadística.
El término Estadística fue empleado por primera vez por Gottfried Achenwall (1719-
1772), el cual proviene de la palabra de origen italiana "Statistik".
La estadística fue utilizada por los Egipcios para analizar los datos de la población, la
renta (Aproximadamente siglo XXXII A. de C). En el antiguo testamento, primera parte
de la Biblia, se encuentran los libros de "Números" y "Crónicas", donde se pueden
observar algunos registros estadísticos.
El libro de Números contiene dos censos de la población de Israel y el de Crónicas
describe la prosperidad económica de las tribus judías.
En sentido general, los grandes registros estadísticos de la antigüedad, descansan en
censos y cobro de impuestos.
Se registros de que el Imperio romano fue el primero en recopilar gran cantidad de
datos sobre la población, superficie y la renta de todos las comarcas bajo su dominio.
En 1662 se conoce como el primer estudio estadístico de mayor trascendencia sobre
población, el trabajo titulado "Observations on the London Bills of Mortality" (Londres).
Para hablar sobre el desarrollo de la estadística, hay que destacar los aportes de
grandes personalidades de la ciencia. A continuación, se presentan algunas de estas
grandes personalidades:
John Graunt (1620-1674): Es el primer estadístico que se va a considerar como el
padre de la Estadística. En 1662 publicó "Observaciones naturales y políticas",
fundamentado en los boletines de mortalidad, considerándose este documento como el
punto de partida de la estadística.
Thomas Bayes (1702-1761): Sus actividades científicas, fueron las matemáticas y
la inferencia estadística. Después de la muerte de Bayes, Price, recibe de parte de los
familiares de Bayes, escritos sobre matemáticas que Bayes había dejado, para que
Price los estudiara. El trabajo de Bayes demuestra la divergencia de la serie log(n!),
corrigiendo a la de Moivre. El ensayo Bayes determina un intervalo de confianza
bayesiano para el parámetro &µ de una distribución de Bernoulli a partir
de n repeticiones del experimento de Bernoulli.
Laplace (1749-1827): Pierre Simon de Laplace nace en Beaumont-en-Auge. En 1774
publica Memoria sobre la probabilidad de las causas por los sucesos.
Karl Pearson (1857-1936): En 1905 publicó un artículo titulado Sobre la teoría general
de la asimetría, la correlación y la regresión no lineal. Algunas contribuciones de K.
Pearson a la Teoría de la Probabilidad y a la Inferencia Estadística son:
 Introduce su familia de curvas y ajusta sus parámetros, introduciendo
el método de los momentos. Esta familia de curvas son las soluciones de una
ecuación diferencial e incluye a las distribuciones, Beta asimétrica, la Beta simétrica,
la Gamma y la Normal, entre otras.
 Define el coeficiente de correlación lineal precisando las ideas introducidas por
Galton.
 Desarrolla el método de la  de Pearson para medir el ajuste entre unos datos y
una distribución de probabilidad, y lo generaliza a las tablas de contingencia
William Sealy Gosset (STUDENT), (1876-1937): Publica trabajos sobre control de
calidad, la ley de errores, la distribución de los errores.
Algunas contribuciones de (Student) William Sealy Gosset son:
 La demostración de la convergencia de la distribución binomial a la distribución
de Poisson.
 Estableciendo su distribución, donde X es la media muestral y S2, la cuasi
varianza muestral.
 Introdujo la función de potencia de un contraste dado por la región crítica.
Ronald Aylmer Fisher (1890-1962): Escribió "La Fundamentación Matemática de la
Estadística Teórica, introduciendo la noción de modelo estadístico y los conceptos de
consistencia, eficiencia, precisión, validación e información. Desarrolló el análisis de la
varianza y los principios del diseño de experimentos. En 1925 publica su primer libro
titulado "Métodos Estadísticos". En 1930 formula La Teoría Genética de la Selección
Natural. En 1956 publica Métodos Estadísticos e Inferencia Científica.
Aplicaciones de la Estadística
La Estadística se aplica en todas las ramas o áreas de la ciencia
Aplicación de la Estadística en los negocios
La estadística es en el mundo actual una herramienta fundamental para los negocios. A
través de la estadística es posible realizar con efectividad las siguientes tareas:
 Estudios de mercado.
 Estudio del valor de un cliente.
 Predicción de ventas.
 Evaluación de programa.
 Evaluación del territorio de ventas.
 Análisis de:
 Mercadeo directo y promociones.
 Deterioro del cliente.
 Satisfacción del cliente
 Segmentación de mercado.
 Base de datos.
 Productividad de ventas.
 Logros de los empleados.
 Calidad e informes.
 Riesgo crediticio.
 Servicio al cliente.
 Soporte al cliente.
 Diseño de producto.
 Beneficios.
 Toma de decisión para mejorar:
 La calidad.
 El desempeño de una línea de productos.
 El nivel de satisfacción de los empleados.

Distribuciones de frecuencias

Las distribuciones o tablas de frecuencias permiten resumir los datos en una  tabla que
recoge:

• Valores de la variable o modalidades del atributo,


• Frecuencia absoluta o número de veces que aparece cada valor o modalidad en la
muestra,

• Porcentaje de veces que aparece cada valor de la variable o modalidad del atributo
sobre el total de observaciones,

• Porcentaje válido calculado sobre el total de observaciones excluidos los valores


missing.

• Porcentaje acumulado hasta cada uno de los valores de la variable ordenados de


menor a mayor. Este porcentaje tiene interpretación sólo en los casos en que la
variable sea susceptible de medida por lo menos en una escala ordinal.

Para obtener la tabla de frecuencias se procede con el menú:

Analizar
Estadísticos Descriptivos
Frecuencias

En el cuadro de diálogo Frecuencias se seleccionan las variables para las que se


quiere obtener sus correspondientes tablas de frecuencia unidimensional y se trasladan
al cuadro Variables con el botón. Para obtener la distribución de frecuencias debe estar
activada la opción Mostrar tablas de frecuencias. La tabla que aparece en el visor de
resultados no agrupa en intervalos o clases los valores de la variable; si se desea
agruparlos es necesario recodificar previamente la variable (en otra variable) definiendo
los límites de los intervalos*
Además, el cuadro de diálogo Frecuencias permite activar otras opciones con los
botones:

 Estadísticos
 Gráficos
 Formato

Estas opciones pueden utilizarse teniendo o no activada la opción Mostrar tablas de


frecuencias.

Estadísticos

La opción Estadísticos abre un cuadro de diálogo que permite la obtención de las


principales medidas de síntesis o estadísticos de una distribución unidimensional de
frecuencias. Éstos se presentan agrupados en cuatro clases: Valores percentiles,
Tendencia central, Dispersión y Distribución.

• Valores percentiles son aquellos valores de la variable que dividen a la distribución


de frecuencias en partes con igual número de observaciones: así, los cuartiles la
dividen en cuatro partes guales y se obtienen directamente activando la
opción Cuartiles. Si interesan los valores que dividen la distribución en k partes iguales
se activa la opción Puntos de corte para (por defecto 10) grupos iguales, lo que
proporciona los deciles de la distribución. En la opción Percentiles es necesario indicar
cuáles de ellos se desean, incluyéndolos de uno en uno con el botón Añadir.

• Tendencia central permite seleccionar Media, Mediana y Moda de la distribución, así


como la Suma de todos los valores de la distribución.
• Dispersión permite seleccionar las siguientes medidas: Varianza, como resultado del
cálculo de la expresión,  y Desviación típica; el error típico de la media (E.T.media) que

se define como , así como los valores Mínimo y Máximo de la variable y


la Amplitud o recorrido de la variable.

• Por último, en Distribución pueden obtenerse las siguientes medidas relativas a la


forma de la distribución:
coeficiente de Asimetría, error típico de asimetría, coeficiente de Curtosis y error típico
de curtosis, calculadas mediante las siguientes expresiones:

Asimetría 

Error típ. De asimetría 

Curtosis 

Error típ.de curtosis 

Gráficos

Los gráficos asociados a la tabla de frecuencias que recoge del cuadro de


diálogo Frecuencias son: Gráficos de barras, Gráficos de sectores o Histogramas. Para
seleccionar el que interesa se activa la opción Gráficos que abre el siguiente cuadro de
diálogo:

Si la característica objeto de análisis es un atributo los gráficos adecuados son el


gráfico de barras o de sectores; en ambos casos pueden realizarse con frecuencias
absolutas o con relativas seleccionando Frecuencias o Porcentajes, respectivamente.
Si la característica es cuantitativa el gráfico adecuado es el histograma que, a su vez,
puede obtenerse superponiéndole la Curva de la distribución normal activando la
opción correspondiente.  

Formato

Para modificar el aspecto de los resultados, ya sean, tablas o estadísticos, se activa la


opción Formato que abre el cuadro de diálogo siguiente:

Con las siguientes opciones:

• Ordenar por: se puede elegir entre distintos criterios de ordenación de los valores de
la variable en la tabla de frecuencias. Por defecto, los valores aparecen en orden
ascendente; pero también es posible una ordenación descendente o una ordenación
por frecuencias, tanto ascendente como descendente, activando las opciones
correspondientes.

• Múltiples variables: se puede seleccionar el tipo de presentación de los cuadros de


estadísticos cuando se realiza simultáneamente el análisis unidimensional de dos o
más variables. Por defecto, está activada la opción Comparar variables que
proporciona un único cuadro que contiene los estadísticos seleccionados
correspondientes a todas las variables. Si se selecciona la opción Organizar resultados
según variables se obtiene un cuadro de estadísticos para cada variable por separado.

El cuadro Frecuencias: Formato también ofrece la posibilidad de limitar la elaboración


de tablas de frecuencias sólo para Aquellas variables que presentan un número
reducido de valores o categorías. Para ello se debe indicar en el recuadro Suprimir
tablas con más de (por defecto 10) categorías el número de categorías a partir del cual
no se desea la elaboración de la tabla.

 
EJEMPLOS

Ejemplo 1. Con la base de datos Enctran.sav obtener la tabla de frecuencias, el


diagrama de barras y los estadísticos media, mediana, moda, desviación tipo, varianza
y las medidas de forma (asimetría y curtosis) de las variables: Como, Rapi e Inde.

Vamos a realizar la descripción de la variable Como, dejando al lector la descripción de


las variables Rapi e Inde.

Con la secuencia Analizar > Estadísticos Descriptivos > Frecuencias se abre un


cuadro de diálogo donde se selecciona la variable Como; con el botón Estadísticos se
activan las medidas que se desean obtener y con el botón Gráficos se activa la
opción Gráficos de barras.

Se obtienen los siguientes cuadros:


En base a estos resultados se concluye:

- La base de datos no presenta para esta variable ningún valor missing, de forma que
las 114 observaciones son todas válidas.

- Las medidas de posición (media, mediana y moda) indican el valor central de la


distribución, y en este caso aproximadamente coinciden los tres estadísticos en el valor
5. Esto significa que la distribución es bastante simétrica y que la valoración media de
la comodidad del medio de transporte no es ni buena ni mala.

- La desviación típica es 2,52 que sobre una media de 5,1 indica que la dispersión de
los datos con respecto a la media es moderada.

- El coeficiente de asimetría toma el valor 0,182 que no es significativo ya que presenta


un error estándar 0,226 y, por lo tanto, puede considerarse que la distribución es
simétrica. La curtosis de esta variable es -0,126 con un error estándar de 0,449 lo que
indica que la distribución es mesocúrtica.

- La distribución de la variable es unimodal, prácticamente simétrica y campaniforme


como se observa en el gráfico.

Ejemplo 2. Con la misma base de datos Enctran.sav obtener la tabla de frecuencias y


el diagrama de barras de la variable Trans.
Entre otros resultados se observa que los porcentajes correspondientes a las tres
modalidades de transporte público acumulan el 83,3% de los estudiantes y,
únicamente, el 12,2% utiliza transporte privado. Al ser una variable cualitativa el único
estadístico representativo de la distribución es la moda que, en este caso, es la
modalidad Metro que representa un 46,5% del total.

Ejemplo 3. Con la base de datos Enctran.sav obtener la tabla de frecuencias y la


representación gráfica adecuada para la variable Coste, agrupando los valores en los
siguientes intervalos: [0,5000) [5000,10000) [10000,15000) [15000, 20000).

Para obtener la tabla con los valores agrupados en intervalos es necesario, en primer
lugar, recodificar los valores en una nueva variable. Para ello, se activa la
opción Recodificar > En distintas variables del menú Transformar. En el cuadro de
diálogo que aparece:
• Se selecciona la variable Coste.

• En Variable de Resultado se indica el nombre elegido para la nueva variable, por


ejemplo, 'Coste1'.

• Se etiqueta la nueva variable, 'Coste recodificado'.

• Se definen los intervalos activando Valores antiguos y nuevos. Para definir el primer


intervalo se activa en Valor antiguo la opción Rango: Del menor hasta 5000 y se le
asigna como Valor nuevo 1; los siguientes intervalos se definen activando Rango límite
inferior hasta límite superior, asignándoles los valores 2 y 3. El último intervalo se
define mediante Rango 15000 hasta el mayor y se le asigna Valor nuevo 4.
• Se etiquetan los valores de la variable Coste1. En la ventana Vista de variable o bien
con doble clic sobre la variable Coste1, introducimos las etiquetas de los valores.
En Valores se indica:

Valor  Etiqueta de valor 


1  0-5000 
2  5000-10000 
3  10000-15000 
4  15000-20000

• Por último, con Analizar > Estadísticos Descriptivos > Frecuencias se obtiene la tabla


de frecuencias y el histograma, que es el adecuado dada la naturaleza continua de la
variable.

a) Gráfico de barras simples.

Se usa fundamentalmente para representar distribuciones de frecuencias de una


variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de
series cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya
sean absolutas o relativas (%), y el otro para la escala de clasificación utilizada. Un
ejemplo de este tipo de gráfico es el que se presenta a continuación:

Cada clase se representa con una barra o rectángulo cuya altura (si el eje de
frecuencias es el vertical) resulta proporcional a la frecuencia que representa. Todas
las barras deben tener el mismo grosor y el espacio entre barras debe ser el mismo,
teniendo un ancho de 0,5 a 1 vez el de las barras.

El orden de las barras en el gráfico debe ser el mismo que en la tabla que le sirve de
fuente. Por ello, si no existe un criterio 'a priori' de orden entre las clases establecidas,
pueden ordenarse las mismas (y, como es lógico, las barras en el gráfico) en orden
ascendente o descendente de las frecuencias, para facilitar la interpretación de esos
resultados.

b) Gráfico circular, de sectores o pastel.

El gráfico siguiente es un ejemplo típico de gráfico circular (confeccionado con los


mismos valores del gráfico anterior):
Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%)
de una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder
la medida del ángulo de cada sector con la frecuencia correspondiente a la clase en
cuestión. Si los 360º del círculo representan el 100 % de los datos clasificados, a cada
1% le corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector
dado bastaría con multiplicar el por ciento correspondiente por 3,6º (por simple regla de
tres).

Mediante un sector circular se representan las medidas angulares correspondientes a


las diferentes categorías, respetando el orden establecido en la tabla, partiendo de un
punto dado de la circunferencia. Ese punto dado generalmente es el punto más alto de
la circunferencia (12 en el reloj). Si lo que se representa en cada sector no puede
colocarse dentro del mismo, se elabora una leyenda o se coloca fuera, adyacente al
mismo. Se acostumbra a diferenciar los sectores con tramas o colores diferentes, lo
que hace que resulte un gráfico más vistoso que el de barras simples.

c) Gráfico de barras múltiples.

Se usa para representar las frecuencias observadas en clasificaciones dobles, es decir,


cuando son dos los criterios de clasificación, para variables cualitativas o cuantitativas
discretas. Su forma de construcción es similar a la del gráfico de barras simples, sólo
que en este caso se representan dos variables. El hecho de ser doble, triple, cuádruple,
etc., parte del número de clases que tenga la variable, que no es el criterio principal de
clasificación. Las barras que integran una barra múltiple se colocan juntas o
ligeramente solapadas.

Veamos un ejemplo de este tipo de gráfico:


Este es un gráfico de barras triples. En la leyenda aparece el criterio de clasificación
que complementa al que aparece en el eje de categorías. Note la separación entre los
“tríos” de barras.

d) Gráfico de barras compuestas

Su objetivo es la representación de las frecuencias relativas (%) observadas en


clasificaciones dobles, es decir, cuando son dos los criterios de clasificación, para
variables cualitativas o cuantitativas discretas.

Su forma de construcción es la siguiente: cada barra representa el 100 % de los


individuos en cada clase del criterio principal de clasificación y se divide,
proporcionalmente, en los por cientos correspondientes a las clases del otro criterio de
clasificación. Como es lógico, las diferentes partes en que se dividen las barras
compuestas se diferencian con tramas o colores diferentes.

e) Histograma

Este gráfico se usa para representar una distribución de frecuencias de una variable
cuantitativa continua.

Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la


variable. La escala del eje correspondiente a la variable se rotula con los límites
inferiores de notación de las clases consideradas y se agrega al final el que le
correspondería a una clase subsiguiente inexistente. En este caso, las frecuencias
deben resultar proporcionales no a la altura de las barras, sino al área de las mismas,
lo que significa que la obtención de las alturas de las barras resulta un poco más
compleja que en los gráficos anteriores. Además, las barras van contiguas y no
separadas, por la naturaleza continua de la variable de clasificación.
Para lograr la proporcionalidad entre la frecuencia y el área de la barra que esta
representa el procedimiento es el siguiente: sabemos que el área de un rectángulo es
el producto de la base por la altura y que la base de una barra en el gráfico es,
precisamente, la amplitud del intervalo de clase, luego la formulación de esa
'proporcionalidad' sería:

frecuencia observada = amplitud del intervalo* altura de la barra

Conocemos la frecuencia observada y la amplitud de cada uno de los intervalos, por


tanto, para calcular las alturas de las barras sólo se tendría que despejar en la fórmula
correspondiente, lo que quedaría:

altura de la barra = frecuencia observada / amplitud del intervalo

Debido a la forma de obtención de esas alturas, el eje de las frecuencias debe rotularse
como número de individuos por unidad de medida de la variable en cuestión, por
ejemplo: 'defunciones por año de edad'; 'número de individuos por kg de peso; etc.

El procedimiento que hemos explicado es el general, pero sucede, en el caso particular


de que las amplitudes de todos los intervalos de clase sean iguales, que no es
estrictamente necesario realizar estos cálculos: sería dividir todas las frecuencias por
una constante y eso no alteraría el gráfico, pues se mantendría la misma relación de
proporcionalidad entre las frecuencias.

Veámoslo a través de un ejemplo, cuando las amplitudes de los intervalos son iguales:

En este caso se usó la frecuencia absoluta como altura de la barra. Todas las barras
tienen el mismo ancho y van unidas, una a continuación de la otra, porque están
representando una variable continua (edad).

Es sencillo darse cuenta de que es imposible presentar otra distribución en ese gráfico,
pues unas barras podrían ocultar a otras. Es decir, este tipo de gráfico sólo es útil para
presentar una distribución.
f) Polígono de frecuencias.

Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de


variables cuantitativas continuas, pero como no se utilizan barras en su confección sino
segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se
quiere mostrar en el mismo gráfico más de una distribución o una clasificación cruzada
de una variable cuantitativa continua con una cualitativa o cuantitativa discreta, ya que
por la forma de construcción del histograma sólo se puede representar una distribución.

Para su confección, una vez construidas y rotuladas las escalas, de manera similar a
como se realiza para un histograma, los valores de alturas obtenidos se plotean sobre
el punto medio o marca de clase de los intervalos correspondientes y luego se procede
a unir esos puntos con segmentos de recta.

Veamos un ejemplo de polígono de frecuencias:

g) Gráfico de frecuencias acumuladas u ojiva.

Su objetivo, al igual que el histograma y el polígono de frecuencias es representar


distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para
frecuencias acumuladas.

No se utilizan barras en su confección, sino segmentos de recta, por ello no sólo es útil
para representar una distribución de frecuencias sino también cuando se quiere
mostrar más de una distribución o una clasificación cruzada de una variable cuantitativa
continua con una cualitativa o cuantitativa discreta. Este es un ejemplo de una ojiva:
La diferencia con el polígono de frecuencia es que la frecuencia acumulada no se
plotea sobre el punto medio de la clase, sino al final de la misma, ya que representa el
número de individuos acumulados hasta esa clase. Como el valor de la frecuencia
acumulada es mayor a medida que avanzamos en la distribución, la poligonal que se
obtiene siempre va a ser creciente y esa forma particular de la misma es la que ha
hecho que se le dé también el nombre de ojiva.

h) Gráfico aritmético simple.

Este es uno de los más sencillos de confeccionar. Su uso estadístico fundamental es


en la representación de series cronológicas, y en casos particulares, como el del
Crecimiento y Desarrollo Humanos, para representar los valores promedio o
posicionales (medias, medianas y percentiles, que se estudiarán más adelante) de
muchas dimensiones: peso para la edad, peso para la talla y talla para la edad, entre
otras.

Uno de los ejes (habitualmente el horizontal) se usa para la unidad de tiempo


estudiada: años, días, etc.. En el otro eje se representa la frecuencia o el indicador
calculado a partir de esos datos. En este tipo de gráfico es particularmente importante
la relación de proporcionalidad entre los ejes para evitar malas interpretaciones del
fenómeno que se presenta.

El gráfico que sigue es un ejemplo de gráfico de este tipo:


En el mismo gráfico se puede presentar más de una serie de datos si la escala usada
se adecua para todas, cuando los valores de las mismas no son extremadamente
diferentes.

4.- Errores más comunes en la confección de gráficos.

En la confección de un gráfico se pueden cometer dos tipos de errores: errores de


forma y errores de contenido. Aquí mencionaremos los que se han observado con más
frecuencia en las publicaciones científicas.

De forma:

· No uso de la identificación.
· No aparición de título o títulos extremadamente extensos.
· Títulos que no responden a las preguntas básicas.
· Gráficos muy cargados y/o sumamente complejos de interpretar.
· Desproporción notable entre las longitudes de los ejes.
· Omisión de los rótulos de los ejes y/o las unidades de medida.

De contenido:

· Uso de gráficos inadecuados dada la naturaleza de lo que se representa.


· Omisión de la leyenda donde se han usado claves o símbolos.
· No respetar alguna de las reglas establecidas para la construcción del gráfico en
particular. Por ejemplo, barras unidas cuando se trabaja con variable cualitativa o
discreta.

5.- Otros tipos de representación gráfica.

Existen muchos otros tipos de gráficos con propósitos más específicos que los
discutidos anteriormente. Daremos una visión muy general de los mismos sin
adentrarnos en las particularidades relativas a la construcción. Estos son gráficos en
los que, en lugar de tener escalas aritméticas en los dos ejes de coordenadas (como es
el caso del gráfico aritmético simple), uno de los ejes tiene una escala especial. Esos
gráficos reciben los nombres de la escala especial, no aritmética. Por ejemplo:

- gráfico semilogarítmico (una escala logarítmica)


- gráfico probabilístico (una escala probabilística)
- gráfico logístico (una escala logística)

Veamos la forma más frecuente de uso de uno de ellos.

Semilogarítmico: En ocasiones, al representar series cronológicas para comparar,


resulta que los valores de las diferentes series pueden diferir grandemente y eso hace
prácticamente imposible el uso del Grafico aritmético simple, pues deben aparecer en
la escala del eje Y valores que pueden estar 'muy distantes' entre sí. La solución es
usar una escala logarítmica en dicho eje y así pueden colocarse todos los datos sin
alterar seriamente sus comportamientos, de modo tal que las comparaciones sean
válidas. Veámoslo con un ejemplo:

El eje correspondiente a las tasas es un eje logarítmico, para poder representar


números de magnitudes tan diferentes al unísono.

También hay formas de presentación gráfica que no son gráficos propiamente dichos.
Al menos, no de los tipos que hemos visto. Esas presentaciones pueden ser:

 Mapas con localizaciones específicas dando información sobre el tema de que


se trate. Por ejemplo, dando colores o intensidades diferentes a las distintas
zonas geográficas en función del grado de afectación por el fenómeno en
estudio.
 Fotos.
 Esquemas.
 Organigramas, etc.

Nota complementaria: Sobre los gráficos basados en barras (barras simples, múltiples,
etc) existe la prohibición de “cortar” el eje de las frecuencias (número de casos, por
cientos, etc). Para el resto se autoriza el “corte” de cualesquiera de los ejes, siempre y
cuando este no interrumpa el trazado. Esto nos ayuda a reducir el gráfico sólo al área
del sistema de ejes coordenados entre cuyos valores se mueven los datos a graficar.

Estadística descriptiva

La parte de la estadística que consiste en recolectar lo datos, organizarlos, presentarlos


analizarlos e interpretar los resultados recibe el nombre de estadística descriptiva.

Cuando nos referimos a estadística descriptiva nos referimos a cualquier tratamiento de


datos que este diseñado para resumir o describir algunas de sus características más
importantes sin intentar deducir nada que escape al alcance de los datos. Cuando
obtenemos informaciones a través de un censo, cuando calculamos el crecimiento
intercensal de la población de un país, cuando se determina el crecimiento de la
producción de una empresa para un periodo determinado; todas estas informaciones
pertenecen al campo de la estadística descriptiva.

Una variable estadística es el conjunto de valores que puede tomar cierta característica
de la población sobre la que se realiza el estudio estadístico y sobre la que es posible
su medición. Estas variables pueden ser: la edad, el peso, las notas de un examen, los
ingresos mensuales, las horas de sueño de un paciente en una semana, el precio
medio del alquiler en las viviendas de un barrio de una ciudad, etc.

Las variables estadísticas se pueden clasificar por diferentes criterios. Según su


medición existen dos tipos de variables:

1. Cualitativa (o categórica): son las variables que pueden tomar como valores
cualidades o categorías.
1. Sexo (hombre, mujer)
2. Salud (buena, regular, mala)
2. Cuantitativas (o numérica): variables que toman valores numéricos.
1. Número de casas (1, 2…). Discreta.
2. Edad (12,5; 24,3; 35;). Continua.

Medidas de posición central

Las medidas de tendencia central (o de centralización) son medidas que tienden a


localizar en qué punto se encuentra la parte central de un conjunto ordenado de datos
de una variable cuantitativa.

Media

Definimos media (también llamada promedio o media aritmética) de un conjunto de


datos (X1,X2,…,XN) al valor característico de una serie de datos resultado de la suma
de todas las observaciones dividido por el número total de datos.

Mediana

La mediana (Me(X)) es el elemento de un conjunto de datos ordenados (X1,X2,…,XN)


que deja a izquierda y derecha la mitad de valores.

Moda

La moda (Mo(X)) es el valor más repetido del conjunto de datos, es decir, el valor cuya
frecuencia relativa es mayor. En un conjunto puede Haber más de una moda.

Media geométrica
La media geométrica (MG) de un conjunto de números estrictamente positivos (X1, X2,
…,XN) es la raíz N-ésima del producto de los N elementos.

Media armónica

La media armónica (H) de un conjunto de elementos no nulos (X1, X2,…,XN) es el


recíproco de la suma de los recíprocos (donde 1/Xi es el recíproco de Xi)) multiplicado
por el número de elementos del conjunto (N).

Media cuadrática

La media cuadrática o RMS (Root Mean Square) de un conjunto de valores (X1, X2,
…,XN) es una medida de posición central. Esta se define como la raíz cuadrada del
promedio de los elementos al cuadrado.

Media ponderada

La media ponderada (MP) es una medida de centralización. Consiste en otorgar a cada


observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la
importancia de cada elemento.

Relación entre medias

Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye la
media ponderada porque depende de los pesos. Sean:

 H la media armónica
 MG la media geométrica
 x la media aritmética
 RMS la media cuadrática

Entonces:

En esta relación, solamente se cumple la igualdad cuando todos los datos sean
iguales, es decir si: x1 = x2 = x3 = … = xN.

Medidas de posición no central

Las medidas de posición no central (o medidas de tendencia no central) permiten


conocer puntos característicos de una serie de valores, que no necesariamente tienen
que ser centrales. La intención de estas medidas es dividir el conjunto de
observaciones en grupos con el mismo número de valores
Cuartiles

Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro
porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los datos. El
segundo (Q2) deja a izquierda y derecha el 50% y coincide con la mediana. El tercero
(Q3) deja a la derecha el 25% de valores. Los tres cuartiles son:

Percentiles

El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos
que dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen
el mismo número de elementos cada una. El percentil 50 es la mediana.

Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:

Donde Pi es la posición del percentil buscado en la serie ordenada de datos.

Medidas de dispersión

Las medidas de dispersión o medidas de variabilidad muestran la variabilidad de un


conjunto de datos, indicando la mayor o menor concentración de datos respecto a las
medias de centralización.

Rango

El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el mínimo


de un conjunto de elementos.

Rango intercuartílico

Es una estimación estadística de la dispersión de una distribución de datos. Consiste


en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se eliminan los
valores extremadamente alejados.

Varianza
La varianza (S2) mide la dispersión de los datos de una muestra respecto a la media,
calculando la media de los cuadrados de las distancias de todos los datos.

Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas


respecto a la media no se anulan entre sí. Además, resaltan los valores alejados.

Desviación típica

Es la medida de dispersión (S) asociada a la media. Mide el promedio de las


desviaciones de los datos respecto a la media en las mismas unidades de los datos.

Coeficiente de variación de Pearson

El coeficiente de variación de Pearson (r) mide la variación de los datos respecto a la


media, sin tener en cuenta las unidades en la que están.

El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0,


significa que existe poca variabilidad en los datos y es una muestra muy compacta. En
cambio, si tienden a 1 es una muestra muy dispersa.
Asimetría

La asimetría es la medida que indica la simetría de la distribución de


una variable respecto a la media aritmética, sin necesidad de hacer la representación
gráfica. Los coeficientes de asimetría indican si hay el mismo número de elementos a
izquierda y derecha de la media.

Existen tres tipos de curva de distribución según su asimetría:

 Asimetría negativa: la cola de la distribución se alarga para valores inferiores a


la media.

 Simétrica: hay el mismo número de elementos a izquierda y derecha de


la media. En este caso, coinciden la media, la mediana y la moda. La
distribución se adapta a la forma de la campana de Gauss, o distribución normal.

 Asimetría positiva: la cola de la distribución se alarga (a la derecha) para


valores superiores a la media.

La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada


o achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de
manera que a mayor grado de curtosis, más escarpada (o apuntada) será la forma
de la curva.
La curtosis se mide promediando la cuarta potencia de la diferencia entre cada
elemento del conjunto y la media, dividido entre la desviación típica elevado también a
la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces el coeficiente de curtosis
será:

La frecuencia es el número de repeticiones por unidad de tiempo de cualquier evento


periódico. El período es la duración de tiempo de cada evento repetitivo, por lo que el
período es el recíproco de la frecuencia.

Tipos de frecuencia estadística

En estadística, podemos identificar hasta 4 tipos de frecuencias: Absoluta, relativa,


absoluta acumulada y relativa acumulada.
Ejemplos de los tipos de frecuencias

Un Grafico o grafica

Es un tipo de representación de datos, generalmente numéricos, mediante recursos


visuales (líneas, vectores, superficies o símbolos), para que se manifieste visualmente
la relación matemática o correlación estadística que guardan entre sí.

También es el nombre de un conjunto de puntos que se plasman en coordenadas


cartesianas y sirven para analizar el comportamiento de un proceso o un conjunto de
elementos o signos que permiten la interpretación de un fenómeno. La representación
gráfica permite establecer valores que no se han obtenido experimentalmente sino
mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del
intervalo experimental).

 Existen diferentes tipos de gráficas:


 Gráfico lineal: se compone de una serie de datos representados por puntos,
unidos por segmentos lineales. Mediante este gráfico se puede comprobar
rápidamente el cambio de tendencia de los datos.
Ejemplos:
Se desea tener un registro de cuántas personas visitaron el museo de una
ciudad durante un año. Esta información puede organizarse en el siguiente
gráfico.

 Gráfico de barras: se usa cuando se pretende resaltar la representación de


porcentajes de datos que componen un total. Una gráfica de barras contiene
barras verticales que representan valores numéricos, generalmente usando una
hoja de cálculo. Las gráficas de barras son una manera de representar
frecuencias; las frecuencias están asociadas con categorías. Una gráfica de
barras se presenta de dos maneras: horizontal o vertical.

 Histograma: se emplea para ilustrar muestras agrupadas en intervalos. Está


formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con
los límites de los intervalos y el centro de cada intervalo es la marca de clase
que representamos en el eje de las abscisas. La altura de cada rectángulo es
proporcional a la frecuencia del intervalo respectivo.
 Gráfico circular: permite ver la distribución interna de los datos que representan
un hecho, en forma de porcentajes sobre un total. Diagrama Circular se usa para
enseñar el por ciento de cada elemento en particular de un grupo. consta de
porcentajes proporciones.

 Pictograma: Son imágenes que sirven para representar el comportamiento o la


distribución de los datos cuantitativos de una población, utilizando símbolos de
tamaño proporcional al dato representado. Una posibilidad es que el gráfico
sea analógico por ejemplo, la representación de los resultados de las elecciones
con colores sobre un hemiciclo.

 Diagrama de Pareto o ABC: es una gráfica para organizar datos de forma que
estos queden en orden descendente, de izquierda a derecha y separados por
barras. Permite asignar un orden de prioridades. El diagrama permite mostrar
gráficamente el principio de Pareto (pocos vitales, muchos triviales), es decir,
que hay muchos problemas sin importancia frente a unos pocos muy
importantes. Mediante la gráfica colocamos los "pocos que son vitales" a la
izquierda y los "muchos triviales" a la derecha. El diagrama facilita el estudio de
las fallas en las industrias o empresas comerciales, así como fenómenos
sociales o naturales psicosomáticos, como se puede ver en el ejemplo de la
gráfica al principio del artículo.
Los diagramas de Caja-Bigotes 
Son una presentación visual que describe varias características importantes, al
mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los
valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal
o verticalmente.
 Construcción:
 Comparar distribuciones
 Diagrama de Caja a través de Excel
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más
largos muestran el recorrido intercuartílico. Este rectángulo está dividido por
un segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relación con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que
cualquier dato o caso que no se encuentre dentro de este rango es marcado e
identificado individualmente

Ejemplo distribución de edades

Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que


representan la edad de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40
Ordenar los datos

Para calcular los parámetros estadísticos, lo primero es ordenar la distribución


20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Cálculo de cuartiles

Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la


distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media
aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el
valor de la variable que ocupa el lugar central en un conjunto de datos
ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el
siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la
distribución. En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).

Diagrama de Tallos y Hojas

Permite obtener simultáneamente una distribución de frecuencias de la variable


y su representación gráfica. Para construirlo basta separar en cada dato el
último dígito de la derecha (que constituye la hoja) del bloque de cifras restantes
(que formará el tallo). Esta representación de los datos es semejante a la de un
histograma, pero además de ser fáciles de elaborar, presentan más información
que estos.

Edad de 20 personas
Supongamos la siguiente distribución de frecuencias

36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
que representan la edad de un colectivo de N = 20 personas y que vamos a
representar mediante un diagrama de Tallos y Hojas.
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de
decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.
A continuación, efectuamos un recuento y vamos «añadiendo» cada hoja a su
tallo

Por último, reordenamos las hojas y hemos terminado el diagrama

Comparar dos distribuciones


Podemos comparar, mediante estos diagramas, dos distribuciones.
Supongamos una segunda distribución

35 38 32 28 30 29 27 19 48 40

39 24 24 34 26 41 29 48 28 22
De ella podemos elaborar su diagrama de Tallos y Hojas y compararla con la
anterior.

También podría gustarte