Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Maestría:
Maestría en dirección financiera
Participantes:
Vanessa Báez 2020-
Laura Duran 2020-
Adonay Núñez 2020-
Lorena Navarro 2020-01232
Enmanuel Contreras 2020-
Kiancy Medina 2020-
Facilitador:
Elvis Quirino García
Tema:
Probabilidades y estadística
11/03/2020
Estadística
1- Realizar una encuesta con los empleados de UAPA donde muestre la intención de
votos para las elecciones de este 15 de marzo.
Fundamentos de estadística
Fundamentos de Estadística
Sobre estadística se presentan diversos conceptos; por tal razón les presento los
siguientes conceptos sobre estadística:
La estadística es una rama de las matemáticas que se ocupa de reunir,
organizar y analizar datos numéricos y que ayuda a resolver problemas como
el diseño de experimentos y la toma de decisiones.
La Estadística es la parte de las Matemáticas que se encarga de recoger datos,
organizarlos, tabularlos, representarlos gráficamente, interpretarlos y analizarlos,
para sacar conclusiones, tomar decisiones o predecir, a partir del estudio
o investigación que se esté realizando sobre alguna característica, propiedad o
situación en una población determinada.
División de la estadística
Distribuciones de frecuencias
Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que
recoge:
• Porcentaje de veces que aparece cada valor de la variable o modalidad del atributo
sobre el total de observaciones,
Analizar
Estadísticos Descriptivos
Frecuencias
Estadísticos
Gráficos
Formato
Estadísticos
Asimetría
Curtosis
Gráficos
Formato
• Ordenar por: se puede elegir entre distintos criterios de ordenación de los valores de
la variable en la tabla de frecuencias. Por defecto, los valores aparecen en orden
ascendente; pero también es posible una ordenación descendente o una ordenación
por frecuencias, tanto ascendente como descendente, activando las opciones
correspondientes.
EJEMPLOS
- La base de datos no presenta para esta variable ningún valor missing, de forma que
las 114 observaciones son todas válidas.
- La desviación típica es 2,52 que sobre una media de 5,1 indica que la dispersión de
los datos con respecto a la media es moderada.
Para obtener la tabla con los valores agrupados en intervalos es necesario, en primer
lugar, recodificar los valores en una nueva variable. Para ello, se activa la
opción Recodificar > En distintas variables del menú Transformar. En el cuadro de
diálogo que aparece:
• Se selecciona la variable Coste.
a) Gráfico de barras simples.
Cada clase se representa con una barra o rectángulo cuya altura (si el eje de
frecuencias es el vertical) resulta proporcional a la frecuencia que representa. Todas
las barras deben tener el mismo grosor y el espacio entre barras debe ser el mismo,
teniendo un ancho de 0,5 a 1 vez el de las barras.
El orden de las barras en el gráfico debe ser el mismo que en la tabla que le sirve de
fuente. Por ello, si no existe un criterio 'a priori' de orden entre las clases establecidas,
pueden ordenarse las mismas (y, como es lógico, las barras en el gráfico) en orden
ascendente o descendente de las frecuencias, para facilitar la interpretación de esos
resultados.
e) Histograma
Este gráfico se usa para representar una distribución de frecuencias de una variable
cuantitativa continua.
Debido a la forma de obtención de esas alturas, el eje de las frecuencias debe rotularse
como número de individuos por unidad de medida de la variable en cuestión, por
ejemplo: 'defunciones por año de edad'; 'número de individuos por kg de peso; etc.
Veámoslo a través de un ejemplo, cuando las amplitudes de los intervalos son iguales:
En este caso se usó la frecuencia absoluta como altura de la barra. Todas las barras
tienen el mismo ancho y van unidas, una a continuación de la otra, porque están
representando una variable continua (edad).
Es sencillo darse cuenta de que es imposible presentar otra distribución en ese gráfico,
pues unas barras podrían ocultar a otras. Es decir, este tipo de gráfico sólo es útil para
presentar una distribución.
f) Polígono de frecuencias.
Para su confección, una vez construidas y rotuladas las escalas, de manera similar a
como se realiza para un histograma, los valores de alturas obtenidos se plotean sobre
el punto medio o marca de clase de los intervalos correspondientes y luego se procede
a unir esos puntos con segmentos de recta.
No se utilizan barras en su confección, sino segmentos de recta, por ello no sólo es útil
para representar una distribución de frecuencias sino también cuando se quiere
mostrar más de una distribución o una clasificación cruzada de una variable cuantitativa
continua con una cualitativa o cuantitativa discreta. Este es un ejemplo de una ojiva:
La diferencia con el polígono de frecuencia es que la frecuencia acumulada no se
plotea sobre el punto medio de la clase, sino al final de la misma, ya que representa el
número de individuos acumulados hasta esa clase. Como el valor de la frecuencia
acumulada es mayor a medida que avanzamos en la distribución, la poligonal que se
obtiene siempre va a ser creciente y esa forma particular de la misma es la que ha
hecho que se le dé también el nombre de ojiva.
De forma:
· No uso de la identificación.
· No aparición de título o títulos extremadamente extensos.
· Títulos que no responden a las preguntas básicas.
· Gráficos muy cargados y/o sumamente complejos de interpretar.
· Desproporción notable entre las longitudes de los ejes.
· Omisión de los rótulos de los ejes y/o las unidades de medida.
De contenido:
Existen muchos otros tipos de gráficos con propósitos más específicos que los
discutidos anteriormente. Daremos una visión muy general de los mismos sin
adentrarnos en las particularidades relativas a la construcción. Estos son gráficos en
los que, en lugar de tener escalas aritméticas en los dos ejes de coordenadas (como es
el caso del gráfico aritmético simple), uno de los ejes tiene una escala especial. Esos
gráficos reciben los nombres de la escala especial, no aritmética. Por ejemplo:
También hay formas de presentación gráfica que no son gráficos propiamente dichos.
Al menos, no de los tipos que hemos visto. Esas presentaciones pueden ser:
Nota complementaria: Sobre los gráficos basados en barras (barras simples, múltiples,
etc) existe la prohibición de “cortar” el eje de las frecuencias (número de casos, por
cientos, etc). Para el resto se autoriza el “corte” de cualesquiera de los ejes, siempre y
cuando este no interrumpa el trazado. Esto nos ayuda a reducir el gráfico sólo al área
del sistema de ejes coordenados entre cuyos valores se mueven los datos a graficar.
Estadística descriptiva
Una variable estadística es el conjunto de valores que puede tomar cierta característica
de la población sobre la que se realiza el estudio estadístico y sobre la que es posible
su medición. Estas variables pueden ser: la edad, el peso, las notas de un examen, los
ingresos mensuales, las horas de sueño de un paciente en una semana, el precio
medio del alquiler en las viviendas de un barrio de una ciudad, etc.
1. Cualitativa (o categórica): son las variables que pueden tomar como valores
cualidades o categorías.
1. Sexo (hombre, mujer)
2. Salud (buena, regular, mala)
2. Cuantitativas (o numérica): variables que toman valores numéricos.
1. Número de casas (1, 2…). Discreta.
2. Edad (12,5; 24,3; 35;). Continua.
Media
Mediana
Moda
La moda (Mo(X)) es el valor más repetido del conjunto de datos, es decir, el valor cuya
frecuencia relativa es mayor. En un conjunto puede Haber más de una moda.
Media geométrica
La media geométrica (MG) de un conjunto de números estrictamente positivos (X1, X2,
…,XN) es la raíz N-ésima del producto de los N elementos.
Media armónica
Media cuadrática
La media cuadrática o RMS (Root Mean Square) de un conjunto de valores (X1, X2,
…,XN) es una medida de posición central. Esta se define como la raíz cuadrada del
promedio de los elementos al cuadrado.
Media ponderada
Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye la
media ponderada porque depende de los pesos. Sean:
H la media armónica
MG la media geométrica
x la media aritmética
RMS la media cuadrática
Entonces:
En esta relación, solamente se cumple la igualdad cuando todos los datos sean
iguales, es decir si: x1 = x2 = x3 = … = xN.
Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro
porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los datos. El
segundo (Q2) deja a izquierda y derecha el 50% y coincide con la mediana. El tercero
(Q3) deja a la derecha el 25% de valores. Los tres cuartiles son:
Percentiles
El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos
que dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen
el mismo número de elementos cada una. El percentil 50 es la mediana.
Medidas de dispersión
Rango
Rango intercuartílico
Varianza
La varianza (S2) mide la dispersión de los datos de una muestra respecto a la media,
calculando la media de los cuadrados de las distancias de todos los datos.
Desviación típica
Un Grafico o grafica
Diagrama de Pareto o ABC: es una gráfica para organizar datos de forma que
estos queden en orden descendente, de izquierda a derecha y separados por
barras. Permite asignar un orden de prioridades. El diagrama permite mostrar
gráficamente el principio de Pareto (pocos vitales, muchos triviales), es decir,
que hay muchos problemas sin importancia frente a unos pocos muy
importantes. Mediante la gráfica colocamos los "pocos que son vitales" a la
izquierda y los "muchos triviales" a la derecha. El diagrama facilita el estudio de
las fallas en las industrias o empresas comerciales, así como fenómenos
sociales o naturales psicosomáticos, como se puede ver en el ejemplo de la
gráfica al principio del artículo.
Los diagramas de Caja-Bigotes
Son una presentación visual que describe varias características importantes, al
mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los
valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal
o verticalmente.
Construcción:
Comparar distribuciones
Diagrama de Caja a través de Excel
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más
largos muestran el recorrido intercuartílico. Este rectángulo está dividido por
un segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relación con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que
cualquier dato o caso que no se encuentre dentro de este rango es marcado e
identificado individualmente
39 24 29 23 41 40 33 24 34 40
Ordenar los datos
Cálculo de cuartiles
Edad de 20 personas
Supongamos la siguiente distribución de frecuencias
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
que representan la edad de un colectivo de N = 20 personas y que vamos a
representar mediante un diagrama de Tallos y Hojas.
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de
decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.
A continuación, efectuamos un recuento y vamos «añadiendo» cada hoja a su
tallo
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22
De ella podemos elaborar su diagrama de Tallos y Hojas y compararla con la
anterior.