Está en la página 1de 18

CAPÍTULO 1

DATOS Y ESTADÍSTICAS

PROBABILIDAD→Calculo que evalúa las posibilidades que existen de que una cosa
suceda, va de 0 a 1, siendo 1 la probabilidad de 100% de que algo suceda y 0 el 0% de que
algo suceda.

ESTADÍSTICA→ Es el arte y la ciencia de recolectar, analizar e interpretar datos.


Particularmente, en el campo de los negocios y la economía, se refiere a datos numéricos,
promedios, medias, porcentajes e índices que permiten a los encargados de tomar
decisiones entender mejor el entorno económico y de los negocios para que las decisiones
sean lo más acertadas posibles. Algunas de sus aplicaciones en este campo son
contabilidad, finanzas, marketing, producción y economía.

DATOS→Hechos y cifras recabadas, analizados y resumidos para su presentación e


interpretación. Todos los datos recabados de un estudio en particular se conocen como
banco de datos.

ELEMENTOS→Entidades a partir de las cuales se reúnen los datos. En la imágen los


elementos son los fondos de inversión cuyos nombres se encuentran en la primera
columna.

VARIABLE→Característica de interés para los elementos. Las variables en la imágen se


muestran como los 5 aspectos que se analizan, ejemplo: FUND TYPE, NET ASSET VALUE, ETC.

OBSERVACIÓN→Conjunto de mediciones obtenidas para un elemento en particular. Estás


en la imágen son los datos obtenidos por cada uno de los elementos, un ejemplo del primer
elemento es: (IE, 14.37, 30.53, 1.41, 3-star).

ESCALAS DE MEDICIÓN→Determina cantidad de información contenida en los datos e


indica la manera más apropiadas de resumirlos y analizarlos estadísticamente.
● Escala Nominal: Se utiliza para categorizar datos en en grupos que no tienen ningún
orden determinado, en la imágen se puede encontrar esta escala en la variable FUND
TYPE .

● Escala ordinal: Los datos se ordenan en categorías que tienen un orden específico,
pero la diferencia entre los valores no se puede medir con precisión. En la imágen se
puede tomar esta clasificación en la variable MORNINGSTAR RANK, el orden importa
pero no se sabe cuánto mejor es un nivel en comparación con otro.

● Escala de intervalo: Esta escala mide la diferencia entre dos valores, y la distancia
entre cada valor es igual.Tiene un punto de referencia arbitrario que no es el 0, ya
que en ningún momento se considera la ausencia del producto o de lo que se este
analizando.

● Escala de razón: Similar a la escala de intervalo, pero su punto de referencia es un


cero absoluto que representa la ausencia del atributo medido.

DATOS CUALITATIVOS Y CUANTITATIVOS→

● Los datos CUALITATIVOS o CATEGÓRICOS se agrupan por categorías


específicas, mientras que los CUANTITATIVOS usan valores numéricos.
● Es de vital importancia agrupar la variable a analizar en una de estas dos categorías
ya que de no hacerlo el análisis estadístico podría no ser apropiado.
● Las variables cualitativas tienen un análisis estadístico muy limitado a diferencia de
las cuantitativas, generalmente, ya que el número de operaciones que se pueden
hacer y que tengan sentido para la variable son muy reducidos.
● Los datos cuantitativos se subdividen en dos grupos, discretos y continuos. Los
discretos son datos que solo pueden tomar valores enteros, mientras que los
continuos pueden tomar cualquier valor dentro de un rango específico.

DATOS DE CORTE TRANSVERSAL Y DE SERIES DE TIEMPO→

● Datos de corte transversal, recabados aproximadamente en el mismo momento.


Ejemplo:
● Datos de series de tiempo, recabado a lo largo de varios periodos. Estos tipos de
gráficos ayudan a los analistas a comprender lo que ocurrió en el pasado, identificar
tendencias y proyectar niveles futuros.Ejemplos:

FUENTES DE DATOS→

Fuentes existentes: En algunos casos los datos necesarios para una aplicación en
particular ya existen, es decir, ya han sido recabados. En el registro interno de la empresa
hay datos sobre empleados, producción, ventas, clientes, etc. Además existen
organizaciones dedicadas a la recopilación de datos que pueden servir de proveedores por
medio de acuerdos o vendiendolos. Otro medio por el que obtener información es internet el
cuál puede ofrecer gran variedad y cantidad de información, también se debe tener en
cuenta a agencias gubernamentales como medio de obtención de datos.
Estudios estadísticos: Se clasifican en experimentales u observacionales.
● Experimentales→Se identifica primero la variable de interés, luego se toma una o
más variables y se analiza cómo el cambio en estas afectan a la variable central.
● Observacionales→El método más usado es la encuesta, primero se diseñan las
preguntas basadas en la información que quiero obtener y luego se elige una
muestra, esta muestra se refiere a una fracción del total.

A la hora de necesitar datos con un determinado propósito es necesario tener en cuenta


varias variables a la hora de elegir el tipo de fuente, se deben considerar los recursos
empleados en cada uno de los métodos y que sea rentable además de evaluar con qué
precisión se necesitan los datos.

ERRORES EN LA ADQUISICIÓN DE DATOS→

Los errores ocurren con frecuencia durante la adquisición de los datos. El uso a ciegas de
cualquier dato con que se cuenta o el uso de los que se adquirieron con poco cuidado
puede conducir a información y a decisiones erróneas. Por tanto, emprender acciones para
adquirir datos precisos ayuda a garantizar que la información sea confiable y valiosa para la
toma de decisiones.

ESTADÍSTICA DESCRIPTIVA→

La información estadística que se presenta en una forma fácil de comprender para el lector
a través de tablas, gráficas o números son denominados como estadística descriptiva.

TABLA

En la siguiente imágen se puede observar que el resultado de la suma de las frecuencias es


25, esto se debe a que estoy trabajando sobre el total de las fundaciones, las cuáles están
divididas entre capital nacional, capital internacional y renta fija. La frecuencia porcentual es
simplemente el resultado de evaluar el promedio de la frecuencia, a través de la fórmula,
Frecuencia Porcentual: (Frecuencia x 100) x /Total. Cabe destacar que la suma de estas
frecuencias debe ser 100 ya que representa el 100%.
GRÁFICO DE BARRAS

La imágen muestra un gráfico de barras, es una forma más visual de representar los
porcentajes calculados en la tabla anterior.

HISTOGRAMA

Estos gráficos son útiles para visualizar la distribución de datos y entender la forma en la
que están agrupados. Permite identificar con facilidad la concentración de valores alrededor
de ciertos puntos además de detectar presencia de valores atípicos.

INFERENCIA ESTADÍSTICA→

● Población→Conjunto de todos los elementos de interés en un estudio en particular.


● Muestra→Subconjunto de la población.
● Censo→Proceso para recabar datos de toda una población.
● Encuesta por muestreo→Proceso para recabar datos de una muestra.
● Inferencia estadística→Proceso de realizar estimaciones sobre características de
una población a través de datos de muestra.

MINERÍA DE DATOS→

Definida como, “La extracción automatizada de información predictiva de bases de datos


(grandes)”. Estas grandes bases de datos se debe al “almacenamiento de datos”, el cuál se
refiere a la captura, almacenamiento y mantenimiento de los datos. Las principales
aplicaciones de la minería de datos son realizadas por empresas con un fuerte enfoque en
el consumidor. En este campo podemos identificar también el software de minería de datos,
el cuál permite mejorar la comprensión de la información estadística desarrollada.

LINEAMIENTOS ÉTICOS PARA LA PRÁCTICA ESTADÍSTICA→

Los lineamientos éticos en la práctica estadística constituyen un conjunto de principios que


buscan asegurar la integridad, justicia y transparencia en el manejo de los datos y en la
generación de conclusiones. En la recopilación de datos una de las normas más destacadas
es informar el propósito de dicha recopilación y obtener su aprobación voluntaria. Además
de preservar la confidencialidad y el anonimato de los datos recolectados. En el análisis de
datos, mantener imparcialidad y objetividad evitando manipulación de resultados. Además,
los estadísticos deben considerar el impacto de su investigación evitando cualquier daño
potencial a los participantes. Esto ayuda a preservar la credibilidad de la práctica
estadística.

CAPÍTULO 2
PRESENTACIONES TABULARES Y GRÁFICAS

● Métodos tabulares y gráficos resumen datos cualitativos y cuantitativos

DISTRIBUCIÓN DE FRECUENCIA→Una distribución de frecuencia es un resumen tabular


de datos que muestra el número (frecuencia) de elementos en cada una de varias clases
que no se superponen. Definición válida para datos cualitativos y cuantitativos.

Resumen de datos cualitativos

La FRECUENCIA señala en este listado de 50 nombres, las veces que aparece cada uno.
FRECUENCIA RELATIVA→ Esto es un cálculo elaborado con la siguiente fórmula:

Divide la frecuencia con la que aparece el nombre en el listado por la cantidad de nombres
en el listado, 50 en el ejemplo.

FRECUENCIA PORCENTUAL→Es la frecuencia relativa multiplicada por 100 con el fin de


representarlo como porcentaje.

GRÁFICA DE BARRAS→Se encarga de representar datos cualitativos resumidos en una


distribución de frecuencia, frecuencia relativa o frecuencia porcentual. A continuación un
ejemplo:

GRÁFICA CIRCULAR O DE PASTEL→Presenta distribuciones de frecuencia, frecuencia


relativa o de frecuencia porcentual para para datos cualitativos. A continuación un ejemplo:
En esta imágen la frecuencia representada es la porcentual, pero podría ser cualquiera de
las otras dos.
Resumen de datos cuantitativos

Con los datos cuantitativos se debe ser más cuidadoso al definir las clases que no se
superponen y que se utilizarán en la distribución de la frecuencia, existen tres pasos para
definir las clases de una distribución de frecuencia con datos cuantitativos, estos son:
1. Determinar el número de clases que no se superponen.
2. Definir el ancho de cada clase.
3. Determinar los límites de clase.

NÚMERO DE CLASES→Se forman mediante la especificación de los rangos que se usarán


para agrupar los datos. La idea es utilizar suficientes clases para mostrar la variación en los
datos, pero no demasiadas si sólo se tienen algunos elementos.

ANCHO DE CLASE→Recomendable que sea el mismo para todas. Un número grande de


clases significa un ancho de clase menor, y viceversa. Para determinar un ancho de clase
aproximado, primero se identifican los valores de datos mayores y menores. Luego, una vez
especificado el número de clases deseado, se utiliza la expresión siguiente para determinar
el ancho de clase aproximado.

Si el ancho de la clase da un número con decimales es necesario redondear para arriba, es


lo que se hace generalmente.

LÍMITES DE CLASE→ Cada elemento de datos debe pertenecer solo a una de las clases,
Límite inferior es el menor valor asignado a la clase mientras que el límite superior todo lo
contrario. En la elaboración de distribuciones de frecuencia para datos cualitativos no se
necesita especificar los límites de clase, debido a que cada elemento de datos corresponde
de manera natural a una clase separada. Por otro lado, los datos cuantitativos necesitan los
límites de clase para poder determinar a dónde pertenece cada valor de datos.

PUNTO MEDIO DE CLASE→ Valor medio entre límites de clase superior e inferior.

DISTRIBUCIÓN DE FRECUENCIA RELATIVA Y FRECUENCIA PORCENTUAL→

La forma de calcular la frecuencia relativa y la frecuencia porcentual es igual que con datos
cualitativos.

La frecuencia porcentual es la multiplicación por 100 de la frecuencia relativa.


DIAGRAMA DE PUNTOS→El eje horizontal muestra el rango de los datos y cada valor está
representado por un punto ubicado sobre este eje. Ejemplo:

HISTOGRAMA→Es una presentación gráfica de los datos cuantitativos, este gráfico se


elabora para datos previamente resumidos, ya sea mediante distribución de frecuencia,
frecuencia relativa o porcentual. Para elaborar uno la variable de interés se coloca sobre el
eje horizontal y la frecuencia, (del tipo que sea), ocupa el eje vertical.

Uno de los usos más importantes del histograma es proporcionar información acerca de la
forma de una distribución, a continuación se presentarán cuatro formas de distribución
distinta y una breve descripción de cada una.

● PANEL A: Muestra conjunto de datos moderadamente sesgados a la izquierda. Esto


ocurre cuando su cola se extiende más hacia esa dirección. Una de sus aplicaciones
es para las clasificaciones de exámenes, no hay superiores a 100% y la mayoría son
superiores a 70%, solo algunas son realmente bajas.
● PANEL B: Conjunto de datos moderadamente sesgados a la derecha. Se podría
usar por ejemplo en el precio de viviendas, donde algunas casas costosas crean un
pequeño sesgo.

● PANEL C: Este histograma es simétrico, la cola izquierda y la cola derecha nunca


son perfectamente simétricos, pero pueden tener una forma aproximadamente igual.

● PANEL D:Este histograma está muy sesgado a la derecha, podría estar basado en
la cantidad de compras hechas por clientes a lo largo de un día.
DISTRIBUCIONES ACUMULADAS→Muestra el número de elementos de datos con valores
menores o iguales que el lí mite de clase superior de cada clase.

Es parecida a las tablas que veníamos viendo, solo que esta va acumulando las frecuencias
hasta llegar a los valores límites.Cabe destacar que la frecuencia relativa acumulada
siempre será 1.0 y la porcentual acumulada 100%.

OJIVA→Es la gráfica de una distribución acumulada, no importa que tipo de frecuencia sea,
y muestra los valores sobre el eje horizontal.

DIAGRAMA DE TALLO Y HOJA→

Esto no es un diagrama de tallo y hoja, es solo una tabla de aptitudes hechas a 50 personas de un
cuestionario de 150 preguntas mostrando cuántas contestaron correctamente.
Para desarrollar un diagrama de tallo y hoja, se colocan los dígitos principales de cada valor
a la izquierda de la vertical y a la derecha el último dígito, basado en la tabla antes
mencionada así quedaría el diagrama de tallo y hoja.

La izquierda de la vertical representa el tallo mientras que cada dígito de la derecha son
hojas. Además si se girara este gráfico se podría formar algo muy parecido al histograma,
sin embargo este último tiene desventajas con respecto al de tallo y hoja.
1. Es más difícil de elaborar a mano.
2. Muestra menos información ya que no muestra los datos actuales.
Pero además otras de las ventajas con la que cuenta es que el número de tallos no es fijo,
entonces podemos representarlo de otra manera, en el ejemplo de a continuación los
valores de hojas que sean 0, 1, 2, 3, 4 irán en una fila y los de 5, 6, 7, 8, 9 irán en otro.
*Hasta ahora solo se ha demostrado poder hacer diagramas de este tipo con hasta 3 cifras,
que ocurriría si estas fueran mayor?.

Primero se trabaja sobre la siguiente tabla→

Esta tabla en formato de diagrama de tallo y hoja se representa de la siguiente manera→

Para entender esto se considera la primera fila, tallo 15 y su hoja asociada 6, da como
resultado 156. La unidad de hoja es 10, lo que se hará es multiplicar por el número antes
obtenido, en este caso, 156 * 10 = 1560. En la tabla no hay ningún valor que sea 1560, esto
se debe a que se le es imposible representar muchas veces valores exactos pero sí
aproximados. Esto está pensado para tablas donde hay números con muchos dígitos. Para
diagramas donde la unidad de hoja no se muestra, se sobreentiende que es 1.

En la siguiente imágen se muestra los métodos que se usan para cada tipo de dato.
CAPÍTULO 3
ESTADÍSTICA DESCRIPTIVA: MEDIDAS NUMÉRICAS

Se presentarán varias medidas numéricas que proporcionan otras opciones para una misma
tarea.

MEDIDA ESTADÍSTICO MUESTRAL→Calculada a partir de los datos de una muestra.


Utilizados para estimular parámetros poblacionales o realizar inferencias sobre población a
partir de la muestra.

PARÁM ETROS POBLACIONALES→Son medidas numéricas que describen características


de una población completa.

ESTIMADOR PUNTUAL→Fórmula matemática que aplicada a los datos de una muestra


obtiene una estimación numérica de un parámetro poblacional.

Medidas de posición o localización

MEDIA→Medida de ubicación más importante para una variable, proporciona medida de


ubicación central para los datos. Si los datos son para una muestra se representa con “x”, si
son para una población “μ“.

El numerador es la suma de los valores de las n observaciones.

La fórmula y procedimiento es igual a la de la medida muestral, solo cambia un poco ya que


debe representar si se está trabajando con toda la población o solo con una parte. Los
resultados deberían ser bastante similares.
MEDIANA→Es el valor de en medio cuando los datos están acomodados en orden
ascendente (menor a mayor), si la cantidad de datos es impar la mediana es el valor del
medio como se dijo anteriormente, sin embargo si es par se requiere un procedimiento
diferente.

Aquí está claro que la mediana es 46, ya que la cantidad de números es 5 (impar).

En este caso la cantidad de números es 12 (par), lo que se debe hacer en este caso es
encontrar los dos valores del medio, en este caso 3490 y 3520. A continuación llevar a cabo
el siguiente cálculo:

MODA→Una tercera medida de posición, es el valor que ocurre con mayor frecuencia. Para
que se entienda más fácilmente este hecho ocurre cuando un número en particular se repite
más que los demás, ahí se produce una moda. Pero si dos números se repiten más que los
demás pero entre ellos la misma cantidad de veces, se dice que son bimodales. Si esto
mismo llegará a pasar con más de dos números se denominarían multimodales.

PERCENTILES→ Medida estadística que indica en qué posición se encuentra un valor


particular dentro de un conjunto de datos ordenados. Los percentiles dividen un conjunto de
datos en 100 partes iguales. Por ejemplo, el percentil 50 es el valor por debajo del cual se
encuentra el 50% de los datos y por encima del cual se encuentra el otro 50%. Esto a
menudo se utiliza en estadísticas y mediciones de rendimiento, como en los exámenes
estandarizados, donde se puede decir que un estudiante se encuentra en el percentil 80 si
ha superado el 80% de los demás estudiantes que tomaron el examen.
Ejemplo de procedimientos:

Otro ejemplo:

CUARTILES→ A veces es recomendable dividir los datos en cuatro partes. Cada una
contiene un 25% o ¼ de los datos. Los puntos de división son los que se conocen como
cuartiles.

Ejemplo de procedimiento:
El objetivo final de los cuartiles es dividir los datos en 4 partes.

Medidas de variabilidad

También podría gustarte