Estadística descriptiva: Es el campo de la estadística que estudia el conjunto
de datos obtenidos de una investigación y los representa de manera gráfica mediante tablas y figuras. En otras palabras se refiere al análisis, el resumen y la presentación de los resultados relacionados con un conjunto de datos derivados de una muestra o de toda la población. La estadística descriptiva comprende tres categorías principales: distribución de frecuencias, medidas de tendencia central y medidas de variabilidad. Diagrama de tallo y hojas: El diagrama de tallo y hoja es un tipo de diagrama estadístico en el que se representa un conjunto de datos cuantitativos. En un diagrama de tallo y hoja cada dato está separado por la hoja, que es su último dígito, y el tallo, que son las cifras restantes. De modo que en un diagrama de tallo y hoja se pone cada hoja en la línea de su tallo correspondiente. De esta forma, los diagramas de tallos y hojas permiten representar gráficamente un conjunto de datos estadísticos y, además, ayudan a visualizar la forma de la distribución.
Rango: El rango es un valor numérico que sirve para manifestar la diferencia
entre el valor máximo y el valor mínimo de una muestra poblacional en Estadística. A través del rango se puede observar la dispersión total en una muestra en concreto. Es una tabla que representa el número de elementos que pertenecen a cada una de las clases o categorías en las que se haya dividido el conjunto de datos para su estudio. Número de clase: Es una tabla que representa el número de elementos que pertenecen a cada una de las clases o categorías en las que se haya dividido el conjunto de datos para su estudio. Anchura del intervalo: La amplitud de la clase es la diferencia entre el límite superior e inferior del intervalo de clase Tabla de frecuencia: Una tabla de frecuencias es una herramienta estadística que organiza y resume la información sobre la distribución de datos. Consiste en una estructura de columnas que muestra las distintas categorías o valores de una variable, junta con el número de veces que cada categoría ocurre en un conjunto de datos. Frecuencia relativa: Es una magnitud, utilizada en estadística, que indica la proporción o fracción de la cantidad de veces que ocurre un fenómeno o evento respecto a los demás. Esta cantidad se denomina frecuencia absoluta. En otras palabras, es el porcentaje que representa a un dato estadístico frente al total de la población o muestra. Prueba de hipótesis: Es una regla que especifica si se puede aceptar o rechazar una afirmación acerca de una población dependiendo de la evidencia proporcionada por una muestra de datos. Prueba de hipótesis para muestras pequeñas: Cuando trabajamos con muestras pequeñas (n < 10) en las que se desconoce si es válido suponer la normalidad de los datos, conviene utilizar pruebas no paramétricas, al menos para corroborar los resultados obtenidos a partir de la utilización de la teoría basada en la normal. Prueba de hipótesis para muestras grandes: Por lo general, se puede considerar como una muestra grande cuando el tamaño de la muestra es mayor o igual a 30. Prueba de hipótesis para una muestra: El valor estimado (estimación puntual para p es p′ donde p′ =x/n, x es el número de aciertos en la muestra y n es el tamaño de la muestra Prueba de hipótesis para 2 muestras: Es similar en muchos aspectos al test para una muestra. Se especifica una hipótesis nula, en la mayoría de los casos se propone que las medias de las dos poblaciones son iguales y se establece la hipótesis alternativa (uni o bilateral). Se especifica un nivel de significación α. Las pruebas paramétricas: Son una herramienta estadística que se utiliza para el análisis de los factores de la población. Esta muestra debe cumplir ciertos requisitos como el tamaño, ya que mientras más grande sea, más exacto será el cálculo.
Las pruebas no paramétricas: También conocidas como pruebas de
distribución libre, son las que se basan en determinadas hipótesis, pero lo datos observados no tienen un organización normal. Generalmente, las pruebas no paramétricas contienen resultados estadísticos que provienen de su ordenación, lo que las vuelve más fáciles de comprender. Media (datos agrupados): Se calcula sumando todos los productos de marca clase con la frecuencia absoluta respectiva y su resultado dividirlo por el número total de datos Moda (datos agrupados): Es el valor que representa la mayor frecuencia absoluta. Mediana (datos agrupados): se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Media (datos no agrupados): también se conoce como PROMEDIO, y
básicamente se calcula como la suma de todos los datos dividida entre el número total de datos. Moda (datos no agrupados): Es la tercera de las medidas de tendencia central para datos no agrupados. Esta medida sirve para identificar cuando un dato aparece continuamente, como también durante un periodo de tiempo determinado. Mediana (datos no agrupados): También conocida como promedio aritmético: esta es el valor encontrado en el centro del conjunto de los datos luego de haber sido ordenados. Varianza: es una medida de dispersión que se utiliza para representar la variabilidad de un conjunto de datos respecto de la media aritmética de los mismos. Asimetría: En estadística, la asimetría es una medida que indica el grado de simetría (o asimetría) de una distribución respecto a su media. Es decir, la asimetría es un parámetro estadístico que sirve para determinar cuánto de simétrica (o asimétrica) es una distribución sin necesidad de representarla gráficamente. Histograma de frecuencia: es un gráfico que se utiliza para representar la distribución de frecuencias de algunos puntos de datos de una variable. Diagrama de pastel: Es una herramienta estadística para representar, visualmente, el comportamiento de un conjunto de datos mediante una figura similar a una torta o un pastel. Polígono de frecuencia relativa: es un tipo de gráfico estadístico en el que se representa el conjunto de datos mediante puntos y se unen con líneas. Curtosis: Es la medida de la forma de una distribución en comparación con la distribución normal, también conocida como campana de Gauss. A través de esta medida, podemos descubrir si una distribución tiene colas pesadas o ligeras, así como si su pico es más pronunciado o suave. Probabilidad: Es la posibilidad de que suceda un fenómeno o un hecho, dadas determinadas circunstancias. Se expresa como un porcentaje. Intervalo de confianza: Es una técnica de estimación utilizada en inferencia estadística que permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una determinada probabilidad) Ojiva: Es un gráfico que muestra la curva de una función de distribución acumulativa dibujada a mano o en software de computado Población: Es un conjunto de elementos o eventos similares que son de interés para alguna pregunta o experimento Muestra: Es un subconjunto de datos perteneciente a una población de datos. Estadísticamente hablando, debe estar constituido por un cierto número de observaciones que representen adecuadamente el total de los datos.
Tarea: Simbología utilizada en probabilidad y estadística
1er cuartil: Son aquellos números que dividen a éstas en cuatro partes porcentualmente iguales. Hay tres cuartiles, Q1, Q2 y Q3. El primer cuartil Q1, es el valor en el cual o por debajo del cual queda aproximadamente un cuarto (25%) de todos los valores de la sucesión (ordenada); El segundo cuartil Q2 es el valor por debajo del cual queda el 50% de los datos (Mediana), el tercer cuartil Q3 es el valor por debajo del cual quedan las tres cuartas partes (75%) de los datos. Para calcular la posición de los cuartiles de un conjunto de datos estadísticos debes multiplicar el número del cuartil por la suma del número total de datos más uno y dividir el resultado entre cuatro.