Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INDICE ____________
1.8 HISTOGRAMAS.............................................................................................. 23
BIBLIOGRAFÍAS: ................................................................................................. 25
1
1.1 Conceptos básicos de estadística
Estadística:
Se puede decir que es la Ciencia de los Datos y que su principal objetivo es mejorar
:la comprensión de los hechos a partir de la información disponible.
Tipos de estadística:
Teoría de decisión:
2
a hacer, debido a que el resultado se ve afectado por factores externos que no están
en nuestro control.
3
D: Espacio de opciones. Es el conjunto de posibles alternativas, debe de
construirse de manera que sea exhaustivo (que agote todas las posibilidades
que en principio parezcan razonables) y excluyente (que la elección de uno
de los elementos de D excluya la elección de cualquier otro).
D = {d1,d2,...,dk}.
Ei = {Ei1,Ei2,...,Eimi}., i=1,2,…,k.
C = {c1,c2,...,ck}.
Población:
Tipos de población:
4
Muestra:
Muestra aleatoria:
Parámetro aleatorio:
Se llama variable aleatoria aquella que toma diversos valores o conjuntos de valores
con distintas probabilidades. Existen 2 características importantes de una variable
aleatoria, sus valores y las probabilidades asociadas a esos valores.
Una tabla, gráfico o expresión matemática que dé las probabilidades con que una
variable aleatoria toma diferente valores, se llama distribución de la variable
aleatoria.
5
1.2 Descripción de datos
Los datos no agrupados son los datos que recopila por primera vez de un
experimento o estudio. Los datos son sin procesar, es decir, no están
ordenados en categorías, clasificados o agrupados de otra manera. Un
conjunto desagrupado de datos es básicamente una lista de números.
6
originales), pero puede encontrar una estimación. La fórmula para estimar la
media muestral para datos que han sido agrupados es:
x̄ es la media muestral,
x es el punto medio de la clase (o categoría),
f es la frecuencia de clase.
Datos no agrupados:
Frecuencia de clase:
Punto que divide a la clase en dos partes iguales. Es el promedio entre los límites
superior e inferior de la clase. Intervalo de clase: para una distribución de
7
frecuencias que tiene clases del mismo tamaño, el intervalo de clase se obtiene
restando el límite inferior de una clase del límite inferior de la siguiente.
Frecuencia relativa:
Punto medio:
Punto medio es el punto que divide a un segmento en dos partes iguales. El punto
medio de un segmento, es único y equidista de los extremos del segmento.
Cumpliendo esta última condición, pertenece a la mediatriz del segmento. La
fórmula para determinar el punto medio de un segmento en el plano, con
coordenadas: (x1,y1) y (x2,y2) es: [(x1 + x2) / 2] + [(y1 + y2) / 2]
8
Limites:
Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre
los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
9
Media aritmética:
La media aritmética es un tipo de media que otorga la misma ponderación a todos
los valores.
Existen muchos tipos de media y la más conocida es la media aritmética. Sin
embargo, la idea general se mantiene en todos los tipos de media: queremos saber
un valor promedio. Al ser una medida de tendencia central, lo que busca es
aportarnos información sobre el centro.
La media aritmética es lo que se conoce como media al uso. Sumamos todos los
valores y lo dividimos entre la cantidad de observaciones.
Símbolo de la media aritmética:
El símbolo de la media aritmética es una X con una barra encima. Por lo que
quedaría así ↓
Símbolo de la media aritmética → x̄
Fórmula de la media aritmética
Media geométrica:
La media geométrica es un tipo de media que se calcula como la raíz del producto
de un conjunto de números estrictamente positivos
La media geométrica se calcula como un producto conjunto. Es decir, que todos los
valores se multiplican entre sí. De modo que si uno de ellos fuera cero, el producto
total sería cero. Por ello, debemos siempre tener en cuenta que a la hora de calcular
la media geométrica necesitamos números que sean únicamente positivos.
Uno de sus principales usos es para calcular medias sobre porcentajes, pues su
cálculo ofrece unos resultados más adaptados a la realidad.
Fórmula de la media geométrica
10
Media ponderada:
La media ponderada es un tipo de media que otorga diferentes pesos a los distintos
valores sobre los que se calcula.
Se diferencia de la media aritmética en que no le da la misma importancia a todos
los valores. De hecho, como veremos más tarde, en realidad la media aritmética es
una media ponderada en la que todos los valores son igual de importantes.
Fórmula de la media ponderada
Mediana:
La mediana es un estadístico de posición central que parte la distribución en dos,
es decir, deja la misma cantidad de valores a un lado que a otro.
Para calcular la mediana es importante que los datos estén ordenados de mayor a
menor, o al contrario de menor a mayor.
La mediana, junto con la media y la varianza es un estadístico muy ilustrativo de
una distribución. Al contrario que la media que puede estar desplazada hacia un
lado o a otro, según la distribución, la mediana siempre se sitúa en el centro de esta.
Fórmula de la mediana
La fórmula no nos dará el valor de la mediana, lo que nos dará es la posición en la
que está dentro del conjunto de datos. Debemos tener en cuenta, en este sentido,
si el número total de datos u observaciones que tenemos (n) es par o impar. De tal
forma que la fórmula de la mediana es:
Cuando el número de observaciones es par:
Mediana = (n+1) / 2 → Media de las observaciones
11
Moda:
La moda estadística de un conjunto de datos, se define como el número que está
representado más veces dentro de esos datos, es decir, aquel número que presenta
una mayor frecuencia absoluta dentro de la muestra.
¿Cómo se calcula la moda?
La moda puede ser calculada tanto para variables cuantitativas como para variables
cualitativas.
Medidas de dispersión:
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de
arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de
una variable.
las medidas de dispersión son números que indican si una variable se mueve
mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es
conocer de manera resumida una característica de la variable estudiada. En este
sentido, deben acompañar a las medidas de tendencia central.
Varianza:
La varianza es una medida de dispersión que representa la variabilidad de una serie
de datos respecto a su media. Formalmente se calcula como la suma de los residuos
al cuadrado divididos entre el total de observaciones.
También se puede calcular como la desviación típica al cuadrado. Dicho sea de
paso, entendemos como residuo a la diferencia entre el valor de una variable en un
momento y el valor medio de toda la variable.
Fórmula
12
Esperanza matemática, valor esperado o media: Es la media de nuestra serie de
datos.
Desviación: La desviación es la separación que existe entre un valor cualquiera de
la serie y la media.
Ahora, entendiendo estos dos conceptos la desviación típica se calculará de forma
similar a la media. Pero tomando como valores las desviaciones.
Fórmulas para calcular la desviación típica
Desviación media:
La dispersión estadística es el grado en que una distribución de datos se aleja, o se
acerca, en valor absoluto a la media aritmética, como estadístico de posición central.
Por tanto, las medidas de dispersión van a acompañar siempre a esa media o
promedio.
De esta forma, estarían informando de la variabilidad o dispersión de los datos en
relación a ella. A mayores valores, como veremos a continuación, mayor dispersión
estadística.
https://economipedia.com/definiciones/dispersion-estadistica.html
Desviación mediana:
la desviación absoluta mediana (DMA) es una medida robusta de la variabilidad de
una muestra univariada de datos cuantitativos. También puede referirse al
parámetro poblacional que estima la MAD calculada a partir de una muestra.
Para un conjunto de datos univariados X 1, X 2,..., X n, la MAD se define como la
mediana de las desviaciones absolutas de la mediana de los datos
https://academia-lab.com/enciclopedia/desviacion-mediana-absoluta/
Rango:
El rango es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística. Su fórmula es:
13
R = Máxx – Mínx
14
1.5 Distribución de Frecuencias:
Definición de distribución de frecuencias La distribución de frecuencias o tabla de
frecuencias es una ordenación en forma de tabla de los datos estadísticos,
asignando a cada dato su frecuencia correspondiente.
Frecuencia acumulada:
15
Frecuencia relativa:
𝑓𝑟𝑖 = 𝑓𝑖 /𝑁
16
Frecuencia porcentual:
Límites de clase:
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
17
Rango de la clase:
Fronteras de clase:
Son los puntos medios entre límites de clases adyacentes. Los límites de una clase
estarán siempre contenidos entre las fronteras de la misma clase y tendrán mayor
aproximación que los datos, y por lo tanto también que los límites.
Marca de clase:
18
Intervalo de clase:
Intervalo abierto
Un intervalo abierto es aquel que no incluye los extremos entre los cuales está
comprendido, pero sí todos los valores ubicados entre estos. Se representa
mediante una expresión del tipo a < x < b ó (a;b).
Por ejemplo, si tenemos el intervalo abierto (1;5), tendremos el conjunto de
números mayores a 1 y menores que 5. Sin incluir el 1 y el 5.
Intervalo cerrado
Un intervalo cerrado es aquel que incluye los extremos del intervalo y todos los
valores comprendidos entre estos. Se representa con una expresión del tipo a ≤ x
≤ b ó [a;b].
Intervalo semiabierto
Un intervalo semiabierto es aquel que incluye tan solo uno de los extremos de los
valores que están entre ellos, de modo que el otro extremo queda excluido.
Pueden estar incluidos o excluidos tanto el extremo derecho como el izquierdo.
19
Diagrama de tallos y hojas:
En un diagrama de tallo y hoja cada dato está separado por la hoja, que es su último
dígito, y el tallo, que son las cifras restantes. De modo que en un diagrama de tallo
y hoja se pone cada hoja en la línea de su tallo correspondiente.
20
Representar cada dato en el diagrama de tallo y hoja. Los tallos se colocan
en la columna de la izquierda en orden ascendente, mientras que las hojas
se ponen en la columna de la derecha a la altura de su tallo
correspondiente y también en orden ascendente.
Diagrama de Pareto:
Es una gráfica para organizar datos de forma que estos queden en orden
descendente, de izquierda a derecha y separados por barras.
21
Determinar el porcentaje acumulado, que es equivalente a la suma del
porcentaje de la categoría más todos los porcentajes anteriores.
Representar en una gráfica las frecuencias absolutas mediante barras y los
porcentajes acumulados mediante un polígono de frecuencias.
1.7 Técnicas de Muestreo
El muestreo es una técnica de selección de miembros individuales o de un
subconjunto de la población para hacer inferencias estadísticas a partir de ellos y
estimar las características de toda la población.
También es un método conveniente en cuanto al tiempo y eficaz en función de los
costos y, por lo tanto, constituye la base de cualquier diseño de investigación. Las
técnicas de muestreo pueden utilizarse en un programa informático de encuestas
de investigación para una derivación óptima.
Por ejemplo, si un fabricante de medicamentos desea investigar los efectos
secundarios adversos de un medicamento en la población del país, es casi
imposible llevar a cabo un estudio de investigación en el que participen todos. Para
ello, el investigador elige tener una muestra de personas de cada grupo demográfico
para luego investigar, dándole una retroalimentación indicativa sobre el
comportamiento del medicamento.
Métodos de muestreo:
Existen dos métodos de muestreo: El muestreo probabilístico y el no
probabilístico:
Muestreo probabilístico: El muestreo probabilístico es una técnica de
muestreo en la que un investigador establece una selección de unos pocos
criterios y elige al azar a los miembros de una población. Todos los miembros
tienen la misma oportunidad de formar parte de la muestra con este
parámetro de selección.
Muestreo no probabilístico: En el muestreo no probabilístico, el
investigador elige al azar a los miembros de la investigación. Este método de
muestreo no es un proceso de selección fijo o predefinido. Esto dificulta que
todos los elementos de una población tengan las mismas posibilidades de
ser incluidos en una muestra.
22
1.8 Histogramas
En estadística, un histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a
la frecuencia de los valores representados. Sirven para obtener una "primera vista"
general, o panorama, de la distribución de la población, o de la muestra, respecto a
una característica, cuantitativa y continua (como la longitud o el peso). De esta
manera ofrece una visión de grupo permitiendo observar una preferencia, o
tendencia, por parte de la muestra o población por ubicarse hacia una determinada
región de valores dentro del espectro de valores posibles (sean infinitos o no) que
pueda adquirir la característica. Así pues, podemos evidenciar comportamientos,
observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas
las partes que componen la población o la muestra, o, en contraposición, poder
observar el grado de variabilidad, y por ende, la dispersión de todos los valores que
toman las partes, también es posible no evidenciar ninguna tendencia y obtener que
cada miembro de la población toma por su lado y adquiere un valor de la
característica aleatoriamente sin mostrar ninguna preferencia o tendencia.
23
Se utilizan para relacionar variables cuantitativas continuas. Para variables
cuantitativas discretas las barras se dibujan separadas y el gráfico se llama
diagrama de frecuencias, porque la variable representada en el eje horizontal ya no
representa un espectro continuo de valores, sino valores cuantitativos específicos,
igual que ocurre en un diagrama de barras, usado para representar una
característica cualitativa o categórica. Su utilidad se hace más evidente cuando se
cuenta con un gran número de datos cuantitativos y que se han agrupado en
intervalos de clase. Ejemplos de su uso es la representación de edades o estaturas
de una población. Por comodidad, sus valores se agrupan en clases, es decir, en
intervalos continuos. En los casos en los que los datos son cualitativos (no
numéricos), como cierto grado de acuerdo o nivel de estudios, es preferible
un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas
que en ciencias naturales y exactas. Y permite la comparación de los resultados de
un proceso.
24
BIBLIOGRAFÍAS:
25
Unidad III.pdf (itpn.mx)
Licenciado en Matemáticas. Universidad de los Andes.
Última edición el 20 de mayo de 2021.
Marca de clase: concepto, para qué sirve, cómo se saca, ejemplos (lifeder.com)
Editorial Grudemi (2019). Intervalos. Recuperado de Enciclopedia Económica
(https://enciclopediaeconomica.com/intervalos/). Última actualización: marzo 2021.
Editorial Grudemi (2019). Intervalos. Recuperado de Enciclopedia Económica
(https://enciclopediaeconomica.com/intervalos/). Última actualización: marzo 2021.
http://probabilidadyestadisticaitsav.blogspot.com/2012/06/33-medidas-de-
tendencia-central-media.html
https://cursos.clavijero.edu.mx/cursos/029_rm/modulo4/contenidos/tema4.2.html
https://www.cecytcampeche.edu.mx/BibliotecaVirtual/6toSemestre/06_BAS_Prob_
y_Estadistica_2do_parcial.pdf
https://sites.google.com/site/probyestacecytechig/parcial-i/conceptos-
generales/distribucion-de-frecuencias
https://es.scribd.com/document/389804758/3-5-Parametros-Para-Datos-
Agrupados-Alumnos
https://economipedia.com/definiciones/media-aritmetica.html
Fórmula de la media geométrica
https://economipedia.com/definiciones/media-geometrica.html
https://economipedia.com/definiciones/media-ponderada.html
https://economipedia.com/definiciones/mediana.html
https://estadisticamente.com/moda-estadistica/
https://economipedia.com/definiciones/medidas-de-dispersion.html
https://economipedia.com/definiciones/varianza.html
https://economipedia.com/definiciones/desviacion-tipica.html
26