Está en la página 1de 22

MAT-360

HISTOGRAMAS Y
DISTRIBUCIONES
EMPIRICAS
DOCENTE: ING. FLAVIO CARREÑO HEVIAVACA

eta
N° INTEGRANTES REGISTRO

1 ALVARADO LARA ALONZO 219002118


2 MEDINA PEÑALOZA LUIS FELIPE 219032165
3 ARRATIA MEJIA ROXANA ABIGAIL 219181934
4 SOTO SOTO SAUL 218051735
5 ROCA CARVAJAL PEDRO DANIEL 220009384
6 JUANIQUINA VELASQUEZ WILMA 215111516
7 SEVERICHE CAYUBA YOSMAR 216170621
8 CUELLAR HERRERA YAMIR GUILLERMO 210014296
9
1.-Introducción
Llamamos Estadística a la parte de las Matemáticas que se ocupa de obtener
conclusiones a partir de datos observados. Estos datos pueden corresponder a una
serie de observaciones de cualquier acontecimiento.
Por lo tanto, consideramos a la estadística como una disciplina que posee su propio
método. Tal disciplina emplea conocimiento de otras ciencias como la lógica y la
matemática y por ello se dice que la estadística es una forma razonable de emplear el
sentido común y la aritmética para el manejo de los datos en las investigaciones.
El método estadístico es una secuencia de procedimiento para el manejo de los datos de
la investigación.

2.-DISTRIBUCIONES EMPIRICAS

Para empezar de hablar sobre que es una distribución empírica, primero comencemos a
definir cada uno de eso términos por separado:

Distribuciones: hace referencia a distribución, que es la acción de distribuir o


distribuirse.

Empírico: es un adjetivo que señala que algo está basado en la práctica, experiencia y en la
observación de los hechos.

En sí, las Distribuciones Empíricas hacen referencia a tablas creadas por el usuario con
una serie de valores obtenidos mediante ensayo u observaciones. Donde dichos valores
deben estar ordenadas de manera ascendente de menor a mayor y se las coloca en tablas
para su mejor representación.

Ejemplo. Consideremos los resultados obtenidos en un ensayo de ruptura de varios


cuerpos de hormigón, cuyas unidades están en Kgf/cm2 , los resultados fueron:

267 247 271 296 305 300 276 285 267 289
254 283 290 285 250 265 277 308 287 254
2.2.-Numero de datos(N): Son números que pueden ser comparados, analizados e
interpretados. Determinar el número de datos consiste únicamente en contabilizar la
cantidad de valores en cuestión:

Ejemplo.

267 247 271 296 305 300 276 285 267 289
254 283 290 285 250 265 277 308 287 254

N= 20

2.3.-Rango(R): El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello,
comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor es el rango, aún más dispersos están los datos.

Si lo reagrupamos en forma ascendente el ejemplo anterior tendremos:

247 250 254 254 265 267 267 271 276 277
283 285 285 287 289 290 296 300 305 308

A través de este nuevo grupo, podremos decir que la resistencia madia vario entre los
límites de 274 y el máximo de 308 Kgf/cm 2 y que la amplitud de resultados (A R) fue de:

AR = Rs – Ri = 308 - 247 = 61 Kgf/cm2

Donde:

AR = Amplitud de resultados

Rs = Resultado superior (mayor)

Ri = Resultado inferior (menor)

2.4-Numero de clases (Nc)


El número de clases es el número de grupos en los que vas a agrupar tus datos en una
tabla de frecuencias, pueden ser de 4 a 20 clases y el número es a criterio tuyo
dependiendo del número de datos. A ser usado es arbitrario, no debiendo ser, ni muy
pequeño, ni muy grande para no distorsionar las observaciones y condiciones a una
conclusión incorrecta. Lo ideal es variar entre los valores de 5 a 25. Existe una formula
empírica, FORMULA DE STURGES, que nos permite determinar de una forma
aproximada el valor del número de clase (Nc):

𝑵𝒄 = 𝟏 + 𝟑, 𝟑𝟑𝐥𝐨𝐠⁡(𝑵)

sustituyendo:

𝑵𝒄 = 𝟏 + 𝟑, 𝟑𝟑𝐥𝐨 𝐠(𝟐𝟎) = 𝟓, 𝟑𝟑

Como el Nc debe ser un valor entero, redondeamos y nos da Nc = 5.

Para determinar la Amplitud del Rango (Ar), se lo puede determinar, de una manera
empírica también, de la siguiente forma:

𝑨𝒓 𝟔𝟏
𝑨𝒓 = = = 𝟏𝟐, 𝟐
𝑵𝒄 𝟓

Redondeando para facilidad de cálculo a = 12

A veces el tamaño de muestras es muy grande, la representación individual de todas las


medidas u observaciones no siempre es posible. En estos casos, los resultados de la
muestra pueden ser condensados bajo la forma de una tabla de frecuencia.
3.-FRECUENCIAS

En estadística, la frecuencia (o frecuencia absoluta) de un evento es el número de veces en


que dicho evento se repite durante un experimento o muestra estadística. Comúnmente,
la distribución de la frecuencia suele visualizarse con el uso de histogramas

3.1TIPOS DE FRECUENCIA

3.1.1.-Frecuencia Absoluta (Fa):

La frecuencia absoluta es el número de valores que aparecen en un determinado intervalo


de clase, para obtenerla tenemos que mirar nuestra tabla de valores y nuestra tabla de
intervalos de clase simultáneamente así podremos contabilizar con cuanta frecuencia
encontramos valores entre algún intervalo.

Ejemplo.

247 250 254 254 265 267 267 271 276 277
283 285 285 287 289 290 296 300 305 308
RANGO O FRECUENCIA
CLASE ABSOLUTA(Fa)
247-259 4
259-271 3
271-283 3
283-295 6

295-308 4

3.1.2.-Frecuencia absoluta acumulada (Fac):

La frecuencia absoluta acumulada es el resultado de ir sumando las frecuencias absolutas


de las observaciones o valores o muestras, etc.

Ejemplo.
RANGO O CLASE FRECUENCIA FRECUENCIA
ABSOLUTA(Fa) ABSOLUTA
ACUMULADA (Fi)
247-259 4 4
259-271 3 7
271-283 3 10
283-295 6 16
295-308 4 20

3.1.3.-Frecuencia Relativa (Fr):

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y


el número total de datos. Se calcula dividiendo la frecuencia absoluta con el número de
datos, se puede representar en 3 maneras.

𝐹𝑎
𝐹𝑟 =
𝑁

RANGO O FRECUENCIA FRECUENCIA RELATIVA (Fr)


CLASE ABSOLUTA(Fa) FRACCION DECIMAL PORCENTAJE
247-259 4 4/20 0.2 20%
259-271 3 3/20 0.15 15%
271-283 3 3/20 0.15 15%
283-295 6 6/20 0.3 30%
295-308 4 4/20 0.2 20%

3.1.4.-Frecuencia relativa acumulada (Frac):

La frecuencia relativa acumulada es el cociente entre la frecuencia absoluta acumulada de


un determinado valor y el número total de datos.
𝐹𝑖
𝐹𝑟𝑎𝑐 =
𝑁

Ejemplo.

RANGO FRECUENCIA FRECUENCIA FRECUENCIA RELATIVA


O ABSOLUTA ABSOLUTA ACUMULADA(Fr)
CLASE (Fa) ACUMULADA FRACCION DECIMAL PORCENTAJE
(Fi)
247-259 4 4 4/20 0.2 20%
259-271 3 7 7/20 0.35 35%
271-283 3 10 10/20 0.5 50%
283-295 6 16 16/20 0.8 80%
295-308 4 20 20/20 1 100%

3.2.-MARCA DE CLASE(XC):

La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros como la media
aritmética o la desviación típica. Para calcularlo solo témenos que sumar el límite superior
(Ls), el límite inferior(Li) de cada intervalo y dividirlo todo entre 2:

𝑅𝑠 + 𝑅𝑖
𝑋𝑐 =
2

RANGO O CLASE MARCA DE CLASE(Xc)

247-259 253
259-271 265
271-283 277
283-295 289
295-308 301
3.3.-TABLA DE FRECUENCIAS: Las Tablas de frecuencias son herramientas de
Estadística donde se colocan los datos en columnas representando los distintos valores
recogidos en la muestra y las frecuencias (las veces) en que ocurren. Una tabla de
frecuencia por lo general contiene 6 datos intervalo de clases, marca de clase, frecuencia
absoluta, frecuencia absoluta acumulada, frecuencia relativa y frecuencia relativa
acumulada.

RANGO MARCA FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA


O DE ABSOLUTA(Fa) ABSOLUTA RELATIVA RELATIVA
CLASE CLASE(Xc) ACUMULADA (Fr) ACUMULADA(Fr)
(Fi)
247-259 253 4 4 20% 20%

259-271 265 3 7 15% 35%

271-283 277 3 10 15% 50%

283-295 289 6 16 30% 80%

295-308 301 4 20 20% 100%

4.-Medidas de tendencia central.

Corresponden a valores que generalmente se


ubican en la parte central de un conjunto de datos.
Las medidas estadísticas pretenden "resumir" la
información de la "muestra" para poder tener así un
mejor conocimiento de la Población. (Ellas
permiten analizar los datos en torno a un valor central). Entre éstas están la media
aritmética, la moda y la mediana.
4.1.-Media aritmética

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable
por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de
datos dividida por el número total de dichos datos.

Ejemplo.

∑ 𝑿𝒊
𝑿𝒎 = ⁡ donde i varía de 1,2,3,…..,n
𝒏

Para los valores del ejemplo anterior, tenemos:

𝟐𝟒𝟕 + 𝟐𝟓𝟎 + ⋯ . +𝟑𝟎𝟖


𝑿𝒎 = ⁡ = 𝟐𝟕𝟕, 𝟖𝟎⁡𝐊𝐠𝐟/𝐜𝒎𝟐
𝟐𝟎

Donde podemos decir que la resistencia media del ensayo de ruptura fue de
𝟐𝟕𝟕, 𝟖𝟎⁡𝐊𝐠𝐟/𝐜𝒎𝟐 .

4.2.-Moda (Mo)

Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea,
cual se repite más.

Para nuestro ejemplo tenemos: (254, 267 y 285)

247 250 254 254 265 267 267 271 276 277
283 285 285 287 289 290 296 300 305 308
4.3.-Mediana (Med)

Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente.


Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores
antes y después de él en un conjunto de datos agrupados.
Según el número de valores que se tengan se pueden presentar dos casos:
- Si el número de valores es impar, la Mediana corresponderá al valor central de dicho
conjunto de datos.
- Si el número de valores es par, la Mediana corresponderá al Promedio de los dos valores
centrales (los valores centrales se suman y se dividen por 2).

Ejemplo.

(𝑛+1)°
𝑀𝑒 = ⁡ si n es impar
2

(𝑛/2)°+⁡(𝑛/2+1)°
𝑀𝑒 = si n es par
2

el símbolo (°) indica la posición unas vez agrupados en forma ascendente.

Para el caso que estamos analizando, reemplazando con los valores del ejemplo tenemos:

(20/2)° + ⁡ (20/2 + 1)° 10° + 11°


𝑀𝑒 = =
2 2

247 250 254 254 265 267 267 271 276 277
283 285 285 287 289 290 296 300 305 308

277 + 283 280𝐾𝑔𝑓


𝑀𝑒 = =
2 𝑐𝑚2
5.-Medidas de dispersión

La representación de una distribución solo a través de su media (Xm) no permite una


conclusión correcta con respecto con respecto a la misma. La media de una determinada
distribución, como por ejemplo 35, es la misma, ya sea para 34 y 36 como para 4 y 66.
Entonces para una representación más adecuada de un suceso o evento cualquiera, es
conveniente que asociemos la media, a una medida de dispersión, así tenemos la varianza:

2
∑(xi2 ) − 𝑛 ∗ 𝑥𝑚2
σ =
𝑛−1

Donde σ2 ⁡representa la variancia y σ el desvió estándar que es igual a:

σ2 = √𝜎 2

La variancia como medida de dispersión presenta la desventaja de poseer diferente


dimensión que los datos observados, este problema puede ser eliminado a través de
desvió estándar.

Siguiendo el ejemplo anterior:

1549724 − (20)(277,80)2
σ2 = = 329,852𝐾𝑔𝑓 2 /𝑐𝑚4
20 − 1

σ = √329,852 = 18,1618⁡𝐾𝑔𝑓/𝑐𝑚2

un desvió standard de 10 unidades puede ser considerado pequeño si el valor medio de la


muestra es de 10000. Pero, lo mismo no puede ser dicho si la muestra es igual a 100. Para
sanar esa dificultad, podemos asociar el desvió estándar otra medida de dispersión que es
el coeficiente de variación

5.1.-Coeficiente de variación

Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del
conjunto y por lo general se expresa en porcentaje para su mejor comprensión.

𝜎
𝐶𝑣 = ∗ 100
𝑥𝑚

Para el ejemplo:
18,1618
𝐶𝑣 = ∗ 100 = 6,53%
277,80

6.- HISTOGRAMA

En estadística, un histograma es una


representación gráfica de una variable en
forma de barras, donde la superficie de cada
barra es proporcional a la frecuencia de los
valores representados. Sirven para obtener
una "primera vista" general, o panorama, de la distribución de la población, o de la
muestra, respecto a una característica, cuantitativa y continua (como la longitud o el
peso).
En un histograma el eje de las (o abscisas) consiste del rango en el cual se encuentran
los datos. Ahora, las bases de los rectángulos consisten de los intervalos en los cuales
agrupamos dichos datos.

Por otro lado, en el eje de las (u ordenadas) tenemos más opciones, dependiendo estas
opciones es el tipo de histograma que tenemos.

6.1.- LA UTILIZACIÓN DE LOS HISTOGRAMAS

Los histogramas son utilizados siempre por la ciencia estadística. Su función es exponer
gráficamente números, variables y cifras de modo que los resultados se visualicen más
clara y ordenadamente. El histograma es siempre una representación en barras y por eso
es importante no confundirlo con otro tipo de gráficos. Se estima que por el tipo de
información brindada y por la manera en que ésta es dispuesta, los histogramas son de
especial utilidad y eficacia para las ciencias sociales ya que permiten comparar datos
sociales como los resultados de un censo, la cantidad de mujeres y/o hombres en una
comunidad, el nivel de analfabetismo o mortandad infantil, etc.
6.2.-Los dos tipos principales de histogramas son los siguientes:

 Histograma de frecuencias absolutas. Representa la frecuencia absoluta mediante


la altura de las barras.
 Histograma de frecuencias relativas. Representa la frecuencia relativa mediante la
altura de las barras.

Así, ya que conocemos las características de un histograma, tenemos que para construir
uno, dado un conjunto de datos, debemos seguir los siguientes pasos.

 Dibujamos el eje de las abscisas de tal forma que incluya como mínimo el rango de los
datos y, posteriormente, dividimos este rango en los intervalos dados.
 Dibujamos el eje de las ordenadas representando las frecuencias absolutas o relativas
según sea el caso.
 Se dibujan los rectángulos de anchura igual y proporcional al intervalo (en nuestro
caso todos tendrán la misma anchura) y de altura igual a la frecuencia absoluta o
relativa, según sea el caso.

Ejemplo. Consideremos los siguientes datos:


Nuestro histograma de frecuencias absolutas sería el siguiente

Por otro lado, nuestro histograma de frecuencias relativas sería el siguiente

6.3.-Polígono de frecuencia

Un polígono de frecuencias da la misma información de un histograma, para esto


graficamos un punto por cada clase del conjunto de datos en donde en la entrada de las
abscisas se toma el valor del punto medio de la clase y en la entrada las ordenadas tendrán
en mismo valor que la altura del rectángulo. Al final, unimos cada punto con su sucesor y
su antecesor.

Ejemplo. Utilizando el mismo conjunto de datos del ejemplo anterior


6.4.-Histograma y polígono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene


el histograma de frecuencias acumuladas y su correspondiente polígono.

Ejemplo. Utilizando el mismo conjunto de datos del ejemplo anterior


6.5.-Histogramas con intervalos de amplitud diferente

En este caso, el histograma debería representar la frecuencia de cada intervalo con el área
de la barra y no con su altura. Por lo tanto, calculamos la altura de cada barra de la
siguiente manera

En donde

 es la altura del intervalo


 es la frecuencia absoluta o relativa del intervalo, según sea el caso.
 es la amplitud del intervalo

La idea del polígono de frecuencias sigue siendo exactamente la misma.

Ejemplo. Consideremos una agrupación distinta de los datos de los ejemplos anteriores

Su histograma y su polígono de frecuencias relativas sería el siguiente


7.-Tipos de histogramas

7.1.-Histograma en forma de campana: El histograma en forma de campana es una


curva uniformemente distribuida, donde el lado izquierdo es igual que el lado derecho.
Esto significa que las muestras que se tomaron siguen o caen dentro del estándar de la
operación dada.
7.2.-Histograma sesgado a la derecha: Este tipo de histograma se desvía de la curva
normal, la forma de la distribución es asimétrica cargada a la derecha.

7.3.-Histograma sesgado a la izquierda: Este tipo de histograma también se desvía de


la curva normal, la forma de la distribución fuera asimétrica cargada a la izquierda.
7.4.-Histograma de precipicio: Un histograma con forma de precipicio o acantilado
muestra cierto pico en la gráfica que no es necesariamente el estándar. Esto puede
atribuirse a un problema en la recolección de datos o en la operación de la máquina.

7.5.-Histograma dentado: Esta es la combinación de varias formas de precipicio o


acantilado, lo que indica que la distribución es irregular.
7.6.-Histograma isla: Este histograma normalmente es el resultado de un pequeño pico
aislado del resto de histograma. Sugiere que podría existir un pequeño grupo de datos
provenientes de una distribución distinta, como podría ser el caso de laguna anormalidad
en el proceso, algún error de medición o la inclusión de datos de un proceso diferente.

8.-Bibliografía
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/histograma.h
tml#tema_que-es-un-histograma

http://asesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica/DOCUMENTOS/TEM
A%201/7.%20HISTOGRAMAS.pdf

https://qdoc.tips/trabajo-de-histograma-pdf-free.html

Medidas de dispersión - Qué es, definición y concepto | 2021 | Economipedia

Medidas de Tendencia Central - EcuRed

También podría gustarte