Está en la página 1de 4

Asignatura Datos del estudiante Fecha

Apellidos: CARRASCAL BELTRAN


ESTADISTICA I 11/10/2022
Nombre: JESUS ANTONIO

Actividad
Protocolo individual de la unidad n°: 2 DISTRIBUCIÓN EMPÍRICA

Análisis y síntesis: 
Síntesis e interpretación personal de los temas vistos en la unidad

DISTRIBUCIÓN EMPÍRICA

los matemáticos rusos Andrey Kolmogorov y Nikolai Smirnov. Quienes


inventaron la famosa prueba Kolmogorov Smirnov en la década de 1930-1940,
los que buscan básicamente era saber que tan buen estimador era la
distribución empírica respecto al modelo predictivo. "Ellos se preguntaban si era
posible que hubiera una especie de convergencia entre estos dos modelos".

Según lo anterior, entonces podemos decir que es la función de distribución


asociada con la medida empírica de una muestra. Esta función de distribución
acumulativa es una función conocida como escalera, que salta (1 / n) en cada
uno de los (n) puntos de datos. Su valor en cualquier valor especificado de la
variable medida es la fracción de observaciones de la variable medida que son
menores o iguales al valor especificado.

DATOS AGRUPADOS

Básicamente consiste en agrupar los datos en intervalos de una misma


amplitud, denominados clases. A cada clase se le asignan valores de cada tipo
de frecuencias.

Explicaré su clasificación mediante el siguiente ejemplo:

Se consultaron 50 personas sobre cuál era su edad y obtuvimos los siguientes


resultados:

38 -15 - 10 - 12 - 62 - 46 - 25 - 56 - 27 - 24 - 23 - 21 - 20 - 25 - 38 - 27 - 48 - 35 -
50 - 65 - 59 - 58 - 47 - 42 - 37 - 35 - 32 - 40 - 28 - 14 - 12 - 24 - 66 - 73 - 72 - 70 -
68 - 65 - 54 - 48 - 34 - 33 - 21 - 19 - 61 - 59 - 47 - 46 - 30 - 30.

Lo primero que toca hacer es determinar el valor máximo y mínimo, que para
este caso sería:

Valor Máximo: 73 años


Valor Mínimo: 10 años

Calcular el Rango: obtener el rango de edades en que se encuentran los


Asignatura Datos del estudiante Fecha
Apellidos: CARRASCAL BELTRAN
ESTADISTICA I 11/10/2022
Nombre: JESUS ANTONIO

encuestados, sólo basta con determinar la diferencia que hay entre el más joven
y el más adulto.
Rango = Valor máximo – Valor mínimo
Rango = 73 – 10
Rango = 63 años
Número de intervalos:
Marca de clase: la marca de clase simplemente es el punto medio que hay en
cada intervalo. Lo que se debe hacer es sumar límite inferior y superior de cada
intervalo y dividir el resultado entre 2.

Intervalo de clase: a los intervalos también se les conoce como clases.


Simplemente son las categorías en las cuales vamos a encasillar a los
encuestados. Existen varias formulas para calcular intervalos, pero para este
ejemplo usaremos la siguiente:

Intervalos = √n
n= 50 = 1+3.322 Log (n)

Amplitud de clase: para determinar la amplitud de clase, primeramente,


debemos conocer el Rango y saber entre cuantos intervalos repetiremos las
categorías. Dividimos Rango entre Intervalos y obtendremos la Amplitud.

Amplitud = Rango ÷ Intervalos = 63 ÷ 7 = 9

Posterior a estos, determinamos para cada intervalo, lo visto en las tutorías


anteriores, con respecto a la Frecuencia absoluta, Frecuencia acumulada,
Frecuencia relativa y Frecuencia relativa acumulada. Obteniendo la
consolidación de todos los datos finalmente en la siguiente tabla:

Edad Marca Frecuencia Frecuencia Frecuencia Frecuencia %


(x) de absoluta absoluta relativa (fr) relativa
Clase (fi) acumulada acumulada
(xi) (Fi) (Fr)
[10-19) 14.5 5 5 0.1 0.1 10%
(19-28) 23.5 11 16 0.22 0.32 22%
(28-37) 32.5 8 24 0.16 0.48 16%
(37-46) 41.5 5 29 0.1 0.58 10%
(46-55) 50.5 8 37 0.16 0.74 16%
(55-64) 59.5 6 43 0.12 0.86 12%
(64-73] 68.5 7 50 0.14 1 14%
Total 50 Total 1 100
Asignatura Datos del estudiante Fecha
Apellidos: CARRASCAL BELTRAN
ESTADISTICA I 11/10/2022
Nombre: JESUS ANTONIO

DATOS NO AGRUPADOS

Los datos no agrupados son el conjunto de datos que no se ha clasificado y se


es presentada en su forma de aparición en una tabla de datos donde cada valor
se representa de forma individual. Por lo general este conjunto comprende una
cantidad de elementos menor a 30 (n<30) con poca o nula repetición.
El manejo de estos datos es simple, se recolectan los datos de la población de
estudio y dichos datos se distribuyen en una tabla de datos y se analizan sin
necesidad de formar clases con ellos.
Por ejemplo: al investigar la edad a un grupo de 20 niños en datos no
agrupados, es decir, vienen los 20 niños y así como nos dan la edad así la
anotamos.
2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 Total: 20 niños.
Estos serías los datos no agrupados, ya que no los hemos clasificado y
contado.1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 Total: 20 niños.
Los datos no agrupados también los podemos ordenar, por ejemplo, de la edad
mínima a la edad máxima, ya que no estaríamos contabilizándolos, ni
clasificándolos, solamente estaríamos ordenándolos.
Variable: se presentan cuando el número de valores que puede presentar
la variable no es muy elevado, y en ese caso podemos observar todos los
valores de esa variable. Como ejemplo, tenemos la variable Discreta que no
presenta excesivos valores.
Frecuencia absoluta: nos representa el numero de veces que un dato se repite
dentro del consolidado de la muestra.
Frecuencia relativa: es esa porción de elementos que hacen parte de una clase
o categoría, la cual obtenemos dividiendo la frecuencia absoluta entre el número
de datos de la muestra.
Frecuencia absoluta acumulada: es el acumulado o suma de las frecuencias
absolutas, indica cuantos datos se van contando hasta ese momento o cuántos
datos se van reportando.
Frecuencia relativa acumulada: Es la suma de las frecuencias relativas, y se
puede calcular también dividiendo la frecuencia acumulada entre el número de
datos del estudio.
DIFERENCIAS ENTRE LOS DATOS AGRUPADOS Y NO AGRUPADOS
La principal diferencia entre los datos agrupados y los no agrupados es que los
agrupados están clasificados según un criterio y los no agrupados se encuentran
Asignatura Datos del estudiante Fecha
Apellidos: CARRASCAL BELTRAN
ESTADISTICA I 11/10/2022
Nombre: JESUS ANTONIO

en el mismo formato que cuando se recopilaron.


Reflexión: los datos son la representación de una variable de tipo cualitativa o
cuantitativa que expresamos a través de símbolos, números o letras. Son muy
importantes en el campo de la estadística, ya que suponen una pieza
imprescindible para poder trabajar, conocer la situación actual, por ejemplo, de
una empresa y así tomar las mejores decisiones.

Discusión: 
Dudas, desacuerdos, discusiones

Dificultades presentadas con el tema: Distribución Empírica.


Me gustaría ahondar un poco más en el tema de la Distribución Empírica
durante las próximas tutorías, ya que es un tema con mucha información.
Del resto, no tuve dificultad para comprender los temas.

También podría gustarte