Está en la página 1de 5

Asignatura Datos del estudiante Fecha

Apellidos: Aparicio De La Rosa


Fundamentos de
05/Mayo/2023
Estadística
Nombre: Berlys Sandrith

Actividad
Protocolo individual de la unidad n°: 2

Análisis y síntesis: 
Síntesis e interpretación personal de los temas vistos en la unidad

 ANALISIS DE DATOS

El análisis de datos es una parte fundamental de la estadística. Se trata de un


proceso sistemático y riguroso que tiene como objetivo extraer información útil
de los datos y tomar decisiones informadas basadas en esta información.
Desde un enfoque académico, el análisis de datos en estadística se divide en
varias etapas:

1. Recopilación de datos: La primera etapa es la recopilación de los datos.


Los datos pueden ser obtenidos a través de encuestas, experimentos,
registros administrativos, entre otros.
2. Preparación de datos: Una vez que se han recopilado los datos, se debe
realizar una limpieza y preparación de los mismos. Esto puede incluir la
eliminación de datos faltantes, la identificación y eliminación de outliers o
valores extremos, la transformación de variables, entre otros.
3. Análisis exploratorio de datos: El análisis exploratorio de datos es una
técnica que permite describir y visualizar los datos de manera resumida.
Esto puede incluir la creación de gráficos, tablas de frecuencias, medidas
de tendencia central y dispersión, entre otros.
4. Modelado estadístico: Una vez que se ha explorado los datos, se puede
comenzar a construir modelos estadísticos que permitan explicar los
datos y hacer predicciones. Esto puede incluir la utilización de modelos
de regresión, análisis de varianza, modelos de series temporales, entre
otros.
5. Validación de modelos: Es importante validar los modelos construidos
para asegurarse de que sean confiables y precisos. Esto se puede lograr
utilizando técnicas de validación cruzada, evaluando la calidad del ajuste,
entre otros.
6. Comunicación de resultados: Finalmente, es importante comunicar los
resultados del análisis de datos de manera clara y concisa. Esto puede
incluir la creación de informes, presentaciones, gráficos, tablas, entre
otros.
En resumen, el análisis de datos en estadística desde un enfoque académico
implica una serie de etapas que van desde la recopilación de datos hasta la
comunicación de resultados. Cada una de estas etapas es importante para
Asignatura Datos del estudiante Fecha
Apellidos: Aparicio De La Rosa
Fundamentos de
05/Mayo/2023
Estadística
Nombre: Berlys Sandrith

garantizar que los resultados obtenidos sean confiables y útiles para la toma de
decisiones informadas.

 NUMERO DE CLASES

El número de clases es una de las decisiones importantes que se deben tomar


al construir un histograma en estadística. Desde un enfoque académico, la
elección del número de clases se basa en diversas técnicas que se utilizan para
determinar la cantidad óptima de clases en un histograma. Algunas de estas
técnicas son:

Regla de Sturges: Esta técnica se basa en la fórmula de Sturges, que establece


que el número de clases en un histograma debe ser aproximadamente igual a la
raíz cuadrada del tamaño de la muestra. La fórmula es: k = 1 + 3.322 log(n),
donde k es el número de clases y n es el tamaño de la muestra.

Regla de la raíz cuadrada: Esta técnica sugiere que el número de clases en un


histograma debe ser igual a la raíz cuadrada del tamaño de la muestra.

Regla de la amplitud: Esta técnica se basa en la amplitud del rango de los datos
y establece que el número de clases en un histograma debe ser igual al rango
de los datos dividido por la amplitud de cada clase.

Método de Scott: Este método sugiere que el ancho de cada clase debe ser
igual a 3.5 veces la desviación estándar de los datos dividido por la raíz
cuadrada del tamaño de la muestra. El número de clases se calcula dividiendo el
rango de los datos por el ancho de las clases.

Método de Freedman-Diaconis: Este método sugiere que el ancho de cada clase


debe ser igual al rango intercuartílico de los datos dividido por la raíz cuadrada
del tamaño de la muestra. El número de clases se calcula dividiendo el rango de
los datos por el ancho de las clases.
En general, la elección del número de clases en un histograma dependerá del
tamaño de la muestra, la amplitud de los datos, la distribución de los mismos y el
propósito del análisis. Es importante tener en cuenta que la elección del número
de clases puede afectar la interpretación de los resultados, por lo que se deben
considerar cuidadosamente las diferentes técnicas y elegir la que mejor se
adapte a las necesidades del análisis.

Discusión: 
Asignatura Datos del estudiante Fecha
Apellidos: Aparicio De La Rosa
Fundamentos de
05/Mayo/2023
Estadística
Nombre: Berlys Sandrith

Dudas, desacuerdos, discusiones


 INTERVALOS Y SUS LIMITES
En estadística, un intervalo es un rango de valores que se utiliza para agrupar
los datos en un histograma o para definir los límites de un intervalo de confianza.
Desde un enfoque académico, los intervalos y sus límites se determinan
utilizando técnicas estadísticas que dependen del tipo de datos que se están
analizando.
Si se están analizando datos continuos, los intervalos se pueden definir
utilizando la amplitud de cada clase en un histograma. Por ejemplo, si se tiene
un conjunto de datos con un rango de 0 a 100 y se desea crear un histograma
con 10 clases, se pueden definir los límites de cada intervalo como 0-10, 10-20,
20-30, etc. La amplitud de cada clase se calcula dividiendo el rango de los datos
por el número de clases.
En el caso de datos discretos, los intervalos se pueden definir utilizando los
valores de los datos. Por ejemplo, si se tiene un conjunto de datos que
representa el número de estudiantes en una clase y los valores posibles son 0,
1, 2, 3, 4, 5, se pueden definir los límites de cada intervalo como 0-1, 1-2, 2-3,
etc.
En cuanto a los límites de los intervalos, se pueden definir de diferentes
maneras según el propósito del análisis. En general, los límites pueden ser
inclusivos o exclusivos, lo que significa que pueden incluir o excluir el límite
inferior o superior del intervalo. Por ejemplo, si se define un intervalo de 0 a 10,
los límites inclusivos serían [0,10], lo que significa que el intervalo incluye los
valores 0 y 10. En cambio, los límites exclusivos serían (0,10), lo que significa
que el intervalo no incluye los valores 0 y 10.
Es importante tener en cuenta que la elección de los límites de los intervalos
puede afectar la interpretación de los resultados, por lo que se deben considerar
cuidadosamente las diferentes técnicas y elegir la que mejor se adapte a las
necesidades del análisis.

 FRECUENCIA ABSOLUTA
La frecuencia absoluta es un concepto fundamental en estadística que se utiliza
para describir la distribución de un conjunto de datos. Desde un enfoque
académico, la frecuencia absoluta se define como el número de veces que un
determinado valor aparece en un conjunto de datos.

Por ejemplo, si se tiene un conjunto de datos {2, 3, 4, 3, 1, 4, 2, 5, 2, 4}, la


frecuencia absoluta del valor 2 es 3, la frecuencia absoluta del valor 3 es 2, la
frecuencia absoluta del valor 4 es 3, la frecuencia absoluta del valor 1 es 1 y la
frecuencia absoluta del valor 5 es 1.

La frecuencia absoluta se puede representar en una tabla de frecuencias, que


Asignatura Datos del estudiante Fecha
Apellidos: Aparicio De La Rosa
Fundamentos de
05/Mayo/2023
Estadística
Nombre: Berlys Sandrith

es una herramienta que se utiliza para organizar y resumir la información


contenida en un conjunto de datos. La tabla de frecuencias muestra cada valor
en el conjunto de datos y su frecuencia absoluta correspondiente.

Además, la frecuencia absoluta se utiliza en la construcción de gráficos


estadísticos como el histograma, que muestra la distribución de frecuencia de
los datos.

Es importante tener en cuenta que la frecuencia absoluta es solo una medida


descriptiva y no proporciona información sobre la distribución de los datos en
relación a otros valores. Por lo tanto, es común utilizar otras medidas
estadísticas como la frecuencia relativa, la frecuencia acumulada y la media
para obtener una comprensión más completa de la distribución de los datos.

 FRECUENCIA RELATIVA
La frecuencia relativa es otra medida importante en estadística que se utiliza
para describir la distribución de un conjunto de datos. Desde un enfoque
académico, la frecuencia relativa se define como la proporción o el porcentaje de
veces que un valor determinado aparece en un conjunto de datos.

Por ejemplo, si se tiene el conjunto de datos {2, 3, 4, 3, 1, 4, 2, 5, 2, 4}, la


frecuencia relativa del valor 2 se calcula dividiendo la frecuencia absoluta del
valor 2 (que es 3) por el tamaño total del conjunto de datos (que es 10). Por lo
tanto, la frecuencia relativa del valor 2 es 0,3 o 30%.

En general, la frecuencia relativa se puede expresar como una fracción o como


un porcentaje. Para expresar la frecuencia relativa como porcentaje, se
multiplica la fracción por 100.

La frecuencia relativa es útil porque proporciona información sobre la


distribución de los datos en relación a otros valores. Además, la suma de todas
las frecuencias relativas de un conjunto de datos es siempre igual a 1 o 100%, lo
que significa que representa la proporción total del conjunto de datos.

Al igual que con la frecuencia absoluta, la frecuencia relativa se puede mostrar


en una tabla de frecuencias o en un histograma, lo que permite una mejor
visualización de la distribución de los datos.

Es importante tener en cuenta que tanto la frecuencia absoluta como la


frecuencia relativa son medidas descriptivas que se utilizan para resumir y
describir un conjunto de datos. Para obtener una comprensión más completa de
la distribución de los datos, se pueden utilizar otras medidas estadísticas como
la media, la mediana, la moda, la varianza y la desviación estándar.
Asignatura Datos del estudiante Fecha
Apellidos: Aparicio De La Rosa
Fundamentos de
05/Mayo/2023
Estadística
Nombre: Berlys Sandrith

También podría gustarte