Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudiante:
Grupo:
202016908_41
Tutor:
Ingeniería de Sistemas
Análisis de Datos
1
INTRODUCCIÓN
2
CUADRO COMPARATIVO
3
predicciones sobre el
nuevo conjunto de datos.
Se requiere un mínimo
esfuerzo humano, ya que la
carga de trabajo
Se requiere que el
involucrada en la
modelador comprenda la
informática se coloca
Esfuerzo humano relaciones entre las
directamente en la
variables antes de ingresar
máquina, ya que se
los datos.
encuentra “en forma” y
“entrenada” para encontrar
patrones en los datos.
Puede parecer que Machine Learning y el Modelo estadístico son dos ramas
diferentes del modelado predictivo, pero la diferencia entre ambos se ha
reducido significativamente en la última década, ambas ramas aprendieron
mucho el uno del otro y continuarán acercándose en el futuro.
LISTADO DE DEFINICIONES
4
5. Mediana: representa el valor de la variable de posición central de un
conjunto de datos ordenados.
Si la serie tiene un número par de puntuaciones, la mediana es la media entre las
dos puntuaciones centrales.
Ejemplo:
7, 8, 9, 10, 11, 12
Me=9,5 = (9+10) /2
5
intercuartílico. Se representa gráficamente como la achura de las cajas en los
llamados diagramas de cajas.
Dada una serie de valores X1, X2, X3,… Xn ordenados en forma creciente, podemos
pensar que su cálculo podría efectuarse:
Primer cuartil (Q1) como la mediana de la primera mitad de valores.
Segundo cuartil (Q2) como la propia mediana de la serie.
Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
15. ANOVA: Análisis de Varianza (ANOVA por sus siglas en inglés, Analysis Of
Variance) es una colección de modelos estadísticos y sus procedimientos
asociados, en el cual la varianza está particionada en ciertos componentes
debidos a diferentes variables explicativas. Se utiliza de forma intensiva en el
análisis y diseño de experimentos para evaluar el efecto de tratamientos en la
variabilidad de la variable respuesta.
El análisis de la varianza parte del concepto de regresión lineal, cuya funcionalidad
amplía. Así, un análisis de la varianza permite, por ejemplo, si deferentes
tratamientos médicos (es decir, un grupo de más de dos tratamientos) muestran
6
diferencias significativas en sus resultados o si por el contrario puede suponerse
que sus medias poblacionales no difieren. De este modo el análisis de la varianza
permite superar las limitaciones de hacer contrastes bilaterales por parejas entre
todos los tratamientos posibles, lo que sería un mal método para determinar si un
conjunto de variables con n>2 difieren entre sí. El primer concepto fundamental es
suponer que too valor observado puede expresarse mediante la siguiente función:
y ij =μ+ τ i+ ϵ ij
Donde:
y ij sería el valor observado (variable dependiente) [valor j-ésimo del tratamiento i-
ésimo], y τ i es el efecto del tratamiento i.
μ sería una constante que en la recta de regresión equivale a la ordenada en el
origen.
τ i es una variable que varía de tratamiento a tratamiento.
ϵ ij es una variable aleatoria que añade a la función cierto error que desvía la
puntuación observada de la puntuación pronosticada.
7
REFERENCIAS BIBLIOGRÁFICAS