1) ¿Para qué usos se puede aplicar el Rango Estadístico? Se usa para tener una rápida idea del grado de dispersión o separación de un conjunto de datos Se usa para conocer con mayor precisión el nivel de dispersión. 2) Para usted, ¿Cuál es el aspecto más importante en la correlación estadística? Que es una técnica que está ampliamente documentada, con múltiples fuentes de información abiertas para que cualquiera pueda acceder a sus principios y realizar sus propios análisis. 3) Coloque 1 ejemplo de Rango Estadístico y Correlación Estadística Ejemplo: Rango: Este es el rango de los datos. Para encontrar el rango, restamos el valor mínimo del conjunto de datos del valor máximo. Por ejemplo, en los datos de 2, 5, 3, 4, 5, y 5, el valor mínimo es 2 y el valor máximo es 5, entonces el rango es 5 – 2, o 3. Correlación: considera que las variables son el ingreso familiar y el gasto familiar. Se sabe que los aumentos de ingresos y gastos disminuyen juntos. Por lo tanto, están relacionados en el sentido de que el cambio en cualquier variable estará acompañado por un cambio en la otra variable. De la misma manera, los precios y la demanda de un producto son variables relacionadas; cuando los precios aumentan la demanda tenderá a disminuir y viceversa. 4) ¿Qué es la regresión lineal? La regresión lineal es una técnica de modelado estadístico que se emplea para describir una variable de respuesta continua como una función de una o varias variables predictoras. Puede ayudar a comprender y predecir el comportamiento de sistemas complejos o a analizar datos experimentales, financieros y biológicos. 5) ¿Qué es la interpolación y extrapolación? Interpolación: consiste en hallar un dato dentro de un intervalo en el que conocemos los valores en los extremos. Extrapolación: consiste en hallar un dato fuera del intervalo conocido, pero debe tenerse en cuenta que esté próximo a uno de sus extremos, pues en otro caso no es muy fiable el resultado obtenido. 6) ¿Qué es un falso positivo y un falso negativo? Falso positivo: es una anomalía o un error en el resultado de una medición o cálculo dado en un modelo de clasificación binaria, indicando la presencia de una condición o característica cuando la misma no está presente en realidad. Falso negativo: es la ausencia de dicha condición o característica en el resultado de una medición o cálculo cuando en realidad sí que está presente. El contrario de un falso positivo es un verdadero positivo, y el de un falso negativo un verdadero negativo.
7) ¿Qué entiende usted por error de estimación?
MARYURIS DIAZ CALLE
Que mide la desviación en una muestra valor poblacional. Es decir, el error
estándar de estimación mide las posibles variaciones de la media muestral con respecto al verdadero valor de la media poblacional.
8) ¿Por qué la limpieza de datos juega un papel vital en el análisis estadístico?
La limpieza de datos incluye encontrar, corregir o eliminar datos erróneos de una base de datos. El proceso permite identificar datos incompletos, incorrectos, inexactos, no pertinentes, etc. y luego substituir, modificar o eliminar estos datos sucios ("data duty"). Con esto se busca que los datos obtenidos se encuentren en las condiciones adecuadas al momento de realizar los análisis estadísticos pertinentes a la investigación. Podría tomar hasta un 80% del tiempo de trabajo, por lo que es una parte crítica de la tarea de análisis.
9) ¿Qué es la colinealidad? ¿Cómo eliminar multicolinealidad?
Colinealidad / Multicolinealidad: - En la regresión múltiple: cuando dos o más variables están altamente correlacionados - Proporcionan información redundante - Los errores estándar de los coeficientes de regresión de las variables afectadas tienden a ser grandes - La prueba de hipótesis de que el coeficiente es igual a cero puede conducir a un error de rechazar falsamente la hipótesis nula de ningún efecto de la explicativo (error tipo II) - Lleva a sobreajuste Cómo eliminar la multicolinealidad: - Elimine algunas de las variables afectadas - Utilice regresión con componentes principales: da predictores no correlacionados - Combine las variables afectadas - Utilice la regresión contraída (ridge) - Utilice la regresión parcial por mínimos cuadrados (PLS) Cómo detectar la multicolinealidad: Se observan grandes cambios en los coeficientes individuales cuando se añaden o eliminan una variable predictora - Se observan coeficientes de regresión insignificante para los predictores afectados pero también un rechazo de la hipótesis conjunta de que los coeficientes son todos cero (prueba F) - VIF: es la proporción de las varianzas del coeficiente cuando se ajusta el modelo completo dividido por la varianza del coeficiente cuando se ajusta con él. - Regla de oro: VIF > 5 indica multicolinealidad (aunque otros autores consideran 10 y otros 20 como puntos de corte). - Matriz de correlación parcial.
10) ¿Cuáles son las principales debilidades de la media aritmética?
MARYURIS DIAZ CALLE
Es sensible a los valores extremos.
- No es recomendable emplearla en distribuciones muy asimétricas. - Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede no pertenecer al conjunto de valores de la variable. - Es la media aritmética que se utiliza cuando a cada valor de la variable se le otorga una ponderación o peso distinto de la frecuencia o repetición. Para poder calcularla se tendrá que tener en cuenta las ponderaciones de cada uno de los valores que tenga la variable.
Sesgos Cognitivos: Una Fascinante Mirada dentro de la Psicología Humana y los Métodos para Evitar la Disonancia Cognitiva, Mejorar sus Habilidades para Resolver Problemas y Tomar Mejores Decisiones
Inteligencia artificial: Lo que usted necesita saber sobre el aprendizaje automático, robótica, aprendizaje profundo, Internet de las cosas, redes neuronales, y nuestro futuro