Está en la página 1de 3

MARYURIS DIAZ CALLE

Responda las siguientes preguntas:


1) ¿Para qué usos se puede aplicar el Rango Estadístico?
 Se usa para tener una rápida idea del grado de dispersión o separación de un conjunto
de datos
 Se usa para conocer con mayor precisión el nivel de dispersión.
2) Para usted, ¿Cuál es el aspecto más importante en la correlación estadística?
 Que es una técnica que está ampliamente documentada, con múltiples fuentes de
información abiertas para que cualquiera pueda acceder a sus principios y realizar sus
propios análisis.
3) Coloque 1 ejemplo de Rango Estadístico y Correlación Estadística
Ejemplo:
 Rango:  Este es el rango de los datos. Para encontrar el rango, restamos el valor
mínimo del conjunto de datos del valor máximo. Por ejemplo, en los datos de 2,
5, 3, 4, 5, y 5, el valor mínimo es 2 y el valor máximo es 5, entonces el rango es
5 – 2, o 3.
 Correlación:  considera que las variables son el ingreso familiar y el gasto
familiar. Se sabe que los aumentos de ingresos y gastos disminuyen juntos. Por
lo tanto, están relacionados en el sentido de que el cambio en cualquier variable
estará acompañado por un cambio en la otra variable.
De la misma manera, los precios y la demanda de un producto son variables
relacionadas; cuando los precios aumentan la demanda tenderá a disminuir y
viceversa.
4) ¿Qué es la regresión lineal?
 La regresión lineal es una técnica de modelado estadístico que se emplea para
describir una variable de respuesta continua como una función de una o varias
variables predictoras. Puede ayudar a comprender y predecir el comportamiento de
sistemas complejos o a analizar datos experimentales, financieros y biológicos.
5) ¿Qué es la interpolación y extrapolación?
 Interpolación: consiste en hallar un dato dentro de un intervalo en el que
conocemos los valores en los extremos.
 Extrapolación:  consiste en hallar un dato fuera del intervalo conocido, pero debe
tenerse en cuenta que esté próximo a uno de sus extremos, pues en otro caso no es
muy fiable el resultado obtenido.
6) ¿Qué es un falso positivo y un falso negativo?
 Falso positivo: es una anomalía o un error en el resultado de una medición o
cálculo dado en un modelo de clasificación binaria, indicando la presencia de una
condición o característica cuando la misma no está presente en realidad. 
 Falso negativo: es la ausencia de dicha condición o característica en el resultado de
una medición o cálculo cuando en realidad sí que está presente. El contrario de un
falso positivo es un verdadero positivo, y el de un falso negativo un verdadero
negativo.

7) ¿Qué entiende usted por error de estimación?


MARYURIS DIAZ CALLE

 Que mide la desviación en una muestra valor poblacional. Es decir, el error


estándar de estimación mide las posibles variaciones de la media muestral con
respecto al verdadero valor de la media poblacional.

8) ¿Por qué la limpieza de datos juega un papel vital en el análisis estadístico?


 La limpieza de datos incluye encontrar, corregir o eliminar datos erróneos de una
base de datos. El proceso permite identificar datos incompletos, incorrectos,
inexactos, no pertinentes, etc. y luego substituir, modificar o eliminar estos datos
sucios ("data duty"). Con esto se busca que los datos obtenidos se encuentren en las
condiciones adecuadas al momento de realizar los análisis estadísticos pertinentes a
la investigación. Podría tomar hasta un 80% del tiempo de trabajo, por lo que es
una parte crítica de la tarea de análisis.

9) ¿Qué es la colinealidad? ¿Cómo eliminar multicolinealidad?


Colinealidad / Multicolinealidad:
- En la regresión múltiple: cuando dos o más variables están altamente correlacionados
- Proporcionan información redundante
- Los errores estándar de los coeficientes de regresión de las variables afectadas tienden a ser
grandes
- La prueba de hipótesis de que el coeficiente es igual a cero puede conducir a un error de
rechazar falsamente la hipótesis nula de ningún efecto de la explicativo (error tipo II)
- Lleva a sobreajuste
Cómo eliminar la multicolinealidad:
- Elimine algunas de las variables afectadas
- Utilice regresión con componentes principales: da predictores no correlacionados
- Combine las variables afectadas
- Utilice la regresión contraída (ridge)
- Utilice la regresión parcial por mínimos cuadrados (PLS)
Cómo detectar la multicolinealidad:
Se observan grandes cambios en los coeficientes individuales cuando se añaden o eliminan una
variable predictora
- Se observan coeficientes de regresión insignificante para los predictores afectados pero
también un rechazo de la
hipótesis conjunta de que los coeficientes son todos cero (prueba F) - VIF: es la proporción de
las varianzas del coeficiente cuando se ajusta el modelo completo dividido por la varianza del
coeficiente cuando se ajusta con él.
- Regla de oro: VIF > 5 indica multicolinealidad (aunque otros autores consideran 10 y otros 20
como puntos de corte).
- Matriz de correlación parcial.

10) ¿Cuáles son las principales debilidades de la media aritmética?


MARYURIS DIAZ CALLE

 Es sensible a los valores extremos.


- No es recomendable emplearla en distribuciones muy asimétricas.
- Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede no
pertenecer al conjunto de valores de la variable. - Es la media aritmética que se utiliza
cuando a cada valor de la variable se le otorga una ponderación o peso distinto de la
frecuencia o repetición. Para poder calcularla se tendrá que tener en cuenta las
ponderaciones de cada uno de los valores que tenga la variable.

También podría gustarte