Documentos de Académico
Documentos de Profesional
Documentos de Cultura
´´Simón Rodríguez
Núcleo: Maturín
Es importante para conocer las probabilidades asociadas a cada valor, así como para
poder estimar probabilidades acumuladas. En este sentido es imprescindible, conocer la
definición y características de Función de Probabilidad y Función de Distribución. Conocer
los objetivos que pretendemos conseguir trabajaremos la definición y características de
Función de Probabilidad y características de las distribuciones
En muchas ocasiones no nos interesa conocer la probabilidad de que la variables aleatoria
X tome exactamente un determinado valor xi, sino que puede interesarnos determinar la
probabilidad de que tome valores menores o iguales que un cierto valor xi. En tales casos
es necesario acumular los distintos valores de la función de probabilidad hasta el valor
deseado. Es lo que se denomina unión de distribución y se representa por F (X).
La función de probabilidad, de cuantía o de masa de una variable aleatoria discreta, es una
función que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de
que dicho suceso ocurra, estando definida sobre el conjunto de todos de los posibles
valores de la variable aleatoria.
En el mundo actual, al momento de tomar una decisión, muy rara vez contamos con la información
completa para hacerlo, es por eso que la inferencia estadística juega un papel fundamental en este
caso, ya que a partir de una muestra significativa de una población (información limitada),
inferimos propiedades de esta población y utilizando la teoría de probabilidades podemos analizar
riesgos y reducirlos al mínimo.
Los científicos siempre se han sentido fascinados con los fenómenos y acontecimientos que
ocurren en la vida cotidiana, por lo que se han puesto en la tarea de construir modelos
probabilísticos teóricos, a través de la experimentación, que los describan. Algunos de los más
utilizados hoy en día son:
Es una probabilidad discreta y se presenta con mucha frecuencia en nuestra vida cotidiana. Fue
propuesta por Jakob Bernoulli (1654-1705), y es utilizada con acontecimientos que tengan
respuesta binaria, generalmente clasificada como “éxito” o “fracaso”. Algunos ejemplos donde se
aplica esta distribución son:
Recibe su nombre gracias al matemático francés Simeón Denis Poisson (1781-1840). Describe el
número de veces que se presenta un acontecimiento durante un intervalo específico, este
intervalo puede ser de tiempo, distancia, área o volumen. La probabilidad de ocurrencia es
proporcional a la longitud del intervalo. Algunos ejemplos donde se aplica esta distribución son:
El número de vehículos que vende por día un concesionario.
Fue utilizada por Carl Friedich Gauss (1777-1855) al escribir un libro sobre el movimiento de los
cuerpos celestes, por este motivo también es conocida como distribución Gaussiana.
Es importante debido a que el teorema central del límite implica que esta distribución es casi
universal y la podemos encontrar en todos los campos de las ciencias empíricas tales como:
biología, física, psicología, economía, etc.
El contraste de hipótesis a la luz de los desarrollos de las teorías estadísticas pertinentes implica un
trabajo racional por la búsqueda de un equilibrio entre el control del error tipo I y la potencia del
contraste. En función de ello, los autores sugieren trabajar con algunos elementos críticos
asociados con el rechazo de la hipótesis nula como son: el tamaño del efecto, el nivel de
significación o alfa y el tamaño de la muestra o número de observaciones. Básicamente, la
potencia del contraste se mueve como una función de estos elementos que se resume en la
necesidad de incrementar el índice de discrepancia o efecto relativo de la variable independiente
sobre la variable dependiente. Se entiende el índice de discrepancia como una razón del tamaño
de las diferencias entre los parámetros contrastados dividido por la varianza relativa de la
población.
a) el diseño de la investigación
a) el número de muestras
b) el número de observaciones
c) los niveles de independencia de las observaciones. En cuanto al cumplimiento de los supuestos,
la literatura agrupa las pruebas estadísticas de contraste en las categorías: paramétricas y no
paramétricas, tomando en cuenta los criterios:
El contraste de hipótesis es la práctica científica que, como tal, busca articular los elementos
teóricos, metodológicos y técnicos en la construcción del conocimiento científico. De este modo, el
contraste de hipótesis involucra dos tipos de hipótesis fundamentales, según el campo discursivo
en el cual se les ubica: el primero es el campo propiamente teórico y que definiremos como
hipótesis sustantivas y el otro es el campo metodológico donde las hipótesis se definen
operacional y estadísticamente. A nivel sustantivo, las hipótesis expresan una afirmación
conjetural acerca de la relación entre dos o más variables. Mientras que las hipótesis sustantivas
nos hablan del plano formal del conocimiento, es decir, nos describe las relaciones teóricas entre
las variables, estrictamente hablando estas no pueden ser probadas a menos que se traduzcan en
definiciones operacionales (Kerlinger & Lee, 2002). De modo que, el investigador deberá traducir
sus enunciados teóricos a elementos operacionales y reducir estos a formulaciones estadísticas
que le permitan generar los argumentos para la “verificación” o “felación” de sus hipótesis
sustantivas. Una hipótesis estadística se define como “una predicción sobre cómo resultarán los
estadísticos utilizados al analizar los datos cuantitativos de un problema de investigación.
Este tipo de estudios, requiere de experiencia del investigador, e información relevante de los
conceptos a ser relacionados, por lo tanto la descripción de un marco teórico con riqueza de
datos, facilitará su aplicación.
Se define como correlación, a una medida en la cual dos o más variables encuentran
relaciones de interdependencia entre sí.
De esta forma, para el desarrollo de un estudio correlacional, debe existir información previa de
conceptos, determinados por estudios descriptivos anteriores, que permitan al investigador la
obtención de información, que pueda ser utilizada para ver el comportamiento de los conceptos
de alguna variable, mediante la observación de otras variables relacionadas, intentando predecir
un valor aproximado de relación entre ellas.3
Cuando el investigador está en búsqueda de una relación causal, el estudio de tipo correlacional,
no será el ideal para ser elegido, ya que con este diseño, es imposible demostrar cuál fue la causa,
y cuál el efecto, planteando un problema importante de direccionalidad.
De igual forma, al ser un estudio observacional y no poder realizar la manipulación física de las
variables, es imposible establecer la relación, sobre la existencia de una tercera variable no
considerada, que agreda de alguna manera a las variables de estudio.
Los datos de un estudio correlacional deben definir con concreción las variables que permitan
predecir la puntuación y ejecución de individuos que no han sido previamente probados,
denominándose a ella, variable criterio, a partir de la puntuación de otra variable, denominada
variable predictora. La combinación de ambas puede lograr una relación lineal específica,
denominada recta de regresión.
Se esté calculando el coeficiente de correlación entre dos variables que no están relacionadas.
Aunque se tengan niveles de confianza 0,05, las probabilidades de correlación son menores al 1%
(p<0.01) o al 1/1000 (p<0.001), recomendándose que se debe indicar una probabilidad exacta sin
limitarse a poner superior o inferior a un valor.
Por lo tanto la pregunta de investigación deberá idealmente establecer los valores específicos a
medir en cada variable de estudio, así como el coeficiente de relación entre ellas, dato que de
igual forma deberá estar especificado en la hipótesis investigativa.
Los instrumentos de medición utilizados en este tipo de estudios, deben ser confiables,
identificando la relación entre variables sin que sea detectada. La poca precisión en los
instrumentos puede llevar a errores frecuentes durante el análisis. Es posible que durante el
diseño de instrumentos se puedan hacer correcciones por atenuación, que permiten dar una
estimación de la correlación, verificando de esta forma si la fiabilidad de los indicadores utilizados
es perfecta.
Regreso lineal
Regresión lineal simple). Una generalización de este modelo, el de regresión lineal múltiple,
permite considerar más de una variable explicativa cuantitativa. Por otra parte, tal como se verá
en un tema posterior, es también posible incluir variables explicativas categóricas en un modelo de
regresión lineal si se sigue una determinada estrategia en la codificación de los datos conocida
como codificación ficticia. • En concreto, según el modelo de regresión lineal simple, las
puntuaciones de los sujetos en 2 variables -una de ellas considerada como variable predictora (X) y
la otra como variable de respuesta (Y)- vienen representadas (modeladas) por la ecuación de una
línea recta: 0 1 Y X ˆ = β β + 1 Cuando hay más de una variable explicativa (modelo de regresión
lineal múltiple), se utiliza un subíndice para cada una de ellas, por ejemplo, para el caso de dos
variables explicativas: 0 1 1 2 Yˆ = β β + X + β X2 Ejemplo de aplicación de un modelo de
regresión lineal simple a fin de modelar la distribución conjunta de las variables “Estrategias de
afrontamiento” y “Estrés”. En este ejemplo concreto.
Los dos parámetros de la ecuación de regresión lineal simple, β0 y β1, son conocidos como el
origen (también, constante) y la pendiente del modelo, respectivamente. En conjunto reciben el
nombre de coeficientes de la ecuación de regresión. Si la ecuación de la recta de regresión es
obtenida a partir de una muestra, y no de una población (esto es, los coeficientes de la ecuación
de regresión son estadísticos, y no parámetros), la ecuación se expresa como: 0 1 Y b ˆ = + b X1 •
Una vez que sean conocidos los valores de β0 y β1 del modelo de regresión lineal simple, éste
puede ser utilizado como modelo predictivo, esto es, para realizar predicciones de los valores que
tomará la variable de respuesta para determinados valores de la variable explicativa. Basta para
ello con sustituir en la ecuación de regresión el valor concreto de X que se quiera (Xi). Al hacerlo,
se obtendrá el valor predicho para Y según la ecuación de regresión para aquellos casos que en la
variable X tomen el valor Xi. Este valor es conocido de forma genérica como puntuación predicha,
siendo representado simbólicamente como ' Yi o ˆY
Una serie cronológica no es sino una variable dada en sucesivos intentes de tiempo y se le conoce
también con el nombre de serie de tiempo, serie histórica, serie cronológica, etc. Una serie
cronológica llamada también serie de tiempo o serie histórica de un conjunto de datos
recopilados, observados y registrados sistemáticamente en un tiempo determinado.
Se dice también que es la variable dada en sucesivos instantes de tiempo como la producción de
algodón en los últimos 10 años, las exportaciones anuales de los países de la región andina, las
ventas anuales en farmacias, laboratorios, supermercados, etc. Las principales aplicaciones de las
series cronológicas son las proyecciones (determinación de las tendencias); debe advertirse que
las proyecciones no son valores determinantes que tienen que ocurrir necesariamente en el
futuro, son valores estimados o esperados y estos resultados pueden variar dependiendo de varios
factores que de forma directa e indirecta participen en los resultados de una serie cronológica. Las
empresas industriales y comerciales deben de realizar un examen sobre la forma como la
producción y venta de sus artículos han sido afectados en el pasado por diferentes factores con el
objeto de hacer una estimación, diagnóstico o previsión para el futuro a fin de estar en
condiciones de trazar planes de desarrollo de la empresa. Gráficamente las series cronológicas se
representan haciendo uso de los ejes cartesianos, colocando la variable tiempo (ti) en el semi-eje
positivo de las abscisas y la variable (Yi) en el semi-eje positivo de las coordenadas.
Los elementos de una serie cronológica también coincide con el nombre de variaciones,
componentes, o movimiento característicos de una serie cronológica pueden dividirse en: -
Tendencia (T) - Variaciones estacionales (S) - Variaciones irregulares, fortuitas o accidentales -
Ciclos u oscilaciones
ca que se puede visualizar con facilidad a partir del gráfico poligonal de la serie. Hay series cuyos
valores poseen una “Tendencia ascendente o creciente”, en tanto hay otros cuyos valores poseen
una “Tendencia descendiente” y por último existen series que no son fáciles de advertir su
tendencia. El estudio de la tendencia es de suma importancia porque sirve para de terminar el
probable comportamiento de los datos en el futuro. La proyección de la serie cronológica
constituye el aspecto más importante para la planificación social, económica, educacional, etc. de
mediano y largo plazo. La tendencia se puede determinar por una expresión matemática, siendo
necesario proyectar la serie y así obtener valores estimados para el futuro, que puedan tener a su
vez un error o sesgo cuya, dimensión depende de la validez o significación de los datos de la serie,
del periodo elegido y del método utilizado para analizar la tendencia. Del método estadístico
elegido, depende el comportamiento de la variable en el tiempo. La tendencia de una serie se
puede determinar y estimar por dos métodos generales: el gráfico y el analítico.
Y=T+S+I+C
La serie cronológica que se puede visualizar con facilidad a partir del gráfico poligonal de la serie.
Hay series cuyos valores poseen una “Tendencia ascendente o creciente”, en tanto hay otros
cuyos valores poseen una “Tendencia descendiente” y por último existen series que no son fáciles
de advertir su tendencia. El estudio de la tendencia es de suma importancia porque sirve para
determinar el probable comportamiento de los datos en el futuro. La proyección de la serie
cronológica constituye el aspecto más importante para la planificación social, económica,
educacional, etc. de mediano y largo plazo. La tendencia se puede determinar por una expresión
matemática, siendo necesario proyectar la serie y así obtener valores estimados para el futuro,
que puedan tener a su vez un error o sesgo cuya, dimensión depende de la validez o significación
de los datos de la serie, del periodo elegido y del método utilizado para analizar la tendencia. Del
método estadístico elegido, depende el comportamiento de la variable en el tiempo. La tendencia
de una serie se puede determinar y estimar por dos métodos generales: el gráfico y el analítico.
Conclusión
La estadística resulta fundamental para conocer el comportamiento de ciertos eventos, por lo que
ha adquirido un papel clave en la investigación. Se usa como un valioso auxiliar y en los diferentes
campos del conocimiento y en las variadas ciencias. Es un lenguaje que permite comunicar
información basada en datos cuantitativos.
Es tan importante que casi no existe actividad humana en que no esté involucrada la Estadística.
Las decisiones más importantes de nuestra vida se toman con base en la aplicación de la
Estadística. Pongamos algunos ejemplos.