Está en la página 1de 6

FINAL ESTADISTICA – PANO

Tema: Variables

La variable es una característica de los individuos de una población que puede tomar
distintos valores.
Una población es un conjunto de individuos (personas, animales o tiempos de reacción,
etc.) que tienen características similares. Un parámetro es una propiedad descriptiva de
una población.

Es importante definir la población de interés al momento de llevar a cabo una


investigación, ya que las conclusiones que obtengamos estarán referidas a toda esa
población. Al ser por lo general muy numerosas, por razones practicas y económicas se
trabaja con muestras que es una parte de una población. Con la información que
obtenemos con ella podremos hacer inferencias sobre la población total, por eso es
necesario que la muestra sea representativa.

La existencia de la variabilidad ( es decir, que una variable tome distintos valores), es


necesaria para la aplicación de la estadística que aporta a la ciencia métodos para explicar
los cambios en las variables y relaciones con otros cambios.

Pueden presentarse dos tipos de variaciones: Las variaciones previsibles que están
asociadas a las fuentes de variación sistemáticas (edad, eduacación, etc.) y son
tomadas en cuenta por el investigador a la hora de hacer observaciones. Y las
variables imprevisibles, están ligada a las fuentes de variación fortuitas las cuales
son desconocidas para el investigador, son cosas que el no tiene en cuenta (conflictos,
prejuicios, etc.).

Para obtener el valor de una variable se necesita medir, esto consiste en el proceso de
asignar elementos de un conjunto a cosas con un sentido determinado. La acción de medir
requiere una escala, que es el conjunto cuyos elementos son asignados a las cosas a medir,
y ésta tiene una determinada estructura a través de la cual podemos diferenciar 4 tipos de
escalas:
La escala nominal: sus valores son nombres que designan a las distintas clases de cosas
que se miden. Discrimina y coloca los elementos que son iguales en un mismo conjunto
pero sin ningún orden jerárquico. Puede representarse con números o letras pero estas se
usan como códigos o etiquetas que representan los nombres de las clases y sirven para
distinguirlas, como F=1, M=2. El gráfico que se utiliza en esta escala es el diagrama
circular y el de barras.
La escala ordinal: al igual que la escala nominal sus valores se representan con palabras, o
numero y letras usados como códigos, pero en este caso hay establecido un orden
jerárquico. El gráfico utilizado para esta escala es el diagrama de barras.

La escala intervalar: en esta escala el cero es arbitrario, es decir que no representa una
ausencia del atributo. Podemos tomar el ejemplo de la temperatura, el cual depende de que
en escala se mida, por ejemplo 0°C no significa que no haya temperatura.
La escala de razones esta escala tiene un cero absoluto, es decir que remite a una ausencia
del atributo. Ej: peso, altura, etc.

Para saber que tipo de escala debo usar, necesito saber que tipo de variable tengo. Tenemos
dos grandes clases de variables:

Las variables cualitativas se refieren a atributos, condiciones o cualidades que poseen los
individuos y se expresan con palabras como el sexo, actividad laboral, etc. Sus valores
pueden estar ordenados o no. Se relacionan con los niveles de medición Nominal y Ordinal.

Las variables cuantitativas El conjunto de sus valores son números. Entre ellas
distinguimos las variables discretas y las variables continuas.
La variable continua sirve para marcar una distancia indefinida entre dos elementos
(ej:peso). Se representa gráficamente con el diagrama de Tallo-Hoja, el histograma, el
histograma de áreas y la poligonal de frecuencias acumulada.
La variable discreta: sus valores son reductibles como la edad. Para representar estas
variables gráficamente utilizamos el diagrama de bastones y el diagrama de Tallo-Hoja.
Para las variables cuantitativas utilizamos la escala intervalar o de razones.

Hay casos en los que es de interés comparar una variable con otra, y para esto es muy util la
distribución de frecuencia. Lo que hace es la organización de observaciones recopiladas,
y asocia a cada valor de la variable su correspondiente frecuencia y resalta características
importantes. La distribución de frecuencia se puede presentar en forma de gráfico o tabla
de frecuencias que consta de dos columnas, en la primera colocamos los valores de la
variable (ejemplo, cant de hijos: 1,2,3) y en la segunda la frecuencias absolutas
correspondiente a cada valor, que son la cantidad de veces que se observa cada valores de la
variable en la muestra. Pero para poder comparar dos variables el tamaño de la muestra
debe ser el mismo, y en caso de no ser así, deberemos transformar las frecuencias absolutas
en frecuencias relativas, que es cada frecuencia divida por el tamaño de la muestra o en
frecuencias porcentuales, es la frecuencia relativa multiplicada por cien.

El modelo teórico para la variable es una distribución de frecuencias relativas que


representa probabilidades. Dentro de este tenemos:

El modelo de la variable de Bernoulli que es una variable que solo toma dos valores (ej:
sexo: F y M) a los cuales se les designa el nombre de “éxito” y “fracaso”, y tiene un único
parámetro P que indica la probabilidad del éxito.
Con ésta se vincula la variable Binomial la cual además del parámetro P que indica la
probabilidad de éxito; el parámetro n que es la cantidad de ensayos; y el r es la cantidad de
éxitos observados. Esta variable expresa la cantidad de éxitos en n ensayos, siempre que se
esté bajo la condición de estabilidad donde la probabilidad de éxito permanece constante
de observación a observación, y bajo la condición de independencia donde las
observaciones son independientes, es decir, el resultado de una observación no es afectado
por el resultado de cualquier otra observación.
En los modelos teóricos se pueden calcular las medidas de tendencia central, las cuales
representar la totalidad de las observaciones. Ellas son:
La moda que es el valor que se repite con mayor frecuencia y es aplicable al nivel nominal.
La mediana que es un valor de la variable que ocupa una posición central determinando
dos subconjuntos de valores de la variable, el de los valores mayores que ella y el de los
menores. Se aplica desde el nivel ordinal, donde puede no existir.
La media es la suma de todas las observaciones dividida por el total de ellas, es el
promedio. Se utiliza en variables cuantitativas.
En las variables cuantitativas, las medidas de variabilidad o dispersión están asociadas al
alejamiento de los datos a la media, y cuanto mas cerca este los datos de la media mas
representativa será ésta. Las medidas de variabilidad son:
La varianza indica la dispersión de los valores respecto de la media.
El desvío estándar es la raíz cuadrada de la varianza. Indica la distancia promedio a la
media.
Para comparar la variabilidad de dos o más grupos, si la variable es la misma y las medias
coinciden o son muy similares, se concluye según la varianza o el desvío.
El coeficiente de variación es el cociente entre el desvío estándar y la media. Expresa la
variabilidad relativa a la media. Se usa en variables medidas con escala de cocientes o
razón. Cuanto más lejos del cero la media es menos representativa y hay mayor
variabilidad.
Así como el modelo binomial, tenemos el modelo de distribución normal que se ajusta a
las observaciones de muchas variables continuas en situaciones extremas. Su
representación gráfica se denomina curva o campana de Gauss. Tiene forma acampanada
con un solo pico máximo en la medio poblacional y es simétrica. Tiene dos puntos de
inflexión, donde cambia la concavidad, en el punto x= media poblacional – desviación
poblacional, la curva pasa de ser cóncava hacia arriba a ser cóncava hacia abajo y en el
punto x= media poblacional + desviación poblacional la curva pasa de ser cóncava hacia
abajo a ser cóncava hacia arriba. Se acerca asintóticamente al eje de abscisas sin llegar a
tocarlo. El área total bajo la curva representa el 100% de los casos e indica la probabilidad
de que ocurra un suceso.
Cuando el desvío poblacional esta fijo y varia la media poblacional toda la curva se
desplaza hacia la derecha o hacia la izquierda una distancia que corresponda a la cuantía de
variación.
Con la media poblacional fija y el desvío poblacional variando lo que sucede es que las
abscisas de los puntos de inflexión se acercan o se alejan de la media poblacional.
Efecto de la variación de la media Efecto de la variación del desvío
poblacional en la distribución poblacional en la distribución
normal manteniendo el desvío normal manteniendo la media
poblacional constante. poblacional constante.

De lo ultimo que voy a hablar es de la relación entre variables que es uno de los objetivos
de la Psicología, que estudia con ayuda de la estadística.

Para estudiar los problemas referentes variación conjunta de dos variables cuantitativas se
utiliza la correlación que estima comportamientos. Para esto usamos el coeficiente de
correlación lineal de Pearson, que representa la intensidad lineal entre las dos variables.
cuantifica la relación lineal entre dos variables. Este coeficiente se representa con la letra r
y nunca es mayor que 1 ni menor que -1. Cuanto mas cerca se esta de -1 o 1, la relación
lineal es mas intensa; y cuanto mas cerca del cero, es menos intensa.

Para estudiar los problemas referentes a la predicción de los resultados en una de las dos
variables, conocidos los resultados de la otra, usamos la regresión. Aquí usamos el
coeficiente de determinación que se utiliza para saber el valor de influencia de una
variable sobre otra y se expresa en porcentaje del 0 al 100, varía entre 0 y 1. Si r²=1 la
relación lineal es perfecta; y si r²=0 la relación lineal es nula.

Para determinar la relación entre dos variables cualitativas utilizamos la prueba de Chi-
cuadrado que es una prueba de hipótesis.

La prueba de hipótesis es un procedimiento estadístico que permite mediante la


utilización del muestreo, decidir entre dos hipótesis, una hipótesis Nula (H0) que es la
hipótesis contraria de lo que quiere probar el investigador, y la hipótesis Alternativa (H1)
que es la que el investigador quiere probar. La decisión entre la H0 y H1, se hace en base a
un estadístico de prueba, dependiendo de si cae dentro o fuera de la zona de rechazo. Si
el estadístico de prueba toma un valor que pertenece a la zona de rechazo, se rechaza H0; y
si el estadístico toma un valor que no pertenece a la zona de rechazo no se rechaza H0.

Por lo tanto puede haber dos tipos de errores: Si la hipótesis nula es verdadera y se
rechaza, es ERROR DE TIPO I , y si la hipótesis nula es falsa y no se rechaza, se produce
el ERROR DE TIPO II.

El nivel de significación de la prueba, es la probabilidad de comer ERROR DE TIPO I. En


general, es un dato, y de este dato se obtiene el o los puntos críticos, y se conoce la región
crítica.
En la prueba de Chi-Cuadrado, la hipótesis alternativa sostiene que las variables no
son independientes, y la hipótesis nula que las dos variables son independientes.
La decisión se toma en base al estadístico Chi-cuadrado de Pearson y a
medida que se agranda nos encontramos más próximo a rechazar la hipótesis
nula.

Para mi fue muy útil armar un cuadro para poder guiarme en el oral y no olvidarme de
nada.
VARIABLES

Variaciones

Medir

Escala

Variable Variable

Dis. De Frec.
Relac. Entre variables

Chi- Cuadrado Correlación


Mod. Normal Mod. Binomial
Regresión

Prueba de
Hipótesis
V. Bernoulli V. Binomial

Med. Tendencia
central
Resúmenes
estadísticos
Med. De variabilidad

También podría gustarte