Está en la página 1de 25

INTEGRANTES:

-Camacho Benítez Pierre Alexander

-Carrasco Ramos Noemí

-Gómez Fernández Diego

-Lossio Cigüeñas Jennifer

-Malca Suarez Yuri

-Rachumi Rodríguez Kevin

-Sandoval Valdera Alex Javier

-Santa Cruz Lozano Smith

-Santamaría Namuche Alex

-Vásquez Vargas Fernando José

-Yaipen Díaz Yesenia

CURSO:
Análisis Cuantitativo I

DOCENTE:
Albañil Romero Lionel Sebastián
Una variable estadística es una característica que puede fluctuar y cuya
variación es susceptible de adoptar diferentes valores, los cuales pueden
medirse u observarse. Las variables adquieren valor cuando se relacionan
con otras variables, es decir, si forman parte de una hipótesis o de
una teoría. En este caso se las denomina constructos o construcciones
hipotéticas.

Existen diferentes tipos de variables: -Cualitativa Nominal -Cualitativa


Ordinal -Cuantitativa Continua -Cuantitativa Discreta

 Según el nivel de Medida:


1. Variables cualitativas

Son el tipo de variables que como su nombre lo indica expresan distintas


cualidades, características o modalidad. Cada modalidad que se presenta se
denomina atributo o categoría, y la medición consiste en una clasificación de
dichos atributos. Las variables cualitativas puede ser dicotómicas cuando
sólo pueden tomar dos valores posibles, como sí y no, hombre y mujer o
ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas
podemos distinguir:

*Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede


tomar distintos valores ordenados siguiendo una escala establecida, aunque
no es necesario que el intervalo entre mediciones sea uniforme, por
ejemplo: leve, moderado, fuerte.

*Variable cualitativa nominal: En esta variable los valores no pueden ser


sometidos a un criterio de orden, como por ejemplo los colores o el lugar de
nacimiento.

2. Variables cuantitativas

Son las variables que toman como argumento cantidades numéricas,


son variables matemáticas. Las variables cuantitativas además pueden ser:

*Variable discreta: Es la variable que presenta separaciones o


interrupciones en la escala de valores que puede tomar. Estas separaciones
o interrupciones indican la ausencia de valores entre los distintos valores
específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2,
3, 4, 5).

*Variable continua: Es la variable que puede adquirir cualquier valor dentro


de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg,
2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se
está limitado por la precisión del aparato medidor, en teoría permiten que
exista un valor entre dos variables.

 Según la Influencia:
1. Variables independientes

Una variable independiente es aquella cuyo valor no depende de otra


variable. Es aquella característica o propiedad que se supone es la causa del
fenómeno estudiado. En investigación experimental se llama así a
la variable que el investigador manipula.

Las variables independientes son las que el investigador escoge para


establecer agrupaciones en el estudio, clasificando intrínsecamente a los
casos del mismo. Un tipo especial son las variables de control, que modifican
al resto de las variables independientes y que de no tenerse en cuenta
adecuadamente pueden alterar los resultados por medio de un sesgo.

La variable independiente se suele representar en el eje de abscisas.

La variable independiente es la que se le asignan valores arbitrarios

2. Variables dependientes

Una variable dependiente es aquella cuyos valores dependen de los que


tomen otra variable. La variable dependiente en una función que suele
representar por y. La variable dependiente se representa en el eje
ordenadas. Son las variables de respuesta que se observan en el estudio, y
que podrían estar influidas por los valores de las variables independientes.

Hayman (1974) la define como propiedad o característica que se trata de


cambiar mediante la manipulación de la variable independiente.
La variable dependiente es el factor que es observado y medido para
determinar el efecto de la variable independiente.

La tabla de frecuencias (o distribución de frecuencias) es una tabla que


muestra la distribución de los datos mediante sus frecuencias. Se utiliza
para variables cuantitativas o cualitativas ordinales.

La tabla de frecuencias es una herramienta que permite ordenar los datos


de manera que se presentan numéricamente las características de la
distribución de un conjunto de datos o muestra.
Construcción de la tabla de frecuencias
En la primera columna se ordenan de menor a mayor los diferentes valores
que tiene la variable en el conjunto de datos.

En las siguientes columnas (segunda y tercera) se ponen las frecuencias


absolutas y las frecuencias absolutas acumuladas.

Las columnas cuarta y quinta contienen la las frecuencias relativas y


las frecuencias relativas acumuladas.

Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima),


representando la frecuencia relativa y la frecuencia relativa acumulada como
tanto por cien. Estos porcentajes se obtienen multiplicando las dos
frecuencias por cien.

Tipos de frecuencias
Existen cuatro tipos de frecuencias:

 Frecuencia absoluta

La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor


está en el conjunto (X1, X2,…, XN).

La suma de las frecuencias absolutas de todos los elementos diferentes del


conjunto debe ser el número total de sujetos N. Si el conjunto
tiene k números (o categorías) diferentes, entonces:

 Frecuencia absoluta acumulada

La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…,


XN) es la suma de las frecuencias absolutas de los valores menores o iguales a
Xi, es decir:
 Frecuencia relativa

La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a


Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es
la frecuencia absoluta dividida por el número total de elementos N:

Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1. La suma de


las frecuencias relativas de todos los sujetos da 1. Supongamos que en el
conjunto tenemos k números (o categorías) diferentes, entonces:

Si se multiplica la frecuencia relativa por cien se obtiene el porcentaje (tanto


por cien %).

 Frecuencia relativa acumulada

Definimos la frecuencia relativa acumulada(Fi) de un valor Xi como


la proporción de valores iguales o menores a Xi en el conjunto de datos (X1,
X2,…, XN). Es decir, la frecuencia relativa acumulada es la frecuencia absoluta
acumulada dividida por el número total de sujetos N:

La frecuencia relativa acumulada de cada valor siempre es mayor que


la frecuencia relativa. De hecho, la frecuencia relativa acumulada de un
elemento es la suma de las frecuencias relativas de los elementos menores o
iguales a él, es decir:
Ejemplo

Un profesor tiene la lista de las notas en matemáticas de 30 alumnos de su


clase. Las notas son las siguientes:

1) Frecuencia absoluta
Se realiza el recuento de la variable que se estudia (notas) para ver el
número de veces que aparece cada nota.

Una vez realizado el recuento, se representan las frecuencias absolutas de


cada una de las notas (ni). Las frecuencias son: n1(3)=2, n2(4)=4, n3(5)=6,
n4(6)=7, n5(7)=5, n6(8)=3, n7(9)=2 y n8(10)=1.

2) Frecuencia absoluta acumulada

Se calculan las frecuencias absolutas acumuladas (Ni) como la suma de


las frecuencias absolutas de los valores menores o iguales a Xi:

N1 (3)=n1 (3)=2

N2 (4)=n1 (3)+n2 (4)=2+4=6

N3 (5)=n1 (3)+n2 (4)+n3 (5)=2+4+6=12

N4 (6)=n1 (3)+n2 (4)+n3 (5)+n4 (6)=2+4+6+7=19

N5 (7)=n1 (3)+n2 (4)+n3 (5)+n4 (6)+n5 (7)=2+4+6+7+5=24

N6 (8)=n1 (3)+n2 (4)+n3 (5)+n4 (6)+n5 (7)+n6 (8)=2+4+6+7+5+3=27

N7 (9)=n1 (3)+n2 (4)+n3 (5)+n4 (6)+n5 (7)+n6 (8)+n7 (9)=2+4+6+7+5+3+2=29

N8 (10)=n1 (3)+n2 (4)+n3 (5)+n4 (6)+n5 (7)+n6 (8)+n7 (9)+n8 (10)

=2+4+6+7+5+3+2+1=30
3) Frecuencia relativa

Se calcula la frecuencia relativa de cada elemento como la división de


la frecuencia absoluta entre el total de elementos N=30.

f1(3) = n1(3)/N = 2/30 = 0,07

f2(4) = n2(4)/N = 4/30 = 0,13

f3(5) = n3(5)/N = 6/30 = 0,20

f4(6) = n4(6)/N = 7/30 = 0,23

f5(7) = n5(7)/N = 5/30 = 0,17

f6(8) = n6(8)/N = 3/30 = 0,10

f7(9) = n7(9)/N = 2/30 = 0,07

f8(10) = n8(10)/N = 1/30 = 0,03

Se pueden calcular las frecuencias relativas en porcentaje (%)


multiplicándolas por 100.

4) Frecuencia relativa acumulada

Para obtener la frecuencia relativa acumulada se divide la frecuencia absoluta


acumulada entre el número total de elementos (N=30). Esto da el tanto por
uno de elementos iguales o menores al elemento que se estudia.
Las frecuencias relativas acumuladas son las siguientes:

F1(3)=f1(3)=0,07

F2(4)=f1(3)+f2(4)=0,07+0,13=0,20

F3(5)=f1(3)+f2(4)+f3(5)=0,07+0,13+0,20=0,40

F4(6)=f1(3)+f2(4)+f3(5)+f4(6)=0,07+0,13+0,20+0,23=0,63

F5(7)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)=0,07+0,13+0,20+0,23+0,17=0,80

F6(8)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)

=0,07+0,13+0,20+0,23+0,17+0,10=0,90

F7(9)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9)

=0,07+0,13+0,20+0,23+0,17+0,10+0,07=0,97

F8(10)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9)+f8(10)

=0,07+0,13+0,20+0,23+0,17+0,10+0,07+0,03=1,00

Se pueden calcular las frecuencias relativas acumuladas en porcentaje (%)


multiplicándolas por 100.

5) Tabla de frecuencias

Una vez se han calculado todas las frecuencias, se construye la tabla de


frecuencias. La tabla es la siguiente:
Adicionalmente, se pueden incluir dos columnas con los porcentajes de
las frecuencias relativas y frecuencias relativas acumuladas. Se obtiene la
siguiente tabla:
DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS

Es aquella distribución en la que la disposición tabular de los datos


estadísticos se encuentra ordenados en clases y con la frecuencia en cada
clase; es decir, los datos originales de varios valores adyacentes del
conjunto se combinan para formar un intervalo de clase. No existen normas
establecidas para determinar cuándo es apropiado utilizar datos agrupados
o datos no agrupados; sin embargo, se sugiere que cuando el número total de
datos (N) es igual o superior 50 y además el rango o recorrido de la serie de
datos es mayor de 20, entonces, se utilizará la distribución de frecuencia
para datos agrupados, también se utilizará este tipo de distribución cuando
se requiera elaborar gráficos lineales como el histograma, el polígono de
frecuencia o la ojiva.
La razón fundamental para utilizar la distribución de frecuencia de clases
es proporcionar mejor comunicación acerca del patrón establecido en los
datos y facilitar la manipulación de los mismos. Los datos se agrupan en
clases con el fin de sintetizar, resumir, condensar o hacer que la
información obtenida de una investigación sea manejable con mayor
facilidad.
Al agrupar los datos en una distribución de frecuencia de clase se pierde
parte de la información. La reducción o agrupamiento a que son sometidos
los datos de una serie de valores cuando existen muchos valores diferentes,
originan los denominados errores de agrupamiento; sin embargo, estos
errores son en general muy pequeños, razón por la cual la distribución de
frecuencia de clase tiene una validez estadística práctica.
Para agrupar los datos en intervalos de clase se deben seguir las siguientes
reglas generales:
• El número de intervalos de clase se toma entre 5 y 15 dependiendo de los
datos.
• Cada observación debe estar incluida en una y solo una clase o intervalo.
• El valor más pequeño y mas grande deben entrar en la clasificación.
• No deben existir brechas o vacíos entre clases sucesivas.
• Los intervalos no se deben sobreponer.
• En la medida de lo posible, se debe utilizar la misma amplitud para todos
los intervalos.
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIAS DE
CLASES
1. Clase o Intervalo de clase.- Son divisiones o categorías en las cuales
se agrupan un conjunto de datos ordenados con características
comunes. Para organizar los valores de la serie de datos hay que
determinar un número de clases que sea conveniente. En otras
palabras, que ese número de intervalos no origine un número pequeño
de clases ni muy grande. Un número de clases pequeño puede ocultar
la naturaleza natural de los datos y un número muy alto puede
provocar demasiados detalles como para observar alguna información
de gran utilidad en la investigación. A las fronteras del intervalo, la
llamaremos, límites inferior y superior de la clase y los denotaremos
por Li-1, Li.
2. Punto medio o Marca de clase (X&).- Es la semisuma del límite
inferior y superior de una clase.
X& = (Li-Li-1) ÷ 2
3. Amplitud, Longitud o Tamaño del Intervalo.- Los intervalos de clases
pueden ser de tres tipos: Clases de igual tamaño, clases de tamaños
desiguales y clases abiertas. En términos generales, las clases de
igual tamaño son los más utilizados y recomendados para los cálculos
estadísticos. Se designa por las letras Ic.
Nota: Al número de observaciones de una clase se le llama frecuencia de
clase, si dividimos esta frecuencia por el número total de observaciones, se
llama frecuencia relativa de clase, y del mismo modo que lo hacíamos para
datos sin agrupar definiríamos Hi, y Fi.

PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIÓN DE


FRECUENCIAS AGRUPADA EN INTERVALOS

A. Determinar el máximo y mínimo entre los valores que tenemos en la


muestra y calcular el recorrido de la variable o rango, es decir,

R=Xmax-Xmin

B. Calcular el número de clases a utilizar. Existen diversos criterios


para determinar el número de clases, ante tanta diversidad de
criterios, se ha considerado que lo más importante es dar un ancho o
longitud de clases a todos los intervalos de tal manera que respondan
a la naturaleza de los datos y al objetivo que se persigue y esto se
logra con la practica.

Existe una forma para determinar el número de clases y la misma puede


ilustrarse en el siguiente cuadro:
Numero de Datos Número de Intervalos

10 – 100. De 4 a 8

100 - 1.000. De 8 a 11

1.000 - 10.000. De 11 a 14

Cuando se tenga dudas en determinar el numero de intervalos de clases, es


de gran utilidad utilizar el método sugerido por Hebert A. Sturges, el cual
establece que: K= 1+3,322 log(n) = numero de intervalos. En este curso se
utilizará este método siempre y cuando el mismo sea aplicable.

C. Determinamos la amplitud o tamaño de los intervalos través de la


siguiente formula:

Ic = R ÷ K

En estadística la ojiva es un polígono frecuencial acumulado, es decir, que


permite ver cuántas observaciones se encuentran por encima o debajo de
ciertos valores, en lugar de solo exhibir los números asignados a cada
intervalo.

La ojiva apropiada para información que presente frecuencias mayores que


el dato que se está comparando tendrá una pendiente negativa (hacia abajo
y a la derecha) y en cambio la que se asigna a valores menores, tendrá una
pendiente positiva.

Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se


obtiene de aplicar parcialmente la misma técnica a una distribución
acumulativa y de igual manera que éstas, existen las ojivas "mayor que" y las
ojivas "menor que".

Existen dos diferencias fundamentales entre las ojivas y los polígonos de


frecuencias (y por esto la aplicación de la técnica es parcial):

Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor


que" sucede con el extremo izquierdo; para la ojiva "menor que", con el
derecho.
En el eje horizontal, en lugar de colocar las marcas de clase, se colocan las
fronteras de clase. Para el caso de la ojiva "mayor que" es la frontera
menor; para la ojiva menor que, la mayor.

La ojiva "mayor que" se le denomina de esta manera porque viendo el aspire


que está sobre el límite superior se ven las frecuencias que tienen por
encima de ese límite superior. De forma análoga, en la ojiva "menor que" la
frecuencia que se representa en cada frontera de clase son el número de
observaciones menores que la frontera señalada (en caso de tiempos sería el
número de observaciones antes de la hora que señala la frontera).

1. GRÁFICOS ESTADÍSTICOS

Existe una gran cantidad de gráficos para la representación de datos


estadísticos, entre los principales tenemos:

a) Gráfico de Barras
El gráfico de barras, como su nombre lo indica, está constituido por barras
rectangulares de igual ancho, conservando la misma distancia de separación
entre sí. Se utiliza básicamente para mostrar y comparar frecuencias de
variables cuantitativas o comportamientos en el tiempo, cuando el número
de ítems es reducido.

Para elaborarlo debemos:

- Utilizar un sistema de coordenadas rectangulares y se llevan al eje de las


"x" los valores que toma la variable en estudio y en el eje de las "y" se
colocan las frecuencias de cada barra.

- Luego se construyen los rectángulos, tomando como base al eje de las


abscisas, cuya altura será igual a cada una de las diferentes frecuencias que
presentan las variables en estudio.

- La magnitud con que viene expresada la variable se observa en la longitud


de las barras (rectángulos). Es importante destacar que solamente la
longitud de las barras y no su anchura es lo que denota la diferencia de
magnitud entre los valores de la variable.

Todas las barras tienen que tener una anchura igual, separadas entre sí,
preferiblemente por una longitud igual a la mitad del ancho de estas o
distancias iguales entre barras.

Las barras se pueden graficar tanto verticalmente como horizontalmente.


Se pueden elaborar barras compuestas y barras agrupadas.
Este tipo de gráfico se clasifican por:

- Barras simples: Compara valores entre categorías de una variable

- Barras dobles: Compara valores entre categorías de dos variables

- Barras múltiples: Compara valores entre categorías de dos o más


variables.

- Barras verticales: Las categorías de la variable deben ubicarse en el eje


x.

- Barras horizontales: Las categorías de la variable deben ubicarse en el


eje y.

- Barras Aplicadas: Compara entre categorías el aporte de cada valor en


el total.

b) Gráfico de sectores Circulares:


Usualmente llamado gráfico de torta, debido a su forma característica de
una circunferencia dividida en sectores, por medio de radios que dan la
sensación de un pastel cortado en porciones.

Se usa para representar variables cualitativas en porcentajes o cifras


absolutas cuando el número de ítems no es superior a 5 y se quiere resaltar
uno de ellos.

FRECUENCIA RELATIVA = FRECUENCIA ABSOLUTA ÷ NÚMERO TOTAL


DE DATOS

PORCENTAJE = FRECUENCIA RELATIVA X 100

ÁNGULO = FRECUENCIA RELATIVA X 360°


c) Gráfico de líneas o Tendencia:
Usado básicamente para mostrar el comportamiento de una variable
cuantitativa a través del tiempo. El gráfico de líneas consiste en segmentos
rectilíneos unidos entre sí, los cuales resaltan las variaciones de la variable
por unidad de tiempo.

Cuando se tienen varias variables a representar, con el fin de establecer


comparaciones entre ellas (siempre que su unidad de medida sea la misma);
se utiliza plasmarlos en un solo gráfico, el cual es el resultado de
representar varias variables en un mismo plano. A este tipo de gráfico se le

llama gráfico de líneas compuesto.


Criterios para elaborar un gráfico de líneas:

I. La utilización de la escala que se utilizará en el plano cartesiano


puede variar tomando en cuenta el fenómeno que se va a graficar. No
es necesario que las abscisas (ejes x) y las ordenadas (eje y) del
plano cartesiano lleven la misma escala; sin embargo, cuando las
magnitudes de las variables no se diferencian sustancialmente es
recomendable utilizar escalas iguales para obtener un gráfico con
mayor precisión.

II. Cuando una de las variables en estudio se inicia con valores muy altos
es recomendable no comenzar el eje por el origen cartesiano sino por
un valor próximo o por el mismo valor por donde comienza la variable.

III. Es costumbre representar en el eje de las x del plano cartesiano la


variable independiente del estudio que se realiza y en el eje de las y
la variable dependiente.
En aquellos casos que se dificulta distinguir el tipo de variable se
recomienda colocar en la ordenada del plano cartesiano las
frecuencias de las variables en estudio y sobre la abscisa la variable
cronológica (años, semanas, días, horas, etc.)

d) Histograma de frecuencias:
El histograma es un diagrama en forma de columna, muy parecido a los
gráficos de barras. Se define como un conjunto de rectángulos paralelos, en
el que la base representa la clase de la distribución y su altura la magnitud
que alcanza la frecuencia de la clase correspondiente. Son barras
rectangulares levantadas sobre el eje de las abscisas del plano cartesiano
utilizando escalas adecuadas para los valores que asume la variable en la
distribución de frecuencia.

El ancho de la base de los rectángulos es proporcional a cada clase de la


distribución, de tal manera que, cuando la distribución tiene clases de igual
tamaño, el tamaño de todos los rectángulos tendrá bases iguales.

Los lados del rectángulo se levantan sobre los puntos del eje de las x que
corresponden a los límites de cada clase y la longitud de los mismos será
igual a la frecuencia que tenga esa clase, los lados por lo tanto corresponden
a la frecuencia de cada clase de la distribución de frecuencia.

Cuando se elaboran gráficas estadísticas en el plano cartesiano es


recomendable que en el eje de las ordenadas se representen las frecuencias
y el eje de abscisas las variables independientes.
e) Polígono de frecuencias:
Se utiliza básicamente para mostrar la distribución de frecuencias de
variables cuantitativas. Para construir el polígono de frecuencia se toma la
marca de clase que coincide con el punto medio de cada rectángulo de un
histograma.

Pasos para elaborar un polígono de frecuencias:

1. Se dibuja un plano cartesiano.


2. Se traza sobre el eje de las abscisas, a distancias iguales, los puntos
medios de las diferentes clases de la distribución de frecuencias.
3. Se levantan perpendiculares por cada una de las marcas de clase, con
una longitud igual a la frecuencia de cada una de las clases que
integran la distribución de frecuencia. Al final de cada perpendicular
se marca un punto.
4. Los puntos resultantes se unen por medio de una línea recta
obteniéndose una línea poligonal.
5. Con la finalidad de cerrar la línea poligonal se agrega una clase
imaginaria con frecuencia cero a cada extremo de la distribución de
frecuencia, por tal motivo ambos extremos del polígono se cortan con
el eje de las abscisas.

 También se puede elaborar un polígono de frecuencia después de


haber graficado un histograma; si se determina el punto medio de
cada rectángulo de un histograma y esos puntos medios se unen por
medio de segmentos de recta dan como resultado el polígono de
frecuencia.
Pictograma
Un pictograma es un tipo de gráfico que representa mediante dibujos la característica
estudiada. Éstos representan las frecuencias relativas o absolutas de una variablecualitativa o
discreta.
Los pictogramas comparan las frecuencias entre diferentes categorías o períodos de tiempo.

Tipos de pictograma:

1. Gráfico de barras

Las barras son dibujos o símbolos de longitud proporcional a la frecuencia de cada categoría o
valor.

2. Gráfico de dibujos

Cada uno de los dibujos o símbolos equivale a ciertas unidades de frecuencia relativa o
absoluta. Cuantos más dibujos haya en cada categoría, mayor será la frecuencia.

3. Gráfico de áreas

El dibujo o símbolo varía de tamaño proporcionalmente a la frecuencia. Cuanto mayor sea


el área del dibujo, mayor será su frecuencia o cantidad.