Está en la página 1de 97

Estadística aplicada a la

investigación

Administración de negocios
Bienvenidos
Estadística Aplicada a la
Investigación
José Luis Tuesta Chávez | Docente
fjtuesta@zegelipae.pe
2023 - I
ADMINISTRACIÓN DE NEGOCIOS V CICLO
Estadística aplicada a la Investigación
IL 2: MEDIDAS DE CENTRALIZACIÓN Y DISPERSIÓN.
Calcula e interpreta las medidas de tendencia central y de
dispersión.
Tema:
• Medidas de tendencia Central
• Medidas de Dispersión

IL 3: Medidas de localización, de forma, de concentración


Grafica, calcula e interpreta las medidas de localización,
forma y concentración de una data.
Tema:
• Grafica de variables ° Medidas de Forma
• Medidas de localización ° Regresión Lineal
Estadística aplicada a la Investigación
Fórmulas en TDF no agrupadas
para MTC

Estadística aplicada a la Investigación Fuente: http://matematicas-chidas.over-blog.com/2018/10/medidas-de-tendencia-central.html


Demostramos lo aprendido
2. En un estudio sobre las edades de conductores que sufre un accidente
automovilístico se obtuvo:
16 16 16 16 16 16 16 16 17 17
17 17 17 17 17 17 18 18 18 18
18 18 18 18 18 18 18 18 18 19
20 20 20 21 21 21 22 23 24 24
24 24 24 24 25 26 27 27 27 28
28 28 29 29 30 30 31 31 32 34
34 35 36 37 37 38 38 38 40 42
44 44 45 45 45 45 51 51 51 52
53 56 57 58 65 69 69 70 73 73
73 74 76 76 77 81 86 87 87 88
Halle las medidas de posición central e interprete.
Ejemplo
1) Rango (R) = valor máximo - valor mínimo.
Rango (R) = 88 - 16 = 72

2) Número de intervalos (k) == 1 + 3.32 log(100) = 7.64 = 8


(redondeo por exceso)

𝑆𝑖 𝑛 < 30 , 𝑢𝑠𝑎𝑟 𝑙𝑎 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑉𝑒𝑙𝑙𝑒𝑚𝑎𝑛: k= 𝑛


𝑆𝑖𝑛 ≥ 30, 𝑢𝑠𝑎𝑟Regla𝑑𝑒𝑆𝑡𝑢𝑟𝑔𝑒𝑠: 𝑘 = 1 + 3.32 log 𝑛
𝑅
3) Amplitud (A ) = (redondeo por exceso)
𝑘
72
Amplitud (A ) = =9 (redondeo por exceso)
8

6 5/07/2023
Media Aritmética
k
i=1(fi ∙ xi )
Solución Los 100 conductores tienen una edad
promedio 37 años.
x=
n

Marca Frecuencia
Intervalo de
Frecuencia
Absoluta
2° Hallando la
[Li – Ls> clase
Absoluta
(fi)
Acumulada xi.fi media
1° Construir la (xi) (Fi)
aritmética.
[16 – 25> 20,5 44 44 902
tabla de
[25 – 34> 29,5 15 59 442,5
Distribución de
[34 – 43> 38,5 11 70 423,5
Frecuencias, [43 – 52> 47,5 9 79 427,5
sólo con los 3688
[52 – 61> 56,5 5 84 282,5 𝑥ҧ =
100
datos [61 – 70> 65,5 3 87 196,5
necesarios. 𝑥ҧ = 36,88
[70 – 79> 74,5 8 95 596
[79 – 88] 83,5 5 100 417,5

7 5/07/2023
Se ubicará el intervalo [LI - LS] n
− Fm−1
Solución donde se ubique el
correspondiente a n/2. Dicho
intervalo tiene una Fm
valor
Me = LI + A 2
fm
• Ubicamos la
clase mediana,
que contiene a la
Marca Frecuencia mediana, para
Frecuencia
Intervalo de Absoluta
[Li – Ls> clase
Absoluta
(fi)
Acumulada xi.fi esto hallamos:
(xi) (Fi)
[16 – 25> 20,5 44 44 902 𝑛 100
= = 50
[25 – 34> 29,5 15 59 442,5 2 2
3° Hallando
[34 – 43> 38,5 11 70 423,5
la mediana. [43 – 52> 47,5 9 79 427,5
• Reemplazamos
en la fórmula:
[52 – 61> 56,5 5 84 282,5
100
[61 – 70> 65,5 3 87 196,5 −44
2
[70 – 79> 74,5 8 95 596 𝑀𝑒 = 25 + 9
15
[79 – 88> 83,5 5 100 417,5
Mediana
𝑀𝑒 =28,6
El 50% de los conductores, tiene menos de 28,6 años.
8 5/07/2023
Se ubicará el intervalo [LI - LS] donde se ubique la fm − fm−1

Solución mayor frecuencia absoluta fm.


Mo = LI + A
fm − fm−1 + fm − fm+1

Intervalo
Marca
de
Frecuencia
Frecuencia
Absoluta
• Ubicamos la clase
[Li – Ls> clase
Absoluta
(fi)
Acumulada xi.fi modal, que contiene a
(xi) (Fi) la moda, es decir la
[16 – 25> 20,5 44 44 902 frecuencia absoluta
[25 – 34> 29,5 15 59 442,5
más grande:

4° Hallando [34 – 43> 38,5 11 70 423,5


[43 – 52> 47,5 9 79 427,5 • Reemplazamos
la moda. en la fórmula:
[52 – 61> 56,5 5 84 282,5
[61 – 70> 65,5 3 87 196,5 44−0
[70 – 79> 74,5 8 95 596 𝑀𝑜 = 16 + 9
44−0 + 44−15
[79 – 88> 83,5 5 100 417,5

Moda 𝑀𝑜 = 21,42
La mayoría de los conductores tienen aproximadamente 22 años.
9 5/07/2023
Aplicación en PSPP para una variable cuantitativa

10 Tablas de frecuencias para datos agrupados


Aplicación en PSPP para una variable cuantitativa 6º
Ingresar los límites
de los intervalos


Colocar el nombre de la
nueva variable

11 Tablas de frecuencias para datos agrupados
Aplicación
Tenemos la
en PSPP para una variable cuantitativa
nueva
variable

12 Tablas de frecuencias para datos agrupados


Aplicación en PSPP


Elegimos las
medidas de
posición central

13 Medidas de tendencia central


Medidas de Dispersión
Rango
Medidas
Medidas de
Dispersión

Varianza
absolutas Las medidas estadísticas
de variabilidad se clasifican
Desviación Estándar
en absolutas o relativas.
Medidas Coeficiente de Variación
relativas

14
Rango
Es la medida de variabilidad o dispersión más
simple. Se calcula tomando la diferencia
entre el valor máximo y el mínimo observado.
Rango
R = Max − Min El rango o amplitud total es la medida de
(R) dispersión muy fácilmente calculable, pero es
muy inestable, ya que depende únicamente
de los dos valores extremos. Su valor puede
cambiar grandemente si se añade o elimina
un sólo dato. Por tanto su uso es muy
limitado.

15 5/07/2023
Varianza
La varianza, es una medida
que cuantifica el grado de k
dispersión o de variación de Datos No Tabulados − x)2
i=1(x i
los valores de una variable
S2 =
n−1
cuantitativa con respecto a Varianza
su media aritmética.
(S2)
Si los valores tienden a k
concentrarse alrededor de Datos Tabulados − x)2 ∙ fi
i=1(x i
su media, la varianza será (Continuos y S2 =
pequeña. Si los valores
Discretos) n−1
tienden a distribuirse lejos
de la media, la varianza
será grande.
16 5/07/2023
Desviación Estándar
También llamada desviación típica, es una
medida de dispersión usada en estadística que
nos dice cuánto tienden a alejarse los valores
Desviación puntuales del promedio en una distribución.
estándar S= S2 Una desviación estándar grande indica que los
puntos están lejos de la media, y una
(S) desviación pequeño indica que los datos están
agrupados cerca de la media.
La desviación es la raíz cuadrada de la
varianza.

17 5/07/2023
Coeficiente de Variación
Es una medida de dispersión relativa (libre de
unidades de medidas), que se define como la Coeficiente S
desviación estándar dividido por la media aritmética. de Variación CV = ∙ 100%
El coeficiente de variación mide el grado de
x
variabilidad de un conjunto de datos, además compara
(CV)
el grado de variabilidad entre dos o más distribuciones.

Cuando la desviación estándar es muy pequeña, el coeficiente de variación también es pequeño (los valores se encuentran muy concentrados
respecto a la media); en cambio, cuando el valor de la desviación estándar es muy grande, el coeficiente de variación es grande, hasta superar el
100% (los valores se encuentran muy dispersos)

18 5/07/2023
Interpretación del Coeficiente de Variación
Una escala que Rango del CV Interpretación Nivel de variabilidad
nos permite la 0% < CV < 5% Datos muy homogéneos
interpretación del Baja variabilidad
5% < CV < 10% Datos homogéneos
coeficiente de Datos regularmente
10% < CV < 15%
variación es homogéneos
Moderada variabilidad
fenómenos no 15% < CV < 20%
Datos regularmente
heterogéneos
controlados como 20% < CV < 25% Datos heterogéneos
los naturales, CV ≥ 25% Datos muy heterogéneos
Alta variabilidad

sociales,
deportivos, entre
otros, se tiene:
19 5/07/2023
Ejemplo Tabla de distribución de
frecuencias para datos agrupados
Se dispone de datos sobre el número de créditos acumulados de 50 estudiantes de la Carrera de
Negocios de Zegel IPAE. Los datos obtenidos son los siguientes:
18 21 23 34 45 56 32 26 25 31
36 29 24 22 34 45 56 32 19 41
20 25 27 32 46 50 51 56 54 23
26 35 24 38 39 43 49 60 48 50
21 30 35 19 43 48 54 56 26 29
Con los resultados obtenidos, elaborar la tabla de distribución de frecuencias.

20 5/07/2023
Ejemplo
Hallar la tabla de distribución de frecuencias

18 21 23 34 45 56 32 26 25 31

36 29 24 22 34 45 56 32 19 41

20 25 27 32 46 50 51 56 54 23

26 35 24 38 39 43 49 60 48 50

21 30 35 19 43 48 54 56 26 29

1) Rango (R) = valor máximo - valor mínimo. 2) Número de intervalos (k) = 1 + 3.3 log(50) = 6.6 = 7
Rango (R) = 60 - 18 = 42 (redondeo por exceso)

𝑅
3) Amplitud (A ) = (redondeo por exceso)
𝑘 𝑢𝑠𝑎𝑟Regla𝑑𝑒𝑆𝑡𝑢𝑟𝑔𝑒𝑠: 𝑘 = 1 + 3.3 log 𝑛
42
Amplitud (A ) = = 6 (redondeo por exceso)
7

21 5/07/2023
Ejemplo
1) Rango (R) = valor máximo - valor mínimo.
Intervalos Marca de
Rango (R) = 60 - 18 = 42 clase
[18 – 24  21

2) Número de intervalos (k) == 1 + 3.32 log(50) = 6.6 = 7 [24 – 30  27


(redondeo por exceso)

𝑆𝑖 𝑛 < 30 , 𝑢𝑠𝑎𝑟 𝑙𝑎 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑉𝑒𝑙𝑙𝑒𝑚𝑎𝑛: k= 𝑛 [30 – 36  33

𝑆𝑖𝑛 ≥ 30, 𝑢𝑠𝑎𝑟Regla𝑑𝑒𝑆𝑡𝑢𝑟𝑔𝑒𝑠: 𝑘 = 1 + 3.32 log 𝑛 [36 – 42  39

𝑅
[42 – 48  45
3) Amplitud (A ) = (redondeo por exceso)
𝑘 [48 – 54  51
42
Amplitud (A ) = = 6 (redondeo por exceso) [54 – 60] 57
7

22 5/07/2023
Aplicación en PSPP para una variable cuantitativa

23 Tablas de frecuencias para datos agrupados


Aplicación en PSPP para una variable cuantitativa 6º
Ingresar los límites
de los intervalos


Colocar el nombre de la
nueva variable

24 Tablas de frecuencias para datos agrupados
Aplicación
Tenemos la
en PSPP para una variable cuantitativa
nueva
variable

25 Tablas de frecuencias para datos agrupados


Medidas de dispersión
Las medidas estadísticas de variabilidad se clasifican en absolutas o relativas.

Medidas Medidas
absolutas relativas

Coeficiente
Rango Desviación
Rango Varianza de
Intercuartil Estándar
Variación

26 Medidas de dispersión
Interpretación del Coeficiente de variación
Una escala que nos permite la interpretación del coeficiente de variación es fenómenos no controlados como los
naturales, sociales, deportivos, entre otros, se tiene:
Rango del CV Interpretación Nivel de variabilidad

0% < CV < 5% Datos muy homogéneos


Baja variabilidad
5% < CV < 10% Datos homogéneos

Datos regularmente
10% < CV < 15%
homogéneos
Moderada variabilidad
Datos regularmente
15% < CV < 20%
heterogéneos

20% < CV < 25% Datos heterogéneos


Alta variabilidad
CV ≥ 25% Datos muy heterogéneos

27 Medidas de dispersión

Aplicación en PSPP 2º

3º Elegimos las
Hallaremos medidas de
dispersión
el rango, la
varianza y
desviación
estándar.

Tenemos los resultados del


rango (intervalo), la varianza y
desviación estándar.
28 Medidas de dispersión
2° Buscar y elegir

Aplicación en PSPP la función CFVAR( )

Hallaremos el
coeficiente de
variación
Tenemos el
3° Ingresar resultado del
1º Colocar etiqueta para coeficiente de
los datos el coeficiente de
variación
variación.

29 Medidas de dispersión
En PSPP:

Nivel de
Rango del CV Interpretación
variabilidad
0% < CV < 5% Datos muy homogéneos
Tenemos el
Baja variabilidad
5% < CV < 10% Datos homogéneos resultado del
10% < CV < 15%
Datos regularmente coeficiente de
homogéneos Moderada
variabilidad
variación.
Datos regularmente
15% < CV < 20% heterogéneos

20% < CV < 25% Datos heterogéneos


Alta variabilidad
CV ≥ 25% Datos muy heterogéneos

Como observamos, el CV≥25%, por lo tanto hay alta variabilidad.


30 5/07/2023
Representación gráfica
Para complementar el análisis (procesamiento de datos) que se realiza por medio de las tablas de distribución de
frecuencias existe la posibilidad de construir gráficas de diversos tipos que permiten explicar de manera mucho más fácil
el comportamiento de los datos estudiados.

Mostrar
magnitudes
Entre los

para comparar
valores
Una Explicar
que
Los datos
Gráfica estadísticos
tendencias adquiere
una
estadística Interpretar variable
relaciones
Analizar

31 Representación gráfica
Clasificación de los gráficos estadísticos
La clasificación de los gráficos estadísticos es en función del tipo de variable (cualitativo o cuantitativo)

Variables Variables
Cuantitativas Cualitativas
Tipo Continuo: Tipo Nominal y Ordinal:
• Histogramas • Gráfico Circular
• Ojiva • Gráfico de Barras
• Polígonos de frecuencia

Tipo Discreto:
• Gráfico de Barras

32 Representación gráfica
Gráficos de barras
Es un gráfico que se utiliza para Sencillo
representar datos de variables
cualitativas o cuantitativas
discretas.
Gráfico Agrupado
Está formado por barras
rectangulares (verticales u
de
horizontales) cuya altura es barras Apilado
proporcional a la frecuencia
absoluta de cada uno de los
valores de la variable. Pirámide de
población

33 Representación gráfica
Gráfico circular
También llamado gráfica de
pastel o diagrama de sectores.
Es un gráfico que se utiliza para
representar datos de variables
cualitativas.
Se utiliza para representar la
proporción de elementos de Se recomienda utilizar
cada uno de los valores de la gráficos en 2D ya que los de
variable. Consiste en dividir 3 dimensiones siempre
el círculo en porciones parece mayor la parte más
proporcionales a la frecuencia cercana al usuario.
relativa y porcentual.

34 Representación gráfica
Histograma
Es un gráfico que se utiliza para representar datos de variables
cuantitativas continuas.

Un histograma es un conjunto de barras rectangulares verticales


cuya altura es proporcional a las frecuencias absolutas de cada
uno de los intervalos (también se pueden representar
las frecuencias relativas o frecuencias relativas porcentuales).

Los intervalos abarcan todo el conjunto sin cortarse, de manera


que un elemento está solo en un intervalo. La base de cada barra
vertical es proporcional a la amplitud del intervalo.

35 Representación gráfica
Polígonos de frecuencia
Es un gráfico que se utiliza para
representar datos de variables
cuantitativas continuas.

Es una gráfica poligonal cerrada,


que se obtiene uniendo con
segmentos de recta, los puntos
que tienen proporcionalmente
como abscisa a la marca de clase
y como ordenada a la frecuencia
respectiva. Se cierra en ambos
extremos en las marcas de clase
adyacentes de frecuencia cero.
36 Representación gráfica
Ojiva
Es un gráfico que se utiliza para
representar datos de variables
cuantitativas continuas.

Una Ojiva se utiliza para representar la


frecuencia acumulada. Similar al Polígono
de frecuencia, se forma o se construye
uniendo los puntos más altos de cada
columna pero de un Histograma que
represente las Frecuencias Acumuladas.

37 Representación gráfica
Ejemplo Ejemplo: Construcción de una Tabla de Distribución de Frecuencias para
una Variable Cualitativa
Se pidió a un grupo de alumnos que indiquen su nivel socioeconómico, y se obtuvo los
siguientes resultados:
medio bajo alto alto bajo
bajo alto bajo bajo medio
alto bajo medio medio alto
medio medio alto alto bajo
Aplicación en PSPP para una gráfica correspondiente
a un variable cualitativa

Seleccionar
tipo de 1º
gráfico

39 Representación gráfica
Aplicación en PSPP para una gráfica correspondiente
a un variable cualitativa

40 Representación gráfica
Ejemplo
Hallar las medidas de posición central

Se dispone de datos sobre el número de créditos acumulados de 50 estudiantes de la Carrera de


Negocios de Zegel IPAE. Los datos obtenidos son los siguientes:
18 21 23 34 45 56 32 26 25 31
36 29 24 22 34 45 56 32 19 41
20 25 27 32 46 50 51 56 54 23
26 35 24 38 39 43 49 60 48 50
21 30 35 19 43 48 54 56 26 29

41 5/07/2023
Ejemplo
Se dispone de datos sobre el número de créditos acumulados de 50 estudiantes de la Carrera de
Negocios de Zegel IPAE. Los datos obtenidos son los siguientes:

42 5/07/2023
Aplicación en PSPP para una gráfica correspondiente
a un variable cuantitativa continua


Histograma

43 Representación gráfica
Aplicación en PSPP para una gráfica correspondiente
a un variable cuantitativa continua

44 Representación gráfica
Interpretación de las Medidas de
Localización

Estadística aplicada a la Investigación


Fórmulas para los cuartiles y
percentiles de una TDF no agrupada
Mientras que los cuartiles dividen a la
data en 4 partes iguales, los percentiles
la dividen en 100 partes iguales.
Imagínate un tío que sólo te de propina
de 25 en 25 soles, el será tu tío CUARTIL
y otro tío que si te da la propina exacta
cuando se la pides, por ejemplo pides 34
soles, este será tu tío Percentil.

Estadística aplicada a la Investigación


Fórmulas para los cuartiles y
percentiles de una TDF no agrupada
Para calcular un cuartil o un percentil Posición
primero debemos ubicarlos (posición).
Estas fórmulas nos ayudarán a Cuartil Percentil
encontrar los lugares donde están
escondidos los cuartiles y los
percentiles. Cuando el resultado de la
aplicación es decimal, se estila
conservar el valor del lugar entero y
sumar la interpolación del consecutivo.

Estadística aplicada a la Investigación


Aplicación en PSPP


Elegimos las
medidas de
localización

48 Medidas de tendencia central


Medidas de Forma de la distribución
Es la medida que indica la
Son indicadores o simetría de la distribución de
Asimetría una variable respecto a la media
medidas estadísticos aritmética, sin necesidad de
que permiten Medidas de hacer la representación gráfica.
identificar si una Forma de la
distribución de Distribución Esta medida indica cuán
frecuencia presenta Curtosis escarpada o achatada está una
curva o distribución.
uniformidad.

49 5/07/2023
Medidas de Forma
Coeficiente de Asimetría: Casos
Las medidas de asimetría son indicadores que permiten
establecer el grado de simetría (o asimetría) que presenta
una distribución de probabilidad de una variable aleatoria
(medida intervalo y razón) sin tener que hacer su
representación gráfica. Si una distribución es simétrica,
existe el mismo número de valores a la derecha que a la
izquierda de la media, por tanto, el mismo número de
desviaciones con signo positivo que con signo negativo.
Decimos que hay asimetría positiva (o a la derecha) si la
"cola" a la derecha de la media es más larga que la de la
izquierda, es decir, si hay valores más separados de la
media a la derecha. Diremos que hay asimetría negativa
(o a la izquierda) si la "cola" a la izquierda de la media es
más larga que la de la derecha, es decir, si hay valores
más separados de la media a la izquierda.

Estadística aplicada a la Investigación


Medida de Curtosis:
Mientras el coeficiente de Asimetría de Fisher son permite ver que tan desviados del centro se encuentran
nuestros datos. El coeficiente de curtosis nos da una idea de la ubicación de éstos datos alrededor de la
media, es decir del grado de apuntamiento, comparándola con una distribución normal.

Estadística aplicada a la Investigación


Tipos de curva de
Asimetría distribución según su
asimetría

Asimétrica Negativa Asimétrica Positiva


Simétrica
(o a la izquierda) (o a la derecha)

Si está alargada o Si está alargada o


inclinada hacia el lado Si no está alargada o inclinada hacia el lado
izquierdo inclinada hacia ningún derecho
lado
(moda > media) (media > moda)

Recuperado: http://andromeda.estadistica.unam.mx/tutorial_estadistica/Est_Indic_SHCP/recursos/imgpp07u1t04.png
Interpretación del Coeficiente de Asimetría
Coeficiente de
Interpretación
Asimetría
CA > 0,6 Asimétrica Positiva Fuerte
Los coeficientes de
0,3 < CA ≤ 0,6 Moderadamente asimétrica positiva
asimetría de Fisher o
0,05 < CA ≤ 0,3 Moderadamente simétrica
Pearson o Bowley se
- 0,05 ≤ CA ≤ 0,05
interpretan de la Simétrica

misma manera: - 0,3 ≤ CA < - 0,05 Moderadamente simétrica


- 0,6 ≤ CA < - 0,3 Moderadamente asimétrica negativa

CA < - 0,6 Asimétrica Negativa Fuerte

53 5/07/2023
Curtosis Tipos de curva de distribución según su
curtosis

Leptocúrtica Mesocúrtica Platicúrtica

Si existe una gran Si existe una Si existe una baja


concentración de valores. concentración normal de concentración de valores.
valores.

En PSPP: Elegimos las


medidas de
asimetría y
curtosis

Hallaremos
el
coeficiente 2º
de Asimetría
y Curtosis.

Es moderadamente asimétrica positiva


55 5/07/2023 y leptocúrtica.
Aprendemos
Se dispone de datos sobre el número de créditos acumulados de 50 estudiantes
de la Carrera de Negocios de Zegel IPAE. Los datos obtenidos son los
siguientes: 18 21 23 34 45 56 32 26 25 31

36 29 24 22 34 45 56 32 19 41

20 25 27 32 46 50 51 56 54 23

26 35 24 38 39 43 49 57 48 50

21 30 35 19 43 48 54 56 26 29

Halle las medidas de forma de la distribución, utilizando el PSPP e interprete.


56 5/07/2023
Ejemplo
1) Rango (R) = valor máximo - valor mínimo.
Intervalos
Rango (R) = 57 - 18 = 39
[18 – 24 

2) Número de intervalos (k) == 1 + 3.32 log(50) = 6.6 = 7 [24 – 30 


(redondeo por exceso)
[30 – 36 
𝑆𝑖 𝑛 < 30 , 𝑢𝑠𝑎𝑟 𝑙𝑎 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑉𝑒𝑙𝑙𝑒𝑚𝑎𝑛: k= 𝑛
[36 – 42 
𝑆𝑖𝑛 ≥ 30, 𝑢𝑠𝑎𝑟Regla𝑑𝑒𝑆𝑡𝑢𝑟𝑔𝑒𝑠: 𝑘 = 1 + 3.32 log 𝑛
[42 – 48 
𝑅
3) Amplitud (A ) = (redondeo por exceso)
[48 – 54 
𝑘

Amplitud (A ) =
39
= 5.57 = 6 (redondeo por exceso) [54 – 60 
7

57 5/07/2023
Solución
Frecuenci
Frecuencia Frecuencia
Marca Frecuencia Frecuencia a Relativa Frecuencia
Intervalo Absoluta Porcentual
de clase Absoluta Relativa Acumulad Porcentual
1° Construir la [Li – Ls>
(xi) (fi)
Acumulada
(hi) a (pi)
Acumulada
(Fi) (Pi)
tabla de 18 − 24 (Hi)

Distribución de 24 − 30 21 9 9 0,18 0,18 18% 18%


27 10 19 0,20 0,38 20% 38%
Frecuencias, 30 − 36
33 9 28 0,18 0,56 18% 56%
sólo con los 36 − 42
42 − 48 39 4 32 0,08 0,64 8% 64%
datos
48 − 54 45 5 37 0,10 0,74 10% 74%
necesarios. 51 6 43 0,12 0,86 12% 86%
54 − 60
57 7 50 0,14 1 14% 100%

58 5/07/2023
Aplicación en PSPP para una variable cuantitativa

59 Tablas de frecuencias para datos agrupados


Aplicación en PSPP para una variable cuantitativa 6º
Ingresar los límites
de los intervalos


Colocar el nombre de la
nueva variable

60 Tablas de frecuencias para datos agrupados
Aplicación
Tenemos la
en PSPP para una variable cuantitativa
nueva
variable

61 Tablas de frecuencias para datos agrupados


Aplicación en PSPP para una variable cuantitativa
Siguiendo los
pasos ya
mencionados
anteriormente, se
genera la tabla de
distribución de
frecuencias para
datos agrupados
por intervalos

62 Tablas de frecuencias para datos agrupados


En PSPP: Elegimos las


medidas de
asimetría y
curtosis

Hallaremos
el
coeficiente 2º
de Asimetría
y Curtosis.

Es moderadamente asimétrica positiva


63 5/07/2023
y platicúrtica.
Supuestos para una regresión lineal:
Figura 1
La Regresión Lineal nos permite analizar el Temperatura de Falla del Motor por Horas Trabajadas
comportamiento de 2 o más variables
cuantitativas para luego hacer posteriores
pronósticos. Para aplicar esta teoría debo
suponer primero una hipótesis; Aquí se
encontrarán implícitas los 2 tipos de variables
que necesitamos: la dependiente y la
independiente. Por ejemplo: “la temperatura de
falla del motor depende las horas trabajadas”.
Aquí la variable dependiente o predicción (y)
seria la temperatura de falla del motor y la
variable independiente o predictora (x) el
número de horas trabajadas por el motor.
Nota. Elaboración Propia. eje x (horas), eje y (°C).
Estadística aplicada a la Investigación
Supuestos para una regresión lineal:
Para que la regresión lineal sea más precisa, se
recomienda que cumpla con 5 supuestos. Otros
autores indican que si la intención es solo
conocer un ratio estas condiciones no son
restrictivas al cálculo.

Estadística aplicada a la Investigación


Modelo de regresión lineal:
Hacer un análisis de regresión lineal consiste en Método de los mínimos cuadrados (MMC)
aplicar teorías estadísticas para hallar la ecuación
de la recta que pasa perfectamente por el centro
de la nube de datos cuantitativos (diagrama de
dispersión o de puntos). Así todo el análisis lleva
a hallar a y b.

Estadística aplicada a la Investigación


Modelo de regresión lineal:
Método de los mínimos cuadrados (MMC) Diagrama de dispersión o de puntos
Ecuación de la línea de regresión.

Fórmula para calcular la pendiente de la línea de Regresión.


a: “es la variación de y, cada vez que x aumenta en 1”

Fórmula para calcular el intercepto de la línea de


Regresión. b: “es el valor puntual de y cuando x=0”

Estadística aplicada a la Investigación


Cálculo e interpretación de la correlación (R)
La correlación nos indica que sentido y fuerza tiene
la relación entre las variables de estudio.
La fuerza de R puede ser como mínimo -1 y como
máximo 1.

Estadística aplicada a la Investigación Fuente: https://rpubs.com/camilamila/correlaciones


•El índice de correlación se define mediante fórmulas específicas (dependiendo del
Índice o modelo de regresión)
coeficiente •El valor de “r” varía entre -1 y +1, es decir: -1≤ 𝑟 ≤ 1
•Para la interpretación clásica el índice de correlación de todo modelo de regresión
de se tiene la siguiente tabla de categorías:
correlación ESCALA CATEGORIAS ESCALA

-0,2 < r < 0,0 Existe correlación no significativa 0,0 < r < 0,2

-0,4 < r ≤ -0,2 Existe baja correlación 0,2 ≤ r < 0,4

-0,7 < r ≤-0,4 Existe una significativa correlación 0,4 ≤ r < 0,7

-1,0 < r ≤-0,7 Existe alto grado de correlación 0,7 ≤ r < 1,0

r = -1 Existe perfecta correlación r=1


r=0 Los datos están incorrelacionados r=0

La categorización mostrada en la tabla es arbitraria ya que dependerá de la naturaleza de la investigación o


definición especifica del investigador.
Cálculo e interpretación de la determinación (R2)
Imagínate esta conversación:
¿Mi amor me amas? Rpta.-si
¿Qué tan seguro estas? Uhmmmm.. Un 2%.

Bueno si alguien dice que te ama pero con una seguridad del 2%,
no vale la pena tu esfuerzo y tiempo. Lo mismo nos sucede con
las hipótesis que tienen un grado de determinación o seguridad
muy bajo.

La determinación nos indica el grado de ajuste, seguridad o la


probabilidad que el modelo se aproxime a una regresión lineal.
La determinación (R2) se puede obtener de forma manual
elevando al cuadrado la correlación.
Mientras que la correlación oscila entre -1 y 1, la determinación Fuente: https://elpais.com/eps/psicologia-y-bienestar/2021-
11-04/anatomia-del-amor-anhelamos-seguridad-pero-a-la-
por su exponente cuadrático siempre es positiva y oscila entre 0 y vez-buscamos-aventura.html
1 (0% y 100%).
Estadística aplicada a la Investigación
Demostrando lo aprendido
El propietario de la cadena de tiendas Company estudió la
relación entre las ventas y la cantidad que gastaba en la
publicidad. La información de las ventas de los cuatro
últimos meses se repite a continuación.
Mes Gastos en publicidad Ganancia por ventas
(Millones de dólares) (Millones de dólares)

Mayo 2 7
Junio 1 3
Julio 3 8
Agosto 4 10

a) Determine el coeficiente de correlación


b) Determine la ecuación de regresión.
c) Estime las ventas cuando se gastan $5 millones en publicidad.
d) Estime el gasto en publicidad si deseamos una ganancia por ventas de $18
millones
Demostrando lo aprendido
Mes Gastos en Ganancia por
publicidad ventas
(Millones de (Millones de
dólares) dólares)
Mayo 2 7
Junio 1 3
Julio 3 8
Agosto 4 10

a) Determine el coeficiente de correlación


b) Determine la ecuación de regresión.
c) Estime las ventas cuando se gastan $5
millones en publicidad.
d) Estime el gasto en publicidad si deseamos una
ganancia por ventas de $18 millones
Demostrando lo aprendido
Mes Gastos en Ganancia por
publicidad ventas
(Millones de (Millones de
dólares) dólares)
Mayo 2 7
Junio 1 3
Julio 3 8
Agosto 4 10

a) Determine el coeficiente de correlación


b) Determine la ecuación de regresión.
c) Estime las ventas cuando se gastan $5
millones en publicidad.
d) Estime el gasto en publicidad si deseamos una
ganancia por ventas de $18 millones
Demostrando lo aprendido
Mes Gastos en Ganancia por
publicidad ventas
(Millones de (Millones de
dólares) dólares)
Mayo 2 7
Junio 1 3
Julio 3 8 Existe alto grado de correlación.

Agosto 4 10

a) Determine el coeficiente de correlación Entonces el coeficiente de determinación es 93%,


b) Determine la ecuación de regresión. esto nos indica que de los datos de la variable “x”
c) Estime las ventas cuando se gastan $5 condiciona a los datos de la variable “y” en un 93%
millones en publicidad. de los casos.
d) Estime el gasto en publicidad si deseamos una
ganancia por ventas de $18 millones
Demostrando lo aprendido
Mes Gastos en Ganancia por
publicidad ventas
(Millones de (Millones de
dólares) dólares)
Mayo 2 7
Junio 1 3
Determine la ecuación de regresión.
Julio 3 8
Agosto 4 10 Estime el gasto en publicidad si deseamos una
Estime las ventas cuando se gastan $5 ganancia por ventas de $18 millones
millones en publicidad.
El gasto en publicidad debería ser de
7.5 millones si deseamos una ganancia
de 18 millones.

Se estima unas ventas de 12.5 millones y la probabilidad de


que ocurra es del 93%.
Demostramos lo aprendido

1. Los datos que se muestran corresponden a calificativos obtenidos en una


prueba de “ conocimientos sobre Estadística aplicada a la Investigación” tomados
a un grupo de 25 estudiantes del segundo ciclo de Zegelipae.

12 08 11 14 19 16 09 16 15
06 09 14 12 04 05 07 02 10
13 15 12 16 11 06 05
Colocar los datos en el PSPP

Los datos que se muestran corresponden a calificativos


obtenidos en una prueba de “ conocimientos sobre Estadística
aplicada a la Investigación” tomados a un grupo de 25
estudiantes del segundo ciclo de Zegelipae.

12 08 11 14 19 16 09 16 15
06 09 14 12 04 05 07 02 10
13 15 12 16 11 06 05
Hallar los intervalos y la marca de clase

Rango (R) = 19 - 2 = 17

𝑆𝑖 𝑛 < 30 , 𝑢𝑠𝑎𝑟 𝑙𝑎 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑉𝑒𝑙𝑙𝑒𝑚𝑎𝑛: k= 25 = 5

17
Amplitud (A ) = = 3.4 Intervalos Marca de
5 clase

[2 – 5.4  3.7
[5.4 – 8.8  7.1
[8.8 – 12.2  10.5
[12.2 – 15.6  13.9
[15.6 – 19 ] 17.3
Colocar los límites reales

Intervalos Marca de
clase

[2 – 5.4  3.7
[5.4 – 8.8  7.1
[8.8 – 12.2  10.5
[12.2 – 15.6  13.9
[15.6 – 19 ] 17.3
Generar la segunda variable
Colocar los intervalos y la marca de clase en la etiqueta de valor
Mostrar la etiqueta de valor
Generar la tabla de frecuencia con intervalos
Medidas de tendencia central
Medidas de Dispersión
Histograma
Medidas de Localización
Medidas de Forma
Aprendemos
2. Una fábrica de cierta marca de
Temperatura Cantidad de Temperatura Cantidad de
gaseosas ha tomado al azar 10 semanas media (ºC) gaseosas media (ºC) gaseosas
al año, observando la temperatura media (X) (Y) (X) (Y)

correspondiente (en ºC) a cada una de 10 21 19 39


ella y la cantidad de gaseosas vendidas 28 65 24 67
durante cada uno de dichos periodos. La 12 31 5 11
información obtenida es la siguiente:
31 72 9 12
Hallar la ecuación de la recta estimada 30 75 15 24
utilizando PSPP

89 5/07/2023
Demostrando lo aprendido
Temperatura Cantidad de
media (ºC) gaseosas
(X) (Y)
10 21
28 65
12 31
31 72
30 75
19 39
24 67
5 11
9 12
15 24
Gráfico de Puntos
Regresión Lineal
Valores de la Regresión Lineal
Coeficiente de correlación y determinación

R = 0.97
Existe alto grado de correlación.

R2 = 0.95 = 95%
Entonces el coeficiente de determinación es 95%, esto nos
indica que de los datos de la variable “x” condiciona a los
datos de la variable “y” en un 95% de los casos.
Ecuación de Regresión

Ecuación de regresión lineal.


y = -6.42 + 2.63 * x
Estime la probable cantidad de gaseosas vendidas si
tenemos una temperatura de 32°.
y = -6.42 + 2.63 (32)
y = 77.74
Se estima una venta de 78 gaseosas y la probabilidad de
que ocurra es del 95%.
Ecuación de Regresión

Ecuación de regresión lineal.


y = -6.42 + 2.63 * x
Estime la temperatura, si deseamos vender 50 gaseosas.

50 = -6.42 + 2.63 (x) Debería haber una


50 + 6.42 = 2.63x temperatura de 21.45° si
se desea vender 50
56.42 = x gaseosas, y existe una
2.63 probabilidad de que
ocurra del 95%. .
21.45 = x
97 Tablas de frecuencias para datos sin agrupar

También podría gustarte