Documentos de Académico
Documentos de Profesional
Documentos de Cultura
P á g i n a 1 | 73
Contenido
Introducción .....................................................................................................................4
Justificación .....................................................................................................................6
Tema..................................................................................................................................7
Objetivo general ..............................................................................................................8
Objetivos específicos ..................................................................................................8
Marco Teórico ..................................................................................................................9
Análisis de Regresión Lineal Múltiple ..........................................................................9
Modelo de regresión múltiple ...................................................................................... 10
Modelo de regresión lineal en el que se utilizan matrices ....................................... 13
Análisis de correlación ................................................................................................. 15
Prueba de Hipótesis ...................................................................................................... 17
Fórmulas para la prueba de hipótesis .................................................................... 17
Tabla ANOVA ................................................................................................................. 20
Pasos para calcular la Tabla ANOVA ...................................................................... 20
Representación de la Tabla ANOVA ........................................................................ 21
Grados de libertad (GL) ................................................................................................ 22
Fórmula ....................................................................................................................... 22
Notación .................................................................................................................. 22
Suma de los cuadrados (SC) ....................................................................................... 23
Cuadrados medios (CM) ............................................................................................... 24
Valor F ............................................................................................................................. 25
Valor p ............................................................................................................................. 25
R-cuadrado. .................................................................................................................... 26
Inferencias en la regresión lineal múltiple ................................................................. 27
Coeficiente de determinación múltiple o R2 .............................................................. 28
Coeficiente de determinación Múltiple o R2 ....................................................... 28
Diseño Factorial (Diseño de 3 Factores) .................................................................... 29
Formulas del Diseño Factorial de 3 Factores ........................................................ 30
Tabla ANOVA de 3 Factores: ....................................................................................... 33
Modelo para Experimento de 3 Factores .................................................................... 34
Pruebas no paramétricas ............................................................................................. 35
Prueba de Kruskal-Wallis ......................................................................................... 36
Prueba de signo ......................................................................................................... 37
P á g i n a 2 | 73
Planteamiento de la Hipótesis.................................................................................. 38
Desarrollo ....................................................................................................................... 39
Capítulo 1: Análisis de Regresión Múltiple de los costos de producción con
respecto a la cantidad de software elaborados, ingresos mensuales y costo de
mano de obra directa. ................................................................................................... 39
1.1 Modelo de Regresión Lineal múltiple................................................................ 41
1.2 Diagrama de dispersión ...................................................................................... 42
1.3 Análisis de correlacion ....................................................................................... 43
1.4 Análisis de varianza ............................................................................................ 45
1.5 Coeficientes.......................................................................................................... 46
1.6 Prueba de significancia del modelo ................................................................. 48
Capítulo 2: Análisis de varianza de tres factores para conocer si los costos
indirectos de fabricación, mano de obra directa y costos de desarrollo afectan
significativamente los costos de producción de software. ..................................... 50
2.1 Tabla de diseño factorial de tres factores ........................................................ 55
2.2 Suma de las interacciones de los efectos. ....................................................... 56
2.3 Tabla de Análisis de Varianza ............................................................................ 59
2.4 Prueba de hipótesis para conocer si los costos indirectos de fabricación,
mano de obra directa y costos de desarrollo tienen un efecto significativo en
los costos de producción para la elaboración de software. ................................ 60
Capítulo 3: Prueba de Kruskal-Wallis para conocer si el número de trabajadores
para la elaboración de los softwares de contabilidad, videojuegos y estadísticos
es el mismo o difieren por tipo de software............................................................... 61
3.1 Tabla con los datos ............................................................................................. 62
3.1.1 Calculando “n” y sus rangos ...................................................................... 63
3.2 Prueba de Hipótesis para determinar cuál de tres diferentes tipos de
software, contable, videojuegos y estadístico requiere mayor número de
trabajadores para su elaboración. ........................................................................... 63
Capítulo 4: Aplicar la prueba de signo para determinar si la elaboración de
softwares tarda 90 días o más. ........................................................................................... 66
Conclusiones........................................................................................................................... 69
Recomendaciones ................................................................................................................. 70
Anexo......................................................................................................................................... 70
Bibliografías............................................................................................................................. 73
P á g i n a 3 | 73
Introducción
P á g i n a 4 | 73
El problema principal del proyecto estadístico de la empresa FREE
BALANCES, es que actualmente no llevan un control de cada uno de los
procesos que se realizan, debido a que la mayoría de veces les que ocasiona
reclamos de los clientes debido a la demora en el tiempo y en muchas ocasiones
no se lleva un control de los ingresos, en vista se requiere que los procesos
internos sean correctamente estructurados.
P á g i n a 5 | 73
Justificación
P á g i n a 6 | 73
Tema
P á g i n a 7 | 73
Objetivo general
Objetivos específicos
P á g i n a 8 | 73
Marco Teórico
La regresión lineal es una técnica estadística destinada a analizar por qué pasan
las cosas o cuáles son las principales explicaciones de algún fenómeno. A partir
de los análisis de regresión lineal múltiple podemos:
(Ronald, 2012)
La regresión lineal se utiliza para generar conocimientos para los gráficos que
contienen al menos dos campos continuos con uno identificado como el destino
y el otro como un predictor. Además, se puede especificar un predictor categórico
y dos campos continuos auxiliares en un gráfico y se pueden utilizar para generar
un modelo de regresión adecuado. (Ronald, 2012)
P á g i n a 9 | 73
¿Qué son las variables dependientes?
Por último, las independientes son las variables que sirven para estudiar las
dependientes.
= b0 + b1 x1 + ··· + bk x k,
P á g i n a 10 | 73
También se pueden aplicar técnicas similares de mínimos cuadrados para
estimar los coeficientes cuando el modelo lineal incluye, por ejemplo, potencias
y productos de las variables independientes. Un ejemplo de esto se presentaría
cuando k = 1, en cuyo caso el experimentador podría pensar que las medias μY|x
no caen sobre una línea recta, sino que se describen de manera más adecuada
mediante el modelo de regresión polinomial.
μ |x = β0 + β1 x + β2x 2 + ··· + βr x r, Y
𝑌̂ = b0 + b1 x + b2x 2 + ··· + br x r
μY |x 1, x 2,..., x k = β0 + β1 x 1 + ··· + βk x k
Donde yi es la respuesta observada a los valores x1i, x2i,..., xki de las k variables
independientes x1, x2,..., xk. Se supone que cada observación (x1i, x2i,..., xki,
yi) satisface la siguiente ecuación:
yi = β0 + β1 x 1i + β2 x 2i + ··· + βk x ki + i
o bien,
P á g i n a 11 | 73
Como en el caso de la regresión lineal simple, se supone que las i son
independientes y están distribuidos en forma idéntica con media cero y varianza
común σ 2. Si usamos el concepto de mínimos cuadrados para obtener los
estimados b0, b1,..., bk, minimizamos la expresión.
𝑛 𝑛
(Ronald, 2012)
Estas ecuaciones se pueden resolver para b0, b1, b2,..., bk utilizando cualquier
método apropiado que permita resolver sistemas de ecuaciones lineales. Casi
todos los programas estadísticos de cómputo se pueden utilizar para obtener
soluciones numéricas de las ecuaciones anteriores. (Ronald, 2012)
P á g i n a 12 | 73
Modelo de regresión lineal en el que se utilizan matrices
yi = β0 + β1 x 1i + β2x 2i + ··· + βk x ki + i.
(Ronald, 2012)
𝜕
(𝑆𝐶𝐸) = 0
𝜕𝑏
(X X) b = X y.
P á g i n a 13 | 73
Naturaleza de la matriz X. Además del elemento inicial, el i-ésimo renglón
representa los valores de x que dan lugar a la respuesta yi. .
(Ronald, 2012)
Ab = g
b = A −1 g = (X X) −1 X y.
P á g i n a 14 | 73
Análisis de correlación
El análisis de correlación consiste en un procedimiento estadístico para
determinar si dos variables están relacionadas o no. El resultado del análisis es
un coeficiente de correlación que puede tomar valores entre -1 y +1. El signo
indica el tipo de correlación entre las dos variables. Un signo positivo indica que
existe una relación positiva entre las dos variables; es decir, cuando la magnitud
de una incrementa, la otra también. Un signo negativo indica que existe una
relación negativa entre las dos variables. Mientras los valores de una
incrementan, los de la segunda variable disminuyen. Si dos variables son
independientes, el coeficiente de correlación es de magnitud cero. La fuerza de
la relación lineal incrementa a medida que el coeficiente de correlación se
aproxima a -1 o a +1. (Ronald, 2012)
Una de las herramientas que nos permite inferir si existe dicho vínculo es
justamente el análisis de correlación. Este procedimiento tiene por objetivo
indicarnos si existe relación entre dos eventos, es decir, variables, un poco sobre
la naturaleza de dicha relación, y su fuerza.
r=Covxy / SxxSyy
P á g i n a 15 | 73
Para calcular la covarianza entre la variable X y la variable Y (entre las dos
columnas de la matriz) de acuerdo a la siguiente fórmula:
P á g i n a 16 | 73
Prueba de Hipótesis
Una prueba de hipótesis es una regla que especifica cuando se puede
aceptar o rechazar una afirmación sobre una población dependiendo de la
evidencia proporcionada por una muestra de datos. (Ronald, 2012)
P á g i n a 17 | 73
Nula, falto de valor y fuerza para obligar o tener efecto). La hipótesis
alternativa es que el efecto sí existe, que es distinto de cero, y que en algunos
casos se puede especificar el signo de esa diferencia. Normalmente
corresponde a la hipótesis de trabajo, se abrevia como H1 y tiene tres
alternativas: µ 1≠ µ 2, µ 1< µ 2 o bien µ 1> µ 2.
P á g i n a 18 | 73
5. Si p es menor que α, rechazar H0 y aceptar la alternativa; en caso contrario,
se acepta la hipótesis nula. El conjunto de valores que resultarían en el
rechazo de H0 – calculados conociendo la prueba usada, α y el número de
observaciones – se conoce con el nombre de región crítica. Este punto puede
representarse así: se rechaza la H0 si el estadístico cae en la región crítica.
En los apéndices de los textos de estadística aparecen tablas con la
distribución de estos estadísticos, dando el valor de p y donde el tamaño de
la muestra se considera en los grados de libertad.
(Ronald, 2012)
P á g i n a 19 | 73
Tabla ANOVA
La tabla del análisis de la varianza (también conocida como Tabla
ANOVA), fue desarrollada a principios de 1930 por el estadístico británico Ronald
Aylmer Fisher, y es por ello que a veces también se conoce a esta prueba
estadística como «ANOVA de Fisher» o «análisis de varianza de Fisher «.
(Ronald, 2012)
H0: μ1=μ2=⋯=μk
P á g i n a 20 | 73
Representación de la Tabla ANOVA
(∑ 𝑌𝑖)2
SST = ∑ 𝑦𝑖 2 −
𝑛
(∑ 𝑌𝑖)2
SSR = β̃𝑇 𝑋 𝑇 𝑦 −
𝑛
P á g i n a 21 | 73
Grados de libertad (GL)
Los grados de libertad se definen frecuentemente como el número de
observaciones (piezas de información) en los datos que pueden variar libremente
al estimar parámetros estadísticos. (Ronald, 2012)
Fórmula
Indica el número de elementos independientes en la suma de cuadrados. Los
grados de libertad para cada componente del modelo son:
(Factor) GL = r – 1
Error GL = nT – r
Total = nT – 1
Notación
Término Descripción
P á g i n a 22 | 73
Suma de los cuadrados (SC)
La suma de las distancias al cuadrado. La SC Total es la variación total
en los datos. El SC (Factor) es la desviación de la media del nivel de factor
estimado alrededor de la media general. Esto se conoce también como la suma
de los cuadrados entre los tratamientos. El error SC es la desviación de una
observación desde su media de nivel de factor correspondiente. Esto se conoce
también como error en los tratamientos. (Ronald, 2012)
̅̅̅2
Factor SC = ∑ 𝑖 ∑ 𝑗 (𝑌̅𝑖 − 𝑌)
̅̅̅̅2
Error SC = ∑ 𝑖 ∑ 𝑗 (𝑌𝑖𝑗 − 𝑌𝑖)
̅̅̅2
SC Total = ∑ 𝑖 ∑ 𝑗 (𝑌𝑖𝑗 − 𝑌)
Notación
Término Descripción
P á g i n a 23 | 73
Cuadrados medios (CM)
Los cuadrados medios esperados son calculados de acuerdo con el tipo
de factor replicación e interacción; sirven para ver la variación entre grupos y
para establecer la variación dentro de los grupos considerados en un proceso
investigativo mediante la utilización del diseño experimental. (Ronald, 2012)
Fórmula
𝑭𝑨𝑪𝑻𝑶𝑹 𝑺𝑪
Factor CM = 𝑭𝑨𝑪𝑻𝑶𝑹 𝑮𝑳
𝑬𝑹𝑹𝑶𝑹 𝑺𝑪
ERROR CM = 𝑬𝑹𝑹𝑶𝑹 𝑮𝑳
Notación
Término Descripción
CM Cuadrado medio
GL Grados de libertad
P á g i n a 24 | 73
Valor F
La estadística F es simplemente un cociente de dos varianzas. Las
varianzas son una medida de dispersión, es decir, qué tan dispersos están los
datos con respecto a la media. Los valores más altos representan mayor
dispersión. La varianza es el cuadrado de la desviación estándar. (Ronald, 2012)
Fórmula
𝑪𝑴 (𝑭𝑨𝑪𝑻𝑶𝑹)
F= 𝑪𝑴 (𝑬𝑹𝑹𝑶𝑹)
Los grados de libertad del numerador son r – 1. Los grados de libertad del
denominador son nT – r.
Notación
Término Descripción
Valor p
Se utiliza en las pruebas de hipótesis como ayuda para decidir si se puede
rechazar o no una hipótesis nula. El valor p es la probabilidad de obtener una
estadística de prueba que sea por lo menos tan extrema como el valor calculado
real, si la hipótesis nula es verdadera. Un valor de corte comúnmente utilizado
para el valor p calculado es 0.05. Por ejemplo, si el valor p de una estadística de
prueba es menor que 0.05, rechace la hipótesis nula. (Ronald, 2012)
P á g i n a 25 | 73
R-cuadrado.
En estadística, el coeficiente de determinación, denominado R², es un
estadístico usado en el contexto de un modelo estadístico cuyo principal
propósito es predecir futuros resultados o probar una hipótesis. (Ronald, 2012)
𝑬𝑹𝑹𝑶𝑹 𝑺𝑪
1- 𝑺𝑪 𝑻𝑶𝑻𝑨𝑳
Notación
Término Descripción
Y variable de respuesta
P á g i n a 26 | 73
Inferencias en la regresión lineal múltiple
El conocimiento de la distribución de los estimadores del coeficiente
individual facilita al experimentador construir intervalos de confianza para los
coeficientes y hacer pruebas de hipótesis acerca de ellos. Recuerde que en la
sección 12.4 estudiamos que bj (j = 0, 1, 2,..., k) se distribuyen de forma normal
con media βj y varianza cjjσ 2. De esta manera, se puede utilizar el estadístico.
(Ronald, 2012)
𝑩𝑱− 𝜷𝑱𝟎
T=
𝒔√𝒄𝑱𝑱
H0: βj = βj 0,
H1: βj ≠ βj 0,
P á g i n a 27 | 73
Coeficiente de determinación múltiple o R2
𝑆𝐶𝑅 ∑𝑁 ̌ ̅2)
𝐼=1(𝑌𝑖 − 𝑦 𝑆𝐶𝐸
𝑅2 = = 𝑛 =1−
𝑆𝑇𝐶𝐶 ̌ − 𝑦̅2)
∑𝑖=1(𝑌𝑖 𝑆𝑇𝐶𝐶
P á g i n a 28 | 73
Diseño Factorial (Diseño de 3 Factores)
Este tipo de diseño se utiliza para experimentos con dos o más factores,
dado que en general son los más eficientes para ellos. En este diseño se
investiga todas las combinaciones posibles entre los niveles de los factores.
(Ronald, 2012)
Este tipo de diseño se utiliza para experimentos con dos o más factores,
dado que en general son los más eficientes para ellos. En este diseño se
investiga todas las combinaciones posibles entre los niveles de los factores.
(Ronald, 2012)
P á g i n a 29 | 73
Formulas del Diseño Factorial de 3 Factores
̌ − 𝑌𝑘
SC (AC) = BN ∑ 𝑖 ∑ 𝑘 (𝑌𝑖𝑘 ̌ + 𝑌̌)2
SCB = acn ∑𝒃𝒋=𝟏(𝒚 ̌ )𝟐
̌𝒋 − 𝒚
̌ − 𝑌𝑘
SC (BC) = AN ∑ 𝑗 ∑ 𝑘 (𝑌𝑗𝑘 ̌ + 𝑌̌)2
̌𝒌 − 𝒚
SCC = abn ∑𝒄𝒌=𝟏(𝒚 ̌ )𝟐
STC = n ∑ 𝒊 ∑ 𝒊 ∑ 𝒋 ∑ 𝒌 (𝒚 ̌ )𝟐
̌− 𝒚
̌ − 𝒚
SCE = ∑ 𝒊 ∑ 𝒊 ∑ 𝒋 ∑ 𝒌 (𝒚𝒊𝒋𝒌𝒍 ̌𝒊𝒋𝒌)𝟐
P á g i n a 30 | 73
Suma de cuadrados
Otras alternativas para realizar la suma de cuadrados en experimentos de tres
factores.
𝑌2
SCT = ∑𝑖=1 𝑎 ∑𝑗=1 𝑏 ∑𝑘=1 𝑐 ∑𝑙=1 𝑛 𝑌 2 𝑖𝑗𝑘𝑙 −
𝑁
𝒀𝟐 𝒀𝟐 𝒀𝟐 𝒀𝟐 𝒀𝟐 𝒚𝟐
SCa = ∑𝒊=𝟏 𝒂 − : 𝑺𝑪𝒃 = − : 𝑺𝑪𝒄 = ∑𝒍=𝟏 𝒄 −
𝒃𝒄𝒏 𝑵 𝒂𝒄𝒏 𝑵 𝒂𝒃𝒏 𝑵
𝒀𝟐 𝒀𝟐
SCab = ∑𝒊=𝟏 𝒂 ∑𝒋=𝟏 𝒃 − − 𝑺𝑪𝒂 − 𝑺𝑪𝒃
𝑪𝑵 𝑵
𝒀𝟐 𝒀𝟐
SCac = ∑𝒊=𝟏 𝒂 ∑𝒋=𝟏 𝒄 − − 𝑺𝑪𝒂 − 𝑺𝑪𝒄
𝑩𝑵 𝑵
𝒀𝟐 𝒀𝟐
SCbc = ∑𝒊=𝟏 𝒃 ∑𝒋=𝟏 𝒄 − − 𝑺𝑪𝒃 − 𝑺𝑪𝒄
𝑨𝑵 𝑵
𝟐 𝒀𝟐
SCabc = ∑𝒊=𝟏 𝒂 ∑𝒋=𝟏 𝒃 ∑𝒌=𝟏 𝒄 𝒀𝒏 −
𝑵
− 𝑺𝑪𝒂𝒃 − 𝑺𝑪𝒂𝒄 − 𝑺𝑪𝒃𝒄
P á g i n a 31 | 73
Los Promedios en la Formula se definen como:
P á g i n a 32 | 73
Tabla ANOVA de 3 Factores:
(Ronald, 2012)
CM = SUMACUADRADO/GRADOS DE LIBERTAD
FCAL= CM/CME
P á g i n a 33 | 73
Modelo para Experimento de 3 Factores
I = 1,2 a; j = 1,2 b; 1,2 c; y L =1,2 n, donde α,β,y,yk son los efectos principales y
(αβ)ij, (αy)ik, y (βy)jk son los efectos de interacción de 2 factores que tienen la
misma interpretación que en el experimento de 2 factores.
Conclusiones de FCrítica
P á g i n a 34 | 73
Pruebas no paramétricas
P á g i n a 35 | 73
Prueba de Kruskal-Wallis
P á g i n a 36 | 73
Prueba de signo
̃ =μ
H0: μ ̃,0
̌,
H1: µ̃ < µ0
P = P (X ≤ x cuando p = 1/2)
P á g i n a 37 | 73
Planteamiento de la Hipótesis
P á g i n a 38 | 73
Desarrollo
Variable de estudio
Y = Ingresos en $.
Variables Independientes
X1 X2 X3 Y
Mes Cantidad de Costos de Costos de mano Ingresos
software producción de obra directa
elaborado
Enero 10 $25.00 $10.00 $52.00
Febrero 14 $36.00 $13.00 $64.00
Marzo 20 $70.00 $17.00 $110.00
Abril 16 $48.00 $13.00 $80.00
Mayo 13 $33.00 $12.00 $60.00
Junio 18 $52.00 $15.00 $100.00
Julio 15 $46.00 $14.50 $75.00
Agosto 21 $74.00 $19.00 $120.00
Septiembre 16 $48.00 $15.00 $88.00
Octubre 20 $70.00 $18.00 $110.00
Noviembre 16 $48.00 $14.80 $80.00
Diciembre 21 $85.00 $20.00 $120.00
Total 200 $635.00 $181.30 $1,059.00
P á g i n a 40 | 73
1.1 Modelo de Regresión Lineal múltiple
Coeficientes
Intercepcion -11.6283
Cantidad de software elaborado 4.8425
Costos de producción 0.3760
Costos de mano de obra directa -0.0481
De aquí el modelo es
Cada una de las pendientes de este modelo representan que por cada unidad
que aumente la cantidad de software elaborado, los costos de producción y los
costos de mano de obra directa, los ingresos varían en promedio tantas unidades
como indica la pendiente.
Y = $139.30.
P á g i n a 41 | 73
Una vez interpretados los resultados se pueden predecir los ingresos de la
empresa FREE BALANCES cuando la cantidad de software elaborado es de 25,
los costos de producción son de $25 y los costos de mano de obra directa son
de $24, resultando en que la empresa obtendria ingresos $139.30.
Diagrama de dispersión
150
Ingresos
100
50
0
0 20 40 60 80 100 120
Muestra percentil
P á g i n a 42 | 73
1.3 Análisis de correlacion
Estadisticas de la regresion
Coeficiente de correlacion multiple 0.986065703
Coeficiente de determinacion R^2 0.972325571
R^2 ajustado 0.96194766
Error tipico 4.598274554
Observaciones 12
P á g i n a 43 | 73
El coeficiente de determinación R2
Esta es una medida mucho más usada e indica que tan bien se ajusta el modelo.
Significa que tanto explican la cantidad de software elaborado, costos de
producción y los costos de mano de obra directa, en conjunto, lo que ocurre en
los ingresos. Su valor va entre 0 y 1, y mientras más cercano a 1, la cantidad de
software elaborado, costos de producción y los costos de mano de obra directa
explican una mayor variación de los ingresos. En este caso R2 es alto, de 0.972.
Esto indica un ajuste casi perfecto y, por tanto, un modelo muy fiable para las
previsiones futuras.
R2 ajustado
Tal como indica su nombre, es similar al R2 pero este se ajusta por la cantidad
de variables que tiene la regresión. Esto ocurre porque si se agregan la suficiente
cantidad de variables al modelo, entonces R2 se acercara cada vez más a 1, aun
cuando esas variables sean totalmente irrelevantes. Luego R2 “castiga” por la
cantidad de variables que tiene la regresión, siendo una medida más estricta de
que tan bueno está el modelo. En este caso, es casi igual que el R 2 ya que el
modelo tiene en cuenta la cantidad de software elaborado, costos de producción
y los costos de mano de obra directa.
Error típico
También se le conoce como error estándar y nos indica cuanto se desvían las
variables de la predicción que realiza la regresión, es decir, es la distancia que
tienen los puntitos (que son las observaciones) a la recta de regresión.
Observaciones
P á g i n a 44 | 73
1.4 Análisis de varianza
ANOVA
GL SC CM Fca. Valor crítico de F
Regresión 3 5943.096969 1981.032323 93.69183923 1.42742E-06
Residuos 8 169.153031 21.14412887
Total 11 6112.25
Grados de libertad
Los grados de libertad de una prueba estadística son el número de datos que
son libres de variar cuando se calcula tal prueba.
La suma de cuadrados
Cuadrado medio
Sirven para ver la variación entre los grupos y para ver la variación entre grupos
y establecer la variación dentro de los grupos considerados en un proceso
investigativo mediante la utilización del diseño experimental.
P á g i n a 45 | 73
F calculada y F crítica
1.5 Coeficientes
Intercepción
P á g i n a 46 | 73
serían de $ -11.828. Aunque este número puede no tener un sentido práctico, es
clave entender su significado en una regresión.
Este coeficiente indica que por cada unidad de software elaborado, el salario
aumenta en $ 4.8425.
Este coeficiente indica que por cada dólar de costo de producción, el salario
aumenta en $0.3760.
Similar al anterior, este coeficiente indica que por cada unidad de costo de mano
de obra directa, el salario aumentar $ -0.0481.
Error típico
Este error indica la variación que tiene la estimación del coeficiente. Sera muy
importante al momento de determinar la significancia.
Estadístico t
Probabilidad
P á g i n a 47 | 73
específicamente menor a 0.05. En nuestro caso, todos los valores-p del
coeficiente de la regresión son muy cercanos a cero, por lo que, nuevamente se
dice que son distintos a cero.
1) Planteamiento de la Hipótesis
𝐻0 : 𝛽1 = 𝛽2 = 𝛽3 = 0
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝛽𝑖 ≠ 0
2) Estadístico de Prueba
3) Cálculo
Fcal = 93.6918
P á g i n a 48 | 73
4) Regla de decisión
Donde α = 0.05
Fcrítico = F (1 - α, k, n - k - 1) = F (0.95, 3,8)
Fcrítico = 4.07
5) Conclusión
Como 93.69 > 4.07, con 95% de confianza se rechaza la H0 y se concluye que
existe una relación significativa entre los ingresos y las tres variables
independientes, cantidad de software elaborado, costos de producción y costos
de mano de obra directa.
P á g i n a 49 | 73
Capítulo 2: Análisis de varianza de tres factores para conocer
si los costos indirectos de fabricación, mano de obra directa y
costos de desarrollo afectan significativamente los costos de
producción de software.
Factor A (CIF)
A1: A2: A3:
Luz Mantenimiento de Salario Personal
equipo Administrativo
P á g i n a 50 | 73
El mantenimiento de equipo de trabajo: Consiste en realizar todas aquellas
actuaciones y acciones necesarias en ellos para evitar fallos y averías. Con
el objetivo de asegurar el funcionamiento y disponibilidad de dichos equipos
para la producción.
P á g i n a 51 | 73
La estimación de los costos de desarrollo de software es un factor muy
importante en el análisis de proyectos informáticos, constituye un tema
estratégico contar con indicadores para medir el costo de los mismos,
garantizando la eficiencia, excelencia, calidad y la competitividad.
Luz $5,633.80
Mantenimiento $35,000.00
Salario $100,000.00
Impuestos $24,960,000.00
Licencias $15,000.00
proceso de producción $150,000.00
prestación de servicios $40,000.00
P á g i n a 53 | 73
Una vez explicado cada uno de los factores involucrados se procede a
aplicar el diseño para investigar el efecto de los costos indirectos de
fabricación (A), mano de obra directa (B) y costos de desarrollo (C) con
respecto a los costos de producción para la elaboración de software de la
empresa FREE BALANCES (Y), para ello se decide correr un experimento
factorial 3x2x2 con seis replicas y las observaciones obtenidas en las 72
corridas experimentales que se muestran en la tabla.
P á g i n a 54 | 73
2.1 Tabla de diseño factorial de tres factores
2253
Impuesto 24965.6 22770.5 23470.5 25460.5 21435.3 21435.3 210435.4 210354.2 210344.6 24674.9 21234.9 4.764 23444.2 25768.4 23546.4 24500.2 24000.43
s (C1) 338 423 423 300 255 255 354 354 540 996 342 4 26434.2343 354 33 365 341 11 1969228.7046
170.633 150.523 160.543 200000.0 200549.2 202349.4 89.34 250.764 236.542 155.000 143.234
8 5 2 60.6338 63.5432 61.9054 000 333 565 90.0000 90.2347 22 265.0000 3 3 0 5 148.5433
Licencias
de
software 158.633 142.432 143.452 201123.9 205234.2 203515.3 90.05 270.235 268.054 149.999 134.234
(C2) 4 1 1 61.5423 62.1249 62.3259 832 314 212 91.5464 87.8645 46 268.5435 4 5 6 5 156.4345 1217056.1479
P á g i n a 55 | 73
2.2 Suma de las interacciones de los efectos.
Datos
a= 3
b= 2
c= 2
n= 6
N= 72
2758335.7998 427949.0527
P á g i n a 56 | 73
Efecto AB
A1 A2 A3
B1 B2 B1 B2 B1 B2
Efecto AC
A1 A3 A4
Efecto BC
B1 B2
C1 1543078.2161 426150.4885
C2 1215257.5837 1798.5643
P á g i n a 57 | 73
Efecto ABC
A1 A2 A3
B1 B2 B1 B2 B1 B2
P á g i n a 58 | 73
2.3 Tabla de Análisis de Varianza
ANOVA
Grados
Suma de Cuadrado
Fuente de Variación de Fcal Fcritica Valor P
cuadrado Medio
libertad
Se
4.90081E-
Efecto A 1.49674E+11 2 74837178035 45063.33245 0.051337169 rechaza
96
H0.
Se
4.18588E-
Efecto B 75426422094 1 75426422094 45418.14675 0.003965174 rechaza
88
H0.
Se
8.78644E-
Efecto C 7857827152 1 7857827152 4731.603817 0.003965174 rechaza
59
H0.
Se
4.48175E-
Efecto AB 1.50121E+11 2 75060638909 45197.88979 0.051337169 rechaza
96
H0.
Se
1.90166E-
Efecto AC 288633662.8 2 144316831.4 86.90062241 0.051337169 rechaza
18
H0.
Se
1.92523E-
Efecto BC 129420698.5 1 129420698.5 77.93089095 0.003965174 rechaza
12
H0.
Se
8.60903E-
Efecto ABC 269573077 2 134786538.5 81.16194053 0.051337169 rechaza
18
H0.
Error 99642668.18 60 1660711.136
Total 3.83867E+11 71
P á g i n a 59 | 73
2.4 Prueba de hipótesis para conocer si los costos indirectos
de fabricación, mano de obra directa y costos de desarrollo
tienen un efecto significativo en los costos de producción para
la elaboración de software.
Se deja en evidencia que los efectos principales tanto de los costos indirectos de
fabricación, costos de mano de obra directa y costos de desarrollo son muy
significativos. Así mismo, las interacciones de dos factores como lo son, los
costos indirectos de fabricación y su interacción con los costos de mano de obra
directa, los costos indirectos de fabricación y su interacción con los costos de
desarrollo, los costos de mano de obra directa y su interacción con los costos de
desarrollo y la interacción de los tres factores, costos indirectos de fabricación,
costos de mano de obra directa y costos de desarrollo también son significativas.
Interpretación
P á g i n a 60 | 73
Capítulo 3: Prueba de Kruskal-Wallis para conocer si el número
de trabajadores para la elaboración de los softwares de
contabilidad, videojuegos y estadísticos es el mismo o difieren
por tipo de software.
P á g i n a 61 | 73
Se desea realizar un experimento para determinar cuál de tres
diferentes tipos de software, contable, videojuegos y estadístico requiere
mayor número de trabajadores para su elaboración, se mide el número de
trabajadores necesarios para desarrollar cada uno de los softwares que se
han realizado, se presentan en la siguiente tabla. Se utiliza la prueba de
Kruskal-Wallis y un nivel de significancia de 0.05 para probar la hipótesis
de que el número de trabajadores para la elaboración de cada software son
iguales para los tres tipos.
Prueba de Kruskal-Wallis
Software
A B C
10 20 18
7 16 16
15 7 7
8 9 4
11 12 15
19 17
P á g i n a 62 | 73
3.1.1 Calculando “n” y sus rangos
Software
A B C
20 (17) 18 (15)
r1= 33.5 r2= 63.5 r3= 56
n1 = 5 n2 = 6 n3 = 6
P á g i n a 63 | 73
Estadístico de prueba
𝟏𝟐 𝒓𝟏 𝟐 𝒓𝟐 𝟐 (𝒓𝟑 𝟐 )
𝑯= [( ) + ( ) + ( ) ] − 𝟑 (𝑵 + 𝟏)
𝑵(𝑵 + 𝟏) 𝒏𝟏 𝒏𝟐 𝒏𝟑
Hcal = 1.631
Reglas de decisión
V = # de columnas – 1
3-1=2
α = 0.05
Hcritica = 5.991
Conclusión
P á g i n a 64 | 73
Como Hcal = 1.631 no cae en la región crítica h > 5.991, no hay evidencia
suficiente para rechazar la hipótesis de que el número de trabajadores
necesarios para el desarrollo de software son iguales para los tres tipos
softwares, ya sea software contable, software de videojuegos y software
estadístico.
P á g i n a 65 | 73
Capítulo 4: Aplicar la prueba de signo para determinar si la
elaboración de softwares tarda 90 días o más.
Así mismo, todo software puede tener fallos que terminen siendo responsables
de grandes pérdidas de dinero para la empresa.
Situación 1:
Situación 2:
P á g i n a 66 | 73
La empresa FREE BALANCES realiza la prueba de signo para
determinar quién tiene la razón, con respecto a las situaciones
presentadas previamente.
H0: μ = 90 días.
Nivel de significancia
α= 0.05
Datos
86 -
115 +
100 +
80 -
98 +
95 +
90 Eliminado
82 -
118 +
90 Eliminado
97 +
94 +
P á g i n a 67 | 73
X (Todos los signos positivos) = 7.
n (Todos los signos positivos y negativos) = 10.
p=½
q=½
μ: n*p
Ztabla: 1.64
(𝑥 ± 0.5) − µ
Zcal =
√𝑛 𝑝 𝑞
( 7+ 0.5) −5
Zcal = 11
√10 2 2
Zcal = 1.58113883
Conclusión
No se rechaza H0 ∴ se rechaza H1.
Interpretación
Aceptamos que el programador tiene la razón, es decir, se acepta
que el promedio de días que el programador tarda en la realización
de softwares es igual o mayor a 90 días.
Debido a que los programadores necesitan tiempo para investigar el
proceso a desarrollar, entrevistar a gente que domina el proceso para
crear los algoritmos del software propuesto, deben de tener tiempo
para realizar pruebas al software que muchas veces se tiene que
buscar la disponibilidad para implementar la aplicación.
P á g i n a 68 | 73
Conclusiones
P á g i n a 69 | 73
Recomendaciones
P á g i n a 70 | 73
Anexo
P á g i n a 71 | 73
Tabla de Valores Críticos de la distribución F
P á g i n a 72 | 73
Bibliografías
(Ronald, 2012)
https://youtu.be/AAtNl-c2Qn0
https://youtu.be/ofTOldXbTro
P á g i n a 73 | 73