Está en la página 1de 62

UNIVERSIDAD MARIANO GÁLVEZ DE GUATEMALA

CENTRO REGIONAL DE QUETZALTENANGO


ESTADISTICA COMPUTACIONAL
CATEDRÁTICO:
ING. DENER MEDRANO

“ESTUDIO DEL CONSUMO DE ANCHO DE BANDA EN LA RED


LOCAL DE LA EMPRESA GRUPO ENTRE RIOS S.A.”

ALUMNOS:

CARLOS HUMBERTO DE LEÓN VILLATORO 2692-07-16455


MICHAEL ALEXANDER SANCHEZ RAMOS 2692-08-3703
LUIS ENRIQUE ESTRADA ARDAVIN 2692-08-9238

QUETZALTENANGO, 09 DE MAYO DE 2015


Contenido

Introducción............................................................................................................. 3
1. Teoría relevante .................................................................................................. 4
1.1 Aspectos Tecnológicos e informática. ........................................................... 4
1.1.1 Redes de computadoras ......................................................................... 4
1.1.2 Tipos de redes ........................................................................................ 4
1.1.3 Medios de transmisión ............................................................................ 5
1.1.3 Metodología TCP/IP ................................................................................ 5
1.1.4 Protocolos ............................................................................................... 7
1.1.5 Redes de Computadoras de Área Local ................................................. 8
1.1.6 Red de área local inalámbrica ............................................................... 10
1.1.7 Redes de Área Amplia (WAN) .............................................................. 12
1.1.8 Elementos de Una Red ......................................................................... 13
1.2 Aspectos científicos y estadística ................................................................ 15
1.2.1 Estadística ............................................................................................ 15
1.2.2 Estadística descriptiva .......................................................................... 16
1.2.3 Medidas de tendencia central ............................................................... 18
1.2.4 Medidas de posición ............................................................................. 18
1.2.5 Medidas de Dispersión.......................................................................... 18
1.2.6 Distribución de Probabilidades ............................................................. 19
2. Caso.................................................................................................................. 21
2.1 Objetivos de aprendizaje ............................................................................. 21
2.2 Párrafo de apertura ..................................................................................... 21
2.3 Antecedentes generales de la organización ................................................ 22
2.4 Área específica de interés ........................................................................... 25
2.5 Situación específica, decisión, problema u oportunidad .............................. 25
2.6 Alternativas .................................................................................................. 26
2.6.1 Recolección de los datos ...................................................................... 26
2.6.2 Tabulación de los datos ........................................................................ 26
2.6.3 Cálculo de las medidas de tendencia central ........................................ 26
2.6.4 Cálculo de las medidas de posición ...................................................... 29
2.6.5 Cálculo de las medidas de dispersión ................................................... 33
2.6.6 Distribución normal ............................................................................... 35
2.6.7 Intervalos de confianza ......................................................................... 39
2.6.8 Análisis de varianza ANOVA ................................................................. 41
2.6.9 Prueba T de Student ............................................................................. 42
2.6.10 Prueba de chi cuadrado ...................................................................... 46
2.7. Conclusiones .............................................................................................. 47
2.8. Preguntas ................................................................................................... 48
2.8.1 Preguntas y respuestas relativas a las inquietudes .............................. 48
2.8.2 Preguntas y respuestas relativas a la experiencia ................................ 49
2.9. Bibliografía.................................................................................................. 51
2.10. Anexos...................................................................................................... 52
2.10.1 Figuras ................................................................................................ 52
2.10.2 Tablas ................................................................................................. 57
Índice de figuras

Figura No. 1 – Dispositivos para conectarse a una red local .......................... 52


Figura No. 2 – Histograma de frecuencias ...................................................... 52
Figura No. 3 – Polígono de frecuencias .......................................................... 53
Figura No. 4 – Ojiva ........................................................................................ 53
Figura No. 5 – Probabilidad normal 1 .............................................................. 54
Figura No. 6 – Probabilidad normal 2............................................................... 55
Figura No. 7 – Probabilidad normal 3 .............................................................. 55
Figura No. 8 – Probabilidad normal 4 .............................................................. 55
Figura No. 9 – Probabilidad normal 5 .............................................................. 56
Figura No. 10 – Gráfica chi cuadrado ............................................................. 56

Índice de tablas

Tabla No. 1: Datos de consumo de ancho de banda semana 1


13-04-2015 al 18-04-2015 ............................................................................... 57
Tabla No. 2 – Datos de consumo de ancho de banda semana 2
20-04-2015 al 25-04-2015 ............................................................................... 57
Tabla No. 3 – Tabulación de los datos de ancho de banda ........................... 58
Tabla No. 4 – Resumen medidas de tendencia central, posición
y dispersión ..................................................................................................... 58
Tabla No. 5 – Datos para prueba de intervalos de confianza ......................... 59
Tabla No. 6 - Análisis de varianza de un factor semana 1 .............................. 59
Tabla No. 7 – Análisis de varianza de un factor probabilidades semana 1 ..... 59
Tabla No. 8 - Análisis de varianza de un factor semana 2 .............................. 60
Tabla No. 9 - Análisis de varianza de un factor probabilidades semana 2 ...... 60
3

Introducción

El presente documento fue elaborado para analizar el comportamiento del


consumo de ancho de banda en la red de la empresa Grupo Entre Ríos S.A.,
además de aplicar los conocimientos adquiridos en el curso de Estadística
Computacional.

Este trabajo de investigación se presenta de la siguiente manera: Fase 1,


en esta fase está el contenido sobre la teoría relevante y relacionada al caso que
se está estudiando, esto con el objetivo de que el lector comprenda el contenido
de la Fase 2, tratando de explicar términos utilizados a lo largo de este
documento. En la Fase 2, se presentan varios incisos en los cuales se encuentran
los objetivos del aprendizaje, en el cual se presentan lo que se quiere conseguir al
final con el estudio realizado; el párrafo de apertura trata sobre una idea general
de lo que trata el estudio, para que el lector comprenda sobre que trata el caso;
además se presentan los antecedentes de la organización, en la cual se describe
la historia de cómo surgió, la evolución a lo largo del tiempo y como está
actualmente funcionando; en el área específica de interés se describe el por qué
se tomó este fenómeno para evaluar y el impacto que tiene dentro de la
organización; en la situación, decisión, problema u oportunidad se explica la
problemática que está afectando la organización; en las alternativas se expone el
trabajo de recopilación, aplicación de los métodos estadísticos a la problemática y
los resultados de los mismos; finalmente las conclusiones que dejó el estudio del
caso, además en los anexos se encuentran todas las tablas y figuras que se
fueron generando de los distintos métodos estadísticos.
4

1. Teoría relevante

1.1 Aspectos Tecnológicos e informática.

1.1.1 Redes de computadoras

Se puede definir a las redes de computadoras como “la agrupación de


computadores, impresoras, routers, switches y otros dispositivos que se pueden
comunicar entre sí a través de un medio de transmisión”. Por medio de esta red se
pueden transmitir toda clase de datos, incluyendo voz y video.

1.1.2 Tipos de redes

Las redes se clasifican atendiendo a varios criterios como el área que cubren,
los medios de transmisión, tecnología de transmisión, entre otros. Por el área de
cobertura pueden ser:

 Redes de área local (LAN): Conectan estaciones de trabajo, periféricos,


terminales y otros dispositivos en un solo edificio u otra área limitada; es
decir, un área geográficamente pequeña Son redes de alta velocidad y bajo
nivel de error.
 Redes de Área Metropolitana (MAN): Abarca un área metropolitana.
Generalmente, una MAN abarca un área geográfica más grande que una
LAN, pero cubre un área geográfica más pequeña que una WAN, como por
ejemplo un campus universitario o una ciudad.
 Redes de Área Amplia (WAN): Sirve a usuarios dentro de un área
geográfica extensa y a menudo usa dispositivos de transmisión
suministrados por proveedores de servicio comunes. Estas redes, en
cambio, suelen ser de velocidades más bajas que las LAN. Un ejemplo es
la Internet.
5

1.1.3 Medios de transmisión

Existen una clasificación de los medios de transmisión de datos, las


importantes son las siguientes:

 Par trenzado: Medio de cable de cuatro pares que se utiliza en varias redes.
Su desventaja es que solo alcanza una distancia de hasta 100m, aunque se
recomienda una distancia no mayor a 90m.
 Cable coaxial: Un alambre dentro de un conductor cilíndrico. Tiene un mejor
blindaje y puede cruzar distancias mayores con velocidades mayores (por
ejemplo, 1-2 Gbps).
 Fibra óptica: Hoy tiene un ancho de banda de 50.000 Gbps, pero es
limitada por la conversión entre las señales ópticas y eléctricas (1 Gbps).
En una fibra de modo único los pulsos no pueden rebotar (el diámetro es
demasiado pequeño) y se necesita menor amplificación.
 Microondas: 100 MHz-10 GHz. Van en líneas rectas. Antes de la fibra
formaban el centro del sistema telefónico de larga distancia. EL problema
es que la lluvia las absorbe.

1.1.3 Metodología TCP/IP

Es un conjunto de protocolos diseñado para la comunicación entre


computadoras de tal modo para que estas compartan recursos en un ambiente de
red.

1.1.3.1 Características de TCP/IP

 Independencia del fabricante.


 Soporta múltiples tecnologías.
6

 Es Ruteable.
 Puede funcionar en máquinas de cualquier tamaño.
 Otorga acceso a Internet.

El modelo básico en Internet es el modelo Cliente/Servidor. El Cliente es un


programa que le solicita a otro que le preste un servicio. El Servidor es el
programa que proporciona este servicio.

1.1.3.2 Direcciones IP

Es una dirección lógica de 32 bits asignada a los hosts que usan TCP/IP. Una
dirección IP corresponde a una de cinco clases (A, B, C, D o E) y se escribe en
forma de 4 octetos separados por puntos (formato decimal con punto). Las
utilizadas redes de computación son las clases A, B y C26.

Clase Rango
A 1.0.0.0 - 127.255.255.255
B 128.0.0.0 - 191.255.255.255
C 192.0.0.0 - 223.255.255.255

1.1.3.3 MAC Address

Dirección de Control de Acceso al Medio (MAC). Es una dirección física


estandarizada de 6bytes, controlada por la IEEE, representada en hexadecimal,
que se encuentra en cada tarjeta adaptadora de red, y que es única para cada
tarjeta.
7

1.1.3.4 Ancho de banda

Diferencia entre las frecuencias más altas y más bajas disponibles para las
señales de red. También se utiliza este término para describir la capacidad de
rendimiento medida de un medio o un protocolo de red específico.

1.1.3.5 Broadcast

Paquete de datos enviado a todos los nodos de una red. Los broadcasts se
identifican mediante una dirección de broadcast.

1.1.3.6 Dirección de broadcast

Dirección especial reservada para enviar un mensaje a todas las estaciones.

1.1.3.7 Dominio de broadcast

Conjunto de todos los dispositivos que recibirán tramas de broadcast que se


originan en cualquier dispositivo dentro del conjunto. Los dominios de broadcast
se encuentran normalmente delimitados por routers.

1.1.4 Protocolos

A medida que se desarrollaban las redes de computadoras se fueron


desarrollando varios Protocolos de red. Entre los protocolos más conocidos, y que
se han ido implementando, tenemos: TCP/IP, Novel IPX, X.25, Frame Relay, entre
otros.
8

1.1.4.1 Direccionamiento

El direccionamiento lógico está formado por 32 bits, 4bytes representados en


decimal separados por puntos, con una parte de red y una de host. Las
direcciones se pueden asignar de forma estática o dinámica, pero se necesita de
un protocolo de Resolución de Direcciones (ARP) para direccionar los paquetes en
la red.

1.1.4.2 Servicios

No hay publicación de servicios. Se utilizan protocolos para los diferentes


servicios. Los servidores publican en la red sus servicios. Los routers
mantienen tablas con los servicios disponibles.

1.1.4.3 Difusión

Actualmente se lo considera como estándar, es soportado por la mayoría de


sistemas y está disponible a nivel mundial. Es un conjunto propietario de
protocolos, que aún es muy utilizado en redes de servidores.

1.1.5 Redes de Computadoras de Área Local

Las Redes de Área Local, generalmente llamadas LAN (Local Area Network),
son redes de propiedad privada dentro de un solo edificio.

Se usan ampliamente para conectar computadoras personales PC´s y


estaciones de trabajo en oficinas de compañías y fábricas con el objeto de
compartir recursos (por ejemplo: impresoras, capacidad de almacenamiento,
dispositivos de comunicaciones) e intercambiar información entre usuarios. Las
LAN se distinguen de otro tipo de redes por tres características:
9

 Su infraestructura
 Su direccionamiento
 Su topología

Las LAN están restringidas por la infraestructura, lo cual significa que sus
tiempos de retransmisión están limitados y son conocidos y por lo tanto pueden
ser controlados en base a diseños adecuados de la red.

Las LAN tradicionales operan a velocidades que van de los 10 a los 100 Mbps
(Mega Bits por Segundo) y actualmente nuevas LAN ya se están implementando a
velocidades del orden de los Gbps (Giga Bits por Segundo).

Algunos de los dispositivos que utilizan las redes de área local para
conectarse se muestran en la Figura No. 1.

1.1.5.1 Sistema de cableado estructurado

El concepto de cableado estructurado es tender cables de señal en un edificio


de manera tal que cualquier servicio de voz, datos, vídeo, audio, tráfico de
Internet, seguridad, control y monitoreo esté disponible desde y hacia cualquier
roseta de conexión (Outlet) del edificio. Esto es posible distribuyendo cada servicio
a través del edificio por medio de un cableado estructurado estándar con cables
de cobre o fibra óptica.

1.1.5.1.2 Componentes de cableado estructurado

Entre los principales componentes se tiene:


10

 Cableado Backbone: Cableado que brinda interconexiones entre armarios


para el cableado, entre los armarios para el cableado y el POP, y entre
edificios que forman parte de la misma LAN. También se lo llama cableado
vertical.
 MDF - Servicio de Distribución Principal: Sala de comunicaciones principal
de un edificio. Punto central de una topología de red en estrella, donde se
encuentran ubicados los paneles de conmutación, los switches y el Router.
 IDF - Servicio de distribución intermedia: Sala de comunicaciones
secundaria para un edificio donde funciona una topología de red en estrella.
El IDF depende del MDF.
 HCC - Interconexión cruzada horizontal: Armario para el cableado donde el
cableado horizontal se conecta a un panel de conmutación, que a su vez se
conecta mediante un cableado backbone al próximo IDF.

1.1.6 Red de área local inalámbrica

Una red de área local inalámbrica puede definirse como una red de alcance
local que tiene como medio de transmisión el aire. Por red inalámbrica
entendemos una red que utiliza ondas electromagnéticas como medio de
transmisión de la información que viaja a través del canal inalámbrico enlazando
los diferentes equipos o terminales móviles asociados a la red. Una red de área
local inalámbrica, también llamada Wireless LAN (WLAN), es un sistema flexible
de comunicaciones que puede implementarse como una extensión o directamente
como una alternativa a una red cableada. Este hecho proporciona al usuario una
gran movilidad sin perder Conectividad.

1.1.6.1 Componentes de una WLAN

Una LAN inalámbrica por lo general está constituida por los siguientes
elementos:
11

 Estaciones: Una estación (STA) es un computador o equipo de la red que


está provisto con un dispositivo de la red inalámbrico o tarjeta adaptadora.
Una computadora personal con un adaptador de la red inalámbrico es
conocida como un cliente inalámbrico. Los clientes inalámbricos pueden
comunicar directamente entre sí o a través de un punto de acceso
inalámbrico.
 Punto de Acceso Inalámbrico: Conocido como Access Point (AP) es un
nodo de la red inalámbrico que actúa como un puente entre STA’s y una
red alámbrica. Contiene por lo menos una interfase que conecta el AP con
una red alambrada existente, un dispositivo de red inalámbrica con el que
se cree conexiones con STA’s, y un software de puenteo IEEE 802.1D para
que pueda actuar como un puente transparente entre la red cableada e
inalámbrica.
 Puertos: Es un canal que puede soportar una sola conexión punto a punto.
Para el estándar IEEE 802.11b, un puerto es una asociación, una entidad
lógica sobre la cual se hace una sola conexión inalámbrica. Un cliente
inalámbrico típico con un solo adaptador de la red inalámbrico tiene un
puerto y puede apoyar sólo una conexión inalámbrica. Un AP inalámbrico
típico tiene puertos múltiples y puede apoyar conexiones inalámbricas
múltiples simultáneamente.
 Sistema de distribución: Son mportantes ya que proporcionan movilidad
entre los AP, para tramas entre distintos puntos de acceso o con los
terminales. Determina y controla donde está la estación para enviarle las
tramas.

1.1.6.2 Seguridad

 WEP: (Wired Equivalent Privacy) Es un algoritmo de seguridad estática que


se basa en un sistema sencillo de secretos compartidos (contraseña o
12

clave) para la autenticación de usuarios y dispositivos en la WLAN’s. El


estándar no contempla ningún mecanismo de distribución automática de
claves, lo que obliga a escribir la clave manualmente en cada uno de los
elementos de red. Puede ser WEP64 (40 bits reales) WEP128 (104 bits
reales). El problema de WEP es que no es completamente seguro, pues
puede ser descifrado, y no hay forma de distribuir una nueva clave
automáticamente.

 WPA: (Wi-Fi Protected Access) Utiliza una distribución dinámica de claves,


mejora la confidencialidad y aplica nuevas técnicas de integridad y
autentificación. Incluye las siguientes tecnologías:

1.1.7 Redes de Área Amplia (WAN)

Una red de Área Amplia o WAN (Wide Area Network), se extiende sobre un
área geográfica extensa, a veces un país o un continente, contiene una colección
de máquinas dedicadas a ejecutar programas de aplicación de usuario.

Las Hosts están conectadas por una Subred de Comunicación o simplemente


Subred. El trabajo de la Subred es conducir mensajes de una Host a otra. La
separación entre los aspectos exclusivamente de comunicación de la red (la
Subred) y los aspectos de las aplicaciones (las Hosts) simplifican enormemente el
diseño total de la red.

En muchas redes de área amplia, la subred tiene dos componentes distintos:


las líneas de transmisión y los Elementos de Conmutación

Las Líneas de Transmisión, también llamadas: circuitos, canales o troncales,


mueven bits de un nodo a otro.
13

Los Elementos de Conmutación son dispositivos especializados que conectan


dos o más líneas de transmisión. Cuando los datos llegan por una línea de
entrada, este elemento debe escoger una línea de salida para reenviarlos. Estas
máquinas se pueden denominar: nodos conmutadores de paquetes, sistemas
intermedios, centrales de conmutación de datos y Enrutadores (Router´s).

1.1.8 Elementos de Una Red

 Servidor: es el elemento principal de procesamiento, contiene el sistema


operativo de red y se encarga de administrar todos los procesos dentro de
ella, controla también el acceso a los recursos comunes como son las
impresoras y las unidades de almacenamiento.
 Host: Sistema informático en una red. Similar al término nodo, salvo que
host normalmente implica un computador, mientras que nodo generalmente
se aplica a cualquier sistema de red, incluyendo servidores de acceso y
routers.
 Estaciones de trabajo: en ocasiones llamadas nodos, pueden ser
computadoras personales o cualquier terminal conectada a la red. Se
trabaja con sus propios programas o aprovecha las aplicaciones existentes
en el servidor.
 Sistema operativo de red: es el programa que permite el control de la red y
reside en el servidor.
 NIC tarjeta de interface de red: proporciona la conectividad de la terminal o
usuario de la red física, ya que maneja los protocolos de comunicación de
cada topología específica.
 Cableado: es el cable que se va a ocupar en la red que es físico se llama
UTP.
 Hub o concentrador: en comunicaciones, centro de distribución,
concentrador. Un Hub es un equipo de redes que permite conectar entre si
otros equipos o dispositivos retransmitiendo los paquetes de datos desde
14

cualquiera de ellos hacia todos. Han dejado de utilizarse por la gran


cantidad de colisiones y tráfico de red que producen.
 Switch o conmutador: es un dispositivo digital de lógica de interconexión de
redes de computadores que opera en la capa 2 (nivel de enlace de datos)
del modelo OSI: su función es interconectar 2 o más segmentos de red, de
manera similar a los puentes (bridges), pasando datos de un segmento a
otro de acuerdo con la dirección Mac de distinto de las tramas en la red.
 Repetidor: es un dispositivo electrónico que recibe una señal débil o de bajo
nivel y la retransmite a una potencia o nivel más alto, de tal modo que se
puedan cubrir distancias más largas sin degradación o con una degradación
tolerable.
 Router o ruteador: es un dispositivo de propósito general diseñada para
segmentar la red, con la idea de limitar tráfico de brodcast y proporcionar
seguridad, control y redundancia entre dominios individuales de brodcast,
también puede dar servicio de firewall y un acceso económico a una WAN.
 Puente o bridge: es un dispositivo de interconexión de redes de
ordenadores que opera en la capa2 (nivel de enlace de datos) del modelo
OSI. Este interconecta 2 segmentos de red haciendo el pasaje de datos de
una red hacia otra, con base en la dirección física de destino de cada
empaque. Un bridge conecta 2 segmentos de red como una sola red
usando el mismo protocolo de establecimiento de red.
 Gateway (puerta de enlace): es un dispositivo con frecuencia un ordenador,
que permite interconectar redes con protocolos y arquitecturas diferentes a
todos los niveles de comunicación. Su propósito es traducir la información
del protocolo utilizado en una red al protocolo usado en la red del destino.
15

1.2 Aspectos científicos y estadística

1.2.1 Estadística

El arte y la ciencia de recolectar, analizar, presentar e interpretar datos.


Además hay otros términos muy utilizados en estadística, se listan a continuación:

 Datos: Los hechos y las cifras que se recolectan, analizan y resumen para
su presentación e interpretación.
 Conjunto de datos: Todos los datos recolectados en un estudio
determinado.
 Elementos: Entidades sobre las que se recolectan los datos.
 Variable: Una característica que interesa de un elemento.
 Observación: El conjunto de mediciones obtenidas de un elemento
determinado.
 Escala nominal: Escala de medición de una variable cuando los datos son
etiquetas o nombres que se emplean para identificar un atributo de un
elemento. Los datos nominales pueden ser no numéricos o numéricos.
 Escala ordinal: Escala de medición de una variable cuando los datos
presentan las propiedades de los datos nominales y el orden o jerarquía de
los datos tiene sentido. Los datos ordinales pueden ser no numéricos o
numéricos.
 Escala de intervalo: Escala de medición de una variable cuando los datos
presentan las propiedades de los datos ordinales y los intervalos entre
valores se expresan en términos de una unidad o medida fija. Los datos de
intervalo siempre son numéricos.
 Escala de razón: Escala de medición de una variable cuando los datos
presentan todas las propiedades de los datos de intervalo y la razón entre
dos valores tiene sentido. Los datos de razón siempre son numéricos.
16

 Datos cualitativos: Etiquetas o nombres utilizados para identificar un


atributo de cada elemento. Los datos cualitativos usan las escalas de
medición nominal y ordinal y pueden ser no numéricos o numéricos.
 Datos cuantitativos: Valores numéricos que indican cuánto o cuántos de
algo. Los datos cuantitativos se obtienen mediante la escala de intervalo o
de razón.
 Variable cualitativa: Una variable con datos cualitativos.
 Variable cuantitativa: Una variable con datos cuantitativos.
 Datos de sección transversal: Datos recolectados en el mismo o
aproximadamente en el mismo momento.
 Datos de series de tiempo: Datos recolectados a lo largo de varios periodos
de tiempo.

1.2.2 Estadística descriptiva

Resúmenes tabulares, gráficos o numéricos de datos.

 Población: Conjunto de todos los elementos que interesan en un estudio


determinado.
 Muestra: Un subconjunto de la población.
 Censo: Un estudio para recolectar los datos de toda la población.
 Encuesta muestral: Un estudio para recolectar los datos de una muestra.
 Inferencia estadística: El proceso de emplear los datos obtenidos de una
muestra para hacer estimaciones o probar hipótesis acerca de las
características de la población.
 Distribución de frecuencia: Resumen tabular de datos que muestra el
número (frecuencia) de los datos que pertenecen a cada una de varias
clases disyuntas.
17

 Distribución de frecuencia relativa: Resumen tabular de datos que muestra


la proporción o la fracción de datos propios de cada una de varias clases
disyuntas.
 Distribución de frecuencia porcentual: Resumen tabular de datos que
muestra el porcentaje de datos que corresponden a cada una de varias
clases disyuntas.
 Histograma: Representación gráfica de una distribución de frecuencia, de
frecuencia relativa o de frecuencia porcentual que se construye colocando
los intervalos de clase sobre un eje horizontal y la frecuencia, la frecuencia
relativa o la frecuencia porcentual sobre un eje vertical.
 Distribución de frecuencia acumulada: Síntesis tabular de datos
cuantitativos, en la que se muestra el número de datos que son menores o
iguales que el límite superior de cada clase.
 Distribución de frecuencia relativa acumulada: Resumen tabular de datos
cuantitativos, en el que se muestra la proporción o fracción de datos que
son menores o iguales que el límite superior de cada clase.
 Distribución de frecuencia porcentual acumulada: Síntesis tabular de datos
cuantitativos, en la que se muestra el porcentaje de datos que son menores
o iguales que el límite superior de cada clase.
 Ojiva: Gráfica de una distribución acumulada.
 Estadístico muestral: Valor numérico usado como una medida que resume
una muestra (por ejemplo, la media muestral, la varianza muestral, s2 y la
desviación estándar muestral, s).
 Parámetro poblacional: Valor numérico que resume una población (por
ejemplo, la media poblacional μ, la varianza poblacional, σ2 y la desviación
estándar poblacional, σ).
 Estimador puntual: Un estadístico muestral como, s2 y s cuando se usa
para estimar el parámetro poblacional correspondiente.
18

1.2.3 Medidas de tendencia central

 Datos agrupados: Datos que se dan en intervalos de clase, como cuando


se resumen para una distribución de frecuencias. No se tienen los valores
de los datos originales.
 Media: Medida de localización central que se calcula sumando los valores
de los datos y dividiendo entre el número de observaciones.
 Mediana: Medida de localización central proporcionada por el valor central
de los datos cuando éstos se han ordenado de menor a mayor.
 Moda: Medida de localización central, definida como el valor que se
presenta con mayor frecuencia.

1.2.4 Medidas de posición

 Percentil: Un valor tal que por lo menos p por ciento de las observaciones
son menores o iguales que este valor y por lo menos (100 _ p) por ciento de
las observaciones son mayores o iguales que este valor. El percentil 50 es
la mediana.
 Cuartiles: Los percentiles 25, 50 y 75, llamados cada uno primer cuartil,
segundo cuartil (mediana) y tercer cuartil. Los cuartiles sirven para dividir al
conjunto de datos en cuatro partes; cada una contiene aproximadamente
25% de los datos.

1.2.5 Medidas de Dispersión

 Varianza: Una medida de la variabilidad que se basa en los cuadrados de


las desviaciones de los datos respecto a la media.
 Desviación estándar: Una medida de variabilidad obtenida de la raíz
cuadrada de la varianza.
19

 Coeficiente de variación: Medida de variabilidad relativa que se obtiene al


dividir la desviación estándar entre la media y multiplicando el resultado por
100.
 Sesgo: Medida de la forma de la distribución de los datos. Datos sesgados
a la izquierda tienen un sesgo negativo; una distribución de datos simétrica
tiene sesgo cero, y datos sesgados a la derecha tienen sesgo positivo.
 Coeficiente de correlación: Medida de la relación lineal entre dos variables,
que puede tener valores desde _1 hasta _1. Los valores cercanos a _1
indican una fuerte relación lineal positiva; valores cercanos a _1 muestran
una fuerte relación lineal negativa, y valores cercanos a cero una ausencia
de relación lineal.

1.2.6 Distribución de Probabilidades

 Probabilidad: Medida numérica de la posibilidad de que ocurra un evento.


 Experimento: Proceso para generar resultados bien definidos.
 Espacio muestral: Conjunto de todos los resultados experimentales.
 Diagrama de árbol: Representación gráfica que ayuda a visualizar un
experimento de pasos múltiples.
 Variable aleatoria discreta: Una variable aleatoria que puede asumir un
número finito de valores o un número infinito de valores de una sucesión.
 Variable aleatoria continua: Ésta toma cualquier valor de un intervalo o de
una colección de intervalos.
 Distribución de probabilidad: Descripción de cómo se distribuyen las
probabilidades entre los valores de una variable aleatoria.
 Función de probabilidad: Se denota f(x) y da la probabilidad de que x tome
un determinado valor de una variable aleatoria.
20

 Distribución de probabilidad normal: Una distribución de probabilidad


continua. Su función de densidad de probabilidad tiene forma de campana y
está determinada por la media μ y la desviación estándar σ.
 Distribución de probabilidad normal estándar: Distribución normal en la cual
la media es cero y la desviación estándar es uno.
 Distribución de probabilidad binomial: Distribución de probabilidad da la
probabilidad de x éxitos en n ensayos de un experimento binomial.
 Función de probabilidad binomial: La función usada para calcular las
probabilidades binomiales.
 Distribución de probabilidad de Poisson: Distribución de probabilidad da la
probabilidad de x ocurrencias de un evento en un determinado intervalo de
tiempo o de espacio.
 Función de probabilidad de Poisson: La función usada para calcular las
probabilidades de Poisson.
21

2. Caso

2.1 Objetivos de aprendizaje

 Aplicar los conocimientos de estadística en un escenario real, a partir de


datos obtenidos en un periodo de dos semanas de un firewall físico que
monitorea el tráfico de la red.

 Analizar los resultados obtenidos de los diferentes métodos estadísticos


aplicados y realizar observaciones sobre el comportamiento del consumo
de ancho de banda.

 Servir como antecedentes para futuros estudios en los cuales se tenga


referencia sobre el comportamiento del consumo de ancho de banda.

2.2 Párrafo de apertura

En la actualidad vivimos en un mundo cambiante, que avanza


tecnológicamente. Vivimos en la era en donde el internet dejo de ser un lujo y se
ha vuelto una necesidad. Ahora la mayoría de personas cuentan con este
servicio, no digamos las empresas.

El servicio del internet ha venido a simplificarnos la vida. Ahora se pueden


realizar pagos mediante aplicaciones, podemos enviar y recibir e-mails casi al
instante, podemos ver nuestros estados de cuenta y muchas otras cosas más.
Pero este recurso se distribuye de diferente manera y es vendido por ancho de
banda que va desde 1 Mbps hasta 25 Mbps en Guatemala. Las empresas se ven
en la necesidad de poder optimizar este recurso porque muchas veces se los
distribuyen por fibra óptica (FO), dependiendo mucho de la posición geográfica en
22

la que se encuentren y esto hace que el costo se eleve. Por esta razón es que se
necesita distribuir de una buena forma el ancho de banda que se tiene.

Una empresa puede tener varios usuarios conectados simultáneamente y


puede contar con varios servicios, como lo son servidores, servicio de correo,
transacciones de facturas electrónicas, y muchos otros, y si el ancho de banda con
que se cuenta se está utilizando de una forma errónea, se pueden entorpecer o
paralizar procesos que son necesarios para determinadas operaciones.

Por este y otros motivos es necesario que se realicen monitoreos en el flujo


de este servicio para poder determinar si se encuentra dentro de los parámetros
normales o si está fuera de los mismos. Esto nos permitirá poder analizar el
problema y tomar las decisiones necesarias para evitar futuros problemas, y hacer
las correcciones necesarias.

2.3 Antecedentes generales de la organización

El nombre original de la empresa es Trapiche Grande y no se llama finca


sino hacienda, la casa patronal estaba ubicada a 7 km de Cuyotenango,
departamento de Suchitepéquez. La extensión de la hacienda era de 1200
caballerías que terminaban hasta el mar en lo que hoy se conoce como Aldea y
Playa Tulate.

La mayor parte de los terrenos de la hacienda estaba cultivada con pastos


para crianza de ganado, pero también se cultivaban grandes extensiones de caña
de azúcar la cual era molida en el Trapiche Grande de la hacienda, movido por
una enorme rueda hidráulica. La hacienda era rica en árboles frondosos
especialmente para el aprovechamiento de la madera.
23

El gobierno de Guatemala decidió parcelar las 600 caballerías y repartirlas


entre muchas familias guatemaltecas, dándole de una vez los títulos de propiedad,
en extensiones de 30 manzanas por cada familia, fue así como nació lo que hoy
se conoce como Parcelamiento la Máquina.

Los antiguos dueños se quedaron con 100 caballerías que posteriormente


vendieron a don Roberto Salazar y su hijo Eugenio Salazar, aquí fue donde la
hacienda cambio de nombre de TRAPICHE GRANDE a Finca Entre Ríos porque
sus terrenos estaban bañados por los ríos Icán, Sis Negro y Besa, que en esos
años eran caudalosos.

En la finca se cultivaba hule, caña de azúcar, té de limón, achiote, café


banano, plátano, algodón y en la parte húmeda arroz. En el año de 1957, la familia
Ralda González compro la finca Entre Ríos.

Hace 50 años, la finca se constituyó en la cuna de la industria de hule


natural en Guatemala. Desde entonces es una empresa dedicada a las
exportaciones de este producto, siendo uno de los primeros exportadores de hule
natural de Guatemala al mundo.

Entre Ríos se comenzó a ver en la necesidad de implementar tecnología,


porque sus procesos fueron creciendo, y necesitaba que sus datos fueran más
fluidos y ordenados, necesitaba de alguna manera comenzar u ofrecer producto
de más calidad y esto solo lo podía lograr sistematizando sus procesos. Fue así
como la empresa comenzó a invertir en equipo de cómputo e impresoras en las
cuales ya se comenzaron a llevar tablas dinámicas y gráficos que ya ayudaban a
tener una idea sobre la calidad de la materia prima y el producto que se exportaba.

Pero comenzó el tiempo en que el internet fue más accesibles para la


mayoría de personas y los correos electrónicos comenzaron a utilizarse de una
24

forma más frecuente, era evidente que la empresa tenía que comenzar a invertir
en señal de internet para comenzar a mantener informada de una forma más
rápida y dinámica a todos sus clientes y proveedores.

El problema que se tenía era la ubicación geográfica, casi ninguna empresa


proveedora de internet tenía cobertura en ese lugar. Pero se logró superar este
problema realizando un contrato de servicio con la empresa INNOVA, la cual
brindó el servicio de internet con un ancho de banda de 1 Mbps por medio de FO.
A partir de ahí se comenzó la instalación y configuración de Switch Administrables
ya que se dieron cuenta que el ancho de banda que se tenía estaba siendo mal
utilizado.

Hoy en día se cuenta con 2 servidores y sistemas que se utilizan para


recepciones y liquidación de materia prima, como un ERP que lleva controles
contables de bancos y de Recursos Humanos, además de tener sistematizado el
área de recepciones, la cual envía al instante un correo electrónico al proveedor
informándole los pesos de la entrega.

Además de todo esto hubo la necesidad de aumentar el ancho de banda de


1 Mbps a 2 Mbps, porque 1 Mbps comenzó a ser muy poco, pues también se
incrementaron los usuarios. Hoy en día 2 Mbps es la cantidad de ancho de banda
que se maneja, pero el costo es alto y es por eso que se necesita utilizar de una
buena forma el recurso de ancho de banda con que se cuenta. Por tal razón es
necesario monitorear de una forma eficiente este recurso, para evitar que los
procesos y servicios lleguen a ser deficientes y provoquen problemas graves como
atrasos en facturación electrónica o certificados de calidad para la exportación del
producto terminado.
25

2.4 Área específica de interés

Los directivos de Grupo Entre Rios S.A. se han dado cuenta de la


fluctuación del servicio de la red empresarial, existen momentos de inestabilidad,
que impide que el trabajo sea eficiente, por lo que han visto la necesidad de
solicitar al jefe de informática que realice un monitoreo del tráfico de la red e
internet, para conocer qué es lo que está afectando la red y que soluciones
pueden aplicarse, para prevenir futuros problemas de conectividad dentro de la
empresa, ya que es necesario que los usuarios tengan un servicio de red estable
para realizar sus procesos, el objetivo es recolectar los datos y analizarlos para
obtener los consumos de ancho de banda más altos que afectan de manera
significativa la red de las instalaciones.

2.5 Situación específica, decisión, problema u oportunidad

La finca de Grupo Entre Rios S.A. cuenta en sus instalaciones una red
interna a través de cableado estructurado e inalámbrico para que los usuarios se
conecten a la red, el total de usuarios que se conectan a la red son 40, los cuales
utilizan aplicaciones locales como también aplicaciones externas a través de
internet, por lo que el uso del ancho de banda de internet se ve afectado en
diferentes momentos del día, los cuales aún no se han monitoreado para poder
dar soluciones a los distintos problemas de conectividad y saturación de red.

Esto se da aun teniendo medidas de seguridad para impedir que los


usuarios utilicen páginas de internet inadecuadas, las cuales puedan consumir una
considerable cantidad de ancho de banda, esto genera que el tráfico de red se
sature, por lo que el rendimiento de la red es afectada significativamente, llegando
en ocasiones que la red colapse, teniendo que reiniciar los servicios de internet
para que se reestablezca la red, por lo que afecta a todos los usuarios y procesos
26

que se están ejecutando en sus computadoras, generando atraso e impidiendo


que la información sea fluida.

2.6 Alternativas

2.6.1 Recolección de los datos

Para realizar el estudio del consumo de ancho de banda en la red, se


estableció en un período de dos semanas, en el horario de 6:00 A.M. a 17:00
P.M., durante este período, los datos fueron provenientes de un firewall físico, que
mostraba de una manera textual diferentes tipos de datos, por lo que de esta
manera se hace complicado interpretarlos, de tal manera que se quiere realizar el
estudio a través de estos datos, utilizando los diferentes métodos estadísticos para
poder mostrarlos de manera entendible, por medio de tablas y gráficas. Como se
muestra en la Tabla No. 1 y Tabla No. 2 en anexos, los datos están tabulados por
hora y día.

2.6.2 Tabulación de los datos

Se realizó la clasificación y tabulación de los datos obtenidos de la Tabla


No. 1 y Tabla No. 2, esto servirá para calcular las medidas de tendencia central,
medidas de posición y medidas de dispersión, esto ayudará para analizar el
comportamiento de los datos recolectados durante las dos semanas, ver la Tabla
No. 3.

2.6.3 Cálculo de las medidas de tendencia central

Para el cálculo de la media aritmética se utiliza la siguiente fórmula para


datos agrupados:
27


̅
Donde:
̅ = Media aritmética
F = frecuencias
Xi = Suma de los límites reales partido dos
n = número total de datos

Datos:
∑ = 91243.00
n = 144

Para el cálculo de la mediana se utiliza la siguiente fórmula para datos


agrupados:

( )

Donde
me = mediana
Li = límite real inferior de la clase mediana
n = número de datos o sumatoria de frecuencias
fa = frecuencia acumulada anterior a la clase mediana
f = frecuencia de la clase mediana
c = amplitud de la clase
La clase mediana se determina por n/2 y observando la frecuencia acumulada.

Datos
Li = 324.5
n = 144
28

fa = 56
f = 38
c = 307

( )

Para el cálculo de la moda se utiliza la siguiente fórmula para datos


agrupados:

( )
Donde
Mo = moda
Li = límite real inferior de la clase modal
d1 = frecuencia de la clase modal menos frecuencia anterior
d2 = frecuencia de la clase modal menos frecuencia posterior
c = amplitud de clase
La clase modal es la que tiene la más alta frecuencia.

Datos
Li = 17.5
d1 = 56-0 -> 56
d2 = 56-38 ->18
c = 307

( )
29

2.6.4 Cálculo de las medidas de posición

Para el cálculo de las medidas de posición y aplicando al caso se utiliza la


siguiente fórmula:

( )

Donde
Qj = Cuantil
Li = límite real inferior de la clase
k = número correspondiente a la posición que se desea obtener
n = número total de datos
j = número correspondiente según cuartil (4), decil (10), percenptil (100)
Fa = frecuencia acumulada anterior de la clase
f = frecuencia de la clase
c = amplitud de la clase

Datos para Q1
Li = 17.5
k=1
n = 144
j=4
Fa = 0
f = 56
c = 307

( )
30

Datos para Q2
Li = 324.5
k=2
n = 144
j=4
Fa = 56
f = 38
c = 307

( )

Datos para Q3
Li = 631.5
k=3
n = 144
j=4
Fa = 94
f = 16
c = 307

( )

Datos para D2
Li = 17.5
k=2
n = 144
31

j = 10
Fa = 0
f = 56
c = 307

( )

Datos para D5
Li = 324.5
k=5
n = 144
j = 10
Fa = 56
f = 38
c = 307

( )

Datos para D8
Li = 938.5
k=8
n = 144
j = 10
Fa = 110
f = 10
c = 307
32

( )

Datos para P23


Li = 17.5
k = 23
n = 144
j = 100
Fa = 0
f = 56
c = 307

( )

Datos para P50


Li = 324.5
k = 50
n = 144
j = 100
Fa = 56
f = 38
c = 307

( )
33

Datos para P90


Li = 1245.5
k = 90
n = 144
j = 100
Fa = 120
f = 12
c = 307

( )

2.6.5 Cálculo de las medidas de dispersión

Para el cálculo de la varianza en el caso del consumo de ancho de banda,


se utilizó la siguiente fórmula:

∑( ̅)

Donde:
= varianza
̅ = media aritmética
fi = frecuencias
Xi = Suma de los límites reales partido dos
n = número total de datos
34

Datos:
∑( ̅) = 43353885.49
n = 144

Para el cálculo de la desviación estándar se utiliza la siguiente fórmula para


datos agrupados:

Donde:
= desviación estándar
= varianza

Datos:
=

Para el cálculo del coeficiente de variación para datos agrupados se utiliza


la siguiente fórmula:

̅
35

Donde:
C.V. = coeficiente de variación
= desviación estándar
̅ = media aritmética

Datos:
= 548.70
̅ = 633.63

En la Tabla No. 4 podemos ver el resumen de los resultados de las medidas


de tendencia central, medidas de posición y las medidas de dispersión. Se puede
observar que el promedio del consumo de ancho de banda es 633.33 kbps. Se
encontró que el 50% del consumo de ancho de banda está en el intervalo de 18.07
kbps a 452.76 kbps y el 50% restante está en el intervalo de 452.76 kbps a 2467.6
kbps. El uso más frecuente de ancho de banda es de 249.82 kbps. Los valores de
la desviación estándar 548.7 kbps y el coeficiente de variación 86.70, nos indican
que los valores están dispersos respecto a la media.

2.6.6 Distribución normal

En esta sección se aplicará la distribución normal, para encontrar la


probabilidad de que diferentes eventos ocurran. Ecuación a utilizar:
36

Donde:
z = valor del probabilidad
x = valor de la variable aleatoria continua
µ = media de la población
σ = desviación estándar

Se desea hallar el porcentaje de que el consumo del ancho de bando sea


mayor a 1500 kbps.

Datos:
x = 1500
µ = 633.63
σ = 548.69

p = 0.4429  0.5 – 0.4429 = 5.71%

La probabilidad de que el consumo del ancho de banda sea mayor a 1500


kbps es de 5.71%. Ver Figura No. 5.

Se requiere encontrar el porcentaje de que el consumo sea menor a 400


kbps.

Datos:
x = 400
µ = 633.63
σ = 548.69
37

P = 0.1644  0.5 – 0.1644 = 33.36%

La probabilidad de que el consumo del ancho de banda sea menor a 400


kbps es de 33.36%. Ver Figura No. 6.

Se desea conocer el porcentaje de que el consumo de ancho de banda esté


entre 500 kbps a 700 kbps.

Datos:
X1 = 500
X2 = 700
µ = 633.63
σ = 548.69

P = p(500) + p(700)  0.0948 + 0.0478 = 14.26%

La probabilidad de que el consumo del ancho de banda esté entre 500 kbps
a 700 kbps es de 14.26%. Ver Figura No. 7.

Se desea saber el porcentaje de que el consumo de ancho de banda sea


mayor a 700 kbps.
38

Datos:
x = 700
µ = 633.63
σ = 548.69

P = 0.0478  0.5 – 0.0478 = 45.22%

La probabilidad de que el consumo del ancho de banda sea mayor de 700


kbps es de 45.22%. Ver Figura No. 8.

Se desea encontrar el porcentaje de que el consumo de ancho de banda


sea mayor a 300 kbps.

Datos:
x = 300
µ = 633.63
σ = 548.69

P = 0.2291  0.5 – 0.2291 = 72.91%

La probabilidad de que el consumo del ancho de banda sea mayor a 300


kbps es de 72.91%. Ver Figura No. 9.
39

2.6.7 Intervalos de confianza

Con los intervalos de confianza nos permiten conocer si la medición o el


estudio realizado es un indicador estable de un valor estimado.

El jefe de informática de Grupo Entre Ríos plantea que el promedio de


consumo de ancho de banda es de 1200 kbps. De los 144 datos obtenidos del
consumo de ancho de banda, se selecciona una muestra de 20 datos, ver Tabla
No. 5. Calcular la estimación del intervalo de confianza de:

A. Intervalo de confianza al 90%.


B. Intervalo de confianza al 99%

Ho: El promedio de consumo de ancho de banda es de 1200 kbps en la red


empresarial.
H1: El promedio de consumo de ancho de banda es diferente a 1200 kbps
en la red empresarial.

Utilizando Microsoft Excel como herramienta para la aplicar la prueba de


intervalos de confianza, la fórmula a utilizar es:

INTERVALO.CONFIANZA.T(alfa, desviación estándar, tamaño)

Donde:
Alfa: nivel de significancia o probabilidad de error
Desviación estándar: valor calculado de la muestra
Tamaño: cantidad de datos
40

Datos inciso A:
Alfa: 0.1
Desviación estándar: 447.37
Tamaño: 20
Media: 516.17

IC90 = INTERVALO.CONFIANZA.T(0.1, 447.37,20)


IC90 = 172.97
IC90 = 343.19 <= n =< 689.14

Con un nivel de confianza del 90% se estima que el promedio de consumo


de ancho de banda está en un intervalo de 343.19 kbps y 689.14 kbps, por lo que
se rechaza la hipótesis nula.

Datos inciso B:
Alfa: 0.01
Desviación estándar: 447.37
Tamaño: 20
Media: 516.17

IC99 = INTERVALO.CONFIANZA.T(0.01, 447.37,20)


IC99 = 286.19
IC99 = 229.97 <= n =< 802.36

Con un nivel de confianza del 99% se estima que el promedio de consumo


de ancho de banda está en un intervalo de 229.97 kbps y 802.36 kbps, por lo que
se rechaza la hipótesis nula.
41

2.6.8 Análisis de varianza ANOVA

En el análisis de varianza nos permite comparar dos o más medias,


utilizando Microsoft Excel para realizar el análisis de los datos de las dos
semanas, como se muestran en la Tabla No. 1 y Tabla No. 2, a cada semana se le
aplicó la prueba de análisis de varianza de un factor.

Como se puede ver en la Tabla No. 6 y Tabla No. 7, los resultados de la


aplicación del análisis de varianza de un factor, en la Tabla No. 6 se muestran el
total de muestras, la suma, el promedio y la varianza de cada día evaluado, en la
Tabla No. 7 se encuentran los resultados del análisis, en la cual se toman dos
datos importantes para realizar la prueba de hipótesis:

 F = 3.7167829
 Valor crítico para F = 2.35809

Ho: todas las medias de los días son iguales


H1: existen diferencias entre las medias de los días

Para realizar la prueba de hipótesis, se debe de verificar la condición si el


valor de F es menor al valor crítico para F, si lo es, se acepta la hipótesis nula, de
lo contrario se rechaza.

F < Valor crítico para F


3.7167829 < 2.35809

Como vemos no se cumple con la condición, así que se rechaza la Ho, lo


que quiere decir que existen diferencias entre las medias de los días.
42

Se realizó el mismo análisis para la semana 2, como se puede ver en la


Tabla No. 8 y Tabla No. 9, los resultados de la aplicación del análisis de varianza
de un factor, en la Tabla No. 8 se muestran el total de muestras, la suma, el
promedio y la varianza de cada día evaluado, en la Tabla No. 9 se encuentran los
resultados del análisis, en la cual se toman dos datos importantes para realizar la
prueba de hipótesis:

 F = 3.318982
 Valor crítico para F = 2.353809

Ho: todas las medias de los días son iguales


H1: existen diferencias entre las medias de los días

Para realizar la prueba de hipótesis, se debe de verificar la condición si el


valor de F es menor al valor crítico para F, si lo es, se acepta la hipótesis nula, de
lo contrario se rechaza.

F < Valor crítico para F


3.7167829 < 2.35809

Como vemos no se cumple con la condición, así que se rechaza la Ho, lo


que quiere decir que existen diferencias entre las medias de los días.

2.6.9 Prueba T de Student

Con la prueba T de Student se continúa evaluando probabilidades de


eventos, asumiendo hipótesis del caso estudiado.

El Ti de la empresa le ha informado al Gerente Administrativo en su reporte


que la media del uso del ancho de banda de internet promedia 1024 kbps por día.
43

Sin embargo el Gerente ha notado que en ciertas ocasiones le ha costado ingresar


a ciertas páginas y sospecha que el promedio este rebasando el límite de ancho
de banda. Para verificar los datos a decidido tomar una muestra de 20 horas
aleatorias y han reportado una media de 516.17 con una σ = 447.39. Si se utiliza
un valor alfa de 5%. ¿Qué puede concluir el Gerente Administrativo?

Para realizar esta prueba se tomó una muestra de 20 datos, los cuales se
pueden ver en la Tabla No. 5.

Ho: el promedio de uso de ancho de bando es mayor a 1024 kbps.


H1: el promedio de uso de ancho de banda es menor o igual a 1024 kbps.

Se utilizará la fórmula para obtener el T estadístico (Te) que servirá para la


fórmula en Microsoft Excel.

̅

Donde:
̅ = media muestral
σ = desviación estándar muestral
N = tamaño de la muestra
Gl = grados de libertad
Alfa = nivel de significancia
Ho = Hipótesis nula

Datos:
̅ = 516.17
σ = 447.37
N = 20
44

Gl = 19
Alfa = 0.05
Ho = 1024


Tc = 1.729

A continuación se presenta la fórmula utilizada en Microsoft Excel para


obtener el valor de la probabilidad:

DISTR.T.2C(x, gl)
Donde:
X = valor de Te
Gl = grados de libertad

Datos:
X = 4.95
Gl = 19

Pt = DISTR.T.2C(4.95, 19)
Pt = 0.0000893

Conclusión: se rechaza la hipótesis nula y el Gerente puede concluir que el


ancho de banda no está superando el promedio que reportó de TI.
45

Los registro llevados por el Ti en 2 semanas en base a un firewall que se


tiene actualmente, promedian 1900 kbps, y se ha estado teniendo problemas muy
seguidos de saturación de ancho de banda. Un proveedor ha decido dar una
demostración de 2 semanas con un nuevo firewall más potente, las cuales han
dado como resultado una media de 601.11 y s = 590.93 utilizando un alfa del 5%.
¿Se debería realizar el cambio de firewall para tener un mejor control sobre el
ancho de banda?

Ho: el promedio de uso de ancho de bando es menor a 1900 kbps.


H1: el promedio de uso de ancho de banda es mayor o igual 1900 kbps.

Datos:
̅ = 601.11
σ = 590.93
N = 12
Gl = 11
Alfa = 0.05
Ho = 1900


Tc = 1.796

Conclusión: Se acepta la hipótesis nula, se recomienda realizar el cambio


de firewall del nuevo proveedor.
46

2.6.10 Prueba de chi cuadrado

El jefe de TI de la empresa Grupo Entre Ríos tiene la responsabilidad de


controlar el ancho de banda de internet el cree que lo ideal por hora es de 646.8
Mbps, él considera que debería probar su hipótesis respecto a una demanda
uniforme de consumo de internet de los usuarios. Tomando como referencia los
consumos promedio por hora de una muestra de 2 semanas, verificar la hipótesis
planteada a 1% confianza.

 Ho: El consumo está distribuido uniformemente


 H1: El consumo no está distribuido uniformemente

( ̅)

Datos:
Media: 646.8
Desviación estándar: 127.198707
Grados de libertad: 9
( ) ( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

Valor critico en la tabla:

La hipótesis nula que el consumo de ancho de banda se rechaza, debido a


que x^2 estadístico con valor 225 es mayor al valor crítico de 21.66. Ver Figura
No. 10.
47

2.7. Conclusiones

A partir de los datos generados del firewall físico que está instalado, se
obtuvieron los datos necesarios para aplicar diferentes métodos estadísticos,
como las medidas de tendencia central, medidas de posición, medidas dispersión,
pruebas de hipótesis como la prueba T de Student, estudio de probabilidades con
la distribución normal; todos estos métodos fueron aplicados para obtener
resultados que ayuden tanto al jefe de TI como al gerente para la toma de
decisiones para tener mayor control sobre el consumo de ancho de banda y
proveedor un mejor servicio a los usuarios.

Los resultados que se obtuvieron los métodos estadísticos aplicados


demuestran que el consumo del ancho de banda dentro de la empresa es variado,
ya que la red es afectada en distintos momentos del día, el resultado del
coeficiente de variación nos indica que los kbps consumidos en los diferentes
horarios que se estudiaron, están muy dispersos respecto a la media, esto nos
confirma lo primero mencionado, es decir, es variado el consumo de ancho de
banda. Además de la hipótesis del gerente argumentando que el promedio de
consumo de ancho de banda era mayor a 1024 kbps, lo que le impedía visualizar
páginas web, la prueba de hipótesis demostró que el promedio era menor a 1024
kbps.

El análisis y los resultados del estudio realizado al consumo de ancho de


banda en Grupo Entre Ríos, quedó debidamente documentado para ser
consultado en ocasiones posteriores, cuando se necesite información sobre el
comportamiento de los datos. Esto servirá para comparar resultados de posibles
estudios posteriores, además de contar con historial documentado para otros
asuntos como auditorías internas y externas sobre el control de red.
48

2.8. Preguntas

2.8.1 Preguntas y respuestas relativas a las inquietudes

1. ¿Qué son los estudios experimentales?


En este tipo de estudio se identifica primero la variable de interés. Después
se ubica otra otras variables que son controladas para lograr datos de cómo
ésta influye sobre la variable de interés. Por ejemplo, a una empresa de
diseño de software le interesa realizar un experimento para saber la forma
en que un proceso afecta el rendimiento de la aplicación en general. La
variable que interesa en el estudio es la tiempo de respuesta.

2. ¿Qué es el método subjetivo de probabilidades?


Este método de asignación de probabilidades es el más indicado cuando no
es factible suponer que todos los resultados de un experimento sean
igualmente posibles y, además, cuenta con pocos datos relevantes. El
método subjetivo de asignación de probabilidades a los resultados de un
experimento, usa toda la información disponible, por ejemplo, la propia
experiencia o la intuición. Después de considerar dicha información se
asigna un valor de probabilidad que expresa el grado de confianza (en una
escala de 0 a 1) que tiene acerca de que un resultado experimental ocurra.
Como la probabilidad subjetiva expresa el grado de confianza que tiene un
individuo, es personal. Cuando se usa el método de probabilidad subjetiva,
es de esperarse que personas distintas asignen probabilidades diferentes a
los mismos resultados de un experimento.

3. ¿Cuáles son las características más importantes de la distribución


normal?
La experiencia demuestra que las distribuciones de la mayoría de las
muestras tomadas en el campo de la industria se aproximan a la
49

distribución normal si el tamaño de la muestra es grande. Esta distribución


queda definida por dos parámetros: la media y la desviación estándar. Se
presenta mediante una curva simétrica conocida como campana de Gauss.
Esta distribución nos da la probabilidad de que al elegir un valor, éste tenga
una medida contenida en unos intervalos definidos.

4. ¿Cuál es la diferencia entre la estadística descriptiva y la estadística


inferencial?
La estadística descriptiva analiza, estudia y describe las características
particulares de la totalidad de los individuos de un grupo, Tiene una función
inductiva. Mientras que la estadística inferencial nos permite deducir las
propiedades del total de los elementos de un conjunto a partir del estudio de
una muestra significativa de este conjunto.

2.8.2 Preguntas y respuestas relativas a la experiencia

1. ¿Por qué es importante definir un grado de confiabilidad en el


estudio?
En los estudios estadísticos pueden contener Errores en la adquisición de
datos siempre hay que estar conscientes de la posibilidad de errores en los
datos de los estudios estadísticos. Usar datos erróneos es peor que no usar
ningún dato. Un error en la adquisición de datos se tiene siempre que el
valor del dato obtenido no es igual al verdadero valor o al valor real que se
hubiera obtenido con un procedimiento correcto. Por tal motivo los
intervalos de confianza son valores entre los cuales se estima que ciertos
valores tendrán una probabilidad de acierto

2. ¿Por qué utilizar computadoras en los estudios estadísticos?


Como en el análisis estadístico suelen emplearse grandes cantidades de
datos, los analistas usan software para realizar estos trabajos. Por ejemplo,
50

calcular el tiempo de vida promedio de los 200 motherboard resultaría muy


tedioso si no se contara con una computadora. Debido que existe software
que podrían simular los eventos de las variables a estudiar a través de
datos aleatorios.

3. ¿Cuál es la diferencia entre una muestra probabilística y una no


probabilística y cuáles son las ventajas y las desventajas de cada
una?
El muestreo de probabilidad todos los elementos de la población tienen la
oportunidad de ser escogidos en la muestra. Una muestra seleccionada por
muestreo de juicio se basa en la experiencia de alguien con la población.
Algunas veces una muestra de juicio se usa como guía o muestra tentativa
para decidir cómo tomar una muestra aleatoria más adelante. Las muestras
de juicio evitan los análisis estadísticos necesarios para hacer muestras de
probabilidad.

4. ¿Qué se entiende por error de estimación?


Es una medida de su precisión que se corresponde con la amplitud del
intervalo de confianza. Cuanta más precisión se desee en la estimación de
un parámetro, más estrecho deberá ser el intervalo de confianza y, si se
quiere mantener o disminuir el error, más ocurrencias deberán incluirse en
la muestra estudiada.
51

2.9. Bibliografía

Anderson, D. R. (2008). Estadistica para administracion y economia. México DF:


CENGAGE LEARNING.

Castellanos, M. A. (2012). Estadistica aplicada a los negocios y economia. México


DF: Mc Graw Hill.

Griega, J. i. (2008). Estructura de redes de computadores. Barcelona España:


UOC.

Mantiega, M. T. (2012). Estadistica Aplicada Una vision Instrumental. Madrid


España: Albasanz.

Perez, E. H. (2003). Tecnologias y Redes de transmision. México: LIMUSA S.A.

Academy, K. (31 de octubre de 2014). Estadística descriptiva. Recuperado el 04


de mayo de 2015, de
https://es.khanacademy.org/math/probability/descriptive-statistics

Centro de Cálculo e Investigación Educativa Facultad de Ingeniería, U. d. (03 de


julio de 2011). Estadística Descriptiva. Recuperado el 04 de mayo de 2015,
de
http://destadistica.ingenieria.usac.edu.gt/index.php?option=com_content&vi
ew=article&id=26&Itemid=41

García, J. M. (13 de junio de 2014). Diferencias entre Estadística Descriptiva e


Inferencial. Recuperado el 05 de mayo de 2015, de
http://estadistica.jmgonzalez.com.mx/?p=82

Ibujes, M. O. (23 de abril de 2012). Conceptos básicos de estadística descriptiva e


inferencial. Recuperado el 06 de mayo de 2015, de
http://www.monografias.com/trabajos96/conceptos-basicos-estadistica-
descriptiva-e-inferencial/conceptos-basicos-estadistica-descriptiva-e-
inferencial.shtml

Ricardi, F. Q. (22 de febrero de 2011). Medidas de tendencia central y dispersión.


Recuperado el 07 de mayo de 2015, de
http://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
52

2.10. Anexos

2.10.1 Figuras

Figura No. 1 – Dispositivos para conectarse a una red local

Fuente: https://sites.google.com/site/cursotelecomunicaciones/redes-locales

Figura No. 2 – Histograma de frecuencias

Histograma de frecuencias
60

56
50 18 - 324
325 - 631
40
632 - 938
38
939 - 1245
30
1246 - 1552
1553 - 1859
20
1860 - 2166
16
10 2167 - 2473
12
10
5 5 2
0

Fuente: propia
53

Figura No. 3 – Polígono de frecuencias

Polígono de frecuencias
60

50

40

30

20

10

0
18-324 325-631 632-938 939-1245 1246-1552 1553-1859 1860-2166 2167-2473

Fuente: propia

Figura No. 4 – Ojiva

Ojiva
160

140

120

100

80

60

40

20

0
56 94 110 120 132 137 142 144

Fuente: propia
54

Figura No. 5 – Probabilidad normal 1

Fuente: Propia

Figura No. 6 – Probabilidad normal 2

Fuente: propia
55

Figura No. 7 – Probabilidad normal 3

Fuente: propia

Figura No. 8 – Probabilidad normal 4

Fuente: propia
56

Figura No. 9 – Probabilidad normal 5

Fuente: propia

Figura No. 10 – Gráfica chi cuadrado

Fuente: propia
57

2.10.2 Tablas

Tabla No. 1: Datos de consumo de ancho de banda


semana 1 13-04-2015 al 18-04-2015
Semana 13-04-2015 al 18-04-2015
Hora / Día Lunes Martes Miércoles Jueves Viernes Sábado
6:00 5.27 7.07 4.99 317.7 3.76 5.41
7:00 80.13 40.1 56.6 18.99 139.58 94.28
8:00 1771.52 76 192.91 585.83 139.8 34.51
9:00 2119.68 101.6 1361.92 353.9 738.4 687.88
10:00 2355.2 1085.44 1505.28 255.48 1075.2 428.57
11:00 2109.44 422.81 1402.88 445.65 499.75 537.6
12:00 917.18 854.48 152.67 1484.8 106.88 12.89
13:00 1495.04 726.43 1300.48 1064.96 1382.4 10.87
14:00 1822.78 1454.08 1884.16 1157.12 259.21 276.99
15:00 84.23 1832.96 1884.16 1249.28 878.57 8.46
16:00 529.85 1044.48 631.03 571.88 627.54 7.76
17:00 331.8 655.56 864.12 188.25 79.35 5.22
Fuente: propia

Tabla No. 2 – Datos de consumo de ancho de banda


semana 2 20-04-2015 al 25-04-2015

Semana 20-04-2015 al 25-04-2015


Hora / Día Lunes Martes Miércoles Jueves Viernes Sábado
6:00 82.49 3.85 12.22 1.96 4.86 3.20
7:00 85.20 105.70 70.55 20.80 30.90 60.50
8:00 180.75 45.63 94.37 183.36 44.99 237.57
9:00 1843.2 240.60 500.95 455.90 255.50 475.30
10:00 1361.92 526.28 653.27 537.35 383.99 387.09
11:00 2457.6 628.30 800.40 660.40 589.45 470.22
12:00 1177.6 546.99 416.66 428.27 372.34 705.98
13:00 1638.4 450.90 400.20 375.99 266.78 355.10
14:00 512.60 1280.4 297.14 506.81 342.18 18.07
15:00 1126.4 1945.6 500.35 1228.8 730.78 9.20
16:00 754.32 835.78 1034.24 1515.52 1146.88 24.79
17:00 341.63 540.39 443.35 408.09 433.17 4.20
Fuente: propia
58

Tabla No. 3 – Tabulación de los datos de ancho de banda


((Xi-
F Li Ls Xi FXi Fa Xi-media (Xi-media)^2
media)^2)*f
-
18 - 324 56 17.5 - 324.5 171 9576 56 214028.316 11985585.7
462.6319444
-
325 - 631 38 324.5 - 631.5 478 18164 94 24221.30213 920409.481
155.6319444
632 - 938 16 631.5 - 938.5 785 12560 110 151.3680556 22912.28824 366596.6119

939 - 1245 10 938.5 - 1245.5 1092 10920 120 458.3680556 210101.2744 2101012.744

1246 - 1552 12 1245.5 - 1552.5 1399 16788 132 765.3680556 585788.2605 7029459.126

1553 - 1859 5 1552.5 - 1859.5 1706 8530 137 1072.368056 1149973.247 5749866.233

1860 - 2166 5 1859.5 - 2166.5 2013 10065 142 1379.368056 1902656.233 9513281.163

2167 - 2473 2 2166.5 - 2473.5 2320 4640 144 1686.368056 2843837.219 5687674.438

91243 43353885.49
Fuente: propia

Tabla No. 4 – Resumen medidas de tendencia central, posición y dispersión


Media 633.63
Mediana 452.76
Moda 249.82
Q1 214.85
Q2 453.76
Q3 900.12
D2 176.48
D5 453.76
D8 1092
P23 198.41
P50 453.76
P90 1501.33
Varianza 301068.65
Desviación estándar 548.70
Coeficiente de correlación 86.70
Fuente: propia
59

Tabla No. 5 – Datos para prueba de intervalos de confianza

21.30 470.22
31.58 506.81
39.23 537.60
82.49 589.45
180.75 660.4
237.57 726.43
255.5 835.78
353.90 878.57
383.99 1280.40
428.57 1822.78
Fuente: propia

Tabla No. 6 - Análisis de varianza de un factor semana 1


Grupos Cuenta Suma Promedio Varianza
Lunes 12 13642.25 1136.85417 811151.402
Martes 12 8319.27 693.2725 350945.488
Miércoles 12 11270.51 939.209167 500415.516
Jueves 12 7413.84 617.82 250414.735
Viernes 12 5956.11 496.3425 199662.992
Sábado 12 2202.66 183.555 57444.2472
Fuente: propia

Tabla No. 7 – Análisis de varianza de un factor probabilidades semana 1


Grados
Origen de las Suma de Promedio de Proba Valor crítico
de F
variaciones cuadrados los cuadrados bilidad para F
libertad
Entre grupos 6721288.95 5 1344257.79 3.716 0.0050 2.35380896
7829 3052
3
Dentro de los 23870378.2 66 361672.397
grupos

Total 30591667.1 71
Fuente: propia
60

Tabla No. 8 - Análisis de varianza de un factor semana 2


Grupos Cuenta Suma Promedio Varianza
Lunes 12 11562.11 963.509167 589717.007
Martes 12 7166 597.166667 307436.147
Miercoles 12 5234.69 436.224167 89808.6976
Jueves 12 6360.52 530.043333 195626.1
Viernes 12 4628.54 385.711667 103889.035
Sábado 12 2803.75 233.645833 57173.5682
Fuente: propia

Tabla No. 9 - Análisis de varianza de un factor probabilidades semana 2


Origen de las Suma de Grados Promedio de F Proba Valor crítico
variaciones cuadrados de los bilidad para F
libertad cuadrados
Entre grupos 3716293.33 5 743258.665 3.318 0.0098 2.35380896
9819 1861
9
Dentro de los 14780156.1 66 223941.759
grupos

Total 18496449.4 71
Fuente: propia

También podría gustarte