Laboratorio7 Si Utp

OBJETIVO DEL LABORATORIO.
El objetivo de este laboratorio es el de desarrollar habilidades en el análisis de requerimientos de

seguridad y diseño de arquitectura de sistemas con componentes de seguridad para soluciones cloud, se
estudiará la arquitectura de seguridad de AWS y sus componentes para crear diseños aplicados a las
empresas caso del trabajo final.
Planteamiento del problema
Se requiere una solución cloud para una empresa que tendrá un grupo de servidores que ejecutan las
aplicaciones principales del negocio cuyo giro es la salud. Los datos de atención médica se generan a un
ritmo cada vez mayor y se prevé que alcancen los 35 zettabytes para 2020. Ser capaz de administrar estos
datos de manera rentable y segura, ya sea para la atención del paciente, la investigación o por razones
legales, es cada vez más importante para los proveedores de atención médica. Los proveedores de
atención médica deben tener la capacidad de ingerir, almacenar y proteger grandes volúmenes de datos,
incluidos datos clínicos, genómicos, de dispositivos, financieros, de la cadena de suministro y de
reclamaciones. AWS se adapta bien a esta avalancha de datos con una amplia variedad de servicios de
ingesta, almacenamiento y seguridad (por ejemplo, AWS Direct Connect, Amazon Kinesis Streams,
Amazon S3, Amazon Macie) para que los clientes manejen sus datos de atención médica. Lo que
magnifica el problema es el hecho de que los datos de atención médica son cada vez más atractivos para
los atacantes cibernéticos, lo que hace que la seguridad sea una prioridad principal. AWS puede brindar a
los clientes para ingerir, almacenar y proteger los datos de atención médica del proveedor. El tsunami de
datos está sobre nosotros, ¿de dónde provienen estos datos? Además de la omnipresente historia clínica
electrónica (EHR), las fuentes de estos datos incluyen:
• secuenciadores genómicos
• dispositivos como resonancias magnéticas, rayos X y ultrasonidos
• sensores y dispositivos portátiles para pacientes
• telemetría de equipos médicos
• aplicaciones móviles
Las fuentes adicionales de datos provienen de sistemas operativos no clínicos, tales como:
• recursos humanos
• Finanzas
• cadena de suministro
• reclamaciones y facturación
Los datos de estas fuentes pueden ser estructurados (p. ej., datos de reclamaciones) y no estructurados (p.
ej., notas del médico). Algunos datos se encuentran en flujos, como los que se toman de los monitores de
los pacientes, mientras que otros vienen en forma de lotes. Otros datos llegan casi en tiempo real, como
los mensajes HL7. Todos estos datos tienen políticas de retención que dictan cuánto tiempo deben
almacenarse. Gran parte de estos datos se almacenan a perpetuidad ya que muchos sistemas en uso hoy en
día no tienen un mecanismo de purga. Las imágenes son un contribuyente significativo a este tsunami de
datos. La creciente demanda de diagnósticos en etapas tempranas junto con el envejecimiento de la
población impulsa la creciente demanda de imágenes de CT, PET, MRI, ultrasonido, patología digital,
rayos X y fluoroscopia. Por ejemplo, una imagen de TC de corte fino puede ocupar cientos de megabytes.
El aumento de la demanda y las estrictas políticas de retención hacen que el almacenamiento sea costoso.
Debido a la caída en picado del costo de la secuenciación de genes, el diagnóstico molecular (incluida la
biopsia líquida) es un gran contribuyente a esta avalancha de datos. Muchos predicen que a medida que el
valor de las pruebas moleculares se vuelve más identificable, los modelos de reembolso cambiarán y se
convertirán cada vez más en el estándar de atención. Según el artículo del Washington Post "La
secuenciación del genoma crea tantos datos que no sabemos qué hacer con ellos". “Algunos
investigadores predicen que hasta mil millones de personas tendrán su genoma secuenciado para 2025
generando hasta 40 exabytes de datos por año”. Aunque la genómica se usa principalmente para el
diagnóstico oncológico en la actualidad, también se usa para otros fines, la farmacogenómica, que se usa
para comprender cómo un individuo metabolizará un medicamento. Arquitectura de referencia Cada vez
es más difícil para el típico hospital, clínica o práctica médica almacenar, procesar y administrar de forma
segura estos datos sin la adopción de la nube. El diseño de la arquitectura solución debe tener cuatro
componentes distintos: ingesta, almacenamiento, seguridad análisis.
Solución:
Componentes usados
AWS volumen: Un volumen de Amazon EBS es un dispositivo de almacenamiento duradero a nivel de

bloque que puede adjuntar a sus instancias.
Snowball: AWS Snowball, es un dispositivo de informática de borde, migración de datos y

almacenamiento de borde que ofrece dos opciones
“On-premises” significa en español “en las instalaciones propias” o “in situ”
AWS Storage Gateway es un servicio de almacenamiento en la nube híbrido que le brinda acceso local a
almacenamiento en la nube prácticamente ilimitado.
Amazon Simple Queue Service (Amazon SQS) es un servicio de colas de mensajes completamente
administrado que permite desacoplar y ajustar la escala de microservicios, sistemas distribuidos y
aplicaciones sin servidor.
AWS Direct Connect es un servicio de red que ofrece una alternativa al uso de Internet para utilizar los
servicios en la nube de AWS
Amazon Kinesis Data Streams es un servicio de datos de streaming sin servidor que hace que sea fácil
capturar, procesar y almacenar flujos de datos a cualquier escala
AWS vpc pvn Gateway: Una puerta de enlace privada virtual es una función de enrutamiento perimetral
distribuida lógica y completamente redundante que se ubica en el perímetro de su VPC.
Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece
escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector
AWS Glue automatiza gran parte del esfuerzo necesario para integrar los datos.
Amazon S3 Glacier es una clase de almacenamiento de Amazon S3 segura, duradera y de muy bajo
costo para archivado de datos y copias de seguridad a largo plazo.
Amazon EMR es una plataforma de big data en la nube para ejecutar trabajos de procesamiento de datos
distribuidos a gran escala, consultas SQL interactivas y aplicaciones de machine learning (ML) con
marcos de análisis de código abierto como Apache Spark, Apache Hive y Presto.
Amazon DynamoDB es una base de datos NoSQL de clave-valor sin servidor y completamente
administrada que está diseñada para ejecutar aplicaciones de alto rendimiento a cualquier escala.
Amazon Macie es un servicio de privacidad y seguridad de datos totalmente administrados que utiliza el
aprendizaje automático y la correspondencia de patrones para descubrir y proteger sus datos
confidenciales en AWS
Amazon Athena es un servicio de consulta interactivo que facilita el análisis de datos directamente en
Amazon Simple Storage Service (Amazon S3) mediante SQL estándar.
Amazon Athena es un servicio de consulta interactivo que facilita el análisis de datos directamente en
Amazon Simple Storage Service (Amazon S3) mediante SQL estándar.
Amazon EMR (anteriormente llamado Amazon Elastic MapReduce) es una plataforma de clúster
administrada que simplifica la ejecución de marcos de big data, como Apache Hadoop y Apache Spark,
en AWS para procesar y analizar grandes cantidades de datos.
Amazon CloudSearch es un servicio administrado en la nube de AWS que facilita la configuración, la
administración y el escalado rentables de una solución de búsqueda para su sitio web o aplicación.
Amazon Elasticsearch Service es un servicio administrado que facilita la implementación, el

funcionamiento y la escala de Elasticsearch en la nube de AWS.
Amazon Redshift es un servicio de almacenamiento de datos a escala de petabytes totalmente

administrado en la nube.
Solución implementada:

Laboratorio7 Si Utp

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Laboratorio7 Si Utp

Cargado por

Copyright:

Formatos disponibles

OBJETIVO DEL LABORATORIO.

El objetivo de este laboratorio es el de desarrollar habilidades en el análisis de requerimientos de

Planteamiento del problema

AWS volumen: Un volumen de Amazon EBS es un dispositivo de almacenamiento duradero a nivel de

Snowball: AWS Snowball, es un dispositivo de informática de borde, migración de datos y

“On-premises” significa en español “en las instalaciones propias” o “in situ”

Amazon Elasticsearch Service es un servicio administrado que facilita la implementación, el

Amazon Redshift es un servicio de almacenamiento de datos a escala de petabytes totalmente

También podría gustarte