Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tendencias importantes
1. Antes de explicar la arquitectura de CDP Private Cloud,
2. Quiero describir algunas tendencias importantes
3. ya que las primeras plataformas CDH y HDP fueron concebidas originalmente.
4. Esto proporcionará un poco de contexto a la discusión arquitectónica.
5. ya que entenderás no solo lo que ha cambiado,
6. pero también por qué.
7. A medida que la adopción de la nube ha aumentado,
8. ha aumentado el ritmo al que operan los negocios.
9. También ha cambiado las expectativas sobre la rapidez con la que se pueden
aprovisionar los servicios.
10. y la rapidez con la que pueden escalar en respuesta a las necesidades del negocio.
11. La cita de la revista CIO que mostré anteriormente
12. explicó que cuando la TI empresarial no funciona a la velocidad del negocio,
13. a menudo son reemplazados por TI en la sombra,
14. afortunadamente la tendencia hacia los servicios en la nube
15. también ha dado lugar a nuevas innovaciones en ingeniería y arquitectura de software.
16.
¿Qué es Kubernetes?
1. Una de las cosas que hace esto posible es Kubernetes,
2. que a menudo se abrevia debido a su nombre largo
3. y el hecho de que hay ocho letras entre la K y la S.
4. Kubernetes es un sistema de software utilizado para implementar,
5. escalar y administrar aplicaciones en contenedores.
6. Fue desarrollado originalmente en Google
7. y es esencialmente una versión mejorada de un sistema interno
8. han estado funcionando durante años.
9. Google lanzó Kubernetes como código abierto en 2014
10. y desde entonces se ha convertido en el estándar de facto para la orquestación de
contenedores,
11. ya que es compatible con los principales proveedores de nube
12. incluyendo Amazon Web Services,
13. Microsoft Azure y, por supuesto, Google Compute Platform.
14. También se utiliza para la infraestructura de nube privada en muchas organizaciones,
15. ya sea independiente a través del proyecto de código abierto
16. o a través de productos con soporte comercial como Red Hat OpenShift,
17. Al igual que la arquitectura tradicional de Apache Hadoop que describí anteriormente,
18. una colección de máquinas que trabajan juntas
19. y ejecutar el software de Kubernetes también se conoce como clúster
20. o más específicamente un clúster de Kubernetes.
Requisitos de instalación
1. Antes de explicar los requisitos previos para configurar CDP Private Cloud,
2. Quiero mencionar primero
3. que te recomiendo encarecidamente que compruebes
4. la documentación de los requisitos del sistema
5. y versiones compatibles.
6. Estos detalles pueden cambiar a medida que CDP Private Cloud evoluciona.
7. También te animo a que compruebes la arquitectura de referencia para
8. orientación sobre el diseño y el tamaño de los nodos.
9. Una implementación de CDP Private Cloud Plus requiere dos cosas principales.
10. El primero es un clúster de OpenShift Kubernetes,
11. versión 4.3. funcionando sobre metal desnudo.
12. Esto es compatible con la consola de administración
13. y proporciona orquestación de contenedores
14. y capacidad de cómputo para experiencias en contenedores
15. como Cloudera Data Warehouse y Cloudera Machine Learning.
16. El segundo requisito previo es un clúster
17. ejecución de CDP Private Cloud Base
18. versión 7.1 o superior,
19. que servirá como el lago de datos.
20. Esto proporciona almacenamiento de datos y servicios SDX
21. así como soporte para ejecutar cargas de trabajo bare metal.
22. Como mínimo,
23. debe ejecutar el HDFS, Ozono,
24. Servicios de hive metastore, Ranger y Atlas.
25. Sin embargo, puede ejecutar otros servicios de acuerdo con sus necesidades
específicas,
26. como Apache NiFi y Apache Kafka para la ingesta de datos,
27. Apache Hive para el procesamiento ETL
28. o Apache Spark para aprendizaje automático e IA.
29. Entonces, ¿cómo se consigue que el clúster de CDP Private Cloud Base llegue a
30. ¿Usarlo como lago de datos para su implementación de Private Cloud Plus?
31. Una opción es actualizar un clúster CDH o HDP existente
32. a CDP Private Cloud Base.
33. Asegúrese de consultar la documentación para obtener más detalles.
34. ya que el soporte variará en función de la versión desde y hacia la que esté
actualizando.
35. Otra opción es configurar un nuevo clúster con un
36. nueva instalación de CDP Private Cloud Base
37. y, a continuación, migre sus datos existentes a él.
38. El clúster de Private Cloud Base Edition debe estar configurado
39. para una autenticación segura con Kerberos,
40. respaldado por un KDC Kerberos del MIT
41. o Microsoft Active Directory.
42. También debe tener habilitado Auto TLS,
43. que protege los datos confidenciales, como las fichas de clave Kerberos,
44. que podría transmitirse a través de la red.
45. Finalmente, para garantizar un buen rendimiento,
46. el clúster de OpenShift debe tener rápido,
47. conectividad de red de alto ancho de banda
48. al clúster de CDP Private Cloud Base que sirve como lago de datos
49. porque habrá cantidades significativas de datos transferidos entre ellos.
50.
Demostración de instalación
1. Esta demostración comienza con Cloudera Manager,
2. donde iniciaremos sesión como administrador.
3. Lo que ves aquí
4. son todos los servicios que componen el clúster CDP Private Cloud Base,
5. incluidos los servicios de almacenamiento,
6. metadatos, seguridad y gobierno de datos.
7. Son utilizados por las cargas de trabajo bare metal que se ejecutan en este clúster
8. así como las cargas de trabajo informáticas en contenedores
9. ejecutándose en OpenShift que accederá a estos servicios de forma remota.
10. Comenzará el proceso de instalación de CDP Private Cloud
11. haciendo clic en el enlace Nueva nube privada en la barra lateral izquierda en Cloudera
Manager.
12. Si este enlace no es visible
13. y está seguro de que está ejecutando la versión correcta de CDP Private Cloud Base,
14. consulte la documentación de un comando que puede ejecutar para habilitar este
vínculo.
15. Esto le mostrará cualquier instalación existente
16. asociado a este clúster base.
17. Haga clic en el botón azul Instalar nueva nube privada de CDP
18. para comenzar una nueva instalación.
19. Esto inicia un asistente de cuatro pasos para guiarlo a través del
20. Proceso de instalación de una consola de administración de private Cloud
21. en el clúster de OpenShift.
22. Puede seleccionar un repositorio que proporcione los archivos de instalación
23. o simplemente puede aceptar la ubicación predeterminada del repositorio,
24. como se hace aquí.
25. El primer paso es proporcionar el archivo de configuración de Kubernetes,
26. conocido como Kube Config,
27. que proporciona información sobre el clúster de OpenShift,
28. incluyendo detalles sobre cómo acceder a él.
29. El administrador de OpenShift podrá proporcionar este archivo.
30. A continuación, especifique el valor del espacio de nombres.
31. Esto es simplemente un identificador único para su instalación de Private Cloud
32. y se utiliza para generar la URL mediante la cual posteriormente se puede acceder a
ella.
33. Opcionalmente, puede especificar un Registro de Docker
34. utilizado para distribuir imágenes de Docker necesarias para CDP Private Cloud,
35. aunque se recomienda usar uno que esté coubicado con
36. su clúster de OpenShift para obtener el mejor rendimiento
37. a los efectos de esta demostración
38. aceptaremos la opción predeterminada y usaremos el Registro de Docker proporcionado
por Cloudera.
39. Haga clic en el botón Siguiente para continuar.
40. Esto inicia el proceso de instalación del plano de control CDP en OpenShift.
41. En el transcurso de varios minutos
42. descargará y extraerá los archivos de instalación,
43. implementar la aplicación en el clúster de OpenShift
44. y espere a que se inicien los pods de Kubernetes.
45. En aras del tiempo,
46. volveremos a la página de inicio de Cloudera Manager
47. y luego vaya a una de las consolas de administración de CDP Private Cloud existentes
48. eso ya se ha establecido.
49. Después de iniciar sesión como administrador,
50. nos lleva a la pantalla del entorno,
51. lo cual es conveniente porque aquí es donde necesitamos estar
52. para realizar el primer paso posterior a la instalación
53. y eso es registrar un entorno
54. que proporciona información sobre el clúster de Kubernetes utilizado para la
computación
55. así como el CDP Private Cloud Base Cluster que servirá como lago de datos.
56. En primer lugar, especifique un nombre que se utilizará para este entorno.
57. A continuación, especifique el archivo de configuración de Kubernetes
58. que proporciona información sobre el clúster de OpenShift utilizado para la computación.
59. En este caso usaremos el mismo archivo Kube Config
60. como solíamos instalar la consola de administración.
61. Hay algunos otros valores que podríamos cambiar,
62. como el dominio de red y el prefijo del espacio de nombres
63. para personalizar aún más la instalación,
64. pero para esta demostración aceptaremos los valores predeterminados y continuaremos.
65. Para el lago de datos
66. Debemos proporcionar la URL de la instancia de Cloudera Manager
67. que gestiona ese clúster,
68. que podemos copiar directamente desde la barra de direcciones
69. y, a continuación, pegar en el campo de texto.
70. Después de hacerlo,
71. el formulario agrega campos para especificar las credenciales para
72. una cuenta de Cloudera Manager con privilegios administrativos.
73. Rellenamos esos valores y hacemos clic en el botón Conectar para validar esa
información.
74. Unos segundos más tarde
75. podemos ver que ha validado esa información,
76. conectado a Cloudera Manager
77. y rellenó un menú desplegable con una lista de clústeres disponibles
78. así como los servicios relevantes que se ejecutan en el clúster seleccionado.
79. Haga clic en el botón Registrar para completar el proceso de registro de un entorno.
80. En pocos segundos podemos ver información sobre el medio ambiente,
81. incluido el nombre del clúster del lago de datos,
82. el número de nodos de ese clúster,
83. la versión de Cloudera Runtime
84. y una lista de los servicios relacionados con el almacenamiento y SDX que se ejecutan
allí.
85. También hay un enlace a la instancia de Cloudera Manager para el clúster del lago de
datos
86. y otros enlaces que podemos utilizar para navegar por los espacios de trabajo de
Cloudera Machine learning,
87. elementos relacionados con el almacén de datos de Cloudera
88. e información de configuración.
89. Y así concluye la demostración
90. del proceso de instalación de CDP Private Cloud.
Puntos esenciales
Introducción a Cloudera Data Warehouse: Análisis de
autoservicio en la nube con CDP
Introducción al Curso
1. Hola, y bienvenidos a Introducción a Cloudera Data Warehouse:
2. Análisis de autoservicio en la nube con CDP.
3. En este curso, responderé a la pregunta,
4. ¿Qué es Cloudera Data Warehouse o CDW?
5. y te mostraré cómo usarlo.
6. Hay dos pistas para este curso.
7. Después de las dos primeras secciones, puede elegir la pista de Ingeniero de datos
8. o la pista de Data Analyst.
9. Al final de este curso, usted será capaz de:
10. Identificar el propósito principal y los beneficios de CDW
11. Y acceda a CDW y navegue por diferentes páginas dentro de él.
12. Además, para la pista de Ingeniería de Datos,
13. podrás
14. crear un catálogo de datos y un almacén virtual en CDW,
15. describir cómo CDW escala automáticamente.
16. y cambiar la configuración de los almacenes virtuales de Hive e Impala.
17. Para la pista de Data Analyst, podrá
18. Ejecutar una consulta con Hue o Data Analytics Studio
19. con un almacén virtual CDW,
20. conectarse a un almacén virtual desde la línea de comandos,
21. y conectar herramientas de terceros a un almacén virtual CDW.
22.