X

Entérate cómo la nube y las nuevas tecnologías habilitan la transformación en los negocios y en la sociedad

La nueva versión de Oracle Cloud Infrastructure Data Integration se centra en la conectividad y las transformaciones

This is a syndicated post, view the original post here

Esta versión amplía las opciones de conectividad, las capacidades de transformación, además de la integración entre ellas y OCI Data Flow.

Por Sandrine Riley*

Estamos encantados de anunciar una nueva versión de Oracle Cloud Infrastructure (OCI) Data Integration. Esta versión amplía las opciones de conectividad, las capacidades de transformación, además de la integración entre ellas y OCI Data Flow.

Integración nativa de la nube, sin servidor
Como recordatorio, OCI Data Integration es una solución de extracción, transformación y carga (ETL) sin servidor totalmente administrada y nativa de la nube. Las organizaciones que construyen lagos de datos para Data Science en Oracle Cloud, y los departamentos que construyen lagos de datos y Data Marts utilizando Autonomous Databases, estas pueden obtener un gran valor comercial de nuestra solución que simplifica, automatiza y acelera la consolidación de datos para ser usados.

La integración de datos es gráfica, permitiendo diseñar sin codificación, además de proveer preparación interactiva de datos, opciones de creación de perfiles y protección contra la evolución de esquemas. Todo está generado por ejecución de Spark ETL o ELT push-down. Si no estás familiarizado con este nuevo servicio, echa un vistazo a este blog para obtener más información: ¿Qué es Oracle Cloud Infrastructure Data Integration?
Data Integration está disponible en todas las regiones comerciales OCI.

-Lee más: Oracle Cloud Advisor: Correcciones masivas sencillas, orientación y más

Nuevas Características
Hemos ampliado la profundidad de las opciones de ETL para ayudarte a diseñar de manera más efectiva flujos de datos, tareas y procesos generales a través de operadores y transformaciones recientemente proporcionados.

Los operadores entran en la interfaz gráfica de usuario a medida que creas un diagrama de flujo de integración de datos personalizados. Te ayudan a seleccionar, filtrar y dar forma a los datos.

Esta versión incluye los siguientes operadores nuevos:

•Union: Combina múltiples flujos de datos en uno.

•Minus: Compara dos entidades de datos y da como resultado las filas presentes en una entidad pero no presentes en la otra entidad.

•Intersect: Compara dos o más entidades de datos y da como resultado las filas presentes en las entidades conectadas.

Estos operadores te permiten expresar rápida y fácilmente transformaciones complejas. Dale un vistazo a la reseña completa de los operadores de integración de datos.

Data Integration incluye un Data Xplorer  interactivo que visualiza una muestra de datos que se actualiza automáticamente a medida que tú aplicas las operaciones de transformación. Data Xplorer te ayuda a validar el impacto de estas transformaciones, descubrir problemas en los datos y depurar o solucionar posibles fallos antes de que se ejecute una tarea.

Data Xplorer incluye las siguientes nuevas transformaciones:

•Crear ID única: Añade un atributo a un conjunto de datos. Los valores de este atributo se rellenan con un identificador universal único de 128 bits (UUID por sus siglas en inglés).

•Reemplazar vía patrón: Te permite introducir una expresión regular para buscar y reemplazar valores de datos en un atributo, y agrega un atributo para contener los datos transformados.

Para obtener más información sobre cómo transformar datos con integración de datos, consulta la página de documentación.

La nueva conectividad siempre es emocionante. Nos complace tener Amazon Web Services (AWS) Relational Data Store (RDS) para Oracle, MySQL y Microsoft SQL Server, Microsoft Azure SQL Database, y la compatibilidad con archivos comprimidos para el almacenamiento de objetos en OCI. Mira la lista completa de activos de datos compatibles.

También hemos mejorado la experiencia del usuario. ¡Ahora puedes ver la actividad reciente en tu espacio de trabajo desde la pestaña de Inicio, proporcionando una mejor legibilidad, una buena visión de lo que has estado haciendo y la capacidad de volver rápidamente a los últimos elementos en los que estaba trabajando!

Integración con Data Flow
Por último, queremos señalar que hemos mejorado la integración entre OCI Data Integration y OCI Data Flow. Data Flow es un servicio Apache Spark completamente administrado que realiza tareas de procesamiento en conjuntos de datos masivos sin infraestructura para implementar o administrar. Esta rápida distribución de aplicaciones le permite a los desarrolladores centrarse en el desarrollo de aplicaciones, no en la gestión de infraestructura.

Échale un vistazo a "Publicar una tarea de integración de datos de Oracle Cloud Infrastructure en Oracle Cloud Infrastructure Data Flow" para saber cómo los servicios se complementan entre sí.

La integración entre Data Integration y Data Flow ahora admite endpoints privados para acceder a la red privada donde se alojan tus orígenes de datos. Este acceso amplía las opciones para incluir y utilizar fuentes de datos a las que solo se puede acceder de forma privada. Ahora tienes más opciones para usar los dos servicios en conjunto mientras trabajas con datos.

¿Deseas obtener más información?
Las organizaciones se están embarcando en su viaje analítico de próxima generación con lagos de datos, bases de datos autónomas y análisis avanzados con IA y machine learning en la nube. Para que este viaje tenga éxito, necesitan ingerir, preparar, transformar y cargar sus datos rápida y fácilmente en Oracle Cloud Infrastructure. ¡El proceso de integración de datos acaba de comenzar! ¡Pruébalo hoy mismo!

*Sandrine Riley es Gerente Principal de Productos en Oracle

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.