Es posible que últimamente hayas oído que las organizaciones están adoptando proyectos de ciencia de datos para encontrar información que les ayude a tomar mejores decisiones basadas en esos hallazgos. Hoy vemos el uso de la ciencia de datos en las áreas de salud, logística, detección de fraudes, recomendaciones automatizadas y varias otras, que sin duda pueden mejorar nuestras vidas y aportar beneficios a las empresas.
Para poner en marcha un proyecto de este tipo, primero se debe analizar el entorno de TI actual, dónde se encuentra la mayor parte de los datos, qué restricciones normativas existen sobre la residencia de los datos, qué competencias tiene el equipo y cuál es la estrategia de TI de la empresa. La verdad es que debería empezar donde tenga más sentido para tu organización, que podría ser en el entorno local (on-premises), en la nube, o un enfoque híbrido para aplicar la mejor estrategia de análisis de datos.
Cuando nos planteamos embarcarnos en un proyecto para analizar los datos disponibles en una organización, lo primero que se nos viene a la mente es que necesitamos científicos de datos expertos, que trabajen varios meses o años con numerosas fuentes de datos para llevar a cabo esta tarea. Eso sin tener en cuenta la infraestructura, la base de datos y la solución de análisis de datos que habrá que adquirir, instalar y gestionar.
Aunque esto puede ser cierto en grandes organizaciones, la realidad es que, para comenzar, la tarea no tiene por qué ser excesivamente compleja. Se puede empezar con un recurso completo que cuente con todos los componentes necesarios para desarrollar fácilmente una solución de análisis de datos, lo que resulta especialmente beneficioso para pequeñas y medianas empresas. Esto se debe a que, para ellas, tales proyectos suelen estar fuera de su presupuesto y, por tanto, de su objetivo inmediato.
Independientemente del tamaño de la organización, el análisis de datos debe ser parte integrante de cualquier empresa. El mayor desafío es encontrar los productos y herramientas adecuados que puedan ayudar a tu empresa a instalar, ejecutar, recopilar, preparar, analizar e interpretar los datos, para luego encontrar información que pueda utilizarse para mejorar las operaciones o la toma de decisiones.
A continuación encontrarás algunas sugerencias sobre dónde concentrar tus esfuerzos y cómo herramientas como Oracle Database Appliance u Oracle Exadata junto con Oracle Analytics Server pueden ayudar:
• Selecciona la infraestructura en la que se ejecutará tu solución analítica. Lo mejor es optar por una solución integrada y optimizada, como Oracle Database Appliance o Exadata Database Machine. También es posible elegir servicios de Oracle Cloud Infrastructure (OCI) como Oracle Compute Services u Oracle Database Services para aprovechar las ventajas de la nube. En este caso, el mejor enfoque dependerá de dónde residan los datos y de las restricciones normativas que existan para tu ubicación o sector.
• Selecciona una herramienta de análisis de datos que tenga el conjunto de funciones más amplio y que mejor se adapte a tus habilidades y estrategias. Oracle Analytics es una plataforma intuitiva que aborda todo el proceso analítico, incluida la ingesta de datos, su preparación, el machine learning, la visualización y la colaboración. Y lo mejor de todo es que está disponible para funcionar on-premises y en la nube.
Una vez elegida la infraestructura y las herramientas de análisis de datos, se debe capacitar a los usuarios empresariales, ingenieros de datos y científicos de datos para que accedan a ellos, los procesen y, a continuación, los evalúen y tomen decisiones basadas en ellos. Para ello, es necesario:
1. Acceder a los datos conectando cualquier tipo de fuente o base de datos, independientemente de donde esté, mediante conectores incluidos o admitidos por esa fuente. Estos datos deben proceder de bases de datos existentes, aplicaciones compatibles o cualquier contenido online que permita compartir datos a través de un punto de conexión RESTAPI.
2. Preparar los datos limpiándolos y enriqueciéndolos. La automatización incorporada a la herramienta debe garantizar el cumplimiento de la privacidad y la seguridad de los datos. También debes poder añadir información recomendada a los campos de datos, como información geográfica, zonas horarias y otros metadatos relevantes que puedan ayudar a visualizar o localizar patrones en la fase de exploración.
3. Modelar los datos creando nuevos conjuntos de datos basados en diferentes fuentes o tipos de información (por ejemplo, considera la posibilidad de unir publicaciones de redes sociales con datos de productos para descubrir nuevos mercados potenciales). O Oracle Analytics Server dispone de una interfaz que permite “arrastrar y soltar” visualmente conjuntos de datos para facilitar esta tarea.
4. Explorar los datos formulando preguntas intuitivas a la herramienta mediante lenguaje natural. Esta funcionalidad ayudará a acelerar el proceso de consulta y no requerirá conocimientos especializados de programación. Por ejemplo, Oracle Digital Assistant se integra con Oracle Analytics Server y aplicaciones de terceros a través de API ya incluidas. También opera en 28 idiomas diferentes.
5. Poner a prueba tus modelos generando informes o cuadros de mando en los que podrás ver los resultados y las tendencias. También es posible aplicar algoritmos para buscar insights o modelos de machine learning para descubrir comportamientos futuros. Ahí es donde los análisis avanzados y los modelos predictivos pueden ser difíciles de desarrollar si no se cuenta con las herramientas adecuadas. Los científicos de datos utilizan lenguajes de programación, como Python o R, para desarrollar estos modelos de machine learning. Sin embargo, herramientas como Oracle Analytics Server incluyen una interfaz gráfica para seleccionar y aplicar algoritmos incorporados que ayudan a visualizar y realizar predicciones.
6. Presentar tus conclusiones o colaborar con las partes interesadas mediante informes interactivos online (disponibles para computadoras, dispositivos móviles o tabletas) o exportando los resultados que pueden compartirse a través de las redes sociales o por correo electrónico.
Para facilitar la labor de algunas organizaciones, el equipo de Business Development de Oracle trabajó en la creación de un bundle que incluye los componentes de hardware y software para empezar a implementar un proyecto de análisis de datos. Este bundle incluye los productos de Oracle recomendados para que una pequeña organización se encamine hacia una estrategia de análisis de datos.
Cuando decidas poner en marcha tu proyecto de análisis de datos, sigue estos pasos básicos y estarás preparado para el éxito. Ten en cuenta que hoy en día existe una gran variedad de fuentes de datos disponibles para asegurarte de obtener resultados realmente reveladores. Las organizaciones avanzan hacia una arquitectura de datos más descentralizada que incluye nubes híbridas, multinubes y arquitectura híbrida (nube + on-premises).
Para obtener más eventos de datos en tiempo real que proporcionen análisis oportunos, puedes considerar implementar herramientas adicionales como pluggable databases de Oracle con Kubernetes, Docker o cloud-native con Autonomous Database. Además, Oracle GoldenGate para realizar la sincronización de datos entre nubes.