Watson Discovery, la API de IBM para dar valor a los datos de las empresas

Watson Discovery, la API de IBM para dar valor a los datos de las empresas
Watson Discovery, la API de IBM para dar valor a los datos de las empresas

BBVA API Market

Discovery permite a las empresas comprender, con cierta facilidad, la gran masa de datos de las que disponen, en muchas ocasiones de fuentes muy dispares (documentos de aplicaciones de ofimática, documentos HTML, JSON, PDF...).

Siempre se habla de los datos como la llave que abre todas las puertas. Y no es una comparación equivocada. Pero los datos son algo más que la obtención de información agregada, a volumen o en bruto, y es necesario que una empresa tenga la capacidad de generar verdadero valor de negocio con ella. Lograrlo no es nada fácil. En España hay algunas empresas, muy pocas, que están extrayendo valor de negocio de sus datos; otras están en proceso de disponer de información agregada de la que extraer ese beneficio; y el resto buscan soluciones para disponer de esa información. Soluciones a nivel de infraestructura y back y también en el front.

Igual que existen empresas en busca de ese valor añadido, hay otras compañías que ofrecen productos y servicios a esos terceros para ser capaces de monetizar sus datos. IBM es, posiblemente, una de las principales empresas en el mundo en inteligencia artificial y en la creación de productos y servicios en campos como el procesamiento de lenguaje natural y aprendizaje automático. La mayoría de estos productos giran en torno a su core Watson, el sistema informático de inteligencia artificial desarrollado en torno a la tecnología DeepQA (Deep Question Answers). Watson no es nada más que un sistema informático para búsqueda de respuestas.

Esta búsqueda de respuestas está basada en el procesamiento de lenguaje natural, una ciencia de la computación y la inteligencia artificial que estudia y mejora la interacción entre las máquinas y los seres humanos, sobre todo a nivel del lenguaje. Watson puede, gracias a eso, entender el mundo de los seres humanos a través de los sentidos, el aprendizaje y la experiencia propios de las personas. ¿Cómo hace IBM Watson para resolver preguntas dando respuestas relativamente acertadas?

●   Watson bucea dentro de millones de documentos para encontrar respuestas a las preguntas que se le plantean. Eso es posible porque acumula cientos de datos de fuentes diversas como Microsoft Word, páginas webs, documentos en PDF o formato JSON, documentos en aplicaciones en la nube…

●   Utiliza un algoritmo de puntuación para valorar la calidad de la respuesta.

Discovery, producto interesante en Watson

Dentro de todos los productos relacionados con Watson, uno de los servicios más interesantes es Discovery. La meta fundamental de este producto es conseguir que las empresas puedan comprender sus grandes datos con algo menos de esfuerzo. Esto es posible gracias a tres situaciones que no son nada sencillas en IA:

●   Analizar grandes volúmenes de datos que, en un primer momento, pueden estar en un formato o en unas condiciones que no son las mejores. Normalmente la información llega de las fuentes totalmente desestructurada procedente de fuentes locales tan dispares como correos electrónicos o chats. La mayoría de científicos de datos usa gran parte de su tiempo en la recogida, limpieza y organización de los datos no estructurados. Este es un trabajo arduo, complejo y necesario para obtener información de valor real.

●   IBM Watson también es capaz de analizar información estructurada y semiestructurada procedente de otras fuentes como bases de datos o sistemas de gestión de contenidos (CMS) habituales en las empresas. 

●   Normalmente la inteligencia artificial tiene capacidad para dar una única respuesta determinista a una pregunta o consulta. Lo realmente difícil es que un sistema o plataforma sea capaz de contextualizar y ofrecer alternativas. El objetivo de Watson Discovery es contextualizar datos y dar respuestas.   

La API de Watson Discovery

IBM presume de tener un servicio que no necesita perfiles con un doctorado. Con saber hacer una llamada a una API REST es necesario. Esa es la forma en la que se hace todo el proceso de extracción, transformación y carga (ETL) de contenido e integrarlo directamente con las capacidades que tiene Watson en la importación de documentos y grandes volúmenes de datos. Desde ahí los desarrolladores pueden identificar tareas, análisis de datos, exploración de información, búsqueda…

Al final, el gran bloque de APIs de Watson lo que permite es lo siguiente:

●   Rastrear, convertir, enriquecer y normalizar los datos.

●   Explorar el contenido del cliente, pero también de fuentes de contenido público y totalmente libre o bien contenido que está bajo licencia.

●   Añadir a la información recogida un nuevo valor: Watson usa el procesamiento de lenguaje natural para extraer conceptos, establecer relaciones y vincular sentimientos a los datos que se han recogido.

●   Simplificar el desarrollo sin dejar de ofrecer acceso a las APIs.

El objetivo de Discovery es poner todas las capacidades que tiene IBM Watson en tecnologías como la computación y el procesamiento de lenguaje natural en un servicio más accesible para todos, con la idea de dar soporte a todo tipo de sectores y contenidos, sobre todos aquellos que manejan grandes datos como la salud. Con Discovery, la idea es que la preparación de los datos no estructurados, hacer las consultas necesarias para localizar la información que se desea e integrar todo eso dentro de una nueva aplicación, una plataforma o una solución sea muy sencillo.

Cómo se añade contenido con Watson Discovery

Watson Discovery tiene tres formas distintas de relacionar, contextualizar, conectar o encontrar ideas brillantes entre todo el volumen de datos que tiene una empresa después del proceso de rastreo y organización de esa información no estructurada:

●   A través de la API: esta es la mejor fórmula posible si la carga del contenido está integrada directamente con una aplicación o servicio ya existente.

●   Herramientas de Discovery: el método ideal si lo que se quiere es subir directamente ese contenido a un servicio local para su consulta y uso.

●   Mediante el rastreador de datos: el rastreador de datos es una herramienta de línea de comandos que ayuda a los desarrolladores a coger sus documentos desde los repositorios en los que se encuentran (puede ser por ejemplo una base de datos) y empujarlos a la nube para ser usados por Watson Discovery.

Si quieres saber más:

–  Caso de Estudio sobre Watson IBM: Big Data y APIs para ayudar a un hospital para mejorar sus objetivos

–  ¿Te interesan las APIs financieras? Descubre todas las que te ofrece BBVA

También podría interesarte