Inteligencia Artificial: Hacia la Web Semántica

Hace poco leía un artículo de la web "The Motley Fool" titulado "How IBM plans to destroy Google". Traducido al español, "Cómo IBM planea destruir a Google". Esta web, dedicada al asesoramiento y análisis del mercado de valores, se caracteriza por sus artículos sensacionalistas, y en este caso, no podía ser menos. En el artículo en cuestión se hacen eco de una iniciativa de los laboratorios de IBM, la construcción de un sistema informático capaz de procesar preguntas formuladas en lenguaje natural y obtener una respuesta adecuada. Para rizar el rizo, el entorno de test propuesto para dicho sistema sería el famoso concurso de la televisión norteamericana Jeopardy!. En este concurso, se formula una pregunta a los tres concursantes, aunque no es siempre una pregunta directa, sino un poco enrevesada, por lo que hay que hacer un esfuerzo en entender la pregunta en primer lugar, y, determinar la respuesta correcta a continuación.

Aquí es donde los articulistas de "The Motley Fool" hacen la extrapolación de que con un sistema así IBM sería capaz de fabricar un buscador que hiciera que el de Google pareciera un juguete. Como dicen en las películas del oeste: "no tan rápido, forastero".

Como muy bien se apunta en el citado artículo, el problema de las búsquedas de Google (por cierto, basadas en mecanismos de Inteligencia Artificial, algo que ya comentaré otro día) es que carecen de inteligencia suficiente para entender exáctamente qué es lo que están buscando. Es decir, Google no entiende la 'semántica' de la búsqueda que realiza, no entiende el lenguaje natural, por lo que es la persona que busca la que debe refinar los términos de búsqueda para lograr los resultados deseados. En el caso del proyecto de IBM, el sistema construido sería capaz de entender el lenguaje natural, la semántica de la frase introducida, y producir resultados en consecuencia. En realidad este artículo va a ser una introducción a una serie de artículos relacionados con la Web Semántica (o Web 3.0, como la llaman algunos), usando este proyecto de IBM, el proyecto DeepQA como entradilla.

¿Qué es el DeepQA, o Watson? Es en realidad una combinación de software y hardware. La parte interesante es que Watson se apoya, según parece por la información de IBM, en unos nuevos algoritmos que permitirían a un computador analizar el significado de las preguntas hechas por un usuario final. De este modo, no tendríamos que plantearnos como dirigir las búsquedas, tal y como hacemos en los buscadores tradicionales, sino que haríamos las preguntas en lenguaje natural, del mismo modo que hacemos con una persona cuando mantenemos una conversación.

Ahora bien, este software se basa en un soporte hardware de la familia BlueGene, es decir, uno de los supercomputadores más potentes del mundo, con lo que la aplicación práctica de la herramienta resulta de momento limitada por la ingente cantidad de recursos hardware que son necesarios para hacerlo funcionar. Hay que recordar que Google se basa en realidad en una estructura en 'grid', es decir, se puede afirmar que han construido un gran supercomputador, pero en lugar de utilizar un hardware específico para ello, utilizan ordenadores tipo PC que colaboran entre sí para obtener la potencia de cálculo necesaria para ofrecer el servicio que todos conocemos.

No cabe duda de que el futuro de la informática en general, y de la Inteligencia Artificial en particular, pasa por lograr que los computadores entiendan el lenguaje natural de forma directa, aunque hoy por hoy una aproximación a este problema suponga un gasto ingente de potencia de cálculo. La web semántica, de la que trataré en breve, puede ser una buena primera aproximación para dotar de significado a la red y aumentar este entendimiento entre el hombre y la máquina.


Comentarios:

Enviar un comentario:
  • Sintaxis HTML: Deshabilitado
About

Trabajo en Sun desde 2002 y estoy especializado en Software, en particular en Gestión de Identidad. En este blog trataré de hablar de novedades normalmente no relacionadas con la Gestión de Identidad, sino con tecnología Informática puntera en general.

Search

Archives
« abril 2014
lunmarmiéjueviesábdom
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
    
       
Hoy