viernes, 17 de mayo de 2019

¿Pueden pensar las máquinas?


El desarrollo de la web semántica será importante para estructurar y dar significado a los datos para que puedan ser útiles para las personas y las computadoras.

La importancia de la web semántica (Otras Fuentes)
Sonia Pacheco Moreno, profesora de The Valley DBS
21/10/2016 13:48 Actualizado a18/09/2017 17:33


Hoy casi todo está en Internet. El problema radica en buscar la información correctamente y, lo que es más complicado, encontrar lo que uno busca de manera precisa.

Disponemos de millones y millones de webs, si bien un 75% están inactivas. Tantas, que si medimos el tamaño de la ‘www’ por el tráfico online generado, ya estaríamos inmersos en la era Zettabyte (un zettayte=1021 bytes) según Cisco y su Visual Networking Index. La cifra equivale aproximadamente a unos 36.000 años de vídeo en alta resolución.

Más de 336 millones de dominios se han dado de alta en el último trimestre en todo el mundo. Aunque parezca mucho, solo estamos en el inicio: en España, por ejemplo, el ratio de registro de dominio (.es) por habitante es de 23 por cada 1.000. En uno de los países más activos en este ámbito, Alemania, cuenta con un ratio de hasta 190 por cada 1.000 habitantes, lo que da cuenta de que hay mucho más recorrido con webs y aplicaciones que están por llegar. Nunca la humanidad tuvo a su alcance tanta información con tan fácil acceso.

La cifra En los últimos tres meses se han dado de alta 336 millones de dominios. Un millón y medio por hora.

A todo esto hay que añadir que cualquier persona, independientemente de su edad, con o sin formación, puede crear contenidos y volcarlos en la red en pocos segundos, sobre todo desde la aparición de los smartphone. Esta facilidad se traduce en millones de personas generando contenido a diario: un 29% de la población dispone de cuenta en alguna red social, empleando en ellas un tiempo de 2,4 horas al día.

 

 Los humanos le damos significado a toda la información que hay en la red (exdez)
 
Sin embargo, para la web actual, toda la información existente carece de significado. Las máquinas no entienden su sentido, salvo que el humano detrás de la pantalla pueda dárselo. La ‘www’ fue concebida de manera que unas webs enlazaban con otras webs, pero los enlaces, desde el punto de vista del sistema, necesitan que los humanos les doten de significado (una web no sabe que el link pertenece a la home de otra web o al enlace de una cuenta de social media, o a un fichero pdf).

Puede sorprender que, habiendo creado sistemas complejos de computación, aún hoy mucha parte del trabajo lo debamos realizar las personas. En el caso de las búsquedas y tratamiento de la información en Internet, son los usuarios los que deben extraer la información, contextualizarla, resumirla, interpretarla y organizarla.

Las máquinas no entienden el significado de la información, a no ser que el humano pueda dársela”

Pongamos un ejemplo: si alguien busca un hotel en una zona específica donde alojarse en Londres, y pregunta en un buscador genérico ‘¿Dónde alojarse en La City?’, las cientos de miles de respuestas no responderán a esta pregunta concreta. ¿El motivo? El buscador no entiende la pregunta ni tampoco los términos de la misma. Es el usuario quien debe navegar resultado por resultado para comprobar que la información de cada uno de los enlaces puede resultar la adecuada a su búsqueda.

Parece que hemos diseñado estos sistemas complejos de computación solo para presentar la información de manera muy veloz, pero no para llevar a cabo esas labores de las cuales nos encargamos en la actualidad y consumen mucho de nuestro tiempo. Todo indica que en algunos aspectos no aprovechamos de manera óptima las posibilidades que ofrecen Internet y nuestros dispositivos.

¿Podemos hacer que esto cambie?

La web semántica, sí. Da significado y estructura los datos para que puedan ser útiles para las personas y también para las máquinas; para que puedan elaborar información de utilidad sin que los usuarios tengan que malgastar tiempo y esfuerzo. Así se conseguirá un nivel de automatización tal que ayude a los usuarios a realizar con eficacia y eficiencia las tareas de búsqueda, interpretación o clasificación de la información, entre otras. Esto va a permitir el desarrollo de aplicaciones, programas y agentes, redefiniendo con una alta probabilidad la relación hombre-máquina que hoy en día conocemos y abriendo, por tanto, nuevos usos y formas relación máquina-máquina, las cuales podrán generar conocimiento de manera autónoma.

El mayor impulsor de la web semántica es Tim Berners-Lee, padre de la ‘www’. El británico ya se refería a esta web semántica, en 2001, de la siguiente manera: “No es una web independiente sino una extensión de la actual, en la que se da información de significado bien definido, que puede permitir que ordenadores y las personas trabajen en cooperación”. El mismo indicaba que “la Web se ha desarrollado rápidamente como un medio de documentos para las personas más que un lugar para que los datos y la información pueda ser procesada de forma automática.

Cinco años después, Berners-Lee presentó el concepto Linked Data: no vale dar significado a los conceptos, hay que enlazarlos unos con otros. Todo esto le lleva a ser un firme defensor del Open Data que está íntimamente ligado a la buena marcha de la web semántica.

 
Nos encontramos ya en la era de los Zettabytes (Otras Fuentes)

Pero despegar todo el potencial de la web semántica es un trabajo arduo y complejo cuyo éxito depende en gran medida de varios factores, entre otros, los avances en el desarrollo de herramientas como los anotadores semiautomáticos y aplicaciones en Procesamiento de Lenguaje Natural, una disciplina englobada dentro del campo de la Inteligencia Artificial.

El PLN trabaja para hacer comprender a las computadoras y los sistemas el lenguaje que hablamos los humanos, porque las máquinas en la actualidad no disponen de la capacidad para entender lo que decimos. Se trata de una tarea aún no resuelta a nivel computacional: los sistemas pueden dominar la sintaxis de una lengua, pero no su significado conceptual. Esto se debe a la complejidad que de la propia lengua. Por ese motivo se nos escapa una sonrisa cuando ciertas aplicaciones como los asistentes de voz no nos comprenden o transcriben erróneamente lo que decimos.

Algunos Data Scientists señalan que la inteligencia artificial ha tenido cierto nivel de éxito en todo aquello que tiene que ver con la lógica, no así con respecto al procesamiento del lenguaje humano.

Ese es precisamente el objetivo de la web semántica: dotar de significado a los datos. Es decir, si buscáramos respuestas a preguntas como: ¿Qué ciudad es más grande, Tokio o Bangkok? obtendríamos una respuesta clara y precisa, al contrario del enfoque actual donde el usuario tiene que: 1) buscar los habitantes de Tokio; 2) Discriminar y elegir una fuente fidedigna; 3) Anotar el resultado; 4) 5) 6) realizar los mismos pasos para Bangkok; 7) comparar resultados.

Con la web semántica esto no ocurriría. El sistema sería capaz de realizar estas operaciones por sí mismo; extraería el dato de fuentes fidedignas, incluso aquellas que estuvieran en un idioma diferente. Por este motivo Berner-Lee aboga por el Open Data, ya que es necesario que los datos estén disponibles para que esta magia ocurra. Afortunadamente cada vez hay más instituciones que permiten el acceso a los mismos - por ejemplo en España http://datos.gob.es- .

La web semántica permite dotar de significado a los datos

Pero antes de que todo esto sea posible, hay que afrontar uno de los mayores retos de la web semántica: el traslado unificado de la base conceptual del mundo que nos rodea. Es decir, estandarizar, independientemente de la lengua, todo el conocimiento universal que aglutina la ‘www’.

Ante este reto surge la siguiente pregunta: ¿Cómo y quién se va a encargar de esta inmensa tarea? Parece que, por el momento, necesitaremos inteligencia y esfuerzo colectivo para llevarlo a cabo, y ya se están incentivando ciertos estímulos para los más ‘adelantados de la clase’. De no ser así, y con la cantidad de información que se espera en los próximos cinco años, tal vez empecemos a preguntarnos sobre la calidad de las respuestas ofrecidas por los buscadores y estos últimos sobre sus modelos de negocio.

De tener éxito creando este complejo sistema, tal vez tendríamos que empezar a plantearnos muy seriamente la pregunta más famosa de Alan Turing: Can Machines Think? (¿Pueden pensar las máquinas?).

No hay comentarios.:

Publicar un comentario

Las mujeres y las luchas por sus derechos

Las mujeres y las luchas por sus derechos José Antonio Robledo y Meza   Durante el sexenio de Andrés Manuel López Obrador, la Cámara de Dipu...