El
desarrollo de la web semántica será importante para estructurar y
dar significado a los datos para que puedan ser útiles para las
personas y las computadoras.
La
importancia de la web semántica (Otras Fuentes)
Sonia
Pacheco Moreno, profesora de The Valley DBS
21/10/2016
13:48 Actualizado
a18/09/2017 17:33
Hoy
casi todo está en Internet. El problema radica en buscar la
información correctamente y, lo que es más complicado, encontrar lo
que uno busca de manera precisa.
Disponemos
de millones y millones de webs, si bien un 75% están inactivas.
Tantas, que si medimos el tamaño de la ‘www’ por el tráfico
online generado, ya estaríamos inmersos en la era Zettabyte (un
zettayte=1021 bytes) según Cisco y su Visual Networking Index. La
cifra equivale aproximadamente a unos 36.000 años de vídeo en alta
resolución.
Más de 336 millones de
dominios se han dado de alta en el último trimestre en todo el
mundo. Aunque parezca mucho, solo estamos en el inicio: en España,
por ejemplo, el ratio de registro de dominio (.es) por habitante es
de 23 por cada 1.000. En uno de los países más activos en este
ámbito, Alemania, cuenta con un ratio de hasta 190 por cada 1.000
habitantes, lo que da cuenta de que hay mucho más recorrido con webs
y aplicaciones que están por llegar. Nunca la humanidad tuvo a su
alcance tanta información con tan fácil acceso.
La cifra En
los últimos tres meses se han dado de alta 336 millones de dominios.
Un millón y medio por hora.
A todo esto hay que añadir
que cualquier persona, independientemente de su edad, con o sin
formación, puede crear contenidos y volcarlos en la red en pocos
segundos, sobre todo desde la aparición de los smartphone. Esta
facilidad se traduce en millones de personas generando contenido a
diario: un 29% de la población dispone de cuenta en alguna red
social, empleando en ellas un tiempo de 2,4 horas al día.
Los humanos le damos
significado a toda la información que hay en la red (exdez)
Sin embargo, para la web
actual, toda la información existente carece de significado. Las
máquinas no entienden su sentido, salvo que el humano detrás de la
pantalla pueda dárselo. La ‘www’ fue concebida de manera que
unas webs enlazaban con otras webs, pero los enlaces, desde el punto
de vista del sistema, necesitan que los humanos les doten de
significado (una web no sabe que el link pertenece a la home de otra
web o al enlace de una cuenta de social media, o a un fichero pdf).
Puede sorprender que, habiendo
creado sistemas complejos de computación, aún hoy mucha parte del
trabajo lo debamos realizar las personas. En el caso de las búsquedas
y tratamiento de la información en Internet, son los usuarios los
que deben extraer la información, contextualizarla, resumirla,
interpretarla y organizarla.
Las máquinas no entienden el
significado de la información, a no ser que el humano pueda dársela”
Pongamos un ejemplo: si
alguien busca un hotel en una zona específica donde alojarse en
Londres, y pregunta en un buscador genérico ‘¿Dónde alojarse en
La City?’, las cientos de miles de respuestas no responderán a
esta pregunta concreta. ¿El motivo? El buscador no entiende la
pregunta ni tampoco los términos de la misma. Es el usuario quien
debe navegar resultado por resultado para comprobar que la
información de cada uno de los enlaces puede resultar la adecuada a
su búsqueda.
Parece que hemos diseñado
estos sistemas complejos de computación solo para presentar la
información de manera muy veloz, pero no para llevar a cabo esas
labores de las cuales nos encargamos en la actualidad y consumen
mucho de nuestro tiempo. Todo indica que en algunos aspectos no
aprovechamos de manera óptima las posibilidades que ofrecen Internet
y nuestros dispositivos.
¿Podemos
hacer que esto cambie?
La
web semántica, sí. Da significado y estructura los datos para que
puedan ser útiles para las personas y también para las máquinas;
para que puedan elaborar información de utilidad sin que los
usuarios tengan que malgastar tiempo y esfuerzo. Así se conseguirá
un nivel de automatización tal que ayude a los usuarios a realizar
con eficacia y eficiencia las tareas de búsqueda, interpretación o
clasificación de la información, entre otras. Esto va a permitir el
desarrollo de aplicaciones, programas y agentes, redefiniendo con una
alta probabilidad la relación hombre-máquina que hoy en día
conocemos y abriendo, por tanto, nuevos usos y formas relación
máquina-máquina, las cuales podrán generar conocimiento de manera
autónoma.
El mayor impulsor de la web
semántica es Tim Berners-Lee, padre de la ‘www’. El británico
ya se refería a esta web semántica, en 2001, de la siguiente
manera: “No es una web independiente sino una extensión de la
actual, en la que se da información de significado bien definido,
que puede permitir que ordenadores y las personas trabajen en
cooperación”. El mismo indicaba que “la Web se ha desarrollado
rápidamente como un medio de documentos para las personas más que
un lugar para que los datos y la información pueda ser procesada de
forma automática.
Cinco años después,
Berners-Lee presentó el concepto Linked Data: no vale dar
significado a los conceptos, hay que enlazarlos unos con otros. Todo
esto le lleva a ser un firme defensor del Open Data que está
íntimamente ligado a la buena marcha de la web semántica.
Nos
encontramos ya en la era de los Zettabytes (Otras Fuentes)
Pero
despegar todo el potencial de la web semántica es un trabajo arduo y
complejo cuyo éxito depende en gran medida de varios factores, entre
otros, los avances en el desarrollo de herramientas como los
anotadores semiautomáticos y aplicaciones en Procesamiento de
Lenguaje Natural, una disciplina englobada dentro del campo de la
Inteligencia Artificial.
El PLN trabaja para hacer
comprender a las computadoras y los sistemas el lenguaje que hablamos
los humanos, porque las máquinas en la actualidad no disponen de la
capacidad para entender lo que decimos. Se trata de una tarea aún no
resuelta a nivel computacional: los sistemas pueden dominar la
sintaxis de una lengua, pero no su significado conceptual. Esto se
debe a la complejidad que de la propia lengua. Por ese motivo se nos
escapa una sonrisa cuando ciertas aplicaciones como los asistentes de
voz no nos comprenden o transcriben erróneamente lo que decimos.
Algunos Data Scientists
señalan que la inteligencia artificial ha tenido cierto nivel de
éxito en todo aquello que tiene que ver con la lógica, no así con
respecto al procesamiento del lenguaje humano.
Ese es precisamente el
objetivo de la web semántica: dotar de significado a los datos. Es
decir, si buscáramos respuestas a preguntas como: ¿Qué ciudad es
más grande, Tokio o Bangkok? obtendríamos una respuesta clara y
precisa, al contrario del enfoque actual donde el usuario tiene que:
1) buscar los habitantes de Tokio; 2) Discriminar y elegir una fuente
fidedigna; 3) Anotar el resultado; 4) 5) 6) realizar los mismos pasos
para Bangkok; 7) comparar resultados.
Con la web semántica esto no
ocurriría. El sistema sería capaz de realizar estas operaciones por
sí mismo; extraería el dato de fuentes fidedignas, incluso aquellas
que estuvieran en un idioma diferente. Por este motivo Berner-Lee
aboga por el Open Data, ya que es necesario que los datos estén
disponibles para que esta magia ocurra. Afortunadamente cada vez hay
más instituciones que permiten el acceso a los mismos - por ejemplo
en España http://datos.gob.es- .
La
web semántica permite dotar de significado a los datos
Pero
antes de que todo esto sea posible, hay que afrontar uno de los
mayores retos de la web semántica: el traslado unificado de la base
conceptual del mundo que nos rodea. Es decir, estandarizar,
independientemente de la lengua, todo el conocimiento universal que
aglutina la ‘www’.
Ante este reto surge la
siguiente pregunta: ¿Cómo y quién se va a encargar de esta inmensa
tarea? Parece que, por el momento, necesitaremos inteligencia y
esfuerzo colectivo para llevarlo a cabo, y ya se están incentivando
ciertos estímulos para los más ‘adelantados de la clase’. De no
ser así, y con la cantidad de información que se espera en los
próximos cinco años, tal vez empecemos a preguntarnos sobre la
calidad de las respuestas ofrecidas por los buscadores y estos
últimos sobre sus modelos de negocio.
De tener éxito creando este
complejo sistema, tal vez tendríamos que empezar a plantearnos muy
seriamente la pregunta más famosa de Alan Turing: Can Machines
Think? (¿Pueden pensar las máquinas?).
Texto
ofrecido por: The
Valley Digital Business School
No hay comentarios.:
Publicar un comentario