‘La búsqueda está cambiando’
Así comienza el prólogo del libro de David Amerland ‘Google Semantic Search’. Y es que, si llevas tiempo utilizando Internet, y más concretamente los buscadores, habrás comprobado que tu forma de buscar información ha variado enormemente de hace unos años hasta ahora. Nos encontramos en un momento en el que la búsqueda semántica, aquella capaz de poner en contexto las distintas consultas que hacen los usuarios, se presenta como la opción más precisa a la hora de otorgar respuestas.
Sin embargo, antes de adentrarnos en este nuevo tipo de búsqueda conviene que nos paremos a plantearnos la siguiente pregunta: ¿qué ha motivado nuestro cambio a la hora de buscar?
Nuevos tipos de búsquedas
Sin duda, la amplia gama de dispositivos desde los que podemos realizar nuestras búsquedas representa un factor determinante: PCs, portátiles, smartphones, tablets, TVs, etc. Además, unido a esta variedad nos encontramos también con distintos métodos de introducción, como puede ser teclear una búsqueda en nuestro ordenador o hacer una consulta de voz directamente a aplicaciones como Siri, Sherpa, Cortana o Google Now.
Estos avances han provocado que de búsquedas del tipo ‘restaurantes en manhattan’ hayamos cambiado nuestra forma de buscar a consultas mucho más específicas como ‘dónde comer comida india en manhattan’, o incluso ‘cual es el mejor sitio donde comer comida india en manhattan’. En esta evolución podemos observar dos tendencias: un aumento de las consultas long tail y una mayor exigencia por parte de los usuarios a los buscadores, por lo que estos últimos han tenido que adaptarse para ofrecer resultados más relevantes.
Los buscadores entendieron que no era suficiente identificar simples palabras claves en los distintos documentos de su índice y relacionarlos a cierta búsqueda, sino que debían entender de qué manera estaban relacionados los datos que contenían estos documentos, tanto con el resto de datos dentro de los mismos como con otros documentos. Es a partir de aquí cuando se produce el cambio más importante dentro del panorama de las búsquedas: una progresión desde las omnipresentes keywords hasta las cada vez más importantes entidades. Las palabras dejan de ser simples palabras para convertirse en conceptos, y los buscadores evolucionan de motores de búsquedas a auténticas máquinas de aprendizaje.
Esta evolución conjunta da lugar a lo que ahora conocemos como búsqueda semántica.
¿Qué es la búsqueda semántica?
Por establecer una definición vamos a recurrir a la Wikipedia (eh, que Google también lo hace):
Semantic search seeks to improve search accuracy by understanding searcher intent and the contextual meaning of terms as they appear in the searchable dataspace, whether on the Web or within a closed system, to generate more relevant results.
Y también la definición que ofrece la Techopedia:
Semantic search is a data searching technique in a which a search query aims to not only find keywords, but to determine the intent and contextual meaning of the words a person is using for search.
Conviene parar en dos conceptos importantes: intención y contexto.
La intención, que proviene del usuario, es la que establece de manera explícita aquello que está buscando este. Y el contexto podríamos entenderlo como todo lo que rodea a una búsqueda y hace que esta vaya en un sentido u otro, es decir, es lo que la dota de un significado. Así, entendiendo y uniendo intención más contexto los buscadores son capaces de comprender las búsquedas, tanto lo que las motiva como lo que se espera de ellas.
La llegada del colibrí
En verano de 2013 Google anunció una nueva actualización de su algoritmo: Hummingbird. En esta ocasión, a diferencia de Panda o Penguin, se trataba de una absoluta reescritura del algoritmo orientada a presentar los resultados de una manera completamente distinta a como lo había hecho hasta ahora.
Google había modificado su famoso algoritmo para que este se centrase en la fase de comprensión de las búsquedas, de modo que facilitara las siguientes fases del proceso, al limitar el número de documentos de su índice que debían ser consultados con el objetivo de mostrar los mejores resultados posibles.
Este refuerzo de la fase de compresión significa que Google comienza a prestar una mayor atención al contexto en el que se realiza una búsqueda y en el que los conceptos aparecen en los documentos y se relacionan entre ellos. Pero, ¿cómo lo hace? Pues gracias a la semántica.
Ya hemos comentado que las palabras dejan de ser conjuntos de letras unidas en un todo y pasan a convertirse en conceptos. Esto quiere decir que lo que antes era una unidad individual ahora lleva asociada toda una serie de connotaciones que le dan un sentido concreto. Y esto se hace gracias a un proceso de desambiguación. De nuevo, acudimos a la Wikipedia para definir este término:
In computational linguistics, word-sense disambiguation (WSD) is an open problem of natural language processing and ontology, which governs the process of identifying which sense of a word (i.e. meaning) is used in a sentence, when the word has multiple meanings.
Desambiguar un término consiste en diferenciar claramente sus distintos significados, es decir, buscar los distintos contextos en los que puede ser utilizado.
Búsqueda semántica en funcionamiento
Para poder comprender de una forma más visual cómo funciona la búsqueda semántica vamos a hacer uso de un ejemplo.
Si hacemos una búsqueda de ‘panda’, sin especificar nada más, podríamos pensar que nos estamos refiriendo a la especie de oso originaria de China, a una de las actualizaciones del algoritmo de Google o incluso a un antivirus informático. Viendo la página de resultados podemos comprobar que, en primera instancia, a Google no le queda claro qué es lo que estamos buscando:
Google, como primera opción, entiende que lo que el usuario busca es información sobre el oso panda, lo cual tiene mucha lógica, puesto que de todas las posibles variantes de ‘panda’ que nos podemos encontrar, la referente al animal es la que primero existió y, por tanto, la que da nombre a todo el resto de resultados que aparecen. Sin embargo, la variedad de resultados es un claro ejemplo de que es necesario afinar un poco más la búsqueda. De hecho, si prestamos atención a las búsquedas relacionadas ofrecidas al final de la página queda claro que el campo de opciones es bastante amplio:
Resulta además curioso el modo en que funcionan las sugerencias de Google:
El buscador nos ofrece como primera opción la web de una cadena de restaurantes de comida china. Esto es particularmente llamativo en mi caso, ya que al vivir en España no suelo hacer búsquedas en google.com, por lo que este resultado no tiene nada que ver con cualquier tipo de búsqueda anterior por mi parte. Cosas de Google.
Podríamos afirmar que ante una falta de contexto Google ofrece varias posibilidades al usuario, de modo que el siguiente paso por parte de este sea tener que elegir sobre qué tipo de ‘panda’ quiere seguir obteniendo información.
Si ahora afrontamos la búsqueda escribiendo en la caja del buscador ‘panda diet’ está claro que Google sabrá perfectamente devolvernos resultados en los que se especifique la dieta de este animal (aunque quien sabe, a lo mejor nos sorprende algún día con un listado de páginas sancionadas por poseer contenidos pobres o duplicados). Lo que encontramos es lo siguiente:
En esta ocasión Google responde directamente a nuestra consulta, ofreciendo una de las tarjetas de su Knowledge Base, extrayendo la información de la ficha del oso panda perteneciente a la web del Parque Zoológico Nacional Smithsoniano. Sobre cómo Google responde de forma directa a las consultas de los usuarios recomiendo la lectura de este artículo de Dean Cruddace.
Vemos que esto es un paso más allá del Knowledge Graph, donde Google anticipaba parte de la información a partir de fuentes de conocimiento como Wikipedia.
Si atendemos en esta ocasión a las búsquedas relacionadas podemos comprender que Google ha entendido mucho mejor la consulta realizada por el usuario:
En esta ocasión, las sugerencias de Google van mucho más en consonancia con la búsqueda realizada:
En la primera búsqueda Google está tratando con un término de búsqueda, pero con varias entidades. De hecho, si entramos en Freebase (otra de las fuentes de conocimiento de las que se nutre Google para entender mejor la web) y buscamos ‘panda’, la base de datos nos devolverá 220 resultados.
Sin embargo, en el segundo caso el término está mucho más definido gracias a que le estamos dando un contexto, por lo que podríamos afirmar que constituye por sí mismo una entidad. No tendría sentido que ante la palabra ‘alimentación’ como parte de mi criterio de búsqueda, el buscador me devolviera resultados de un antivirus.
Criterio de búsqueda | Entidad |
panda | panda (oso) |
panda (antivirus) | |
panda (google update) | |
panda (restaurantes) | |
etc | |
panda diet | panda diet |
Entidades de búsqueda
Para buscar, encontrar y mostrar los resultados más relevantes, Google se ayuda de lo que denomina entidades de búsqueda. Resumiendo mucho, se trata de un procedimiento por el cual a partir de las búsquedas realizadas por los usuarios se establecen una serie de relaciones entre ellas que ayudan a establecer la importancia de los distintos documentos y, por tanto, influyen en la posición en la que son mostrados. Para poder ampliar la información sobre las entidades de búsqueda recomiendo la lectura de este fantástico artículo de Bill Slawski donde explica en qué consisten.
A la hora de establecer el contexto en el que se produce una consulta, Google tiene en cuenta una serie de factores como pueden ser:
- Historial de búsquedas del usuario.
- Ubicación del usuario. En función de la localización del usuario, el buscador es capaz de discernir qué resultados son más apropiados para él. Junto con el punto anterior vemos que hace acto de presencia la personalización de resultados.
- Historial global de búsquedas. Búsquedas que se realizan consecutivamente o cercanas en el tiempo asociadas a otra búsqueda.
- Relaciones entre con juntos de datos previamente almacenados (llámense términos o entidades)
- Ciertas características de las consultas: ortografía, variaciones, etc.
- Dominios enlazados desde documentos que comparten la misma temática.
- Co-ocurrencia de términos y distancia entre ellos.
- etc.
¿Por qué debo prestar atención a la búsqueda semántica?
La misión de Google es organizar la información del mundo y hacerla accesible y útil de forma universal.
Esto es lo que podemos leer al principio de la página que Google dedica a explicar más a fondo la compañía. En esta labor de organizar la información se hace fundamental encontrar mecanismos por los que entender de la manera más precisa los contenidos existentes.
Como hemos dicho anteriormente, los motores de búsqueda se están convirtiendo en auténticas máquinas de aprendizaje, por lo que si queremos que nuestras páginas sean entendidas por los buscadores de la forma más parecida a como lo hace un humano debemos facilitar esa labor a los buscadores.
Intervienen aquí muchos componentes que pueden ayudarnos a conseguir nuestro objetivo, pero como alternativa más relevante resaltaremos el marcado semántico de nuestros contenidos.
Google, Bing, Yahoo! y Yandex decidieron aunar fuerzas para elaborar un vocabulario mediante el que implementar el marcado HTML de las páginas web. El resultado fue Schema.org, donde podemos encontrar la referencia necesaria para marcar semánticamente nuestros contenidos de un modo adecuado.
En dicha web nos encontramos la siguiente afirmación:
On-page markup enables search engines to understand the information on web pages and provide richer search results in order to make it easier for users to find relevant information on the web.
Como podemos ver, mediante este marcado semántico estamos contribuyendo a que las SERPs ofrezcan resultados más relevantes para el usuario, a la vez que propiciamos que dichos resultados puedan ir acompañados de información adicional, los famosos rich snippets.
¿Cómo sacar el máximo provecho a la búsqueda semántica?
A continuación voy a dar una serie de consejos para que los buscadores entiendan mejor los contenidos de nuestras páginas, con lo que ayudaremos a que estas ganen en relevancia.
Crea un contexto
Cuando te dispongas a crear un nuevo contenido plantéate de qué forma tienes que exponer la información para que ésta sea facil de ubicar en el imaginario del usuario. Si conseguimos que el usuario entienda fácilmente nuestro contenido, tendremos mucho ganado a la hora de que los buscadores lo hagan también.
Co-ocurrencia
Cuando hablamos o leemos sobre un término concreto, usualmente este va acompañado de otra serie de palabras que ayudan también a contextualizar su significado. Por seguir el ejemplo anterior, si un contenido habla del oso panda lo lógico es que en el texto encontremos también las palabras ‘bambú’, ‘China’, ‘animal’, ‘mamífero’, etc.
Si somos capaces de identificar todas estas palabras ‘acompañantes’ y las incluimos en nuestro texto, estaremos haciendo uso de señales inequívocas para los buscadores sobre la temática de nuestro contenido.
Utiliza sinónimos y variantes
Además de enriquecer nuestro texto y hacerlo mucho más legible al no repetir demasiadas veces nuestra keyword, estaremos ayudando a los buscadores en dos tareas que ya hemos visto que son muy importantes:
- Por un lado identificar otra serie de términos que guardan relación directa con la temática de nuestro contenido.
- Y por otro a construir un contexto mucho más rico que el que los buscadores encontrarían si estas variantes no estuvieran.
Plantea la investigación de palabras claves semánticamente
Las palabras claves son todavía muy importantes, por eso debemos seguir buscando aquellas que más beneficio nos ofrezcan. Ante la búsqueda semántica se nos plantea la necesidad de saber cómo encontrar esas keywords rentables que además beneficien al contexto de nuestra página web.
Sujan Patel escribió un artículo muy recomendable sobre este tema.
Enlaza a fuentes relevantes
Cuando enlaces a páginas externas procura que los contenido de estas tengan tanta o más calidad que el tuyo propio. Estarás reforzando las relaciones entre documentos además de aportar aún más valor a tus usuarios.
Comparte en redes sociales
Como ya sabemos los contenidos de calidad son capaces de atraer la atención de los usuarios y harán que estos estén predispuestos a compartirlos con sus contactos. Además, para ciertas redes sociales también tenemos la posibilidad de marcar nuestros contenidos con metadatos de modo que mejoremos la forma en que se se visualizan.
- Facebook: OpenGraph
- Twitter: Twitter Cards
- Pinterest: Rich Pins
Haz uso de las herramientas
Existen multitud de herramientas y recursos que nos ayudan a que nuestros contenidos posean un mayor valor semántico. Entre ellas:
- Schema.org
- Google Structured Data Testing Tool
- Yandex Cheker
- Structured Data Linter
- Schema Creator
- AlchemyAPI
- Text Razor
- Gruff
- Semaphore
Y por supuesto muchas más. En este artículo de Barbara Starr encontramos una gran selección.
Reflexión final
No cabe duda que el panorama de las búsquedas está cambiando hacia un lenguaje más natural y espontáneo. Aunque conservan su importancia, las keywords ya no son lo que eran. En el momento actual, cuando de nuestra web y, por tanto, de nuestros servicios y/o productos se trata, necesitamos poseer una visión mucho más amplia de nuestro sector.
Conocer el lenguaje que se utiliza en el mundo en que nos movemos resulta crucial para poder ofrecer tanto a los usuarios como a los motores de búsqueda contenidos que posean la suficiente relevancia como para que podamos destacar entre nuestra competencia.
La web semántica es nuestra gran aliada en esta tarea. Afortunadamente tenemos a nuestra disposición una serie de herramientas para poder sacar el máximo partido a nuestros contenidos. ¿Nos podemos permitir no sacar provecho de ellas? Yo creo que no.
Semantic search is the new black.
Esta entrada se publicó primero en inglés en SEJ
Teresa says
Me parece un artículo excelente, Fernando. Sí que es verdad que con tanta información se hace necesario hacer búsquedas cada vez más detalladas, de aquí que cada vez adquiera más protagonismo el SEO semántico.
Lo dicho, un gran artículo.