La historia de los cien ceros
Chrome, Gmail, Android, Maps, Calendar, Youtube… En la actualidad todo ser
que tenga un mínimo de relación con la tecnología está obligado a conocer estos
conceptos. Y… ¿Qué tienen en común todo ellos? Pues que todos forman parte del
gran entramado de Google. Como algunas historias tecnológicas,
comienza con un par de estudiantes que tienen una idea alocada que no consiguen
vender a un precio irrisorio para multiplicar su valor en unos pocos años.
En el año 1996 Larry Page y Sergey Brin, ambos estudiantes de la
universidad de Standford, comenzaron a trabajar con el objetivo de conseguir la
información más relevante dentro de una gran cantidad de datos mediante un
algoritmo. Un año después, intentaron vender el algoritmo a Yahoo, que era el
principal buscador de la época, pero no tuvieron suerte. Un lustro después fue
Yahoo quien intentó comprar Google por 3.000 millones de dólares, pero era
demasiado tarde.
El nombre de Google proviene de un juego de palabras con el término “googol”,
que se utiliza para hacer referencia al número 1 seguido de 100 ceros (10100).
El 4 de septiembre de 1998 se fundó Google y unos meses después registraron lo
que sería su algoritmo estrella, el PageRank. Aunque a día de hoy la actividad
de Google no esté estrechamente relacionada con este algoritmo, en sus inicios
supuso una auténtica revolución y fue clave en el éxito de la compañía.
PageRank, que coge el nombre del apellido de su creador Larry Page, es un
sencillo algoritmo que permite ordenar por relevancia una serie de páginas web
relacionadas con la búsqueda realizada. En realidad el algoritmo no tiene nada
de sencillo y podríamos decir que su principal función es el posicionamiento de
las páginas útiles, es decir, crear un ranking de las páginas relacionadas
donde las más relevantes se encuentren en la parte superior de la búsqueda.
A continuación intentaremos explicar brevemente el funcionamiento de este
algoritmo.
Como hemos dicho, el objetivo de PageRank es crear un ranking de páginas
web en base a su relevancia y el algoritmo genera ese ranking en base al número
de conexiones que tiene esa página web con el resto de páginas y viceversa.
Vemos un ejemplo simplificado.
Del diagrama podemos determinar lo siguiente.
La página 1 enlaza con todas las
páginas.
La página 2 enlaza con las
páginas 3 y 4.
La página 3 enlaza sólo con la
página 1.
La página 4 enlaza con las
páginas 1 y 3.
Si asumimos que en un inicio todas las páginas tiene el mismo valor, supongamos 1, el valor de la página se divide entre el número de páginas a las que enlaza.
Es
decir:
Con ello obtenemos que el valor de las páginas es el siguiente:
Página 1: 3/2
Página 2: 1/2
Página 3: 4/3
Página 4: 5/6
La suma de todas esas relevancias es 4, igual al número de páginas del
ejemplo. Ahora sabemos que la página más relevante es la 1 por lo que cuando
repetimos el proceso partimos de que todas las páginas no tiene la misma
relevancia. Este proceso se repite una y otra vez hasta estabilizar el proceso
y determinar cuáles son las páginas más relevantes.
Evidentemente este es un ejemplo muy simplificado ya que en la realidad nos
encontramos con miles de millones de páginas en las que unas no tienen ningún
tipo de enlace o en las que hay diferentes páginas que no se relacionan con
páginas fuera de un grupo determinado. Además, y como todos habremos podido
comprobar en nuestras búsquedas, el funcionamiento actual de Google no se
limita a este algoritmo.
Existen otras características, según la propia Google, que facilitan y
optimizan nuestras búsquedas como son: análisis de términos de búsqueda,
búsqueda de coincidencias, personalización de los resultados y análisis de la
calidad de los resultados. Podríamos decir que estas características aprenden
de nosotros y facilitan la optimización e búsquedas. Por ello, si realizáramos
la misma búsqueda desde dos cuentas diferentes de Google los resultados que obtendríamos
serían diferentes, a pesar de estar jugando con el mismo algoritmo.
Estas son herramientas que tiene la
propia empresa para posicionar ciertas páginas en la parte superior para
favorecerla o eliminarla de las primeras páginas para perjudicarla. Hoy en día
Google tiene la capacidad de eliminar de las primeras páginas de su buscador
ciertas web, o colocarlas en las primeras posiciones, con todo lo que ello
supone. A día de hoy difícilmente acudimos a la segunda página del buscador, ya
que lo realmente “importante” se encuentra siempre en primera plana, o eso nos
hace creer Google.
La historia de los cien ceros que intentaron vender un par de estudiantes
por un millón de dólares sabe más de nosotros que nuestros familiares más
cercanos. Gracias a un algoritmo matemático, nos dice que es lo que realmente
es importante para nosotros y nos desprende de webs innecesarias. Nunca
desprecies el valor de las matemáticas, ya que estas también pueden cambiar el
mundo.
Enlaces relacionados:
iruzkinik ez:
Argitaratu iruzkina