2022(e)ko urtarrilaren 4(a), asteartea

La historia de los cien ceros

 La historia de los cien ceros

Chrome, Gmail, Android, Maps, Calendar, Youtube… En la actualidad todo ser que tenga un mínimo de relación con la tecnología está obligado a conocer estos conceptos. Y… ¿Qué tienen en común todo ellos? Pues que todos forman parte del gran entramado de Google. Como algunas historias tecnológicas, comienza con un par de estudiantes que tienen una idea alocada que no consiguen vender a un precio irrisorio para multiplicar su valor en unos pocos años.

En el año 1996 Larry Page y Sergey Brin, ambos estudiantes de la universidad de Standford, comenzaron a trabajar con el objetivo de conseguir la información más relevante dentro de una gran cantidad de datos mediante un algoritmo. Un año después, intentaron vender el algoritmo a Yahoo, que era el principal buscador de la época, pero no tuvieron suerte. Un lustro después fue Yahoo quien intentó comprar Google por 3.000 millones de dólares, pero era demasiado tarde.

El nombre de Google proviene de un juego de palabras con el término “googol”, que se utiliza para hacer referencia al número 1 seguido de 100 ceros (10100). El 4 de septiembre de 1998 se fundó Google y unos meses después registraron lo que sería su algoritmo estrella, el PageRank. Aunque a día de hoy la actividad de Google no esté estrechamente relacionada con este algoritmo, en sus inicios supuso una auténtica revolución y fue clave en el éxito de la compañía.

PageRank, que coge el nombre del apellido de su creador Larry Page, es un sencillo algoritmo que permite ordenar por relevancia una serie de páginas web relacionadas con la búsqueda realizada. En realidad el algoritmo no tiene nada de sencillo y podríamos decir que su principal función es el posicionamiento de las páginas útiles, es decir, crear un ranking de las páginas relacionadas donde las más relevantes se encuentren en la parte superior de la búsqueda.

A continuación intentaremos explicar brevemente el funcionamiento de este algoritmo.

Como hemos dicho, el objetivo de PageRank es crear un ranking de páginas web en base a su relevancia y el algoritmo genera ese ranking en base al número de conexiones que tiene esa página web con el resto de páginas y viceversa. Vemos un ejemplo simplificado.

Del diagrama podemos determinar lo siguiente.

La página 1 enlaza con todas las páginas.

La página 2 enlaza con las páginas 3 y 4.

La página 3 enlaza sólo con la página 1.

La página 4 enlaza con las páginas 1 y 3.

Si asumimos que en un inicio todas las páginas tiene el mismo valor, supongamos 1, el valor de la página se divide entre el número de páginas a las que enlaza.

Es decir:



Con ello obtenemos que el valor de las páginas es el siguiente:

Página 1: 3/2

Página 2: 1/2

Página 3: 4/3

Página 4: 5/6

La suma de todas esas relevancias es 4, igual al número de páginas del ejemplo. Ahora sabemos que la página más relevante es la 1 por lo que cuando repetimos el proceso partimos de que todas las páginas no tiene la misma relevancia. Este proceso se repite una y otra vez hasta estabilizar el proceso y determinar cuáles son las páginas más relevantes.

Evidentemente este es un ejemplo muy simplificado ya que en la realidad nos encontramos con miles de millones de páginas en las que unas no tienen ningún tipo de enlace o en las que hay diferentes páginas que no se relacionan con páginas fuera de un grupo determinado. Además, y como todos habremos podido comprobar en nuestras búsquedas, el funcionamiento actual de Google no se limita a este algoritmo.

Existen otras características, según la propia Google, que facilitan y optimizan nuestras búsquedas como son: análisis de términos de búsqueda, búsqueda de coincidencias, personalización de los resultados y análisis de la calidad de los resultados. Podríamos decir que estas características aprenden de nosotros y facilitan la optimización e búsquedas. Por ello, si realizáramos la misma búsqueda desde dos cuentas diferentes de Google los resultados que obtendríamos serían diferentes, a pesar de estar jugando con el mismo algoritmo.

 Estas son herramientas que tiene la propia empresa para posicionar ciertas páginas en la parte superior para favorecerla o eliminarla de las primeras páginas para perjudicarla. Hoy en día Google tiene la capacidad de eliminar de las primeras páginas de su buscador ciertas web, o colocarlas en las primeras posiciones, con todo lo que ello supone. A día de hoy difícilmente acudimos a la segunda página del buscador, ya que lo realmente “importante” se encuentra siempre en primera plana, o eso nos hace creer Google.

La historia de los cien ceros que intentaron vender un par de estudiantes por un millón de dólares sabe más de nosotros que nuestros familiares más cercanos. Gracias a un algoritmo matemático, nos dice que es lo que realmente es importante para nosotros y nos desprende de webs innecesarias. Nunca desprecies el valor de las matemáticas, ya que estas también pueden cambiar el mundo.


Enlaces relacionados:

-PageRank y el surfista aleatorio

-Platzi, historia de Google

-Derivando, PageRank

iruzkinik ez:

Argitaratu iruzkina

EN DEUDA CON LA TIERRA

EN DEUDA CON LA TIERRA   El día de la Deuda Ecológica es el día del año en que la humanidad ha agotado el presupuesto de la naturaleza para ...