domingo, 17 de enero de 2010

Las “200″ variables del algoritmo de Google

Hoy, a un día de que finalice la "competición", me he encontrado este artículo. Me hubiera venido bien haberlo descubierto un mes atrás, pero bueno, la verdad es que hay muchos puntos que sí he seguido aún sin saber que eran importantes. Ahí os dejo el artículo:


No hace mucho Matt Cutts (una de las caras visibles de Google y muy seguido por la comunidad SEO) dijo que Google usaba 200 variables en su algoritmo para la evaluación y posterior posicionamiento de una página en las búsquedas. A finales del mes pasado en Search Engine Journal empezaron una lista de esas posibles 200 variables que afectan al posicionamiento.

La lista actualmente ya va para las 130 variables. Como todo en el SEO, no se debe tomar como verdades absolutas ya que siempre están abiertas a discusión (sin ir más lejos en varios puntos hay un interrogante entre paréntesis porque hay poca discusión al respecto).

A continuación la traducción de la lista:

Dominio: 13 factores.
  • Antigüedad del dominio.
  • Tiempo restante para que expire el dominio.
  • Si la información del dueño del nombre del dominio está oculta / anónima.
  • Dominio de primer nivel (enfocado a posicionamiento geográfico por ejemplo los .com versus .co.uk).
  • Dominio de primer nivel (.com versus .info).
  • ¿Subdominio o dominio principal?.
  • Registros anteriores del dominio (con qué frecuencia cambia la IP donde se aloja el sitio).
  • Dueños anteriores del dominio (con qué frecuencia cambia su propietario).
  • Palabras clave en el dominio.
  • IP del dominio.
  • “Vecinos” del dominio.
  • Número de menciones que hacen desde fuera a tu dominio (sin enlazarlo).
  • Opciones de objetivos geográficos (Geo-Targeting) usadas en Google Webmaster Tools.

Del lado del servidor: 2 factores.
  • Localización geográfica del servidor.
  • Fiabilidad / tiempo activo sin caídas (uptime) del servidor.


Arquitectura: 8 factores

  • Estructura de las URL.
  • Estructura del HTML.
  • Estructura semántica.
  • Uso de ficheros JavaScript / CSS externos.
  • Accesibilidad en la estructura del sitio (uso de navegación inaccesible, JavaScript, etcétera).
  • Uso de URLs canonicales.
  • Código HTML “Correcto” (?).
  • Uso de cookies.

Contenido: 14 factores
  • Idioma del contenido.
  • Lo “único” que es el contenido.
  • Cantidad de contenido (texto versus HTML).
  • Densidad de contenido no enlazado (enlaces versus texto).
  • Ratio de contenido únicamente textual (sin enlaces, imágenes, código, etcétera).
  • Contenido estacional / de actualidad (por ejemplo para búsquedas relacionadas a las estaciones del año).
  • Información semántica.
  • Contenido etiquetado para una categoría general (transaccionales, de información, de navegación…).
  • Contenido / Nicho de mercado.
  • Uso de palabras marcadas (”flagged”1).
  • Texto en las imágenes (?).
  • Contenido malicioso (añadido posiblemente por crackers2).
  • Uso desenfrenado de palabras mal escritas, mala ortografía y 10.000 palabras sin puntuación.

Cruce de enlaces interno: 5 factores
  • Número de enlaces internos a una página.
  • Número de enlaces internos a una página con exactamente el mismo texto.
  • Número de enlaces internos a una página desde el contenido (en lugar de usar barras de navegación, menús, etcétera).
  • Número de enlaces usando el atributo “nofollow” (?).
  • Densidad de enlaces internos.

Particularidades del sitio: 7 factores
  • Contenido del fichero robots.txt.
  • Frecuencia general de actualización del sitio.
  • Tamaño general del sitio (número de páginas).
  • Antigüedad del sitio desde la primera vez que lo descubrió Google.
  • XML Sitemap.
  • Contenido detectado que genera “confianza” (Enlaces a información de contacto, política de privacidad, TOS, etcétera).
  • Tipo de sitio (por ejemplo un blog en lugar de un sitio de información).

Particularidades concretas de una página: 9 factores
  • Etiqueta “meta robots” en la página.
  • Antigüedad de esa página.
  • Frescura de la página (frecuencia en que se edita y % del contenido modificado).
  • Contenido repetido en otras páginas del mismo sitio (contenido duplicado.
  • “Legibilidad” del contenido (?).
  • Tiempo de carga de la página (varios factores entran aquí).
  • Tipo de página (página “acerca de” versus una página de contenido principal).
  • Popularidad interna de la página (cantidad de enlaces internos que tiene hacía ella).
  • Popularidad externa (cantidad de enlaces externos relevantes hacía otras páginas de este sitio).

Las palabras clave y su correcto uso: 13 factores
  • En el título de la página.
  • Al principio del título de la página.
  • En las etiquetas “alt”.
  • En el texto de un enlace a una página interna.
  • En el texto de un enlace a una página externa (?).
  • Palabras en negrita o cursiva (?).
  • En el inicio del cuerpo (”body”).
  • En el texto a lo largo del cuerpo.
  • Palabras clave sinónimas usadas y relacionadas a la temática de la página o del sitio.
  • En el nombre del fichero.
  • En la URL.
  • Sin ponerlas de forma “aleatoria” a propósito (poner “keyword” en el dominio, “keyword” en el nombre del fichero, “keyword” como primera palabra en el título, “keyword” como primera palabra de la primera línea de la descripción, “keyword” en las etiquetas, etcétera).
  • El uso (abuso) de palabras clave utilizadas dentro de los comentarios HTML ().

Enlaces salientes: 8 factores
  • Número de enlaces salientes (por dominio).
  • Número de enlaces salientes (por página).
  • Calidad de los sitios a los que enlazas.
  • Enlaces a “malos vecinos”.
  • Relevancia de los enlaces salientes.
  • Enlaces a páginas 404 u otras páginas de error.
  • Enlaces a agencias “SEO” desde el sitio del cliente.
  • Imágenes enlazadas a otros sitios (hotlinking).

Perfil de los enlaces entrantes (de forma general): 21 factores

  • Relevancia del sitio que te enlaza.
  • Relevancia de la página que te enlaza.
  • Calidad del sitio que te enlaza.
  • Calidad de la página que te enlaza.
  • Enlaces entrantes desde redes de sitios.
  • Diversidad de enlaces en el sitio que te enlazan.
  • Diversidad de palabras usadas en el enlace (anchor text).
  • Diferentes IPs de los sitios que te enlazan.
  • Diversidad geográfica.
  • Diferentes TLD dominios de nivel superior (com, es, net, org, etcétera).
  • Diversidad temática y/o actualidad.
  • Diferentes tipos de sitios enlazándote (logs, directorios, etcétera).
  • Diversidad en los lugares donde eres enlazado.
  • Enlaces de autoridad (CNN, BBC, etcétera) por cada enlace entrante.
  • Enlaces de un mal vecino (ausencia / presencia de enlaces marcados de estos sitios).
  • Ratio de enlaces recíprocos (hechos hacía ti y devueltos. Relevante para el perfil general de enlaces entrantes).
  • Ratio de enlaces de sitios sociales (ratio de… versus el perfil general de enlaces entrantes).
  • Patrones y tendencias anormales (como aumentos/disminuciones repentinos/as en el número de enlaces entrantes).
  • Citaciones en la Wikipedia y DMOZ.
  • Registros históricos en el perfil (alguna vez pillado comprando/vendiendo enlaces, etcétera).
  • Enlaces desde sitios sociales de favoritos (como del.icio.us).

Cada enlace entrante de forma independiente: 6 factores

  • Autoridad del TLD (.com versus .gov).
  • Autoridad del dominio que te enlaza.
  • Autoridad de la página que te enlaza
  • Localización del enlace (a pie de página, en el cuerpo, en el menú de navegación…).
  • Texto del enlace (y texto de la etiqueta “alt” en las imágenes enlazadas).
  • El atributo “Title” de un enlace (?).

Perfil del visitante y su comportamiento: 6 factores

  • Número de visitas.
  • Demografía de los visitantes.
  • “Ratio de retención”3.
  • Costumbres de navegación del visitante (que otros sitios tiene costumbre de visitar).
  • Tendencias y patrones del visitante (como por ejemplo aumento repentino de tráfico entrante).
  • Cuán a menudo el visitante hace click en tu sitio en los SERPs.

Penalizaciones, filtros y manipulación: 12 factores

  • Abuso de palabras clave / llenar el texto de ellas.
  • Detección de compra de enlaces.
  • Detección de venta de enlaces.
  • Registros de spam (en comentarios, foros, etcétera).
  • Encubrimiento (Cloaking)4.
  • Texto oculto.
  • Contenido duplicado (duplicación externa).
  • Historial de penalizaciones pasadas de este dominio.
  • Historial de penalizaciones pasadas del propietario.
  • Historial de penalizaciones pasadas para otros sitios del dueño (?).
  • Registros de ataques por parte de crackers2 en el pasado.
  • Redirecciones 301 erróneas: redirecciones dobles, bucles de redirecciones o que terminan en error 404.

Otros: 6 factores

  • Registrar el dominio en Google Webmaster Tools.
  • Presencia del dominio en Google News.
  • Presencia del dominio en Google Blog Search.
  • Dominio usándose en Google Adwords.
  • Dominio usándose en Google Adsense.
  • Nombre comercial / menciones externas a la marca.


Notas de pie de página a la traducción:
  1. En este contexto, se refiere a palabras usadas por lo general en páginas con contenidos “mal vistos” por Google como las páginas para adultos, sitios de citas o de juego.
  2. Otro mal uso de la palabra “hackers”. Sigh…
  3. La traducción más cercana de “bounce rate” es ratio de rebote y tiene algo de sentido si el sitio no es capaz de “retener” al visitante pero he prefiero modificarlo.
  4. Cloaking.



Vía: SIGT.net
Original en inglés y más información: searchenginejournal

lunes, 11 de enero de 2010

El fondo de escritorio de la conchena

o de las conchenas más bien.

Pinchar en la imágen para verlo a tamaño completo

PD: Me hubiera gustado poner otro del galete , pero creo que no hay...