Archivo de junio de 2009
Como agregar el url de nuestro sitio web en los buscadores principales
Enviar contenido a Yahoo: visitar el siguiente enlace
http://siteexplorer.search.yahoo.com/es/free/submit
Aquí se puede enviar el URL del sitio web o del feed
Enviar contenido a Google
Para agregarlo a Google: visitar el siguiente enlace
http://www.google.com/intl/es/submit_content.html
Introducir el URL completa, incluido el prefijo http://www.misitioweb.com/
Para que google diferencie entre los sitios que han enviado los usuarios y los que se han introducido de forma automática a través de algún software, escribir en el campo correspondiente las letras torcidas que aparecen en el cuadro.
Hacer clic en añadir url
Verificación del sitio web:
Hay dos maneras de verificar el sitio web, para demostrar que es el propietario de un sitio web, puede añadir una meta-etiqueta a su página principal (demostrará que tiene acceso a los archivos originales) o subir un archivo HTML a su servidor con el nombre que desee (demostrará que tiene acceso al servidor)
1. Cuando google te pase la etiqueta de verificación del tipo: google5234626gh246246246246.html
Sólo debes crear con tu bloc de notas el archivo con el siguiente nombre: google5234626gh246246246246.html (sin contenido dentro).
Posteriormente lo subes a la carpeta de tu sitio (dentro del directorio PUBLIC)
2. Agregar una meta etiqueta. esta se debe agregar entre de las etiquetas <header></header> de nuetra página web
Enviar contenido al buscador Bing:
visitar el enlace e ingresar iniciando sesión (email contraseña de msn)
http://www.bing.com/webmaster/
dar clic en el boton add site y llenar los campos
Web address: url del sitio web
Sitemap address: ubicación del sitemap www.misitioweb.com/sitemap.xml
Webmaster e-mail: email de contacto
Comercial Asimo

Honda asimo timeline
Sobre el uso de robots.txt
Hacer accesible a los robots de los buscadores por medio del archivo robots.txt, que es simplemente un archivo de texto como sugiere su extensión. Se crea usando un simple editor de texto como Notepad o WordPad.
Utilice el archivo robots.txt en su servidor web. Este archivo indica a los rastreadores qué directorios se pueden rastrear.
El siguiente archivo robots.txt bloquea el rastreo de contenido en todos los motores de búsqueda :
User-agent: *
Disallow: /
No hay ninguna ruta, después de “Disallow:” lo que significa que se permite el rastreo a todos.
User-agent: *
Disallow:
El User-Agent es el nombre del spider del buscador y Disallow es el nombre del archivo que no quieres que indexe el spider
User-Agent: (Spider Name)
Disallow: (File Name)
Hay que hacer un nuevo bloque de código para cada buscador, pero si quieres multiplicar la lista de archivos no permitidos puedes ponerlos uno debajo de otro.
Por ejemplo -
User-Agent: Googlebot
Disallow: ejemplopaginano accesiblearobots.html
Disallow: paginano accesiblearobots.html
Disallow: paginano accesiblearobots.html
Disallow: paginano accesiblearobots.html
Google es quien decide la descripción de un elemento para una determinada búsqueda y lo decide en función de la relevancia
Para probar el archivo robots.txt de un sitio, siga estos pasos:
1. En la página principal de Herramientas para webmasters de Google, haga clic en el sitio del que desee probar el archivo robots.txt.
2. En Información del sitio, haga clic en Acceso de rastreadores.
3. Si aún no se ha seleccionado, haga clic en la pestaña Probar robots.txt.
4. Copie el contenido del archivo robots.txt y péguelo en el primer cuadro.
5. En el cuadro URL, indique el sitio en el que quiera probar el archivo.
6. En la lista User-agents, seleccione los user-agents que desee.