indicizzazione sito

  • Creatore Discussione Creatore Discussione Pizzi80
  • Data di inizio Data di inizio
ok. Ho capito, non mi sono ben chiare due cose però. Seguendo la guida mi dice di inserire www.tuosito.tld, perchè tld?
Seconda cosa sitemaps.xml si riferisce a qualche file del mio sito o devo inserire solo sitemaps.xml scritto così com'è?
 
occhio anche ai contenuti. Siccome è una pizzeria, ci saranno sicuramente tante immagini. Non tralasciare la loro ottimizzazione! :)
ti saranno utili!
 
allora dopo qualche giorno di stop ho ripreso con il sito della pizzeria. Ho fatto la registrazione a strumenti per web master di google e inserito il loro file html e non hanno riscontrato problemi e fin qui tutto semplice. Adesso ho creato la sitemaps.xml del sito ma non riesco a caricarlo. In pratica andando su AGGIUNGI/TESTA SITE MAPS mi chiede l' url della sitemaps preceduta da http://www.pizzeriamajn.it/ ma io il file con la mappa del sito in xml ce l'ho sul desktop . . .devo caricarla nella root?
 
nel frattempo sono andato avanti . . .
potrebbe andare bene un file .text con questo codice

Codice:
User-agent: *
Disallow: 
Disallow: /cgi-bin/
Sitemap: [url]http://www.pizzeriamajn.it/sitemap.xml[/url]

da caricare nella root del sito ?
 
Ultima modifica di un moderatore:
Si da caricare nella root.

Utilizzerei questo robots.txt:
Codice:
User-agent: NetMechanic
Disallow: /

User-agent: Teleport
Disallow: / 

Disallow: /cgi-bin/
Sitemap: http://www.pizzeriamajn.it/sitemap.xml
 
ok, se avessi un altro sito ad esempio pasticceriamajn, per generare un altro robot basterebbe cambiare solo il nome del dominio in questo modo

User-agent: NetMechanic
Disallow: /

User-agent: Teleport
Disallow: /

Disallow: /cgi-bin/
Sitemap: http://www.pasticceriamajn.it/sitemap.xml

o sbaglio?
 
ok grazie. L' ho appena caricato nella root principale del sito ma continua a darmi il punto esclamativo arancione

DNS ok Connettività server ok Recupero Robots.txt !

è normale?
 
grazie, ma a livello di posizionamento che vantaggi ho a inserire il robots.txt. Potrei anche lasciar stare o no?
 
diciamo che il file robots.txt non è indispensabile e quindi, sì, potresti anche lasciare stare.
Ma non sottovalutare il suo peso in termini di indicizzazione, in quanto impedisce agli spider di scansionare delle pagine che a te non serve indicizzare, permettendoti così di dare priorità ad altre.
 
Si va bene ma io toglierei la voce
Disallow: /cgi-bin/
 

Discussioni simili