Addons di ScrapeBox: Sitemap Scraper

Gli Addons disponibili per il software ScrapeBox sono tanti e molto diversi gli uni dagli altri. Oggi approfondiremo Sitemap Scraper, che permette di identificare tutti gli URL di un dominio, attraverso l’analisi approfondita della sua Sitemap.

Una tematica complessa ma importantissima, quella della Sitemap di un sito web, sulla quale si concentra anche il nostro servizio di realizzazione della Sitemap logica di siti web.

RICORDA: che siano gratuiti o a pagamento, gli Addons di ScrapeBox sono estensioni utilissime per svolgere operazioni particolari. In questo caso l’Addon è gratuito.

Indice articolo - Addons di Scrapebox 6: Sitemap Scraper

Come scaricare e installare Sitemap Scraper?

Dalla voce Addons del menu principale scegliamo l’opzione Show Available Addons. Tra i risultati disponibili nella finestra di riepilogo, cerchiamo Scrapebox Sitemap Scraper e procediamo con il download e l’installazione.

Una volta ultimato questo processo, come spiegavamo nella guida dedicata a Google Competition Finder, il nuovo Addon comparirà nella lista verde, fra gli Addons installati nel nostro software. Una volta aperto Sitemap Scraper sarà necessario procedere con il caricamento della lista di domini dei quali desideriamo tracciare la Sitemap.

Passiamo dunque ad analizzare le prime opzioni messe a disposizione dal software.

  1. Scelta dello useragent: aprendo un menu a tendina denominato Useragent è possibile selezionare con quale spider di uno specifico motore di ricerca far scansionare i files;
  2. Load urls: è possibile scegliere come caricare i files da analizzare. Nello specifico si può utilizzare un upload tramite file esterno Load urls from file (ovviamente in formato .xml), tramite caricamento dalla sezione di Harvester di ScrapeBox Load urls from ScrapeBox harvester oppure con un caricamento ottenuto tramite copia e incolla di file Load urls from clipboard
  3. E’ possibile anche fornire un’altra impostazione che includa o escluda dall’analisi le urls che non presentano le tag <?xml

Come usare Sitemap Scraper: esempio pratico

In questo caso sceglieremo la prima opzione, e cioè di importare la lista di URL, da analizzare da ScrapeBox, tramite un file di sitemap in fomato .xml

La ricerca, che inizia dopo aver premuto il pulsante Start, mostrerà a video tre colonne dei risultati:

  1. Sitemap urls: le urls del file sitemap .xml analizzato;
  2. Links: il numero totale di urls che compongono la specifca sitemap .xml;
  3. Status: lo stato dell’analisi.

E’ possibile ora valutare con maggior precisione e accuratezza i risultati ottenuti.

Premendo sul pulsante Show download folder si accede alla directory che contiene i files in formato .txt creati dall’addon durante la scansione. Essi riportano l’elenco di tutte le urls che compongono il file .xml

E’ facilmente intuibile come queste urls possono essere ulteriormente analizzate per valutarne lo stato o meno di indicizzazione oppure ulteriori fattori significativi utili per un’analisi globale su un sito web.