scansione parole in una pagina

User Name

Utente Attivo
17 Mar 2005
42
0
6
Ciao a tutti, avrei una richiesta forse un po' complessa da fare.

Vorrei creare una sorta di indice univoco di tutte le parole contenute in un file (ditemi voi, se possibile, quale conviene di più txt html pdf doc)

Come posso far scandire un documento e far restituire l'elenco di tutte le parole una sotto l'altra?
grazie
 
In sostanza vuoi creare un parser che analizzi un documento (e poi gli altri) e ti restituisca l'elenco delle parole?

Complimenti, vuoi creare la base di uno spider :)

E' un lavoro molto complesso e bisogna tener conto di un sacco di fattori.

Posso essere indiscreto? A cosa ti serve?
 

Discussioni simili