Ciao a tutti,
la settimana scorsa ho cominciato i lavori su un parser in php per prelevare i dati da soccerway.com, il problema è che php oltre ad essere un linguaggio lato server (quindi alcuni contenuti che si caricano dopo non posso prelevarli), è anche molto spoglio a livello di parser. I pochi che ci sono sono pieni di bug e lentissimi, e nel mio caso con simple_html_dom si mangia molta memoria sul server il ché è sbagliatissimo.
Ho quindi intenzione di scrivere un parser in javascript per il sito web in alto. Ho intenzione di basarmi sul modello MVC, l'idea sarebbe questa:
1. Una cron job in php lancia un file javascript che include tutte le classi con i metodi per ogni sezione da scrapare del sito
2. Ogni dato prelevato da js viene inviato a file php che si occuperanno di caricare i dati sul mio database
3. Al termine viene fatto un aggiornamento del file di log
Quello che voglio chiedervi è se potete consigliarmi un buon parser in js (o un framework) che mi permetta di fare questo senza troppi sforzi e nella maniera più pulita possibile, non so se conoscete CodeIgniter o Slim, questi due framework mettono a disposizione metodi per le query, in questo modo non c'è il bisogno di scrivere ogni volta la query, ma questo è un altro discorso.
Spero che sia tutto chiaro
la settimana scorsa ho cominciato i lavori su un parser in php per prelevare i dati da soccerway.com, il problema è che php oltre ad essere un linguaggio lato server (quindi alcuni contenuti che si caricano dopo non posso prelevarli), è anche molto spoglio a livello di parser. I pochi che ci sono sono pieni di bug e lentissimi, e nel mio caso con simple_html_dom si mangia molta memoria sul server il ché è sbagliatissimo.
Ho quindi intenzione di scrivere un parser in javascript per il sito web in alto. Ho intenzione di basarmi sul modello MVC, l'idea sarebbe questa:
1. Una cron job in php lancia un file javascript che include tutte le classi con i metodi per ogni sezione da scrapare del sito
2. Ogni dato prelevato da js viene inviato a file php che si occuperanno di caricare i dati sul mio database
3. Al termine viene fatto un aggiornamento del file di log
Quello che voglio chiedervi è se potete consigliarmi un buon parser in js (o un framework) che mi permetta di fare questo senza troppi sforzi e nella maniera più pulita possibile, non so se conoscete CodeIgniter o Slim, questi due framework mettono a disposizione metodi per le query, in questo modo non c'è il bisogno di scrivere ogni volta la query, ma questo è un altro discorso.
Spero che sia tutto chiaro