Ho intenzione di scrivere un tool che estragga dati da soccerway.com. Ho intenzione infatti di creare una sorta di storico:
http://it.soccerway.com/national/italy/serie-a/20152016/regular-season/r31554/
come potete vedere i dati sono raggruppati in stagioni calcistiche, quindi ci sarebbe database 2015/2016 - 2016/2017 e così via. Quello che voglio fare è quindi prelevare i dati, inserirli nel database per poi eseguire con una cron job un modulo che vada ad aggiornare tali valori. Il problema è che ogni dato dovrebbe avere una chiave di riconoscimento su cui eseguire l'aggiornamento o qualcosa del genere. Attualmente ho in mente soltanto il funzionamento del parser ma non so proprio come posso creare una procedura di aggiornamento chiave => valore.
Per esempio, prendete la classifica serie A dal link che vi ho fornito, come posso (una volta inseriti i dati), in futuro controllare con la cronjob che ci siano aggiornamenti e sostituire i valori?
So che per vedere se ci sono gli aggiornamenti potrei sfruttare il campo lastUpdate nell'header e salvarlo da qualche parte nel database, per poi con la cronjob andare a controllare questo campo per ogni campionato. Il punto più importante però è riconoscere i valori da aggiornare perché non ho nessun id a cui fare riferimento.
Qualche idea?
http://it.soccerway.com/national/italy/serie-a/20152016/regular-season/r31554/
come potete vedere i dati sono raggruppati in stagioni calcistiche, quindi ci sarebbe database 2015/2016 - 2016/2017 e così via. Quello che voglio fare è quindi prelevare i dati, inserirli nel database per poi eseguire con una cron job un modulo che vada ad aggiornare tali valori. Il problema è che ogni dato dovrebbe avere una chiave di riconoscimento su cui eseguire l'aggiornamento o qualcosa del genere. Attualmente ho in mente soltanto il funzionamento del parser ma non so proprio come posso creare una procedura di aggiornamento chiave => valore.
Per esempio, prendete la classifica serie A dal link che vi ho fornito, come posso (una volta inseriti i dati), in futuro controllare con la cronjob che ci siano aggiornamenti e sostituire i valori?
So che per vedere se ci sono gli aggiornamenti potrei sfruttare il campo lastUpdate nell'header e salvarlo da qualche parte nel database, per poi con la cronjob andare a controllare questo campo per ogni campionato. Il punto più importante però è riconoscere i valori da aggiornare perché non ho nessun id a cui fare riferimento.
Qualche idea?