Buonasera, oggi mi stavo cimentando per scopi puramente informativi nello scrape dai contenuti di pagine web e per studiare al meglio mi sono messo l'obbiettivo di creare un "servizio" che data una pagina in automatico cerca i proxy. Essi successiamente saranno passati ad un altra pagina PHP che tramite curl/websocket li testerà per vedere se sono attivi e se la risposta sarà positiva saranno inseriti in un database.
Ora però mi trovo ad un punto morto, magari per qualcuno anche scontato ma ci sto veramente sbattendo la testa. Ho bisogno di separare l'indirizzo ip dalla porta... Come mostrato dal codice seguente tramite la funzione preg_match_all() vado a salvare tutti i proxy in un array. Ora per separare i due cercando su internet ho trovato la funzione explode() che però da quanto ho capito non mi permette di separarne il contenuto se la variabile è un array quindi nei vari tentativi ho creato un ciclo che ogni volta mi salva il valore del' array attuale in una variabile da poi "esplodere" Ma i risultati non sono assai positivi: "Warning: explode() expects parameter 2 to be string, array given in /web/htdocs/www.********.it/home/scrape.php on line 12
IP: PORT: "
Lascio il codice che sto usando, se avete consigli sono ben accetti
Ora però mi trovo ad un punto morto, magari per qualcuno anche scontato ma ci sto veramente sbattendo la testa. Ho bisogno di separare l'indirizzo ip dalla porta... Come mostrato dal codice seguente tramite la funzione preg_match_all() vado a salvare tutti i proxy in un array. Ora per separare i due cercando su internet ho trovato la funzione explode() che però da quanto ho capito non mi permette di separarne il contenuto se la variabile è un array quindi nei vari tentativi ho creato un ciclo che ogni volta mi salva il valore del' array attuale in una variabile da poi "esplodere" Ma i risultati non sono assai positivi: "Warning: explode() expects parameter 2 to be string, array given in /web/htdocs/www.********.it/home/scrape.php on line 12
IP: PORT: "
Lascio il codice che sto usando, se avete consigli sono ben accetti
Codice:
<?php
$page = file_get_contents("URL cancellato per regolamento");
preg_match_all("/[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\:[0-9]{1,5}/", $page, $matches);
//print_r($matches);
end($matches);
$count = key($matches);
while($count==0)
{
$array = $matches[$count];
$array = explode(":",$array);
echo "IP: $array[0] PORT: $array[1] ";
}
?>