[PHP] estrarre le email da un elenco di url

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
buongiorno.
E' possibile estralle le email da un elenco di url disposti in una collonna di un file excel?
grazie
 

mr.x

Utente Attivo
9 Apr 2016
251
25
28
Senza troppi sbattimenti importa il file exel in un db (puoi convertirlo preventivamente in .cvs) e poi fai una select per estrarre gli indirizzi.
Altrimenti un parser del file
 

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
Con Excel non è possibile estrarre tutte le email. Ho provato a chiedere nei forum di Excel (anche quelli esteri). Mi hanno consigliato di usare un linguaggio di programmazione. Io finora ho usato un programma però poi devo stare ad estrarli, capire l'ultimo di appartenenza e poi incollarli nella cella vicino. È facile per alcune url, però per tante, diventa più di uno sbattimento...
 

mr.x

Utente Attivo
9 Apr 2016
251
25
28
Appunto, se importi i dati excel in un db,ad esempio mysql, poi recuperi dati con php come piú ti fa comodo. Excel ti permette di salvare il file come csv e quest' ultimo lo importi tranquillamente in mysql
 

marino51

Utente Attivo
28 Feb 2013
2.920
164
63
Lombardia
se ho capito quello che ti serve,
credo che si possa fare in Excel come con qualunque altro linguaggio di programmazione
tutto sta a conoscere come individuare l'indirizzo email nell'url
da cosa è preceduto e da cosa è seguito ?
l'url contiene 1 solo carattere @ o più ?
suppongo non si possa dire che è in posizione fissa ....
chiunque debba estrarre gli indirizzi deve avere queste risposte

in Excel, userei una formula che,
trova la posizione del carattere @
da questo il "separatore" di inzio
quindi il "separatore" di fine
ed è individuato l'indirizzo

ma forse troppo semplice ..... o troppo complessi gli url ....
 

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
Appunto, se importi i dati excel in un db,ad esempio mysql, poi recuperi dati con php come piú ti fa comodo. Excel ti permette di salvare il file come csv e quest' ultimo lo importi tranquillamente in mysql
Sai se c'è qualcosa già esistente in php che fa questa cosa?
 

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
se ho capito quello che ti serve,
credo che si possa fare in Excel come con qualunque altro linguaggio di programmazione
tutto sta a conoscere come individuare l'indirizzo email nell'url
da cosa è preceduto e da cosa è seguito ?
l'url contiene 1 solo carattere @ o più ?
suppongo non si possa dire che è in posizione fissa ....
chiunque debba estrarre gli indirizzi deve avere queste risposte

in Excel, userei una formula che,
trova la posizione del carattere @
da questo il "separatore" di inzio
quindi il "separatore" di fine
ed è individuato l'indirizzo

ma forse troppo semplice ..... o troppo complessi gli url ....
sembra che in excel non si posso proprio fare...
 

mr.x

Utente Attivo
9 Apr 2016
251
25
28
Sai se c'è qualcosa già esistente in php che fa questa cosa?
Probabilmente si ma nn so indicarti. Scrivo da me cio che mi occorre, ad ogni modo perdendoci un po di tempo non è una cosa complicatissima.
importati i dati devi impostarti il recupero in base a cio che t serve
 

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
Probabilmente si ma nn so indicarti. Scrivo da me cio che mi occorre, ad ogni modo perdendoci un po di tempo non è una cosa complicatissima.
importati i dati devi impostarti il recupero in base a cio che t serve
a me basterebbe solamente che le elamil (tutte del sito) vadano a finire nella cella accanto a quella contenente l'url. Il resto si puo fare con le macro e/o formule di excel.. Il problema è riuscire ad estrapolarle. Conoscete qualche altro sito dove posso raggiungere questo obiettivo?
Grazie
 

marino51

Utente Attivo
28 Feb 2013
2.920
164
63
Lombardia
sembra che in excel non si posso proprio fare...
bisogna conoscere Excel per poterlo dire,
in ogni caso, credo, che se non lo puoi fare in Excel, non lo puoi fare con nessun altro linguaggio

come detto, tutto sta a conoscere come individuare l'indirizzo email nell'url
puoi postare qualche riga di esempio ?
 
Ultima modifica:

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
bisogna conoscere Excel per poterlo dire,
in ogni caso, credo, che se non lo puoi fare in Excel, non lo puoi fare con nessun altro linguaggio

come detto, tutto sta a conoscere come individuare l'indirizzo email nell'url
puoi postare qualche riga di esempio ?
allego il link del file che ho inserito nel forum di excel. l'ultima colonna serve per capire dove stanno le email dei rettori.. nella prima colonna ci sono i link nelle altre le email con stesso e diverso path. poi dovrei inserire una formula per estrapolare dalle email quelle che contengono prima della chiocciola delle parole che indicherò come intestazione delle colonne succesive (ho fatto l'esempio con rettore).

https://www.dropbox.com/s/s1kzlkbkkmvvc2f/find email and links.xlsx?dl=0

un amico fece una prova con asp.net.. mi spiego che bisognava far cliccare su tutti i link presenti nel sito ed estrapolare le email individuando la chiocciola o www per i siti.
 

marino51

Utente Attivo
28 Feb 2013
2.920
164
63
Lombardia
nel file vedo,
la colonna A con dei links
la colonna B con delle email separate da ";"
la colonna C idem come sopra
la colonna D con una singola email
la colonna E con un link

forse devi solo separare le email delle colonne B e C mettendo ciascuna email in una cella diversa ?
 

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
nel file vedo,
la colonna A con dei links
la colonna B con delle email separate da ";"
la colonna C idem come sopra
la colonna D con una singola email
la colonna E con un link

forse devi solo separare le email delle colonne B e C mettendo ciascuna email in una cella diversa ?
È un esempio di risultato che vorrei ottenere. Avrei dovuto inserire un'altra colonna dopo quella delle url, in vanno tutte le email estrapolare da ogni url. Poi con Excel dovrei dividere queste email nelle altre sue colone (che vedi in tabella) in cui la prima contiene quelle con email ci stesso path dell'url e l'altra con path diverso. Poi con riferimento a quelle con lo stesso path estraggo quelle che contengono determinate parole (nel caso indicato nel file "rettore".
 

marino51

Utente Attivo
28 Feb 2013
2.920
164
63
Lombardia
cos'è un URL,
https://it.wikipedia.org/wiki/Uniform_Resource_Locator

La struttura di un URL è codificata nel documento RFC 3986 della IETF, scritta da Tim Berners-Lee,
e si compone normalmente di sei parti, alcune delle quali opzionali:

protocollo://[username:p[email protected]]host[:porta]</percorso>[?querystring][#fragment]

il titolo della discussione dice che devi "estrarre le email da un elenco di url"
gli indirizzi mail possono essere presenti solo nella querystring,

chiedi a persone di dedicare tempo, inventandosi delle querystring,
con la certezza che non avranno la struttura che tu stai trattando
e sviluppare un sistema per estrarle ....
non credo tu sia sulla strada giusta per risolvere il problema

------------

pensando che tu abbia sbagliato titolo, provo a darti un suggerimento,

nel tuo esempio ho visto che ci sono colonne con indirizzi mail (tipo "[email protected]") separati dal carattere punto e virgola
upload_2017-8-10_6-39-25.png


se vuoi separare gli indirizzi mettendoli in celle successive per usarli singolarmente, puoi
- copiare la singola colonna che ti interessa, in un foglio vuoto (lo scopo è avere colonne vuote a destra)
- selezionare la colonna copiata
- nel menu "dati" cliccare "Testo in colonne"
upload_2017-8-10_6-48-54.png

- nel primo menu scegliere "delimitati" ed il tasto "avanti"
- nel secondo menu togliere le spunte presenti e mettere la spunta su "punto e virgola" ed il tasto "fine"
otterrai così gli indirizzi separati
upload_2017-8-10_6-50-34.png


puoi ripetere queste operazioni per tutte le colonne che contengono indirizzi da separare
ed al termine ricomporre l'excel come preferisci

tempo 30 secondi a colonna senza scrivere una riga di programma

spero ti sia sufficiente
 

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
cos'è un URL,
https://it.wikipedia.org/wiki/Uniform_Resource_Locator

La struttura di un URL è codificata nel documento RFC 3986 della IETF, scritta da Tim Berners-Lee,
e si compone normalmente di sei parti, alcune delle quali opzionali:

protocollo://[username:p[email protected]]host[:porta]</percorso>[?querystring][#fragment]

il titolo della discussione dice che devi "estrarre le email da un elenco di url"
gli indirizzi mail possono essere presenti solo nella querystring,

chiedi a persone di dedicare tempo, inventandosi delle querystring,
con la certezza che non avranno la struttura che tu stai trattando
e sviluppare un sistema per estrarle ....
non credo tu sia sulla strada giusta per risolvere il problema

------------

pensando che tu abbia sbagliato titolo, provo a darti un suggerimento,

nel tuo esempio ho visto che ci sono colonne con indirizzi mail (tipo "[email protected]") separati dal carattere punto e virgola
Vedi l'allegato 4059

se vuoi separare gli indirizzi mettendoli in celle successive per usarli singolarmente, puoi
- copiare la singola colonna che ti interessa, in un foglio vuoto (lo scopo è avere colonne vuote a destra)
- selezionare la colonna copiata
- nel menu "dati" cliccare "Testo in colonne"
Vedi l'allegato 4060
- nel primo menu scegliere "delimitati" ed il tasto "avanti"
- nel secondo menu togliere le spunte presenti e mettere la spunta su "punto e virgola" ed il tasto "fine"
otterrai così gli indirizzi separati
Vedi l'allegato 4061

puoi ripetere queste operazioni per tutte le colonne che contengono indirizzi da separare
ed al termine ricomporre l'excel come preferisci

tempo 30 secondi a colonna senza scrivere una riga di programma

spero ti sia sufficiente

il mio problema non è sistemare/organizzare le email ma estrapolarle da ogni link...
 

stefano78

Nuovo Utente
21 Gen 2017
12
0
1
come detto posta un esempio xls o xslx,
senza l'esempio non ho idea di cosa ti serve perché non conosco l'origine .....
saluti

Hai presente il link di dropbox dei precedenti nessaggi? fai finta che il file ha solamente la prima colonna "links" e basta. Nella colonna b in corrispondenza di ciascun link sapresti estrarre tutte le email contenute nel sito?
a presto
 

borgo italia

Super Moderatore
Membro dello Staff
SUPER MOD
MOD
4 Feb 2008
16.042
146
63
PR
www.borgo-italia.it
ciao
guarda che marino51 ha ragione, tu stai chiedendo (faccio un esempio)
voglio avere 9
ma non basta perche per avere 9 ci sono 'diversi' modi che dipendono dai dati di partenza
8+1, 7+2.....
3^2
18/2, 29/3...
.....
quindi devi postare un piccolo esmpio di dati iniziali e quello che vuoi ottenere

poi un piccolo dubbio, dici
Nella colonna b in corrispondenza di ciascun link sapresti estrarre tutte le email contenute nel sito?
non intendi per caso una cosa del genere avendo una serie di lik tipo
www.pinco_pallo.it
ww.semprionio.com
......
andare ad accedere ai siti e estrarre gli indirizzi email da ,es,
Codice:
<a href="[email protected]_pallo.it">scrivimi</a>
se intendi far questo, guarda che siamo ai limiti della legalità
se ho capito male scusa, comunque posta esempio di partenza e di arrivo