Data Warehousing & Pentaho

  • Creatore Discussione Creatore Discussione pup3770
  • Data di inizio Data di inizio

pup3770

Utente Attivo
30 Mag 2012
122
0
16
Ciao Ragazzi,
non ho trovato una sessione adatta. Ma qualcuno ha usato, usa o sa usare Pentaho? Oppure con qualcosa di simile che utilizza Join Rows (product catersian) o Merge Join (Inner, Left join, Right join, Full outer)?

Io ho dei Database in locale MySQL che gestisco da OSX con MAMP.
 
[risolto]

Bene bene, sono riuscito da solo a capire.

Pentaho è una suite utilissima per l' Integrazione dei dati. Fornisce potenti metodi di estrazione, trasformazione e caricamento (ETL) dei dati, utilizzando un innovativo approccio metadati.
Con un intuitiva grafica, è possibile utilizzare il drag&drop, utilizzabile anche per la scalabilità dei contenuti, l'architettura basata su standard, l'integrazione dei dati è sempre più la scelta per le organizzazioni più tradizionali, ETL proprietarie o strumenti di integrazione dei dati.

E' possibile prelevare dati da diverse tipologie di input selezionabili dal menù a tendina di sinistra e nello stesso modo è possibile lavorare e salvare in altrettanti sistemi di output.

Per quanto riguarda le trasformazioni la tecnica, forse la più utilizzata, è quella di unire i dati fra loro mediante dei join.

Di join in Pentaho ne esistono due tipi:
- Join Rows (cartesian product)
- Merge Join.

Il primo Join Rows (cartesian product) è un prodotto cartesiano. Viene passato il "Passo principale da cui leggere" ed è possibile selezionare il tipo di condizione che dev'essere verificata.

Il secondo (Merge Join), offre la possibilità di selezionare fino a 4 tipi di Join:
- INNER
- LEFT OUTER
- RIGHT OUTER
- FULL OUTER

INNER: il suo scopo è quello di unire due tabelle restituendo un risultato combinato sulla base di uno o più campi che trovano corrispondenza in tutte le tabelle coinvolte nella JOIN;
LEFT OUTER: Il join sinistro estende le tuple del primo operando. Estrae tutti i valori della tabella a sinistra anche se non hanno corrispondenza nella tabella a destra;
RIGHT OUTER: Il join destro estende le tuple del secondo operando. Estrae tutti i valori della tabella a destra anche se non hanno corrispondenza nella tabella di sinistra.
FULL OUTER: Il join completo le estende tutte.

Per documentarsi sulle operazioni di Join: https://www.mrw.it/mysql/join_6812.html

Dunque in Pentaho funziona nello stesso modo. Fate delle prove inizialmente utilizzando delle tabelle con poche informazioni per capire se realmente state operando nel verso giusto e vedrete che piano piano inizierete a spostare ed elaborare i dati a vostro piacimento.

Per Informazioni e Download su Pentaho:

http://pentahoitalia.com/unintroduzione-a-pentaho-data-integration/

http://pentahoitalia.com

http://www.pentaho.com
 
Ultima modifica:

Discussioni simili