Implementazione data warehousing

  • Creatore Discussione Creatore Discussione pup3770
  • Data di inizio Data di inizio

pup3770

Utente Attivo
30 Mag 2012
122
0
16
Ciao Ragazzi,
come da oggetto ho la necessità per un progetto universitario di realizzare un sistema di data warehousing.
Avevo in precedenza, come dai precedenti post, implementato diversi script php per la manipolazione dei data da un database.
Script che permettevano l'inserimento di un dipendente, l'inserimento di un nuovo ordine impartito da un dipendente, la visualizzazione dei dipendente, la visualizzazione degli ordini, la conversione della prima lettere del nome e del cognome in maiuscolo, la aggregazione in base all'id_dipendente mostrando l'id_dipendente (che prelevavo da una tabella chiamata ordini), il nome e cognome (che prelevavo da una tabelle chiamata dipendeti) e sommavo la quantità dei prodotti acquistati nei vari ordini in modo che riuscivo a vedere e salvare sul file tutte le info del dipendente e la quantità di prodotti che ognuno aveva ordinato.
Lasciando stare che lavoravo su un solo database, credevo che poteva andar bene come progetto tanto per mostrare che avevo capito come si implementava, ma confrontandomi con il professore mi diceva che non è un progetto di datawarehouse questo. Dalla teoria non penso di essere molto lontano dalla realizzazione di un sistema di data warehouse, ma come mai non piace al prof.? In cosa sbaglio e come potrei modificare il tutto per renderlo data warehousing?

Saluti
 
Tralasciando il fatto che un DWH serio richiede mesi di individuazione degli obiettivi, analisi dei problemi, e sviluppo software da parte di un team di professionisti del settore (ed è quindi ovvio che il tuo non sia un vero DWH), riporto la definizione di Wikipedia:
Un Data warehouse (o DW, o DWH) (termine inglese traducibile con magazzino di dati), è un archivio informatico contenente i dati di un'organizzazione. I DW sono progettati per consentire di produrre facilmente relazioni ed analisi.
Vengono considerati componenti essenziali di un sistema Data warehouse anche gli strumenti per localizzare i dati, per estrarli, trasformarli e caricarli, come pure gli strumenti per gestire un dizionario dei dati. Le definizioni di DW considerano solitamente questo contesto ampio.
Una definizione ampliata comprende inoltre gli strumenti per gestire e recuperare i metadati e gli strumenti di business intelligence.
Mi sembra dunque che, in linea di massima, tu abbia centrato lo scopo: raccogliere le informazioni riguardanti un'organizzazione. Quello che il tuo professore vuole probabilmente dirti è che manca tutta la parte relazionale: l'operatore dev'essere in grado di accedere alle informazioni contenute nel DWH come se fossero nella sua mente, creando visualizzazioni quasi del tutto arbitrarie sulla base di relazioni già esistenti tra i dati.

Poi mi sorge un dubbio: perché non vai da lui e gli chiedi di spiegarsi meglio? :D
 
Grazie mille per la risposta.

In merito all'incontro con il professore, si è correttissimo, vediamo se prossima settimana (visto che il lavoro mi sta distruggendo questa settimana) potrò incontrarlo.

Ci siamo sentiti per telefono prima di aprire questo post e lui mi ha detto che il progetto non va bene perché il data base intanto dev'essere popolato ed io gli ho detto: ma se ci sono 30 dati o 30000 dati mica cambia molto ai fini di come aggregare i dati, l'importante penso che sia quello di dimostrare di aver capito che qualcosa l'abbia capita e sappia implementarla.

Inoltre mi ha detto che il data warehouse è formato da dati eterogenei provenienti da diverse sorgenti, si a livello teorico lo sapevo ma cosa vuol dire che devo creare un altro o altri database da cui attingere i dati?

Inoltre mi ha detto che bisognerebbe interfacciarlo con ambienti tipo "Visual Studio" per la realizzazione dei cubi, delle dimensioni e schematizzazione delle tabelle. Ma io ho OS X, quindi "Visual Studio" potrei emularlo o gestirlo da windows (che ho già installato in una partizione BOOTCAMP).

Cioè quello che dice lui non fa una piega ma penso che il progettino da materia universitaria e non quello da tesi sperimentale sia già esaudito.

Rispondendo alla tua domanda sulla parte relazionale, potrei fare tutto quello che voglio visto che già ho fatto gli script per la visualizzazione e aggregazione.
Ho creato, come accennato, lo script per la visualizzazione dei dipendenti e degli ordini, aggregati i dati in base all'id_dipendente visualizzando la quantità degli ordini venduti. Cioè penso che così già ho dimostrato qualcosa.

Cosa secondo voi dovrei fare per soddisfare le sue richieste?
 
Ho parlato con il professore. In pratica devo creare tutta la struttura dei cubi e gestione OLAP.

Mi ha detto di installare "SQLServer", una volta creato il database popolarlo con gli strumenti "EMS" e poi utilizzare "Visual Studio" per la gestione dei report e OLAP.

Punto di domanda. Ho installato windows tramite BOOTCAMP, ho provato ad installare tutto ma niente. Qualcuno ha qualche soluzione in merito?
Esistono strumenti per la gestione OLAP che si interfacciano con APACHE e MYSQL???

Aiutatemi che i giorni passano e le tasse universitarie le sto pagando inutilmente
 

Discussioni simili