Ciao Ragazzi,
non sono riuscito a trovare la sessione più idonea al tipo di post che sto scrivendo e non sono riuscito a trovare molto materiale pratico di aiuto se non tutte copie delle stesse pagine di teoria.
Per un esame universitario mi viene richiesto un progetto: "Progetto e Realizzazione di un Sistema di Data Warehousing ed OLAP” e NON “Disegno, Sviluppo e Testing di Algoritmi per l'Elaborazione di Dati Multidimensionali”.
Io attualmente come Suite sto utilizzando "SQL Server 2008", precisamente la suite "Microsoft SQL Server Management Studio" per creare un server in locale (127.0.0.1).
Ho creato dei database contenenti delle tabelle, esempio vorrei fare un progetto del tipo.
Il negozio di abbigliamento "Ciao Mondo" ha il marchio principale e poi ci sono i vari affiliati tipo: "Mondo Senior", "Mondo Junior", "Mondo Man", "Mondo Outlet".
Dalla teoria vedrei questo DataWarehouse e quindi "Progetto e Realizzazione di un Sistema di Data Warehousing ed OLAP" come un insieme di Database ognuno avente le proprie tabelle:
Nome Database - nomi delle tabelle (ogni tabella separata da ";")
Ciao Mondo - clienti; prodotti; fornitori; rivenditori; merce_da_rendere; merce_inventuta
Mondo Senior - clienti; prodotti
Mondo Junior - clienti; prodotti; fornitori
Mondo Man - clienti; prodotti; fornitori; rivenditori; merce_inventuta
Mondo Outlet - clienti; prodotti; fornitori; rivenditori; merce_da_rendere
NOTA. Da notare che ogni DB non ha le medesime tabelle. Tutte le celle delle tabelle sono riempite ramdom (con "EMS Data Generator for SQL Server").
Dopo aver fatto la creazione macchinosa; Abbiamo detto che "Ciao Mondo" è il DB del marchio principale quindi l'amministrazione di "Ciao Mondo" potrebbe voler vedere, per scopo statistico, la provenienza dei clienti che comprano presso i punti vendita affiliati.
Nel DB "Ciao Mondo" dovremmo fare convogliare tutti i dati di tutte le tabelle di tutti i punti vendita affiliati "clienti".
Viste le possibili inconsistenze bisogna effettuare procedure di ETL, quindi Estrazione dei dati dalle varie tabelle "clienti", Trasformare questi dati in modo da essere confrontabili (ad esempio un'inconsistenza potrebbe essere "numero di telefono" con "numero di cellulare") e Caricare/Loading tutti i dati nella tabella "clienti" del DB "Ciao Mondo".
Mi viene chiesto dal professore, successivamente, di utilizzare il template: “Analysis Services Project”, disponibile in Visual Studio 2008.
La mia domanda è: tutto quello che ho scritto è corretto o sono fuori strada? Come fare queste procedure di ETL?
Ragazzi attendo un Vostro gentile aiuto
non sono riuscito a trovare la sessione più idonea al tipo di post che sto scrivendo e non sono riuscito a trovare molto materiale pratico di aiuto se non tutte copie delle stesse pagine di teoria.
Per un esame universitario mi viene richiesto un progetto: "Progetto e Realizzazione di un Sistema di Data Warehousing ed OLAP” e NON “Disegno, Sviluppo e Testing di Algoritmi per l'Elaborazione di Dati Multidimensionali”.
Io attualmente come Suite sto utilizzando "SQL Server 2008", precisamente la suite "Microsoft SQL Server Management Studio" per creare un server in locale (127.0.0.1).
Ho creato dei database contenenti delle tabelle, esempio vorrei fare un progetto del tipo.
Il negozio di abbigliamento "Ciao Mondo" ha il marchio principale e poi ci sono i vari affiliati tipo: "Mondo Senior", "Mondo Junior", "Mondo Man", "Mondo Outlet".
Dalla teoria vedrei questo DataWarehouse e quindi "Progetto e Realizzazione di un Sistema di Data Warehousing ed OLAP" come un insieme di Database ognuno avente le proprie tabelle:
Nome Database - nomi delle tabelle (ogni tabella separata da ";")
Ciao Mondo - clienti; prodotti; fornitori; rivenditori; merce_da_rendere; merce_inventuta
Mondo Senior - clienti; prodotti
Mondo Junior - clienti; prodotti; fornitori
Mondo Man - clienti; prodotti; fornitori; rivenditori; merce_inventuta
Mondo Outlet - clienti; prodotti; fornitori; rivenditori; merce_da_rendere
NOTA. Da notare che ogni DB non ha le medesime tabelle. Tutte le celle delle tabelle sono riempite ramdom (con "EMS Data Generator for SQL Server").
Dopo aver fatto la creazione macchinosa; Abbiamo detto che "Ciao Mondo" è il DB del marchio principale quindi l'amministrazione di "Ciao Mondo" potrebbe voler vedere, per scopo statistico, la provenienza dei clienti che comprano presso i punti vendita affiliati.
Nel DB "Ciao Mondo" dovremmo fare convogliare tutti i dati di tutte le tabelle di tutti i punti vendita affiliati "clienti".
Viste le possibili inconsistenze bisogna effettuare procedure di ETL, quindi Estrazione dei dati dalle varie tabelle "clienti", Trasformare questi dati in modo da essere confrontabili (ad esempio un'inconsistenza potrebbe essere "numero di telefono" con "numero di cellulare") e Caricare/Loading tutti i dati nella tabella "clienti" del DB "Ciao Mondo".
Mi viene chiesto dal professore, successivamente, di utilizzare il template: “Analysis Services Project”, disponibile in Visual Studio 2008.
La mia domanda è: tutto quello che ho scritto è corretto o sono fuori strada? Come fare queste procedure di ETL?
Ragazzi attendo un Vostro gentile aiuto