Programma C per la gestione di grandi quantità di dati

Francesco Caiazza

Nuovo Utente
29 Set 2015
2
0
0
Questo è il mio primo messaggio sul forum del sito _mrwebmaster.it_ e voglio innanzitutto ringraziare gli amministratori per aver accettato la mia domanda di iscrizione.
Il mio titolo di studio è laurea in Fisica (vecchio ordinamento) ma il mio corso di laurea non includeva esami di informatica, (nemmeno quelli di base), ho studiato da solo la Programmazione in C e C++, e ho pensato di scrivere questo messaggio per entrare in contatto con programmatori esperti di gestione dati , per avere una valutazione delle prestazioni e delle possibili applicazioni di un programma realizzato dal sottoscritto;questo programma implementa una struttura dati composta da un insieme di alberi binari con bilanciamento RED-BLACK, e a me sembra interessante perché su computer dell' attuale standard commerciale, mi permette di gestire anche migliaia di miliardi di chiavi(naturalmente con le appropriate dimensioni della memoria esterna disponibile). Il numero di alberi RB che sono gestiti dal programma nonché la dimensione degli stessi, sono fissati dall'utente come parametri di ingresso. In fase di esecuzione l'utente può selezionare uno degli alberi della struttura attraverso il suo numero identificativo, e l'albero selezionato che in fase di generazione era stato allocato sulla memoria esterna, viene caricato nella RAM, dove è possibile gestirlo essendo disponibili tutte le funzioni di dizionario classico, oltre a funzioni di visualizzazione di un intervallo di livelli di ciascun albero (intervallo di livelli da visualizzare può essere scelto anche questo interattivamente dall'utente), e funzioni di creazione, distruzione, e gestione visuale completa di sotto-alberi, con nodo radice scelto dall'utente.
In più è disponibile una funzione di ricerca dati che confronta un campione di 100 Milioni di dati casuali esterni, con 1 Miliardo di chiavi distribuite sugli alberi componenti la struttura, le intersezioni trovate vengono riportate su una struttura parallela di alberi anch'essi binari RB, e dotati di tutte le funzioni di gestione e visualizzazione gia' descritte per gli alberi di immagazzinamento sulla prima struttura; a richiesta dell'utente tutti i valori di intersezione trovati, oltre a essere riportati sulla struttura parallela di alberi RB, possono essere cancellati dal rispettivi alberi di appartenenza sulla struttura magazzino e tutte queste elaborazioni per il confronto [100 Milioni di dati esterni - 1/2 Miliardo di dati sulla struttura magazzino] terminano in meno di 15 minuti. Chiaramente se la ricerca confronta campioni di minori dimensioni i tempi si accorciano proporzionalmente. Grazie a tutti per eventuali risposte! Se qualcuno preferisse approfondire telefonicamente scrivo il mio numero di Cell:3466538679..
Cordiali Saluti a tutto il forum!
 

Discussioni simili