ciao a tutti, vado al nocciolo della questione, se un nodo va giù per qualsiasi motivo (compreso il fatto che ce lo mando io per testare il tutto) , ci vogliono ore (nel senso vero del termine) perche si metta in linea con il master. Obvs i client mysql sono down etc etc, la procedura per lo startup e corretta, semplicemente ci mette secoli. La base dati consta in un centinaio di tabelle per circa 1Gb di dati complessivi (indici esclusi) con la tabella più grossa che ha circa 10 milioni di record.
Sono alle prime armi con i cluster e non riesco a capire dove sbaglio :-(. Vi riporto di seguito configurazioni e parte dei log in modo che possate avere un quadro chiaro della situazione.
- configurazione hardware dei nodi dati:
- Configurazione CLuster:
- I Client mysql sono uno sul server mgm e l'altro in un'altra postazione della rete locale
- ndb_1_cluster.log
- ndb_3_out.log
- ndb_mgm
Questo è quello che ottengo dopo un --initial del nodo in questione, ma la situazione è identica quando faccio uno shutdown, il nodo 1(id=2) va up subito ma poi il 2 per fare il RESTORE ci mette anni luce. Spero di esser stato il più chiaro possibile e grazie in anticipo per le risposte
Sono alle prime armi con i cluster e non riesco a capire dove sbaglio :-(. Vi riporto di seguito configurazioni e parte dei log in modo che possate avere un quadro chiaro della situazione.
- configurazione hardware dei nodi dati:
CPU intel Xeon Quadcore 2.13Ghz
6Gb Ram Ddr3
2 dischi SAS 15000rpm
- Configurazione CLuster:
[NDB_MGMD]
id=1
HostName=10.72.135.146
datadir=/var/lib/mysql/
[NDBD DEFAULT]
NoOfReplicas=2
DataMemory=5950M
IndexMemory=1100M
TimeBetweenGlobalCheckpoints=20000
TimeBetweenLocalCheckpoints=24
MaxNoOfConcurrentIndexOperations=200000
MaxNoOfConcurrentOperations=2000000
MaxNoOfLocalOperations=2200000
RedoBuffer=128M
NoOfFragmentLogFiles=64
MaxNoOfAttributes=8192
MaxNoOfTables=2048
MaxNoOfOrderedIndexes=2048
MaxNoOfUniqueHashIndexes=1024
[NDBD]
id=2
HostName=10.72.135.150
DataDir=/var/lib/mysql/
[NDBD]
id=3
HostName=10.72.135.151
DataDir=/var/lib/mysql/
[MYSQLD]
[MYSQLD]
- I Client mysql sono uno sul server mgm e l'altro in un'altra postazione della rete locale
- ndb_1_cluster.log
2011-07-09 09:34:31 [MgmSrvr] INFO -- Node 3: Operations=6500
2011-07-09 09:34:33 [MgmSrvr] INFO -- Node 2: Operations=0
2011-07-09 09:34:35 [MgmSrvr] INFO -- Node 2: Trans. Count = 0, Commit Count = 0, Read Count = 0, Simple Read Count = 0,
Write Count = 0, AttrInfo Count = 0, Concurrent Operations = 0, Abort Count = 0
Scans: 0 Range scans: 0
2011-07-09 09:34:38 [MgmSrvr] INFO -- Node 2: Operations=0
2011-07-09 09:34:40 [MgmSrvr] INFO -- Node 2: Trans. Count = 0, Commit Count = 0, Read Count = 0, Simple Read Count = 0,
Write Count = 0, AttrInfo Count = 0, Concurrent Operations = 0, Abort Count = 0
Scans: 0 Range scans: 0
2011-07-09 09:34:41 [MgmSrvr] INFO -- Mean loop Counter in doJob last 8192 times = 14
2011-07-09 09:34:41 [MgmSrvr] INFO -- Node 3: Trans. Count = 0, Commit Count = 0, Read Count = 0, Simple Read Count = 0,
Write Count = 0, AttrInfo Count = 0, Concurrent Operations = 0, Abort Count = 0
Scans: 0 Range scans: 0
2011-07-09 09:34:43 [MgmSrvr] INFO -- Node 2: Operations=0
2011-07-09 09:34:45 [MgmSrvr] INFO -- Node 2: Trans. Count = 0, Commit Count = 0, Read Count = 0, Simple Read Count = 0,
Write Count = 0, AttrInfo Count = 0, Concurrent Operations = 0, Abort Count = 0
Scans: 0 Range scans: 0
2011-07-09 09:34:45 [MgmSrvr] INFO -- Node 3: Operations=6496
2011-07-09 09:34:48 [MgmSrvr] INFO -- Node 2: Operations=0
2011-07-09 09:34:50 [MgmSrvr] INFO -- Node 2: Trans. Count = 0, Commit Count = 0, Read Count = 0, Simple Read Count = 0,
Write Count = 0, AttrInfo Count = 0, Concurrent Operations = 0, Abort Count = 0
Scans: 0 Range scans: 0
- ndb_3_out.log
2011-07-09 08:02:08 [ndbd] INFO -- Received signal 15. Performing stop.
2011-07-09 08:02:08 [ndbd] INFO -- Shutdown initiated
2011-07-09 08:02:08 [ndbd] INFO -- Shutdown completed - exiting
2011-07-09 08:02:08 [ndbd] INFO -- Angel shutting down
2011-07-09 08:02:08 [ndbd] INFO -- Node 3: Node shutdown completed. Initiated by signal 15.
2011-07-09 08:02:23 [ndbd] INFO -- Angel pid: 6126 ndb pid: 6127
2011-07-09 08:02:23 [ndbd] INFO -- NDB Cluster -- DB node 3
2011-07-09 08:02:23 [ndbd] INFO -- Version 5.2.3 (falcon) --
2011-07-09 08:02:23 [ndbd] INFO -- Configuration fetched at 10.72.135.146 port 1186
2011-07-09 08:02:23 [ndbd] INFO -- Start initiated (version 5.2.3)
2011-07-09 08:02:23 [ndbd] INFO -- Ndbd_mem_manager::init(1) min: 20Mb initial: 20Mb
WOPool::init(61, 9)
RWPool::init(82, 13)
RWPool::init(a2, 18)
RWPool::init(c2, 13)
RWPool::init(122, 18)
RWPool::init(142, 18)
WOPool::init(41, 12)
RWPool::init(e2, 12)
RWPool::init(102, 52)
WOPool::init(21, 10)
- ndb_mgm
ndb_mgm> show
Cluster Configuration
---------------------
[ndbd(NDB)] 2 node(s)
id=2 @10.72.135.150 (Version: 5.2.3, Nodegroup: 0, Master)
id=3 @10.72.135.151 (Version: 5.2.3, starting, Nodegroup: 0)
[ndb_mgmd(MGM)] 1 node(s)
id=1 @10.72.135.146 (Version: 5.2.3)
[mysqld(API)] 2 node(s)
id=4 (not connected, accepting connect from any host)
id=5 (not connected, accepting connect from any host)
Questo è quello che ottengo dopo un --initial del nodo in questione, ma la situazione è identica quando faccio uno shutdown, il nodo 1(id=2) va up subito ma poi il 2 per fare il RESTORE ci mette anni luce. Spero di esser stato il più chiaro possibile e grazie in anticipo per le risposte