Hadoop 2.x Yüksek Kullanılabilirlik

Bu bölümde 2.x versiyonlarında Yüksek Kullanılabilirliğin nasıl sağlandığını inceleyeceğiz

hadoop-high-available
hadoop-high-available

Hadoop sisteminde NameNode genel olarak master görevini üstlenir ve hangi DataNode üzerinde hangi verilerin saklandığı bilgisini tutar.Fakat NameNode makinesinde bir problem meydana geldiğinde DataNode üzerindeki verilere erişemeyiz. Bu durum Hadoop sistemlerinde SPOF(single point of failure) olarak adlandırılır.

Hadoop 2.0 versiyonu ile birlikte bu duruma şöyle bir çözüm getirilmiştir

hadoop-spof
hadoop-spof

Hadoop cluster kurulumunda birden fazla NameNode kurulumu yapılır ve tüm DataNode makineleri bu bilgiye sahiptir.NameNode makinelerinden bir tanesi sürekli aktif durumdadır, diğeri ise hazır durumda bekler(standby).DataNode üzerinde saklanan bilgiler belirli periyotlarda her iki NameNode’a iletilir.

Ayrıca NameNode bazı bilgileri NFS dosya sistemine iletir ve standby durumunda bekleyen NameNode sürekli bu bilgiyi okur.

Aktif olan NameNode üzerinde bir problem meydana gelirse standby durumunda bekleyen NameNode devreye girer.

Not : Sistem büyüklüğüne bağlı olarak saniyeler seviyesinde kesinti yaşanabilir


 

Bizi takip edebileceğiniz sosyal medya platformları

–> Facebook –> Linkedin  -> Twitter

Sorularınız için Big Data grubumuz (-> Facebook group)

Online eğitimler için sitemizi takip edebilirsiniz

 

Please follow and like us:

Yazar: serkan sakınmaz

serkansakinmaz@gmail.com

Bir Cevap Yazın