Apache Hadoop projesinin bir alt projeleri olan HBase ve MapReduce ürünleri konusunda kendimi geliştirmek istiyorum. Bir PHP developer olaraktan kocaman kocaman verilerle uğraşmak istiyorum. O'reilly'nin kitabı ile başladım. Başka önerisi olan var mı? #hadoop#hbase#MapReduce
Ben ıspartaya dönünce indiricem diye hiç denemedim :)
- Gurkan Oluc
Tom White'in kitabi guzel bir baslangic olacaktir. Sadece buyuk veri ile ugrasmak istiyorum diye dalarsan, hedefi belirsiz bir motivasyon oldugu icin cok sonuc alabilecegini zannetmiyorum. Once kitabi oku. Bu sure icinde hadoop ile bir kac map/reduce job yaz. Problemlerin nasil MR'da dusunebilecegini etud et. Bazen uzun bir sure alabilir dusunus seklini degistirmek. HBase daha ayri bir dunya. Tom White'in kitabinda, Stack ve JGray'in yazdigi bir HBase kismi var. Onu oku. Daha sonra Google'in BigTable makalesini oku. Elin degmisken, MapReduce, Google File System, Chubby, Stubby makalelerini de oku. Bunu ardindan Paxos algoritmasi ve Byzantine Paxos'a da goz at. Distributed computing'in onemli problemlerinden veya olgularindan CAP Theorem zaten kafani yormaya baslamis olacaktir.
- Berk D. Demir
"Kitapla ugrasma, mutfaga gir" tavsiyesi birak HBase'i, Hadoop gibi olgunlasmis bir proje icin bile alabildigine yersiz. Kitap, hic de derin olmayan bir tanitim veriyor. Cogu zaman bu bile bazi temel sorulari yanitsiz birakabiliyor. MapReduce ve daha da genelinde distributed computing, PHP - MySQL gibi okundugunda "haa. tamam lan!" diye anlasilan konular degil. Bu yuzden hala doktora tezlerinin populer konulari arasinda. Paradigmalarin tamamen farkli oldugu bir dunyada, temelleri okumadan girdiginiz yer "mutfak" degil sadece "lagim" olur. Bok ile ugrasmak istemediginize eminim.
- Berk D. Demir
ASF'in kullanici e-posta listeleri genelde bir cok yeni baslayan ile dolu. Yardim etmek isteyen insan sayisi da epey fazla. Bu yuzden, ev odevini iyi yapmak kaydi ile, bu listelere sorular sorabilirsin. Arsivlerinden faydalanabilirsin. Cunku ne Hadoop Core, ne HDFS ne Hadoop-MR ne de HBase, gelisimini tamamlayip platoya girmis super olgun projeler degil. Bir problem yasamadan kullanabiliyorsaniz gercekten bir yerde sorun var demektir. Liste arsivleri baskalarinin bu deneyimlerine erismek ve cozumleri bulmak icin harika yerler.
- Berk D. Demir
Bu arada Hadoop kitaplarini lutfen normal yollardan edinin. Korsan sitelerden cekmeyin. Tom White'i taniyorum. Son 1 ayda defalarca biraraya geldik, konustuk, fikir paylastik. Tom bu kitabi yazarken 10 ay boyunca esinden ve cok sevdigi cocuklarindan uzak kalip, bir odaya kapanarak gecelerini ve tatillerini harcadi. Bu kitabin e-book fiyati 36$. Asagi yukari 54TL. Eger sigara iciyorsaniz, kendinizi zehirlemek icin aldiginiz 10 pakete denk. Ankara - Istanbul gidis donus otobus biletinden ucuz. Tek yon Ankara - Istanbul ucak biletinden ucuz. Hatta belki ickili bir yemekte kisi basi odediginiz paradan bile ucuz. Tom White yasadiginiz yere gelse, ona bir raki ismarlamayacak kadar cimriyseniz, bu kadar da sayginizi hak etmiyorsa... Peki, calin kitabini.
- Berk D. Demir
Berk hocam, çok teşekkürler : ) olayın üniversitelerde devam eden boyutundan haberdar etmeniz bir bilg. müh. öğrencisi olarak yüksek lisans konusunda kafamda çeşitli ampüllerin yanmasına sebep oldu : )
- Gurkan Oluc
winterismute : ebook olarak nerden aldın?
- Gurkan Oluc
<<<Paradigmalarin tamamen farkli oldugu bir dunyada, temelleri okumadan girdiginiz yer "mutfak" degil sadece "lagim" olur.>>> bunu sevdim :)
- Şaban Ulutaş