1、Hadoop集群的机器最好是多核、多通道硬盘,但不要使用RAID。选用中档机器。例如8核、16GB内存、4×1TB硬盘。
2、集群可随着规模而不断扩充,当小集群时(10的数量级),namenode和jobtracker可以放在同一台机器上(同时保证有一份NFS远端的namenode备份)即可。再大就最好分别放在两台机器上。
3、Windows这么不靠谱的东西就不要用于生产环境了,生产环境最好用Linux,或者Unix。
4、Hadoop的网络拓扑结构分为:机架内Rack(在[......]