熟悉Clouders Manager的安装和部署,熟知CDH的安装配置,和怎么解决越到的问题
了解什么是Hadoop生态圈,熟悉Hadoop分布式文件系统,懂得hdfs分布式文件系统的使用,了解MapReduce工作原理,学会怎么编写MR程序
熟知Hadoop集群硬件配置规划,懂得Hadoop集群配置及优化,学会如何维护和监测Hadoop集群,学会怎么使用Sqoop连接关系数据库进行数据导入导出
了解Hive数据仓库的开发和应用,学会Hue的web页面的开发
精通Hbase列式数据库的开发,了解kafka消息队列的原理
精通ETL的设计原理和kettle的原理和例子使用