为什么80%的码农都做不了架构师?>>>
cloudera公司集成的spark是不带spark-sql的,如果需要让cdh的spark支持spark-sql,需要重新编译spark
网上有参考资料,大概步骤是编译,替换jar包,把spark-sql的shell脚本放到bin目录下,注意,还有可能需要更改/opt/cloudera/parcels/CDH/lib/spark/conf/classpath.txt,这个文件里面就是spark有那些jar包和包路径。
参考:CDH5.5自行编译支持sparkSQL,sparkR 重新编译spark 增加spark-sql适配CDH