求大神帮忙在ubuntu hadoop上搭建个hadoop平台并装上hive,会搭的大神求私聊

如图在运行Hadoop后,查看了其它两囼机子jps进程其它两台机子的datanode均运行,但是在50070该端口进入查看datanodeinformation却没有显示两台从机的datanode运行状态求大神解惑... 如图,在运行Hadoop后查看了其它兩台机子jps进程,其它两台机子的datanode均运行但是在50070该端口进入查看datanode information却没有显示两台从机的datanode运行状态,求大神解惑
我启动Hadoop后发现主机jps正常 从機jps显示也是正常,但是进入8088查看datanode进程发现进程数为0,请问这是什么原因呢
}

为什么这篇文章说Hbase不适合做BI呢

MapReduce昰Hadoop系统上的基本计算框架,HBase用户可以使用MapReduce来进行筛选和聚合运算但是我们知道MapReduce的反应时间一般在几十秒或几分钟以上,这对于实时BI运算過慢所以我们想调查一下HBase Coprocessor是否是一个更好的选择。

在逻辑层面上 HBase Table相当于一个3维Map--用(Row, Column, TimeStamp),我们可以找到相应的值在具体实现中,HBase Table的数據是按照一个一个数据单元存储的每个数据单元除了值域以外,还有其它的域如RowKey, Column ID,TimeStamp这样数据单元的很大一部分空间实际上被用来存儲那些Metadata. 这种存储格式对于稀疏报表十分有效,但是当报表的数据密度变大时其存储效率就大打折扣了。而一个典型的数据仓库的数据表嘚数据密度往往接近于100%这时HBase Table的存储效率要远远低于一个简单的2维报表,如一个关系型数据库报表或一个CSV报表

综上所述,博主认为HBase Table本身的存储格式并不适合典型的BI运用。


}

不行换个hive版本试试

你对这个回答的评价是?

}

我要回帖

更多关于 ubuntu hadoop 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信