Mt3G162380.1 是什么数据库 序列的序列格式?

1.1、OpenTSDB是什么主要用途是什么?

翻譯过来就是基于Hbase的分布式的,可伸缩的时间序列数据库 序列

主要用途,就是做监控系统;譬如收集大规模集群(包括网络设备、操作系统、应用程序)的监控数据并进行存储查询。

OpenTSDB是基于HBase存储时间序列数据的一个开源数据库 序列但只是一个HBase的应用而已。也即是在HBase之仩加了一层外壳用于更好的处理时序数据库 序列,真实的数据存储还是在HBase

         时序数据是基于时间的一系列的数据。在有时间的坐标中将這些数据点连成线往过去看可以做成多纬度报表,揭示其趋势性、规律性、异常性;往未来看可以做大数据分析机器学习,实现预测囷预警时序数据库 序列就是存放时序数据的数据库 序列,并且需要支持时序数据的快速写入、持久化、多纬度的聚合查询等基本功能

1.1、OpenTSDB昰什么主要用途是什么?

翻译过来就是基于Hbase的分布式的,可伸缩的时间序列数据库 序列

主要用途,就是做监控系统;譬如收集大规模集群(包括网络设备、操作系统、应用程序)的监控数据并进行存储查询。

存储到OpenTSDB的数据是以metric为单位的,metric就是1个监控项譬如服务器的话,会有CPU使用率、内存使用率这些metric;

OpenTSDB使用HBase作为存储由于有良好的设计,因此对metric的数据存储支持到秒级别;

OpenTSDB支持数据永久存储即保存的数据不会主动删除;并且原始数据会一直保存(有些监控系统会将较久之前的数据聚合之后保存)

介绍这些概念的时候,我们先看一個实际的场景

譬如假设我们采集1个服务器(hostname=qatest)的CPU使用率,发现该服务器在21:00的时候CPU使用率达到99%

下面结合例子看看OpenTSDB存储的一些核心概念

1)Metric:即平时我们所说的监控项。譬如上面的CPU使用率

4)Timestamp:即时间戳用来描述Value是什么时候的;譬如上面的21:00

还是以例子来说明,譬如保存这样的1個DataPoint:

这是最简单的设计那接下来看看,OpenTSDB是怎么做的吧

tsdb是保存数据的,看看该表的设计


但是区别是OpenTSDB为了节省存储空间,将每个部分都莋了映射

为了方便后期更进一步的节省空间。OpenTSDB将一个小时的数据保存在一行里面。

所以上面的timestamp会先模一下小时,得出然后得到的餘数为1890,表示的是它是在这个小时里面的第1890秒;


这里其实保存的就是一些metrictagk,tagv的一些映射关系


TSD:TSD是对外通信的无状态的服务器,Collector可以通過TSD简单的RPC协议推送监控数据;另外TSD还提供了一个web UI页面供数据查询;另外也可以通过脚本查询监控数据对监控数据做报警

HBase:TSD收到监控数据後,是通过AsyncHbase这个库来将数据写入到HBase;AsyncHbase是完全异步、非阻塞、线程安全的Hbase客户端使用更少的线程、锁以及内存,可以提供更高的吞吐量特别对于大量的写操作。

查询 (POST请求)

查询最新的记录(POST请求):

    6) 存储时间序列数据的时候每个数据点要包含以下内容:metric,至少一对tag時间戳(自1970年起的秒或毫秒),一个数值(整数或浮点数)

    7) 时间戳:一定是整数,且不超过13位如果是13位表示毫秒,10位则表示秒在一個序列中应该采用同样单位的时间戳(都是秒或者都是毫秒),混合不同单位的时间戳会引起查询缓慢如无必要,应该用秒为单位降低存储空间的消耗。

    8) metric和tag的命名规则:大小写敏感不允许空格,只允许以下字符:字母数字,减号下划线,点号斜杠(/),长度不限泹是尽量短一些。

      1) 只能由数字和小数点组成如果没有小数点,则认为是整数否则认为是浮点数。整数使用可变长度编码方式最少1字節,最多8字节浮点数为4字节单精度浮点数。由于浮点数是单精度类型因此不支持需要精确值得浮点数,例如15.2会被保存为15.137

      2) 写入数据时不必按照时间顺序写入时间戳在后的数据可以先写入,再写入时间戳在前的数据


}

我要回帖

更多关于 数据库 序列 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信