-
数据库索引-05-倒排索引
倒排索引
倒排索引源于实际应用中需要根据属性的值来查找记录。
这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。
由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。
带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(inverted file)。
概述
在关系数据库系统里,索引是检索数据最有效率的方式。...
2019-01-02 02:17:00 |
SQL
-
数据库索引-04-Apache Phoenix
Phoenix
Phoenix 是针对Apache Hadoop的OLTP和运营分析。
Overview
Apache Phoenix通过结合两个方面的优势,为低延迟应用程序启用Hadoop中的OLTP和操作分析:
具有完整ACID事务功能的标准SQL和JDBC API的功能以及
通过利用HBase作为其后备存储,从NoSQL世界获得最新绑定的读取...
2019-01-02 02:17:00 |
SQL
-
数据库索引-03-cluster index 聚集索引
通俗点讲
聚簇索引:将数据存储与索引放到了一块,找到索引也就找到了数据
非聚簇索引:将数据存储于索引分开结构,索引结构的叶子节点指向了数据的对应行,myisam通过key_buffer把索引先缓存到内存中,当需要访问数据时(通过索引访问数据),在内存中直接搜索索引,然后通过索引找到磁盘相应数据,这也就是为什么索引不在key buffer命中时,速度慢的原因
澄清一个概念:innodb中...
2019-01-02 02:17:00 |
SQL
-
数据库索引-02-secondary index 二级索引
主键索引
大部分的数据都会有唯一的主键进行标识。
但是查询时的条件往往不是主键,而是其他的比如名称,时间,标签的信息。
为了提升查询的性能,二级索引可以说是是必须的。
个人的理解
主键索引与数据
主键索引可以唯一确定数据的位置。
二级索引可以建立与主键索引之间的关系。
mysql 二级索引
mysql中每个表都有一个聚簇索引(clustered index ),除此之外的表...
2019-01-02 02:17:00 |
SQL
-
数据库索引-01-index
索引的重要性
索引对于数据的查询,是质的飞跃。
索引核心知识
数据结构
b tree
红黑树
跳表
slimtrie
SLM 树
Hash
索引知识
联合索引
全文索引
倒排索引
Mongo 覆盖索引查询
二级索引
聚集索引与非聚集索引
拓展阅读
mysql-index
mongo-index
Elasticsearch
索引的重要性
索引...
2019-01-02 02:17:00 |
SQL
-
日志归档
日志归档
应用场景
便于查阅
当日志的量比较大,而且长时间累计下来,全部放在一起就不利于查阅,就需要分类保存。
比如按照时间。
按照不同的包信息。
减小量
为了保证历史的日志信息,就要全部保存,量特别大,就需要压缩。
分布式中
分布式系统中,一个服务有多个负载均衡的服务。
如果日志不做总的汇总,一个个服务器查,太过于麻烦,效率极低。
现在主流是 ...
2018-12-29 05:17:49 |
Log
-
Redis 存储值的类型
Redis 提供的值存储类型
Redis为我们提供了5种数据类型,基本上我们使用频率最高的就是String,而对其他四种数据类型使用的频次稍弱于String。
原因在于:
string
String使用起来比较简单,可以方便存储复杂的对象,使用场景比较多;
expire
由于Redis expire time只能设置在key上,像List、Hash、Set、Zse...
2018-12-28 02:59:54 |
NoSQL
-
Tensorflow
Tensorflow
Tensorflow tensorflow是一个使用数据流图进行数值计算的开源软件库。图节点表示数学运算,而图形边表示在它们之间流动的多维数据数组(张量)。这种灵活的体系结构使您能够将计算 部署到桌面,服务器或移动设备中的一个或多个cpu或gpu,而无需重写代码。滕索流还包括一个数据可视化工具包 - 紧张板。
滕索流最初是由在谷歌机器智能研究组织内从事谷歌大脑团队工...
2018-12-28 02:39:55 |
AI