包含"索引"标签的文章
-
Order By 是怎么实现的 聊聊
首先排序功能由ORDERBY实现,具体排列顺序取决于优化器的选择,若优化器认为索引排序更有效率,则使用索引排序;反之,则使用filesort,执行计划中额外信息提示,使用filesort,然而,索引排序的适用情况有限,且不确定性较高,通常还是会采用filesort,在filesort排序中,如果排序...
-
告别传统的文档切块!JinaAI提出Late Chunking技巧
今天给大家分享JinaAI提出的一个新的技巧,正常在处理大规模数据建索引的时候,一般我们需要先对文档进行分块,建立向量索引,而这个分块大小,设置的都是比较短的,比如512,一方面是早期bert的处理长度的限制,另一个方面是如果文本太长,包含的信息就越多,那么可能比较难用一个向量来表征出来,对于前者,...
-
数据库索引技术之Lsm树
上次我们分享了采用哈希索引实现的存储引擎,它总是将写操作不断追加到数据文件,就跟写日志一样,这种日志结构式的存储引擎,数据记录顺序由写入时间决定,同一键的旧记录由新记录取代,由于数据在写入时,自动切分成一个个文件,数据库需要在后台对文件进行合并,以减少文件数,进而加快查询,如果待合并文件里的数据是有...
-
我秃了!唯一索引 普通索引我该选谁
提到唯一索引和普通索引,相信大家都不陌生,当同事小姐姐问你这俩有什么区别时?或许你会脱口而出,这还用问?见名知意啊,一个是允许字段重复,一个不允许存在重复数据,是否解决小姐姐的疑问我不知道,但你在同事心目中,肯定不是啥好玩意儿~要知道,一眼就看出的答案,一般不会有人问,除非问傻子~那么当你处理一张市...