科技

  • 数据湖与数据仓库之间的五大差异

      根据Google的说法,对,大数据,的兴趣已经持续了好几年,而且在过去几年里真正的兴起,这篇文章的目的是为了帮助突出数据湖泊和数据仓库之间的差异,帮助您就如何管理数据做出明智的决定,我们这些数据和分析从业者当然听过这个词,当我们开始与客户讨论大数据解决方案时,谈话自然转向了对数据湖的讨论,但是,我经...

    2024-11-15 218
  • 低代码指标平台 构建人人可用的敏捷指标工具

      在现代数据服务体系中,指标平台或者说基于指标的服务和应用是其中关键的要素之一,麦肯锡,2025数据驱动企业,报告当中有一个重要观点,到2025年,绝大多数人将会使用数据来优化他们工作的几乎各个方面,这里的,绝大多数人,,不仅包括业务决策人员,也有数据分析师和工程师等,而大家所在的行业领域以及相关的背...

    2024-11-15 456
  • 助力构建低成本数据湖分析的最佳实践 阿里云 AnalyticDB Spark MySQL

      一、AnalyticDBMySQL介绍首先介绍下ADB产品架构,ADB湖仓版产品架构包含自研和开源两部分,ADB湖仓版在数据全链路的,采存算管用,5大方面都进行了全面升级和建设,我们推出了数据管道APS功能,可以一键低成本接入数据库、日志、大数据中的数据,解决数据入湖仓的问题,我们除了内置Hudi,...

    2024-11-15 118
  • 如何打造一款极速数据湖分析引擎

      前言随着数字产业化和产业数字化成为经济驱动的重要动力,企业的数据分析场景越来越丰富,对数据分析架构的要求也越来越高,新的数据分析场景催生了新的需求,主要包括三个方面,数据湖的出现很好的满足了用户的前两个需求,它允许用户导入任何数量的实时获得的数据,用户可以从多个来源收集数据,并以其原始形式存储到数据...

    2024-11-15 218
  • Kyuubi Hudi 的现代技术栈探索 出行基于 T3

      过去的几年里,随着大数据的进一步发展,现代数据栈的生态愈加丰富完善,而数据湖在这期间几乎已成为现代数据栈的必备品,它的出现大大简化了用户管理数据的难度,让用户更加关心于数据本身,而非组件本身,T3出行在数据湖基础上,对现代数据栈进行了一些探索,并初步打造了特征平台,在本文中,我将给大家分享下T3出行...

    2024-11-15 365
  • StarRocks 数据湖查询和迁移实践

      1.为什么需要数据湖架构为什么需要数据湖,与其它技术一样,数据湖本身也是由需求而生的,早期都是离线数仓,为了应对现在数据分析中越来越多的实时性场景,以及对ACID、事物性隔离越来越高的要求,数据湖技术应运而生,传统的数据湖三剑客为Iceberg、Hudi和Deltalake,从去年开始,开源的Apa...

    2024-11-15 643
  • 你是否在自建Ceph 集群中 犯过这五个错误

      Ceph是一个开源的分布式对象,块和文件存储,该项目诞生于2003年,是塞奇·韦伊的博士论文的结果,然后在2006年在LGPL2.1许可证发布,Ceph已经与Linux内核KVM集成,并且默认包含在许多GNU,Linux发行版中,当前的工作负载和基础设施需要不同的数据访问方法,对象,块,文件,,Ce...

    2024-11-15 109
  • 还有和Redis一样好用的NoSQL

      实际上为了更好的描述实体之间的关系,我们要是再继续使用Redis的话,是不是感觉实体之间的关系不够那么的明显,虽然也是属于NoSQL的一种,但是相对来说,Redis,表现实体之间的关系就没有那么清晰了,为了更好的描述实体之间的关系,就会使用图形数据库来进行了,那么今天阿粉介绍的,就是一个图形化的数据...

    2024-11-15 989
  • 分布式存储架构发展及技术分析

      从云和互联网的业务场景来看,其存储域主要采用基于服务器部署分布式存储服务的融合方式,它面临如下挑战,1.数据保存周期与服务器更新周期不匹配,大数据、人工智能等新兴业务催生出海量数据,大量数据需按照其生命周期策略,例如8~10年,进行保存,2.性能可靠与资源利用率难以兼得,支撑业务的分布式存储系统大致...

    2024-11-15 200
  • 图解PostgreSQL进程结构和内存结构

      一.建立会话的过程阶段一,客户端发起请求,阶段二,该阶段由主服务postmaster进程负责,阶段三,阶段二通过之后,主服务进程为该客户端单独fork一个客户端工作进程Postgres,SP进程,会话进程,用户一旦验证成功就会fork一个新的进程,分配PGA里面的work,mem,从磁盘读取数据到S...

    2024-11-15 412
  • 我们一起聊聊运维知识的呈现需要个性化吗

      这些年数据库运维工具的领域各种概念层出不穷,每个用户好像都有自己的特殊情况,他们需要的运维工具的功能也千差万别,搞的有时候让我都感到有些弄不明白用户到底需要什么样的产品了,有些运维工具是企业的刚需,是高频使用的功能,比如说数据库的安装部署、自动打补丁升级,批量修改数据库配置等,随着企业私有云的建设,...

    2024-11-15 595
  • 基础设施和数据两手都要硬 新型IT运维管理

      AI大模型时代,数据赋予IT人,新使命,当下IT人在企业中扮演着运营支撑的角色,说到运维管理,相信每人都是一把辛酸泪,每天承担着繁琐、高负荷且又高风险的运维工作,但在业务规划和职业发展时又成为了,透明人,业内有句调侃的话,只花钱的人,不配拥有发言权随着AI大模型应用的普及,数据成为了企业的关键资产和...

    2024-11-15 523
  • 一键搞定集群升级与测试 Pulsar升级自动化

      背景由于我在公司内部负责维护Pulsar,需要时不时的升级Pulsar版本从而和社区保持一致,而每次升级过程都需要做相同的步骤,命令行工具以上的流程步骤最好是全部一键完成,我们只需要人工检测下监控是否正常即可,于是我便写了一个命令行工具,执行流程如下,pulsar,upgrade,cli,hok,a...

    2024-11-15 555
  • Elasticsearch 深度巡检 Logstash Kibana 如何对 Filebeat

      本文将详细介绍一套深度巡检方案,包括各组件的监控方法、健康状态检查、性能指标监控,以及一些关键的DSL查询示例,帮助大家全面掌握集群状态,及时发现潜在问题,优化EFLK的运行,...。...

    2024-11-15 670
  • pod驱逐问题处理 K8S故障处理指南

      在K8S集群故障处理过程中,你可能遇到过pod的各种状态,Evicted状态代表你的K8S环境遇到了资源驱逐的问题,本节通过对驱逐问题的解决,参数的调整,问题的处理思路,希望给你解决此类问题提供帮助,pod出现状态为Evicted时,表示出现了驱逐,pod驱逐出现的原因一般为资源不足,内存或磁盘空间...

    2024-11-15 523

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息