望云阁

望云阁

关于数仓建设及数据治理的超全概括

在谈数仓之前,先来看下面几个问题: 数仓为什么要分层? 用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量冗余的数据;不分层的话,如果源业务系统的业务规则发生变化将


gxq926  846  2021-07-22 阅读全文

浅谈数仓模型(维度建模)

背景 数据仓库的核心是展现层和提供优质的服务。ETL 及其规范、分层等所做的一切都是为了一个更清晰易用的展现层。 数仓架构的原则: 1、底层业务的数据驱动为导向同时结合业务需求驱动 2、便于数据分析


gxq926  936  2021-07-21 阅读全文

用户画像标签体系——从零开始搭建实时用户画像

用户画像标签体系 用户画像的核心在于给用户“打标签”,每一个标签通常是人为规定的特征标识,用高度精炼的特征描述一类人,例如年龄、性别、兴趣偏好等,不同的标签通过结构化的数据体系整合,就可与组合出不同的


gxq926  1510  2021-07-21 阅读全文

大数据相关岗位及要求

一、大数据开发工程师: 1.要求 编程基础扎实,熟悉Java,熟悉Scala/Shell/Python语言中其中一种更好(社招一般要求两种); 熟悉MySQL等至少一种数据库,熟悉SQL语言,熟悉Li


gxq926  394  2021-06-24 阅读全文

大数据学习or转型

这段时间有一些小伙伴问了关于大数据学习的一些问题,都是在校学生或者已经工作了想转型转型的小伙伴,所以分为两种情况来说明 在校学生:   在校学生又可以分为计算机相关专业或非计算机相关专业;如果你是计算


gxq926  423  2021-06-24 阅读全文