0 簡介 在日常的數(shù)據(jù)分析中,分位數(shù) 是非常重要的一環(huán),在探查數(shù)據(jù)分布,定義指標(biāo)中都必不可缺。但 python 里的分位數(shù)計(jì)算卻潛藏了一些坑點(diǎn),...
0 前言 數(shù)據(jù)分析師在使用python進(jìn)行數(shù)據(jù)分析時(shí),經(jīng)常會遇到 Nan 和 None 這兩個(gè)數(shù)據(jù)缺失值,但它們兩并不互相等價(jià),有很多細(xì)微的差別...
數(shù)據(jù)分析的點(diǎn)、線、面 前言 在告別了人口紅利之后,對于成熟或平臺型產(chǎn)品而言,增長的核心不再是對增量用戶的擴(kuò)張,而是對存量用戶的精細(xì)化運(yùn)營,提升轉(zhuǎn)...
前言 在日常工作中,數(shù)據(jù)同學(xué)經(jīng)常會遇到以下問題 產(chǎn)品:為什么A頁面的數(shù)據(jù)和B頁面的數(shù)據(jù)對不上數(shù)據(jù):我去看看一段時(shí)間后.....數(shù)據(jù):A頁面數(shù)據(jù)是...
前言 支架表是維度設(shè)計(jì)中非常有意思的一部分,可以說是星型模型和雪花模型的結(jié)合;但在大部分維度建模書里都只是簡單的一筆帶過,實(shí)在是過于可惜。 在本...
前言 在大部分的公司里,數(shù)據(jù)部門的產(chǎn)出主要都是提取數(shù)據(jù)和 數(shù)據(jù)可視化(BI);提數(shù)工作無需多說,寫好SQL即可。但BI則不同,即使在BAT等非常...
前言 ETL 開發(fā)是數(shù)據(jù)工程師必備的技能之一,在數(shù)據(jù)倉庫、BI等場景中起到重要的作用。但很多從業(yè)者連 ETL 對應(yīng)的英文是什么都不了解,更不要談...
引言 元數(shù)據(jù)管理是企業(yè)數(shù)據(jù)治理的基礎(chǔ),是數(shù)據(jù)倉庫的提升;作為一名數(shù)據(jù)人,首要任務(wù)就是理解元數(shù)據(jù)管理。本篇文章將為大家梳理元數(shù)據(jù)的概念,介紹元數(shù)據(jù)...
引言 本文主要面向?qū)ο笫牵瑢I完全不了解,或只是初步了解的人。從宏觀角度介紹了BI的基本信息,并附以大量的圖表作為說明。期望能幫助大家對BI有...