Celery源碼筆記(六) 定時任務

定時任務
定時任務是celery的一個重要功能,本節會對celery的定時任務進行分析。
根據之前分析可知,在celery啟動的過程中,會創建并啟動Beat組件,而celery的任務調度服務就在Beat組件啟動的過程中被啟動了。
首先,我們來看celery.apps.beat.Beat類的部分聲明

class Beat(object):
    """Beat as a service."""

    # 調度服務
    Service = beat.Service
    app = None

該類中的屬性Service即為調度服務,默認指向celery.beat.Service類,我們將目光轉向該類的聲明

class Service(object):
    """Celery periodic task service."""

    # 調度器
    scheduler_cls = PersistentScheduler

可以看到,該類中有一屬性為調度器,指向了celery.beat.PersistentScheduler類,從這里我們可以分析得出,服務的調度類為PersistentScheduler類,該類又繼承自同一文件中聲明的Scheduler類。繼承關系如下圖所示:


image.png

在創建了celery.beat.Service實例后,會調用該實例的start()方法,在改方法中,定義如下

def start(self, embedded_process=False):
        info('beat: Starting...')
        debug('beat: Ticking with max interval->%s',
              humanize_seconds(self.scheduler.max_interval))

        signals.beat_init.send(sender=self)
        if embedded_process:
            signals.beat_embedded_init.send(sender=self)
            platforms.set_process_title('celery beat')

        try:
            while not self._is_shutdown.is_set():
                interval = self.scheduler.tick()
                if interval and interval > 0.0:
                    debug('beat: Waking up %s.',
                          humanize_seconds(interval, prefix='in '))
                    time.sleep(interval)
                    if self.scheduler.should_sync():
                        self.scheduler._do_sync()
        except (KeyboardInterrupt, SystemExit):
            self._is_shutdown.set()
        finally:
            self.sync()

其中可以看到,該方法創建了一個事件循環,其中啟動了調度服務,而且我們可以看到在循環中有scheduler相關的方法調用,接下來,我們尋找相關的聲明,來看看scheduler是怎樣初始化的

def get_scheduler(self, lazy=False,
                      extension_namespace='celery.beat_schedulers'):
        filename = self.schedule_filename
        aliases = dict(
            load_extension_class_names(extension_namespace) or {})
        return symbol_by_name(self.scheduler_cls, aliases=aliases)(
            app=self.app,
            schedule_filename=filename,
            max_interval=self.max_interval,
            lazy=lazy,
        )

    @cached_property
    def scheduler(self):
        return self.get_scheduler()

這里可以看到,celery.beat.Service實例中,并沒有聲明scheduler屬性,而是聲明了一個方法并且用一個cached_property裝飾器對其進行了修飾。該裝飾器的作用是將方法調用的結果緩存起來,以便下次可以直接使用。

而第一次調用該方法時,將會調用get_scheduler創建一個self.scheduler_cls類型的實例,一般地,該實例的類型為PersistentScheduler。在使用中,可以將scheduler方法以調用屬性的方法使用,可以理解為以單例模式使用scheduler。

回到celery.beat.Service.start()方法,我們可以看到該方法中首先調用了self.scheduler.tick()獲取間隔時間,之后會sleep該時間間隔后,再通過self.scheduler.should_sync()判斷是否需要進行同步,若需要則調用self.scheduler._do_sync()進行同步。

接下來,我們來分析celery.beat.Scheduler.tick()是怎樣實現任務調度的,同樣地,首先來看該方法的聲明

def tick(self, event_t=event_t, min=min, heappop=heapq.heappop,
             heappush=heapq.heappush):
        """Run a tick - one iteration of the scheduler.

        Executes one due task per call.

        Returns:
            float: preferred delay in seconds for next call.
        """
        adjust = self.adjust
        max_interval = self.max_interval

        if (self._heap is None or
                not self.schedules_equal(self.old_schedulers, self.schedule)):
            self.old_schedulers = copy.copy(self.schedule)
            self.populate_heap()

        H = self._heap # 使用小根堆作為任務隊列

        if not H:
            return max_interval

        event = H[0]
        entry = event[2]
        is_due, next_time_to_run = self.is_due(entry)
        if is_due:
            verify = heappop(H)
            if verify is event:
                next_entry = self.reserve(entry)
                self.apply_entry(entry, producer=self.producer)
                heappush(H, event_t(self._when(next_entry, next_time_to_run),
                                    event[1], next_entry))
                return 0
            else:
                heappush(H, verify)
                return min(verify[0], max_interval)
        return min(adjust(next_time_to_run) or max_interval, max_interval)

我們可以看到,這里使用了一個heap存儲任務列表,每次從堆頂取出一個事件,若該事件通過校驗,則對該事件進行調度并將下次執行的事件放入堆中,否則只將該事件放入堆中,最后返回下次的任務執行時間與最大間隔時間中的最小值

接下來分析celery.beat.Scheduler.should_sync()方法

def should_sync(self):
        return (
            (not self._last_sync or
               (monotonic() - self._last_sync) > self.sync_every) or
            (self.sync_every_tasks and
                self._tasks_since_sync >= self.sync_every_tasks)
        )

可以看到,該方法的實現比較簡單,總結一下就是若上次同步的時間差大于最大時間差最大限制,則返回True 最后,

我們來分析celery.beat.Scheduler._do_sync()方法

class Scheduler(object):
    def _do_sync(self):
        try:
            debug('beat: Synchronizing schedule...')
            self.sync()
        finally:
            self._last_sync = monotonic()
            self._tasks_since_sync = 0

    def sync(self):
        pass

class PersistentScheduler(Scheduler):
    def sync(self):
        if self._store is not None:
            self._store.sync()

這里可以看到,該方法中調用了sync()方法,而在PersistentScheduler中重寫了sync()方法,這里是使用了Python的shelve模塊創建了一個存儲的文件,并將內存中的數據存儲至該文件中(實際上就是進行了一次持久化操作)。


image.png

簡單總結一下,celery的任務調度的核心是使用一個最小堆實現優先級隊列,并且每隔一段時間將調度的任務隊列持久化至文件中,以防進程中斷造成任務丟失的問題。

參考資料

Python內置函數property()使用實例
紅黑樹 vs 最小堆
shelve -- 用來持久化任意的Python對象

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,333評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,491評論 3 416
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,263評論 0 374
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,946評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,708評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,186評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,255評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,409評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,939評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,774評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,976評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,518評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,209評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,641評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,872評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,650評論 3 391
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,958評論 2 373