航空業每時每刻都要處理大量的數據,是一個很好的可以利用大數據分析和機器學習技術創造價值的領域,在航行數據、天氣數據、顧客行為數據等多個角度和層次都可以進行挖掘。本文將選取航行燃油預測這個角度入手簡要介紹大數據分析在航空領域的實踐,是對項目流程和通用方法的總結,并不涉及到具體的業務邏輯和算法實現。
業務和技術的雙重驅動
飛機的航行燃油一直占據著航空業成本的很大比例,13年左右是國際油價高漲時期,燃油費用最高可以達到總成本的50%,目前油價下跌,情況有所好轉,但是仍然占據至少15%。
航行燃油可以簡單地劃分為決策性燃油和非決策性燃油,決策性燃油是指部分燃油的分配由機組人員人為決策。
由于決策性燃油的經驗的成分很大,這個過程必然導致油量的不確定性,多帶燃油會增加油耗,因為多帶的油要占據重量從而消耗油量,即導致所謂的攜帶消耗成本。有關數據顯示,空客A321攜帶7噸燃油時,攜帶消耗成本已經達到20%左右。航空公司每年因過量攜帶燃油會產生數百萬美元的開支。但是少帶燃油則有可能產生安全問題,關乎乘客的生命和財產安全。所以,燃油攜帶量要能達到攜帶消耗成本和用油安全的平衡,這對于人為決策來講,顯然是一個很大的挑戰。
另一方面,從技術角度來講,現在大數據時代來了,數據的存儲和管理成本越來越高,但是一直沒有去充分使用,那么說這本身就是一種浪費,如何充分挖掘這些數據來創造價值,實現從人為決策到數據驅動到一個轉變,燃油預測是一個很好的切入點。
燃油的預測和推薦
在進行燃油的預測和推薦時,我們會面臨如下問題:
-
哪些燃油可以被優化
由于各個航空公司的燃油控制策略是不一樣的,在滑行、爬升、交通空中管制等階段的決策性燃油是不統一的,這需要根據其具體的策略和歷史燃油數據來分析哪些燃油可以被優化,對于一些歷史燃油數據較少的航空公司,則還要進行一段時間的數據采集才能做出決定。
航班的不同階段-圖片來源https://ntrs.nasa.gov/archive/nasa/casi.ntrs.nasa.gov/20030068171.pdf 如何與已有系統集成
一般來說,航空公司已經搭建好了自己的航班管理或者燃油管理系統,燃油推薦系統的輸入數據來自于已有系統,譬如航班飛行數據、航班實際燃油數據等,的而輸出數據要被燃油管理系統調用,然后加油員才可以獲取到推薦的燃油。與已有系統集成時要保障服務的高可用性。-
如何建模
建模通常是要利用機器學習算法建立起燃油數據和其他因素之間的關系,即其他因素是因變量,需要預測的燃油數據是目的變量:
建模階段需要行業專家、數據科學家和軟件架構師等角色的共同參與,要完成算法和技術的選型,模型的訓練和優化調整要經歷數據收集->數據建模->結果預測
多次循環的過程。
系統框架分析
數據收集、數據建模和結果預測三階段的系統框架:
在數據采集階段,初次建模的歷史數據是需要ETL工具導入的,存入關系型數據庫或分布式文件系統可便于離線分析和建模,而系統開始運行之后,則可以將新的實時數據源源不斷地寫入數據庫,從而可以周期性地進行重新訓練模型,構成了自學習的閉環。
燃油預測系統與已有系統集成: