用Python寫一個命令行火車票查看器

tickets

當你想查詢一下火車票信息的時候,你還在上12306官網嗎?或是打開你手機里的APP?下面讓我們來用Python寫一個命令行版的火車票查看器, 只要在命令行敲一行命令就能獲得你想要的火車票信息!如果你剛掌握了Python基礎,這將是個不錯的小練習。

接口設計

一個應用寫出來最終是要給人使用的,哪怕只是給你自己使用。所以,首先應該想想你希望怎么使用它?讓我們先給這個小應用起個名字吧,既然及查詢票務信息,那就叫它tickets好了。我們希望用戶只要輸入出發站,到達站以及日期就讓就能獲得想要的信息,所以tickets應該這樣被使用:


$ tickets from to date

另外,火車有各種類型,高鐵、動車、特快、快速和直達,我們希望可以提供選項只查詢特定的一種或幾種的火車,所以,我們應該有下面這些選項:

  • -g 高鐵
  • -d 動車
  • -t 特快
  • -k 快速
  • -z 直達

這幾個選項應該能被組合使用,所以,最終我們的接口應該是這個樣子的:

$ tickets [-gdtkz] from to date

接口已經確定好了,剩下的就是實現它了。

開發環境

寫Python程序的一個良好實踐是使用virtualenv這個工具建一個虛擬的環境。我們的程序使用Python3開發,下面在你的工作目錄下建一個文件夾tickets,進去創建一個虛擬環境:

$ virtualenv -p /usr/bin/python3 venv

通過下面的命令激活它:

$ . venv/bin/activate

解析參數

Python有很多寫命令行應用的工具,如argparse, docopt, options...這里,我們選用docopt這個簡單易用的工具,我們先安裝它:

$ pip3 install docopt

docopt可以按我們在文檔字符串中定義的格式來解析參數,在tickets.py中:

# coding: utf-8

"""Train tickets query via command-line.

Usage:
    tickets [-gdtkz] <from> <to> <date>

Options: 
    -h,--help        顯示幫助菜單
    -g               高鐵
    -d               動車
    -t               特快
    -k               快速
    -z               直達

Example:
    tickets 南京 北京 2016-07-01
    tickets -dg 南京 北京 2016-07-01
"""
from docopt import docopt

def cli():
    """command-line interface""" 
    arguments = docopt(__doc__)
    print(arguments)

if __name__ == '__main__': 
    cli()

下面我們運行一下這個程序:


$ python3 tickets.py 上海 北京 2016-07-01

我們得到下面的參數解析結果:

{'-d': False, '-g': False, '-k': False, '-t': False, '-z': False, '<date>': '2016-07-01', '<from>': '上海', '<to>': '北京'}

獲取數據

參數已經解析好了,下面就是如何獲取數據了,這也是最主要的部分。首先我們打開12306,進入余票查詢頁面,如果你使用chrome,那么按F12打開開發者工具,選中Network一欄,在查詢框鐘我們輸入上海北京,日期2016-07-01, 點擊查詢,我們在調試工具發現,查詢系統實際上請求了這個URL

https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-07-01&from_station=SHH&to_station=BJP

并且返回的是JSON格式的數據!接下來問題就簡單了,我們只需要構建請求URL然后解析返回的JSON數據就可以了。但是我們發現,URL里面from_stationto_station并不是漢字,而是一個代號,而用戶輸入的是漢字,我們要如何獲取代號呢?我們打開網頁源碼看看有沒有什么發現。

啊哈!果然,我們在網頁里面找到了這個鏈接:點我, 這里面貌似是包含了所有車站的中文名,拼音,簡寫和代號等信息, 我們在項目目錄下將它保存為stations.html。但是這些信息擠在一起,而我們只想要中文名和大寫字母的代號信息,怎么辦呢?

BINGO!正則表達式,我們寫個小腳本來匹配提取出想要的信息吧, 在parse.py中:

# coding: utf-8
import re
from pprint import pprint

with open('stations.html', 'r') as f:
    text = f.read()
    stations = re.findall(u'([\u4e00-\u9fa5]+)\|([A-Z]+)', text)
    pprint(dict(stations), indent=4)

我們運行這個腳本,它將以字典的形式返回所有車站和它的大寫字母代號, 我們將結果重定向到stations.py中,

$ python3 parse.py > stations.py

我們為這個字典加名字,stations, 最終,stations.py文件是這樣的:


stations = {    
    '一間堡': 'YJT',
    '一面坡': 'YPB',
     ... 
    '龍鎮': 'LZA',
    '龍骨甸': 'LGM'
}

現在,用戶輸入車站的中文名,我們就可以直接從這個字典中獲取它的字母代碼了:

...
from stations import stations

def cli():
    arguments = docopt(__doc__)
    from_staion = stations.get(arguments['<from>'])
    to_station = stations.get(arguments['<to>'])
    date = arguments['<date>']
    # 構建URL
    url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format(
        date, from_staion, to_station
)

萬事俱備,下面我們來請求這個URL獲取數據吧!這里我們使用requests這個庫, 先安裝它:

$ pip3 install requests

它提供了非常簡單易用的接口,

...
import requests

def cli():
    ...
    # 添加verify=False參數, 不驗證證書
    r = requests.get(url, verify=False)
    print(r.json())

從結果中,我們可以觀察到,與車票有關的信息需要進一步提取:

def cli():
    ...
    r = requsets.get(url);
    rows = r.json()['data']['datas']

顯示結果

數據已經獲取到了,剩下的就是提取我們要的信息并將它顯示出來。prettytable這個庫可以讓我們它像MySQL數據庫那樣格式化顯示數據。

$ pip3 install prettytable

這樣使用它:

...
from prettytable import PrettyTable

def cli():
    ...
    headers = '車次 車站 時間 歷時 商務 一等 二等 軟臥 硬臥 軟座 硬座 無座'.split()
    pt = PrettyTable()
    pt._set_field_names(headers)
    for row in rows:
    # 從row中根據headers過濾信息, 然后調用pt.add_row()添加到表中
        ...
    print(pt)

練習

下面一些問題留給你做練習:

  • 從每一行row中按照headers過濾信息,將結果添加到prettytable中
  1. 像開始的圖片中那樣將出發站和到達站,出發時間和到達時間顯示為一列

  2. 添加顏色(提示:使用colorama, termcorlor或ANSI轉義字符)

  3. 添加異常處理,如果用戶輸入的車站或日期有錯誤怎么辦?如果網絡異常怎么辦?...

  4. 添加更多的日期格式支持: 比如用戶輸入20160701也可以查

  5. 添加參數支持,用戶可以指定火車類型

如果你還有問題,可以去github查看源碼, 或者來我的博客下面提問:

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容