PaddlePaddle作為國內首個深度學習框架,最近發布了更加強大的Fluid1.2版本, 增加了對windows環境的支持,全面支持了Linux、Mac、 windows三大環境。
PaddlePaddle在功能完備的基礎上,也盡量秉承易學易用的特點,在Windows的安裝方面,體現了一鍵式的特點,大部分情況下,只需要一條簡單的命令就可以完成安裝。
用戶在使用的過程中可能會面對安裝和編譯方面的問題,下面就從這兩個方面來分別說明。
一、安裝
在深度學習框架上, python語言由于本身的易用性和豐富的類庫,被眾多深度學習框架作為了應用方面的首選,PaddlePaddle也將python語言作為了自己的應用語言,如下介紹在python下怎么安裝PaddlePaddle。-
1. 系統檢查
PaddlePaddle目前支持windows7,8,10系列的專業和企業版本,且只支持64位的操作系統。
PaddlePaddle目前支持的python版本覆蓋了2.7,3.5,3.6,3.7版本,基本上包含了目前主流使用的所有python版本,可以通過如下方式檢查操作系統和python版本情況?
>>>import platform
>>>platform.architecture()
('64bit','WindowsPE') # 64 bits on windows 64 bits
>>> platform.version()
'10.0.17134' # windows 10
>>> platform.python_version()
'2.7.15' # python 2.7
如筆者自己的系統就顯示了如上信息。
2. 拉取安裝包的方式
Paddlepaddle可以選擇通過pip命令在線或離線安裝,下面展示一下如何離線下載安裝包。
PaddlePaddle的安裝包已經放到了python官方支持的發布渠道上,打開PyPI官方網站,按圖中所示輸入Paddlepaddle,
用戶將會得到當前所有的Paddlepaddle安裝包,根據系統和python版本號選擇對應版本即可
3. 安裝過程
如果是在線安裝,用戶直接輸入 pip install paddlepaddle即可正常安裝。
如果是離線安裝,用戶輸入 pip install paddlepaddle_xxx.whl 包也可以完成安裝。
通常情況下pip命令伴隨python安裝包一起已經得到安裝,如果用戶發現自己沒有安裝pip,可以到PyPA
Documentation,按照提示安裝pip即可。
如果出現錯誤,用戶可以檢查
請使用管理員權限賬戶操作(比如Administrator賬號),并確保使用64位python(查看系統檢查章節)
[MO用1]?
通過 控制面板 – 賬號 – 管理用戶賬號 即可看到如上界面。
4. 安裝完成檢查
安裝完成后,用戶可以打開python命令,輸入如下語句,
>>> import paddle.fluid
>>> print(paddle.__version__)
1.2.0 # 當前paddle版本
如果出現錯誤,用戶可以檢查
1. PaddlePaddle依賴python的動態庫,如果當前python沒有選擇安裝到環境變量,則可能出現找不到依賴庫的情況,用戶可以在如下圖中加入環境路徑,再次啟動即可。
二、編譯
不想自己做編譯的用戶可以直接跳過此節。
一、 前期準備
1. 環境檢查
當前paddle的編譯只支持window10 專業/企業版本。
2. 工具準備
2.1 請安裝Visual Studio 2015 update3版本。
2.2 下載cmake 3.0及以上版本 安裝
2.3 下載git安裝
2.4 下載python安裝,請注意當前支持版本為2.7,3.5,3.6,3.7
2.4.1 下載pip安裝
2.4.2 請運行 pip install protobuf numpy wheel?
二、編譯過程
Paddlepaddle的編譯過程需要保證網絡可用,因為部分依賴包需要通過網絡環境獲取。Paddlepaddle編譯需要訪問GitHub。
1. 用戶需要到 GitHub PaddlePaddle 下載源代碼,選擇 release 1.2 分支,下載zip包或者 通過命令
a. git clone https://github.com/paddlepaddle/paddle
b. cd paddle
c. git checkout release /1.2
2. 在源代碼目錄下,建一個build子目錄并進入
3. 運行cmake .. -G "Visual Studio 14 2015 Win64" -DPYTHON_INCLUDE_DIR=${PYTHON_INCLUDE_DIRS} -DPYTHON_LIBRARY=${PYTHON_LIBRARY} -DPYTHON_EXECUTABLE=${PYTHON_EXECUTABLE} -DWITH_FLUID_ONLY=ON -DWITH_GPU=OFF -DWITH_TESTING=OFF -DCMAKE_BUILD_TYPE=Release
a. 其中PYTHON_INCLUDE_DIRS指的是python的include目錄,比如 c:\Python35\include\
b. 其中PYTHON_LIBRARY指定是pythonxx.lib所在的目錄,比如c:\Python35\libs\
c. 其中PYTHON_EXECUTABLE指的是python.exe,比如c:\Python35\ python.exe
d. 其中DWITH_FLUID_ONLY=ON指的是paddlepaddle在windows下只支持fluid版本
e. 其中WITH_GPU=OFF指的是paddlepaddle當前只支持CPU
f. 其中WITH_TESTING=OFF指的是關閉測試
g. 其中CMAKE_BUILD_TYPE=Release指的是只支持Release編譯
h. 其中-G "Visual Studio 14 2015 Win64"指的是只支持VS2016的64bit編譯
4. 目錄下會生成paddle.sln文件,用Visual Studio 2015打開,選擇64位Release模式,開始編譯。
三、編譯完成檢查
1. 檢查方法
如果編譯過程不出錯則表明編譯成功,用戶可以到 build\python\dist 目錄下查找對應的生成 whl 文件。
2. 常見編譯問題
【問】為什么我的paddle.sln文件沒有生成?
【答】請按編譯過程要求檢查是安裝了指定的軟件和版本
【問】編譯過程中為什么出現ssl一類的網絡錯誤?
【答】編譯過程需要訪問網絡,請檢查系統代理和網絡連通情況。
【問】whl文件為什么沒有生成?
【答】請按編譯過程要求檢查python的變量是否正確設置。
三、訓練模型檢測
1. 導入網絡
PaddlePaddle在使用方面為了貼合用戶需求,盡量做到了將復雜的概念簡化,深度學習用戶將網絡結構會理解為多個層結構的疊加,相對應的,PaddlePaddle也對應的有了層的封裝。
在定義網絡方面,用戶可以統一使用fluid.layers里面定義好的結構,來方面的構建一個神經網絡結構,比如
# Include libraries.
import?paddle
import?paddle.fluid?as?fluid
import?numpy
# Configure the neural network.
def?net(x, y):
y_predict = fluid.layers.fc(input=x, size=1, act=None)
cost = fluid.layers.square_error_cost(input=y_predict, label=y)
avg_cost = fluid.layers.mean(cost)
return?y_predict, avg_cost
2. 定義訓練和預測函數
訓練和預測方面,可以統一成為輸入,計算和輸出三個大的方面,用戶可以使用fluid.layers.data來定義輸入數據,對應在具體在執行層面,executor的run函數中,使用feed來接受輸入數據。
下面可以定義預測函數和訓練函數,示例?
# Define train function.
def?train(save_dirname):
x = fluid.layers.data(name='x', shape=[13], dtype='float32')
y = fluid.layers.data(name='y', shape=[1], dtype='float32')
y_predict, avg_cost = net(x, y)
sgd_optimizer = fluid.optimizer.SGD(learning_rate=0.001)
sgd_optimizer.minimize(avg_cost)
train_reader = paddle.batch(
paddle.reader.shuffle(paddle.dataset.uci_housing.train(), buf_size=500),
batch_size=20)
place = fluid.CPUPlace()
exe = fluid.Executor(place)
def?train_loop(main_program):
feeder = fluid.DataFeeder(place=place, feed_list=[x, y])
exe.run(fluid.default_startup_program())
PASS_NUM = 1000
for?pass_id?in?range(PASS_NUM):
total_loss_pass = 0
for?data?in?train_reader():
avg_loss_value, = exe.run(
main_program, feed=feeder.feed(data), fetch_list=[avg_cost])
total_loss_pass += avg_loss_value
if?avg_loss_value < 5.0:
if?save_dirname?is?not?None:
fluid.io.save_inference_model(
save_dirname, ['x'], [y_predict], exe)
return
print("Pass %d, total avg cost = %f" % (pass_id, total_loss_pass))
train_loop(fluid.default_main_program())
# Infer by using provided test data.
def?infer(save_dirname=None):
place = fluid.CPUPlace()
exe = fluid.Executor(place)
inference_scope = fluid.core.Scope()
with?fluid.scope_guard(inference_scope):
[inference_program, feed_target_names, fetch_targets] = (
fluid.io.load_inference_model(save_dirname, exe))
test_reader = paddle.batch(paddle.dataset.uci_housing.test(), batch_size=20)
test_data = test_reader().next()
test_feat = numpy.array(map(lambda?x: x[0], test_data)).astype("float32")
test_label = numpy.array(map(lambda?x: x[1], test_data)).astype("float32")
results = exe.run(inference_program,
feed={feed_target_names[0]: numpy.array(test_feat)},
fetch_list=fetch_targets)
print("infer results: ", results[0])
print("ground truth: ", test_label)
2. 執行訓練和預測
接著可以簡單調用上面定義函數,訓練過程會產生輸出,用戶可以自定義輸出目錄,在后面的預測過程中,加載訓練輸出的模型?
# Run train and infer.
if?__name__ == "__main__":
save_dirname = "fit_a_line.inference.model"
train(save_dirname)
infer(save_dirname)
程序將輸出預測結果,比如在筆者的環境中輸出為(僅作參考,用戶環境可能有出入)
非常歡迎您為PaddlePaddle貢獻文檔,我們的文檔在PaddlePaddle/FluidDoc (GitHub PaddlePaddle專區中的FluidDoc) 中統一管理,如您對PaddlePaddle有任何問題,也非常歡迎您在此Repo提交Issue,您的反饋是我們進步的動力