本文是 WWDC 2019 Session 430的讀后感,其視頻及配套 PDF 文稿鏈接如下:Introducing the Create ML App。
本文首先介紹 Create ML 的背景知識(shí),然后講解全新 Create ML App 的進(jìn)步,最后介紹 Create ML 所對(duì)應(yīng)的使用場(chǎng)景。
查閱全部 WWDC 2019 專(zhuān)欄內(nèi)容,點(diǎn)擊此處前往小專(zhuān)欄。
Create ML 的背景
Create ML 是蘋(píng)果于2018年 WWDC 推出的生成機(jī)器學(xué)習(xí)模型的工具。它可以接收用戶(hù)給定的數(shù)據(jù),生成 iOS 開(kāi)發(fā)中需要的機(jī)器學(xué)習(xí)模型(Core ML 模型)。
iOS 開(kāi)發(fā)中,機(jī)器學(xué)習(xí)模型的獲取主要有以下幾種:
從蘋(píng)果的官方主頁(yè)下載現(xiàn)成的模型。2017年有4個(gè)現(xiàn)成的模型,2018年有6個(gè),今年增加到了9個(gè)(8個(gè)圖片、1個(gè)文字),數(shù)量有限,進(jìn)步速度緩慢。
用第三方的機(jī)器學(xué)習(xí)框架生成模型,再用 Core ML Tools 轉(zhuǎn)成 Core ML 模型。2017年蘋(píng)果宣布支持的框架有6個(gè),包括 Caffee、Keras。2018年宣布支持的第三方框架增加到了11個(gè),包括了最知名的 TensorFlow、IBM Watson、MXNet。至此 Core ML 已經(jīng)完全支持市面上所有主流的框架。
用 Create ML 直接訓(xùn)練數(shù)據(jù)生成模型。2018年推出的初代 Create ML有三個(gè)特性:使用 Swift 編程進(jìn)行操作、用 Playground 訓(xùn)練和生成模型、在 Mac OS 上完成所有工作。
今年的 Create ML 在易用性上更進(jìn)一步:無(wú)需編程即可完成操作、獨(dú)立成單獨(dú)的 Mac OS App、支持更多的數(shù)據(jù)類(lèi)型和使用場(chǎng)景。
Create ML App 的主要功能
去年推出的 Create ML 的工作流程是這樣的:定義數(shù)據(jù)源 -> 用數(shù)據(jù)源訓(xùn)練并生成模型 -> 驗(yàn)證和測(cè)試 -> 保存模型。整個(gè)過(guò)程需要在 Playground 中編寫(xiě) Swift 代碼,示例代碼如下:
import Foundation
import CreateML
// 定義數(shù)據(jù)源
let trainDirectory = URL(fileURLWithPath: "/Users/createml/Desktop/Fruits")
let testDirectory = URL(fileURLWithPath: "/Users/createml/Desktop/TestFruits")
// 訓(xùn)練模型
let model = try MLImageClassifier(trainingData: .labeledDirectories(at: trainDirectory))
// 評(píng)估模型
let evaluation = model.evaluation(on: .labeledDirectories(at: testDirectory))
// 保存模型
try model.write(to: URL(fileURLWithPath: "/Users/createml/Desktop/FruitClassifier.mlmodel"))
今年的 Create ML App 成為了一個(gè)單獨(dú)的 Mac OS 應(yīng)用,它的工作流程不變,但操作卻是異常簡(jiǎn)便,這里我們以花朵圖片分類(lèi)器為例:
打開(kāi) Create ML App。打開(kāi) Xcode,選擇左上菜單 Xcode 選項(xiàng),在開(kāi)發(fā)者工具中找到 Create ML,點(diǎn)擊打開(kāi)。
選擇模型類(lèi)型并導(dǎo)入數(shù)據(jù)。選擇模型類(lèi)型為圖片分類(lèi)器,輸入名稱(chēng)并保存。接著將準(zhǔn)備好的訓(xùn)練數(shù)據(jù)(花朵圖片)導(dǎo)入 Create ML App 中,這里可以直接拖拽,也可以通過(guò)左上角文件菜單導(dǎo)入。
- 訓(xùn)練模型。點(diǎn)擊左上角運(yùn)行按鈕,Create ML 一鍵訓(xùn)練并生成花朵圖片分類(lèi)器模型,期間我們能看到模型的訓(xùn)練進(jìn)度、對(duì)于不同花朵圖片的分類(lèi)情況。
- 評(píng)估模型。同導(dǎo)入訓(xùn)練數(shù)據(jù)一樣,我們只需切換到測(cè)試一欄,然后將準(zhǔn)備好的測(cè)試圖片拖拽至測(cè)試框中,接著點(diǎn)擊下方測(cè)試按鈕即可。
- 觀(guān)察模型。至此我們已經(jīng)生成了需要的花朵圖片分類(lèi)器,我們可以點(diǎn)擊輸出一欄對(duì)其屬性進(jìn)行觀(guān)察。
整個(gè)操作無(wú)需任何編程,即使是幾百?gòu)垐D片也只需幾秒鐘即可生成對(duì)應(yīng)模型。不僅如此,新的 Create ML App 提供的信息相比于之前的 Playground,也更加豐富、精確、簡(jiǎn)潔。
Create ML 的應(yīng)用場(chǎng)景
去年的 Create ML 支持圖片、文本、表格3種場(chǎng)景,今年增加到了5個(gè)為圖片、文本、表格、聲音、活動(dòng)5種。
圖片:圖片分類(lèi)器、目標(biāo)識(shí)別。應(yīng)用場(chǎng)景如上文中的花朵分類(lèi)、藝術(shù)照特征提取、撲克牌牌面識(shí)別。其進(jìn)步在于,模型生成方面運(yùn)用了遷移學(xué)習(xí)和深度學(xué)習(xí)、內(nèi)部集成了數(shù)據(jù)增強(qiáng)、模型也縮小了尺寸,也就是說(shuō)應(yīng)用場(chǎng)景更廣、準(zhǔn)確性更高、移動(dòng)端適配性更好。
文本:文本分類(lèi)器、單詞標(biāo)注。應(yīng)用場(chǎng)景如提取長(zhǎng)文本關(guān)鍵信息、判段文本反應(yīng)出的情緒等。蘋(píng)果在 Core ML 框架上層還有專(zhuān)門(mén)的自然語(yǔ)言處理框架(NLP),它所能解決的文本問(wèn)題更多、更加的高度定制化、也更加準(zhǔn)確和易用。
表格:表格分類(lèi)器、表格回歸、推薦系統(tǒng)。應(yīng)用場(chǎng)景如根據(jù)某一物品特征判定其類(lèi)別及用戶(hù)滿(mǎn)意度、根據(jù)用戶(hù)喜好推薦商品等。
聲音:音頻分類(lèi)器。應(yīng)用場(chǎng)景為識(shí)別音頻類(lèi)別。蘋(píng)果現(xiàn)場(chǎng)展示了用一段音頻來(lái)訓(xùn)練模型,模型可以自動(dòng)識(shí)別出掌聲和不同樂(lè)器發(fā)出的聲音。注意聲音方面雖然剛起步,但潛力很大,因?yàn)檎Z(yǔ)音識(shí)別、語(yǔ)音轉(zhuǎn)文字、文字轉(zhuǎn)語(yǔ)音都還可以深度集成在各種 App 中。另外 Apple Watch 也針對(duì)聲音模型訓(xùn)練進(jìn)行了硬件層面的加速優(yōu)化,相信未來(lái)它會(huì)更加強(qiáng)大。
活動(dòng):活動(dòng)分類(lèi)器。應(yīng)用場(chǎng)景主要集中在運(yùn)動(dòng)方面。例如可以通過(guò) Apple Watch 收集的加速度、經(jīng)緯度、方向、海拔等信息訓(xùn)練出模型。蘋(píng)果展示了利用飛盤(pán)(Frisbee)運(yùn)動(dòng)中獲取的信息訓(xùn)練出的活動(dòng)分類(lèi)器模型,它可以自動(dòng)區(qū)分出正手、反手等動(dòng)作,以幫助運(yùn)動(dòng)員評(píng)估比賽表現(xiàn)和狀態(tài)。
蘋(píng)果自己也將 Create ML 和 Core ML 深度運(yùn)用在了其 iOS 系統(tǒng)中:系統(tǒng)自帶的圖片應(yīng)用中,其搜索功能就運(yùn)用了單詞標(biāo)注和圖片分類(lèi)器模型,它可以快速準(zhǔn)確得標(biāo)注搜索內(nèi)容,并將分類(lèi)的圖片搜索出來(lái)。請(qǐng)注意這些內(nèi)容都是在手機(jī)上獨(dú)立完成,無(wú)需網(wǎng)絡(luò)和服務(wù)器端的操作,這樣用戶(hù)的隱私也得到了充分保護(hù)。
總結(jié)
Create ML App 的獨(dú)立使得其靈活性和功能再一步增強(qiáng)。零門(mén)檻的操作、豐富的使用場(chǎng)景、原生系統(tǒng)的支持使得 App 開(kāi)發(fā)者可以更自由得定義和使用機(jī)器學(xué)習(xí)。雖然難與 TensorFlow、Pytorch 等專(zhuān)業(yè)框架相提并論,但在開(kāi)發(fā) App 上,Create ML 已經(jīng)可以滿(mǎn)足用戶(hù)的絕大多數(shù)需求。Create ML 的最大優(yōu)點(diǎn)在于,它是以用戶(hù)需求為驅(qū)動(dòng)、完全服務(wù)于 App 開(kāi)發(fā),相信在 iOS 13 后越來(lái)越多的開(kāi)發(fā)者將會(huì)采用 Creat ML 和 Core ML 開(kāi)發(fā)應(yīng)用。