最新開源項目精選(語義分割、圖片上色、AI游戲、照片修補、圖像描述)

姓名:蘆凱 ? ? ?學(xué)號:17011210546

轉(zhuǎn)載自:習(xí)悅智能公眾號,原文鏈接:https://mp.weixin.qq.com/s/_-FYWQvey9VXsfYiPSZn5w

【嵌牛導(dǎo)讀】GITHUB最新開源項目精選

【嵌牛鼻子】GITHUB,開源項目,人工智能

【嵌牛提問】github最新開源項目有哪些?

【嵌牛正文】

1 基于手機的實時語義分割

項目簡介:

????該項目受到MobileNets和U-Net的啟發(fā),提出了一種架構(gòu)叫做MobileUNet,用于實現(xiàn)頭發(fā)部分的語義分割。作為一個典型的U-Net架構(gòu),本文的網(wǎng)絡(luò)包含編碼器及解碼器,其中的卷積單元基于MobileNet中的思路,是depthwise結(jié)構(gòu)的。編碼器將輸入圖片縮小至32分之一的尺寸大小,之后解碼器將其恢復(fù)至原來的二分之一。最終,網(wǎng)絡(luò)輸出和輸入圖像等尺寸的預(yù)測結(jié)果。項目可以在手機或其他安卓移動設(shè)備端實時運行,精度和速度都還不錯。

????項目采用的數(shù)據(jù)集為LFW,可以獲得0.89的IoU。除了U-Net模型之外,作者還嘗試了PSPNet模型,但是效果不佳。作者認(rèn)為可能是全局的上下文信息對于頭發(fā)的識別來說沒有重要的輔助作用。作者在不同的手機上測試了性能,最終iPhone 7 勝出。

項目環(huán)境:

Keras 2、TensorFlow

項目地址:

https://github.com/akirasosa/mobile-semantic-segmentation

2 黑白圖片自動上色

項目簡介:

????使用神經(jīng)網(wǎng)絡(luò)對圖片進行風(fēng)格化渲染是計算機視覺領(lǐng)域的熱門應(yīng)用之一,如為自己的照片賦予梵高的油畫風(fēng)格。彩色渲染也是對圖片的風(fēng)格處理方法之一,可以將黑白老照片變成現(xiàn)代化的彩色照片。現(xiàn)在很多彩色上色工作都由人工手工完成,通過photoshop對圖片進行層層處理,動輒需要花費幾個月的時間,比如,對一張臉進行上色處理,需要設(shè)計20層圖層,工作量真大可以想象。

????人工智能的發(fā)展為黑白圖片自動上色帶來了可能。Reddit社區(qū)用戶Amir Avni提出了一種基于深度學(xué)習(xí)的上色機器人,其效果可媲美大師級著色水平。其技術(shù)核心在于,將自動著色轉(zhuǎn)換為發(fā)現(xiàn)灰度與彩色之間的特征聯(lián)結(jié)。我們知道,在黑白圖像中,圖片為單通道的,每個像素值代表了亮度,取值區(qū)間為0-255,代表了由白色到黑色的灰度區(qū)間。而彩色圖像包含3個通道,即RGB紅綠藍通道,取值區(qū)間同樣為0-255.通過深度學(xué)習(xí)構(gòu)建深層神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)灰色圖像與彩色圖像對應(yīng)的關(guān)系。

項目環(huán)境:

Floyd開放云平臺

項目鏈接:

https://blog.floydhub.com/colorizing-b&w-photos-with-neural-networks/

3

用Tensorflow構(gòu)建游戲AI

項目簡介:

????DeepMind 開放的 AlphaGo將強化學(xué)習(xí)(reinforce learning)帶向了大眾視野,基于強化學(xué)習(xí)教會機器人自動下象棋、讓計算機自己學(xué)著玩經(jīng)典游戲 Atari等。強化學(xué)習(xí)起初看似非常有挑戰(zhàn)性,但其實要入門并不困難。本項目作者基于 Keras創(chuàng)建一個簡單機器人,并教會它玩 Catch 游戲。Catch 是一個非常簡單的街機游戲,游戲規(guī)則也很簡單:水果從屏幕的頂部落下,玩家必須用一個籃子抓住它們;每抓住一個水果,玩家得一分;每漏掉一個水果,玩家會被扣除一分。

????項目中采用了黑白色簡化版的游戲界面,小人用底部的白色方框表示,水果用正方形的白色小方塊表示。所謂強化學(xué)習(xí),即系統(tǒng)在一次次嘗試中,吸收成功或失敗的經(jīng)驗,自己學(xué)習(xí)成長,屬于無監(jiān)督學(xué)習(xí)的一種,沒有明確的標(biāo)簽指示。在此項目中,同樣不提供哪些是屬于正確的行為,而是給予相應(yīng)的處罰和獎勵。在 Catch 游戲中,只有在水果掉到籃子里或是撞到地板上時你才會獲得獎勵。

項目環(huán)境:

Tensorflow、Keras

項目鏈接:

https://medium.freecodecamp.org/deep-reinforcement-learning-where-to-start-291fb0058c01

4 人臉照片的自動補全

項目簡介:

????內(nèi)容識別填充是一個強大的工具,設(shè)計師和攝影師可以用它來填充圖片中不想要的部分或者缺失的部分。在填充圖片的缺失或損壞的部分時,圖像補全和修復(fù)是兩種密切相關(guān)的技術(shù)。有很多方法可以實現(xiàn)內(nèi)容識別填充,圖像補全和修復(fù)。

????該項目基于Raymond Yeh 和 Chen Chen 等人的一篇論文,“基于感知和語境損失的圖像語義修補( Semantic Image Inpainting with Perceptual and Contextual Losses)”。論文介紹了如何使用 DCGAN 網(wǎng)絡(luò)來進行圖像補全。圖像補全包含三個步驟:將圖像理解為一個概率分布的樣本;學(xué)習(xí)如何生成偽圖片;找到最適合填充回去的偽圖片。

項目環(huán)境:

Tensorflow

項目鏈接:

http://bamos.github.io/2016/08/09/deep-completion/bamos/dcgan-completion.tensorflow

5 自動生成照片文本描述

項目簡介:

????圖像對于很多人來講一目了然,然而對于盲人等存在視覺障礙的人群來說,文本描述能夠幫助他們了解、想象一幅圖片中的內(nèi)容。此外,基于照片的文本描述還具有照片管理、分類等多種功能。

????早在2015年,谷歌Brain團隊發(fā)布了圖片描述模型,該模型結(jié)構(gòu)與NeuralTalk2相仿,但是用了一些trick使得性能精度更高。本項目中作者本著入門的目的,展示了一個基于Torch的圖片描述模型。

項目環(huán)境:

Torch

項目鏈接:

https://github.com/karpathy/neuraltalk2

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容