Machine Learning

機器學(xué)習(xí)

一個很棒的機器學(xué)習(xí)框架、庫和軟件的精選列表(按語言)。靈感來自於 awesome-php。

計算機視覺

Scikit-Image?- Python 中圖像處理算法的集合。

Scikit-Opt?- Python 中的群智能(Python 中的遺傳算法、粒子群優(yōu)化、模擬退火、蟻群算法、免疫算法、人工魚群算法)

SimpleCV?- 一個開源計算機視覺框架,可以訪問多個高性能計算機視覺庫,例如 OpenCV。用 Python 編寫,可在 Mac、Windows 和 Ubuntu Linux 上運行。

Vigranumpy? - VIGRA C++ 計算機視覺庫的 Python 綁定。

OpenFace?- 使用深度神經(jīng)網(wǎng)絡(luò)進行免費和開源的人臉識別。

face_recognition?- 從 Python 或命令行識別和操作人臉的人臉識別庫。

dockerface?- 易于安裝和使用的對于 docker 容器中的圖像和視頻深度學(xué)習(xí) Faster R-CNN 人臉檢測.

detectron2?- FAIR 用于目標(biāo)檢測和分割的下一代研究平臺。它是對之前版本 Detectron 的徹底重寫,由 PyTorch 深度學(xué)習(xí)框架提供支持。

albumentations?- 一個快速且框架不可知的圖像增強庫,它實現(xiàn)了多種增強技術(shù)。支持開箱即用(?out of the box)的分類、分割、檢測。曾在 Kaggle、Topcoder 和那些作為 CVPR 研討會一部分的深度學(xué)習(xí)競賽中獲勝。

pytessarct? - Python-tesseract 是 Python 的光學(xué)字符識別(OCR)工具。也就是說,它將識別并“讀取”嵌入在圖像中的文本。 Python-tesseract 是 Google 的 Tesseract-OCR 引擎的包裝器。

imutils - 一個包含Convenience functions的庫,可以使用 OpenCV 和 Python 使基本的圖像處理操作(如平移、旋轉(zhuǎn)、調(diào)整大小、骨架化和顯示 Matplotlib 圖像更容易)。

PyTorchCV?- 基于 PyTorch 的計算機視覺深度學(xué)習(xí)框架。

Neuro-style-pt - Justin Johnson 的神經(jīng)風(fēng)格(神經(jīng)風(fēng)格轉(zhuǎn)移)的 PyTorch 實現(xiàn)。

Detecto - 用 5-10 行代碼訓(xùn)練和運行計算機視覺模型。

Neuro-dream - DeepDream 的 PyTorch 實現(xiàn)。

Openpose - 用于身體、面部、手和腳估計的實時多人關(guān)鍵點檢測庫

Deep High-Resolution-Net - CVPR2019 論文“Deep High-Resolution Representation Learning for Human Pose Estimation”的 PyTorch 實現(xiàn)

Dream-creator - DeepDream 的 PyTorch 實現(xiàn)。允許個人使用 DeepDream 的自定義數(shù)據(jù)集快速輕松地訓(xùn)練他們自己的自定義 GoogleNet 模型。

Lucent - Tensorflow 和 OpenAI Clarity 的 Lucid 適用于 PyTorch.

lightly - Lightly 是一種用于自監(jiān)督學(xué)習(xí)的計算機視覺框架。

Learnergy - 基于 PyTorch 的基于能量的機器學(xué)習(xí)模型。

OpenVisionAPI - 基于開源模型的開源計算機視覺 API。


Natural Language Processing(自然語言處理)

pkuseg-python - 更好的jieba版本,由北京大學(xué)開發(fā)。

NLTK - 用于構(gòu)建 Python 程序以處理人類語言數(shù)據(jù)的領(lǐng)先平臺。

Pattern - Python 編程語言的 Web 挖掘模塊。它具有用于自然語言處理、機器學(xué)習(xí)等的工具。

Quepy - 將自然語言問題轉(zhuǎn)換為數(shù)據(jù)庫查詢語言查詢的 Python 框架。

TextBlob - 為深入研究常見的自然語言處理 (NLP) 任務(wù)提供一致的 API。站在 NLTK 和 Pattern 的巨大肩膀上,并與兩者配合得很好。

YAlign - 一個句子對齊器,一個友好的工具,用于從可比較的語料庫中提取平行句子。 [已棄用]

jieba - 中文分詞實用程序。

SnowNLP - 處理中文文本的庫。

spammy - 基于 nltk 構(gòu)建的用于電子郵件垃圾郵件過濾的庫

loso - 另一個中文分割庫。 [已棄用]

genius - 基于條件隨機場的中文段。Genius是一個開源的python中文分詞組件,采用 CRF(Conditional Random Field)條件隨機場算法。

KoNLPy - 用于韓語自然語言處理的 Python 包。

nut - 自然語言理解工具包。 [已棄用]

Rosetta - 文本處理工具和包裝器(例如 Vowpal Wabbit)

BLLIP Parser - BLLIP 自然語言解析器(也稱為 Charniak-Johnson 解析器)的 Python 綁定。 [已棄用]

PyNPl - Python 自然語言處理庫。 Python 的通用 NLP 庫。還包含一些用于解析常見 NLP 格式的特定模塊,最顯著的是 FoLiA,還有 ARPA 語言模型、Moses 短語表、GIZA++ 對齊。

PySS3 - Python 包,它實現(xiàn)了一種用于文本分類的新型白盒機器學(xué)習(xí)模型,稱為 SS3。由于 SS3 能夠直觀地解釋其基本原理,因此該軟件包還附帶易于使用的交互式可視化工具(在線演示)。

python-ucto - Python 綁定到 ucto(用于各種語言的基于 unicode 的規(guī)則標(biāo)記器)。

python-frog - Python 綁定到 Frog,荷蘭語的 NLP 套件。 (pos 標(biāo)記、詞形還原、依賴解析、NER)

python-zpar - ZPar 的 Python 綁定,一種統(tǒng)計詞性標(biāo)注器、選區(qū)解析器和英語依賴解析器。

colibri-core - Python 綁定到 C ++ 庫,用于以快速且節(jié)省內(nèi)存的方式提取和處理基本語言結(jié)構(gòu),例如 n-gram 和 skipgram。

spaCy - 具有 Python 和 Cython 的工業(yè)強度 NLP。

PyStanfordDependencies - 用于將 Penn Treebank 樹轉(zhuǎn)換為 Stanford Dependencies 的 Python 接口。

距離 - Levenshtein 和 Hamming 距離計算。 [已棄用]

Fuzzy Wuzzy - Python 中的模糊字符串匹配。

jellyfish - 用于對字符串進行近似和語音匹配的 Python 庫。

editdistance - 編輯距離的快速實現(xiàn)。

textacy - 基于 Spacy 的更高級別的 NLP。

stanford-corenlp-python - 斯坦福 CoreNLP 的 Python 包裝器 [已棄用]

CLTK - 經(jīng)典語言工具包。

Rasa - 一個“機器學(xué)習(xí)框架,用于自動化基于文本和語音的對話。”

yase - 將句子(或其他序列)轉(zhuǎn)碼為詞向量列表。

Polyglot - 多語言文本 (NLP) 處理工具包。

DrQA - 閱讀維基百科來回答開放領(lǐng)域的問題。

Dedupe - 用于準(zhǔn)確和可擴展的模糊匹配、記錄重復(fù)數(shù)據(jù)刪除和實體解析的 Python 庫。

Snips NLU - 用于意圖分類和實體提取的自然語言理解庫

NeuroNER - 使用神經(jīng)網(wǎng)絡(luò)進行命名實體識別,提供最先進的結(jié)果

DeepPavlov - 具有許多預(yù)訓(xùn)練的俄羅斯 NLP 模型的對話 AI 庫。

BigARTM - 主題建模平臺。

NALP - 基于 Tensorflow 構(gòu)建的自然對抗性語言處理框架。

DL Translate - 一個基于深度學(xué)習(xí)的 50 種語言之間的翻譯庫,使用轉(zhuǎn)換器構(gòu)建。

General-Purpose machine learning (多用途的機器學(xué)習(xí))(通用機器學(xué)習(xí))

Microsoft ML for Apache Spark -> 分布式機器學(xué)習(xí)框架 Apache Spark

Shapley -> 一個數(shù)據(jù)驅(qū)動的框架,用于量化機器學(xué)習(xí)集成中分類器的價值。

igel -> 一個令人愉快的機器學(xué)習(xí)工具,允許您在不編寫代碼的情況下訓(xùn)練/擬合、測試和使用模型

ML 模型構(gòu)建 -> 包含分類、聚類、回歸、推薦筆記本的存儲庫,并帶有插圖來制作它們。

ML/DL 項目模板

PyTorch Geometric Temporal -> 用于動態(tài)圖表示學(xué)習(xí)的 PyTorch Geometric 的時間擴展。

Little Ball of Fur -> NetworkX 的圖形采樣擴展庫,具有類似 Scikit-Learn 的 API。

空手道俱樂部 -> 一個用于 NetworkX 的無監(jiān)督機器學(xué)習(xí)擴展庫,具有類似 Scikit-Learn 的 API。

Auto_ViML -> 快速自動構(gòu)建變體可解釋 ML 模型! Auto_ViML 發(fā)音為“auto vimal”,是一個全面且可擴展的 Python AutoML 工具包,具有不平衡處理、集成、堆疊和內(nèi)置特征選擇。精選在 Medium 文章中。

PyOD -> Python Outlier Detection,全面且可擴展的 Python 工具包,用于檢測多元數(shù)據(jù)中的外圍對象。精選高級模型,包括神經(jīng)網(wǎng)絡(luò)/深度學(xué)習(xí)和異常值集成。

steppy -> 輕量級的 Python 庫,用于快速且可重復(fù)的機器學(xué)習(xí)實驗。引入了一個非常簡單的界面,可以實現(xiàn)干凈的機器學(xué)習(xí)管道設(shè)計。

steppy-toolkit -> 精選的神經(jīng)網(wǎng)絡(luò)、轉(zhuǎn)換器和模型集合,使您的機器學(xué)習(xí)工作更快、更有效。

CNTK - Microsoft Cognitive Toolkit (CNTK),一個開源深度學(xué)習(xí)工具包。文檔可以在這里找到。

Couler - 用于在不同工作流引擎(例如 Argo Workflows、Tekton Pipelines 和 Apache Airflow)上構(gòu)建和管理機器學(xué)習(xí)工作流的統(tǒng)一接口。

auto_ml - 用于生產(chǎn)和分析的自動化機器學(xué)習(xí)。讓您專注于 ML 的有趣部分,同時輸出可用于生產(chǎn)的代碼以及數(shù)據(jù)集和結(jié)果的詳細分析。包括對 NLP、XGBoost、CatBoost、LightGBM 以及即將推出的深度學(xué)習(xí)的支持。

機器學(xué)習(xí) - 由 Web 界面和一組編程界面 API 組成的自動構(gòu)建,用于支持向量機。相應(yīng)的數(shù)據(jù)集存儲在 SQL 數(shù)據(jù)庫中,然后生成的用于預(yù)測的模型存儲在 NoSQL 數(shù)據(jù)存儲中。

XGBoost - 用于 eXtreme Gradient Boosting(樹)庫的 Python 綁定。

Apache SINGA - 一個用于開發(fā)開源機器學(xué)習(xí)庫的 Apache Incubating 項目。

Bayesian Methods for Hackers - 關(guān)于 Python 概率編程的書籍/iPython 筆記本。

Featureforge 一組用于創(chuàng)建和測試機器學(xué)習(xí)功能的工具,具有與 scikit-learn 兼容的 API。

Apache Spark 中的 MLlib - Spark 中的分布式機器學(xué)習(xí)庫

Hydrosphere Mist - 一種用于將 Apache Spark MLLib 機器學(xué)習(xí)模型部署為實時、批處理或反應(yīng)式 Web 服務(wù)的服務(wù)。

scikit-learn - 基于 SciPy 構(gòu)建的用于機器學(xué)習(xí)的 Python 模塊。

metric-learn - 用于度量學(xué)習(xí)的 Python 模塊。

SimpleAI Python 實現(xiàn)了《人工智能,一種現(xiàn)代方法》一書中描述的許多人工智能算法。它專注于提供一個易于使用、有據(jù)可查和經(jīng)過測試的庫。

astroML - 用于天文學(xué)的機器學(xué)習(xí)和數(shù)據(jù)挖掘。

graphlab-create - 在磁盤支持的 DataFrame 之上實現(xiàn)的具有各種機器學(xué)習(xí)模型(回歸、聚類、推薦系統(tǒng)、圖形分析等)的庫。

BigML - 聯(lián)系外部服務(wù)器的庫。

模式 - Python 的 Web 挖掘模塊。

NuPIC - 用于智能計算的 Numenta 平臺。

Pylearn2 - 基于 Theano 的機器學(xué)習(xí)庫。 [已棄用]

keras - TensorFlow、CNTK 和 Theano 的高級神經(jīng)網(wǎng)絡(luò)前端。

Lasagne - 在 Theano 中構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)的輕量級庫。

hebel - Python 中的 GPU 加速深度學(xué)習(xí)庫。 [已棄用]

Chainer - 靈活的神經(jīng)網(wǎng)絡(luò)框架。

先知 - Facebook 的快速和自動化的時間序列預(yù)測框架。

gensim - 人類主題建模。

topik - 主題建模工具包。 [已棄用]

PyBrain - 另一個 Python 機器學(xué)習(xí)庫。

頭腦風(fēng)暴 - 快速、靈活且有趣的神經(jīng)網(wǎng)絡(luò)。這是 PyBrain 的繼承者。

Surprise - 用于構(gòu)建和分析推薦系統(tǒng)的 scikit。

隱式 - 隱式數(shù)據(jù)集的快速 Python 協(xié)作過濾。

LightFM - 用于隱式和顯式反饋的許多流行推薦算法的 Python 實現(xiàn)。

Crab - 靈活、快速的推薦引擎。 [已棄用]

python-recsys - 用于實現(xiàn)推薦系統(tǒng)的 Python 庫。

思考貝葉斯 - 關(guān)于貝葉斯分析的書。

Image-to-Image Translation with Conditional Adversarial Networks - 從 isola 等人的論文中實現(xiàn)圖像到圖像 (pix2pix) 轉(zhuǎn)換。[深度學(xué)習(xí)]

受限玻爾茲曼機 - Python 中的受限玻爾茲曼機。 【深度學(xué)習(xí)】

Bolt - Bolt 在線學(xué)習(xí)工具箱。 [已棄用]

CoverTree - 覆蓋樹的 Python 實現(xiàn),幾乎直接替代 scipy.spatial.kdtree [已棄用]

nilearn - Python 中神經(jīng)成像的機器學(xué)習(xí)。

Neuropredict - 針對新手機器學(xué)習(xí)者和非專家程序員,該軟件包在 Python 中為 NeuroImaging 和任何其他類型的功能提供簡單(無需編碼)和全面的機器學(xué)習(xí)(評估和預(yù)測性能的完整報告,無需您編寫代碼) .這旨在吸收大部分 ML 工作流程,與 nilearn 和 pymvpa 等其他軟件包不同,它們要求您學(xué)習(xí)它們的 API 和代碼以生成任何有用的東西。

不平衡學(xué)習(xí) - 使用各種技術(shù)執(zhí)行欠采樣和過采樣的 Python 模塊。

Shogun -Shogun 機器學(xué)習(xí)工具箱。

Pyevolve - 遺傳算法框架。 [已棄用]

Caffe - 一個深度學(xué)習(xí)框架,在開發(fā)時考慮到了清潔度、可讀性和速度。

breze - 基于 Theano 的深度和循環(huán)神經(jīng)網(wǎng)絡(luò)庫。

Cortex - 用于在生產(chǎn)中部署機器學(xué)習(xí)模型的開源平臺。

pyhsmm - 用于貝葉斯隱馬爾可夫模型 (HMM) 和顯式持續(xù)時間隱半馬爾可夫模型 (HSMM) 中的近似無監(jiān)督推理的庫,側(cè)重于貝葉斯非參數(shù)擴展、HDP-HMM 和 HDP-HSMM,主要具有弱極限近似.

SKLL - scikit-learn 的包裝器,使進行實驗變得更簡單。

神經(jīng)實驗室

Spearmint - Spearmint 是根據(jù)論文中概述的算法執(zhí)行貝葉斯優(yōu)化的包:機器學(xué)習(xí)算法的實用貝葉斯優(yōu)化. Jasper Snoek、Hugo Larochelle 和 Ryan P. Adams。神經(jīng)信息處理系統(tǒng)的進展,2012 年。 [已棄用]

Pebl - 貝葉斯學(xué)習(xí)的 Python 環(huán)境。 [已棄用]

Theano - 在 Python 中優(yōu)化 GPU 元編程代碼生成面向數(shù)組的優(yōu)化數(shù)學(xué)編譯器。

TensorFlow - 使用數(shù)據(jù)流圖進行數(shù)值計算的開源軟件庫。

pomegranate - Python 的隱藏馬爾可夫模型,在 Cython 中實現(xiàn)以提高速度和效率。

python-timbl - 包裝完整 TiMBL C++ 編程接口的 Python 擴展模塊。 Timbl 是一個精心設(shè)計的 k-最近鄰機器學(xué)習(xí)工具包。

deap - 進化算法框架。

pydeep - Python 中的深度學(xué)習(xí)。 [已棄用]

mlxtend - 一個包含用于數(shù)據(jù)科學(xué)和機器學(xué)習(xí)任務(wù)的有用工具的庫。

neon - Nervana 的高性能基于 Python 的深度學(xué)習(xí)框架 [DEEP LEARNING]。 [已棄用]

Optunity - 一個專門用于自動超參數(shù)優(yōu)化的庫,具有簡單、輕量級的 API 以促進網(wǎng)格搜索的插入替換。

神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí) - 我的書“神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)”[深度學(xué)習(xí)] 的代碼示例。

Annoy - 近似最近鄰實現(xiàn)。

TPOT - 使用遺傳編程自動創(chuàng)建和優(yōu)化機器學(xué)習(xí)管道的工具。將其視為您的個人數(shù)據(jù)科學(xué)助手,將機器學(xué)習(xí)中乏味的部分自動化。

pgmpy 用于處理概率圖形模型的 Python 庫。

DIGITS - 深度學(xué)習(xí) GPU 訓(xùn)練系統(tǒng) (DIGITS) 是一個用于訓(xùn)練深度學(xué)習(xí)模型的 Web 應(yīng)用程序。

Orange - 面向新手和專家的開源數(shù)據(jù)可視化和數(shù)據(jù)分析。

MXNet - 輕量級、便攜、靈活的分布式/移動深度學(xué)習(xí),具有動態(tài)、變異感知數(shù)據(jù)流調(diào)度器;適用于 Python、R、Julia、Go、Javascript 等。

Milk - 專注于監(jiān)督分類的機器學(xué)習(xí)工具包。 [已棄用]

TFLearn - 深度學(xué)習(xí)庫,具有更高級別的 TensorFlow API。

REP - 基于 IPython 的環(huán)境,用于以一致和可重復(fù)的方式進行數(shù)據(jù)驅(qū)動的研究。 REP 并不試圖替代 scikit-learn,而是對其進行擴展并提供更好的用戶體驗。 [已棄用]

rgf_python - 正則化貪婪森林(樹)庫的 Python 綁定。

skbayes - 使用 scikit-learn API 進行貝葉斯機器學(xué)習(xí)的 Python 包。

fuku-ml - 簡單的機器學(xué)習(xí)庫,包括感知器、回歸、支持向量機、決策樹等,易于使用,適合初學(xué)者學(xué)習(xí)。

Xcessiv - 基于 Web 的應(yīng)用程序,用于快速、可擴展和自動化的超參數(shù)調(diào)整和堆疊集成。

PyTorch - Python 中的張量和動態(tài)神經(jīng)網(wǎng)絡(luò),具有強大的 GPU 加速

PyTorch Lightning - 用于高性能 AI 研究的輕量級 PyTorch 包裝器。

PyTorch Lightning Bolts - AI/ML 研究人員的模型、回調(diào)和數(shù)據(jù)集工具箱。

skorch - 包裝 PyTorch 的 scikit-learn 兼容神經(jīng)網(wǎng)絡(luò)庫。

ML-From-Scratch - 在 Python 中從頭開始實現(xiàn)機器學(xué)習(xí)模型,重點是透明度。旨在以一種易于理解的方式展示 ML 的細節(jié)。

Edward - 用于概率建模、推理和批評的庫。建立在 TensorFlow 之上。

xRBM - 受限玻爾茲曼機(RBM)及其在 Tensorflow 中的條件變體的庫。

CatBoost - 決策樹庫上的通用梯度提升,具有開箱即用的分類特征支持。它易于安裝、文檔齊全并支持 CPU 和 GPU(甚至多 GPU)計算。

stacked_generalization - 在 Python 中實現(xiàn)機器學(xué)習(xí)堆疊技術(shù)作為一個方便的庫。

modAL - 基于 scikit-learn 構(gòu)建的 Python 模塊化主動學(xué)習(xí)框架。

Cogitare:一個現(xiàn)代、快速、模塊化的 Python 深度學(xué)習(xí)和機器學(xué)習(xí)框架。

Parris -Parris,機器學(xué)習(xí)算法的自動化基礎(chǔ)設(shè)施設(shè)置工具。

neonrvm -neonrvm 是一個基于 RVM 技術(shù)的開源機器學(xué)習(xí)庫。它是用 C 編程語言編寫的,并帶有 Python 編程語言綁定。

Turi Create - 來自 Apple 的機器學(xué)習(xí)。 Turi Create 簡化了自定義機器學(xué)習(xí)模型的開發(fā)。您無需成為機器學(xué)習(xí)專家即可向您的應(yīng)用程序添加推薦、對象檢測、圖像分類、圖像相似性或活動分類。

xLearn - 一個高性能、易于使用且可擴展的機器學(xué)習(xí)包,可用于解決大規(guī)模機器學(xué)習(xí)問題。 xLearn 對于解決大規(guī)模稀疏數(shù)據(jù)的機器學(xué)習(xí)問題特別有用,這在諸如在線廣告和推薦系統(tǒng)等互聯(lián)網(wǎng)服務(wù)中非常常見。

mlens - 與 scikit-learn 集成的高性能、內(nèi)存效率高、最大并行化的集成學(xué)習(xí)。

Netron - 機器學(xué)習(xí)模型的可視化工具。

Thampi - AWS Lambda 上的機器學(xué)習(xí)預(yù)測系統(tǒng)

MindsDB - 簡化神經(jīng)網(wǎng)絡(luò)使用的開源框架。

Microsoft Recommenders:構(gòu)建推薦系統(tǒng)的示例和最佳實踐,以 Jupyter 筆記本的形式提供。該存儲庫包含來自 Microsoft Research 以及其他公司和機構(gòu)的一些最新的最先進算法。

StellarGraph:圖上的機器學(xué)習(xí),一個用于圖結(jié)構(gòu)(網(wǎng)絡(luò)結(jié)構(gòu))數(shù)據(jù)機器學(xué)習(xí)的 Python 庫。

BentoML:用于打包和部署機器學(xué)習(xí)模型以用于生產(chǎn)的工具包

MiraiML:用于連續(xù)和自主機器學(xué)習(xí)的異步引擎,專為實時使用而構(gòu)建。

numpy-ML:用 numpy 編寫的 ML 模型的參考實現(xiàn)

Neuraxle:一個提供正確抽象的框架,以簡化 ML 管道的研究、開發(fā)和部署。

Cornac - 多模式推薦系統(tǒng)的比較框架,重點是利用輔助數(shù)據(jù)的模型。

JAX - JAX 是 Autograd 和 XLA,匯集在一起用于高性能機器學(xué)習(xí)研究。

Catalyst - 用于 PyTorch DL 和 RL 研究的高級實用程序。它的開發(fā)重點是可重復(fù)性、快速實驗和代碼/想法的重用。能夠研究/開發(fā)新的東西,而不是編寫另一個常規(guī)的火車循環(huán)。

Fastai - 構(gòu)建在 Pytorch 之上的高級包裝器,支持視覺、文本、表格數(shù)據(jù)和協(xié)同過濾。

scikit-multiflow - 用于多輸出/多標(biāo)簽和流數(shù)據(jù)的機器學(xué)習(xí)框架。

Lightwood - 一種基于 Pytorch 的框架,可將機器學(xué)習(xí)問題分解為更小的塊,這些塊可以無縫地粘合在一起,目標(biāo)是用一行代碼構(gòu)建預(yù)測模型。

bayeso - 一個簡單但必不可少的貝葉斯優(yōu)化包,用 Python 編寫。

mljar-supervised - 用于表格數(shù)據(jù)的自動機器學(xué)習(xí)(AutoML)python 包。它可以處理:二元分類、多類分類和回歸。它提供了解釋和降價報告。

evostra - Python 中的快速進化策略實現(xiàn)。

確定 - 可擴展的深度學(xué)習(xí)訓(xùn)練平臺,包括對分布式訓(xùn)練、超參數(shù)調(diào)整、實驗跟蹤和模型管理的集成支持。

PySyft - 基于 PyTorch 和 TensorFlow 的用于安全和私有深度學(xué)習(xí)的 Python 庫。

PyGrid - 數(shù)據(jù)所有者和數(shù)據(jù)科學(xué)家的點對點網(wǎng)絡(luò),他們可以使用 PySyft 共同訓(xùn)練 AI 模型

sktime - 具有時間序列的機器學(xué)習(xí)統(tǒng)一框架

OPFython - Optimum-Path Forest 分類器的 Python 啟發(fā)實現(xiàn)。

Optitimizer - 基于 Python 的元啟發(fā)式優(yōu)化技術(shù)。

Gradio - 用于快速創(chuàng)建和共享模型演示的 Python 庫。在瀏覽器中以交互方式調(diào)試模型,從合作者那里獲得反饋,并在不部署任何東西的情況下生成公共鏈接。

Hub - TensorFlow / PyTorch 最快的非結(jié)構(gòu)化數(shù)據(jù)集管理。流和版本控制數(shù)據(jù)。甚至可以將 PB 級數(shù)據(jù)存儲在云上的一個類似 numpy 的數(shù)組中,可以在任何機器上訪問。訪問 activeloop.ai 了解更多信息。

Synthia - Python 中的多維合成數(shù)據(jù)生成。

ByteHub - 易于使用、基于 Python 的功能存儲。針對時間序列數(shù)據(jù)進行了優(yōu)化。

Backprop - Backprop 使使用、微調(diào)和部署最先進的 ML 模型變得簡單。

River:通用在線機器學(xué)習(xí)框架。

FEDOT:用于復(fù)合建模管道自動化設(shè)計的 AutoML 框架。它可以處理不同類型數(shù)據(jù)(包括多模態(tài)數(shù)據(jù)集)的分類、回歸和時間序列預(yù)測任務(wù)。

數(shù)據(jù)分析/數(shù)據(jù)可視化

DataVisualization - 一個 Github 存儲庫,您可以在其中學(xué)習(xí) Datavisualizatoin 基礎(chǔ)知識到中級水平。

Cartopy -Cartopy 是一個 Python 包,專為地理空間數(shù)據(jù)處理而設(shè)計,以生成地圖和其他地理空間數(shù)據(jù)分析。

SciPy - 基于 Python 的數(shù)學(xué)、科學(xué)和工程開源軟件生態(tài)系統(tǒng)。

NumPy - 使用 Python 進行科學(xué)計算的基本包。

AutoViz AutoViz 使用一行 Python 代碼執(zhí)行任何數(shù)據(jù)集的自動可視化。給它任何大小的任何輸入文件(CSV、txt 或 json),AutoViz 將對其進行可視化。請參閱中等文章。

Numba -Cython 和 NumPy 的開發(fā)人員針對科學(xué) Python 的 LLVM 的 Python JIT(及時)編譯器.

Mars - 用于大規(guī)模數(shù)據(jù)計算的基于張量的框架,通常被視為 NumPy 的并行和分布式版本。

NetworkX - 復(fù)雜網(wǎng)絡(luò)的高生產(chǎn)力軟件。

igraph - 綁定到 igraph 庫 - 通用圖形庫。

Pandas - 一個提供高性能、易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具的庫。

ParaMonte - 通過串行/并行蒙特卡羅和 MCMC 模擬進行貝葉斯數(shù)據(jù)分析和可視化的通用 Python 庫。文檔可以在這里找到。

Open Mining - Python 中的商業(yè)智能 (BI)(Pandas Web 界面)[已棄用]

PyMC - 馬爾可夫鏈蒙特卡羅采樣工具包。

zipline - Pythonic 算法交易庫。

PyDy - Python Dynamics 的縮寫,用于輔助基于 NumPy、SciPy、IPython 和 matplotlib 的動態(tài)運動建模的工作流。

SymPy - 符號數(shù)學(xué)的 Python 庫。

statsmodels - Python 中的統(tǒng)計建模和計量經(jīng)濟學(xué)。

astropy - 一個用于天文學(xué)的社區(qū) Python 庫。

matplotlib - Python 2D 繪圖庫。

bokeh - Python 的交互式網(wǎng)絡(luò)繪圖。

plotly - Python 和 matplotlib 的協(xié)作網(wǎng)絡(luò)繪圖。

altair - 一個 Python 到 Vega 的翻譯器。

d3py - 基于 D3.js 的 Python 繪圖庫。

PyDexter - Python 的簡單繪圖。 D3xterjs 的包裝器;輕松在瀏覽器中呈現(xiàn)圖表。

ggplot - 與 R 的 ggplot2 相同的 API。 [已棄用]

ggfortify - ggplot2 流行 R 包的統(tǒng)一接口。

Kartograph.py - 在 Python 中渲染漂亮的 SVG 地圖。

pygal - Python SVG 圖表創(chuàng)建器。

PyQtGraph - 基于 PyQt4 / PySide 和 NumPy 構(gòu)建的純 Python 圖形和 GUI 庫.

pycascading [已棄用]

Petrel - 用純 Python 編寫、提交、調(diào)試和監(jiān)控 Storm 拓撲的工具。

Blaze - NumPy 和 Pandas 與大數(shù)據(jù)的接口。

emcee - 用于仿射不變 MCMC 的 Python 集成采樣工具包。

windML - 風(fēng)能分析和預(yù)測的 Python 框架。

vispy - 基于 GPU 的高性能交互式 OpenGL 2D/3D 數(shù)據(jù)可視化庫。

cerebro2 用于 NuPIC 的基于 Web 的可視化和調(diào)試平臺。 [已棄用]

NuPIC Studio 一個多合一的 NuPIC Hierarchical Temporal Memory 可視化和調(diào)試超級工具![Deprecated]

SparklingPandas PySpark (POPS) 上的 Pandas。

Seaborn - 基于 matplotlib 的 Python 可視化庫。

bqplot - 用于在 Jupyter (IPython) 中繪圖的 API。

Pastalog - 神經(jīng)網(wǎng)絡(luò)訓(xùn)練性能的簡單、實時可視化。

Superset - 設(shè)計為可視化、直觀和交互的數(shù)據(jù)探索平臺。

Dora - 在 Python 中進行探索性數(shù)據(jù)分析的工具。

Ruffus - python 的計算管道庫。

SOMPY - 用 Python 編寫的自組織地圖(使用神經(jīng)網(wǎng)絡(luò)進行數(shù)據(jù)分析)。

somoclu 大規(guī)模并行自組織映射:加速多核 CPU、GPU 和集群的訓(xùn)練,具有 python API。

HDBScan - 在 Python 中實現(xiàn) hdbscan 算法 - 用于聚類

visualize_ML - 用于數(shù)據(jù)探索和數(shù)據(jù)分析的 python 包。 [已棄用]

scikit-plot - 一個可視化庫,用于快速輕松地生成數(shù)據(jù)分析和機器學(xué)習(xí)中的常見繪圖。

Bowtie - 使用 flask socketio 和 react 進行交互式可視化的儀表板庫。

lime - Lime 是關(guān)于解釋機器學(xué)習(xí)分類器(或模型)正在做什么。它能夠解釋任何具有兩個或更多類的黑盒分類器。

PyCM - PyCM 是一個用 Python 編寫的多類混淆矩陣庫,它支持輸入數(shù)據(jù)向量和直接矩陣,是一個合適的分類后模型評估工具,支持大多數(shù)類和整體統(tǒng)計參數(shù)

Dash - 用于創(chuàng)建構(gòu)建在 Plotly.js、React 和 Flask 之上的分析 Web 應(yīng)用程序的框架

Lambdo - 一種工作流引擎,用于通過將 (i) 特征工程和機器學(xué)習(xí) (ii) 模型訓(xùn)練和預(yù)測 (iii) 通過用戶定義 (Python) 函數(shù)進行表填充和列評估結(jié)合在一個分析管道中來解決機器學(xué)習(xí)問題。

TensorWatch - 用于機器學(xué)習(xí)和數(shù)據(jù)科學(xué)的調(diào)試和可視化工具。它廣泛利用 Jupyter Notebook 來顯示運行過程中數(shù)據(jù)的實時可視化,例如機器學(xué)習(xí)訓(xùn)練。

dowel - 用于機器學(xué)習(xí)研究的小記錄器。只需調(diào)用 logger.log() 即可將任何對象輸出到終端、CSV、TensorBoard、磁盤上的文本日志等。

雜項腳本 / iPython 筆記本 / 代碼庫

MiniGrad – autograd (~100 loc) 的最小、教育性、Pythonic 實現(xiàn)。

常見 ML 算法的 Map/Reduce 實現(xiàn):Jupyter 筆記本,涵蓋如何從頭開始實現(xiàn)不同的 ML 算法(普通最小二乘法、梯度下降、k 均值、交替最小二乘法)、使用 Python NumPy,以及如何使這些實現(xiàn)可擴展使用 Map/Reduce 和 Spark。

BioPy - Python 中的生物啟發(fā)和機器學(xué)習(xí)算法。 [已棄用]

CAEs for Data Assimilation - 用于 3D 圖像/場壓縮的卷積自動編碼器應(yīng)用于降階數(shù)據(jù)同化。

SVM Explorer - 交互式 SVM Explorer,使用 Dash 和 scikit-learn

pattern_classification

thinking stats 2

hyperopt

numpic

2012-paper-diginorm

A gallery of interesting IPython notebooks

ipython-notebooks

data-science-ipython-notebooks - 持續(xù)更新的數(shù)據(jù)科學(xué) Python 筆記本:Spark、Hadoop MapReduce、HDFS、AWS、Kaggle、scikit-learn、matplotlib、pandas、NumPy、SciPy 和各種命令行。

決策權(quán)重

Sarah Palin LDA - 主題建模 Sarah Palin 電子郵件。

Diffusion Segmentation - 基于擴散方法的圖像分割算法的集合。

Scipy 教程 - SciPy 教程。這是過時的,請查看 scipy-lecture-notes。

Crab - Python 的推薦引擎庫。

BayesPy - Python 中的貝葉斯推理工具。

scikit-learn 教程 - 用于學(xué)習(xí) scikit-learn 的系列筆記本。

情緒分析器 - 推文情緒分析器

情感分類器 - 使用詞義消歧的情感分類器。

group-lasso - 在(稀疏)Group Lasso 模型中使用的坐標(biāo)下降算法的一些實驗。

jProcessing - 漢字/平假名/片假名轉(zhuǎn)羅馬字轉(zhuǎn)換器。法令詞典和平行句子搜索。兩個 JP 句子之間的句子相似性。日語文本的情感分析。在 Python 中運行 Cabocha(已配置 ISO--8859-1)。

mne-python-notebooks - 使用 mne-python 進行 EEG/MEG 數(shù)據(jù)處理的 IPython 筆記本。

Neon Course - IPython 筆記本,用于了解 Nervana 的 Neon 的完整課程。

熊貓食譜 - 使用 Python 的熊貓庫的食譜。

climin - 專注于機器學(xué)習(xí)、梯度下降的 Python 實現(xiàn)、LBFGS、rmsprop、adadelta 等的優(yōu)化庫。

Allen Downey 的數(shù)據(jù)科學(xué)課程 - 奧林學(xué)院的數(shù)據(jù)科學(xué)代碼,2014 年春季。

Allen Downey's Think Bayes Code - Think Bayes 的代碼庫。

Allen Downey's Think Complexity Code - Allen Downey 的書 Think Complexity 的代碼.

Allen Downey 的 Think OS Code - Think OS 的文本和支持代碼:操作系統(tǒng)簡介。

Python Programming for the Humanities - 人文 Python 編程課程,假設(shè)沒有先驗知識。高度關(guān)注文本處理/NLP。

GreatCircle - 用于計算大圓距離的庫。

Optunity 示例 - 演示如何與機器學(xué)習(xí)庫協(xié)同使用 Optunity 的示例。

使用 Python Jupyter notebook 和 scikit-learn 深入了解機器學(xué)習(xí) - “我首先通過 hacking 學(xué)習(xí) Python,然后認真學(xué)習(xí)。我想用機器學(xué)習(xí)來做到這一點。如果這是你的風(fēng)格,請和我一起超越自己.”

TDB - TensorDebugger (TDB) 是用于深度學(xué)習(xí)的可視化調(diào)試器。它為 TensorFlow 提供交互式、逐節(jié)點調(diào)試和可視化功能。

Suiron - 遙控汽車的機器學(xué)習(xí)。

使用 scikit-learn 進行機器學(xué)習(xí)簡介 - 來自數(shù)據(jù)學(xué)校關(guān)于 scikit-learn 的視頻教程的 IPython 筆記本。

Python 中的實用 XGBoost - 關(guān)于在 Python 中使用 XGBoost 的綜合在線課程。

Introduction to Machine Learning with Python - “Introduction to Machine Learning with Python”一書的筆記本和代碼

Pydata book - O'Reilly Media 出版的 Wes McKinney 的“Python for Data Analysis”的材料和 IPython 筆記本

Homemade Machine Learning - 流行機器學(xué)習(xí)算法的 Python 示例,其中包含交互式 Jupyter 演示和數(shù)學(xué)解釋

Prodmodel - 用于數(shù)據(jù)科學(xué)管道的構(gòu)建工具。

the-elements-of-statistical-learning - 該存儲庫包含 Jupyter 筆記本,實現(xiàn)了本書和教科書摘要中的算法。

Hyperparameter-Optimization-of-Machine-Learning-Algorithms - 用于機器學(xué)習(xí)和深度學(xué)習(xí)算法的超參數(shù)調(diào)整/優(yōu)化的代碼。

神經(jīng)網(wǎng)絡(luò)

nn_builder - nn_builder 是一個 Python 包,可讓您在 1 行中構(gòu)建神經(jīng)網(wǎng)絡(luò)

NeuralTalk - NeuralTalk 是一個 Python + numpy 項目,用于學(xué)習(xí)用句子描述圖像的多模態(tài)循環(huán)神經(jīng)網(wǎng)絡(luò).

Neuron - Neuron 是用于時間序列預(yù)測的簡單類。它利用 LNU(線性神經(jīng)單元)、QNU(二次神經(jīng)單元)、RBF(徑向基函數(shù))、MLP(多層感知器)、MLP-ELM(多層感知器 - 極限學(xué)習(xí)機)神經(jīng)網(wǎng)絡(luò)通過梯度下降或 LeLevenberg 學(xué)習(xí)– 馬夸特算法。

NeuralTalk - NeuralTalk 是一個 Python + numpy 項目,用于學(xué)習(xí)用句子描述圖像的多模態(tài)循環(huán)神經(jīng)網(wǎng)絡(luò). [已棄用]

Neuron - Neuron 是用于時間序列預(yù)測的簡單類。它利用 LNU(線性神經(jīng)單元)、QNU(二次神經(jīng)單元)、RBF(徑向基函數(shù))、MLP(多層感知器)、MLP-ELM(多層感知器 - 極限學(xué)習(xí)機)神經(jīng)網(wǎng)絡(luò)通過梯度下降或 LeLevenberg 學(xué)習(xí)– 馬夸特算法。 [已棄用]

數(shù)據(jù)驅(qū)動代碼 - 在 python 中非常簡單地實現(xiàn)了用于傻瓜的神經(jīng)網(wǎng)絡(luò),無需使用任何庫,并帶有詳細的注釋。

Machine Learning, Data Science and Deep Learning with Python - LiveVideo 課程,涵蓋機器學(xué)習(xí)、Tensorflow、人工智能和神經(jīng)網(wǎng)絡(luò)。

TResNet:高性能 GPU 專用架構(gòu) - TResNet 模型經(jīng)過設(shè)計和優(yōu)化,可在 GPU 上提供最佳的速度-精度權(quán)衡。

TResNet:簡單而強大的 Python 神經(jīng)網(wǎng)絡(luò)庫 - 各種支持類型的人工神經(jīng)網(wǎng)絡(luò)和學(xué)習(xí)算法。

Jina AI 一種在云中構(gòu)建神經(jīng)搜索的更簡單方法。與 Jupyter 筆記本兼容。

sequitur PyTorch 庫,只需兩行代碼即可創(chuàng)建和訓(xùn)練序列自動編碼器


Kaggle 比賽源代碼

open-solution-home-credit-> source code andexperiments resultsforHome Credit Default Risk.

open-solution-googleai-object-detection-> source code andexperiments resultsforGoogle AI Open Images - Object Detection Track.

open-solution-salt-identification-> source code andexperiments resultsforTGS Salt Identification Challenge.

open-solution-ship-detection-> source code andexperiments resultsforAirbus Ship Detection Challenge.

open-solution-data-science-bowl-2018-> source code andexperiments resultsfor2018 Data Science Bowl.

open-solution-value-prediction-> source code andexperiments resultsforSantander Value Prediction Challenge.

open-solution-toxic-comments-> source code forToxic Comment Classification Challenge.

wiki challenge- An implementation of Dell Zhang's solution to Wikipedia's Participation Challenge on Kaggle.

kaggle insults- Kaggle Submission for "Detecting Insults in Social Commentary".

kaggle_acquire-valued-shoppers-challenge- Code for the Kaggle acquire valued shoppers challenge.

kaggle-cifar- Code for the CIFAR-10 competition at Kaggle, uses cuda-convnet.

kaggle-blackbox- Deep learning made easy.

kaggle-accelerometer- Code for Accelerometer Biometric Competition at Kaggle.

kaggle-advertised-salaries- Predicting job salaries from ads - a Kaggle competition.

kaggle amazon- Amazon access control challenge.

kaggle-bestbuy_big- Code for the Best Buy competition at Kaggle.

kaggle-bestbuy_small

Kaggle Dogs vs. Cats- Code for Kaggle Dogs vs. Cats competition.

Kaggle Galaxy Challenge- Winning solution for the Galaxy Challenge on Kaggle.

Kaggle Gender- A Kaggle competition: discriminate gender based on handwriting.

Kaggle Merck- Merck challenge at Kaggle.

Kaggle Stackoverflow- Predicting closed questions on Stack Overflow.

kaggle_acquire-valued-shoppers-challenge- Code for the Kaggle acquire valued shoppers challenge.

wine-quality- Predicting wine quality.

Reinforcement Learning

DeepMind Lab?- DeepMind Lab is a 3D learning environment based on id Software's Quake III Arena via ioquake3 and other open source software. Its primary purpose is to act as a testbed for research in artificial intelligence, especially deep reinforcement learning.

Gym?- OpenAI Gym is a toolkit for developing and comparing reinforcement learning algorithms.

Serpent.AI?- Serpent.AI is a game agent framework that allows you to turn any video game you own into a sandbox to develop AI and machine learning experiments. For both researchers and hobbyists.

ViZDoom?- ViZDoom allows developing AI bots that play Doom using only the visual information (the screen buffer). It is primarily intended for research in machine visual learning, and deep reinforcement learning, in particular.

Roboschool?- Open-source software for robot simulation, integrated with OpenAI Gym.

Retro?- Retro Games in Gym

SLM Lab?- Modular Deep Reinforcement Learning framework in PyTorch.

Coach?- Reinforcement Learning Coach by Intel? AI Lab enables easy experimentation with state of the art Reinforcement Learning algorithms

garage?- 可重復(fù)強化學(xué)習(xí)研究的工具包

metaworld?- An open source robotics benchmark for meta- and multi-task reinforcement learning

acme?- An Open Source Distributed Framework for Reinforcement Learning that makes build and train your agents easily.

Spinning Up?- An educational resource designed to let anyone learn to become a skilled practitioner in deep reinforcement learning

Maze?- Application-oriented deep reinforcement learning framework addressing real-world decision problems.面向應(yīng)用的深度強化學(xué)習(xí)框架解決現(xiàn)實世界的決策問題。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容