史上最软白月光[快穿],久久久久久久久久久精品,中国式家庭

隨機森林算法是一個監督算法用來分類和做回歸。

原理

隨機森林通過建立多顆決策樹，合并他們的結果來得到一個更精確更穩定的預測值。
隨機森林算法是一個集成算法。
集成學習模型聚合多個機器學習模型，從而實現整體更好的性能。

這背后的邏輯是，所使用的每個模型在自己使用時都很弱，但在集合中使用時很強。在隨機森林的情況下，使用大量作為“弱”因子的決策樹，并且它們的輸出被聚合，結果表示“強”集合。

怎樣使用

隨機森林算法有兩個步驟：
第一步是創建隨機森林
第二步是通過第一步創建的森林進行回歸和分類預測。

創建：

每個棵樹都是這樣產生的：
1.如果訓練集中的樣本數為N，則從原始數據中隨機抽樣N個案例但需要替換。此樣本將是用于生成樹的訓練集。
2.如果有M個輸入變量，則指定一個數字，使得在每個節點處，從M中隨機選擇m個變量，并且使用該m的最佳分割來分割節點

預測：

預測需要以下步驟：
1.獲取測試特征并使用每個隨機創建的決策樹的規則來預測結果并存儲預測結果（目標）
2.計算每個預測目標的投票
3.將高投票預測目標視為隨機森林算法的最終預測
分類

實施

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

dataset = pd.read_csv('Social_Network_Ads.csv')
X = dataset.iloc[:, [2, 3]].values
y = dataset.iloc[:, 4].values

from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

from sklearn.ensemble import RandomForestClassifier
classifier = RandomForestClassifier(n_estimators = 10, criterion = 'entropy', random_state = 0)
classifier.fit(X_train, y_train)

y_pred = classifier.predict(X_test)

from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test, y_pred)

from matplotlib.colors import ListedColormap
X_set, y_set = X_train, y_train
X1, X2 = np.meshgrid(np.arange(start = X_set[:, 0].min() - 1, stop = X_set[:, 0].max() + 1, step = 0.01),
                     np.arange(start = X_set[:, 1].min() - 1, stop = X_set[:, 1].max() + 1, step = 0.01))
plt.contourf(X1, X2, classifier.predict(np.array([X1.ravel(), X2.ravel()]).T).reshape(X1.shape),
             alpha = 0.75, cmap = ListedColormap(('red', 'green')))
plt.xlim(X1.min(), X1.max())
plt.ylim(X2.min(), X2.max())
for i, j in enumerate(np.unique(y_set)):
    plt.scatter(X_set[y_set == j, 0], X_set[y_set == j, 1],
                c = ListedColormap(('red', 'green'))(i), label = j)
plt.title('Random Forest Classification (Training set)')
plt.xlabel('Age')
plt.ylabel('Estimated Salary')
plt.legend()
plt.show()

from matplotlib.colors import ListedColormap
X_set, y_set = X_test, y_test
X1, X2 = np.meshgrid(np.arange(start = X_set[:, 0].min() - 1, stop = X_set[:, 0].max() + 1, step = 0.01),
                     np.arange(start = X_set[:, 1].min() - 1, stop = X_set[:, 1].max() + 1, step = 0.01))
plt.contourf(X1, X2, classifier.predict(np.array([X1.ravel(), X2.ravel()]).T).reshape(X1.shape),
             alpha = 0.75, cmap = ListedColormap(('red', 'green')))
plt.xlim(X1.min(), X1.max())
plt.ylim(X2.min(), X2.max())
for i, j in enumerate(np.unique(y_set)):
    plt.scatter(X_set[y_set == j, 0], X_set[y_set == j, 1],
                c = ListedColormap(('red', 'green'))(i), label = j)
plt.title('Random Forest Classification (Test set)')
plt.xlabel('Age')
plt.ylabel('Estimated Salary')
plt.legend()
plt.show()

訓練結果

預測結果

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Random Forests|python

Random Forests|python

原理

怎樣使用

創建：

預測：

實施

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

Random Forests|python

原理

怎樣使用

創建：

預測：

實施

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频