實際上,信息增益準則對可取值數目較多的屬性有所偏好,為減少這種偏好可能帶來的不利影響,著名的 C4.5 決策樹算法 [Quinlan, 1993J 不直接使用信息增益,而是使用"增益率" (gain ratio) 來選擇最優劃分屬性.增益率:增益率是用前面的信息增益Gain(D, a)和屬性a對應的"固有值"(intrinsic value) [Quinlan , 1993J的比值來共同定義的。查看全文>>
如果不是有放回的抽樣,那么每棵樹的訓練樣本都是不同的,都是沒有交集的,這樣每棵樹都是“有偏的”,都是絕對“片面的”(當然這樣說可能不對),也就是說每棵樹訓練出來都是有很大的差異的;而隨機森林最后分類取決于多棵樹(弱分類器)的投票表決。查看全文>>
K Nearest Neighbor算法又叫KNN算法,這個算法是機器學習里面一個比較經典的算法, 總體來說KNN算法是相對比較容易理解的算法,如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別。查看全文>>
采用由淺入深,層層遞進的講解方式, 讓你輕松掌握opencv的使用, 使用opencv對圖像進行炫酷的變換,特征提取等。10小時學會opencv, 帶您領略樸素圖像處理的魅力風采查看全文>>
BRIEF是一種特征描述子提取算法,并非特征點的提取算法,一種生成二值化描述子的算法,不提取代價低,匹配只需要使用簡單的漢明距離(Hamming Distance)利用比特之間的異或操作就可以完成。查看全文>>