使用超平面進行分割數據的過程中,如果我們嚴格地讓所有實例都不在最大=大間隔之間,并且位于正確的一邊,這就是硬間隔分類。硬間隔分類有兩個問題,首先,它只在數據是線性可分離的時候才有效;其次,它對異常值非常敏感。查看全文>>
Seaborn基于 Matplotlib核心庫進行了更高級的API封裝,可以輕松地畫出更漂亮的圖形,而Seaborn的漂亮主要體現在配色更加舒服,以及圖形元素的樣式更加細膩。查看全文>>
SOM 即自組織映射,是一種用于特征檢測的無監督學習神經網絡。它模擬人腦中處于不同區域的神經細胞 分工不同的特點,即不同區域具有不同的響應特征,而且這一過程是自動完成的。SOM 用于生成訓練樣本的低維 空間,可以將高維數據間復雜的非線性統計關系轉化為簡單的幾何關系,且以低維的方式展現,因此通常在降維問題中會使用它。查看全文>>
分析一個算法主要看這個算法的執行需要多少機器資源。在各種機器資源中,時間和空間是兩個最主要的方面。因此,在進行算法分析時,人們最關心的就是運行算法所要花費的時間和算法中使用的各種數據所占用的空間資源。算法所花費的時間通常稱為時間復雜度,使用的空間資源稱為空間復雜度。接下來學習如何計算一個算法的時間復雜度和空間復雜度。查看全文>>
假設標記為星星的點是 test point, 綠色的點是找到的近似點,在回溯過程中,需要用到一個隊列,存儲需要回溯的點,在判斷其他子節點空間中是否有可能有距離查詢點更近的數據點時,做法是以查詢點為圓心,以當前的最近距離為半徑畫圓查看全文>>
以一個符合語言規律的序列為輸入,模型將利用序列間關系等特征,輸出一個在所有詞匯上的概率分布.這樣的模型稱為語言模型。實現可分為以下五個步驟:第一步導入必備的工具包;第二步導入wikiText-2數據集并作基本處理;第三步構建用于模型輸入的批次化數據;第四步構建訓練和評估函數;第五步進行訓練和評估(包括驗證以及測試)...查看全文>>