国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

Python方差特征過濾的實例分析

瀏覽:93日期:2022-07-29 08:24:29
說明

1、通過特征本身的方差來篩選特征。特征的方差越小,特征的變化越不明顯。

2、變化越不明顯的特征對我們區(qū)分標簽沒有太大作用,因此應該消除這些特征。

實例

def variance_demo(): ''' 過濾低方差特征 :return: ''' # 1. 獲取數(shù)據(jù) data = pd.read_csv(’factor_returns.csv’) data = data.iloc[:, 1:-2] print(’data:n’, data) # 2. 實例化一個轉(zhuǎn)換器類 transfer = VarianceThreshold(threshold=10) # 3. 調(diào)用fit_transform() data_new = transfer.fit_transform(data) print(’data_new:n’, data_new, data_new.shape)return None

知識點擴充:

方差過濾法

VarianceThreshold 是特征選擇的一個簡單基本方法,其原理在于–底方差的特征的預測效果往往不好。而VarianceThreshold會移除所有那些方差不滿足一些閾值的特征。默認情況下,它將會移除所有的零方差特征,即那些在所有的樣本上的取值均不變的特征。

sklearn中的VarianceThreshold類中重要參數(shù) threshold(方差的閾值),表示刪除所有方差小于threshold的特征 #不填默認為0——刪除所有記錄相同的特征。

import pandas as pdimport numpy as npnp.random.seed(1) #設置隨機種子,實現(xiàn)每次生成的隨機數(shù)矩陣都一樣a= np.random.randint(0, 200,10)b= np.random.randint(0, 200,10)c= np.random.randint(0, 200,10)d= [9,9,9,9,9,9,9,9,9,9]data=pd.DataFrame({'A' : a,'B' : b,'C' : c,'D' : d})datafrom sklearn.feature_selection import VarianceThresholdsel_model = VarianceThreshold(threshold = 0)#刪除不合格特征之后的新矩陣sel_model.fit_transform(data)

到此這篇關(guān)于Python方差特征過濾的實例分析的文章就介紹到這了,更多相關(guān)Python方差特征過濾的實現(xiàn)內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 灌阳县| 罗源县| 通山县| 山丹县| 安康市| 邹平县| 灵璧县| 石首市| 临颍县| 萝北县| 通化县| 汝阳县| 新乐市| 砚山县| 都安| 汝州市| 阳江市| 宜兰县| 邳州市| 长汀县| 曲阜市| 辽宁省| 颍上县| 常山县| 南漳县| 内黄县| 新安县| 隆林| 齐河县| 南和县| 彰化县| 福鼎市| 云林县| 卓资县| 惠东县| 扎兰屯市| 五家渠市| 逊克县| 武义县| 荆州市| 宿松县|