如何使用Python 對缺失值進行處理
問題描述
最近項目一直在研究如何處理缺失值,因為拿來分析的數據多種多樣,缺失值也占了一小部分,讓人頭痛的有兩個問題:1.R語言里有一個專門處理缺失值的mice包,那么萬能的Python里有沒有相似的呢?2.如何對含有字符串類型的缺失值進行填充呢?聚類啊回歸都是相對于數值型來說的,那么對于字符型有什么好的算法或者有什么好的封裝的包來處理呢?求大神解答。PS:額,樣例的話,比較不好描述,就如下:name,password,age,address張三,123456,15.3,sichuang李四,12,12.2,wuhan王五,232,12,錢六,,23,nanchang哈哈,123456,,lal啦啦,123123,,mmm
我們希望如R語言中的mice包一樣,能使用Python很快的填充里面的缺失值(當然這個例子里面的信息關聯性不大,但是要處理的數據里關聯性比較多),再也如例子中,通過其他的屬性,將屬于字符串類型的address填充完整,就是第二個問題。
問題解答
回答1:#文本保存到1.txt,刪除最后一行的address值name,password,age,address張三,123456,15.3,sichuang李四,12,12.2,wuhan王五,232,12,錢六,,23,nanchang哈哈,123456,,lal啦啦,123123,,
import pandas as pddf = pd.read_table(’1.txt’, header=0, sep=’,’)#添加一列df[’new’] = ’新值’#按當前行的其他列,填充address值df[’address’] = df.apply(lambda x: x[’new’] if pd.isnull(x[’address’]) else x[’address’], axis=1)print df回答2:
PyMICE is a Python? library for mice behavioural data analysis.你可以看看是不是你要的?https://neuroinflab.wordpress...http://neuroinflab.github.io/...
相關文章:
1. python 計算兩個時間相差的分鐘數,超過一天時計算不對2. javascript - 使用form進行頁面跳轉,但是很慢,如何加一個Loading?3. angular.js - 輸入郵箱地址之后, 如何使其自動在末尾添加分號?4. angular.js - angularjs 注入模塊報錯 很怪異... 求解惑5. javascript - JS 里面的 delete object.key 到底刪除了什么?6. javascript - ES6規范下 repeat 函數報錯 Invalid count value7. docker-compose中volumes的問題8. javascript - html5的data屬性怎么指定一個function函數呢?9. javascript - 后臺管理系統左側折疊導航欄數據較多,怎么樣直接通過搜索去定位到具體某一個菜單項位置,并展開當前菜單10. html5 - 為什么使使用vue cli 腳手架,post-css 沒有自動對css3屬性自動添加瀏覽器前綴呢?
