python實(shí)現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫(huà)水平條形圖案例
1、數(shù)據(jù)分組-->頻數(shù)分布表
環(huán)境配置:
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt
按照你設(shè)定合適的間隔,把數(shù)據(jù)分為各個(gè)范圍的組,然后統(tǒng)計(jì)出在這個(gè)范圍內(nèi)的頻數(shù)有多少,我沒(méi)有找到合適的函數(shù),我就自己寫(xiě)了一個(gè)函數(shù),類似直方圖的工作,這是畫(huà)水平條形圖的數(shù)據(jù)準(zhǔn)備。至于為什么要畫(huà)水平條形圖,當(dāng)類別太多,使用水平條形圖比較簡(jiǎn)潔,個(gè)人看法。下面給出代碼,就不解釋代碼含義了。
def data_count(dataa, r1, r2, step): r = pd.DataFrame(np.random.randn(1, 2)) r.drop(0, inplace=True) while r1+step <= r2: num = 0 for j in range(len(dataa)): if dataa[j] >= r1 and dataa[j] < r1+step: num = num + 1 f = '%s~%d' % (r1, r1+step) # r = r.append([[int(r1), num], ]) # 使用單數(shù)表示 r = r.append([[f, num], ]) # 使用范圍表示 r1 = r1 + step return r
要注意的數(shù)據(jù)范圍只包含上界不含下界,數(shù)據(jù)公式這樣子1⩽data<5,只含上界,這樣就可以做出不重不漏。
2、頻數(shù)計(jì)算
這是運(yùn)用data_count函數(shù)(上面代碼)進(jìn)行頻數(shù)計(jì)算的演示,首先看一下原數(shù)據(jù)長(zhǎng)什么樣,暫時(shí)麻煩就不公布了,你們自己按照自己的數(shù)據(jù)決定。

測(cè)試data_count函數(shù)代碼:
data_gap1 = data_count(g11[:], 1, 51, 1)data_gap2 = data_count(g22[:], 1, 51, 1)
很簡(jiǎn)單啦,就是函數(shù)的調(diào)用,你們都會(huì)的,給大家看一下輸出結(jié)果,如下圖:

輸出結(jié)果
感覺(jué)相當(dāng)完美,函數(shù)也很萬(wàn)能,只要輸入最小值最大值和間隔,就能出頻數(shù)分布表
3、水平條形圖
def plot_bar(plot_data, title): plt.figure(figsize=(10, 15)) y = plot_data.iloc[:, 1].values tt = list(range(len(y))) index = plot_data.iloc[:, 0].values plt.bar(left=0, bottom=list(range(len(y))), width=y, color=’blue’, height=0.5, orientation=’horizontal’) # 水平對(duì)應(yīng)bottom&width, height表示bar的寬度 plt.yticks(tt, index) plt.ylabel(’數(shù)據(jù)范圍’) plt.xlabel(’頻數(shù)’) plt.title(title) plt.show()
上面中plt.bar(left=0, bottom=list(range(len(y))), width=y, color=’blue’, height=0.5,orientation=’horizontal’)這句代碼是最重要的,其中l(wèi)eft表示直方圖的開(kāi)始的位置(也就是最左邊的地方),height是指直方圖的高度,當(dāng)直方圖太粗時(shí),可以通過(guò)width來(lái)定義直方圖的寬度,注意多個(gè)直方圖要用元組,yerr這個(gè)參數(shù)是防止直方圖觸頂。orientation=’horizontal’指得水平條形圖,使用barh方法可以省略這個(gè)參數(shù)得設(shè)定。
有個(gè)坑,如果直接用bottom=類別數(shù)據(jù),文本格式的類別會(huì)亂序,需要像我那樣先指定位置,在指定類別,如plt.yticks(tt, index)所作的工作。

水平條形圖
補(bǔ)充知識(shí):在ipython notebook中添加latex公式
1 MathJax 的安裝
ipython notebook中數(shù)學(xué)公式的渲染使用MathJax。一般網(wǎng)絡(luò)較好的情況下,MathJax可以在線使用,但是如果希望離線使用,需要將其安裝到本地磁盤(pán)中,常用的方法是在ipython notebook中使用以下命令:
from IPython.external.mathjax import install_mathjax
install_mathjax()
2.生成配置文件
安裝完mathjax之后可以正常import latex,但是執(zhí)行Latex(r’Ssqrt{x^2+y^2}$’)后顯示的是‘$sqrt{x^2+y^2}$’這樣字符串;
原來(lái)還需要生成配置文件,方法是:在命令行中運(yùn)行 ipython profile create,執(zhí)行完成會(huì)在./ipython/profile_default 目錄下生成
一系列的配置文件,其中包括ipython_notebook_config.py文件;有地方看到需要修改該配置文件,取消 c.NotebookApp.enable_mathjax=True;
的注釋,大家可以試一下,我自己沒(méi)有取消這行注釋,再打開(kāi)ipnb文件時(shí)公式都能正常渲染,耶~
第一次記錄blog,一方面跟大家一起學(xué)習(xí),一方面方便以后回顧,畢竟記性差了許多,哈哈~
以上這篇python實(shí)現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫(huà)水平條形圖案例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. 利用ajax+php實(shí)現(xiàn)商品價(jià)格計(jì)算2. Java實(shí)現(xiàn)UDP通信過(guò)程實(shí)例分析【服務(wù)器端與客戶端】3. JS圖片懶加載庫(kù)VueLazyLoad詳解4. Java PreparedStatement用法詳解5. Python 解決火狐瀏覽器不彈出下載框直接下載的問(wèn)題6. Java利用TCP協(xié)議實(shí)現(xiàn)客戶端與服務(wù)器通信(附通信源碼)7. 使用AJAX(包含正則表達(dá)式)驗(yàn)證用戶登錄的步驟8. Java實(shí)現(xiàn)的迷宮游戲9. HTML <!DOCTYPE> 標(biāo)簽10. Spring如何集成ibatis項(xiàng)目并實(shí)現(xiàn)dao層基類封裝

網(wǎng)公網(wǎng)安備