文章詳情頁

python之語音識別speech模塊

瀏覽：87日期：2022-07-11 18:27:25

1.原理

語音操控分為語音識別和語音朗讀兩部分。

這兩部分本來是需要自然語言處理技能相關知識以及一系列極其復雜的算法才能搞定，可是這篇文章將會跳過此處，如果你只是對算法和自然語言學感興趣的話，就只有請您移步了，下面沒有一個字會講述到這些內容。

早在上世紀90年代的時候，IBM就推出了一款極為強大的語音識別系統-vio voice , 而其后相關產品層出不窮，不斷的進化和演變著。我們這里將會使用SAPI實現語音模塊。

2. 什么是SAPI？

SAPI是微軟Speech API , 是微軟公司推出的語音接口，而細心的人會發現從WINXP開始，系統上就已經有語音識別的功能了，可是用武之地相當之少，他并沒有給出一些人性化的自定義方案，僅有的語音操控命令顯得相當雞脅。那么這篇文章的任務就是利用SAPI進行個性化的語音識別

代碼

前提：打開win7的語音自動識別（控制面板--輕松訪問--語音識別）

#!/usr/bin/env python# -*- codinfg:utf-8 -*-’’’@author: Jeff LEE@file: .py@time: 2018-07-19 11:15@desc:’’’from win32com.client import constantsimport osimport win32com.clientimport pythoncom speaker = win32com.client.Dispatch('SAPI.SPVOICE') class SpeechRecognition: def __init__(self, wordsToAdd): self.speaker = win32com.client.Dispatch('SAPI.SpVoice') self.listener = win32com.client.Dispatch('SAPI.SpSharedRecognizer') self.context = self.listener.CreateRecoContext() self.grammar = self.context.CreateGrammar() self.grammar.DictationSetState(0) self.wordsRule = self.grammar.Rules.Add('wordsRule', constants.SRATopLevel + constants.SRADynamic, 0) self.wordsRule.Clear() [self.wordsRule.InitialState.AddWordTransition(None, word) for word in wordsToAdd] self.grammar.Rules.Commit() self.grammar.CmdSetRuleState('wordsRule', 1) self.grammar.Rules.Commit() self.eventHandler = ContextEvents(self.context) self.say('Started successfully') def say(self, phrase): self.speaker.Speak(phrase) class ContextEvents(win32com.client.getevents('SAPI.SpSharedRecoContext')): def OnRecognition(self, StreamNumber, StreamPosition, RecognitionType, Result): newResult = win32com.client.Dispatch(Result) print('你在說 ', newResult.PhraseInfo.GetText()) speechstr=newResult.PhraseInfo.GetText() # 下面即為語音識別信息對應,打開響應操作 if speechstr=='記事本': os.system(’notepad’) elif speechstr=='寫字板': os.system(’write’) elif speechstr=='畫圖板': os.system(’mspaint’) else: pass if __name__ == ’__main__’: speaker.Speak('語音識別開啟') wordsToAdd = ['記事本', '寫字板','畫圖板',] speechReco = SpeechRecognition(wordsToAdd) while True: pythoncom.PumpWaitingMessages()

調試遇到問題

python調用語音模塊時，遇見TypeError:NoneTypetakesnoarguments這種錯誤類型該如何解決

報錯的原因是：不能調用語音開發包

解決方法：(如果你已經安裝了pyWin32，它也安裝了PythonWin)

1.在python35目錄中找到pythonwin文件夾下的pythonwin.exe

python之語音識別speech模塊

2.雙擊Pythonwin運行，然后選擇工具tools/commakepyutility

python之語音識別speech模塊

3.然后選擇MicrosoftSpeechObjectLibrary5.4，點擊OK鍵

python之語音識別speech模塊

4.運行結果如下，問題解決

python之語音識別speech模塊

后記

推薦一個不錯的語音識別文檔：https://www.jb51.net/article/195212.htm

到此這篇關于python之語音識別speech模塊的文章就介紹到這了,更多相關python 語音識別內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網！

Python 編程

上一條：利用Python實現Json序列化庫的方法步驟下一條：python speech模塊的使用方法

相關文章：

1. JS圖片懶加載庫VueLazyLoad詳解2. Java實現的迷宮游戲3. django queryset相加和篩選教程4. Java利用TCP協議實現客戶端與服務器通信(附通信源碼)5. 使用AJAX（包含正則表達式）驗證用戶登錄的步驟6. idea設置提示不區分大小寫的方法7. Java PreparedStatement用法詳解8. 利用ajax+php實現商品價格計算9. Spring如何集成ibatis項目并實現dao層基類封裝10. IDEA 2020.1.2 安裝教程附破解教程詳解

排行榜

					
					Java利用TCP協議實現客戶端與服務器通信(附通信源碼)
利用ajax+php實現商品價格計算
IntelliJ IDEA導出項目的方法
Spring如何集成ibatis項目并實現dao層基類封裝
使用AJAX（包含正則表達式）驗證用戶登錄的步驟
IDEA 2020.1.2 安裝教程附破解教程詳解
JS圖片懶加載庫VueLazyLoad詳解
django queryset相加和篩選教程
idea設置提示不區分大小寫的方法
Java PreparedStatement用法詳解
Java實現的迷宮游戲