新聞中心
我們能不能夠?qū)ython進(jìn)行實(shí)際的應(yīng)用呢?之前給大家介紹過(guò)關(guān)于,python的發(fā)展方向,相信大家內(nèi)容都有一個(gè)明朗的目標(biāo),對(duì)于人工智能,大家都說(shuō)感覺(jué)過(guò)于高大上,會(huì)不會(huì)不好學(xué)習(xí)之類(lèi)的,其實(shí)大家不必過(guò)于擔(dān)心,整體內(nèi)容,會(huì)是很多代碼構(gòu)建的,那我們可以從局部?jī)?nèi)容看,比如人工最基礎(chǔ)的語(yǔ)言,大家想一想,是怎么將一個(gè)個(gè)代碼塊轉(zhuǎn)換的呢?一起來(lái)看下吧~

語(yǔ)音識(shí)別通常有以下流程:
l 接收語(yǔ)音,比如通過(guò)電話(huà)等方式
l 對(duì)接收到的語(yǔ)音做處理,將聲音轉(zhuǎn)化為電子信號(hào)
l 通過(guò)模擬數(shù)字轉(zhuǎn)換器將模擬形式的連續(xù)電子信號(hào)轉(zhuǎn)換為數(shù)字形式的離散信號(hào)
l 轉(zhuǎn)換成數(shù)字信號(hào)后,模型便可以將音頻轉(zhuǎn)換為文本了
Python 庫(kù)
pip install SpeechRecognition
將音頻文件轉(zhuǎn)換為文本
l 導(dǎo)入語(yǔ)音識(shí)別庫(kù)
l 初始化識(shí)別類(lèi),以便識(shí)別語(yǔ)音。
l 支持語(yǔ)音識(shí)的音頻文件格式:wav, AIFF, AIFF-C, FLAC Wav,AIFF,AIFF-c,F(xiàn)LAc.在這個(gè)例子中我們使用wav文件.
l 我用的是一段電影音頻剪輯,里邊說(shuō)的話(huà)是:"I don’t know who you are,I don’t know what you want, if you’re looking for ransom,I can tell you I don’t have money"
l 默認(rèn)情況下,谷歌識(shí)別器讀取的是英語(yǔ)。
具體代碼如下所示:
#import library
import speech_recognition as sr
# Initialize recognizer class (for recognizing the speech)
r = sr.Recognizer()
# Reading Audio file as source
# listening the audio file and store in audio_text variable
with sr.AudioFile('I-dont-know.wav') as source:
audio_text = r.listen(source)
# recoginize_() method will throw a request error if the API is unreachable, hence using exception handling
try:
# using google speech recognition
text = r.recognize_google(audio_text)
print('Converting audio transcripts into text ...')
print(text)
except:
print('Sorry.. run again...')
好啦,這樣我們就可以實(shí)現(xiàn)語(yǔ)音的轉(zhuǎn)換啦,對(duì)于剛?cè)腴T(mén)的小伙伴會(huì)不會(huì)感覺(jué)特別神奇呢?其實(shí)python本身就是一個(gè)超級(jí)神奇的編程語(yǔ)言,掌握以后,一切不可能實(shí)現(xiàn)可能盡在自己手中哦~
網(wǎng)站標(biāo)題:創(chuàng)新互聯(lián)Python教程:如何使用python腳本進(jìn)行文本轉(zhuǎn)換?
URL地址:http://m.fisionsoft.com.cn/article/dhhdedg.html


咨詢(xún)
建站咨詢(xún)
