PyTorch語音識別實戰檢視原始碼討論檢視歷史

來自孔夫子網的圖片

《PyTorch語音識別實戰》，王曉華著，出版社：清華大學出版社。

清華大學出版社成立於1980年6月，是教育部主管、清華大學主辦的綜合性大學出版社^[1]。清華社現年出版圖書、音像製品、電子出版物等近3000種，銷售規模和綜合實力以及在高等教育教材市場、科技圖書市場、館配圖書市場占有率均名列前茅^[2]。

內容簡介

《PyTorch語音識別實戰》使用PyTorch 2.0作為語音識別的基本框架，循序漸進地引導讀者從搭建環境開始，逐步深入到語音識別基本理論、算法以及應用實踐，是較好的一本語音識別技術圖書。本書配套示例源碼、數據集、PPT課件等資源。

《PyTorch語音識別實戰》分為13章，內容包括語音識別之路、PyTorch 2.0深度學習環境搭建、音頻信號處理的理論與Python實戰、音頻處理常用工具包Librosa詳解與實戰、基於DNN的語音情緒分類識別、一學就會的深度學習基礎算法、基於PyTorch卷積層的語音情緒分類識別、詞映射與循環神經網絡、基於Whisper的語音轉換實戰、注意力機制與注意力模型詳解、鳥叫的多標籤分類實戰、多模態語音轉換模型基礎、GLM架構多模態語音文字轉換實戰。

《PyTorch語音識別實戰》內容詳盡、示例豐富，適合作為語音識別初學者、深度學習初學者、語音識別技術人員的必備參考書，同時也非常適合作為高等院校或高職高專深度學習、語音識別等課程的教材。

作者介紹

王曉華，高校計算機專業講師，研究方向為雲計算、大數據與人工智能。其創作的部分圖書：《從零開始大模型開發與微調：基於PyTorch與ChatGLM》《PyTorch 2.0深度學習從零開始學》《Python機器學習與可視化分析實戰》《谷歌JAX深度學習從零開始學》《Spark 3.0大數據分析與挖掘：基於機器學習》《TensorFlow深度學習應用實踐》《TensorFlow語音識別實戰》《TensorFlow 2.0深度學習從零開始學》《深度學習的數學原理與實現》。

參考文獻

↑ 我國出版社的等級劃分和分類標準，知網出書，2021-03-01
↑ 企業簡介，清華大學出版社有限公司

[1] 我國出版社的等級劃分和分類標準，知網出書，2021-03-01

[2] 企業簡介，清華大學出版社有限公司

[1]

[2]

PyTorch語音識別實戰檢視原始碼討論檢視歷史

目錄

內容簡介

作者介紹

參考文獻