PyTorch語音識別實戰檢視原始碼討論檢視歷史
《PyTorch語音識別實戰》,王曉華 著,出版社: 清華大學出版社。
清華大學出版社成立於1980年6月,是教育部主管、清華大學主辦的綜合性大學出版社[1]。清華社現年出版圖書、音像製品、電子出版物等近3000種,銷售規模和綜合實力以及在高等教育教材市場、科技圖書市場、館配圖書市場占有率均名列前茅[2]。
內容簡介
《PyTorch語音識別實戰》使用PyTorch 2.0作為語音識別的基本框架,循序漸進地引導讀者從搭建環境開始,逐步深入到語音識別基本理論、算法以及應用實踐,是較好的一本語音識別技術圖書。本書配套示例源碼、數據集、PPT課件等資源。
《PyTorch語音識別實戰》分為13章,內容包括語音識別之路、PyTorch 2.0深度學習環境搭建、音頻信號處理的理論與Python實戰、音頻處理常用工具包Librosa詳解與實戰、基於DNN的語音情緒分類識別、一學就會的深度學習基礎算法、基於PyTorch卷積層的語音情緒分類識別、詞映射與循環神經網絡、基於Whisper的語音轉換實戰、注意力機制與注意力模型詳解、鳥叫的多標籤分類實戰、多模態語音轉換模型基礎、GLM架構多模態語音文字轉換實戰。
《PyTorch語音識別實戰》內容詳盡、示例豐富,適合作為語音識別初學者、深度學習初學者、語音識別技術人員的必備參考書,同時也非常適合作為高等院校或高職高專深度學習、語音識別等課程的教材。
作者介紹
王曉華,高校計算機專業講師,研究方向為雲計算、大數據與人工智能。其創作的部分圖書:《從零開始大模型開發與微調:基於PyTorch與ChatGLM》《PyTorch 2.0深度學習從零開始學》《Python機器學習與可視化分析實戰》《谷歌JAX深度學習從零開始學》《Spark 3.0大數據分析與挖掘:基於機器學習》《TensorFlow深度學習應用實踐》《TensorFlow語音識別實戰》《TensorFlow 2.0深度學習從零開始學》《深度學習的數學原理與實現》。
參考文獻
- ↑ 我國出版社的等級劃分和分類標準,知網出書,2021-03-01
- ↑ 企業簡介,清華大學出版社有限公司