PyTorch语音识别实战

来自孔夫子网的图片

《PyTorch语音识别实战》，王晓华著，出版社：清华大学出版社。

清华大学出版社成立于1980年6月，是教育部主管、清华大学主办的综合性大学出版社^[1]。清华社现年出版图书、音像制品、电子出版物等近3000种，销售规模和综合实力以及在高等教育教材市场、科技图书市场、馆配图书市场占有率均名列前茅^[2]。

内容简介

《PyTorch语音识别实战》使用PyTorch 2.0作为语音识别的基本框架，循序渐进地引导读者从搭建环境开始，逐步深入到语音识别基本理论、算法以及应用实践，是较好的一本语音识别技术图书。本书配套示例源码、数据集、PPT课件等资源。

《PyTorch语音识别实战》分为13章，内容包括语音识别之路、PyTorch 2.0深度学习环境搭建、音频信号处理的理论与Python实战、音频处理常用工具包Librosa详解与实战、基于DNN的语音情绪分类识别、一学就会的深度学习基础算法、基于PyTorch卷积层的语音情绪分类识别、词映射与循环神经网络、基于Whisper的语音转换实战、注意力机制与注意力模型详解、鸟叫的多标签分类实战、多模态语音转换模型基础、GLM架构多模态语音文字转换实战。

《PyTorch语音识别实战》内容详尽、示例丰富，适合作为语音识别初学者、深度学习初学者、语音识别技术人员的必备参考书，同时也非常适合作为高等院校或高职高专深度学习、语音识别等课程的教材。

作者介绍

王晓华，高校计算机专业讲师，研究方向为云计算、大数据与人工智能。其创作的部分图书：《从零开始大模型开发与微调：基于PyTorch与ChatGLM》《PyTorch 2.0深度学习从零开始学》《Python机器学习与可视化分析实战》《谷歌JAX深度学习从零开始学》《Spark 3.0大数据分析与挖掘：基于机器学习》《TensorFlow深度学习应用实践》《TensorFlow语音识别实战》《TensorFlow 2.0深度学习从零开始学》《深度学习的数学原理与实现》。

参考文献

↑ 我国出版社的等级划分和分类标准，知网出书，2021-03-01
↑ 企业简介，清华大学出版社有限公司

[1] 我国出版社的等级划分和分类标准，知网出书，2021-03-01

[2] 企业简介，清华大学出版社有限公司

[1]

[2]

求真百科

PyTorch语音识别实战

目录

内容简介

作者介绍

参考文献