自然語言處理檢視原始碼討論檢視歷史
《自然語言處理》,副標題:基於預訓練模型的方法,車萬翔,郭江,崔一鳴 著,出版社: 電子工業出版社。
電子工業出版社成立於1982年10月,是工業和信息化部直屬的科技與教育出版社[1],享有「全國優秀出版社」、「講信譽、重服務」的優秀出版社、「全國版權貿易先進單位」、首屆中國出版政府獎「先進出版單位」等榮譽稱號[2]。
內容簡介
自然語言處理被譽為「人工智能皇冠上的明珠」。深度學習等技術的引入為自然語言處理技術帶來了一場革命,尤其是近年來出現的基於預訓練模型的方法,已成為研究自然語言處理的新範式。本書在介紹自然語言處理、深度學習等基本概念的基礎上,重點介紹新的基於預訓練模型的自然語言處理技術。本書包括基礎知識、預訓練詞向量和預訓練模型三大部分:基礎知識部分介紹自然語言處理和深度學習的基礎知識和基本工具;預訓練詞向量部分介紹靜態詞向量和動態詞向量的預訓練方法及應用;預訓練模型部分介紹幾種典型的預訓練語言模型及應用,包括BERT、GPT等,特別是近年來發展迅速的生成模型,包括BART、UniLM、T5、GPT-3等,以及預訓練模型的新進展,包括多模態融合的預訓練模型。除了理論知識,本書還有針對性地結合具體案例提供相應的PyTorch 代碼實現,不僅能讓讀者對理論有更深刻的理解,還能快速地實現自然語言處理模型,達到理論和實踐的統一。
本書既適合具有一定機器學習基礎的高等院校學生、研究機構的研究者,以及希望深入研究自然語言處理算法的計算機工程師閱讀,也適合對人工智能、深度學習和自然語言處理感興趣的學生和希望進入人工智能應用領域的研究者參考。
作者介紹
車萬翔
博士,哈爾濱工業大學計算學部長聘教授、博士生導師,社會計算與信息檢索研究中心副主任。教育部青年長江學者,黑龍江省「龍江學者」青年學者,斯坦福大學訪問學者。現任中國中文信息學會計算語言學專業委員會副主任兼秘書長;國際計算語言學學會亞太分會(AACL)執委兼秘書長;中國計算機學會高級會員。在ACL、EMNLP、AAAI、IJCAI等國內外高水平期刊和會議上發表學術論文50餘篇,其中AAAI 2013年的文章獲得了最佳論文提名獎,論文累計被引用4,600餘次(Google Scholar數據),H-index值為37。出版教材 2 部,譯着 2 部。目前承擔2030「新一代人工智能」重大項目課題、國家自然科學基金等多項科研項目。負責研發的語言技術平台(LTP)已被600餘家單位共享,提供的在線「語言云」服務已有用戶1萬餘人,並授權給百度、騰訊、華為等公司使用。2018、2019連續兩年獲CoNLL國際評測No.1。2020年獲黑龍江省青年科技獎;2015、2016連續兩年獲Google Focused Research Award(谷歌專注研究獎);2016年獲黑龍江省科技進步一等獎(排名第2);2012年獲黑龍江省技術發明獎二等獎(排名第2);2010年獲中國中文信息學會「錢偉長」中文信息處理科學技術獎一等獎(排名第2)、首屆漢王青年創新獎(個人)等多項獎勵。2017年,所主講的MOOC課程《高級語言程序設計(Python)》獲國家精品在線開放課程。
郭江
麻省理工學院計算機科學與人工智能實驗室,博士後研究員。畢業於哈爾濱工業大學社會計算與信息檢索研究中心,約翰斯·霍普金斯大學聯合培養博士,研究方向為自然語言處理與機器學習。在人工智能、自然語言處理領域國際重要會議及期刊(如ACL、EMNLP、AAAI等)發表論文20餘篇。是被業界廣泛應用的中文語言技術平台LTP的主要研發者之一。2015年,獲百度獎學金;2018年,獲中文信息學會「優秀博士學位論文」提名獎。
崔一鳴
科大訊飛北京研究院副院長、資深級主管研究員。畢業於哈爾濱工業大學,獲工學學士和碩士學位,並繼續攻讀博士學位。主要從事閱讀理解、預訓練模型等自然語言處理相關領域的核心技術研究工作,致力於推動中文機器閱讀理解和中文預訓練模型的研究與發展。曾多次獲得機器翻譯、機器閱讀理解、自然語言理解評測冠軍,其中包括機器閱讀理解權威評測SQuAD、自然語言理解權威評測GLUE等。所研製的中文閱讀理解及預訓練模型開源項目被業界廣泛應用,在GitHub累計獲得1萬以上星標,HuggingFace平台月均調用量達到100萬次。發表學術論文30餘篇(包括ACL、EMNLP、AAAI等高水平論文),申請發明專利20餘項。擔任EMNLP 2021和NLPCC 2021領域主席,擔任NLP和AI領域頂級國際會議和國際ESI期刊審稿人職務。
參考文獻
- ↑ 我國出版社的等級劃分和分類標準,知網出書,2021-03-01
- ↑ 關於我們,電子工業出版社