機器學習與社會科學應用

《機器學習與社會科學應用》，郭峰著，出版社：上海財經大學出版社。

書籍對於人類原有很重大的意義，但，書籍不僅對那些不會讀書的人是毫無用處，就是對那些機械地讀完了書還不會從死的文字中引申活的思想^[1]的人也是無用的。 —— 烏申斯基^[2]

內容簡介

本書是「新文科·新投資系列」的一本。本教材將主要介紹機器學習的基本原理，以及它們在社會科學中的應用。本書的定位是面向熟悉計量經濟學、因果識別理論，但不熟悉機器學習的社會科學研究者。因此本書將更加側重於以淺顯直白的語言介紹機器學習的基本原理，並以文獻綜述、案例詳解等方式，介紹機器學習各個算法在社會科學實證研究中的代表性應用。對於代碼實操，本書也儘量選取了貼近社會科學研究者的案例，進行詳細闡述。本書還以二維碼的形式將相關的代碼和具體應用呈現出來，供廣大社會科學研究人員參考。

第一章機器學習基本原理與啟示/ 1 第一節為什麼需要學習機器學習/ 1 第二節機器學習的基本任務/ 5 第三節機器學習基本原理/ 9 第四節機器學習的應用與啟示/ 18 參考文獻/ 21 第二章經典回歸算法/ 24 第一節 OLS回歸算法/ 24 第二節嶺回歸算法/ 33 第三節 Lasso回歸算法/ 41 第四節算法調參/ 49 參考文獻/ 57 第三章經典分類算法/ 59 第一節分類算法簡介/ 59 第二節 K近鄰算法/ 61 第三節樸素貝葉斯算法/ 70 第四節決策樹算法/ 75 第五節支持向量機算法/ 83 第六節分類算法評估/ 92 參考文獻/ 95 第四章自然語言處理入門/ 97 第一節自然語言處理的基本任務/ 97 第二節分詞/ 103 第三節 TF-IDF/ 116 第四節文本相似度/ 121 參考文獻/ 134 第五章集成算法/ 136 第一節集成算法基本原理/ 136 第二節隨機森林算法/ 139 第三節梯度提升樹算法/ 146 第四節 XGBoost算法/ 152 參考文獻/ 158 第六章無監督學習算法/ 159 第一節無監督學習簡介/ 159 第二節聚類算法/ 161 第三節降維算法/ 168 第四節 LDA主題模型/ 175 參考文獻/ 191 第七章深度學習算法/ 193 第一節神經網絡基本原理與前饋神經網絡/ 193 第二節卷積神經網絡/ 207 第三節循環神經網絡/ 217 第四節 Word2Vec詞嵌入算法/ 223 第五節大語言模型簡介/ 229 參考文獻/ 235 第八章特徵工程入門與實踐/ 237 第一節特徵工程簡介/ 237 第二節特徵理解：探索性分析/ 238 第三節特徵增強：清洗數據/ 244 第四節特徵構造：生成新數據/ 261 第五節特徵選擇：篩選屬性/ 263 第六節特徵轉換：數據降維/ 270 參考文獻/ 272 第九章機器學習與因果識別/ 273 第一節機器學習助力因果識別的基本邏輯/ 273 第二節更好識別和控制混淆因素/ 275 第三節更好地構建對照組/ 279 第四節更好地識別異質性因果效應/ 287 第五節更好地檢驗因果關係的外部有效性/ 291 第六節大數據和機器學習對因果識別的衝擊/ 292 第七節未來展望/ 295 參考文獻/ 296 第十章機器學習與異質性政策效應分析/ 306 第一節異質性政策效應評估的價值和傳統方法/ 306 第二節傳統異質性政策評估方法的問題/ 311 第三節機器學習在異質性政策效應評估中的應用/ 315 第四節機器學習的局限以及未來方向/ 324 參考文獻/ 330

參考文獻

↑ 思想指導人生，豆丁網，2013-01-15
↑ 烏申斯基的教育思想，中公教育，2021-09-19

[1] 思想指導人生，豆丁網，2013-01-15

[2] 烏申斯基的教育思想，中公教育，2021-09-19

[1]

[2]

求真百科

機器學習與社會科學應用

目錄

內容簡介

目錄

參考文獻