机器学习与社会科学应用
《机器学习与社会科学应用》,郭峰 著,出版社: 上海财经大学出版社。
书籍对于人类原有很重大的意义,但,书籍不仅对那些不会读书的人是毫无用处,就是对那些机械地读完了书还不会从死的文字中引申活的思想[1]的人也是无用的。 —— 乌申斯基[2]
目录
内容简介
本书是“新文科·新投资系列”的一本。本教材将主要介绍机器学习的基本原理,以及它们在社会科学中的应用。本书的定位是面向熟悉计量经济学、因果识别理论,但不熟悉机器学习的社会科学研究者。因此本书将更加侧重于以浅显直白的语言介绍机器学习的基本原理,并以文献综述、案例详解等方式,介绍机器学习各个算法在社会科学实证研究中的代表性应用。对于代码实操,本书也尽量选取了贴近社会科学研究者的案例,进行详细阐述。 本书还以二维码的形式将相关的代码和具体应用呈现出来,供广大社会科学研究人员参考。
目录
第一章 机器学习基本原理与启示/ 1 第一节 为什么需要学习机器学习/ 1 第二节 机器学习的基本任务/ 5 第三节 机器学习基本原理/ 9 第四节 机器学习的应用与启示/ 18 参考文献/ 21 第二章 经典回归算法/ 24 第一节 OLS回归算法/ 24 第二节 岭回归算法/ 33 第三节 Lasso回归算法/ 41 第四节 算法调参/ 49 参考文献/ 57 第三章 经典分类算法/ 59 第一节 分类算法简介/ 59 第二节 K近邻算法/ 61 第三节 朴素贝叶斯算法/ 70 第四节 决策树算法/ 75 第五节 支持向量机算法/ 83 第六节 分类算法评估/ 92 参考文献/ 95 第四章 自然语言处理入门/ 97 第一节 自然语言处理的基本任务/ 97 第二节 分词/ 103 第三节 TF-IDF/ 116 第四节 文本相似度/ 121 参考文献/ 134 第五章 集成算法/ 136 第一节 集成算法基本原理/ 136 第二节 随机森林算法/ 139 第三节 梯度提升树算法/ 146 第四节 XGBoost算法/ 152 参考文献/ 158 第六章 无监督学习算法/ 159 第一节 无监督学习简介/ 159 第二节 聚类算法/ 161 第三节 降维算法/ 168 第四节 LDA主题模型/ 175 参考文献/ 191 第七章 深度学习算法/ 193 第一节 神经网络基本原理与前馈神经网络/ 193 第二节 卷积神经网络/ 207 第三节 循环神经网络/ 217 第四节 Word2Vec词嵌入算法/ 223 第五节 大语言模型简介/ 229 参考文献/ 235 第八章 特征工程入门与实践/ 237 第一节 特征工程简介/ 237 第二节 特征理解:探索性分析/ 238 第三节 特征增强:清洗数据/ 244 第四节 特征构造:生成新数据/ 261 第五节 特征选择:筛选属性/ 263 第六节 特征转换:数据降维/ 270 参考文献/ 272 第九章 机器学习与因果识别/ 273 第一节 机器学习助力因果识别的基本逻辑/ 273 第二节 更好识别和控制混淆因素/ 275 第三节 更好地构建对照组/ 279 第四节 更好地识别异质性因果效应/ 287 第五节 更好地检验因果关系的外部有效性/ 291 第六节 大数据和机器学习对因果识别的冲击/ 292 第七节 未来展望/ 295 参考文献/ 296 第十章 机器学习与异质性政策效应分析/ 306 第一节 异质性政策效应评估的价值和传统方法/ 306 第二节 传统异质性政策评估方法的问题/ 311 第三节 机器学习在异质性政策效应评估中的应用/ 315 第四节 机器学习的局限以及未来方向/ 324 参考文献/ 330