名称机器学习在量化金融中的应用
作者倪好 于光希 郑劲松 董欣
出版清华大学出版社
ISBN9787302565963
定价69.00
出版时间2021年02月
目录目录
第1章 概述.............................1
1.1 大数据时代......................1
1.2 机器学习.........................2
1.3 量化金融.........................5
1.3.1 金融数据的挑战.............5
1.3.2 机器学习的金融应用.........5
1.3.3 量化金融的未来.............6
1.4 新一代宽客......................6
1.5 学习路线图......................7
1.6 更多资源.........................8
1.6.1 Python库..................8
1.6.2 图书与其他在线资源.........9
1.7 本书之外........................10
第2章 监督学习.......................12
2.1 回归任务框架...................12
2.1.1 模型.......................14
2.1.2 损失函数..................15
2.1.3 优化方法..................16
2.1.4 预测和验证................25
2.2 从回归到分类...................28
2.2.1 分类变量..................28
2.2.2 模型.......................28
2.2.3 损失函数和优化方法........29
2.2.4 预测和验证................30
2.2.5 数值实验..................32
2.3 集成方法........................35
2.3.1 集成原理..................36
2.3.2 同质集成法................37
2.3.3 异质集成法................41
2.4 练习.............................42
第3章 线性回归和正则化.............43
3.1 普通最小二乘法................43
3.1.1 公式推导..................43
3.1.2 优缺点....................45
3.2 正则化线性模型................46
3.2.1 正则化....................46
3.2.2 岭回归....................47
3.2.3 套索回归..................48
3.2.4 数值实验..................50
3.2.5 两种正则化方法的联系.....52
3.3 线性模型延伸:基扩展.........55
3.4 练习.............................56
第4章 树模型..........................57
4.1 原理简介........................57
4.2 决策树..........................58
4.2.1 树结构....................58
4.2.2 模型.......................60
4.2.3 回归树....................61
4.2.4 剪枝.......................65
4.2.5 特征重要性................65
4.3 随机森林........................66
4.4 梯度提升树.....................67
4.5 数值实验:Iris数据集..........69
4.5.1 决策树的实现..............69
4.5.2 随机森林的实现............71
4.5.3 梯度提升树的实现..........72
4.5.4 三种树模型的比较..........72
4.6 练习.............................74
第5章 神经网络.......................75
5.1 基本概念........................75
5.1.1 神经元....................75
5.1.2 层.........................77
5.1.3 激活函数..................77
5.1.4 张量.......................80
5.2 人工神经网络...................81
5.2.1 浅层神经网络..............81
5.2.2 多层神经网络..............84
5.2.3 优化方法..................86
5.2.4 数值实验:MNIST数字识别.......................91
5.3 卷积神经网络...................95
5.3.1 原理简介..................95
5.3.2 图像数据..................96
5.3.3 模型.......................98
5.3.4 优化方法.................107
5.3.5 数值实验:Cifar10图像识别...107
5.4 循环神经网络..................115
5.4.1 原理简介.................115
5.4.2 序列数据.................116
5.4.3 模型.....................117
5.4.4 优化方法:BPTT.........118
5.4.5 循环神经网络的缺点......121
5.4.6 LSTM和GRU............124
5.4.7 数值实验:高频金融数据预测...125
5.5 练习...........................135
第6章 聚类分析......................136
6.1 原理简介......................136
6.2 聚类分析框架..................136
6.2.1 数据集...................137
6.2.2 相似性...................138
6.2.3 聚类方法.................138
6.2.4 检验指标.................139
6.3 K均值法......................140
6.3.1 原理简介.................140
6.3.2 参数选择.................141
6.3.3 K均值法的实现..........145
6.4 层次聚类......................146
6.4.1 链接方式.................146
6.4.2 树状图...................147
6.4.3 层次聚类的实现...........149
6.5 密度聚类:DBSCAN...........149
6.5.1 原理简介.................149
6.5.2 参数选择.................151
6.6 分布聚类......................152
6.6.1 原理简介.................152
6.6.2 最大期望算法.............152
6.7 数值实验:聚类分析...........155
6.8 练习...........................155
第7章 主成分分析..................156
7.1 原理简介......................156
7.1.1 线性变换.................156
7.1.2 奇异值分解...............157
7.1.3 X和Z的方差............158
7.1.4 降维.....................159
7.1.5 实际问题.................159
7.1.6 主成分分析的实现.........160
7.2 数值实验:期限结构分析......161
7.2.1 利率期限结构.............161
7.2.2 数据和观察值.............163
7.2.3 主成分分析与期限结构....164
7.2.4 主成分分析与对冲.........168
7.2.5 主成分分析与聚类分析....171
7.3 练习...........................172
第8章 强化学习......................173
8.1 原理简介......................173
8.2 循环强化学习..................175
8.3 从RNN到RRL...............177
8.4 数值实验:算法交易...........182
8.5 练习...........................187
第9章 金融案例研究:违约风险预测.188
9.1 问题设定与数据...............189
9.2 探索性数据分析...............191
9.2.1 不平衡数据...............191
9.2.2 缺失值...................192
9.2.3 特征分组.................192
9.3 构建第一个分类器.............193
9.3.1 数据预处理...............193
9.3.2 特征工程.................193
9.3.3 训练模型.................195
9.3.4 折外预测.................196
9.3.5 参数调整.................199
9.4 模型集成......................200
9.5 提交结果......................202
9.6 练习...........................202
9.6.1 CFM挑战:波动率预测................202
9.6.2 Kaggle其他金融应用竞赛.....................204
参考文献................................205
节选精彩章节