开始cs231n课程
开始cs231n课程
课程介绍
计算机视觉的深化课程,神经网络在计算机视觉领域的应用,涵盖图像分类、定位、检测等视觉识别任务,以及其在搜索、图像理解、应用、地图绘制、医学、无人驾驶飞机和自动驾驶汽车领域的前沿应用。
导师们着重讲授如何建立图像识别问题,学习算法(如反向传播),实用的工程技巧,训练和微调网络,指导学生通过实际作业,完成最后的课程计划。期末作业还涉及训练数百万参数卷积神经网络和应用上最大的图像分类数据集(ImageNet)。在为期16节课程中,学生将学习实施、训练和调试自己的神经网络,并对计算机视觉前沿研究有详细的了解。
课程大纲
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
第一讲:课程简介
计算机视觉概述
历史回顾
课程逻辑顺序
第二讲:图像分类
数据驱动方法
K最近邻算法
线性分类I
第三讲:损失函数和优化
线性分类II
进阶模型表示与图像特征
优化,随机梯度下降
第四讲:介绍神经网络
反向传播算法
多层感知器
神经学观点
第五讲:卷积神经网络
历史
卷积和池化
视觉之外的卷积神经网络
第六讲:训练神经网络,第一部分
激活函数,初始化,信号丢失,小批量正则化
第七讲:训练神经网络,第二部分
更新原则,集成,数据增强,迁移学习
第八讲:深度学习软件
Caffe, Torch, Theano, TensorFlow, Keras, PyTorch等等
第九讲:卷积神经网络架构
AlexNet, VGG, GoogLeNet, ResNet 等等
第十讲:递归神经网络
RNN,LSTM,GRU
自然语言模型
图像字幕,视觉问题回答,软性关注
第十一讲:检测与分割
语义分割
目标检测
实例分割
第十二讲:可视化和理解
表征可视化
对抗实例
DeepDream和风格迁移
第十三讲:生成模型
Pixel RNN/CNN
自编码器
生成对抗网络
第十四讲:深度增强学习
方法梯度,硬性关注
Q-学习,评价器
第十五讲:Song Han 教授客座讲授
第十六讲:学生讨论,推导
课程目标
重点学习视觉识别任务的端到端模型,特别是图像分类,学生学会实施、训练和调试自己的神经网络,并对计算机视觉前沿研究有详细的了解。
附录
本文由作者按照 CC BY 4.0 进行授权