技术解析
本人做 java 开发的,对深度学习基本属于一窍不通,今天部门老大要面试一个深度学习的人,给了份深度学习的面试题要我帮他找下答案(部门老大对深度学习也不太懂所以就把这个烫手的山芋给我了),有人能帮忙解决一下吗?
(1)谈谈你项目中使用过的深度学习模型或网络,为什么选择这个算法? (2)conv2d(kernel=7, stride=1, padding=0 )可以用什么代替? (3)训练神经网络,假如 train loss 已经降为 0,valid loss 为 0.2. 有什么方法可以尝试使 valid loss 再进一步下降,为什么这种方法可以? (4)选择熟悉的框架语言,设计一个简单的孪生网络。可以从 keras 、tensorflow 及 pytorch 选择一个框架,如用 pytorch,写出__init__和 forward 过程即可。 (5)用已知参数写出简单的分类训练的伪代码(参数:t抗投诉服务器rain_image, valid_image, net ) (6)能否使用 VC 维解释模型的过拟合和欠拟合