一、loss的變化情況分爲以下幾種情況:
1.train loss 下降,val loss下降: 表明網絡還在學習
2. train loss下降,val loss穩定:網絡過拟合
3.train loss穩定,val loss下降:數據集有問題
4.train loss穩定,val loss穩定:可能已經收斂,或者學習遇到瓶頸,可以調小學習率試試
5.train loss上升,val loss上升:網絡結構設計有問題,或者訓練參數設置不當等,及時停止學習,調整代碼
二、根據訓練曲線判斷是否收斂
1.欠拟合:欠拟合一般有兩種典型表現
①loss曲線趨于水平或維持相對較高的loss值
②訓練結束時,train loss依然持續減少,且val loss 有較大波動
2.過拟合:過拟合指的是模型對訓練集學習的太好,導緻網絡泛化能力差,在驗證集上反而效果不好。
3.模型收斂:train loss 下降趨于穩定,val loss 下降也趨于穩定,且train loss 的值與val loss 的值相差不大
參考:機器學習如何判斷模型訓練是否充分_怎麽看模型是否收斂_supermapsupport的博客-CSDN博客https://blog.csdn.net/supermapsupport/article/details/123912542?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-123912542-blog-122102672.pc_relevant_landingrelevant&spm=1001.2101.3001.4242.2&utm_relevant_index=4