如何判斷訓練中的模型已經收斂

慈雲數據 8個月前 (03-13) 技術支持 54 0

可以通過查看訓練集和測試集的loss變化來判斷。

一、loss的變化情況分爲以下幾種情況:

1.train loss 下降,val loss下降: 表明網絡還在學習

2. train loss下降,val loss穩定:網絡過拟合

3.train loss穩定,val loss下降:數據集有問題

4.train loss穩定,val loss穩定:可能已經收斂,或者學習遇到瓶頸,可以調小學習率試試

5.train loss上升,val loss上升:網絡結構設計有問題,或者訓練參數設置不當等,及時停止學習,調整代碼

二、根據訓練曲線判斷是否收斂

1.欠拟合:欠拟合一般有兩種典型表現

①loss曲線趨于水平或維持相對較高的loss值

在這裏插入圖片描述

②訓練結束時,train loss依然持續減少,且val loss 有較大波動

在這裏插入圖片描述

2.過拟合:過拟合指的是模型對訓練集學習的太好,導緻網絡泛化能力差,在驗證集上反而效果不好。

在這裏插入圖片描述

 3.模型收斂:train loss 下降趨于穩定,val loss 下降也趨于穩定,且train loss 的值與val loss 的值相差不大 

 參考:機器學習如何判斷模型訓練是否充分_怎麽看模型是否收斂_supermapsupport的博客-CSDN博客https://blog.csdn.net/supermapsupport/article/details/123912542?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-123912542-blog-122102672.pc_relevant_landingrelevant&spm=1001.2101.3001.4242.2&utm_relevant_index=4

微信掃一掃加客服

微信掃一掃加客服

點擊啓動AI問答
Draggable Icon