用hw 的decision tree 去跑了一下
40000筆data 真的要花很多時間
因此就選了那三個都沒'?'的dimension去作測試
train 出來的結果超漂亮的
test -> 1 = 8280, 2=750, 3=799, 4=171
根本就是perfect的結果呀!!!
一整個超興奮的!!
結果submit的成績只有2.2146...
因為tree要跑太久 所以想說改成binary index search 的方法
然後一直有錯...囧>
----
改成theta 取 mid
DCtree_d3_mid = 2.206
看來也沒多好
可見要用很多維去train才有用?!
----
用random perm 取一半 去 train 剩的一半作validation
然後取最好的結果
DCtree_d3_valid = 2.24
結果效果反而更差了
如果train 的sample個數一樣 效果會好一點
但這比全部下去 train 要少了一半 因此效果變差了
沒有留言:
張貼留言