損害賠償案件判決預測
利用判決書案件描述部分來預測法官判決結果,並找出影響判決的重點
司法院判決書開放資料下載
時間為 2017年10月 至 2018年9月,共一年的民事案件資料。
其中選擇數量較多且判決書中有明確判決原因的損害賠償案件作為訓練資料,共 9,062 筆
- 案件描述
主要為原告和被告的主張、陳述,以及案件描述。不會包含判決結果。 - 判決主文
法官的判決結果 - 判決結果
由判決主文決定判決結果,並分為以下三種
1.原告訴求或部分訴求法官同意(原告勝訴)
2.原告訴求遭法院駁回(原告敗訴)
3.其他(像是原判決廢棄、案件移送其他法院等)
p.s. 其餘欄位像是出現的法條、法官等雖然我有整理出來,但並沒有實際應用到判決預測中。
-
模型結構:
案件描述輸入 > embedding(word2vec) > LSTM(雙向GRU) > Attention >
連接層 > LSTM(雙向GRU) > Attention(產出句子權重) > 連接層 > 判決結果 -
訓練結果:
epochs = 23 、 train_acc = 0.826 、 test_acc = 0.830
以下連結與資料在我學習過程中提供了一些很棒的想法和思路
2018中国‘法研杯’法律智能挑战赛(CAIL2018)个人作品
文字探勘on判決預測
Attention
Leemeng-NLP