未來法庭——機器學習讓最高法院判決更透明

科技 06-10

機器學習可以識別出未經署名的最高法院判決意見書的作者真身，準確率也不錯。不過，要通過大法官的圖靈測試，仍有很長的路要走。

長期以來，預測（美國）最高法院判決結果一直是政治學家，律師和法律迷們最愛的遊戲。

人們已經搭建了不同統計模型，預測性演算法，流程圖，還使用機器學習來猜測判決結果。一些模型還是比較可靠的。有些預測命中率達到75%。不過，人類預言者要比這些模型更讓人印象深刻。

機器之心註解：

法律學者Josh Blackman說，他和同事開發的計算機演算法能以7成的正確率預測美國最高法院大法官是否將會維持還是推翻下級法院的裁決。演算法（PDF）使用了超過90個變數，源代碼已經發布在Github上。

有一個人，他被FiveThirtyEight網站視為「世界頂級最高法院判決預測者」，連續數年贏得了FantasySCOTUS（類似最高法院版本的夢幻聯賽，讓玩家預測判決結果——譯者），準確率高達80%。

不過，最高法院還有另一片可供計算機大展拳腳的天地，亦即找出仍不清楚的判決信息，即使判決已經做出，也就是未經署名的判決意見書。最高法院的上一個開庭期，有8份未署名的判決意見書，已經超過該開庭期案件量（66件）的10%。

機器之心註解：

Term，開庭期。聯邦最高法院開庭時間為每年10月的第一個星期一到翌年6月中旬。從十月到年底，大法官們忙著挑選要審理案子。來年1、2月，案件選出後，庭審逐漸密集，偶爾會有新聞爆料。春天一過，庭審接近尾聲，大法官們開始忙著撰寫判決意見。一旦進入六月，絕大多數重要案件判決結果會接連宣布，這段時間，新聞記者會累成狗，最高法院也會成為當之無愧的頭條。隨後進入為期三個月的夏季閉庭期，不再審理案件。鏖戰六月後的新聞記者終於可以鬆口氣，媒體開始回顧總結，展望新一輪開庭期。

去年，Adam Liptak在給《紐約時報》的撰文中寫道，不署名的原因很可能是因為糾正的錯誤太引人注目，會讓法官有更多考量，然而，這個數字確實讓我們看到法院工作的某種趨勢。比如，挑戰針對自己判決的那些犯人輸了。或者說被訴不道德行為、負責法律實施的官員贏了。

他說，這就是一種躲在匿名面紗背後的手段，一種擺脫責任的機制。

機器之心註解：

Per curiam decisions，它是法院認為案件事實問題爭議不大時，越過庭審環節，直接作出的裁判。即決命令很少說理，或者根本不說理，也不用署名。Opinion of the Court和Per curiam Opinions不同。美國最高法院一般要寫一個統一的意見書。這個判決意見書無論是全體法官一致同意、還是多數法官同意，都被稱為法院判決（ opinion of the court），因為是多數意見，也叫做Majority Opinion。有些法官儘管同意判決結果，但可能不同意斷案的根據和邏輯，便會另外出具協同意見（ concurring opinions）。那些根本不同意判決決定的法官也發表自己的意見，通稱為少數意見書( minority opinions)，一般是各自撰寫自己的異議意見書（dissenting opinion），都是需要署名的。

因此，Li和他的同事搭建了一種演算法，用來判定到底是哪個法官撰寫了未署名的判決意見。2012年，他們開始這項研究工作，當時正值羅伯茨大法官在舉國關注的奧巴馬醫療案最後時刻改變主意而導致坊間流言四起的時候——羅伯茨大法官當時的舉動似乎是在已經撰寫了異議意見的大部分內容後，才撰寫完多數意見的。Li和他的同事希望找到證明這一猜測的辦法。

他們結合了統計數據挖掘和機器學習方法，搜集了每位大法官過去多年署名判決意見，當做個人寫作風格的數據資料。機器人程序分析這些判決意見，提取出帶有大法官個人獨特風格的單詞，短語以及句子結構。然後，系統會賦予那些帶有個人風格的術語更大的權重，因此，它就清楚掃描每份判決書時，自己需要搜尋的是什麼。系統發現，羅伯茨頻繁使用「pertinent」這個詞。

機器之心註解：

John G Roberts，美國最高法院首席大法官，也是開庭時落座最中間座位的那位大法官。

Li 說，「羅伯茨大法官似乎傾於用『here』作為句子的開頭語，用『the first place』為一句話做ending。布雷耶大法官則頻繁使用『in respect to』。斯卡利亞大法官的一個象徵性用語就是『utterly』，通常用『of course』作為一句的開頭。似乎確實存在風格不同的署名方式。」

機器之心註解：

Antonin Scalia：美國最高法院大法官，也是美國媒體最喜歡報道，爭議最大的大法官。

Stephen Breyer：美國最高法院大法官，學者型大法官，著述頗豐，被波斯納譽為最善學習的大法官。

計算機可以檢測到的鮮明風格署名，通常很難為人類察覺。比如，機器人系統發現，金斯伯格和索托馬約爾兩人的判決意見關鍵詞存在區別，這是人力很難發現的。金斯伯格經常使用「notebly」、「observed」和「stated」，而索托馬約爾更喜歡「observes」,「heightened 」和「lawsuits」。

機器之心註解：

Ruth Bader Ginsburg：美國最高法院女大法官，知識產權權威，捍衛女權。

Sonia Sotomayor：美國最高法院女大法官，第一位拉丁裔大法官，出身貧民窟的勵志典範。

其他幾位大法官：

Anthony Kennedy：美國最高法院大法官，也是一些重要爭議案件中一錘定音的搖擺票。

Elena Kagan：美國最高法院女大法官，曾任哈佛大學法學院院長。

Samuel Alito：美國最高法院大法官。

Clarence Thomas：美國最高法院大法官，也是美國第二位非裔美國人大法官。

為了測試演算法準確性，Li和同事給系統輸入了117份有簽名（但他們刻意隱藏署名）判決意見書（因此他們是知道正確答案的）。機器人系統猜中了95份，命中率為81%。就奧巴馬醫療案中羅伯茨大法官署名問題來看，計算機給出的答案是，幾乎可以肯定羅伯茨撰寫了多數意見，斯卡利亞撰寫了反對意見。

Li認為自己模型準確率還算「盡如人意」，但也算不上完全意外，部分原因在於他預料到了這一點。他說，這類分析工作可以追溯到上世紀60年代。

比如，1964年，數學家Frederick Mosteller 和 David Wallace用統計方法解決《聯邦黨人文集》的作者爭議。著作《Inference and Disputed Authorship》還登上了當時的《時代》雜誌封面。儘管他們的方法在當時具有開創性，Mosteller和Wallace卻只能使用（在今天看來）極小的資料庫。如今，機器學習演算法越來越成熟，計算機的計算能力也越來越強大，計算機科學家使用的數據量也是海量級別。

Li說，「能夠輕易獲取這麼多數據和作者標記好的數據，這很棒。」「搜集所有大法官判決意見以及其他資料也理應簡單。」

表面看起來，這個發現很陳舊，但是，它確實表明計算機科學家所能做的事情已經有了深刻變化。有了足夠數據，計算機能做的就不僅限於預測作者是誰。比如，你可以想像機器人法官做出判決，判決書頗具某個大法官之風。將機器學習和語言生成應用到一組足夠強健的數據組中，理論上，即使在人類大法官去世後，機器也可以延續他的判決風格繼續做出判決，這才是真正的「終身任命」。（美國最高法院大法官是終身制，除非自己辭職或遭到彈劾。——譯者）

這並不是說，這是個好主意。但它確實讓人感興趣。因為在幾乎所有去烏托邦噩夢中，機器人都在揮舞著機器武器，很暴力。一個機器人的最高法院大法官——或者至少說，機器人足夠能幹，可以生成反映人類寫作特點的判決——的潛在可能性還是有的，Li說，「但是，距離生成與人類書寫的判決意見不分伯仲的判決意見，我們還有很長路的要走。對於計算機來說，挑戰仍然艱巨。通過大法官的圖靈測試，困難重重。」

請您繼續閱讀更多來自 機器之心 的精彩文章:

為什麼你大腦的90％都像中了沉睡魔咒？

史上最強機器人進化編年史

人工智慧或幫助宇宙科學家生成第一張黑洞圖像

機器人商業評論：丹麥成為歐洲機器人中心的5個原因

對話艾倫人工智慧CEO Oren Etzioni

您可能感興趣

※工作人員竟給海豚打飛機，法庭法官這樣判決
※崔順實辯護律師：不服法院一審判決已決定上訴
※據泰國媒體稱：英拉不會現身法庭聽取最終判決結果，即便判了，也是自討沒趣！
※不滿法院延長羈押期限判決朴槿惠律師團表明辭意
※歷史上最牛釘子戶，把皇帝告上法院，結果法官的判決讓人吃驚
※澳門終審法院裁判前檢察長何超明有罪判決成立
※拒不履行法院判決，公司被罰款，法人還被判刑了！
※智能法律：從第一家初創到法官判決智能預測
※韓國憲法法院定於今日對總統朴槿惠彈劾案作出判決
※「小三」傳不雅照，台法官當庭驗照並判決無罪
※韓國憲法法院罷免朴槿惠判決書全文翻譯
※朴槿惠疑似對法院判決不服再表態，波瀾再起
※李在鎔表情凝重走進法院接受結審判決
※法院判決由仲裁機構決定卡蘭尼克是否留在Uber董事會
※父親因超速被法院起訴，法官讓兒子判決，回答讓全場笑翻
※律師稱英拉病了要求推遲判決法院怕英拉逃跑要逮捕
※各地暫停玩具槍案辦理疑等新規出台，有法院收回未生效判決
※英拉現身法庭聽取判決結果，這豈不是自投羅網？
※法院一審判崔順實3年刑韓檢方不服判決決定上訴