當前位置:
首頁 > 最新 > 李則立:人工智慧全面進軍法律界?先做好這三件事!

李則立:人工智慧全面進軍法律界?先做好這三件事!

編者按

2018年1月20日下午,在復旦大學法學院與德恆上海律師事務所共同主辦的「人工智慧(AI)創新與法律服務變革之路」高峰論壇上,上海市人民高級法院宣傳處副處長李則立作了《法律人擁抱人工智慧的現實需求和內在邏輯》的主題演講。他認為,人工智慧不是目的而是手段,法律界之所以要發展人工智慧,是因為它提供了全新的解決方案。以下為其演講全文。

上海市高級人民法院宣傳處副處長 李則立

跟很多法律人聊過人工智慧,與人工智慧的熱潮正好相反,大家對此多持保留態度。

有人說,研發人工智慧是科技公司的事,跟法律人有什麼關係?人工智慧號稱深度學習,為何現在看起來並沒有那麼"智能"?還有人說,我們為什麼要發展人工智慧?等著來替代我們嗎?

這可能是因為我們更多地關注技術的問題,而比較少談法律人擁抱人工智慧的現實需求和內在邏輯。我們不妨從問題出發來談這個話題。人工智慧有何特別?到底有多厲害?開發路徑難不難?法律人推進人工智慧到底有什麼內在需求?

01

為什麼要發展人工智慧

因為人工智慧的發展提供了全新的解決方案。人工智慧與原先大量使用的「專家系統」,最重要的差別是「適應性」(其實專家系統也屬於人工智慧範疇,這個對比應以專家系統與計算智能最為準確,但達成理解起見,還是以專家系統與人工智慧來做區分)。

一位產品經理講過這樣一個故事:

開發銀行問答系統,一個公司用「專家系統」,一個公司用「人工智慧」,兩家競爭。開始的時候專家系統表現更好,為什麼?假如出了一個新的問題,加一個規則,寫幾行代碼,直接給出答案。專家系統改起來很快。但是當數據量大到一定程度以後,人工智慧系統開始超越。

因為人工智慧可以不「依賴規則」。就是說,不需要人告訴它怎麼做,可以基於神經網路、深度學習,自動尋找規律,得出結論。面對海量數據,人工智慧比較優勢明顯,還能夠在學習過程中不斷迭代升級。

專家系統簡單理解,就是一個寫死的程序。但現實中,專家經驗其實在很多時候很難用準確的規則直接寫出來。各條經驗即使寫成明確的規則,也常常不能保持邏輯的自洽性,互相之間打架,假如出現很多新問題,就很難適應。(當然,也並不是說專家系統就此淘汰了,事實的情況是和人工智慧綜合應用,但兩者原理不同。)

02

人工智慧的真實當下

那麼有了一個新的解決方案,似乎給我們帶來了新的希望。那你可能要問了,這個「人工智慧」現在有多厲害?能有多智能?

就目前而言,我們還不能高估人工智慧。《三體》的作者劉慈欣說,我們處在AI的史前時代。連法律科技公司自己都站出來說,法律人工智慧應該降降溫了!因為談前景的太多,以至於把合理的想像和預期變成了當下的真實。

目前的法律人工智慧,如果從一個法律人的角度來看,機器還沒那麼「聰明」,甚至看起來有點「傻」

比如最為重要的兩項技術應用,一是OCR圖像識別,能夠把以紙質文本存在的起訴書、證據材料識別成電子文本。這已經是相當成熟的人工智慧技術了,但是假如在紙質文件上蓋個章,它的識別就可能發生困難,目前彩色的印章可以識別,黑白複印件則不行。如果上面有個表格,那基本識別不出來。如果是手寫體,機器確實已經能夠看懂書寫規範的高考作文,但如果你學的是王羲之韻味深長的草書,它還無法欣賞。

二是語音識別。語言自動轉換成文字,目前已經被大量應用,但是千萬不要以為書記員馬上就要被替代了。如果庭審時,一方當事人不時要說幾句上海方言,機器馬上懵。

倘若你還想讓機器準確理解什麼是債權,什麼是物權,就別多想了。所以,千萬別以為有了神經網路、深度學習,機器就將無所不能,甚至馬上要替代人類

但同時,也不能因為人工智慧目前的發展階段如此,就認為不過是又一個「法律自動售貨機」那樣的鏡花水月。

03

人工智慧的可能未來

圖像識別就像讓機器長了眼睛,而語音識別則讓機器有了耳朵。眼睛和耳朵有什麼稀奇?如果以生物進化的視角來看,我們很可能進入了機器的「寒武紀」。

達爾文的進化論有個很難解釋的bug叫做「寒武紀生物大爆炸」,為什麼生物一代一代緩慢進化,到了寒武紀突然爆發了?有一派理論認為,因為生物「看見」了。5.4億年前,視力可能是寒武紀大爆炸背後的驅動力,有了眼睛之後,生物開始追逐捕食其他生物,動物突然變得積極主動。更重要的是,眼睛作為感測器,能夠收集大量的數據,而隨著數據量的增加,大腦的學習周期就會加快,進一步推動之後的生物進化。數億年後,人類作為最智能的視覺動物,人腦中有一半神經網路致力於視覺處理。孫正義等人都提出此類理念,認為視覺將成為「AI的殺手級應用」

那麼,科技的進化是否可能如生物的寒武紀大爆炸?K·K認為,科技本身是一個物種,和微生物、植物、動物一樣。而且具有自動生長的內在機制,比如有了電,就一定會發明電燈,即使愛迪生沒做出來,也一定有其他人做出來。

確實如此,1674年左右,牛頓和萊布尼茨各自獨立地創建了微積分。在全世界有6位不同的發明人發明了溫度計。有5個人在很短時間裡,反覆發明了電報。更有說服力的例子是,二戰期間,全球6個不同科學組織,在彼此信息完全隔絕的情況下,獨立地研究出核武器時要用到的——四因子公式。K·K稱之為必然性湧現

當機器有了眼睛和耳朵,也就是有了「感知」,必然會向著「認知」的方向進發。這也就是人工智慧界所說的,從感知智能向認知智能發展的大趨勢。

04

人工智慧的實現路徑

到此,你可能說,好吧,我承認人工智慧有個成長過程,現在看起來有點傻,將來會變得聰明。那既然有這個成長過程,我們能不能等到他長大成熟了再來應用呢?何必現在就入場?

這涉及到人工智慧的實現路徑問題。我們能不能等到通用人工智慧實現,人工智慧變得全知全能以後再來用於法律行業?

這個問題當然存在一定爭議,特別是AlphaGo Zero出現以後,不少參與開發法律人工智慧的法官說,我們的路是不是走錯了?阿爾法狗元用「左右互搏」的方法,不用任何人類產生的數據,自我學習,打敗了曾經擊敗李世石,下哭柯潔的阿爾法狗。那麼是否可能出現一種可以適用任何領域的人工智慧呢?

個人比較傾向K·K的觀點,不存在一個通用的人工智慧。K·K說,「我們總是希望創造一個像瑞士軍刀那樣的,有很多功能的東西,但是這樣的智能可能在許多方面都不錯,但不可能所有方面都做到極致,不可能優化每一個維度。」因為物理是有極限的,溫度、空間、時間、速度都有極限,宇宙中還沒有哪種物理維度是無限的。

工程學的原理告訴我們,一個產品不可能在任何指標上達到最佳,必須妥協。比如手機,如果以蘋果為標杆的話,那麼其他所有品牌的手機都可能在一個或者多個性能數據上超過蘋果,蘋果為何不能讓每個數據都做到極致呢?

因為不可能,我們的世界是有極限的,只能在極限以下尋找一個最優解。蘋果之所以受歡迎,是因為它可能是其中做的最好的。其實這個問題有點像當年的「永動機」問題。當我們清楚了原理,也就不會在這個方向上糾結。

如果等待通用人工智慧的道路走不通,目前我們所知的路徑就是沿著「演算法、專家、數據」相結合的模式演進。

兩個模式最大的區別在於,是否需要人類的數據來訓練。也就是說,機器能不能脫離了人類老師完全自學成才,如果不能,就需要人類「教」。但「教」機器成本巨大,可以說是「坑深路遠」。

首先,數據需要經過標註,機器才能看懂,機器還不能一次性看懂,出來結果你需要反饋對了還是錯了?提供給機器繼續學習,這就是所謂的監督學習。

人類老師得一直陪著從小學到中學到大學,才能讓機器自動學習的能力不斷增強。其次,需要讓行業頂尖專家教授核心內動,以免機器跟「臭棋簍子」下棋,成了「臭棋簍子」。

最後,在目前的發展過程中,沒有發現一個大一統的底層方法可以把所有的法律領域打通,這就意味著刑事近470個罪名,民事二級案由就有467個,得一個一個啃,一個一個突破。人工智慧開發,不可能競一日之功,可能是個漫長的過程。這需要大量的人才、資金、技術投入。

05

人工智慧帶來了什麼

那麼,現在你可能要說,這條路如此艱難,何必還要匆匆趕路?實現人工智慧有什麼好處?

沒錯,人工智慧從來只是手段,而不是目的。目的是什麼?要看實現人工智慧是否跟行業發展的內在需求相一致。不妨看看人工智慧發展過程中的「副產品」。

01

倒逼打通數據孤島,實現數據管理

人工智慧天然帶著產品思維、用戶導向的互聯網基因。人工智慧為什麼在這個時代突然爆發?主要有三大要素推動,一是演算法,二是計算能力,三是大數據的發展。這三個要素都非常重要,但對於專門行業而言,演算法、算力屬於通用資源,最重要的是數據。

人工智慧的出現與大數據相伴而生,有了大數據才能進行深度學習。大數據的特點是要全、要真,使用統計數據是肯定不行的。這就意味著這件事要做成,要把數據收集起來。要讓數據積累起來,還必須讓人用起來,通過生產數據、收集數據、開發數據、利用數據,形成循環。

要讓人們深度應用,那就必須用戶思維、產品導向。只有大數據才能餵養「人工智慧」慢慢成長。這很可能帶來法律信息化系統的艱難轉型。如果我們還是秉持管理系統的設計,肯定做不出人工智慧系統。

那麼,如果要實現大數據,一是必須打通數據孤島。比如民商事案件的智能系統,如果從法院端入手,數據從哪裡來?不都在法院。比如訴狀,如果訴狀寫得亂七八糟,提交的證據五花八門,這個數據就可能整理成本太大,以至於沒有辦法抽取出有用的信息。訴狀很大一部分是律師這一端生產的。

如果這個系統由律師端開發,那麼可能需要有判決書的數據,不然不能為案件提供可靠的參考,這個數據就在法院端。又比如刑事人工智慧系統,那麼必然是公安、檢察院、法院之間打通數據。不然,這個系統就成了無米之炊。

二是促進內部數據管理。不論是政法機關、律所還是其他行業部門一般都分批開發各種系統,比如OA系統、流程系統、人力資源管理系統,但是大都各自為政。大家也知道整合一下會更好,但常常很難有動力去做這件事,我們到了移動互聯網時代,但有些系統還處在web1.0時代,連檢索都可能沒有。但開發人工智慧就可能需要建設「數據中心」把各類數據都統管起來。開發人工智慧就是個倒逼機制,必須把我們之前落下的課補回來,不然難以往前走。不少產品經理說,開發人工智慧的過程就是填坑的過程。但填這個坑對法律行業是好事。

三是促進數據收集完備。比如電子卷宗隨案生成。這在以往,改變工作流程中的習慣有很大的困難,但是不這麼做,難以實現數據的完備性與實時化。

所以,不論從哪一端切入,不論什麼形式,最後都需要做到數據管理,這個趨勢將把整個法律行業的數據逐漸整合起來。

02

倒逼專業化、職業化發展

人都想不明白的問題,就不要為難機器了。如何讓機器搞得明白,降低開發成本?一是標準化問題,比如在民商事領域也許標準化程度最高的道交案件中,假如我們統計一下「後續治療費」,說法至少有10種之多,包括「二次治療費、後續治療費、後期醫療費、取出內固定物費用……」。那怎麼辦?

兩種辦法,一種你讓機器變得越來越聰明,能夠識別人類各種天馬行空,甚至連「一別兩寬,各生歡喜」也能懂;另一種是規範化,提高標準化程度,將來這些說法統統歸為「後續治療費」。這顯然是成本更低的一種方式。這樣就形成了一個「倒逼」機制,逼著人做事越來越標準。

二是規則統一問題,從法院來說,假如碰上這樣一類案件,一個中院片區和另一個中院片區意見存在不一致,這就成了一個繞不過去的坎,如果不統一,這個不標準的數據就會給開發帶來問題。同樣也是兩個辦法,統一意見,不論是出解釋也好,研討論證也好,達成一致。或者讓機器去適應各種不同情形,這顯然成本更大。現實中可能兩種情況都會存在。但會倒逼法律適用統一的發展。

第三,專家經驗的積澱。法律行業之所以被認為是一個傳統行業,其中一個重要原因是知識管理問題。無論是在司法機關還是在律所,往往一位帶頭人離去,同時也宣告了一個業務「巔峰」的結束。所以我們想了很多辦法推動職業化、專業化,無論是樹立知識管理的理念,做好文檔管理,運用印象筆記、思維導圖等軟體,還是為此開發OA系統,建立完善的培訓體系,都是為了解決這個事。

但人工智慧將專家經驗嵌入到應用系統當中,就好像剛入行的新醫生,由全國三甲醫院頂尖專家經驗集合成的會診團來給你支招,這業務水平是不是比從0到1的逐步摸索和積累來得高呢?那麼病人是不是也能在一個非三甲醫院獲得三甲平均水準的醫療方案呢?

這才是我們推進法律人工智慧的目的——穩定行業水準。專業運動員與業餘的差別並不在於業餘選手打不出好球,而在於業餘選手不能像高手一樣穩定地發揮,不出錯。專業就體現在這裡。

GIF

所以,實現人工智慧這件事法律人可以不感興趣,但在實現人工智慧過程中,有可能完成法律行業看了很多年,想了很多年,講了很多年但一直沒有完成的事,這是我們感興趣的。也正是在這個維度上,我們可以說發展人工智慧,有意義,值得做,再苦再難,坑深路遠,也要試一試,推一推,拱一拱。

關於律新社

律新社是全國首家法律服務行業垂直媒體,由資深法律媒體人創辦,是法律服務行業影響力最大的法律新媒體之一,持續關注中國法律服務行業發展,致力於推動法律服務行業資訊及品牌建設。

律新社品牌欄目

點擊報名

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 律新社 的精彩文章:

TAG:律新社 |