AI前線一周新聞盤點：谷歌提供免費K80 GPU；AI診斷成功率超過皮膚科醫生

最新 01-24

作者｜Jack Clark

譯者｜核子可樂

編輯｜Natalie，Emily

AI 前線導讀：

以下新聞均來自 Import.AI，內容翻譯獲得獨家授權，未經許可，禁止轉載！

AI 擊敗由 42 名皮膚科醫生組成的專家小組，能夠更準確地發現特定皮膚疾病癥狀：

…R-CNN + 大規模數據集超越擁有數百年歷史的綜合醫學教育…

科學家們已經收集到包含大量指甲與趾甲圖片的大規模醫學級數據集，並利用其訓練神經網路，旨在實現高於專家小組的甲癬癥狀判斷能力。該方法採用最初由微軟研究小組打造的對象分類器 R-CNN 以及可實現 resnet-152 模型（同樣由微軟研究小組開發完成）的卷積神經網路。通過這一案例，再次證明至少在認知領域，在擁有充分的數據與計算資源之後，我們將能夠立足特定任務設計出足以匹敵甚至超越人類能力的 AI 系統。

數據清潔工作：研究人員們還提供了一套包含近 5 萬張指甲圖片的數據集供進一步研究使用。這篇論文詳細介紹了其如何構建並清潔數據內容，從而實現這套數據集——在過程當中，研究人員訓練出一套對象定位系統，從而自動裁剪圖片以確保僅保留指甲特徵（最初，該網路會錯誤地將牙齒或疣痣視為指甲）。

結果: 他們以綜合性方式測試了具備不同技術的不同人群（包括護士、臨床醫生乃至皮膚科專家教授等）在診斷能力方面與人工神經網路間的差異。在所有診斷場景下，基於人工智慧技術的神經網路都能夠達到或者超越大部分醫學診斷專家。研究人員們寫道，「只有一位皮膚科醫生的表現優於利用 A1 數據集訓練完成的整體模型，且具體比例僅為三分之一。」

未來前景: 人工智慧在醫療用例方面的一大承諾，在於顯著降低對特定癥狀進行初步分析的實際成本。此次實驗再次支持了這一觀點。除了收集數據集以及開發 AI 技術之外，科學家們還開發出一套基於網路與智能手機的平台，用於對更多醫療數據進行收集以及分類。他們寫道，「這項研究的結果表明，本項研究當中開發出的 CNN 與我們開發的智能手機平台很可能在未來的遠程醫療環境當中發揮重要作用，而皮膚科醫生在這樣的環境下則將失去用武之地。」

– 了解更多: 深度神經網路在甲癬診斷工作中達到甚至超越大部分皮膚科醫生：利用基於區域的卷積深層神經網路（PLOS One）自動構建甲癬數據集。

http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0191493

美國國防機構投資 AI 與機器人技術：

…新的國防戰略備忘錄中提及 AI 技術…

美國最新發布的國防戰略備忘錄呼籲政府應「廣泛加大對自動化、人工智慧以及機器學習技術在軍事領域內相關應用的投入，同時快速引入各類商業性突破成果。」

此項備忘錄還暗示稱，人工智慧與其它技術可能帶來令人不安的負面用途。「安全環境也將受到技術快速發展與戰爭性質變化的影響。新技術的發展動力將持續存在，並擴展至更多缺少技術背景的操縱者手中以加快其行動速度。此類新型技術包括先進計算、『大數據』分析、人工智慧、自主技術、機器人、定向能量、超音速以及生物技術——這些技術將確保我們能夠在未來的戰爭當中獲取勝利。」

– 了解更多: 2018 年美利堅合眾國國防戰略摘要（PDF 格式）。

https://www.defense.gov/Portals/1/Documents/pubs/2018-National-Defense-Strategy-Summary.pdf

來自 Fast.ai 的可移動語言建模技術：

…校準、校準，還是校準…

Fast.ai 與 Avlient 公司的研究人員們已經公布了其微調語言模型（簡稱 FitLaM）的更多細節信息。這是一套遷移學習方法，用於對特定領域內的語言模型進行優化。本篇論文與 DeepMind 近期公布的「彩虹」演算法類似，雙方研究人員在各自領域（分別為語言建模與強化學習）當中皆整合了一系列近期創新成果，從而構建起「以實用性為中心」的模型，從而取得了良好的實際效能。

結果: FitLaM 在五種不同類別的文本分類任務當中創造了新的最高分——而且在大多數數據集中，其錯誤率下降達 18% 到 24%。

工作原理: FitLaMa 模型由一套 RNN 與個或者多個任務特定線性層構成，此外還包括一項負責在網路較高層級下進行數據操縱的細調技術，旨在保存收集自通用型語言建模的信息。除此之外，作者們還開發出一系列不同技術，希望更進一步促進遷移學習能力，具體請參閱論文原文。

遷移學習: 為了實現遷移學習，研究人員們在一套大型文本語料庫上預編了一套語言模型——其實驗性示例選擇了 Wikitext，其中包含超過 2 萬 8 千篇經過預處理的維基百科文章。他們使用的其它技術還包括在重新訓練期間對神經網路層進行「梯度解凍」、利用餘弦退火進行微調以及使用逆向退火機制。測試領域: 情感分析（兩套獨立數據集）、問題分類、主題分類（兩套數據集）。

– 了解更多: 對語言模型進行微調以實現文本分類 (Arxiv)。 https://arxiv.org/abs/1801.06146

谷歌 Kaggle 添加免費 GPU 以實現在線編碼服務：

…提供免費 GPU，且幾乎不設任何使用限制…

谷歌公司表示，其實時編碼混搭服務 Colaboratory（類似於 Jupyter 記事本加 Google Doc 的組合）的用戶將迎來免費 GPU 資源。谷歌公司一位與 Michael Piatek 往來密切的人士表示，用戶現在將能夠編寫代碼片段並訪問配備有 13 GB 內存的雙 vCPU 以及一塊英偉達 K80 GPU。

– Access Colaboratory here.

https://colab.research.google.com/notebook#fileId=/v2/external/notebooks/welcome.ipynb&recent=true

先是 ResNets、而後是 DenseNets，現在又有……SparseNets？

…研究人員們以奇異的方式將網路連接起來，希望獲得最先進的研發成果…

神經網路可以被看作是一套能夠針對不同數據集進行運算的機器，亦可用於發現各數據集間的關聯轉換方式。研究人員已經開發出多種能夠將不同視覺現象內細化特徵關聯進行轉換的方法（Residual Networks 與 DenseNets），同時確保將儘可能多的信息從網路中的一層傳播至另一層。

如今，西蒙弗雷澤大學的研究人員們開始嘗試從 ResNets 與 DenseNets 當中提取最佳特徵，並將其綜合至 SparseNets 當中。這是一種更為出色的網路構建方法，能夠「聚合前一層的特徵，且每一層僅提取與之存在指數偏移的層中的特徵……在利用 CIFAR-10 與 CIFAR-100 數據集進行實驗測試後，結果顯示 SparseNets 能夠實現與當前最先進的模型相媲美的效能，且參數數量明顯減少。」

低成本網路: 那麼，為什麼要以這種方式構建網路？具體來講，如果能夠通過這種方式在不增加大量參數的前提下擴大網路規模，那麼最終這樣的效率優勢將可用於構建規模更為龐大的網路體系。SparseNet 在實驗當中表明，這樣的網路構建方法能夠保持與 ResNet 以及 DenseNets 等同的精確度，但參數計算需求卻比二者低得多。

– 了解更多: 稀疏關聯型卷積網路。https://arxiv.org/abs/1801.05895

利用神經網路提升數據質量：

…中國研究人員嘗試利用 AI 擴展數據生成能力…

蘇州大學、阿里巴巴集團、深圳高威機器人有限公司以及黑龍江大學的研究人員們已經開發出一套系統，通過生成低質量數據並通過對抗訓練提升其質量，從而顯著改善中國名稱實體識別（簡稱 NER）技術的成效。NER 系統旨在利用智能系統發現語句中的關鍵部分，並將其鏈接至更為宏觀的基礎知識體系當中。NER 方法的改進將能夠被快速轉化為面向消費者或面向監控場景的 AI 系統，包括實現個人助理或被用於分析大規模語言資料庫。

技術解析: 研究人員們利用外包注釋者標記的特定數據集——包括對話及電子商務場景中的數據集，並配合各類基於神經網路的系統以分析各應用內文本樣本在不同 NER 標籤之間的共性與差異。由此生成的系統將能夠以更高的精度實現內容分類，且仍可使用同樣的訓練數據集，並達到或超越由研究人員創建的其它基準指標。

– 了解更多: 中國利用眾包注釋信息實現 NER 的對抗性學習 (Arxiv)。https://arxiv.org/abs/1801.05147

中國研究人員收集行人追蹤數據集並評估其中九款追蹤工具：

…看到你了！就是你，手心出汗那位！…

中國研究人員選擇了 60 段利用紅外熱成像儀拍攝的視頻，並將其整理成一套數據集，用以評估熱紅外行人追蹤（簡稱 TIR）技術的實際成效。

數據集：這 60 條熱量序列包含來自各類設備（例如監控攝像機、手持攝像機、車載攝像頭以及無人機）的素材，亦可混合不同比例的場景、攝像頭位置及視頻視角。

追蹤工具評估: 研究人員評估了九款採用不同實現方法的行人追蹤工具，包括支持向量機、相關性與回歸過濾器、深度學習方法（HDT 與 MCFTS）等。SRDC——即空間正則化鑒別相關過濾器——優勢明顯，其在一系列不同測試當中獲得了最為可靠的出色表現。

令人驚訝的強大深度學習表現: 神經網路方法 HDT 與 MCFTS）同樣擁有出色的排名。研究人員們寫道，「我們建議，如果擁有充足的熱成像圖片用於訓練，那麼基於深層特徵的追蹤工具有可能獲得更理想的成效。」

成本高昂: 深度學習方法的實現擁有高昂的成本，其中深度學習系統（HDT 與 MCFTS）在部署於採用英偉達 1080 GPU 與 32 GB 內存的英特爾 PC 上時，幀率分別為每秒 10.60 幀與 4.73 幀。相比之下，SRDCF 對資源的依賴性相對較低，FPS 為 12.29。

– 了解更多: PTB-TIR: 熱紅外行追蹤基準 (Arxiv)。https://arxiv.org/abs/1801.05944

OpenAI 點滴:

將 Kubernetes 擴展至 2500 節點：

探討我們在擴大自身大規模 AI 基礎設施時遇到的一些問題，以及我們所設計的解決辦法。

– 了解更多: 將 Kubernetes 擴展至 2500 節點 (OpenAI 博客)。https://blog.openai.com/scaling-kubernetes-to-2500-nodes/

作者 Jack Clark 有話對 AI 前線的讀者說：我們對中國的無人機研究非常感興趣，如果您想要在我們的周報里看到更多有趣的內容，請發送郵件至：jack@jack-clark.net。

https://jack-clark.net/

GIF

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自皮膚的精彩文章:

※韓雪皮膚白皙完全，但這件外套就讓他穿出了大媽的味道！

TAG:皮膚 |