基於神經網路的命名實體識別 NeuroNER
選自Neuroner
機器之心編譯
參與:李亞洲
本文主要介紹了一種基於神經網路的命名實體識別系統 NeuroNER,並附上了安裝、下載的項目地址,希望對自然語言處理感興趣的同學有所幫助。
NeuroNER 下載項目地址:https://github.com/Franck-Dernoncourt/NeuroNER
什麼是命名實體識別(NER)?
NER 旨在識別文本中的有趣實體,例如位置、組織和時序表達。識別實體可被用於各種下游應用,比如病歷去識別化(de-identification)和信息提取系統,也可作為其他自然語言處理任務機器學習系統的特徵。
NeuroNER 能做什麼?
NeuroNER 是一個能完成 NER 任務的項目:
NeuroNER 相比於已由的 NER 系統,能提供以下優勢:
利用神經網路的頂尖預測能力(也就是深度學習)
讓用戶能夠創造新的語料庫或修改已有語料庫
它是跨平台的、開源的、免費直接使用的
如何使用 NeuroNER?
下圖對 NeuroNER 的功能做出了簡要介紹,具體描述如下:
訓練神經網路完成 NER 任務。在訓練的過程中,NeuroNER 允許監控網路。
評估 NeuroNER 所做預測的質量。表現標準可通過預測標籤與金色標籤的對比來計算、標繪。如果測試集與訓練和驗證集同時提供,評估也可在訓練的同時完成,或者在訓練後分開完成,或者使用預訓練模型。
部署 NeuroNER 作為產品使用:NeuroNER 標記了部署集,也就是沒有金色標籤的新文本。
NeuroNER 引擎如何工作?
NeuroNER 引擎基於人工神經網路,特別是依賴一種循環神經網路的變體 LSTM。NER 引擎的人工神經網路包含三層:
字元增強的 token 嵌入(Character-enhanced token-embedding)層
標籤預測層
標籤序列優化層
下圖展現了 NeuroNER 引擎中用到的人工神經網路的架構:
如何安裝 NeuroNER
GitHub 上的 repository 解釋了安裝指南,以下視頻展示了使用安裝腳本在 Ubuntu 上進行安裝有多麼簡單:腳本會安裝你所需的所有東西,然後在 CoNLL-2003 數據集上進行訓練。在數個訓練 epoch 之後,模型獲得了頂尖的成果。


※OpenAI聯合DeepMind發布全新研究:根據人類反饋進行強化學習
※Uber 洗牌:創始人可能「被休假」,無人駕駛項目換帥
※捷豹路虎向 Lyft 投資2500萬美元;日本要在2025年打造無人駕駛船隊 | AI Daily
※MIT 新突破:實現光學深度神經網路系統
TAG:機器之心 |
※Spotlight論文:解耦神經網路DCNet,性能優於標準CNN
※用於可視化人工神經網路的 Python庫——ANN Visualizer
※用 Hinton 的膠囊神經網路來識別空間關係 Part1:CNNs及其缺點
※用 Hinton 的膠囊神經網路來識別空間關係 Part1:CNNs及其缺點
※SDN與NFV催生智能網卡需求,Ethernity基於FPGA加速虛擬化網路
※生物神經網路與機器學習的碰撞,Nature論文DNA試管網路識別
※基於改進MapReduce模型的BP神經網路並行化研究
※快思聰:新的Crestron DM XiODirector網路設備簡化DMNVX網路視音頻系統的部署
※當Node.js遇上OpenCV深度神經網路
※分散式ExpressNet SDN在盛大雲平台的網路部署實踐
※比WANNA ONE還狂!席捲韓國網路的爆紅限定女團「Celeb Five」!
※AKASHA:基於Ethereum+IPFS的去中心化社交網路
※Necurs殭屍網路的新變化
※單隱層BP神經網路的Python實現
※淺入淺出TensorFlow 6—實現AlexNet和VGG等經典網路
※兩種網路通信架構:socket與RPC
※ARM放大招發布Trillium項目:包含神經網路軟體庫和兩種AI處理器
※BP神經網路模型:Matlab
※ICLR oral:清華提出離散化架構WAGE,神經網路訓練推理合二為一
※Nexus與SingularityNet達成合作:基於區塊鏈的分散式人工智慧網路架構