教程 | 看看大神的思路!機器學習界網紅 7 分鐘教你如何搭建 Chatbot?(中文版)
Siraj Raval 作為深度學習領域的自媒體人在歐美可以說是無人不知、無人不曉。
憑藉在 Youtube 上的指導視頻,Siraj Raval 在全世界吸粉無數,堪稱是機器學習界的網紅。說他是全球範圍內影響力最大的 ML 自媒體人,怕也無異議。
因此,雷鋒網 AI 研習社聯繫到了Siraj 本人,並獲得授權將他最精華的 Youtube 視頻進行字幕漢化,免費推送給大家。我們將不定期更新,敬請關注!
今天 Siraj 就帶領大家做一個自己的 Chatbot!
(建議在Wi-Fi環境下觀看視頻,土豪隨意~)
為了方便流量不足的小夥伴們在路上看,我們特意整理出了文字版和動圖~
微信、Skype、Messager以及其他主流通信軟體如今都已經搭建了聊天機器人,許多科技巨頭紛紛推出各自的聊天助手,各大電商也越來越多地使用聊天機器人參與客服工作。
不過Chatbot可以為你做些什麼實實在在的事情呢?你可以和CNN機器人聊天來獲取實時新聞,也可以讓機器人訂花送給女票... ...等等,沒有女票?沒關係,說出你的要求,讓婚戀機器人給你介紹。
看來學會搭建一個Chatbot還是很有必要的。Siraj會帶你用TensorFlow建一個聊天機器人,使用遞歸神經網路演算法(RNN),步驟是下載數據集,創建模型,訓練模型,聊天測試。
Step1 下載數據集
這裡會用到來自康奈爾大學的電影對話數據集。包含了超過600部的好萊塢電影的對話。(恩,可以和女票秀一下深厚的台詞功力了。)首先要下載數據集到數據文檔中,然後將其切分為兩個不同的訓練數據集(分別為問和答)進行預處理。
Step2 創建模型
這裡用到的模型是 seq2seq,它包含兩個 LSTM 遞歸神經網路,第一個是 encoder 負責處理 input,第二個是 decoder 負責生成 output。使用encoder和decoder作為輸入參數,把辭彙轉為向量形式。
Step3 訓練模型
這是很小的數據集,完成整個訓練可能也就幾個小時。
Step4 聊天測試
隨著訓練進行,回答會越來越有邏輯。你投入的數據越多,聊得會越開心。
完整代碼和數據集請參考Github(鏈接)。
------------------------------------------------
Siraj Raval 何許人也?
Siraj Raval是YouTube極客網紅,曾任職於Twilio和Meetup,客戶包括Elon Mask和Google,教大家如何使用機器學習開發聊天機器人、無人駕駛車、AI藝術家等視頻點擊量累計數百萬。
Siraj Raval 為什麼這麼火?
首先,當然是這位哥倫比亞大學高材生活兒好技術好,用自己特有的方式三言兩語就能拋出一個原本晦澀的 ML、DL 概念,讓聽眾細細咀嚼。再者,這傢伙幽默逗比、口才便給。興之所至常手舞足蹈,瞳仁奇光掩映,口吐智慧蓮華。深度學習講師不少,但這麼風趣可親的卻不多。
雷鋒網按:視頻已獲得Siraj授權,字幕來自雷鋒網字幕組,為雷鋒網原創。
TAG:雷鋒網 |
※天池中間件大賽Golang版Service Mesh思路分享
※Opus Magnum遊戲基本思路分享
※像素風大牌logo?樂高logo牌提供DIY裝飾新思路!
※RoboMaster AI 挑戰賽科研思路淺談
※跨境電商賣家如何用正確的思路做Facebook?
※《Cell》子刊:優化Cas9特異性新思路!
※Nature子刊:開發靶向FZD/SMO抗癌藥物新思路!
※【Listing】淺析Listing的整體排布思路
※Photoshop詳解商業人像修精-頭髮絲的後期處理思路教程
※和堅果TNT思路一致?Mozilla謀劃語音控制瀏覽器
※Google,OpenAI提出層次強化學習新思路
※spring 使用Resource 後,修改值(實現思路及spring注意事項)
※Encryption 101系列:解密程序的設計思路
※火箭少女單曲卡路里被指抄襲Saint motel的拍攝思路
※Photoshop詳解海報合成過程中思路和方法
※orb_slam整體編程思路及代碼解析
※微軟研究院新思路展示:雙屏Lumia和Xbox手機手柄
※獵豹遊戲Stanley:千萬級日活產品的變現思路
※淺談《Battle Boom》,為卡牌和RTS結合提供新思路
※【Top up新課程開放】留英工作新思路