健康有益：視覺處理應用讓機器認知我們的食物

最新 01-26

伴隨全球對人工智慧的關注度不斷提升，市場對機器視覺等人工智慧產品的需求得到進一步釋放，機器視覺技術正蓬勃發展。圖像識別、視頻識別、三維重建、人臉識別、運動檢測技術已經越來越成熟，並滲入百姓的日常生活中，從手機里的面部識別功能，到家用安全門面部識別、支付寶面部識別等均運用了機器視覺技術。

健康有益作為國內專註人工智慧與健康管理的科技公司，根據市場需求切入圖像識別技術，深度應用於食物識別的研究和場景使用。根據最新測試數據的結果顯示，健康有益對於常見菜品的識別已達到了千餘種，其識別準確率超過90%。

從技術原理角度看，食物識別使用的是卷積神經網路(Convolutional Neural Networks，簡稱CNN)中的殘差神經網路結構(Residual Networks，簡稱ResNet)，最大的特點就是讓深層網路訓練的難易度降低了幾個數量級。在ResNet結構中，食物識別是經過三大層級訓練出來的。

卷積層

在此階段，食物圖像被掃描，作為輸入傳遞到網路中。首先將圖像平均分割成無數個小片段，每個片段將應用一層卷積層，卷積層將小片段再次分為3層圖像組成三維立方體結構，每一個層圖像都呈現RGB三原色中的一種顏色信息。隨後，將卷積濾波器(也稱作神經元)應用到每一層圖像中，猶如濾鏡效果過濾出某些相似的特徵。可以想像，數百個不同的濾波器組成的網路就可以獲取圖片中的各種複雜特徵，形成特徵圖，最終完成特徵提取工作。

池化層

在池化層，從特徵圖中發現，一旦我們知道給定特徵在一個給定區域內，即可忽略特徵的確切位置，將數據普遍化，從而減少數據過擬合。因此，在池化過程中，特徵圖被不斷的壓縮，最終可以大大減少數據量，增加運算速度。

全連接層

全連接網路層作為神經網路的結束層。該層將之前層(卷積層、激活層或者池化層)的處理結果作為輸入，並輸出一個N維的向量，N是程序所選擇的類別的數量。例如，如果程序預測某張圖像是香蕉，它就會在代表黃色或者一定弧度外形等高級特徵的激活映射中有較高的值。本質上講，一個全連接層關注與特定類相關性最強、並且有特定權重的高層特徵，以便能在計算權重與前面一層乘積後得到不同類的正確概率。

在應用場景上，健康管理非常重要的一環就是健康飲食，因此在對食物進行營養成份查詢以及日常記錄的場景下，食物識別發揮了極大的作用。比如在日常就餐時對當前食物進行拍照，立刻就能得到反饋信息，識別所拍攝的食物種類並展示其基礎營養素信息，承載系統會基於個人體征數據推薦攝入量與食用建議;同樣的就餐場景下，在獲取營養素信息的同時，完成飲食記錄，為每個用戶實現精準健康管理創造無障礙通道。在未來的場景中，通過識別食物的質量和體積，系統可以更加精準地計算實際消耗熱量。

健康有益作為將人工智慧與健康管理相結合的科技公司，已全面開啟AI在健康管理領域的應用與落地，致力於探索創新人類個性化健康管理的新方式。未來健康有益會與更多的行業巨頭展開合作，通過技術與健康管理的深度融合，幫助人類更好地量化生命，實現自我管理。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 中國網 的精彩文章:

※哥倫比亞山泥傾瀉壓毀小巴全車13人因窒息死亡

TAG:中國網 |