當前位置:
首頁 > 科技 > iPhoneX的FaceID臉部辨識技術解析:從感光元件到3D立體影像感測原理

iPhoneX的FaceID臉部辨識技術解析:從感光元件到3D立體影像感測原理

iPhoneX的FaceID臉部辨識技術解析:從感光元件到3D立體影像感測原理

【Technews科技新報】蘋果公司的第一支智能手機 iPhone 上市滿十年的今天,特別推出有史以來功能最強大的旗艦機 iPhone X,其中最大的特色是取消了 Home 鍵也無需手動解鎖,而是採用 Face ID 臉部辨識解鎖技術,將 3D 影像技術發揮到極致,這裡我們經由 Face ID 臉部辨識技術來解析 3D 立體影像感測原理。

影像感測器(Image sensor)

數碼相機所使用的影像感測器主要是取得平面彩色影像,這個已經是我們使用了超過 20 年的舊東西,大部分的人都知道影像感測器有 CCD 與 CMOS 兩種,卻很少有人知道這兩種零組件到底是什麼?讓我們先從這兩種最基本的元件談起。

影像(Image)其實指的就是我們看到的一個「畫面」(Frame),是由許許多多的格子組成,這些格子稱為「像素」(Pixel)。影像感測器是由許許多多的格子(像素)組成的陣列,每一個像素含有一個電荷耦合元件(CCD)與光感測器(PD),由於光感測器(PD)只能偵測亮度,無法分辨顏色,為了取出顏色,必須在光感測器上方加裝「彩色濾光片」(Color filter),如圖 1(a)所示,它的 RGB 排列方式有許多種,目前最常使用的是圖中這種稱為「貝爾圖」(Bayer pattern),有沒有發現貝爾圖的設計里,綠色的像素是紅色與藍色的兩倍?因為肉眼對綠色比較敏感,因此多收集綠色的資訊是合理的。

iPhoneX的FaceID臉部辨識技術解析:從感光元件到3D立體影像感測原理

圖 1:CCD 感測器的構造與原理示意圖。

CCD 影像感測器

電荷耦合元件(CCD:Charge Coupled Device)是一種推電荷(電子)前進的元件,利用 3 個金屬電極不同電壓依序推電荷前進,如圖 2(b)所示,左下角像素 A 的光感測器內的電子經由旁邊的 CCD 元件由 4 向上推到 3,此時像素 B 的電子由 3 推到 2,像素 C 的電子由 2 推到 1,像素 A 的電子由 1 推到水平線,依此類推,第一行的電子推完,再推第二行,再推第三行,依此類推,必須把影像感測器內每一個像素的電子依序推到水平線,經由「模擬前端」(AFE:Analog Front End)將模擬訊號轉換成數字訊號,也就是影像的「模擬數字轉換器」(ADC:Analog to Digital Converter),再輸入處理器(Processor)進行數字訊號處理。

CCD 影像感測器的優點是影像畫質較佳,雜訊較小;缺點有成本高、耗電量高、類比前端是使用 CMOS 製程與 CCD 製程不同因此無法整合在同一個晶元。

CMOS 影像感測器

互補型金屬氧化物半導體(CMOS)是一種開關元件,利用閘極施加正電壓在下方形成電子通道,可以便電子由源極流入,由汲極流出,如圖 2(b)所示,每一個像素的左上角都有一個 CMOS 開關,一個一個像素可以依序打開(ON)導通,使光感測器內的電子依序流入水平線,第一行的電子流完,再流第二行,再流第三行,依此類推,必須把影像感測器內每一個像素的電子依序流到水平線,經由「模擬前端」將模擬訊號轉換成數字訊號,也就是影像的「模擬數字轉換器」,再輸入處理器進行數位訊號處理。

iPhoneX的FaceID臉部辨識技術解析:從感光元件到3D立體影像感測原理

圖 2:CMOS 感測器的構造與原理示意圖。

CCD 影像感測器的優點是成本低(大約只有 CCD 的三分之一)、耗電量低(大約只有 CCD 的十分之一),更重要的是類比前端是使用 CMOS 製程與 CMOS 影像感測器的製程相同,可以整合在同一個晶元上縮小體積,這對於智能手機這種對元件尺寸很在意的應用非常適合;缺點有影像畫質較差,雜訊較大,特別是 CMOS 開關本身產生的熱雜訊,這種雜訊是元件在高於絕對零度(0K)時就會產生的,而且溫度愈高雜訊愈嚴重,早期的 CMOS 影像感測器畫面上會看到一個個亮點跳來跳去就是由於熱雜訊產生,近年來由於半導體製程的進步,CMOS 影像感測器的雜訊問題有很大的改善。

3D 立體影像感測技術

數碼相機只能取得平面彩色影像,完全沒有深度的資訊,這代表當我們看到一張照片,只知道這個人的臉部有多寬多高,卻不知道他臉部的立體結構,例如:鼻子有多挺(有多深),為了取得影像的深度資訊,近年來許多廠商投入研發,目前比較成熟的技術有下列兩種:

  1. 飛時測距

    (ToF:Time of Flight):利用發光二極體(Light Emitting Diode,LED)或激光二極體(Laser Diode,LD)發射出紅外光,照射到物體表面反射回來,由於光速(v)已知,可以利用一個紅外光影像感測器量測物體不同深度的位置反射回來的時間(t),利用簡單的數學公式就可以計算出物體不同位置的距離(深度),如

    圖 3(a)

    所示。
  2. 結構光

    (Structured light):利用激光二極體或數位光源處理器(Digital Light Processor,DLP)打出不同的光線圖形,經由物體不同深度的位置反射回來會造成光線圖形扭曲,例如:打出直線條紋的光線到手指上,由於手指是立體圓弧形造成反射回來變成圓弧形條紋,進入紅外光影像感測器後就可以利用圓弧形條紋反推手指的立體結構,如

    圖 3(b)

    所示。

【延伸閱讀】對發光二極體(LED)的原理,以及它與激光二極體(LD)的差異有興趣的人可以參考〈知識力專家社交:發光二極體(LED)〉。

iPhoneX的FaceID臉部辨識技術解析:從感光元件到3D立體影像感測原理

圖 3:3D 立體影像感測技術原理示意圖。(Source:LAGOA)

TrueDepth 相機

蘋果將 iPhone X 所使用的 3D 立體影像感測技術稱為「TrueDepth 相機」,結合了前面介紹的兩種技術,如圖 4所示,TrueDepth 相機為 700 萬像素的 CMOS 影像感測器,配合紅外光相機、泛光照明器、接近感測器、環境光感測器、點陣投射器等元件,以下簡單介紹每個元件的功能:

  1. 泛光照明器

    (Flood illuminator):使用低功率的垂直共振腔面射型激光(Vertical Cavity Surface Emitting Laser,VCSEL),發射出「非結構」(Non-structured)的紅外光投射在物體表面。

  2. 接近感測器

    (Proximity sensor):使用低功率的垂直共振腔面射型激光發射紅外光激光,當有物體靠近時會反射激光光,因此手機可以知道有物體接近,這個元件很早之前智能手機就有了,一般都是安裝在擴音器(Speaker)旁邊,當使用者撥電話並且將手機靠近耳朵時,接近感測器偵測到耳朵接近就知道使用者正要講電話,會自動關閉屏幕節省電力消耗。
  3. 環境光感測器

    (Ambient light sensor):使用光二極體(Photo diode)可以偵測環境光亮度,在明亮的太陽下使用者眼睛瞳孔縮小,因此自動將屏幕調亮讓使用者容易觀看;在陰暗的室內使用者眼睛瞳孔放大,因此自動將屏幕調暗避免使用者感覺太刺眼。
  4. 點陣投射器

    (Dot projector):使用高功率的垂直共振腔面射型激光發射紅外光激光,經由晶圓級光學(Wafer Level Optics,WLO)、繞射光學元件(Diffractive Optical Elements,DOE)等結構,產生大約 3 萬個「結構」(Structured)光點投射到使用者的臉部,利用這些光點所形成的陣列反射回紅外光相機(Infrared camera),計算出臉部不同位置的距離(深度)。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 TechNews 的精彩文章:

懟完三星Note 8懟iPhone X,華為Mate 10怕是要上天吧?
Facebook Messenger 月活躍用戶數破 13 億大關,成長幅度放緩
Equifax 徵信大批個資外泄後,再爆高層內線交易
哈佛大學研究團隊研發「拉伸自如」的穿戴設備
罕見月掩星事件,月亮 24 小時內逐步掩蔽 6 顆天體

TAG:TechNews |