萌狗給演算法帶來的啟示
許叔 @ 2016.09.19 , 02:00 pm
演算法是一股無形的力量,它決定著我們網路生活的方方面面:谷歌的結果,臉書上的內容,垃圾郵件過濾等。這些演算法隨著人工智慧的發展更加聰明。它們需要學習更多的信息。通常,這些機器學習的數據都是來自人類;AI研究者們需要加倍謹慎,保證這些數據精確反應了真實的世界——因為演算法跟人類一樣,會根據現有的信息產生偏見。最近一個AI訓練資料庫Spare5就以一種萌萌噠方式展示了演算法偏見的後果。
Spare5的數據可以訓練AI學習現實世界的不同事物,比如給數千張事物照片做註解,從而你的手機鏡頭可以自行識別一塊比薩。根據TechCrunch的介紹,他們決定給讓員工「可愛地放鬆一下」:給小狗的照片打分,根據萌值從1顆星到5顆星。
但是收到反饋的數據時,他們驚呆了。女人給出的萌值比男人高。平均來說,女人給每隻狗的打分高了0.16顆星。
「這就是一個簡單的例子:二元性別差異解釋了一張照片的不同主觀得分。儘管出乎意料,但是差異明顯,」公司CEO Matt Bencke寫到。
那麼這到底怎麼影響到AI呢?比如說一個研究者正在做一個app,你可以上傳你家汪的照片,然後app會給它打分,並且跟其他寵物主人一起形成排行。如果研究者的訓練數據只採用了男人的數據,那麼演算法可能就成為一個更加嚴苛的評分者。
如果數據足夠多,其他的偏差也會出現。如果男人更喜歡小狗,女人更喜歡大狗,而演技者們更多使用了男人的數據,演算法就會給小狗評分更高,因為它更熟悉小狗。
當然這樣並不會產生什麼嚴重後果(但是已經足以傷害狗狗的感受了),看起來只是一個有趣的註解,說明不同人群之間存在細微的偏好差異。但是這也提醒了那些選擇資料庫的人,他們的決定可能會造成更大的後果。項目背後的研究者們後來承認,黑皮膚的人經常被錯誤分類(谷歌近日道歉,他們的演算法將黑人錯誤標記為黑猩猩了)。
這裡有一個簡單的校正規則,Bencke建議數據科學家們要在三處注意數據多樣性:研究者自己,他們的數據,以及產生數據的源頭。
我們身邊的演算法並非都是完美的,而且未來很長一段時間它們都將是不完美的——但至少我們可以從這些小狗身上吸取一些經驗。
[許叔 via jalopnik]
※勿讓自己被演算法淪為井底之蛙:演算法支配世界,勿被演算法和網路支配
※臉書研發的新演算法可以讓電腦跟人一樣「看」
※計算機演算法讓我們越來越固執
※演算法,我們做朋友吧
※日本科學家創造出一種演算法,能讓任何圖像看起來都是浮動的
※根據新的演演算法 我們很快就能看到黑洞的真實面貌
※演演算法幫你推出最佳結婚年齡!
※上傳一張照片,讓演算法告訴你是否患有抑鬱症
※決策樹演算法究竟說的是什麼?
※拍照畸變 是演算法還是質量惹的禍
※人類大腦的智慧可能都來自於一個基本演演算法?
※當AI出現偏見時,如何讓機器學習演算法解釋自己的決策?
※人類大腦的智慧可能都來自於一個基本演演算法
※產品經理需要了解的演算法——熱度演算法和個性化推薦
※數字營銷的終極未來是尋找超級演算法嗎?
※計算機演算法現在可以設計傢具了 這樣居然也能坐
※谷歌開發「驗光師演算法」,將加速「終極能源」時代的到來
※演算法!演算法!個性化推薦的新聞到底有這麼大需求嗎?
※癌細胞是否會腦轉移?他們找到一種「演算法」!