萌狗給演算法帶來的啟示

知識 09-19

許叔 @ 2016.09.19 , 02:00 pm

萌狗給演算法帶來的啟示

演算法是一股無形的力量，它決定著我們網路生活的方方面面：谷歌的結果，臉書上的內容，垃圾郵件過濾等。這些演算法隨著人工智慧的發展更加聰明。它們需要學習更多的信息。通常，這些機器學習的數據都是來自人類；AI研究者們需要加倍謹慎，保證這些數據精確反應了真實的世界——因為演算法跟人類一樣，會根據現有的信息產生偏見。最近一個AI訓練資料庫Spare5就以一種萌萌噠方式展示了演算法偏見的後果。

Spare5的數據可以訓練AI學習現實世界的不同事物，比如給數千張事物照片做註解，從而你的手機鏡頭可以自行識別一塊比薩。根據TechCrunch的介紹，他們決定給讓員工「可愛地放鬆一下」：給小狗的照片打分，根據萌值從1顆星到5顆星。

但是收到反饋的數據時，他們驚呆了。女人給出的萌值比男人高。平均來說，女人給每隻狗的打分高了0.16顆星。

萌狗給演算法帶來的啟示

「這就是一個簡單的例子：二元性別差異解釋了一張照片的不同主觀得分。儘管出乎意料，但是差異明顯，」公司CEO Matt Bencke寫到。

那麼這到底怎麼影響到AI呢？比如說一個研究者正在做一個app，你可以上傳你家汪的照片，然後app會給它打分，並且跟其他寵物主人一起形成排行。如果研究者的訓練數據只採用了男人的數據，那麼演算法可能就成為一個更加嚴苛的評分者。

如果數據足夠多，其他的偏差也會出現。如果男人更喜歡小狗，女人更喜歡大狗，而演技者們更多使用了男人的數據，演算法就會給小狗評分更高，因為它更熟悉小狗。

當然這樣並不會產生什麼嚴重後果(但是已經足以傷害狗狗的感受了)，看起來只是一個有趣的註解，說明不同人群之間存在細微的偏好差異。但是這也提醒了那些選擇資料庫的人，他們的決定可能會造成更大的後果。項目背後的研究者們後來承認，黑皮膚的人經常被錯誤分類(谷歌近日道歉，他們的演算法將黑人錯誤標記為黑猩猩了)。

這裡有一個簡單的校正規則，Bencke建議數據科學家們要在三處注意數據多樣性：研究者自己，他們的數據，以及產生數據的源頭。

我們身邊的演算法並非都是完美的，而且未來很長一段時間它們都將是不完美的——但至少我們可以從這些小狗身上吸取一些經驗。

[許叔 via jalopnik]

TAG: |

您可能感興趣

※勿讓自己被演算法淪為井底之蛙：演算法支配世界，勿被演算法和網路支配
※臉書研發的新演算法可以讓電腦跟人一樣「看」
※計算機演算法讓我們越來越固執
※演算法，我們做朋友吧
※日本科學家創造出一種演算法，能讓任何圖像看起來都是浮動的
※根據新的演演算法我們很快就能看到黑洞的真實面貌
※演演算法幫你推出最佳結婚年齡！
※上傳一張照片，讓演算法告訴你是否患有抑鬱症
※決策樹演算法究竟說的是什麼？
※拍照畸變是演算法還是質量惹的禍
※人類大腦的智慧可能都來自於一個基本演演算法？
※當AI出現偏見時，如何讓機器學習演算法解釋自己的決策？
※人類大腦的智慧可能都來自於一個基本演演算法
※產品經理需要了解的演算法——熱度演算法和個性化推薦
※數字營銷的終極未來是尋找超級演算法嗎？
※計算機演算法現在可以設計傢具了這樣居然也能坐
※谷歌開發「驗光師演算法」，將加速「終極能源」時代的到來
※演算法！演算法！個性化推薦的新聞到底有這麼大需求嗎？
※癌細胞是否會腦轉移？他們找到一種「演算法」！