剛才在Quora上偶然看到最近火遍互聯(lián)網(wǎng)的how-old.net被解密了:項目開發(fā)者來自微軟的Bing團隊。負責(zé)后端代碼的Eason Wang解釋了他們是怎么做到的,關(guān)鍵技術(shù)涉及人臉識別、年齡識別和性別識別的算法。他在回答最后提到“深度學(xué)習(xí)”的研究未來可以讓年齡識別更為準確。
關(guān)于深度學(xué)習(xí),可以參考去年我的另一篇文章:http://app.fortunechina.com/blog/zhangmaiwen/archives/630 。Google神秘兮兮的X實驗室當(dāng)時用16,000個計算機處理器建造了一個包含10億個節(jié)點的神經(jīng)網(wǎng)絡(luò),模擬人腦去觀看1000萬隨機選擇的YouTube視頻截圖,結(jié)果利用“深度學(xué)習(xí)”算法,在沒有人工干預(yù)的前提下,這部機器開始在2萬個物體的照片中識別出包含“貓”的圖片。是的,有點荒誕,半歲大的孩子都認識貓貓;但是,就是這種機器智能讓很多IT巨擘開始大面積創(chuàng)新:比如微軟借同類技術(shù)將語音識別的錯誤率降低了30%;而蘋果在Siri中也運用了深度學(xué)習(xí)。
最后,也是更重要的是Eason總結(jié)的為什么一個識別年齡的小應(yīng)用會火遍社交網(wǎng)絡(luò),他提出了10個原因:
1. 用起來實在太簡單了。
2. 利用了人們的自戀情結(jié)
3. 算法準確時激發(fā)了人們對科技的敬畏心,不準時激發(fā)人們的自嘲心
4. 給了你一張值得分享的圖片
5. 背后有一個可以講述的故事
(比如,聰明點的汽車廠商可以給自己的汽車廣告加個顏齡測試,取名xx model的“年齡”和“性別”)
6. 機器算法反過來為人提供了具有高度“用戶黏性”的標(biāo)簽
7. 采用了一個很贊的、簡短的、自我解釋型的域名How-Old.net
8. 整個過程只做了一件事
9. 沒有語言障礙(自戀是沒有國界的)
10. 工程師們從自己的忠粉開始試驗,然后開始病毒式傳播