摘要:不同平臺的不同表情和雅虎視覺與機器學習團隊測試了三種不同的方法算法,一種快速線性分類器算法,一種循環神經網絡架構算法,一種平衡性能與復雜性的卷積網絡。雅虎不是將機器學習應用于的公司。
周末想在Netflix看場電影?可能,你選擇觀看的電影正受到來自Netflix復雜的AI算法的影響。同理,由深度學習驅動的預測技術,將越來越便捷地決定你喜歡吃什么、穿什么。
而作為消費型科技公司,Netflix、Yelp、Yahoo、StitchFix這4家公司正在利用AI技術改變用戶體驗。
Netflix:動態個性化布局與視頻縮略圖
從觀看傳統上來講,看電視是一個單向的通信方式——觀眾觀看到的內容是制作者單向傳遞的,但觀眾不向內容制作者提供反饋。借助數字流媒體技術,觀眾的觀看記錄、鼠標(手指)點擊,以及檢索詞,都可以讓Netflix了解觀眾的偏好設置,并提供更多相關的內容。
2009年,Netflix在公開賽中為外部的編程團隊授予了100萬美元的Netflix獎,以改進公司的內部評級預測系統。該獲勝隊伍打敗了原有的算法,效果提高超過10%。
Tony Jebara
從那時起,Netflix引入了更多先進的機器學習算法,讓Netflix在排名、布局、目錄、會員等各個方面,實現全新的預測,并提高個性化水平。今年年初,Netflix公司董事、哥倫比亞計算機科學系教授Tony Jebara在舊金山的RE?WORK深度學習峰會(RE?WORK Deep Learning Summit in San Francisco)上曾解釋說,Netflix不僅可以給用戶推薦更好的電影,而且為每個用戶預測出更好的縮略圖圖像。
圖片來源:Netflix
一般來說,優化網站上的圖像需要在一段時間內測試A / B兩種替代方案。這種方法的問題是,用戶必須痛苦地等待系統收集數據,之后才能完成較佳決策。在此期間,網站的部分受眾群體會經歷測試過程的非最優變量。這種體驗的喪失被稱為“regret”。
圖片作者:Tony Jebara
為了較大限度地減少regret,Netflix采用動態自適應測試法,比如多臂老虎機(multi-arm bandit)模型。這種模型能夠在測試期間,動態地將流量轉移為展示較好的廣告素材,并在數學上減少regret。
什么算是“更好”呢?每個人不盡相同,所以Netflix也將用戶的消費情況納入,以執行個性化的探索/開發優化。如果你經常看喜劇,Netflix將使用羅賓?威廉姆斯的電影《心靈捕手》的封面。如果用戶喜歡浪漫的言情片,Netflix則會把電影中馬特?達蒙和明妮?德瑞弗接吻的照片推送給用戶。
Yelp使所有地點展示最美麗的照片
一張圖片勝過千言萬語。為了幫助用戶做出正確的餐廳選擇,Yelp的Alex Miller和他的團隊采用深度學習算法,用來展示最美的用戶照片。
雖然指標(比如喜歡次數和點擊次數)可用于評估照片,但它們也可能因偶然事件出錯。更好的解決方案是,基于固有的內容和特征(例如景深,對比度和對準)來判斷照片,但是每天有2500萬MAU(每月活躍用戶)給Yelp上傳成千上萬張照片,沒有人能干得了這些工作。
2017年1月27日,在舊金山舉行的Startup ML會議上,Miller介紹了他的工程團隊如何使用CNN(卷積神經網絡)建立一個圖像評分模型。對于照片是不是好的標準可以是,這張照片是不是用單反拍的,這只需要檢測EXIF元數據就行了。
Miller的團隊利用它創建出可擴展的訓練數據集,使用單反圖像作為正例,而非單反圖像作為負例。深度學習算法從訓練數據集中學習了好的照片的質量,并且可以將這些學習應用于所有照片,無論是否是使用單反相機拍攝的。
除了照片質量得分,團隊還添加了過濾器和多元化邏輯,這樣,當你查看以某一菜或特色聞名的餐館時,前10張照片不會都是同一主題。
?
事實勝于雄辯,我們來看看圖片查看結果:
上圖是舊版本,下圖是版本
雅虎確保用戶在任何情況
可以選擇較好的表情符號
對于不愛打字的人來說,emoji是最簡單的方法。但是,emoji目前有超過1800種表情符號可供選擇,那么,用戶怎么能確定選擇最完美的那個呢?
雅虎的機器學習工程師Stacey Svetlichnaya就在解決這些問題。當用戶撰寫或回復消息時,自動填充建議中應顯示哪些表情呢?理想情況下,用戶希望可以給出前五個表情符號來選擇。
使用表情符號是高度動態的。一些用于替換圖像,還有的用于表達情感……
另一個挑戰是emoji在不同平臺的視覺風格迥然不同,容易造成誤解。
?不同平臺的不同emoji表情
Svetlichnaya和雅虎視覺與機器學習團隊(Yahoo Vision & Machine Learning Team)測試了三種不同的方法:
FastText算法,一種快速線性分類器;
LSTM算法,一種循環神經網絡架構;
WordCNN算法,一種平衡性能與復雜性的卷積網絡。
當然,三者之中,FastText不出意外地成為了速度的勝利者,但人們似乎更喜歡LSTM的結果。
雅虎不是將機器學習應用于emoji的公司。2015年,InstagramEngineering刊發了一套由工程師Thomas Dimson撰寫的系列——Emojineering:機器學習表情符號趨勢。
系列文章地址:
https://engineering.instagram.com/emojineering-part-1-machine-learning-for-emoji-trendsmachine-learning-for-emoji-trends-7f5f9cb979ad#.wppfkra4e
StitchFix更快地找到最適合你的時尚
時尚是件很難的事,但StitchFix使造型這件事變得很輕松。這家個性化造型創業公司使用戶可以個性化風格,并且每月將精選的服裝和配件送上家門。
定義風格可能是模糊的。畢竟,用戶怎么能知道一件襯衫是否復古,或者一件衣服是否“性感”但又不顯得“太放蕩”。
?
Christopher Moody
Moody是StitchFix的數據科學家,擁有統計學、天體物理學和計算機學的多學科學術背景。事實證明,“書呆子”的學術技能在時尚界是大有可為的。
許多深度學習模型是“黑匣子”,用戶很難理解為什么算法得出特定的結論。Moody的研究集中于提高模型可解釋性,使人類專家能夠對算法的相對性能提供反饋。
一種方法是使用t-SNE(t分布的隨機相鄰嵌入),一種有助于降低可視化相似對象的維數的方法。許多深度學習模型使用人類不可能概念化的高維數據,維數減少方法將復雜的數據變成更易于理解的二維或三維散點圖。
Moody也是k-SVD方法的狂熱者。 k-SVD是k均值聚類方法的泛化。在高級非技術術語中,聚類分析指將具有類似屬性的對象分組在一起。一旦已經識別出不同的集群,人類專家可以檢查組合,以查看它們是否表現出任何統一的特征,并添加適當的標簽,例如“背心”。
圖片作者:Christopher Moody
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/4471.html
摘要:結果,我們當時非常抱以厚望的就是卷積神經網絡模型,或者說是。單反相機可以讓攝影師調節透鏡類型和光圈大小,更好地控制把相片里的哪個部分作為焦點。更進一步,單反相機的傳感器更大,對光線更敏感,即使在非常昏暗的環境下也可以拍出非常漂亮的相片。 Yelp的數據庫中已經存儲了幾千萬張相片,用戶們現在每天都會上傳大概十萬張,而且速度還在不斷加快。事實上,我們發現相片的上傳增長率大于相片的查看率。這些相片...
摘要:構建一個照片分類器對于理解照片中的模棱兩可的目標,其實有許多不同的方式。如果決定進一步集成依賴于其它信號的新的分類器,這將讓問題變得更加簡單。該架構如下圖所示對于每一個新的分類器,掃描所有的照片,并且將分類結果存儲在一個數據庫中。 Yelp是美國較大點評網站,擁有世界各地的Yelper上傳的成千上萬的照片。各種各樣的照片給進入當地的商業提供了一個豐富的窗口。通過開發一個照片理解系統使Yelp...
摘要:云計算革的命性不僅僅是針對企業,同時也影響著我們的日常生活。因此云計算正在改善著我們的生活,或至少在某些方面改變著我們的生活。所以組織和企業為提升發展速度將擁抱云計算,以保持競爭力,這甚至可能使自身企業成為市場的領導者。 在過去的十年中,計算機趨勢像互聯網與全球化趨勢轉變。這使得世界各地的人們,通過匿名聊天室和網上論壇等方式進行互動。而現在隨著社交網絡的普 及,匿名正在慢慢消失。這是在社交方...
閱讀 2980·2021-09-23 11:32
閱讀 2939·2021-09-22 15:12
閱讀 1719·2019-08-30 14:07
閱讀 3461·2019-08-29 16:59
閱讀 1651·2019-08-29 11:11
閱讀 2316·2019-08-26 13:50
閱讀 2436·2019-08-26 13:49
閱讀 2631·2019-08-26 11:49