摘要:構(gòu)建一個(gè)照片分類器對于理解照片中的模棱兩可的目標(biāo),其實(shí)有許多不同的方式。如果決定進(jìn)一步集成依賴于其它信號的新的分類器,這將讓問題變得更加簡單。該架構(gòu)如下圖所示對于每一個(gè)新的分類器,掃描所有的照片,并且將分類結(jié)果存儲在一個(gè)數(shù)據(jù)庫中。
Yelp是美國較大點(diǎn)評網(wǎng)站,擁有世界各地的Yelper上傳的成千上萬的照片。各種各樣的照片給進(jìn)入當(dāng)?shù)氐纳虡I(yè)提供了一個(gè)豐富的窗口。通過開發(fā)一個(gè)照片理解系統(tǒng)使Yelp能夠創(chuàng)建有關(guān)個(gè)人照片的語義數(shù)據(jù)。跟Yelp第一次在基于內(nèi)容的照片多樣化方面所做的嘗試一樣,由系統(tǒng)生成的數(shù)據(jù)正在增強(qiáng)Yelp近期推出的封面照片多樣化、標(biāo)簽式照片瀏覽等服務(wù)。
構(gòu)建一個(gè)照片分類器
對于理解照片中的模棱兩可的目標(biāo),其實(shí)有許多不同的方式。一開始,為了幫助簡化Yelp的問題,Yelp只專注于將照片分類為幾個(gè)預(yù)定義的類。之后,Yelp又只專注于關(guān)于飯店的照片類別。
事實(shí)上將照片進(jìn)行分類,就可以將其當(dāng)做機(jī)器學(xué)習(xí)中的分類任務(wù),需要開發(fā)一個(gè)分類器,Yelp首先需要做的就是收集訓(xùn)練數(shù)據(jù),在圖片分類任務(wù)中就是收集很多標(biāo)簽已知的照片。Yelp收集這些信息可以通過幾種不同的方式:
照片標(biāo)題:在很多照片的標(biāo)題中都包含代表照片自身含義的詞匯,例如,很多“菜單”照片的標(biāo)題中包含單詞“菜單”。為了識別這些關(guān)于食物的項(xiàng)目,Yelp依靠自己的菜單結(jié)構(gòu)(例如,http://www.yelp.com/menu/gary-danko-san-francisco/),它保留了每種食物的商業(yè)名單。Yelp發(fā)現(xiàn),將列表中的食物項(xiàng)目與照片的標(biāo)題進(jìn)行匹配產(chǎn)生了一個(gè)高準(zhǔn)確率的數(shù)據(jù)集。
照片屬性:當(dāng)上傳照片到Y(jié)elp上時(shí),用戶允許標(biāo)記照片的一些屬性,雖然它們并不總是準(zhǔn)確的,但仍然可以很有效地幫助照片分類。
眾包:通過眾包可以讓大眾自動(dòng)參與照片的標(biāo)注,并同時(shí)糾正一些錯(cuò)誤的標(biāo)注。Yelp已經(jīng)發(fā)現(xiàn),通過眾包Yelp通過合理的成本(在時(shí)間和金錢)獲得了質(zhì)量總體良好的標(biāo)簽。眾包體現(xiàn)了一種群體智能。
一旦Yelp有了標(biāo)簽數(shù)據(jù),Yelp就開始采用“AlexNet”形式的深度卷積神經(jīng)網(wǎng)絡(luò)(CNNs)來識別這些圖片(因?yàn)檫@種方法是一種監(jiān)督學(xué)習(xí)方法,非監(jiān)督學(xué)習(xí)目前仍然是深度學(xué)習(xí)的難點(diǎn)方向)。CNNs是由多個(gè)卷積層組成,ReLU層、pooling層、局部響應(yīng)正則化層和全連接層。Yelp的CNN被建立在基于Caffe架構(gòu)的AWS EC2 GPU實(shí)例上。Yelp喜歡Caffe,因?yàn)樗唵我子?、高性能、模塊化、開源、還一直在不斷完善。為了應(yīng)對Caffe的軟件依賴,Yelp使用Docker封裝了Yelp的CNN,以便它可以更容易地部署。
Yelp還創(chuàng)建了抽象,以確保Yelp的CNN可以很容易地與其他形式的分類器進(jìn)行集成,包括CNN的不同實(shí)例。如下圖所示,Yelp的基線是一個(gè)“Caffe分類器”,它通過Caffe的方式運(yùn)行CNN;它是一個(gè)抽象分類器的一種特殊形式,可以采取不同的信號,并執(zhí)行不同的分類算法。Yelp目前的“facade”分類器,是一個(gè)集成分類器,采用了不同分類結(jié)果的加權(quán)平均。如果Yelp決定進(jìn)一步集成依賴于其它信號的新的分類器,這將讓問題變得更加簡單。
Yelp在一個(gè)均勻黃金分割的2500張照片的測試集上進(jìn)行試驗(yàn),Yelp目前的“facade”分類器的整體較精確度達(dá)到了94%,召回率達(dá)到了70%。根據(jù)Yelp的描述,雖然這些數(shù)字可以再提高,但Yelp發(fā)現(xiàn)對于下面描述的應(yīng)用它們已經(jīng)足夠了。
照片分類服務(wù)
Yelp使用面向服務(wù)的架構(gòu)(SOA),Yelp做了一個(gè)RESTful照片分類服務(wù),用來支持現(xiàn)有的和即將推出的Yelp的應(yīng)用程序。由于服務(wù)預(yù)計(jì)擁有不止一個(gè)分類器(例如,不同的版本或?yàn)椴煌愋偷臉I(yè)務(wù)),該服務(wù)API使用一個(gè)分類器ID,一個(gè)行業(yè)ID,以及可選的類,然后返回所有屬于該行業(yè)的照片,其已經(jīng)通過分類器被歸類:
Yelp使用一個(gè)標(biāo)準(zhǔn)的MySQL數(shù)據(jù)庫服務(wù)器來承載所有的分類結(jié)果,所有的服務(wù)請求可以通過簡單的數(shù)據(jù)庫查詢被處理。為了避免更昂貴的實(shí)時(shí)分類,因?yàn)閅elp目前的應(yīng)用并不取決于的照片分類,所以Yelp只執(zhí)行線下分類。該架構(gòu)如下圖所示:對于每一個(gè)新的分類器,Yelp掃描所有的照片,并且將分類結(jié)果存儲在一個(gè)數(shù)據(jù)庫中。掃描在計(jì)算上消耗很大,但通過將分類器在任意多的機(jī)器上進(jìn)行并行處理,Yelp可以減輕這一點(diǎn)。掃描結(jié)束后,Yelp會(huì)每天自動(dòng)收集新的照片,并將它們發(fā)送到一個(gè)進(jìn)行分類和數(shù)據(jù)庫負(fù)載的批次中:
應(yīng)用:封面照片多樣化
一旦有了照片分類服務(wù),就可以有效地增強(qiáng)Yelp的許多關(guān)鍵功能。Yelp的業(yè)務(wù)詳細(xì)信息頁面顯示了一組“封面照片”,基于用戶的反饋和某些照片的屬性,它們能夠通過照片評分引擎進(jìn)行推薦。但是,目前Yelp的封面照片存在一個(gè)典型問題,即所選的照片缺乏多樣性,例如,如下圖所示,所有封面照片都是關(guān)于食物的(拉面),用戶無法看到其他方面的照片,除非他們點(diǎn)擊“查看全部”按鈕。
通過照片分類服務(wù),現(xiàn)在就可以讓封面照片變得多樣化,Yelp可以容易地確定較高得分的非食品的照片,然后將其納入封面照片。通過嚴(yán)格的A / B測試,Yelp已經(jīng)證實(shí)飯店的瀏覽者更愿意看到一個(gè)顯示突出的“食品”照片和突出的“非食品”照片,以及兩個(gè)小“食品”的照片和另外兩個(gè)“非食品”照片,如下圖所示。多樣化大大增加了Yelp用戶與照片之間的互動(dòng)。
應(yīng)用:標(biāo)簽式瀏覽照片
因?yàn)槿魏稳藶g覽Yelp照片都是在有了解之前,大部分來自于飯店的Yelp照片都是食物。但Yelp從用戶中得到反饋,他們發(fā)現(xiàn)用戶關(guān)心的可不僅僅是食物。有些人使用Yelp的圖片用來檢查一個(gè)特殊事件的氣氛或?qū)Ш降揭粋€(gè)第一次去的地點(diǎn),而其他人使用Yelp的照片用于一些更嚴(yán)肅的應(yīng)用,如發(fā)現(xiàn)餐廳是否能容納殘疾的顧客。隨著標(biāo)簽式照片瀏覽的推出,所有這些任務(wù)現(xiàn)在都變得更容易、更高效。
Yelp表示,標(biāo)簽式照片瀏覽是他們的照片分類服務(wù)現(xiàn)在提供的最顯著的應(yīng)用。照片現(xiàn)在在各自的標(biāo)簽(類)下進(jìn)行組織;從下圖可以看出,跳到你正在尋找的準(zhǔn)確信息現(xiàn)在變得更加容易。
下一步是什么
任何機(jī)器學(xué)習(xí)系統(tǒng)都不可能是完美的。Yelp表示,如果你想幫助提高Yelp照片分類的質(zhì)量,請隨意標(biāo)注你看到的任何未分類的照片。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/4322.html
摘要:結(jié)果,我們當(dāng)時(shí)非常抱以厚望的就是卷積神經(jīng)網(wǎng)絡(luò)模型,或者說是。單反相機(jī)可以讓攝影師調(diào)節(jié)透鏡類型和光圈大小,更好地控制把相片里的哪個(gè)部分作為焦點(diǎn)。更進(jìn)一步,單反相機(jī)的傳感器更大,對光線更敏感,即使在非?;璋档沫h(huán)境下也可以拍出非常漂亮的相片。 Yelp的數(shù)據(jù)庫中已經(jīng)存儲了幾千萬張相片,用戶們現(xiàn)在每天都會(huì)上傳大概十萬張,而且速度還在不斷加快。事實(shí)上,我們發(fā)現(xiàn)相片的上傳增長率大于相片的查看率。這些相片...
摘要:不同平臺的不同表情和雅虎視覺與機(jī)器學(xué)習(xí)團(tuán)隊(duì)測試了三種不同的方法算法,一種快速線性分類器算法,一種循環(huán)神經(jīng)網(wǎng)絡(luò)架構(gòu)算法,一種平衡性能與復(fù)雜性的卷積網(wǎng)絡(luò)。雅虎不是將機(jī)器學(xué)習(xí)應(yīng)用于的公司。 周末想在Netflix看場電影?可能,你選擇觀看的電影正受到來自Netflix復(fù)雜的AI算法的影響。同理,由深度學(xué)習(xí)驅(qū)動(dòng)的預(yù)測技術(shù),將越來越便捷地決定你喜歡吃什么、穿什么。而作為消費(fèi)型科技公司,Netflix、...
閱讀 3126·2021-11-23 09:51
閱讀 1103·2021-09-02 15:21
閱讀 3068·2019-08-30 13:56
閱讀 1903·2019-08-29 14:12
閱讀 775·2019-08-29 13:53
閱讀 1748·2019-08-29 11:32
閱讀 1440·2019-08-29 11:25
閱讀 1548·2019-08-28 17:51