摘要:由于機(jī)器學(xué)習(xí)的基礎(chǔ)是數(shù)據(jù)大量的數(shù)據(jù)很常見的是,人們?cè)絹碓綋?dān)心已經(jīng)擁有大量數(shù)據(jù)的公司會(huì)變得更強(qiáng)大。事實(shí)上,機(jī)器學(xué)習(xí)的傳播并不意味著谷歌變得更強(qiáng)大,但各種各樣的創(chuàng)業(yè)公司都可以比以前更快地用這種前沿科學(xué)建立事物。
機(jī)器學(xué)習(xí)可能是當(dāng)今技術(shù)中最重要的基本趨勢(shì)。由于機(jī)器學(xué)習(xí)的基礎(chǔ)是數(shù)據(jù) - 大量的數(shù)據(jù) - 很常見的是,人們?cè)絹碓綋?dān)心已經(jīng)擁有大量數(shù)據(jù)的公司會(huì)變得更強(qiáng)大。這有一定的道理,但是以相當(dāng)狹窄的方式,同時(shí)ML也看到了很多能力的擴(kuò)散 - 可能存在與集中化一樣多的分散化。
首先,說機(jī)器學(xué)習(xí)是關(guān)于數(shù)據(jù)的意思是什么?由于ML的學(xué)術(shù)文化,幾乎所有的初級(jí)科學(xué)都是在創(chuàng)建之后發(fā)布的 - 幾乎所有新的都是一篇你可以閱讀和構(gòu)建的論文。但是你建造什么?那么,在過去,如果軟件工程師想要?jiǎng)?chuàng)建一個(gè)系統(tǒng)來識(shí)別某些東西,他們就會(huì)編寫邏輯步驟(“規(guī)則”)。要識(shí)別圖片中的貓,你會(huì)編寫規(guī)則來查找邊緣,毛發(fā),腿,眼睛,尖耳等等,并將它們?nèi)科唇釉谝黄鸩⑾M軌蛘9ぷ?。麻煩的是,雖然這在理論上是有效的,但在實(shí)踐中它更像是試圖制造機(jī)械馬 - 這在理論上是可行的,但所需復(fù)雜性的法令是不切實(shí)際的。我們實(shí)際上無法描述我們用于行走或識(shí)別貓的所有邏輯步驟。通過機(jī)器學(xué)習(xí),您可以向統(tǒng)計(jì)引擎提供示例(大量示例),而不是編寫規(guī)則,并且該引擎會(huì)生成可以區(qū)分的模型。你給它10萬張標(biāo)有"cat"的照片和100,000張標(biāo)有"no cat"的照片,然后機(jī)器計(jì)算出差異。 ML用自動(dòng)確定的數(shù)據(jù)模式取代了手寫的邏輯步驟,并且對(duì)于一個(gè)非常廣泛的問題更加有效 - 簡單的演示在于計(jì)算機(jī)視覺,語言和語音,但用例更廣泛。您需要多少數(shù)據(jù)才是移動(dòng)目標(biāo):有研究途徑允許ML使用更小的數(shù)據(jù)集,但就目前而言,(更多)數(shù)據(jù)幾乎總是更好。
因此,問題是:如果ML讓你做新的和重要的事情,而ML會(huì)更好,你擁有的數(shù)據(jù)越多,那么這意味著那些已經(jīng)很大且擁有大量數(shù)據(jù)的公司會(huì)變得更強(qiáng)大了多遠(yuǎn)?贏家通吃效果有多遠(yuǎn)?很容易想象良性循環(huán)強(qiáng)化了贏家:"更多數(shù)據(jù)=更準(zhǔn)確的模型=更好的產(chǎn)品=更多的用戶=更多的數(shù)據(jù)"。從這里開始,這是“Google / Facebook /亞馬遜擁有所有數(shù)據(jù)”或“中國擁有所有數(shù)據(jù)”等聲明的一個(gè)簡單步驟 - 擔(dān)心最強(qiáng)大的科技公司會(huì)變得更強(qiáng)大,人口眾多的國家也會(huì)變得更加強(qiáng)大"對(duì)集中使用數(shù)據(jù)的態(tài)度。
好吧,有點(diǎn)。
首先,雖然您需要大量的機(jī)器學(xué)習(xí)數(shù)據(jù),但您使用的數(shù)據(jù)非常特定于您嘗試解決的問題。通用電氣擁有大量來自燃?xì)廨啓C(jī)的遙測(cè)數(shù)據(jù),谷歌擁有大量搜索數(shù)據(jù),而美國運(yùn)通有很多信用卡欺詐數(shù)據(jù)。您不能使用渦輪機(jī)數(shù)據(jù)作為例子來發(fā)現(xiàn)欺詐性交易,并且您無法使用網(wǎng)絡(luò)搜索來發(fā)現(xiàn)即將發(fā)生故障的燃?xì)廨啓C(jī)。也就是說,ML是一種可推廣的技術(shù) - 您可以將其用于欺詐檢測(cè)或人臉識(shí)別 - 但您使用它構(gòu)建的應(yīng)用程序并不是一般化的。你構(gòu)建的每件事只能做一件事。這與之前的所有自動(dòng)化浪潮大致相同:就像洗衣機(jī)只能洗衣服而不洗碗或做飯一樣,國際象棋程序不能免稅,機(jī)器學(xué)習(xí)翻譯系統(tǒng)無法識(shí)別貓。您構(gòu)建的應(yīng)用程序和您需要的數(shù)據(jù)集都非常特定于您嘗試解決的任務(wù)(盡管如此,這是一個(gè)移動(dòng)目標(biāo),并且正在進(jìn)行研究以嘗試使學(xué)習(xí)在不同數(shù)據(jù)集之間更易于轉(zhuǎn)換)。
這意味著機(jī)器學(xué)習(xí)的實(shí)現(xiàn)將得到非常廣泛的分布。谷歌不會(huì)“擁有所有數(shù)據(jù)” - 谷歌將擁有所有谷歌數(shù)據(jù)。谷歌將擁有更多相關(guān)的搜索結(jié)果,通用電氣將擁有更好的引擎遙測(cè)技術(shù),沃達(dá)豐將更好地分析通話模式和網(wǎng)絡(luò)規(guī)劃,這些都是由不同公司構(gòu)建的不同內(nèi)容。谷歌更善于成為谷歌,但這并不意味著它在某種程度上擅長于其他任何事情。
接下來,人們可以爭辯說,這只意味著每個(gè)行業(yè)中的大公司都會(huì)變得更強(qiáng)大 - 沃達(dá)豐,通用電氣和美國運(yùn)通各自擁有“所有數(shù)據(jù)”,無論他們做什么,因此形成了對(duì)抗競爭的護(hù)城河。但在這里,它更復(fù)雜:有各種有趣的問題,關(guān)于誰擁有數(shù)據(jù),它的獨(dú)特性以及它的獨(dú)特性,以及正確的聚合和分析點(diǎn)。
那么:作為一家工業(yè)公司,您是否保留自己的數(shù)據(jù)并構(gòu)建ML系統(tǒng)進(jìn)行分析(或者向承包商支付費(fèi)用為您做到這一點(diǎn))?您是否從已經(jīng)接受過其他人數(shù)據(jù)培訓(xùn)的供應(yīng)商那里購買成品?您是將您的數(shù)據(jù)混合到那里,還是從它衍生出的培訓(xùn)中混合?供應(yīng)商是否需要您的數(shù)據(jù),或者他們已經(jīng)擁有足夠的數(shù)據(jù)?答案在您的業(yè)務(wù)的不同部分,不同的行業(yè)和不同的用例中會(huì)有所不同。
從另一端來看,如果您正在創(chuàng)建一家公司來部署ML來解決實(shí)際問題,那么有兩個(gè)基本數(shù)據(jù)問題:如何獲得第一個(gè)數(shù)據(jù)來訓(xùn)練模型以獲得第一個(gè)客戶,你實(shí)際需要多少數(shù)據(jù)?當(dāng)然,第二個(gè)問題分解為很多問題:問題是通過相對(duì)少量的數(shù)據(jù)解決的,你可以很容易地獲得(但許多競爭對(duì)手可以獲得),或者你需要更多,難以獲得數(shù)據(jù),如果是這樣,網(wǎng)絡(luò)效應(yīng)可以從中受益,那么勝利者會(huì)采取一切動(dòng)態(tài)嗎?產(chǎn)品是否會(huì)無限期地獲得更多數(shù)據(jù),或者是否存在S曲線?
這取決于。
某些數(shù)據(jù)對(duì)于業(yè)務(wù)或產(chǎn)品而言是獨(dú)一無二的,或者具有強(qiáng)大的專有優(yōu)勢(shì)。 GE發(fā)動(dòng)機(jī)遙測(cè)可能沒有太多用于分析勞斯萊斯發(fā)動(dòng)機(jī),但如果是,他們將不會(huì)分享它。這可能是公司創(chuàng)建的機(jī)會(huì),但也是許多內(nèi)部大公司IT和承包商項(xiàng)目發(fā)生的地方
一些數(shù)據(jù)將適用于許多公司甚至許多行業(yè)中的用例。 “這個(gè)電話有些奇怪”可能是所有信用卡公司的常見分析 - “客戶聽起來很生氣”可能適用于有呼叫中心的任何人。這是“混合”的問題。在這里創(chuàng)建了許多公司來解決許多公司或不同行業(yè)的問題,這里的數(shù)據(jù)存在網(wǎng)絡(luò)效應(yīng)。
但也有一些情況,在某一點(diǎn)之后,供應(yīng)商甚至不需要每個(gè)增量客戶的數(shù)據(jù) - 產(chǎn)品已經(jīng)在運(yùn)行。
實(shí)際上,隨著機(jī)器學(xué)習(xí)幾乎擴(kuò)散到所有東西,一個(gè)初創(chuàng)公司可能會(huì)看到其中的幾個(gè)。我們的投資組合公司Everlaw生產(chǎn)法律發(fā)現(xiàn)軟件:如果你起訴某人并且他們給你發(fā)了一輛裝滿紙的卡車,這會(huì)有所幫助。機(jī)器學(xué)習(xí)意味著他們將能夠?qū)σ话偃f封電子郵件進(jìn)行情緒分析(“向我顯示焦慮的電子郵件”),而無需根據(jù)案例中的數(shù)據(jù)訓(xùn)練該模型,因?yàn)榕嘤?xùn)該模型的情緒示例不需要來自這一特定訴訟(或任何訴訟)。相反,他們也可以對(duì)您的數(shù)據(jù)進(jìn)行聚類分析(“向我顯示與此相同的電子郵件”),而不會(huì)在其他任何地方進(jìn)行。另一家投資組合公司Drishti使用計(jì)算機(jī)視覺來檢測(cè)和分析生產(chǎn)線 - 其中一些功能是根據(jù)您的數(shù)據(jù)進(jìn)行培訓(xùn)的,有些功能根本不是針對(duì)您的業(yè)務(wù),而是跨行業(yè)。
在極端情況下,我最近采訪了一家非常大型車輛的制造商,他們正在使用機(jī)器學(xué)習(xí)來獲得更精確的癟胎檢測(cè)器。這是訓(xùn)練有關(guān)數(shù)據(jù)(很多很多很多來自扁平輪胎和非扁平輪胎的信號(hào)的例子),顯然,但是獲得這些數(shù)據(jù)并不難。這是一個(gè)特征,而不是護(hù)城河。
因此,我之前說過ML啟動(dòng)有兩個(gè)問題:如何獲取數(shù)據(jù)以及您需要多少?但這些只是技術(shù)問題:你還會(huì)問你如何進(jìn)入市場,你的可尋址市場是什么,你解決的問題對(duì)你的客戶有多大價(jià)值,等等。也就是說,很快就會(huì)有任何“AI”創(chuàng)業(yè)公司 - 他們將成為工業(yè)過程分析公司,法律平臺(tái)公司或銷售優(yōu)化公司。事實(shí)上,機(jī)器學(xué)習(xí)的傳播并不意味著谷歌變得更強(qiáng)大,但各種各樣的創(chuàng)業(yè)公司都可以比以前更快地用這種前沿科學(xué)建立事物。
這讓我想到了我在其他地方使用過的比喻 - 我們應(yīng)該將機(jī)器學(xué)習(xí)與SQL進(jìn)行比較。它是一個(gè)重要的構(gòu)建塊,允許新的和重要的事情,并將成為一切的一部分。如果你不使用它和你的競爭對(duì)手,你會(huì)落后。有些人會(huì)用這種方式創(chuàng)建全新的公司 - 沃爾瑪成功的一部分來自于使用數(shù)據(jù)庫來更有效地管理庫存和物流。但是今天,如果你創(chuàng)辦了一家零售商并說“......我們將要使用數(shù)據(jù)庫”,這不會(huì)讓你與眾不同或有趣 - SQL成為了一切的一部分然后消失了。機(jī)器學(xué)習(xí)也會(huì)發(fā)生同樣的情況。
本文為簡譯,更多詳情請(qǐng)參見原文。
文章來源: 網(wǎng)易云社區(qū)
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/25402.html
摘要:近日,一篇在上成為了網(wǎng)友熱議的話題。在這種結(jié)構(gòu)改變幾個(gè)月后,微軟宣布注資億美元。與微軟的合作關(guān)系是基于一個(gè)重要的前提,即微軟有權(quán)將的部分技術(shù)商業(yè)化。網(wǎng)友紛紛稱早已應(yīng)該更名為。 編譯?| 禾木木 出品 |?AI科技大本營(ID:rgznai100) OpenAI 如何以 10 億美元的價(jià)...
摘要:我們來聊聊可能很快就會(huì)影響世界的九大創(chuàng)新人工智能能夠獨(dú)立于人類主人而學(xué)習(xí)操作的人工智能,這看上去就像科幻小說。以色列公司建立了世界最大的海水淡化工廠,每天能生產(chǎn)立方米淡水。 本文轉(zhuǎn)載自:眾成翻譯譯者:文藺鏈接:http://www.zcfy.cc/article/830原文:https://medium.com/startup-grind/9-innovations-that-coul...
摘要:而這種舉一反三的能力在機(jī)器學(xué)習(xí)領(lǐng)域同樣適用,科學(xué)家將其稱之為遷移學(xué)習(xí)。與深度學(xué)習(xí)相比,我們技術(shù)較大優(yōu)點(diǎn)是具有可證明的性能保證。近幾年的人工智能熱潮中,深度學(xué)習(xí)是最主流的技術(shù),以及之后的成功,更是使其幾乎成為的代名詞。 如今,人類將自己的未來放到了技術(shù)手里,無論是讓人工智能更像人類思考的算法,還是讓機(jī)器人大腦運(yùn)轉(zhuǎn)更快的芯片,都在向奇點(diǎn)靠近。谷歌工程總監(jiān)、《奇點(diǎn)臨近》的作者庫茲韋爾認(rèn)為,一旦智能...
摘要:易于學(xué)習(xí),用戶友好且功能強(qiáng)大,所以能在編程語言中排名前五的毫不令人意外。感謝各種庫使得成為科學(xué)計(jì)算方面的很好的語言。金融科技企業(yè)需要一種易于處理,可擴(kuò)展,成熟,高性能的編程語言,并配有現(xiàn)成的庫和組件。 Quora問題:Python作為一種編程語言有多強(qiáng)大?以下是Patrycja Okowicka的回答 說實(shí)話,Python是一門強(qiáng)大的語言,幾乎所有東西都可以用Python創(chuàng)建!這就是為...
摘要:今年月日收購了基于深度學(xué)習(xí)的計(jì)算機(jī)視覺創(chuàng)業(yè)公司。這項(xiàng)基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)已經(jīng)開發(fā)完成,正在測(cè)試。深度學(xué)習(xí)的誤區(qū)及產(chǎn)品化浪潮百度首席科學(xué)家表示目前圍繞存在著某種程度的夸大,它不單出現(xiàn)于媒體的字里行間,也存在于一些研究者之中。 在過去的三十年,深度學(xué)習(xí)運(yùn)動(dòng)一度被認(rèn)為是學(xué)術(shù)界的一個(gè)異類,但是現(xiàn)在, Geoff Hinton(如圖1)和他的深度學(xué)習(xí)同事,包括紐約大學(xué)Yann LeCun和蒙特...
閱讀 2349·2021-08-23 09:46
閱讀 977·2019-08-29 18:31
閱讀 1937·2019-08-29 17:04
閱讀 2532·2019-08-29 12:23
閱讀 1906·2019-08-26 14:05
閱讀 1143·2019-08-26 13:44
閱讀 3280·2019-08-26 12:23
閱讀 2289·2019-08-26 10:46