摘要:我又回頭看那個(gè)爬京東的程序哦我好像被反爬蟲(chóng)發(fā)現(xiàn)了解決反爬蟲(chóng)問(wèn)題這下可以了吧直接點(diǎn)開(kāi)鏈接看一下沒(méi)錯(cuò),火狐才是我的默認(rèn)瀏覽器終于不用再說(shuō)交封不殺了。
昨晚終于提交了該死的31條CPU,今天十節(jié)課翹了八節(jié),躺在宿舍睡覺(jué),不幸遇到幾百年難得一見(jiàn)的點(diǎn)名……然而當(dāng)時(shí)我在吃炸雞,沒(méi)法(懶)趕過(guò)去,達(dá)成“第一次翹課就點(diǎn)名”。
心情郁結(jié)的我打算看一看漂亮小姐姐開(kāi)心一下,于是我發(fā)現(xiàn)了這個(gè)視頻:
據(jù)說(shuō)是Rose韓國(guó)站的站姐飛去美國(guó)科切拉音樂(lè)節(jié)現(xiàn)場(chǎng)拍攝的視頻。因?yàn)樗膫€(gè)站只有Rose的站姐去了,所以視頻、高清圖都非常珍稀。
于是我對(duì)up主說(shuō):
交封不殺!
但是顯然up主并不care我的留言,氣。
求人不如求己,打開(kāi)開(kāi)發(fā)者工具:
……我瞎了……
老年人還是要放大字體啊。
看我找到了什么?
哈哈哈哈哈哈哈哈哈
復(fù)制鏈接打開(kāi):
555為什么會(huì)有這么漂亮的小姐姐!!我愛(ài)了??!
但是后面我又發(fā)現(xiàn)了更多想要封面的視頻:
一個(gè)一個(gè)找我怕不是要累死……
想到“一個(gè)木函”這個(gè)app之前有獲取B站封面的功能,但是后來(lái)用不了了。
那我就自己寫(xiě)一個(gè)!
(非常激動(dòng),畢竟我只會(huì)用python寫(xiě)hello world)
工具:pycharm(不得不說(shuō)這東西的logo真丑);
功能:輸入av號(hào),生成封面圖片鏈接;
環(huán)境:python3.7
思路:輸入av號(hào),到相應(yīng)的網(wǎng)址,打開(kāi)開(kāi)發(fā)者界面,找到并返回圖片鏈接。
那就開(kāi)始吧!
剛剛那個(gè)視頻的鏈接是:
結(jié)構(gòu)是https://www.bilibili.com/ + video + av號(hào)。
that"s easy.
def getcover(): avnum=input("please input the av number of your video:") url="https://www.bilibili.com/video/av"+avnum
emmmm,下面該怎么做?
哦對(duì)!下面找圖片的鏈接!
可以看出來(lái),只要找到
itemprop="image"
content="https://balabala.jpg"
就能確定圖片地址。
index1=text.find("itemprop="image"")+len("itemprop="image" content="") index2=text.find(""",index1) cover=text[index1:index2] print(cover)
作為一個(gè)不會(huì)python的人,我能寫(xiě)出這段真是感天動(dòng)地了。
(我在網(wǎng)上找到好多教python爬蟲(chóng)的文章,可是他們寫(xiě)的都好長(zhǎng)好復(fù)雜……然后看到一個(gè)爬取京東商品信息的,從里面摳出來(lái)這一段……)
anyway,運(yùn)行!
咦,出錯(cuò)了。
我又回頭看那個(gè)爬京東的程序……
哦!我沒(méi)加head。
headers={ "Host":"www.bilibili.com", "User-Agent": "Chrome/73.0.3683.103" }
再運(yùn)行……
還是錯(cuò)。wtf。
我又回頭看那個(gè)爬京東的程序……
哦!我好像被反爬蟲(chóng)發(fā)現(xiàn)了!
text=requests.get(url,headers=headers).text#解決反爬蟲(chóng)問(wèn)題
這下可以了吧?
直接點(diǎn)開(kāi)鏈接看一下?
沒(méi)錯(cuò),火狐才是我的默認(rèn)瀏覽器
perfect!
終于不用再說(shuō)“交封不殺”了。
下面附上源代碼:
import re import requests def getcover(): avnum=input("please input the av number of your video:") url="https://www.bilibili.com/video/av"+avnum headers={ "Host":"www.bilibili.com", "User-Agent": "Chrome/73.0.3683.103" } text=requests.get(url,headers=headers).text#解決反爬蟲(chóng)問(wèn)題 index1=text.find("itemprop="image"")+len("itemprop="image" content="") index2=text.find(""",index1) cover=text[index1:index2] print(cover) getcover()
最后,記錄一下一些“意想不到的bug”。
正常的不會(huì)python的人的bug:
ModuleNotFoundError: No module named "requests"
上網(wǎng)找這個(gè)bug的原因,都顯示因?yàn)闆](méi)有安裝這個(gè)package。
ok,那裝。
順便升級(jí)了一下pip
但是還是同樣的報(bào)錯(cuò)。
找啊找找啊找,終于看到有人說(shuō),或許是因?yàn)椤皼](méi)有安裝到同一目錄”。
what???誰(shuí)和誰(shuí)沒(méi)有安裝到同一目錄???
但是!我突然想到,第一次用的時(shí)候輸入任何代碼都報(bào)錯(cuò),因?yàn)槲覜](méi)把python放到interpreter里。
打開(kāi)project interpreter,發(fā)現(xiàn)果然沒(méi)有requests。
那就手動(dòng)install一下:
perfect!
不正常的bug:
python語(yǔ)句結(jié)尾不要加分號(hào)?。?!
不要加分號(hào)!?。?/p>
不要加分號(hào)?。。?/p>
python的注釋是#不是// ?。。?/p>
python的注釋是#不是// ?。。?/p>
python的注釋是#不是// ?。?!
That"s all.
最后,python和C++真的是太不一樣了。
python可以引用的東西非常多,很多東西都不需要自己寫(xiě)。
但是其實(shí)也差不多,不過(guò)相比之下,python的可讀性更好一點(diǎn)。
btw我還是懶得學(xué)orz
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/43674.html
摘要:摘要近日,阿里云重磅推出視頻點(diǎn)播新功能視頻,基于深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)技術(shù)和海量數(shù)據(jù),為廣大用戶提供多場(chǎng)景的視頻服務(wù)。場(chǎng)景應(yīng)用功能特性阿里云視頻智能服務(wù)在標(biāo)簽預(yù)測(cè)內(nèi)容審核智能封面等層面能夠提供多種應(yīng)用服務(wù)。 摘要: 近日,阿里云重磅推出視頻點(diǎn)播新功能——視頻AI ,基于深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)技術(shù)和海量數(shù)據(jù),為廣大用戶提供多場(chǎng)景的視頻AI服務(wù)。 點(diǎn)此查看原文:http://click.aliy...
閱讀 1532·2021-11-17 09:33
閱讀 3119·2021-10-13 09:39
閱讀 2792·2021-10-09 10:01
閱讀 2533·2021-09-29 09:35
閱讀 4051·2021-09-26 10:01
閱讀 3594·2019-08-26 18:37
閱讀 3244·2019-08-26 13:46
閱讀 1975·2019-08-26 13:39