>

爬取B站视频弹幕信息,知名网站的

- 编辑:至尊游戏网站 -

爬取B站视频弹幕信息,知名网站的

有名网址的 404 页面长啥样?

2017/09/21 · HTML5 · 1 评论 · 404

初稿出处: Muzli   译文出处:众成翻译   

图片 1

图片 2图片 3google.com

.

图片 4

youtube.com

.

图片 5

facebook.com

.

图片 6

reddit.com

.

图片 7

muz.li

.

图片 8

.

图片 9

amazon.com

.

图片 10

vk.com

.

图片 11

linkedin.com

.

图片 12

imgur.com

.

图片 13

aliexpress.com

.

图片 14

bing.com

.

图片 15

图片 16图片 17tumblr.com

.

图片 18

.

图片 19

stackoverflow.com

.

图片 20

github.com

.

图片 21

dropbox.com

.

图片 22

craigslist.org

.

图片 23

dribbble.com

.

图片 24

awwwards.com

.

图片 25

csswinner.com

.

图片 26

producthunt.com

.

图片 27

coolhunting.com

.

图片 28

codyhouse.co

.

图片 29

mailchimp.com

.

图片 30

slack.com

.

图片 31

mashable.com

.

图片 32

bloomberg.com

.

图片 33

airbnb.com

.

图片 34

bitly.com

.

图片 35

virgin.com

1 赞 2 收藏 1 评论

图片 36

收获B站摄像弹幕,相对来讲非常的粗略,必要选择的知识点有requests、re多个库。requests用来收获网页音信,re正则至极获得你必要的新闻,当然还大概有别的的方法,举例Xpath。
跻身你所看见的录制的页面,F12跻身开辟者工具,采取网络。查找大家须要的音信,发掘域名这列有comment.bilibili.com 格式为xml ,文件名即为cid号。点击它后,在侧边的音讯头中复制恳求网站,在浏览器中开荒,就能够获得录像全方位弹幕消息。

图片 37   图片 38

代码如下:

图片 39图片 40

 1 import requests
 2 import re
 3 def getHTML(av):
 4     url='https://comment.bilibili.com/'+av+'.xml'
 5     html=requests.get(url)
 6     comments=html.text
 7     res=r'>(.+?)</d>'
 8     rescom=re.compile(res)
 9     comment=re.findall(rescom,comments)
10     for row in comment:
11         print(row)
12 av=input("input your av:")
13 getHTML(av)

弹幕代码

运转代码,弹幕就全数打字与印刷到窗口中,其他关于获取斟酌以至用斟酌内容制作词云可查看博客。

 

原创不易,尊重版权。转发请表明出处:http://www.cnblogs.com/xsmile/

本文由软件综合发布,转载请注明来源:爬取B站视频弹幕信息,知名网站的