Python学习之抖音视频爬取

抓包

我们要爬取之前，要先拿到获取视频的网络请求包，按下键盘上的F12，打开“开发者工具（DevTools）”，点击网络（Network），然后找一个别人的抖音主页

点进去之后，点击刷新，找到一个叫“post/?device=”的请求包

然后右键复制，以cURL（bash）格式复制，随便找一个cURL转python的网站，转换成python代码，然后将代码创建为python文件

最后只需要在代码最后添加如下代码

aweme_list = response.json().get('aweme_list')

for aweme in aweme_list:

title = aweme.get('desc')

url = aweme.get('video').get('play_addr').get('url_list')[-1]

video_content = requests.get(url, cookies=cookies, headers=headers)

with open(f"./dou_video/{title}.mp4", "wb") as f:

f.write(video_content.content)

print(f"视频：{title}-----下载完成！")

f.close()

以上代码意思：通过解析响应的json文件，获取其中aweme列表，然后循环这个列表，获取每个视频的信息，从中取出视频标题，视频链接，然后打开文件，将视频内容保存到dou_video文件中，以视频名作为文件名

如果想要修改爬取的抖音主页，可以修改params字典中sec_user_id的值

这里只是进行一下简单的json解析，只解析了title和视频，如果想要增加更多功能，比如按照视频作者、视频标签分类，或是增加运行效率，可以采用多线程方式，进一步解析并构建代码

这里报错是因为视频标题存在特殊符号，所以代码还需要进一步完善，比如对标题中的特殊符号进行处理

更多游戏资讯请关注：电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com

热门游戏