-
15行Python代码能干嘛?能写一个抖音网页版的简易爬虫(附源码)
前言
相信还有很多人不知道,2021年6月21日,抖音网页版上线了
但是呢,APP版本的,可以下载视频,保存本地。而网页版的短视频,是没有下载的选线的,所以只能自己写个爬虫爬取下来。
不过,你也可以在手机上打开抖音APP,查找到视频以后在手机的上下载
今天来分享给大家一个只有不到20行代码的简单爬虫,能把你喜欢的抖音视频一个个的爬取下来
完整代码
import requests import re word = input('请输入链接: ') # url = 'https://www.douyin.com/video/6967296943450066214?previous_page=main_page' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=word, headers=headers) html_data = re.findall('src(.*?)vr%3D%2', response.text)[1] dem = requests.utils.unquote(html_data) video_url = html_data.replace('%2F', '/').replace('%22%3A%22', 'https:').replace('%3F', '?').replace('%26', '&') title = re.findall('<title data-react-helmet="true"> (.*?)</title>', response.text)[0] video_content = requests.get(url=video_url).content with open(title + '.mp4', mode='wb') as f: f.write(video_content) print(title, '下载完成')
运行结果如下
有问题可以加群直接找老师一对一解答哟
出处:https://www.cnblogs.com/qshhl/p/15091833.html
出处:https://www.cnblogs.com/qshhl/p/15091833.html
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数