当前位置:
首页 > temp > 简明python教程 >
-
Python实现FTP文件定时自动下载
之前遇到技术问题总能在技术博客上得到启发,十分感谢各位的无私分享。而自己却很少发文,固然是水平有限,但也限制了知识积累和总结。今后多总结分享,回馈博客的同时也希望大家多多批评。
一、需求:
某数据公司每日15:00~17:00之间,在其FTP发布当日数据供下载,我方需及时下载当日数据至指定本地目录。
二、分析:
1、需实现FTP登陆、查询、下载功能;
解答:使用内置的ftplib模块中FTP类;
2、需判断文件是否下载;
解答:使用os模块中path.exists方法;
3、需判断在指定时间段内才执行下载任务;
解答:使用内置的time模块抓取当前时间,并与指定时间做比较;
4、需考虑日期切换问题;
解答:使用内置的time模块抓取当前日期,并与变量中的日期做比较。
三、代码实现
1 #!/usr/bin/env python 2 # _*_ coding:utf-8 _*_ 3 4 ''' 5 @Time : 2019-11-11 13:30 6 @Author : Peanut_C 7 @FileName: ftp_auto_download.py 8 ''' 9 10 11 import time 12 from ftplib import FTP 13 import os 14 15 16 remote_path = "/xxx/yy/z/" # 远端目录 17 begin_time = 1500 # 任务开始时间 18 end_time = 1700 # 任务结束时间 19 20 21 today = time.strftime("%Y%m%d") # 当天日期 22 today_file = today + 'test.txt' # 得到当天日期的目标文件名 23 remote_file = remote_path + today_file # 远端文件名 24 local_file = '\\\\local\\' + today + '\\' + today_file # 本地文件名 25 log_file = 'C:\\\\log\\ftp_log.txt' 26 27 28 def ftp_connect(): 29 """用于FTP连接""" 30 ftp_server = 'w.x.y.z' # ftp站点对应的IP地址 31 username = 'ftpuser' # 用户名 32 password = 'ftppass' # 密码 33 ftp = FTP() 34 ftp.set_debuglevel(0) # 较高的级别方便排查问题 35 ftp.connect(ftp_server, 21) 36 ftp.login(username, password) 37 return ftp 38 39 def remote_file_exists(): 40 """用于FTP站点目标文件存在检测""" 41 ftp = ftp_connect() 42 ftp.cwd(remote_path) # 进入目标目录 43 remote_file_names = ftp.nlst() # 获取文件列表 44 ftp.quit() 45 if today_file in remote_file_names: 46 return True 47 else: 48 return False 49 50 def download_file(): 51 """用于目标文件下载""" 52 ftp = ftp_connect() 53 bufsize = 1024 54 fp = open(local_file, 'wb') 55 ftp.set_debuglevel(0) # 较高的级别方便排查问题 56 ftp.retrbinary('RETR ' + remote_file, fp.write, bufsize) 57 fp.close() 58 ftp.quit() 59 60 61 while True: 62 if int(time.strftime("%H%M")) in range(begin_time, end_time): # 判断是否在执行时间范围 63 if int(time.strftime("%Y%m%d")) - int(today) == 0: # 判断是否跨日期 64 while not os.path.exists(local_file): # 判断本地是否已有文件 65 if remote_file_exists(): # 判断远端是否已有文件 66 download_file() 67 with open(log_file, 'a') as f: 68 f.write('\n' + time.strftime("%Y/%m/%d %H:%M:%S") + " 今日文件已下载!") 69 time.sleep(60) # 下载完毕静默1分钟 70 else: 71 time.sleep(180) 72 break # 注意,此处跳出循环重新判断日期,避免周末或当天没文件时陷入内层循环 73 else: 74 time.sleep(180) 75 else: 76 """如果跨日期,则根据当前日期,更新各文件日期""" 77 today = time.strftime("%Y%m%d") # 当天日期 78 today_file = today + 'test.txt' # 得到当天日期的目标文件名 79 remote_file = remote_path + today_file # 远端文件名 80 local_file = '\\\\local\\' + today + '\\' + today_file # 本地文件名 81 with open(log_file, 'a') as f: 82 f.write('\n' + time.strftime("%Y/%m/%d %H:%M:%S") + " 任务启动, 文件日期已更新。") 83 else: 84 time.sleep(1800)
四、运行情况
保存为pyw文件,任务在后台持续运行,不需要计划任务,省心省力。
不用下载标记,一则较为简洁,二则本地文件如果被人误删或移动可自动重新下载。
日志中,每天仅写入任务启动和文件已下载标志,并记录对应时间,如有需要可再添加。
希望能帮到有需要的朋友。
多多指教!
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数