VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > Python基础教程 >
  • Python3标准库:filecmp比较文件(2)

  • 'example/dir1/file_only_in_dir1',
  • shallow=True),
  • end=' ')
  • print(filecmp.cmp('example/dir1/file_only_in_dir1',
  • 'example/dir1/file_only_in_dir1',
  • shallow=False))
  • shallo参数告诉cmp()除了文件的元数据外,是否还要查看文件的内容。默认情况下,会使用由os.stat()得到的信息来完成一个浅比较。如果结果是一样的,则认为文件相同。因此,对于同时创建的相同大小的文件,即使他们的内容不同,也会报告为是相同的文件。当shallow为False时,则要比较文件的内容。

    如果非递归的比较两个目录中的一组文件,则可以使用cmpfiles()。参数是目录名和两个位置上要检查的我就爱你列表。传入的公共文件列表应当只包含文件名(目录会导致匹配不成功),而且这些文件在两个位置上都应当出现。下一个例子显示了构造公共列表的一种简单方法。与cmp()一样,这个比较也有一个shallow标志。 

    
    	
    1. import filecmp
    2. import os
    3.  
    4. # Determine the items that exist in both directories
    5. d1_contents = set(os.listdir('example/dir1'))
    6. d2_contents = set(os.listdir('example/dir2'))
    7. common = list(d1_contents & d2_contents)
    8. common_files = [
    9. f
    10. for f in common
    11. if os.path.isfile(os.path.join('example/dir1', f))
    12. ]
    13. print('Common files:', common_files)
    14.  
    15. # Compare the directories
    16. match, mismatch, errors = filecmp.cmpfiles(
    17. 'example/dir1',
    18. 'example/dir2',
    19. common_files,
    20. )
    21. print('Match :', match)
    22. print('Mismatch :', mismatch)
    23. print('Errors :', errors)

    cmpfiles()返回3个文件名列表,分别包含匹配的文件、不匹配的文件和不能比较的文件(由于权限问题或出于其他原因)。

    1.3 比较目录

    前面介绍的函数适合完成相对简单的比较。对于大目录树的递归比较或者更完整的分析,dircmp类很更有用。在最简单的用例中,report()会打印比较两个目录的报告。

    
    	
    1. import filecmp
    2.  
    3. dc = filecmp.dircmp('example/dir1', 'example/dir2')
    4. dc.report()

    输出是一个纯文本报告,显示的结果只包括给定目录的内容,而不会递归比较其子目录。在这里,认为文件not_the_same是相同的,因为这里没有比较内容。无法让dircmp像cmp()那样比较文件的内容。

    为了更多的细节,也为了完成一个递归比较,可以使用report_full_closure()。 

    
    	
    1. import filecmp
    2.  
    3. dc = filecmp.dircmp('example/dir1', 'example/dir2')
    4. dc.report_full_closure()

    输出将包括所有同级子目录的比较。 

    1.4 在程序中使用差异

    除了生成打印报告,dircmp还能计算文件列表,可以在程序中直接使用。以下各个属性只在请求时才计算,所以对于未用的数据,创建dircmp实例不会带来开销。

    
    	
    1. import filecmp
    2. import pprint
    3.  
    4. dc = filecmp.dircmp('example/dir1', 'example/dir2')
    5. print('Left:')
    6. pprint.pprint(dc.left_list)
    7.  
    8. print('\nRight:')
    9. pprint.pprint(dc.right_list)

    所比较目录中包含的文件和子目录分别列在left_list和right_list中。

    可以向构造函数传入一个要忽略的名字列表(该列表中指定的名字将被忽略)来对输入进行过滤。默认的,RCS、CVS和tags等名字会被忽略。

    
    	
    1. import filecmp
    2. import pprint
    3.  
    4. dc = filecmp.dircmp('example/dir1', 'example/dir2',
    5. ignore=['common_file'])
    6.  
    7. print('Left:')
    8. pprint.pprint(dc.left_list)
    9.  
    10. print('\nRight:')
    11. pprint.pprint(dc.right_list)

    在这里,将common_file从要比较的文件列表中去除。

    两个输入目录中共有的文件名会保存在common内,各目录独有的文件会列在left_only和right_only中。

    
    	
    1. import filecmp
    2. import pprint
    3.  
    4. dc = filecmp.dircmp('example/dir1', 'example/dir2')
    5. print('Common:')
    6. pprint.pprint(dc.common)
    7.  
    8. print('\nLeft:')
    9. pprint.pprint(dc.left_only)
    10.  
    11. print('\nRight:')
    12. pprint.pprint(dc.right_only)

    "左"目录是dircmp()的第一个参数,"右"目录是第二个参数。

    公共成员可以被进一步分解为文件、目录和“有趣”元素(两个目录中类型不同的内容,或者os.stat()指出的有错误的地方)。

    
    相关教程
    关于我们--广告服务--免责声明--本站帮助-友情链接--版权声明--联系我们       黑ICP备07002182号