论坛徽章:: 13

电梯直达

1楼 [收藏(0)] [报告]

发表于 2016-01-03 15:54 |只看该作者 |倒序浏览

我有个脚本是打印所有.txt 文件的md5 digest,但是发现在有空格或者文件名有'的时候，这个脚本会报错。

import os
import subprocess
import stat
def print_all_md5(dirname):
ll=[]
for root,dirs,files in os.walk(dirname):
for name in files:
ll.append((os.path.join(root,name)))
for i in ll:
if stat.S_ISFIFO(os.stat(i).st_mode):
ll.remove(i)
for filename in ll:
if filename.endswith('txt'):
cmd="md5sum "+filename
fp=subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
(s,e)=fp.communicate()
result=(s.decode()).strip()
e=(e.decode()).strip()
print(result,e)
print_all_md5(dirname=".")

复制代码

我应该怎么处理呢？

如何

文库|博客

substr函数

腰缠万贯

论坛徽章:: 26

2楼 [报告]

发表于 2016-01-03 16:01 |只看该作者

改变文件名 [

]
====>
文件名没有 [空格, ']

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zhonghua7896321

小富即安

论坛徽章:: 6

3楼 [报告]

发表于 2016-01-05 13:30 |只看该作者

本帖最后由 zhonghua7896321 于 2016-01-05 13:46 编辑

用glob模块来查找txt结尾的文件，然后循环处理

[root@server01 Test]# python find_file.py
(u'd41d8cd98f00b204e9800998ecf8427e  a\nd41d8cd98f00b204e9800998ecf8427e  .txt', u'')
(u'333acdcdb62bd6d001b275c885f807f5  A.txt', u'')
[root@server01 Test]# ll
total 12
-rw-r--r-- 1 root root 0 Jan  4 21:40 a
-rw-r--r-- 1 root root 0 Jan  4 21:45 a .txt
-rw-r--r-- 1 root root  68 Jan  4 21:39 A.txt
-rw-r--r-- 1 root root 395 Jan  4 21:44 find_file.py
-rw-r--r-- 1 root root 210 Jan  4 21:39 remove.py
-rw-r--r-- 1 root root 0 Jan  4 21:40 x.html
[root@server01 Test]#
[root@server01 Test]# cat find_file.py
import glob
import stat
import subprocess

def print_md5(dirname):
files = glob.glob("*.txt")
for f in files:
      cmd = "md5sum " + f
      fp = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
      (s,e) = fp.communicate()
      result = (s.decode()).strip()
      e = (e.decode()).strip()
      print (result, e)

print_md5(dirname=".")
[root@server01 Test]#

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zhonghua7896321

小富即安

论坛徽章:: 6

4楼 [报告]

发表于 2016-01-05 13:59 |只看该作者

回复 3# zhonghua7896321

我刚才发现我的解决办法有问题，对文件名含有引号的文件没法获得md5值。

另外一个解决办法：引入hashlib模块来解决

[root@server01 Test]# python find_file.py
a .txt
(u'd41d8cd98f00b204e9800998ecf8427e  a\nd41d8cd98f00b204e9800998ecf8427e  .txt', u'')
=================
d41d8cd98f00b204e9800998ecf8427e

1233'atdz.txt
(u'', u"/bin/sh: -c: line 0: unexpected EOF while looking for matching `''\n/bin/sh: -c: line 1: syntax error: unexpected end of file")
=================
68b329da9893e34099c7d8ad5cb9c940

A.txt
(u'333acdcdb62bd6d001b275c885f807f5  A.txt', u'')
=================
333acdcdb62bd6d001b275c885f807f5

[root@server01 Test]# ll
total 16
-rw-r--r-- 1 root root 1 Jan  4 21:51 1233'atdz.txt
-rw-r--r-- 1 root root 0 Jan  4 21:40 a
-rw-r--r-- 1 root root 0 Jan  4 21:45 a .txt
-rw-r--r-- 1 root root  68 Jan  4 21:39 A.txt
-rw-r--r-- 1 root root 588 Jan  4 21:54 find_file.py
-rw-r--r-- 1 root root 210 Jan  4 21:39 remove.py
-rw-r--r-- 1 root root 0 Jan  4 21:40 x.html
[root@server01 Test]#
[root@server01 Test]# cat find_file.py
import glob
import stat
import subprocess
import hashlib

def print_md5(dirname):
files = glob.glob("*.txt")
for f in files:
      print f
      cmd = "md5sum " + f
      fp = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
      (s,e) = fp.communicate()
      result = (s.decode()).strip()
      e = (e.decode()).strip()
      print (result, e)

      print "================="
      md5file=open(f)
      md5=hashlib.md5(md5file.read()).hexdigest()
      md5file.close()
      print md5, "\n\n"

print_md5(dirname=".")

PS：二楼的办法也不错，这样操作可以直接引用楼主原来的代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hmchzb19

家境小康

论坛徽章:: 13

5楼 [报告]

发表于 2016-01-05 14:36 |只看该作者

楼上这个办法好啊，
用hashlib ，就不需要subprocess 了
我后来用的代码比较蠢，

if filename.endswith(suffix):
if "'" in filename:
filename=filename.replace("'","\\'")
if " " in filename:
filename=filename.replace(" ","\ ")
cmd="md5sum {0}".format(filename)
fp=subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › Python › 如何处理包含'或者空格的文件名

如何处理包含'或者空格的文件名 [复制链接]

浏览过的版块