我有一个脚本,该脚本是按照Learning Python for Forensics一书中的蓝图构建的。该脚本将遍历用户指定的目录并收集目录中每个文件的元数据。结果将保存到 sqlite 数据库中,并写入 CSV 或 HTML 文件。
该脚本最初是用 Python 2.7.15 编写的。我正在尝试更新 Python 3.7 的代码。但是,摄取目录功能中有一行给我带来了问题。
该ingestDirectory函数如下所示:
def ingestDirectory(cur, source, custodian_id):
count = 0
for root, folders, files in os.walk(source):
for file_name in files:
meta_data = dict()
try:
meta_data['file_name'] = file_name
meta_data['file_path'] = os.path.join(root, file_name)
meta_data['extension'] = os.path.splitext(file_name)[-1]
file_stats = os.stat(meta_data['file_path'])
meta_data['mode'] = oct(file_stats.st_mode)
meta_data['inode'] = int(file_stats.st_ino)
meta_data['file_size'] = int(file_stats.st_size)
meta_data['atime'] = formatTimestamp(file_stats.st_atime)
meta_data['mtime'] = formatTimestamp(file_stats.st_mtime)
meta_data['ctime'] = formatTimestamp(file_stats.st_ctime)
except Exception as e:
logging.error('Could not gather data for file: ' + meta_data['file_path'] + e.__str__())
meta_data['custodian'] = custodian_id
columns = '","'.join(meta_data.keys())
values = '","'.join(str(x).encode('string_escape') for x in meta_data.values())
sql = 'INSERT INTO Files ("' + columns + '") VALUES ("' + values + '")'
cur.execute(sql)
count += 1
给我错误的那一行是这样的:
values = '","'.join(str(x).encode('string_escape') for x in meta_data.values())
此行旨在处理在metadata.values将数据写入数据库之前找到的任何字符串转义字符。
当我尝试在 Python 3 中运行此代码时,我收到有关无法识别的编解码器的错误。我做了一些关于 Stack Overflow 的研究,发现它在 Python 3 中string_escape被替换了unicode-escape。
我对 Python 3 和 Unicode 相当陌生。我的问题是这样的:
如何更新上面的行,以便它使用unicode-escape而不是string_escape生成与 Python 2.7 代码相同的结果?
任何帮助,将不胜感激!我已经为此工作了好几天,我尝试的每个解决方案只会导致更多错误代码或损坏的输出文件。
相关分类