flask | werkzeug.util的secure_filename的中文上传问题

今天用werkzeug.util里面的secure_filename的时候发现中文名字的上传问题有一些问题

代码结构为

-template

-upload.html <-简单的上传表单html

-upload <-上传文件存于此文件夹

-XX.XX <-这里就是上传文件的位置

-root.py <-处理文件

upload.html很简单，就是一个html5的上传文件表单，其中name为filename

<!DOCTYPE html><html lang="en"><head>    <meta charset="UTF-8">    <title>Title</title></head><body>    <form action=""          method="post"          enctype="multipart/form-data">        <input type="file" name="filename">        <input type="submit" value="Upload">    </form></body></html>

upload文件夹在未上传的时候为空文件夹

root.py

# -*- coding:utf-8 -*-from werkzeug.utils import secure_filenamefrom flask import Flask, request, render_template, url_for, redirectfrom os import pathapp = Flask(__name__)@app.route('/upload/', methods=["GET", "POST"])def upload():    if request.method == 'POST':        f = request.files['filename']        from unicodedata import normalize        f.save(path.join(path.abspath(path.dirname(__file__)), 'uploads') + '/'               + secure_filename(normalize('NFKD', f.filename).encode('utf-8', 'strict').decode('utf-8')))        return redirect(url_for('upload'))    return render_template('upload.html')if __name__ == '__main__':    app.run(debug=True)

从网上copy的正常上传到upload文件夹的代码，上传以后会出现

正常的中文名不见了欸

于是处理了一下就正常了

处理方法如下

将root.py中的

f.save(upload_path + '/' +secure_filename(normalize('NFKD', f.filename).encode('ascii', 'ignore').decode('ascii')))

中的ascii改成utf-8编码，也即

f.save(upload_path + '/' +secure_filename(normalize('NFKD', f.filename).encode('utf-8', 'ignore').decode('utf-8')))

然后找到werkzeug.util

打开util.py

在第30行

_filename_ascii_strip_re = re.compile(r'[^A-Za-z0-9_.-]')

后面加上一行

_filename_gbk_strip_re = re.compile(u"[^u4e00-u9fa5A-Za-z0-9_.-]")

这句就是加上了汉字的unicode的修改版正则

然后我们找到secure_filename函数

在其280行和282行有两个ascii，将之改成utf-8

也即，从

if isinstance(filename, text_type):        from unicodedata import normalize        filename = normalize('NFKD', filename).encode('ascii', 'ignore')        if not PY2:            filename = filename.decode('ascii')

改成

    if isinstance(filename, text_type):        from unicodedata import normalize        filename = normalize('NFKD', filename).encode('utf-8', 'ignore')        if not PY2:            filename = filename.decode('utf-8')

最后，把286行的_filename_ascii_strip_re改成_filename_gbk_strip_re，也即

filename = str(_filename_ascii_strip_re.sub('', '_'.join(                   filename.split()))).strip('._')

改成

filename = str(_filename_gbk_strip_re.sub('', '_'.join(                   filename.split()))).strip('._')

即可正常运行

如有疑问请在下面留言，看到就回复

欢迎标明作者的转载，不标明以后我不写了！！

标签：上传中文技巧 werkzeug flask

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。