V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
gps32251070
V2EX  ›  Python

关于 python 编码问题的疑惑

  •  
  •   gps32251070 · 2016-11-17 15:08:12 +08:00 · 1841 次点击
    这是一个创建于 2723 天前的主题,其中的信息可能已经有所发展或是发生改变。
    初学 python ,今天在使用 django 的时候遇到一些编码问题,希望大神指教下。



    我在访问 index 方法的时候不会报错,但是访问 news 方法的时候却报错,只有把第二个方法加上 u ,也就是这样才能正确输出



    我想问加上 u 之后 python 到底干了什么动作,为什么第一个 index 方法就可以正常输出?
    第 1 条附言  ·  2016-11-18 14:44:54 +08:00
    我昨天发现貌似是因为 django 自动把传进来的参数进行了 unicode 操作,把代码改成
    return HttpResponse(u"新闻 ID 是:%s" % news_id)
    或者
    return HttpResponse("新闻 ID 是:%s" % news_id.encode("utf8"))
    就可以了
    9 条回复    2016-11-17 23:28:18 +08:00
    Sylv
        1
    Sylv  
       2016-11-17 15:16:07 +08:00 via iPhone
    报的是 UnicodeEncodeError 错吗?
    news_id 是不是有非 ascii 字符?
    gps32251070
        3
    gps32251070  
    OP
       2016-11-17 15:20:37 +08:00
    https://gist.github.com/THK-1991/3d5c9f431e8a5c410110bbd9081546ea
    之前第二段贴错了,修改不了,应该是上面的
    gps32251070
        4
    gps32251070  
    OP
       2016-11-17 15:21:10 +08:00
    @Sylv 这个 ID 是从浏览器链接获取的数字
    holajamc
        5
    holajamc  
       2016-11-17 15:24:22 +08:00
    Sylv
        6
    Sylv  
       2016-11-17 17:11:15 +08:00
    "新闻 ID 是:%s" % news_id
    会报错是因为 news_id 是 unicode 类型,"新闻 ID 是:%s" 则是 str 类型,在格式化字符串时如果有参数是 unicode 类型,会将 str 类型字符串转换为 unicode 后再能格式化,最后的字符串也就是 unicode 类型。而 Python2 默认编码是 ascii ,用 ascii 编码转换 str 类型的 "新闻 ID 是:%s" 为 unicode 时就会报 UnicodeDecodeError 错了,因为其中包含非 ascii 字符的汉字。

    u"新闻 ID 是:%s" % news_id
    没有问题是因为两个字符串都是 unicode 类型,那么格式化后输出的也是 unicode 字符串,没有涉及到编码转换,所以不会报错。
    Sylv
        7
    Sylv  
       2016-11-17 17:14:41 +08:00
    Django 的 HttpResponse 方法应该 str 和 unicode 两种类型的字符串都能接收, Django 内部应该会自动处理编码转换,所以 HttpResponse("这是首页") 可以正常输出。
    stamaimer
        8
    stamaimer  
       2016-11-17 22:25:23 +08:00
    @Sylv 为啥 news_id 是 unicode 类型?
    stamaimer
        9
    stamaimer  
       2016-11-17 23:28:18 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2292 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 03:37 · PVG 11:37 · LAX 20:37 · JFK 23:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.