Python中的編碼定義必須位於第1行/第2行嗎？

要定義源代碼的編碼，一個魔法註釋必須被放置到源文件或者作爲該文件中的第一或第二行，比如：

# coding=<encoding name>

或（使用由常用的編輯器識別的格式）：

#!/usr/bin/python 
# -*- coding: <encoding name> -*-

如果許可信息出現在最頂端的行中，例如，從https://github.com/google/seq2seq/blob/master/seq2seq/training/utils.py：

# Copyright 2017 Google Inc. 
# 
# Licensed under the Apache License, Version 2.0 (the "License"); 
# you may not use this file except in compliance with the License. 
# You may obtain a copy of the License at 
# 
#  http://www.apache.org/licenses/LICENSE-2.0 
# 
# Unless required by applicable law or agreed to in writing, software 
# distributed under the License is distributed on an "AS IS" BASIS, 
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. 
# See the License for the specific language governing permissions and 
# limitations under the License. 

# -*- coding: utf-8 -*- 
"""Miscellaneous training utility functions. 
"""

請問編碼定義是仍然「神奇」由Python解釋器接受？如果答案解釋了爲什麼它必須位於前兩行，並且指向解釋器代碼的指針非常棒，那將會很棒！

來源

2017-03-14 alvas

你報的措辭相當清楚的是，編碼必須在第一或第二線。 – BrenBarn

你試過了嗎？你會做什麼來發現這條編碼線是否正在做它打算做的事情？ –

我們如何才能知道編碼行是否正在做它打算做的事？在代碼中添加一些'utf8'字符？ – alvas

是的，在Python 2中，UTF-8編碼需要編碼標記，如果它超出第二行，並且文件中有任何非ASCII字符，則會發出如下錯誤：

File "encoded.py", line 5 
SyntaxError: Non-ASCII character '\xe1' in file encoded.py on line 5, but 
no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

如果文件只包含ASCII字符，即使UTF-8編碼標記晚於第2行，它仍然可以工作。ASCII是UTF-8的子集，基本上，後期編碼指令是被忽略了。（這似乎是你提到的具體utils.py的情況。）

許多解析器和其他文件處理器需要這樣神奇的命令是在文件的開始，因爲他們要被掃描，爲了考慮到正確解釋文件。把它們放在後面，效率不高，需要掃描整個文件才能找到一些「神奇」的特殊情況。

您將在Python 3中獲得一些餘地，該假設使用UTF-8編碼。儘管如果您的文件是以其他方式編碼的，您仍然希望將其包含在內。

來源

2017-03-14 04:46:42

該規範允許第一個兩行行允許unix系統上的shebang #!...。

不，第二行後不允許。

這裏是代碼的CPython的分詞位其檢查（和解析）編碼的cookie：https://github.com/python/cpython/blob/9e52c907b5511393ab7e44321e9521fe0967e34d/Parser/tokenizer.c#L613-L616

來源

2017-03-14 04:56:31

偉大的鏈接到源=） – alvas

Python中的編碼定義必須位於第1行/第2行嗎？

回答

相關問題