編程語言中的一些邪惡咒語,千萬不要用
自從我看了 Gary Bernhardt 備受推崇的一個視頻 Wat,就驚異于特定編程語言的怪異行為。相較于其他編程語言來說,某些編程語言的行為更出乎意料。例如,有一整本書是針對 Java 的邊緣案例和古怪情況。同樣,差不多只要 200 美元你就可以閱讀 C++ 規范說明了。
下面是我最喜歡的、驚奇的、滑稽的并仍然有效的咒語集合。一般來講,利用這些古怪的行為被視為壞事,因為代碼不應該出乎意料。值得慶幸的是,如果你嘗試以下大多數蠢事,有很多代碼校檢工具(linters)已經準備好嘲笑你了。說了這么多,知識就是力量,那就開始吧。
Python 2 中對 True 邪惡的重賦值
- >>> True = False
- >>> True
- False
謝天謝地,這在 Python 3 中會導致 SyntaxError,因為 True、False 和 None 現在是保留字。它仍遠沒有 C++ 的那個惡作劇那么邪惡,把 #define true false 悄悄寫進同事的開發機器的標準頭文件中。
Java 和 Python 中的詭異行為實例
對 Java 新手程序員來說,== 的語義往往使人困惑。甚至在微不足道的情境下,這個操作符的前后矛盾也會使情況變得復雜,即使性能效益是值得的。
- Integer a = 100;
- Integer b = 100;
- System.out.print(a == b); // prints true
- Integer c = 200;
- Integer d = 200;
- System.out.print(c == d); // prints false
JVM 會對區間 [-128, 127] 內的值使用相同的引用。更奇怪的是,Python 中也有同樣的行為。
- >>> x = 256
- >>> y = 256
- >>> x is y
- True
- >>> x = 257
- >>> y = 257
- >>> x is y
- False
目前為止,還沒有特別出乎意料的。
- >>> x = -5
- >>> y = -5
- >>> x is y
- True
- >>> x = -6
- >>> y = -6
- >>> x is y
- False
似乎 python 解釋器使用相同例子的下限是……-5。區間 [-5, 256] 內的整數有同樣的 ID。不知怎地,這變得更奇怪了。
- >>> x = -10
- >>> y = -10
- >>> x is y
- False
- >>> x, y = [-10, -10]
- >>> x is y
- True
似乎使用解構賦值改變了這里的規則。我不確定為什么是這樣。事實上,我在 Stack Overflow 上提了一個問題來試著理解它。我的猜測是,一個列表中的重復值指向同一個對象,用以節省內存。
C 中顛倒的下標符號
顛倒的下標符號,會使所有開發者都頭疼。
- int x[1] = { 0xdeadbeef };
- printf("%xn", 0[x]); // prints deadbeef
這行得通的原因是,array[index] 確實只是 *(array + index) 的語法糖。由于加法的交換性,我們可以交換數組和索引,并得到同樣的結果。
C 中的“倒數”操作符
–> 操作符***次被看到時,似乎是句法錯誤。在你意識到它可編譯時,它看起來像未被記載的語言特性。幸運的是,兩者都不是。
- for (x = 3; x --> 0;) {
- printf("%d ", x); // prints 2 1 0
- }
–> “操作符”實際上是兩個操作符,在這個背景下解析為 (x–) > 0。眾所周知,大量使用會導致困惑,這完全是邪惡的。
C 中的 sizeof 操作符
sizeof 操作符是一個編譯時操作符,這給予了它有趣的屬性。
- int x = 0;
- sizeof(x += 1);
- if (x == 0) {
- printf("wtf?"); // this will be printed
- }
由于 sizeof 操作符的例子是對編譯時進行評估的,(x += 1) 不會運行。另一件趣事是,研究表明 printf(“wtf?”) 是最普遍的沒有被 push 的代碼。
Lua、Smalltalk、MATLAB 及其他語言,索引由 1 開始
/r/programminghumor 一直在用“indexing starts at 1”表情包取樂。令人震驚的是,有大量編程語言使用從 1 開始的數組索引。可以在這里找到更全面的清單。
Ruby 中的 0 被判為 true
… and only Ruby. *
在 Ruby 中是這樣。*
- if 0 then print 'thanks, ruby' end # prints thanks, ruby
* edit: It was pointed out on reddit that this is true for Lua, Lisp, and Erlang as well.
* 修訂:Reddit 上有人指出,這在 Lua、Lisp 和 Erlang 中也成立。
Trigraph, Digraphs, and Tokens in C
C 中的 Trigraph、Digraph 和 Token
由于歷史原因,C 語言中的非字母符號有替代品。

- if (true and true) { // same as if (true && true)
- printf("thanks, c");
- }
有些外國設備,例如 IBM 3270,在 C/C++ 中不提供某些常用符號,所以提供了 digraph、trigraph 和 token 來避免排斥特定字符集。