成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一日一技:你怎么總是搞不清反斜杠的問題

開發 后端
大家在開發Python的過程中,一定會遇到很多反斜杠的問題,很多人被反斜杠的數量搞得頭大。

[[388533]]

大家在開發Python的過程中,一定會遇到很多反斜杠的問題,很多人被反斜杠的數量搞得頭大。

首先我們寫一段非常簡單的Python代碼,它的作用是把一個字段先轉換為JSON格式的字符串,然后把這個字符串再轉換為JSON格式的字符串:

  1. import json 
  2.  
  3. info = {'name''kingname''address''杭州''salary': 99999} 
  4. info_json = json.dumps(info) 
  5.  
  6. # 第一次轉換以后,打印出來 
  7. print(info_json) 
  8.  
  9. info_json_json = json.dumps(info_json) 
  10.  
  11. # 第二次轉換以后,再打印出來 
  12. print(info_json_json) 

它的運行效果如下圖所示。

第一次,字典轉成JSON格式的字符串,只有中文杭州變成了Unicode編碼\u676d\u5dde,其余地方沒有出現反斜杠。

在Python里面,反斜杠不能單獨出現,這里\u676d\u5dde中的兩根反斜杠,實際上應該是\u。表示這兩個編碼是Unicode編碼。

接下來,把第一次生成的JSON字符串:{"name": "kingname", "address": "\u676d\u5dde", "salary": 99999}再一次轉成JSON格式的字符串,這一次變成了:

  1. "{\"name\": \"kingname\", \"address\": \"\\u676d\\u5dde\", \"salary\": 99999}" 

為什么突然出現了這么多反斜杠?這是因為,JSON格式的字符串本身是使用雙引號來表示字符串的。如果原來的字符串里面本身就有雙引號,那就會導致混淆。此時,Python需要把原來字符串的雙引號變成普通的字符,失去雙引號的作用。因此使用\"讓雙引號變成普通的字符。

這就相當于在Python中,可以這樣定義一個包含雙引號的字符串:

  1. >>> a = "跟我說:\"你好\"" 
  2. >>> print(a) 
  3. 跟我說:"你好" 

這里,你好兩側的雙引號都加上了反斜杠,讓它成為普通的字符,防止它們提前與最外層的雙引號配對。

如果不加反斜杠,就會導致字符串里面的雙引號提前與外層的雙引號配對,引起語法錯誤:

  1. >>> b = "跟我說:"你好"" 
  2.   File "<stdin>", line 1 
  3.     b = "跟我說:"你好"" 
  4.                ^ 
  5. SyntaxError: invalid syntax 

這里,"跟我說:"成為了一個字符串,末尾的""成為了一個空字符串。那么中間的你好就變成了一個沒有定義的變量。而Python里面,是不存在字符串未定義的變量字符串這種寫法的,所以會報語法錯誤。

而JSON格式的字符串,本質上也是字符串,所以自然而然也需要遵循這樣的規則。因此,字符串原來自帶的雙引號左側就被加上了反斜杠。

那么,原來的\u676d\u5dde為什么變成了\\u676d\\u5dde?

這是因為,當第二次執行json.dumps的時候,傳入的參數是一個JSON格式的字符串,本質就是字符串。而一個字符串里面如果自帶反斜杠,那么JSON在對他再次轉換的時候,需要標記這是一個普通的字符串形式的反斜杠,不是一個有特殊意義的反斜杠,所以使用\\表示一個普通的反斜杠。

好了,那么你可以猜一下,如果把info_json_json再json.dumps一下會怎么樣?

會變成:

  1. "\"{\\\"name\\\": \\\"kingname\\\", \\\"address\\\": \\\"\\\\u676d\\\\u5dde\\\", \\\"salary\\\": 99999}\"" 

為什么出現了三個反斜杠連用和四個反斜杠連用的問題?

實際上非常簡單,當你對info_json_json執行json.dumps的時候,Python是怎么轉換的?

我們來看:

  1. "{\"name\": \"kingname\", \"address\": \"\\u676d\\u5dde\", \"salary\": 99999}" 

對字符串執行json.dumps的時候,記住一個關鍵方法——從左到右,一個字符一個字符的轉換。

  1. 1. 第一個字符是雙引號,所以變成\" 
  2. 2. 第二個字符是{,不是特殊符號,保留 
  3. 3. 第三個字符是\,把它變成\\ 
  4. 4. 第四個字符是",把它變成\" 
  5. 5. …… 

全部執行完成了,由于這次轉換是把一個字符串轉換為JSON格式的字符串,所以最外側加上雙引號。

于是就得到了:

  1. "\"{\\\"name\\\": \\\"kingname\\\", \\\"address\\\": \\\"\\\\u676d\\\\u5dde\\\", \\\"salary\\\": 99999}\"" 

我們在爬蟲開發過程中,可能會遇到上面這種經過多次JSON轉換后的字符串,此時,千萬不要輕易使用字符串的.replace方法把多個反斜杠替換為空或者把兩個反斜杠替換為一個反斜杠。那樣做只會導致你的數據更難解析。

正確的做法應該是嘗試對數據一層一層使用json.loads,把它一層一層還原,還原到最初的{'name': 'kingname', 'address': '杭州', 'salary': 99999}這種簡單形式。

好了,今天的介紹就到這里,最后留一個思考題:

還是上面的代碼,現在把PyCharm的調試模式打開,然后數一數info_json和info_json_json里面反斜杠的個數,如下圖所示:

為什么在info_json里面,出現了\\u676d\\u5dde,為什么在info_json_json里面雙引號前是兩根反斜杠,而\"\\u676d\\u5dde\"竟然變成了\\"\\\\u676d\\\\u5dde。

本文轉載自微信公眾號「未聞Code」,可以通過以下二維碼關注。轉載本文請聯系未聞Code公眾號。

 

責任編輯:武曉燕 來源: 未聞Code
相關推薦

2021-04-27 22:15:02

Selenium瀏覽器爬蟲

2021-06-07 17:51:27

反斜杠引號Python

2021-10-15 21:08:31

PandasExcel對象

2021-10-20 20:02:47

字符變量函數

2025-05-28 03:15:00

Scrapy數據sleep

2021-04-12 21:19:01

PythonMakefile項目

2022-06-28 09:31:44

LinuxmacOS系統

2024-11-13 09:18:09

2021-04-05 14:47:55

Python多線程事件監控

2022-03-12 20:38:14

網頁Python測試

2021-07-08 21:49:13

前端后端Cookies

2021-05-10 19:07:18

冗余代碼Python

2023-10-28 12:14:35

爬蟲JavaScriptObject

2021-09-13 20:38:47

Python鏈式調用

2021-03-12 21:19:15

Python鏈式調用

2024-07-30 08:16:18

Python代碼工具

2021-04-19 23:29:44

MakefilemacOSLinux

2024-07-30 08:11:16

2024-11-11 00:38:13

Mypy靜態類型

2021-10-03 20:08:29

HTTP2Scrapy
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天天操天天射天天舔 | 久久99精品久久久久久国产越南 | 成人福利电影 | 日韩中文字幕一区 | 国产精品精品视频一区二区三区 | 欧美日韩精品中文字幕 | 亚洲综合一区二区三区 | 中文字幕在线观看www | 老外几下就让我高潮了 | 国产美女久久久 | 高清国产午夜精品久久久久久 | 欧美久 | 久久久久久久一区二区 | 成年人免费在线视频 | 99成人精品 | 欧美在线视频a | 日韩视频在线观看 | 国产精品成人久久久久 | 成人福利在线视频 | 国产日韩久久久久69影院 | 人妖一区| 美女视频一区二区 | 一区二区三区四区av | 欧美日韩国产在线 | 免费黄色的网站 | 欧美精三区欧美精三区 | 国产一区2区 | 欧美影院久久 | 91久久视频 | 日韩精品激情 | 久久久免费 | 免费观看成人鲁鲁鲁鲁鲁视频 | 毛片一区二区 | 99re在线视频免费观看 | 久久久久久黄 | 精区3d动漫一品二品精区 | 久久久精品一区二区三区四季av | 91久久精品国产91久久 | 91tv在线观看 | 国产999精品久久久久久 | 国产视频精品免费 |