成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一文讀懂全球化系統中的日期時間處理問題

原創 精選
開發 項目管理
日期時間的處理,一直是計算機系統中看似簡單,實則經常爆雷的問題。例如,每隔幾年,都會爆出的「千年蟲問題」的各種變種。

作者 | 吳天際

Too long; didn't read:

  1. 大多數應用中,只需要用“絕對時間 DateTime”一種技術實現即可
  2. 后端應統一用 UTC 時間(包括 DB 落盤、接口定義),不應當受用戶時區或服務器時區的影響
  3. 前端輸入、展示的時間,根據具體業務場景進行時區調整,以及精度調整
  4. 面對不帶時間的日期,要明確區分「紀念日」與「精度不高的絕對時間」兩種用途,大部分時候你看到的日期是后者,它也應當用“確定時區的 DateTime”來實現

1. 重要性

日期時間的處理,一直是計算機系統中看似簡單,實則經常爆雷的問題。

例如,每隔幾年,都會爆出的「千年蟲問題」的各種變種,通常因為系統在設計之初,沒有設計好日期時間的數據存儲方式,或者低估了產品設計的生命周期,導致最初選型的數據結構不夠用了。

千年蟲問題:

  • 年紀大的程序員,都知道千年蟲問題。在 2000 年之前,很多系統用 2 位數字表示年份,這樣 99 年是它能表達的最大數值。因此 1999 年之后的一年,在這些系統中是沒有定義的,甚至可能出現多種奇怪的情況,例如“1900”、“1:00”、“19:0”(為什么?感興趣的讀者可以自己推測)。

如果說,「千年蟲」是在時間維度上缺乏前瞻性的設計導致的,那么另一種缺乏前瞻性的問題,是空間維度的,即產品全球化、跨時區帶來的問題。

全球化的產品中,如果時間的處理沒有遵循統一的標準,會讓整個系統充斥著難以理解和維護的時間轉換。各種接口的對接文檔,都不得不明確說明「這個接口的時間是什么時區的?需要如何處理?」后端服務如果需要跨國部署在多個大洲的機房時,因為服務器的時區不同,需要做大量的改造。

遺憾的是,大多情況下,產品不會一開始就有「全球化」屬性。所以在一開始,產研團隊都不會重視全球化的設計問題,很容易留下缺乏前瞻性的設計問題。

通常情況下,我們都不鼓勵「過度設計」。然而,日期時間的設計,是最不怕「過度」的。這時因為,在技術上實現一個前瞻的時間日期方案,成本并不高;但如果一開始的設計不夠,后期的升級和數據遷移工作,卻是傷筋動骨的。

2. 如何表達時間和日期?

2.1 時間日期的傳遞:用字符串

在微服務之間,以及在前后端之間,建議用字符串傳遞日期時間。字符串清晰易讀,易于人工調試,帶來的開銷通常也完全可以接受。(帶大量時間數據的接口,建議考慮用 Unix Timestamp。)

如果用字符串,格式就不要自己發明了。有個非常明確的國際標準:ISO 8601(wikipedia: https://en.wikipedia.org/wiki/ISO_8601)

下面舉例是符合規范的常用格式:

  • 僅日期:2022-02-09
  • UTC 日期時間:2022-02-09T12:36:42Z
  • 特定時區的日期時間:2022-02-09T20:36:42+08:00
  • 精度更高的時間:2022-02-09T12:36:42.123456789Z

注意,MySQL 中使用的字符串格式(如 2022-02-09 12:36:42)并不符合規范,不建議使用。

2.2 時間日期的存儲:關注 MySQL 中的 DateTime

不同數據庫在時間日期相關對象的處理差異很大。這里單說 MySQL,因為坑不小。

MySQL 的 DateTime 數據在存儲時并不包含時區信息,因此,在讀取時也不會做任何時區的轉換。

同時,每個 MySQL 連接會話,都有「會話時區」的概念,但這個概念只影響 MySQL 的 NOW() 等有關當前時間的函數的行為,對數據中已經保存的 DateTime 沒有任何影響。

例如:

SET time_zone =  '+00:00' ;
UPDATE tab SET datetime_colume = '2020-01-01 00:00:00';
SET time_zone = '+08:00' ; -- 換一個會話時區
SELECT datetime_colume FROM tab;
-- 返回值仍然是 '2020-01-01 00:00:00',和寫入的數據一致,和會話時間無關

---------
SET time_zone = '+00:00' ;
SELECT NOW(); -- 假設返回 '2022-01-01 00:00:00'
UPDATE tab SET datetime_colume = NOW(); -- 存入的是 '2022-01-01 00:00:00'
SET time_zone = '+08:00' ; -- 換一個會話時區
SELECT NOW(); -- '2022-01-01 08:00:00' 根據時區變化了
SELECT datetime_colume FROM tab; -- '2022-01-01 00:00:00' 已經寫入的不會變

2.3 時間日期的計算:語言原生的 DateTime 類型

各語言一般都提供了原生的 DateTime 數據類型,以表達絕對的日期時間,并且都支持上面 ISO 8601 規范的解析和格式化。

處理相對時區時,各種語言通常都是使用操作系統的時區數據庫,來轉化為絕對時區。時區數據庫需要在聯網情況下,由操作系統負責定時更新。

2.4 萬能的 Unix Timestamp

Unix Timestamp 在存儲、計算、傳遞環節都可以使用,可謂萬能。它唯獨不適合表達紀念日日期。

它通過一個數值表示了一個絕對時間與 Unix Epoch 時間(定義為 1970-01-01T00:00:00Z)的差值秒數。Unix Timestamp 本身已經表達了絕對時間,并不需要時區信息。

使用 Unix Timestamp 時,應特別注意選用合適的數值類型,它會影響時間表示的范圍。稍不留神,你就可能種下一個新的千年蟲。

  • 用有符號int32,最多表示到 2038 年。MySQL 的 TIMESTAMP 類型也是它,一個千年蟲變種
  • 用有符號int64,并使用 9 位 10 進制定點小數位時,就是 Golang 的UnixNano(),可以表示 1678 年至 2262 年
  • 一般不會用浮點數表示,因為浮點數的精度不固定

3. 產品視角的日期時間設計

本著不重不漏的原則,我們可以按如下表格劃分產品中的所有日期時間對象:

指明時區,需根據用戶所在時區做轉換② 表示全球唯一確定時間點④ 表示全球可理解的重復性時間? 不存在的場景

下面逐一解釋這五種場景。

3.1 表示全球唯一確定時間點(表中的 ②)

信息量包含「年月日-時分秒-時區」。這樣,就可以完全確定歷史長河中的一個無歧義的時間點。這個時間點是完全客觀的,和訪問的用戶地理位置無關,和服務器的地理位置無關,和什么都無關。

產品表現上,通常會根據查看者所在的時區來重新調整時間的顯示。

用途舉例:

  • 單個事件發生的時間。如 2022 年冬奧會開幕式的時間:2022 年 2 月 4 日,20 點整,+0800 時區。一個英國人看電視轉播預告時,會看到開幕式的轉播時間是:2022 年 2 月 4 日中午 12 點整。這體現了根據查看者做時間的轉換。

3.2 表示本地的確定時間點(表中的 ①)

包含「年月日-時分秒」,因為沒有時區信息,所以它本身并不能確定一個精確的時間點,而是只在特定的情境下才有意義。

所謂特定的情境,是因為業務場景中蘊含了時區的信息,并且是大家公認的共識。因此,本質上它仍然表示了一個絕對時間。在產品表現上,因為對時區的共識,所以不需要根據查看者的時區來調整時間的展示。

用途舉例:

  • 在非國際化的產品中,明確知道用戶所在的時區,那么去掉時區是最簡單的處理方式,可以省去很多麻煩。
  • 對于時區有其他約定俗成的理解。例如:飛機的起飛降落時間,酒店的入住離店時間,一定是按照飛機起落地、酒店坐落地當地時區來表達的。在所有訂票網站上,都會按照這個規則顯示時間,不論訪問的用戶身處哪個時區。

3.3 表示重復性時間(表中的 ③ 和 ④)

和前兩類相比,去掉了「日期」這個信息,是為了描述重復性的日程。它可以是指明了時區的,也可以不指明時區,而基于人們對時區的共識去理解。

用途舉例:

  • 每周三 8:00+0800 開會,如果這可以是個跨國的會議,大家都能理解正確的時間。這時,產品表現上應該注意根據查看者來調整顯示。
  • 每周三 8:00 起飛的航班,航班起飛地的時區是蘊含的共識。產品表現中不必根據查看者的時區調整顯示。

3.4 紀念日日期(表中的 ⑤)

日期對象幾乎只有一個有意義的用途:表示紀念日/節日。它不會包含時區信息。

認為「日期」只能用于「紀念日」,有些絕對了。但我確實查閱了很多資料,也沒有看到任何非「紀念日」用途的日期。

例如:

  • 小吳的生日是 3 月 11 日,那么不管他在中國還是美國,都會在 3 月 11 日這一天過生日。
  • 每年 12 月 25 日是西方的圣誕節,各個國家都在 12 月 25 日這一天慶祝,雖然它們并不在同一個時區。

產品體現上,不需要根據時區調整日期的顯示。本質上,「紀念日」的邏輯,其實是人腦的不嚴謹導致的一種習慣,是不嚴謹、不客觀的習慣。不包含時區信息,就是為了滿足這種不嚴謹的習慣。

3.5 區分「紀念日日期」與「精度不高的絕對時間」

上面說過,日期對象不能包含時區。你可能會問,我需要表示“北京時間 2022 年 3 月 22 日”呢?答案是:這不是一個日期,而是一個「精度不高的絕對時間」。

很多情況下,當你想用日期時,其實很可能需要的是個「精度不高的絕對時間」。在飛書人力套件的業務中,經常會遇到這種場景。

例如,一個在美國的同學與一個在日本的同學,都在 2022 年 3 月 22 日這天從公司離職了,由同一個在北京的 HR 辦理離職事項。

可見,從我們用戶視角理解的「一個事件發生的日期」,其實是我們忽略了時間的精度。在產品全球化之前,我們通過一些默認的簡化,忽略了時間精度的問題(例如把時間都填成 00:00:00)。一旦面臨產品的全球化,就需要補齊時間、提高精度。

而補齊時間、提高精度的方式,需要根據具體的產品形態具體考慮、明確定義。

例如,在上述離職場景下,就需要按照這個公司對離職的定義來補充,可以是當地時間當天的 23:59:59,也可以是當天下班時間,如 17:00:00。

又比如,對于跨團隊的業務,例如一個同學的上級匯報線從一個美國 Leader 轉到一個日本 Leader,那么為了避免歧義,通常會約定一個確定的生效時區,如統一按照公司的總部所在地的時間來計算。

4. 日期時間的技術實現

4.1 確定時區的 DateTime

適用于上面的 ①②③④ 四種場景。

所有后端暴露的接口中的時間對象,全部以 UTC 時間表示。

同時,所有后端在存儲、計算、傳輸時間時,也統一使用 UTC 時間。由于 DB 存儲時間時,時區信息會被丟掉,因此應保證丟掉的時區,是大家明確約定清楚的無歧義的,即 UTC。這樣一來,DB 中的所有時間字段也都沒有歧義。

接口內部產生的時間,例如 CreatedAt、UpdatedAt時間,都應該轉換為 UTC 再落盤。如果直接使用了 MySQL 的NOW()函數,應確保 MySQL Session 的時區設置正確。

在前端或 BFF 負責處理用戶輸入的時間,以及展示給客戶看到的時間。包括兩個步驟:

處理“精度不高的時間”問題。 比如:員工異動的生效時間,用戶只設置到“天”的精度。那么如果不跨國,可以補全用戶會話時區的 00:00:00 為精確生效時間;如果跨國,那就看客戶如何定義,以及產品給客戶怎樣的靈活性:例如,可以以客戶公司總部所在地的時區的 00:00:00 為精確生效的時間。

時區轉換。 注意,這里不一定是使用用戶的會話時區來轉換。如前面介紹的飛機火車賓館的預定時間,就要以預定當地的時區來轉換。

上述兩點,是一定需要在產品設計中定義清晰的,切忌含糊不清。

不要較真兒抬杠的幾點:

  • 由于歷史原因,DB 里已經采用北京時間保存了,那么我們可以約定+0800 時區是我們所有后端接口的時間。只要用一個確定的絕對時區,就不會有歧義,不必非要時 UTC。
  • 也可以在后端接口的網關層處理時間轉換。不要較真那算不算 BFF,我們需要的是,時區轉換邏輯應嚴禁深入到后端的下層去。

4.2 不帶時區的 Date

適用于上面的 ⑤,即紀念日場景。

輸入或展示時,都不對日期做任何處理。日期對象直接保存在 DB 中。

只有真正的紀念日有必要用這種方式,應當非常謹慎。例如保存一個聯系人的生日時。

5. 關于時區的特殊處理

5.1 時區的不確定性

使用絕對的時差來表示時區,例如:“東 8 區”表示比世界協調時間(UTC)早 8 個小時的時區。這是個客觀的時區。

很多時候,我們關注的是一個城市或地區的時區。例如:Asia/Shanghai 表示中國時間;三字母的縮寫 EST 表示美國東部標準時間。注意,這些根據地理位置定義的時區的時差是會發生變化的,變化因素包括:可能受到當地政策的影響,或夏令時影響。

對于歷史的時間,地理時區是可以確定客觀時區的,因為沒有人會重新定義已經過去的時間。

對于未來的時間,地理時區并不能確定客觀時區。因此,如果一個未來的事件是按照非絕對時區約定的,那么它很可能變化。并且,我們的產品需要考慮到處理這種變化。

例如,中國員工發起一個“每天早 8 點”的跨國會議,那么在美國,由于夏令時的改變,冬天開會的時間和夏天是不一樣的。反之,美國員工發起的一個“每天早 8 點”的跨國會議,由于美國夏令時的變化,對中國員工的時間也是夏天和冬天不一樣的。

5.2 夏令時

某些國家在夏天,會把時間調快一小時(提前一小時)。這表現為,同一個地區,在冬天和夏天用不同的絕對時區。

這樣做,是因為夏天白天很長,調整后會在白天的更早的時段上班,從而下班后有更長的天亮的時間。注意,并不是把 10 點上班調整到 9 點上班,而是全社會重新定義了 10 點提前了一小時。

一個具體的例子,在美國:

  • 在 2021 年 3 月 14 日凌晨 1:59:59 后,下一秒就是凌晨 3:00:00。因此,美國的 2021 年 3 月 14 日凌晨 2:10:00 這個時間實際上不存在。為了兼容,根據 RFC5545,如果日程約在了這個不存在的時間,會認為是 3:10:00。
  • 在 2021 年 11 月 7 日凌晨 1:59:59 后,下一秒是凌晨 1:00:00。因此,美國的 2021 年 11 月 7 日凌晨 1:10:00 這個時間實際上會出現兩次。為了避免歧義,根據 RFC5545,看到這個時間時,會認為是靠前的時間點。因此,除非用別國的時區來約日程,否則,美國老板是不可能約你在重疊的第二個小時內開會的。

6. 閱讀更多及參考文獻

Wikipedia: ISO8601 - 用字符串表達各種時間對象的標準??https://en.wikipedia.org/wiki/ISO_8601??

RFC3339 - 互聯網上關于時間和日期實現的通用建議

??https://www.rfc-editor.org/rfc/rfc3339??

RFC5545 - iCalendar 互聯網日歷應用的規范

??https://datatracker.ietf.org/doc/html/rfc5545??

Stackoverflow: Daylight saving time and time zone best practices [closed] - 技術實現建議

https://stackoverflow.com/questions/2532729/daylight-saving-time-and-time-zone-best-practices

Stackoverflow: How to store repeating dates keeping in mind daylight saving time - 技術實現建議

https://medium.com/@vivekmadurai/how-to-deal-with-date-and-time-across-time-zones-39b1bd747f35

Medium: How to Deal with Date and Time across Time Zones - 技術實現建議

https://medium.com/@vivekmadurai/how-to-deal-with-date-and-time-across-time-zones-39b1bd747f35

Microsoft365: Behavior and format options of the Date and Time field - 微軟的時間和日期字段的文檔

https://docs.microsoft.com/en-us/dynamics365/customerengagement/on-premises/customize/behavior-format-date-time-field?view=op-9-1

Time Change 2021 in the United States - 美國 2021 年夏令時的調整方式

??https://www.timeanddate.com/time/change/usa?year=2021??

責任編輯:未麗燕 來源: 字節跳動技術團隊
相關推薦

2022-04-20 11:10:17

bias推薦系統debias

2014-02-19 09:51:29

iOS開發時間處理

2021-11-02 10:53:56

Linux機制CPU

2022-02-15 08:07:17

測試軟件開發

2017-06-02 15:32:09

大數據數據可視化

2021-03-30 18:05:10

數字化轉型計算機技術

2023-12-22 19:59:15

2021-08-04 16:06:45

DataOps智領云

2023-06-19 13:57:00

數據系統

2017-03-07 15:13:28

Scala偏函數函數

2016-10-25 14:35:05

分布式系統 存儲

2020-06-05 14:15:29

可視化數據集分析

2024-02-29 14:27:37

人工智能機器學習物聯網

2021-09-04 19:04:14

配置LogbackJava

2024-12-27 14:45:59

2018-09-28 14:06:25

前端緩存后端

2022-09-22 09:00:46

CSS單位

2022-11-06 21:14:02

數據驅動架構數據

2025-04-03 10:56:47

2023-11-27 17:35:48

ComponentWeb外層
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲人人| 日韩三级在线观看 | 日日干干夜夜 | 久久精品欧美一区二区三区不卡 | 精品综合久久 | 久久久久国产一区二区三区 | 91av免费版 | 四虎影院免费在线 | 黄色成人在线观看 | 日日草夜夜草 | 亚洲成人在线网 | 免费观看毛片 | 欧美日韩亚洲系列 | 日韩av成人| 亚洲+变态+欧美+另类+精品 | 天天操夜夜骑 | 99只有精品| 成人欧美一区二区三区视频xxx | 色综合久 | 超碰精品在线 | 久久亚洲一区 | 日韩视频 中文字幕 | 欧美日韩国产三级 | 日批日韩在线观看 | 国产aaaaav久久久一区二区 | 久久精品这里精品 | 亚洲国产乱码 | 亚洲成人免费在线 | 黄网站涩免费蜜桃网站 | 一区二区三区精品视频 | 亚洲成人精品 | 亚洲精品一区中文字幕 | 一区二区福利视频 | www日本在线 | 亚洲精品一区二区三区四区高清 | 午夜在线视频 | 中文字幕在线电影观看 | 国产a一区二区 | 日韩精品一区二区三区在线观看 | 久久综合久久久 | 精品在线一区二区三区 |