還在用Protocol Buffers？快來看看FlatBuffers!

作者：Hank Zheng 2024-06-03 00:00:06

FlatBuffers 非常適合需要高性能數據傳輸的應用程序。它在速度、數據大小和類型安全性方面提供了顯著優勢，盡管學習曲線稍陡，但其性能提升和資源節省是值得的。

如果你正在尋找一種快速、高效的跨平臺數據序列化庫，FlatBuffers 絕對是一個值得探索的選擇。由 Google 開發，FlatBuffers 旨在提供比其他序列化庫（例如 Protocol Buffers 和 JSON）更高性能的解決方案。今天，我們將深入了解 FlatBuffers 的工作原理，通過一些代碼示例展示如何使用它，并與其他常見的數據格式進行對比。

什么是 FlatBuffers？

FlatBuffers 是一個高效的、跨平臺的序列化庫，特別適用于游戲開發、網絡通信和嵌入式系統。它具有以下幾個主要特點：

零拷貝反序列化：無需解析或解包即可直接訪問數據。
向后兼容：可以在不破壞現有數據格式的情況下擴展結構。
多語言支持：支持多種編程語言，包括 C++, C#, C, Go, Java, JavaScript, PHP, Python, Rust, Swift 等。

安裝 FlatBuffers

在開始之前，我們需要安裝 FlatBuffers。以下是一些常見的安裝方法：

使用 Homebrew（macOS）

brew install flatbuffers

使用 apt-get（Ubuntu）

sudo apt-get install flatbuffers-compiler

從源碼編譯

git clone https://github.com/google/flatbuffers.git
cd flatbuffers
cmake -G "Unix Makefiles"
make
sudo make install

快速入門示例

讓我們通過一個簡單示例來看看 FlatBuffers 是如何工作的。

定義模型

首先，我們需要定義一個數據模型。假設我們有一個包含人物信息的模型：

// person.fbs
namespace MyGame.Sample;

table Person {
id:int;
name:string;
age:int;
email:string;
}

root_type Person;

保存上述定義為 person.fbs 文件。

編譯 FlatBuffers Schema

接下來，我們需要編譯這個 schema 文件。這將生成用于我們應用程序的代碼。

flatc --cpp person.fbs

使用 FlatBuffers 序列化和反序列化數據

現在我們已經生成了所需的代碼，可以在 C++ 中使用它來序列化和反序列化數據。以下是一個簡單的示例：

序列化

#include "person_generated.h"  // 自動生成的頭文件
#include "flatbuffers/flatbuffers.h"
#include <iostream>

int main() {
 flatbuffers::FlatBufferBuilder builder;

 auto name = builder.CreateString("John Doe");
 auto email = builder.CreateString("john.doe@example.com");

 MyGame::Sample::PersonBuilder personBuilder(builder);
 personBuilder.add_id(123);
 personBuilder.add_name(name);
 personBuilder.add_age(30);
 personBuilder.add_email(email);

 auto person = personBuilder.Finish();

 builder.Finish(person);

 // 獲取緩沖區指針和大小
 uint8_t* buf = builder.GetBufferPointer();
 int size = builder.GetSize();

 // 將緩沖區寫入文件或發送
 std::cout << "Serialized data size: " << size << " bytes\n";

 return 0;
}

反序列化

#include "person_generated.h"
#include <iostream>

int main() {
 // 假設 buf 和 size 是從文件或網絡讀取的序列化數據
 uint8_t* buf = ...;
 int size = ...;

 auto person = MyGame::Sample::GetPerson(buf);

 std::cout << "ID: " << person->id() << "\n";
 std::cout << "Name: " << person->name()->str() << "\n";
 std::cout << "Age: " << person->age() << "\n";
 std::cout << "Email: " << person->email()->str() << "\n";

 return 0;
}

FlatBuffers 與其他數據格式的對比

讓我們看看 FlatBuffers 和其他常見數據格式（如 JSON 和 Protocol Buffers）之間的主要差異。

FlatBuffers vs JSON

JSON 是一種文本格式，易于閱讀和調試，廣泛用于 web 應用程序。但它有幾個缺點：

性能：JSON 是文本格式，解析速度較慢。
大小：JSON 數據通常比二進制格式大。
類型安全：JSON 缺乏嚴格的類型約束。

FlatBuffers 的優勢在于：

速度：由于是二進制格式，解析和訪問數據非常快。
大小：二進制格式通常比 JSON 更小，占用更少的存儲空間和網絡帶寬。
類型安全：FlatBuffers 使用 schema 定義數據結構，提供了更強的類型安全性和數據驗證。

FlatBuffers vs Protocol Buffers

Protocol Buffers（Protobuf）同樣是由 Google 開發的序列化庫，也使用二進制格式。它與 FlatBuffers 有相似之處，但也有一些關鍵區別：

延遲：Protobuf 使用了“序列化-反序列化”的方式，這意味著數據在傳輸和存儲時需要進行編碼和解碼。而 FlatBuffers 的零拷貝反序列化允許直接訪問數據，減少了延遲。
動態性：Protobuf 的 schema 更加靈活，可以更容易地進行字段的增加或刪除。FlatBuffers 雖然也支持向后兼容，但在處理復雜的動態數據模型時可能不如 Protobuf 方便。
生態系統：Protobuf 可能擁有更成熟和廣泛的生態系統，特別是在 Google 內部的許多項目中都在使用。

性能對比

以下是一個簡單的性能對比，可以幫助你更好地理解這些格式之間的差異：

特性	JSON	Protocol Buffers	FlatBuffers
解析速度	慢	中等	快
數據大小	大	小	小
類型安全	弱	強	強
序列化/反序列化	需要	需要	不需要（零拷貝）
可讀性	高	低	低
向后兼容	較弱	較強	強

實踐示例：FlatBuffers vs JSON

為了更直觀地展示 FlatBuffers 的優勢，我們來對比一下使用 FlatBuffers 和 JSON 序列化與反序列化的代碼。

使用 JSON

序列化

#include <iostream>
#include <nlohmann/json.hpp>

using json = nlohmann::json;

int main() {
  json person;
  person["id"] = 123;
  person["name"] = "John Doe";
  person["age"] = 30;
  person["email"] = "john.doe@example.com";

  std::string serialized_data = person.dump();
  std::cout << "Serialized JSON data: " << serialized_data << "\n";

  return 0;
}

反序列化

#include <iostream>
#include <nlohmann/json.hpp>

using json = nlohmann::json;

int main() {
  std::string serialized_data = R"({"id":123,"name":"John Doe","age":30,"email":"john.doe@example.com"})";
  
  auto person = json::parse(serialized_data);
  std::cout << "ID: " << person["id"] << "\n";
  std::cout << "Name: " << person["name"] << "\n";
  std::cout << "Age: " << person["age"] << "\n";
  std::cout << "Email: " << person["email"] << "\n";

  return 0;
}

使用 FlatBuffers

上文已展示了如何在 C++ 中使用 FlatBuffers 進行序列化和反序列化。可以看到，雖然 JSON 的代碼更為直觀和易于調試，但 FlatBuffers 在性能和效率上具有顯著優勢，尤其是在處理大量數據或需要高頻率數據交換的場景中。

結論

如果你的項目需要頻繁的數據交換、高效的存儲或需要在多種編程語言之間傳遞數據，FlatBuffers 是一個值得考慮的選擇。希望這篇文章能幫助你更好地理解 FlatBuffers，并在你的項目中有效地應用它。

責任編輯：武曉燕來源：科學隨想錄

高性能數據傳輸應用程序

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

還在用Protocol Buffers？快來看看FlatBuffers!

什么是 FlatBuffers？

安裝 FlatBuffers

使用 Homebrew（macOS）

使用 apt-get（Ubuntu）

從源碼編譯

快速入門示例

定義模型

編譯 FlatBuffers Schema

使用 FlatBuffers 序列化和反序列化數據

序列化

反序列化

FlatBuffers 與其他數據格式的對比

FlatBuffers vs JSON

FlatBuffers vs Protocol Buffers

性能對比

實踐示例：FlatBuffers vs JSON

使用 JSON

序列化

反序列化

使用 FlatBuffers

結論