一、.proto文件的作用及定义
.proto文件是Google Protocol Buffers的核心组成部分。它是Google Protocol Buffers的语法定义文件,定义了数据的结构和格式。在编写.proto文件时,需要定义数据类型、字段名、字段序号等信息。这些定义信息可以被编译为对应语言的代码,支持C++、Python、Java、Node.js、Go等多种编程语言。 下面是一个简单的.proto文件定义:
syntax = "proto3";
message Person {
string name = 1;
int32 id = 2;
string email = 3;
}
在.proto文件中,人物被定义为一个message类型,包含三个字段:name、id和email。每个字段后面的数字表示唯一的标识号,在编译时用于序列化和反序列化数据。
二、.proto文件中的数据类型
.proto文件支持多种基本数据类型和自定义数据类型的定义。基本数据类型包括bool、int32、float、double等,自定义数据类型包括枚举和message。
1.枚举类型
枚举类型定义了一组常量,可以被其他message类型的字段使用。下面是一个简单的例子:
enum PhoneType {
MOBILE = 0;
HOME = 1;
WORK = 2;
}
message PhoneNumber {
string number = 1;
PhoneType type = 2;
}
在这个例子中,PhoneType定义了三个常量MOBILE、HOME和WORK,这些常量可以被其他message类型的字段使用。例如,PhoneNumber中的type字段就使用了PhoneType类型。
2.message类型
message类型可以嵌套定义,可以被其他message类型的字段使用。下面是一个简单的例子:
message Person {
string name = 1;
int32 id = 2;
repeated PhoneNumber phones = 3;
message PhoneNumber {
string number = 1;
PhoneType type = 2;
}
}
在这个例子中,message类型Person定义了三个字段:name、id和phones。其中phones是一个repeated类型的PhoneNumber。
三、.proto文件中的字段规则
在.proto文件中,一个字段有以下三个特性:类型、名称和字段序号。类型是必须的,名称是可选的,字段序号也是必须的。
1.字段类型
字段类型可以是任何.proto文件中定义的数据类型,也可以是其他message类型。
2.字段名称
字段名称是可选的,一般采用驼峰命名法。如果没有指定名称,则默认使用字段类型的小写字母作为名称。例如:
message Person {
string name = 1;
int32 id = 2;
string email = 3;
PhoneNumber phone_number = 4;
}
在这个例子中,email和phone_number分别是字段名称。
3.字段序号
字段序号是必须的,是.protobuf编译器为每个字段分配的唯一标识号,用于序列化和反序列化数据。字段序号必须是正整数,并且唯一,范围是1到2^29-1,不能为0或负数。如果定义了一个字段但没有指定序号,则会自动分配一个未使用过的序号。例如:
message Person {
string name = 1;
int32 id = 2;
string email = 3;
PhoneNumber phone_number = 4;
}
在这个例子中,name对应序号1,id对应序号2,email对应序号3,phone_number对应序号4。
四、.proto文件中的字段规则
字段规则定义了字段是单值、重复值还是可选值。
1.单值字段
单值字段表示只能有一个值。下面是一个例子:
message Person {
string name = 1;
int32 age = 2;
PhoneNumber phone = 3;
}
在这个例子中,name、age和phone都是单值字段。
2.重复值字段
重复值字段表示可以有多个值。下面是一个例子:
message Person {
string name = 1;
int32 age = 2;
repeated PhoneNumber phones = 3;
}
在这个例子中,phones是一个重复值字段。
3.可选值字段
可选值字段表示可能有一个,也可能没有值。下面是一个例子:
message Person {
string name = 1;
int32 age = 2;
optional string email = 3;
}
在这个例子中,email是一个可选值字段。
五、.proto文件的编译和使用
在.proto文件定义完成后,需要使用.protobuf编译器将其编译成对应语言的代码。使用方法如下:
protoc --proto_path=import_path --cpp_out=output_path file.proto
其中,import_path表示引用其他.proto文件的路径,output_path表示输出文件的路径,file.proto表示需要编译的.proto文件。 编译后会生成对应语言的代码文件,可以在代码中使用这些生成的代码文件定义数据类型、序列化和反序列化数据。下面是一个C++语言的例子:
#include "person.pb.h"
void main() {
// create a person instance
Person person;
person.set_name("Alice");
person.set_age(20);
// serialize person to a string
std::string str;
person.SerializeToString(&str);
// deserialize person from a string
Person new_person;
new_person.ParseFromString(str);
// print new_person info
std::cout << "name: " << new_person.name() << std::endl;
std::cout << "age: " << new_person.age() << std::endl;
}
六、总结
.proto文件是Google Protocol Buffers的核心组成部分,定义了数据的结构和格式。它支持多种基本数据类型和自定义数据类型的定义,可以嵌套定义。每个字段有类型、名称和字段序号三个特性,字段规则定义了字段是单值、重复值还是可选值。在.proto文件定义完成后,需要使用protobuf编译器将其编译成对应语言的代码,然后在代码中使用这些生成的代码文件定义数据类型、序列化和反序列化数据。