前言
大家好,今天开始给大家分享 — Dubbo 专题之 Dubbo 序列化。在前一个章节中我们介绍了 Dubbo 路由规则之标签路由,其实现原理为:如果消费端传递标签则和配置的动态规则和静态规则进行匹配,如果消费端未传递标签则使用服务提供端的本地配置的静态标签和动态配置标签进行匹配。同时我们也例举了常见的使用场景并且进行了源码解析来分析其实现原理。有的小伙伴可以想知道 Dubbo 中远程调用数据传输是通过哪些方式进行数据的序列化呢?那么这个章节我们一起来讨论在我们的 Dubbo 中有哪些序列化方式以及性能表现如何。下面就让我们快速开始吧!
1. 序列化简介
首先我们得明白什么是序列化和发序列化,举个简单的例子:当我们需要把一个数据对象写入到文件或者在网络中传输时,就要把数据对象进行转换为二进制格式进行数据传输这个过程就叫做序列化,反之如果一个远程数据或本地文件数据需要读取并解析为我们的对象时就叫做反序列化。在 Dubbo RPC 中,同时支持多种序列化方式:
-
Dubbo 序列化:阿里尚未开发成熟的高效 Java 序列化实现,阿里不建议在生产环境使用它
-
Hessian2 序列化:Hessian 是一种跨语言的高效二进制序列化方式。但这里实际不是原生的 Hessian2 序列化,而是阿里修改过的Hessian Lite,它是 Dubbo RPC 默认启用的序列化方式
-
Json 序列化:目前有两种实现,一种是采用的阿里的 Fastjson 库,另一种是采用 Dubbo中自己实现的简单 Json库,但其实现都不是特别成熟,而且 Json 这种文本序列化性能一般不如上面两种二进制序列化。
-
Java 序列化:主要是采用 JDK 自带的 Java 序列化实现,性能很不理想。
下图是当前2.7.x版本中支持的序列化方式:
Dubbo RPC 默认采用 Hessian2 序列化。但 Hessian 是一个比较老的序列化实现了,而且它是跨语言的,所以不是单独针对 Java 进行优化的。而 Dubbo RPC实际上完全是一种 Java to Java 的远程调用,其实没有必要采用跨语言的序列化方式。最近几年,各种新的高效序列化方式层出不穷,不断刷新序列化性能的上限,最典型的包括:
-
专门针对Java语言的:Kryo、FST等等
-
跨语言的:Protostuff、ProtoBuf、Thrift、Avro、MsgPack等等
其中,Kryo 是一种非常成熟的序列化实现,已经在Twitter、Groupon、Yahoo以及多个著名开源项目(如Hive、Storm)中广泛的使用。而FST是一种较新的序列化实现,目前还缺乏足够多的成熟使用案例。
2. 配置方式
下面我们主要通过 XML 方式进行配置介绍:
XML 方式
<dubbo:protocol name="dubbo" serialization="hession2"/>
这里使用serialization
来进行序列化方式配置。
3. 使用场景
根据前面的介绍我们大概理解了什么是序列化和反序列化,而序列化和反序列化在 Dubbo 中是必须的,那么 Dubbo 中提供了多种序列化方式我们应该使用哪一种序列化方式呢?我们先看一个来自官网的性能测试图:
从上图可以看出序列化方式:kyro、FST 性能最优。如果被序列化的类中不包含无参的构造函数,则在 Kryo 的序列化中,性能将会大打折扣,因为此时我们在底层将用 Java 的序列化来透明的取代 Kryo 序列化。所以,尽可能为每一个被序列化的类添加无参构造函数是一种最佳实践。另外,Kryo 和 FST 本来都不需要被序列化都类实现 Serializable
接口,但我们还是建议每个被序列化类都去实现它,因为这样可以保持和 Java 序列化以及 Dubbo 序列化的兼容性。
4. 示例演示
下面我以获取图书列表为例进行演示。项目结构如下:
我们主要看服务提供者端的dubbo-provider-xml.xml
的 XML 配置 :
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:dubbo="http://dubbo.apache.org/schema/dubbo"
xmlns="http://www.springframework.org/schema/beans"
xsi:schemaLocation="http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-4.3.xsd
http://dubbo.apache.org/schema/dubbo http://dubbo.apache.org/schema/dubbo/dubbo.xsd">
<!--自定序列化方式为:hession2 -->
<dubbo:protocol port="20880" serialization="hession2"/>
<dubbo:application name="demo-provider" metadata-type="remote"/>
<dubbo:registry address="zookeeper://127.0.0.1:2181"/>
<bean id="bookFacade" class="com.muke.dubbocourse.serializable.provider.BookFacadeImpl"/>
<!--暴露服务为Dubbo服务-->
<dubbo:service interface="com.muke.dubbocourse.common.api.BookFacade" ref="bookFacade" />
</beans>
上面的配置文件中指定序列化方式为hession2
。
5. 实现原理
下面我们通过源码的方式简单的分析它们的实现原理。下面我们直接到序列化的核心类org.apache.dubbo.remoting.transport.CodecSupport
我们看其中的反序列化方法deserialize
:
public static ObjectInput deserialize(URL url, InputStream is, byte proto) throws IOException {
//获取序列化对象
Serialization s = getSerialization(url, proto);
return s.deserialize(url, is);
}
我们继续看看getSerialization
方法:
public static Serialization getSerialization(URL url, Byte id) throws IOException {
//通过协议查找Serialization对象
Serialization serialization = getSerializationById(id);
String serializationName = url.getParameter(Constants.SERIALIZATION_KEY, Constants.DEFAULT_REMOTING_SERIALIZATION);
//...
return serialization;
}
上面查找通过 SPI 注册的所有序列化方式。我们接着deserialize
方法看,这里我们以 Java JDK 提供的序列化方式为例:
public ObjectInput deserialize(URL url, InputStream is) throws IOException {
return new JavaObjectInput(is);
}
可以看到这了通过 JDK 提供的 JavaObjectInput
对象包装数据流。 其他的序列化方式也是类似,小伙伴可以自行分析。
6. 小结
在本小节中我们主要学习了 Dubbo 序列化,同时我们也分析了 Dubbo 中序列化的实现原理。其底层的实现原理就是利用我们的序列化和反序列化框架对数据对象进行操作,同时我们也介绍了当前针对 Java 序列化性能比较高的两种方式,分别是:Kryo 和 FST。
本节课程的重点如下:
-
理解 Dubbo 序列化和反序列化
-
了解了序列化使用方式
-
了解序列化框架性能
-
了解序列化实现原理
作者
个人从事金融行业,就职过易极付、思建科技、某网约车平台等重庆一流技术团队,目前就职于某银行负责统一支付系统建设。自身对金融行业有强烈的爱好。同时也实践大数据、数据存储、自动化集成和部署、分布式微服务、响应式编程、人工智能等领域。同时也热衷于技术分享创立公众号和博客站点对知识体系进行分享。