当前位置: 首页 > news >正文

网站后台视频装饰公司网站

网站后台视频,装饰公司网站,哈尔滨刚刚发生的大事件,制作图网店标序列化 Spark是基于JVM运行的进行,其序列化必然遵守Java的序列化规则。 序列化就是指将一个对象转化为二进制的byte流(注意,不是bit流),然后以文件的方式进行保存或通过网络传输,等待被反序列化读取出来。…

序列化

Spark是基于JVM运行的进行,其序列化必然遵守Java的序列化规则。

序列化就是指将一个对象转化为二进制的byte流(注意,不是bit流),然后以文件的方式进行保存或通过网络传输,等待被反序列化读取出来。序列化常被用于数据存取和通信过程中

spark dirver和executor间传递变量,默认需要进行序列化,才能传递。不序列话的成员,可以通过添加@transientlazy标识。

在spark中4个地方用到了序列化:

  1. 算子中用到了driver定义的外部变量的时候
  2. 将自定义的类型作为RDD的泛型类型,所有的自定义类型对象都会进行序列化
  3. 使用可序列化的持久化策略的时候。比如:MEMORY_ONLY_SER,spark会将RDD中每个分区都序列化成一个大的字节数组。
  4. shuffle的时候

序列化的方法:

  1. 类继承scala.Serializable
  2. 使用case class修饰类,case class默认实现了序列化

transient 和 lazy

scala 中@transient 是 java 的 transient 关键字的作用,是需要实现 Serilizable 接口,@transient
是类型修饰符,只能用来修饰字段。在对象序列化过程中, 被 transient 标记的变量不会被序列化

transient使用小结
1)一旦变量被transient修饰,变量将不再是对象持久化的一部分,该变量内容在序列化后无法获得访问。(spark中反序列化后还可以访问吗?可以,但读到的是null。加上lazy才能访问到具体的值。)

2)transient关键字只能修饰变量,而不能修饰方法和类。注意,本地变量是不能被transient关键字修饰的。变量如果是用户自定义类变量,则该类需要实现Serializable接口。

3)被transient关键字修饰的变量不再能被序列化,一个静态变量不管是否被transient修饰,均不能被序列化。

@transient修饰符的lazy val的区别:

lazy val是一个懒加载的不可变值,在第一次访问时才会被计算并缓存起来,且只计算一次。而@transient修饰符则可以用来标记某些字段在序列化时忽略。

示例1:

class A(val a: Int)def compute(rdd: RDD[Int]) = {// lazy val instance = {@transient lazy val instance = {println("in lazy object")new A(1)}val res = rdd.map(instance.a + _).count()println(res)
}compute(sc.makeRDD(1 to 100, 8))

如果在driver端不使用instance,那么@transient 不是必须的,序列化会发生,这时候序列化的instance 为null。
在executor处使用的时候,才真正创建instance。

如果在driver端先使用了instance,那么@transient 是必须的。

示例2

 test("序列化") {class A(a: String) extends Serializable {@transient val name = alazy val nanme2 = aval nanme3 = a@transient lazy val name4 = a}val sc = SparkSession.builder().enableHiveSupport().master("local").appName("JoinTest").getOrCreate()import sc.sqlContext.implicits._val a = new A("张三")val res = Seq("ddd").toDF("c1").map {x =>(a.name, a.nanme2, a.nanme3, a.name4)}.toDF("a", "b", "c", "d").show()}+----+----+----+----+
|   a|   b|   c|   d|
+----+----+----+----+
|null|张三|张三|张三|
+----+----+----+----+

可以看到,不序列化的,在executor端读到的是null。

参考

Spark 序列化和kryo序列化器详解
Scala的序列化,Serialization以及SerialVersionUID
Spark序列化
Java transient关键字使用小记
Scala 序列化带有或不带有@transient修饰符的lazy val的区别
Scala and the ‘@transient lazy val’ pattern
Difference when serializing a lazy val with or without @transient

http://www.cairui.net.cn/news/385/

相关文章:

  • 单位网站怎么制作国外 网站源码
  • 个人音乐网站免费建设旅游类网站设计模板下载
  • 沧州网站建设哪家专业中国网络经纪人
  • 青海网站开发品质好的句子
  • 网站怎么优化排名的方法wordpress 增加浮动条
  • 网站扫描怎么做个人动漫网站怎么做页面
  • 网站建设企业服务器网站建设公司价格差别
  • dw做网站实例wordpress主题不支持php7
  • 网站开发及后期维护短视频网站开发教程
  • UltraEdit做网站教程wordpress 登录保护
  • 哪个网站有做兼职的p2p视频网站开发
  • 建网站的模块龙岩网络公司
  • 新手做网站视频讲解网站专题制作 公司
  • 天津网站开发学校wordpress文章发布专题文章
  • 网站维护与建设合同新手做网站什么内容比较好
  • 炫酷特效网站网站制作费可以做业务宣传费
  • 做网站这么做网站安全认证多少钱
  • 公司 网站源码佛山建站软件
  • 电子商务中网站开发windows2008iis部署及发布网站
  • 游戏网站开发有限公司云速建站怎么样
  • 东莞优秀网站建设宝安中心地铁站时间表
  • 网站是由什么构成的做网站一定要注册公司吗
  • 网站模版一样 内容不同侵权吗朝阳区的互联网公司
  • 男女的做那个视频网站网站板块设计
  • 镇江网站制作咨询东莞南海网站制作
  • 付费网站怎么制作域名进行网站备案
  • 公司网站服务器租用温州网站定制哪家好
  • 快速让百度收录网站百度竞价排名名词解释
  • 上海网站工作室校园微网站建设方案ppt
  • 刘家窑网站建设公司公司网站首页的图片怎么做