继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

应用系统数据删除与恢复

慕森卡
关注TA
已关注
手记 402
粉丝 120
获赞 527

1. 重要数据假删除的基本实现

业务数据删除功能,对于一些重要数据采用“假删除”的实现方式,即数据并非从数据库中delete,而是标识该记录为已删除,数据显示时过滤掉该部分数据;对于非重要数据采用直接删除的实现方式。

1.1. 假删除的实现

数据库表增加deleted字段,默认值为0表示数据未被删除,删除操作时,将deleted字段更新为1表示数据已被删除,查询数据时使用deleted=0过滤。

1.2. 删除数据的恢复

假删除的目的是防止重要数据被误删除,一旦被误删除后,则需要数据恢复的功能。
系统添加“删除数据恢复”功能,查询deleted=1的数据,执行恢复操作时,将deleted更新为0。

2. 假删除的权限控制

2.1. 假删除功能的目的

对于重要数据的保护,一是防止误删除,二是防止恶意删除,根据不同的业务场景设定,可采用不同的功能实现。

2.2. 数据恢复功能的授权

数据被删除后,恢复功能应“谁删除的数据谁有权恢复”,没必要交给管理员(不少系统重要操作都交给管理员处理,例如用户账户锁定等),管理员可以授权处理所有的数据。
每条数据都应该拥有其“所有者(OWNER)”,应设计为所有者有权删除其所拥有的数据,也有权恢复其所拥有的数据,即授权根据数据的所有者操作。
所有者并非是系统的用户,可以泛化为该数据的所有者组织机构,由于组织机构存在树形层级的特点,因此可设计为上级有权管理下级数据(根据业务场景设定)。

2.3. 彻底删除功能的授权

针对于“防止误删除”,可以在“删除数据恢复”功能中添加“彻底删除”的功能,该功能将数据从DB中delete掉。
针对于“防止恶意删除”,则不允许一般业务用户“彻底删除”数据。

3. 唯一性约束的处理

上述deleted标记控制实现的逻辑删除,简单、通用的实现了所有业务数据需求,但对于有唯一性约束的数据则暴露出了问题。
假设有人员数据信息,包含“用户编码(UserCode)”唯一性约束,当添加了用户U-001并标记逻辑删除后,再次添加用户时U-001将引发唯一性约束冲突,但用户UI上却没有U-001的记录,因此造成了用户的困惑,解决该问题有多种方式,各有优缺点,可根据业务场景来选择。

3.1. 全局唯一性约束处理

例如常见的网站用户注册,当输入的用户名已存在时,无论该用户是否已弃用该账户,网站都不会删除该账户,并禁止新用户使用该用户名,以备原用户再次启用该账户,或其他需求。

3.2. 清理或解除原数据后启用

同样是在用户注册上,不少网站使用手机号绑定注册信息,但手机号可能被注销,并分配给新用户。假设用户A使用xxx手机号注册了账号,然后A用户xxx手机号已注销,并被分配被B用户(手机号码资源有限,目前移动运营商都是将号码重复利用的),当B用户在该网站上注册时,使用号码短信验证通过后,即可解除xxx手机号码与A用户注册账号的绑定关系。
不少网站存在用户注册后账号、密码忘记的情况,因此一般使用手机号来绑定验证,但不应仅使用手机号。在仅使用手机号的情况下,上述场景只好将A用户的xxx手机号注册信息清除掉了。
不少应用在手机号外添加身份证号码等其他隐私数据的验证,并通过人工协助的方式处理,例如A用户希望恢复xxx手机号注册的信息时(xxx手机号已被注销并分配给B用户),可通过身份证号码、姓名验证后将该部分信息重置到A用户的yyy手机号账号上。

3.3. 管理权交给用户

当用户输入编码U-001,添加时出现冲突,冲突数据可能位于“删除区(标记deleted=1的数据)” ,因此可针对性的提醒用户“该用户编码已存在,请使用其他编码”(针对非删除区数据冲突)、“该用户编码已存在于删除区,是否要恢复?”(针对删除区数据冲突),当用户选择恢复时,将删除的数据deleted标志更新为0,针对业务需求可继续使用历史数据或初始化。
此方式处理简单,但适用于的业务场景较少。仅适用于系统中要维护的数据在现实中有唯一性的现实编码,例如人员管理中的身份证信息、仪器管理中的资产编号,这些信息在现实中是有唯一编码的,假设输入资产编号为E-001的仪器资产后,删除了该记录,再次录入E-001的时候,原E-001的数据很可能是由于误删除操作造成的,此时提醒用户继续维护即可,系统中不应出现两条E-001的数据,不论是否在删除区。

3.4. 唯一性约束添加删除标记

例如用户管理中删除了用户U-001,新增用户时,再次使用U-001将被允许,因为约束条件设置为deleted=0不存在U-001即可,该操作需要对所有管理对象的所有唯一性约束做处理。
假设再次将U-001删除后,则deleted=1的数据存在两条U-001记录,即针对删除区不做唯一性约束校验。
数据恢复时,继续使用原编码U-001则将遇到唯一性约束冲突,此时可提醒用户U-001已存在,是否覆盖或是否恢复为新记录或放弃操作,类似于Windows垃圾桶恢复操作或者Copy文件操作,提示“覆盖、重命名、取消”三操作。



import org.apache.spark.{SparkConf, SparkContext}/**  * Created by legotime on 2016/4/21.  */object WorkSheet {  def main(args: Array[String]) {    val conf = new SparkConf().setAppName("RDD的基本理解").setMaster("local")    val sc = new SparkContext(conf)    // Load  the data    val data1 = sc.textFile("E:\\SparkCore2\\data\\mllib\\ridge-data\\lpsa.data")    println("data1的类型"+data1)    //MapPartitionsRDD[1] at textFile at WorkSheet.scala:15    println("data1的partittion:" + data1.partitions.size)//1    println("data1的length:" +data1.collect.length)//67    println("data1的count:" +data1.count())//67    println("缓存:"+data1.cache())    //MapPartitionsRDD[1] at textFile at WorkSheet.scala:15    println("data1的name:"+data1.name)    //data1的name:null    println("data1的id:"+data1.id)    //data1的id:1    data1.partitions.foreach { partition =>       println("index:" + partition.index + "  hasCode:" + partition.hashCode())
    }//index:0  hasCode:1681    println("data1 father dependency: " + data1.dependencies)    //data1 father dependency: List(org.apache.spark.OneToOneDependency@36480b2d)    data1.dependencies.foreach { dep =>           println("dependency type:" + dep.getClass)             println("dependency RDD:" + dep.rdd)             println("dependency partitions:" + dep.rdd.partitions)             println("dependency partitions size:" + dep.rdd.partitions.length)
           }    //dependency type:class org.apache.spark.OneToOneDependency    //dependency RDD:E:\SparkCore2\data\mllib\ridge-data\lpsa.data HadoopRDD[0] at textFile at WorkSheet.scala:15    //dependency partitions:[Lorg.apache.spark.Partition;@3c3c4a71    //dependency partitions size:1    //    val data1Map = data1.map(_+1)    //经过一次转换    data1Map.dependencies.foreach { dep =>      println("dependency type:" + dep.getClass)      println("dependency RDD:" + dep.rdd)      println("dependency partitions:" + dep.rdd.partitions)      println("dependency partitions size:" + dep.rdd.partitions.length)
    }    //dependency type:class org.apache.spark.OneToOneDependency    //dependency RDD:MapPartitionsRDD[1] at textFile at WorkSheet.scala:15    //dependency partitions:[Lorg.www.120xh.cn  apache.spark.Partition;@3c3c4a71    //dependency www.hjha178.com partitions size:1    println("data1Map father dependency: " + data1Map.dependencies)    //data1Map father www.boshenyl.cn dependency: List(org.apache.spark.OneToOneDependency@b887730)    data1Map.dependencies.foreach(x =>      println("data1Map的依赖:"+x)
    )    //data1Map的依赖:org.apache.spark.OneToOneDependency@b887730    val data2 = sc.textFile("E:\\SparkCore2\\data\\mllib\\ridge-data\\lpsa.data",2)    println("data2的类型"+data2)    //data2的类型MapPartitionsRDD[4] at textFile at WorkSheet.scala:45    println("data2的partittion:" + data2.partitions.size)//2    println("data2的length:" +data2.collect.length)//67    println("data2的count:" +data2.count())//67    println("缓存:"+data2.cache())    //缓存:MapPartitionsRDD[4] at textFile at WorkSheet.scala:45    println("data2的name:"+data2.name)    //data2的name:null    data2.setName("huhu!!")    println("data2的new name:"+data2.name)    //data2的new name:huhu!!    println("data2的id:"+data2.id)    //data2的id:4    data2.partitions.foreach { partition =>      println("index:" + partition.index + "  hasCode:" + partition.hashCode())
    }    //index:0  hasCode:1804    //index:1  hasCode:1805    println(data2.first())    //-0.4307829,-1.63735562648104 -2.00621178480549 -1.86242597251066 -1.02470580167082 -0.522940888712441 -0.863171185425945 -1.04215728919298 -0.864466507337306    //println(data2.take(0))//java.lang.String;@5f2bd6d9    println(data2.take(2))

    sc.stop()
  }


3.5. 唯一性编码特殊处理

通过唯一性编码特殊处理,可避免影响数据添加的实现,即删除数据U-001时,将该记录标记为deleted=1并将UserCode更新为U-001@deleted,@deleted根据业务场景选用不会出现在正常业务编码中的标记。此种处理方式,添加数据的逻辑可保持不变,删除区数据的处理同前方案,在恢复数据时,将U-001@deleted恢复为U-001并校验U-001是否已存在。

4. 数据的级联关系

4.1. 被删除数据引用了其他数据作为子对象

例如删除用户U-001,该数据配置了其工作经历W-001、W-002,系统设计时,Users和UserWorks表应该使用UserID做主外键约束,而不应该使用UserCode,当删除U-001时,W-001、W-002的数据将不能够通过用户级联查询到。

4.2. 被删除数据作为子对象被其他数据引用

例如删除UserWorks的W-001记录,逻辑删除该记录即可。

4.3. 数据相互引用,对象间的关联关系

当删除U-001时,W-001、W-002的数据将不能够通过用户级联查询到,但从其他维度查询数据则会出现脏数据。例如UserWorks中人员工作经历记录了人员Users数据的UserID和工作单位Companies数据的CompID,当查询某单位的员工时将会查询到该条记录。
对于子信息从属于被删除数据的情况该处理没有问题,而对于子信息为被删除数据与其他数据的关联数据的情况,则需要做额外处理。

4.3.1. 级联逻辑删除

通过查询被删除数据引用的其他数据,并将其标记为deleted=1,可级联删除掉子信息,避免脏数据。此方式的缺点是增加子对象类别时,需要更改父对象的删除实现,例如用户下新增用户教育经历的数据UserEducations,则在标记U-001为Deleted=1的时候,需要标记W-001、E-001的Deleted=1。

4.3.2. 使用Code建立主外键联系并使用数据库级联更新

如果UserWorks使用UserCode关联Users数据,并在DB中设置触发器,则Users的U-001删除时(更新为U-001@deleted),UserWorks记录也将更新。
此方式一是使用Code做主外键关联,二是适用于删除时通过更新Code实现的场景。

5. 其他解决方案

5.1. 状态控制

使用状态变更来代替删除操作。例如人员状态有“在用”、“停用”等状态,数据不允许删除,也不提供假删除的功能,仅将用户状态切换即可。在用户管理处,可查询不同状态的用户,不再提供删除区数据的概念。
现实中,一些数据删除的场景,对应的是数据的状态更改,例如员工离职、商品下架等。

5.2. 数据审核控制

但在系统操作时,难免有错误添加的情况,例如新增员工时员工编号填写错误,系统设计为编号不允许修改,因此只好删除该错误数据。
此种情况,可通过数据审核来控制,即填写人新增的数据可以删除,但当数据审核后,则不允许删除,仅可做状态变更,例如更改为废弃状态。
现实中,当我们在银行柜台填写一份申请单时,当填写错误时,我们重新填写一张,此时即为删除操作,(如果银行申请单允许涂改的话,那么该操作即为系统中的编号修改操作);当申请单递交后,如果我们放弃该申请操作,则系统中将该记录标记为“终止”而非delete。

原文出处

打开App,阅读手记
1人推荐
发表评论
随时随地看视频慕课网APP