一文读懂:数据安全及相关知识
数据安全是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。数据安全特点主要包括保密性、完整性、可用性。数据安全涉及的范围较广,涵盖容灾备份、加密、识别、标记、审计、隐私、脱敏、归档等。
《中华人民共和国数据安全法》自2021年9月1日起施行,对我国规范数据处理活动,保障数据安全,促进数据开发利用,保护个人、组织的合法权益,维护国家主权、安全和发展利益产生深远影响。
数据加密:指以密码技术为基础对数据进行编码转化的保护方法,是网络安全和数据安全领域的通用关键技术。在网络安全领域,加密技术一般用于静态文件加密、数据库加密以及数据传输加密等场景,解决的是信息系统的边界防护和传输通道安全问题。在数据安全领域,加密技术用于满足数据全生命周期的存储、应用、共享流通等各个环节的安全需求,并兼顾数据安全性与可用性的平衡。
数据脱敏:是指对某些敏感信息通过脱敏规则进行数据的变形,可以在不泄露敏感信息的前提下保留数据源的可用性。例如,在涉及客户安全数据或者一些商业性敏感数据的情况下,在合规前提下,对真实数据进行脱敏并供数给使用方,如个人的身份证号、手机号、卡号等敏感信息都需要脱敏。
数据脱敏技术分为静态脱敏和动态脱敏。静态脱敏技术可通过脱敏算法,将生产数据导出至目标存储介质,可以支持源库脱敏、跨库脱敏、数据库异构脱敏、数据库到文件脱敏、文件到数据库脱敏、文件到文件脱敏等场景。动态脱敏通过解析 SQL 语句匹配脱敏条件,通过改写或拦截 SQL 语句,返回脱敏后的数据到应用端,可以支持实时运维管理、应用访问等场景。
数据一致性:指用来描述同一信息主体在不同的数据集中信息属性是否相同,各实体、属性是否符合一致性约束关系。
数据可用性:数据可用性用来描述存储产品和服务的词汇,即产品和服务是用来确保在从正常到“崩溃”的环境中,当系统性能保持在一个必需的级别上时,数据必须是可用的。
数据可恢复性:指将系统数据恢复到故障发生时状态的能力,从系统故障或灾难中恢复数据的能力,不仅取决于是否有数据备份,还要求服务器上是否有预先制定的数据恢复计划。
数据分类分级:《网络数据安全管理条例(征求意见稿)》指出,国家建立数据分类分级保护制度。按照数据对国家安全、公共利益或者个人、组织合法权益的影响和重要程度,将数据分为一般数据、重要数据、核心数据,不同级别的数据采取不同的保护措施。国家对个人信息和重要数据进行重点保护,对核心数据实行严格保护。各地区、各部门应当按照国家数据分类分级要求,对本地区、本部门以及相关行业、领域的数据进行分类分级管理。如工业数据分类分级指南、政府数据分类分级指南等。
数据处理:通常指数据的收集、存储、分析、加工、传输、提供、共享、公开、交易等,目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
数据集成:是指把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。在组织架构中,由于开发部署时间、开发部门等不同,往往有多个异构的、运行在不同的软硬件平台上的信息系统同时运行。这些系统的数据源彼此独立、相互封闭,使得数据难以在系统间流通、共享和融合,形成了“数据孤岛”。数据集成通过特定的复制技术,可有效打破数据孤岛,实现数据交换、流通、共享。
数据归档:将不再经常使用的数据复制到一个单独的存储设备来进行长期保存的过程。数据归档是数据保护合规性的要求之一。
日志文件:用于记录系统操作事件的记录文件或文件集合,可分为事件日志和消息日志,具有处理历史数据、诊断问题的追踪以及理解系统的活动等重要作用。
数据清洗:是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。如果从字面上通俗地理解,数据清洗是把“脏”的“洗掉”,而脏数据(Dirty Read)是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。在数据仓库应用和数据挖掘应用中常用到数据清洗,行业应用如医保数据清洗等。
数据出境:通常指数据处理者向国外机构、企业或个人等提供本国或本地区的数据。规范数据出境活动,保护个人信息权益,可以有效地维护国家安全和社会公共利益,促进数据跨境安全、自由流动。2021年10月29日,国家互联网信息办公室向外发布《数据出境安全评估办法(征求意见稿)》,标志我国在数据出境方面。