然而,在(即 CA 功能的广度)进行选择和评估之前,值得检查是否可以在所有情况下使用内容分析,是否可以通过内容过滤可靠地控制由组织业务逻辑生成的数据传输和分发的所有场景?
让我们从一个简单的例子开始:一家以商业广告形式创作知识产权的公司的安全策略不允许传输视频格式的文件。是否可以使用关键字分析或数字指纹数据库检查?当然不是——视频格式根本没有适合分析的文本数据格式,也没有选择适合验证的片段的能力。这意味着对于这家公司来说,数字指纹之类的内容分析根本毫无用处。对于其他形式的数据,尤其是设计文档,也可以给出类似的例子。
因此,DLP 解决方案的“智能”并不总是选择系统的主要原因和优势。内容分析的本质,在现代普遍接受的理解中,是对数据的文本内容的检测和处理。 DLP系统的主要任务是首先从通过网络传输、存储在外部存 伊朗电报数据 储设备或打印的文件和文档的数据流中提取适合分析的文本内容,然后对选定的文本内容应用指定的过滤规则,并根据结果对传输或存储的数据执行必要的操作。
让我们看另一个更常见的例子:对以 MS Word 格式保存的文档的分析。
尝试分析该文档的二进制内容(或者更准确地说,MS Word 格式的容器)时,没有适用的内容过滤方法。除非首先从该容器中提取文本内容,否则形态分析、正则表达式模式检查甚至指纹分析都不会产生任何结果。除非先将文档“拆解”为其“组成部分”——实际的图形元素、文本内容、文档属性和其他嵌入对象,否则嵌入在 Word 容器中的图形图像的分析也将是不可能的。
由于这种格式的流行和普及,分析 MS Word 文档的任务可归类为经典任务,因此从 Word 容器中提取对象几乎是开发人员在创建内容过滤机制时编写的第一件事。 AutoCAD 和类似系统的设计文档等格式是更为复杂的情况。但是,我们假设 DLP 系统不仅能成功处理正在考虑的示例,还能处理许多其他文件和文档格式,并从中提取适合系统“智能部分”分析的文本内容。