DDOS防御专家-提供超强DDoS高防/CC防护/大流量清洗服务!
当前位置:主页 > WEB安全 > 正文

服务器安全防护_360网站防护_无缝切换

11-08 WEB安全

服务器安全防护_360网站防护_无缝切换

作者:Ethan M.Rudd博士,Sophos数据科学家。人工智能通常被拟人化为"思考"的方式,减去感知(到目前为止)。然而,在机器学习模型的制定过程中,有一个经常被忽视且更为根本的问题,这可能被解释为一个严重的设计缺陷,它也将"人工智能"与实际智能分开,并导致非常明显和明显的失败案例。机器学习模型的目标是在未来运行,对新的输入做出决策,但它们的训练没有基本的不确定性概念。他们在训练中被"教导"对某些样本进行分类,前提是假设所讨论的样本数据代表了对宇宙的全知观点,而且观察结果不会改变。但在现实世界中,智能并不是这样工作的。人们,无论多么聪明,都很少有把握,而且是正确的,因为他们通常缺乏完整的信息,对不完整的信息采取行动可能会产生灾难性的后果。因此,认识到自己知识的局限性是明智的,也是符合个人利益的。正如唐纳德·拉姆斯菲尔德(Donald Rumsfeld)在一次开创性的新闻发布会上所说:有些事我们知道我们知道。我们也知道有些未知,也就是说我们知道有些事情我们不知道…不幸的是,大多数机器学习模型,包括深度学习模型,都没有"已知未知"的概念。另一种说法是它们是闭集模型,多级ddos防御策略,试图在一个本质上是开放集的世界中运行。相比之下,人类每天都会遇到不熟悉的概念,正是我们区分陌生与熟悉的能力让我们得以学习。解决开集问题是大多数机器学习算法无法解决的问题,因为它们的优化目标只是最小化训练样本的误分类。从风险管理范式来看,这通常被描述为经验风险最小化(Ethan M.Rudd,2017),其中经验风险与错误分类培训示例的数量成比例。在一个由虚拟的闭集假设所支配的世界里,经验风险最小化是很好的,但在真实的开放集世界中,它还有更多。考虑一个分类器,它在一个经验风险最小化的目标下,将三个不同类别的数据分开,如图所示。它利用分段线性边界将样本空间切割成三个无限跨度的子空间。这样可以很好地分离数据类,路由开启哪些ddos防御,只要这三类数据中的点都是它能看到的。此外,该机制中的一个常见实践是将类成员的概率或分类器置信度评估为与成员类内决策边界的距离成正比的函数。然而,当来自一个新类的数据出现时,它将被归类为属于一个已知类,当它离任何一个训练样本特别远时(参见图中的中心图示),它将被分类为一个高概率的已知类。因此,自建cdn防御ddos,分类器不仅是错误的-它将是非常错误的,而且对它的决策非常有信心。左图:三类数据:蓝色正方形、绿色三角形和红色钻石由线性分类器分隔。区域的阴影显示了分类器的决策,它完美地分离了数据。中间:当分类器看到来自不同类的新数据时,它将错误地将其分类为蓝色方块。当使用距离决策边界的距离作为置信/校准度量时,金盾防御ddos,它将新数据分类为"蓝方"类,其概率甚至比合法的蓝方更高。右图:一个训练为最小化经验风险和开放空间风险的开放集分类器将把类的置信度限制在训练集中有足够支持的区域上,作为属于给定类的区域。图中所示的玩具示例简单,低维,并假设一个线性分类器。然而,复杂的、高维的、非线性的分类器,包括深层神经网络,也容易受到开集问题的影响,因为在优化过程中没有任何一个项会惩罚将未标记的空间归属于特定的已知类。此外,由于样本点到未标记空间的密度随维数呈指数下降,因此有更多的"未知"空间被误认为是已知的。总之,经验风险最小化是不够的,而且,虽然增加一个更复杂的分类器会产生不同的失效模式,但是没有理由假设这样做会缓解开集问题。有没有可能制定出避免犯这种愚蠢错误的量词?答案是肯定的!这可以通过采用更现实的风险管理框架来实现:既要平衡经验风险(样本分类错误的风险),也要平衡开放空间的风险(Walter J.Scheirer a.R.,2013)。它的平衡变成了一个开放集风险最小化问题,解决方案既学习从训练样本中对有界支持区域中的数据进行分类,又在没有决策依据的情况下学习。一些开放集决策机已经被开发出来,包括单对集机(Walter J.Scheirer A.R.,2013)、W-SVM(Walter J.Scheirer L.P.,2014)和极值机(EVM)(Ethan M.Rudd,2017)。这些方法通过明确界定使用跨类验证估计的开放空间风险来进行操作-在培训期间一次排除一个类,并将这些样本视为"未知",或对给定类别的样本包含概率进行建模。也有类似的临时方法,理论上限制了开放空间的风险——通常对数据进行概率密度估计,然后对最终分类使用拒绝选项。然而,这样的技术在实施时,通常是事后的思考,"开放空间"的界限是松散的和缺乏根据的,部分原因是"类包含概率"和类样本概率密度不是一回事。另外,两个不同的模型被分别拟合在不同的损失函数上,而不是联合优化。然而,在安全社区中有许多开放集分类器的即时使用案例。例如,许多假阳性和假阴性存在于假设空间中以前看不见的区域,可以潜在地减轻。例如,强迫分类器对完全外来的代码类型做出决定可能导致奇怪的行为。例如,2017年秋季,ddos流量防御,许多最先进的供应商认为编译的"hello world"二进制文件是恶意的,可能是因为该程序过于简单,无法与训练集中的任何其他程序相似。同样,零日攻击也很容易被忽略,这正是因为它们的代码或行为模式与之前看到的有很大的不同。开放集分类器可能会检测到这些并标记它们以供检查、创建签名并最终更新到分类器。更一般地说,开放集分类器可以作为一种工具来检测"已知"数据的错误分类,一方面表明训练不当的分类器与需要获取更多训练数据以及需要获取何种类型的训练数据。工具书类Ethan M.Rudd,L.P.(2017年)。极限值机器。IEEE模式识别与机器智能汇刊。可用:https://arxiv.org/pdf/1506.06112.pdfWalter J.Scheirer,A.R.(2013年)。开放集识别。IEEE模式分析与机器智能汇刊。可用:https://www.wjscheirer.com/papers/wjs_tpami2013_openset.pdfWalter J.Scheirer,L.P.(2014年)。开放集识别的概率模型。IEEE模式分析与机器智能汇刊。可用:https://www.wjscheirer.com/papers/wjs_tpami2014_probability.pdf

版权保护: 本文由 DDOS防御专家 原创,转载请保留链接: /web/51550.html

DDoS防御专家简介孤之剑
国内资深白帽子二十人组成员,前BAT资深网络安全工程师,知名网络安全站点板块大神,每年提交Google及微软漏洞,原sina微博负载插件开发者,现在整体防御复合攻击长期接受1-4.7T攻击,CC防护自主开发指纹识别系统,可以做到99.9999%的无敌防御。
  • 文章总数
  • 6946701访问次数
  • 建站天数

    QQ客服

    400-0797-119

    X