99.86%的垃圾邮件识别率,金笛邮件是如何做到的? 垃圾邮件会导致邮件系统的可用性变差。据调查,企业员工每天在处理垃圾邮件上花费的时间在30分钟~1个小时。好多人宁愿用免费的邮箱也不用公司的邮箱,就是因为垃圾邮件充斥其中,处理起来浪费时间、浪费精力。 邮件系统作为一个有30多年历史的通讯技术,在全世界是仅次于Web应用的第二大应用。金笛邮件从2000年开始从事邮件系统的开发和研究,专注于邮件领域,经过十多年的研究开发,始有所得。在邮件方面和反垃圾邮件方面的产品也渐渐趋于成熟。 用过金笛邮件网关产品的客户惊呼,邮箱里看不到垃圾邮件,还以为系统出了问题呢。 众所周知,能做到99%的垃圾邮件识别率就已经很难。100封垃圾邮件能识别出99封,这就是极高的水平。金笛在此基础上,经过几百项技术革新,又向上推进了0.86%,1000封垃圾信可以识别出998.6封。能到达这个水平,在国内寥寥无几,在世界上屈指可数。那金笛是如何做到的呢? ① 创新的基于信任的反垃圾邮件模式。金笛不是把邮件当做对象孤立地、静态地去判断处理,而是通过收件人与发件人的关系动态地处理,网络化地分析,从而收到很好的效果。 ② 用户参与优化机制。如果没有用户的参与,再好的反垃圾邮件系统也是不完美的。用户参与的方式如果过于复杂,也会不实用,终因麻烦而放弃。金笛通过几个特定邮件地址做接口,只要给这spam、notspam、邮箱发信,就可以参与改进提高反垃圾邮件的效果,从而渐次提高反垃圾邮件的识别率,经过一段时间的使用之后,可以从99.86%,提到99.99%。只要给white、notwhite发信,就直接可以对某些重要的邮件放行、停止放行。此做法简便易行。 ③ 自动学习机制。贝叶斯算法在很多反垃圾邮件系统都用到。最麻烦的莫过于训练垃圾邮件。金笛的做法是让系统自动学习。不需要人为干预。另外把贝叶斯从邮件体应用到邮件头,是金笛的一个创造性发明。因为邮件体是会经常变的,即使是同一个垃圾邮件发送者,也会时时变更发送的主题、内容,而邮件头确不是经常变、也不是轻易能变的。通过在邮件头部应用bayes,把垃圾邮件发送者用到MESSID、HOSTID、Recieved等属性记录下来,在实际使用中常收到四两拨千斤的效果。 ④ 多种技术手段同时使用,集成打分机制。文艺比赛经常看到有专家团队,每个专家打分,最后所有专家打分的结果订名次。这种结果通常比较合理的。如果只有1个专家定生死,难免有失偏颇。金笛邮件网关受此启发。一种技术好比是一个专家,金笛在处理一封垃圾邮件时,同时使用几十项技术,每项技术分别占不同的权重,最后形成的邮件分数通常是比较合理的,这样就极大地提高的垃圾邮件的识别率,降低了误判率。 ⑤ 925项邮件取样指标。人要体检,要取样二三十项,参考正常人的指标,分析差异,从而判断是否健康。邮件是否健康也是如此。金笛通过预先设置925项指标,判断邮件是否健康。这些指标涵盖了邮件头、邮件体和IP回话(邮件行为)的方方面面。经过几百项检查筛选之后,就好比是湖水经过了多层的过滤和净化,得到的就是干净的自来水啦。 ⑥ 零设置零管理。很多反垃圾产品,都需要做配置才可以使用。配置的项目,很多比较专业,管理员需要学习很多新知识才可以做到。“能简单、不简单”一直是金笛的产品研发理念。金笛邮件网关部署之后,对用户是透明的,感觉不到它的存在。但是效果又是真真切切、实实在在的。 ⑦ 零误判率。即使有千分之一的误判率,对客户来说都是风险。假如那千分之一幸好是重要的千万订单呢?判定为垃圾邮件的,系统会在主题打上标记之后,放在垃圾邮件箱,而不会立即删除任何一封即使是“判断为[SPAM]”的垃圾邮件。这样客户在登录webmail的时候,可以定期浏览垃圾邮件箱。垃圾邮件箱不需要客户定期删除,系统会自动删除1个月前的垃圾邮件。平时用客户端软件接收邮件的时候,收不到垃圾邮件箱的邮件。这样就从根本上解决误判的问题。 ⑧ 高效率。判定一封邮件只需要0.01-0.05秒,普通服务器一个小时可以处理72000封,一天可以处理172.8万封邮件。用Spamassassin处理一封邮件平均要3-5秒,个别邮件有时候需要十几秒才能处理完。金笛邮件网关的处理速度比它快100倍以上。Spamassassin还有个致命缺陷,内存消耗巨大,经常会导致邮件服务器满负荷而停止响应。
|