LOGO OA教程 ERP教程 模切知识交流 PMS教程 CRM教程 开发文档 其他文档  
 
网站管理员

[点晴CRM客户管理系统]Gmail是怎么判断垃圾邮件的呢?

admin
2012年6月14日 23:25 本文热度 6624
这个只能谈谈原则,没办法谈具体算法(我也不懂哈)。比如有人在stackoverflow上提问后,被顶得最高的答案是:This is the million dollar question, and if it were able to be answered on stackOverflow, then everyones spam filter would be as effective.

主要原则有四条:

1、用户帮助
Gmail有自己的反垃圾邮件算法,但算法总不能100%保证垃圾邮件被拦截,偶尔还是会有垃圾邮件塞进了用户的收件箱,这时候就需要用户配合。当收件箱收到垃圾邮件时,用户点击“Report spam”就非常重要;同样,当Gmail不小心将正常邮件放到垃圾邮件箱时,用户点一下“Not spam”也很重要。依靠用户的帮助,当以后再收到类似邮件的时候,Gmail将更加智能地判断垃圾邮件和正常邮件。用户对这两个功能用得越多(而非简单地删除或捞回到收件箱),系统越智能。

2、快速适应
Google搜索的计算能力也能对判断垃圾邮件起到帮助作用。网络上一旦有新的垃圾数据出现,Google搜索的计算网络可以帮助Gmail系统自动适应新的垃圾数据的模式,从而过滤类似数据的邮件,提高垃圾邮件识别率。

3、基于Google全体力量
Google内部有很多产品团队,每个团队或多或少都会为反垃圾做出贡献。比如,Google图书搜索(Google Book Search)项目的核心技术是视觉特征识别(OCR, optical character recognition)技术,相信大家都收到过那些将文字做在图片上的垃圾邮件吧?利用OCR可以加强Gmail对图片垃圾邮件进行识别,从而过滤掉类似的垃圾邮件。

4、强大的验证系统
许多网络邮件服务都有验证系统来判断发件人是否可疑。Gmail支持多个验证系统,包括SPF (Sender Policy Framework), DomainKeys, and DKIM (DomainKeys Identified Mail),所以Gmail可以判断你的邮件究竟来自哪里,防止某些伪装成合法邮件的垃圾邮件被发到收件箱。

最后再附张图:


该文章在 2012/6/14 23:25:39 编辑过

全部评论1

admin
2012年6月14日 23:25
首先google一般会给出多个算法的组合(猜测),简单的来说Bayes也足够完成任务,而Bayes不过是一个概率问题。 抽取邮件中的N个关键词(可以取10),确定每个词出现过的邮件中垃圾邮件的概率,比如“发 票”,“性”,“色 情”,这些词出现过的邮件95%以上都是垃圾邮件,如果是一个陌生人发的可能高达99%,概率叠加(最简单的是相乘),对比阙值,确定是否为垃圾邮件。 通常在匹配时还提供模糊匹配,比如我上面通过安检的空格(最终没通过啊T_T);或者”cl1ck here:链接“,i->1,这差不多垃圾邮件最简单的方式了,不过一般模糊匹配成功的词,死的概率都极大……而且链接通常也无法修饰,因此也会暴露出很多信息,从而判断除垃圾与否。
关键字查询
相关文章
正在查询...
点晴ERP是一款针对中小制造业的专业生产管理软件系统,系统成熟度和易用性得到了国内大量中小企业的青睐。
点晴PMS码头管理系统主要针对港口码头集装箱与散货日常运作、调度、堆场、车队、财务费用、相关报表等业务管理,结合码头的业务特点,围绕调度、堆场作业而开发的。集技术的先进性、管理的有效性于一体,是物流码头及其他港口类企业的高效ERP管理信息系统。
点晴WMS仓储管理系统提供了货物产品管理,销售管理,采购管理,仓储管理,仓库管理,保质期管理,货位管理,库位管理,生产管理,WMS管理系统,标签打印,条形码,二维码管理,批号管理软件。
点晴免费OA是一款软件和通用服务都免费,不限功能、不限时间、不限用户的免费OA协同办公管理系统。
Copyright 2010-2024 ClickSun All Rights Reserved