说到电子邮件,人们可能会对它印象深刻。
这些年随着QQ、随着微信的普及,电子邮件不再流行。即使在外贸行业,外国人和我们也干脆用它来做生意 WeChat。
有人可能会说,我从来没有见过电子邮件流行。假如你足够年轻,那有资格这么说。
但不可否认的是,大多数 80、90 后网上冲浪的开始离不开一个 E-mail。
不要说它当时有多有用,但至少你可以用它在同学的录音安装一个小的 X。
当你登录你的邮件主页时,你应该好奇地进入垃圾箱。
在此,您可以找到信用卡办理活动,蓝色小药丸打折营销。
甚至还有一批邮件想直接骗你钱。
对方可能是想让你继承大量资产的非洲王子。
也可能是你家附近500米的洋妞,可以免费上门。
连南非总统的第二任妻子都说要寄给你 4000 一万美元,原因你不在乎,不信可以查护照。
世超每次看到垃圾箱里这些脑洞比脑子大的垃圾邮件,都很好奇:
这些垃圾邮件到底是从哪里来的?如何识别邮箱客户端并拦截它们?
让我们今天简单谈谈。
1978年封垃圾邮件诞生于1978年。
当时,为了推广电脑,一家电脑公司的销售人员不管别人想不想买,都会给阿帕网发邮件( 网上前身 )所有用户。
美国国防通信机构也批评他们,尽管他们赚了国国防通信机构也批评了他们。
所以在接下来的十年里,没有人敢这样做。
直到 1994 2000年,真正的垃圾邮件始作俑者出现了。
当时,人们习惯于在新闻组各种栏目,栏目收到的邮件会自动转发给订阅者。
有一天,为了推销自己的业务,两名律师反复向新闻组发邮件 5500 多个栏目。
就这两人▼
那天,很多人发现他们怎么能在每个栏目中看到这封邮件。。
在接下来的几天里,这两位律师的电话和传真被炸了,接着是骂人。
但你可能不相信,因为垃圾邮件,他们得到了 1000 个新客户。几美分的成本相当于几美分 10 万美金。
哦,垃圾邮件的巨大利润突然暴露在公众的视野中。
不赚钱不聪明吗?
于是人们一个接一个地发起了垃圾邮件,尤其是那些平时不允许发布广告的成人用品,趁机广泛撒网。
其他人则另辟蹊径,开始销售邮件地址,有技术的程序员,还开发了一键群发工具。
潘多拉魔盒的垃圾邮件正式打开。
从那以后,人们发现,无论是否需要,收件箱每天都充满了保健药品的广告邮件,严重影响了他们的生活和工作。
最烦人的是,犯罪团伙还使用电子邮件推送欺诈信息和病毒。
在这种情况下,反垃圾邮件技术诞生了。
1996 2000年,两名工程师开始记录垃圾邮件的发送 IP 地址,填进 RBL 在黑洞名单中,名单上的人直接拒绝发送电子邮件。
虽然很受欢迎,但要解决它并不难。
对方要么买服务器换衣服 IP,或者,使用中继服务器可以避免。
说到邮箱服务器,有一个叫做邮箱服务器的功能开放式中继代理,专门做好人好事。
如果你收到一封不是寄给你的邮件,你会帮忙,然后寄出去。
过去,互联网不稳定。为了确保邮件的顺利发送,大多数服务器都会打开此功能。
人人为我,我为人人。
不幸的是,垃圾邮件喜欢这个好功能。他们故意把邮件发给诚实的服务器,然后让它转发,以避免黑名单。
在过去的几年里,由于起步缓慢,管理不善,中国的许多服务器被国外使用并转发了垃圾邮件,结果被列入黑名单。
当时我们和外国人做生意发邮件,要么投诉解封,要么只能用中继服务器。当然,这是另一个话题。
图源 Winmail ▼
可见黑名单技术并不优秀。
所以有没有其他方法来判断邮件是否是垃圾邮件?
有。
想想看,垃圾电脑邮件往往从几十万封开始,肯定会遇到很多发送失败的情况。
如果正常邮件发送失败,将自动重发第二次。
但是垃圾邮件不愿意,因为重发不仅消耗资源,还耽误了很多时间,业务很重要~
灰名单技术基于这一特点诞生了。
呃,你第一次发给我,我先拒绝。如果你是个好人,你一定会再发一次,对吧?
这样,我们只会收到正常的电子邮件止垃圾邮件。
除了不喜欢重发,垃圾邮件的内容也很有特色:医疗、投资、约会等。
把这些词作为关键词,遇到后塞进垃圾箱,好吗?
行是行。但是对方不难避免,最重要的是会误伤。
许多正常邮件被塞进垃圾站,因为它们误解了关键字。
网上有人总结了关键词列表 ▼
电脑因此,关键词还需要过滤垃圾邮件贝叶斯推断。
贝叶斯推断是基于贝叶斯定理的。我们不能详细说明这件事。至少在打开之前说清楚 2 篇文章。
只要你知道,有了贝叶斯推断,过滤器就会根据一组关键字,确定一个为垃圾邮件的概率。
怎么做呢?
我们提供总结的正常邮件和垃圾邮件,让过滤器统计每个单词的频率。
比如,“ 猛男 ” 它出现在垃圾邮件中 78 次,出现在正常邮件中 5 次;
这样,过滤器就可以大致推出。当猛男一词出现在邮件中时,它是垃圾邮件的概率。 90%。
其他词的概率也是一样的。
如果我现在收到邮件,内容是:我是个猛男,喜欢半夜锻炼。
电脑我们不能因为它含有它 “ 猛男 判断它 90% 是垃圾邮件。
而是要把 “ 喜欢 ” “ 半夜 ” “ 健身 ” 这些词一起算,求联合概率!
这样计算出来的是一个内容我是猛男,喜欢半夜健身。 ”邮件,垃圾邮件的概率是多少?
这是贝叶斯的推断,只要我们收到的邮件越多,过滤器就越准确。
当然,实际计算要复杂得多,我们不细说,点到即止。
这里提到的过滤方法都是基于垃圾邮件的特点,比如不喜欢重发和关键词。
但也有一种垃圾邮件更淫秽,它不会显示出明显的特征,伪造成官方运营商来欺骗你敏感信息。
下图是 比尔盖茨 从姓名和地址来看,邮件是对的。
这是否意味着它真的来自比尔盖茨。
网络邮箱和微信的运行机制,QQ不同的双向通信是单向通信。
给别人发邮件,就是直接把包裹扔给服务器,说:我是 A,给这个东西 B。
这一步类似于快递。
你显然不是吴彦祖,但你可以填写寄件人的栏目 “ 吴彦祖 ”。
类似地,只要我在发邮件时配合一些工具,我就可以把自己写成名人、运营商和银行。谁对我犯罪有利,我就是谁。
有网站可以伪造发件人 ▼
为了解决这个问题,我们多了一步验证技术,比如常见的 SPF( Sender Policy Framework )。
一般来说,大型运营商和银行会使用这种技术来防止他人假装自己。
SPF 原则就像每个运营商和银行在自己家门口放一个公告板,告诉大家只有来自 138.138.138.138、139.139.139.139 等 IP 是他们的邮件。
如果有人用他们的名字发邮件,服务器会比较 IP 地址。
如果不对,则判为假冒,直接返还。
随着邮件认证技术的发展 Domainkeys 以及改进版 DKIM,世超就不多说了。
既然反击手段那么多,垃圾邮件有没有停止?
并没有。
2011 2000年,美国一所大学对发送垃圾邮件的收入进行了实验估计。结果发现,如果卖伟哥,一天就能赚钱 7000 美元。
因此,即使我们有10000种处理垃圾邮件的方法,他们仍然是小强,因为他们的利润足够有吸引力。他们仍然每年发送数千亿封信,以各种方式逃避拦截。
2017 几年前,世界上发布的大部分邮件都是垃圾邮件。
你可能认为这离你自己很远。除了不使用电子邮件,更重要的是,在每一秒看不见的世界里,反垃圾邮件系统都在与无数的垃圾邮件作斗争,以保护您的邮箱。
这场比赛可能会持续很长时间,但随着技术的发展和反击技术的进步,垃圾邮件的消失一定是最终的结果。
电脑