使用FuzzyOCR和SpamAssassin在Debian / Ubuntu上打击图像垃圾邮件
版本1.0
作者:Falko Timme
本教程介绍如何使用FuzzyOCR扫描图像垃圾邮件的电子邮件 。 FuzzyOCR是SpamAssassin的一个插件,其针对的是包含图像作为主要内容载体的未经请求的批量邮件。 使用不同的方法,它分析图像的内容和属性,以区分正常的邮件(火腿)和垃圾邮件。 FuzzyOCR尝试通过仅扫描尚未被SpamAssassin分类为垃圾邮件的邮件来保持系统负载低,从而避免不必要的工作。
我不会保证这将为您工作!
1初步说明
在本文中,我将使用Debian Etch作为基础系统。 对于Ubuntu系统,安装FuzzyOCR的步骤应该是一样的。
我假设SpamAssassin已经安装并工作,以/ etc / mail / spamassassin /
作为其主配置目录。 如果您的目录不同(例如,如果您安装了 ISPConfig,目录是/ home / admispconfig / ispconfig / tools / spamassassin / etc / mail / spamassassin /
),这没有问题。 我会注释在哪里改变什么。
请确保您的SpamAssassin版本适用于FuzzyOCR。 例如,我要在这里安装的FuzzyOCR版本( fuzzyocr-3.5.1-devel.tar.gz
)需要SpamAssassin 3.1.4或更新版本。
2安装FuzzyOCR的先决条件
FuzzyOCR有一些先决条件,如ocrad
和gocr
,我们可以这样安装:
apt-get install netpbm gifsicle libungif-bin gocr ocrad libstring-approx-perl libmldbm-sync-perl imagemagick tesseract-ocr
3安装FuzzyOCR
接下来我们从http://fuzzyocr.own-hero.net/wiki/Downloads下载并安装最新的FuzzyOCR devel版本。 我们下载devel版本而不是稳定的版本,因为FuzzyOCR开发人员说:
“目前的推荐是开发版本,因为稳定版本缺少功能,而且很旧。”
cd /usr/src/
wget http://users.own-hero.net/~decoder/fuzzyocr/fuzzyocr-3.5.1-devel.tar.gz
然后我们解压缩FuzzyOCR并将所有FuzzyOcr *
文件和FuzzyOcr
目录(它们都在FuzzyOcr-3.5.1 /
目录中)移动到/ etc / mail / spamassassin中
:
tar xvfz fuzzyocr-3.5.1-devel.tar.gz
cd FuzzyOcr-3.5.1/
mv FuzzyOcr* /etc/mail/spamassassin/
如果您的SpamAssassin目录不同,例如/ home / admispconfig / ispconfig / tools / spamassassin / etc / mail / spamassassin /
,那么最后一个命令应该被替换为
mv FuzzyOcr* /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/
不要删除/usr/src/FuzzyOcr-3.5.1/
目录,还有一个目录,其中包含示例图像垃圾邮件( samples /
),以后我们需要测试FuzzyOCR是否按预期工作。
所以现在FuzzyOCR已经安装了,现在我们需要配置它。