PDA

Bekijk Volledige Versie : Spamassassin sa-learn



IT-worX
07/11/14, 01:04
Hoi hoi!

Daar ik de laatste tijd op diverse e-mailadressen weer een bak spam binnen krijg, besloot ik om mij eens verder te verdiepen in spamassassin. Uiteraard heb ik eerst sa-update gedraaid. Volgens thunderbird (waarmee ik mijn mails binnen haal) zit ik nu op versie 3.4.0 van 7 februari 2014(X-Spam-Checker-Version: SpamAssassin 3.4.0 (2014-02-07) on blablablablabla).

Daar ik altijd de spam in thunderbird heb aangeduid als "ongewenst" voor ik deze archiveerde, heb ik daarna het commando "sa-learn --spam" laten lopen. Echter ... dit duurt nogal een tijd? Zonder overdrijven is die bak nu al 5u bezig met te checken hoeveel mails er gemerkt zijn als "spam".

Volgens DirectAdmin zouden er in totaal 117 emailboxen zijn op die server (totaal een 70-tal domeinnamen). Daar dit niet zoveel lijkt in mijn ogen (ik vermoed dat de meeste hosters hier een veelvoud van hebben draaien op hun servers) vraag ik mij af of het wel normaal is dat dit zolang duurt.

CharlieRoot
09/11/14, 09:33
Hoi hoi!

Daar ik de laatste tijd op diverse e-mailadressen weer een bak spam binnen krijg, besloot ik om mij eens verder te verdiepen in spamassassin. Uiteraard heb ik eerst sa-update gedraaid. Volgens thunderbird (waarmee ik mijn mails binnen haal) zit ik nu op versie 3.4.0 van 7 februari 2014(X-Spam-Checker-Version: SpamAssassin 3.4.0 (2014-02-07) on blablablablabla).

Daar ik altijd de spam in thunderbird heb aangeduid als "ongewenst" voor ik deze archiveerde, heb ik daarna het commando "sa-learn --spam" laten lopen. Echter ... dit duurt nogal een tijd? Zonder overdrijven is die bak nu al 5u bezig met te checken hoeveel mails er gemerkt zijn als "spam".

Volgens DirectAdmin zouden er in totaal 117 emailboxen zijn op die server (totaal een 70-tal domeinnamen). Daar dit niet zoveel lijkt in mijn ogen (ik vermoed dat de meeste hosters hier een veelvoud van hebben draaien op hun servers) vraag ik mij af of het wel normaal is dat dit zolang duurt.

Ik heb het net even getest. 1000 spam berichten in een mapje en sa-learn --spam gedaan. Was binnen 10 seconden klaar :)

systemdeveloper
09/11/14, 09:55
Ik heb het net even getest. 1000 spam berichten in een mapje en sa-learn --spam gedaan. Was binnen 10 seconden klaar :)

Mailboxen en mails kun je niet direct vergelijken. Als je 117 mailboxen hebt met ieder gem. 15k mails (denk aan bv. een hoofdaccount van users dat jarenlang meldingen ontvangt maar nooit uitgelezen worden), dan duurt het bij jou ook 5 uur als je er 10 per sec. traint.

Intio
09/11/14, 10:02
Hoi hoi!

Daar ik de laatste tijd op diverse e-mailadressen weer een bak spam binnen krijg, besloot ik om mij eens verder te verdiepen in spamassassin. Uiteraard heb ik eerst sa-update gedraaid. Volgens thunderbird (waarmee ik mijn mails binnen haal) zit ik nu op versie 3.4.0 van 7 februari 2014(X-Spam-Checker-Version: SpamAssassin 3.4.0 (2014-02-07) on blablablablabla).

Daar ik altijd de spam in thunderbird heb aangeduid als "ongewenst" voor ik deze archiveerde, heb ik daarna het commando "sa-learn --spam" laten lopen. Echter ... dit duurt nogal een tijd? Zonder overdrijven is die bak nu al 5u bezig met te checken hoeveel mails er gemerkt zijn als "spam".

Volgens DirectAdmin zouden er in totaal 117 emailboxen zijn op die server (totaal een 70-tal domeinnamen). Daar dit niet zoveel lijkt in mijn ogen (ik vermoed dat de meeste hosters hier een veelvoud van hebben draaien op hun servers) vraag ik mij af of het wel normaal is dat dit zolang duurt.

Gebruik je gewoon het command sa-learn --spam? of gebruik je iets van een script zoals: http://help.directadmin.com/item.php?id=358

vDong
09/11/14, 11:00
Wat je denk ik vooral moet voorkomen is sa-learn te dwingen om te leren wat ie al geleerd heeft, of wat ie al als spam heeft aangemerkt.
Wat ik doe is een aparte spambox waar ik alles heensleep dat als nietspam is aangemerkt, maar toch spam was (ongeveer op de da manier hierboven)
Na learn gooit het script de email weg, waardoor deze niet opnieuw in de learn loop komt.

CharlieRoot
09/11/14, 11:10
Mailboxen en mails kun je niet direct vergelijken. Als je 117 mailboxen hebt met ieder gem. 15k mails (denk aan bv. een hoofdaccount van users dat jarenlang meldingen ontvangt maar nooit uitgelezen worden), dan duurt het bij jou ook 5 uur als je er 10 per sec. traint.

Weet niet precies wat je hiermee duidelijk probeert te maken, het ging even om een kleine vergelijking. Als je gebruikers met belachelijk veel mail hebt in de spamfolder kan dat natuurlijk zorgen voor vertraging maar dan moet je hem dus gewoon vaker laten lopen en het clean commando gebruiken.


Verzonden vanaf mijn iPhone

systemdeveloper
09/11/14, 11:23
Weet niet precies wat je hiermee duidelijk probeert te maken, het ging even om een kleine vergelijking. Als je gebruikers met belachelijk veel mail hebt in de spamfolder kan dat natuurlijk zorgen voor vertraging maar dan moet je hem dus gewoon vaker laten lopen en het clean commando gebruiken.


Verzonden vanaf mijn iPhone

Volgens mij staat bij directadmin in de admin settings standaard geen tijd ingevuld mbt. wanneer de spam gepurged moet worden. Dus die imap spamboxen waar geen hond naar kijkt maar SpamAssassin wel de spam in kan doppen, kunnen best groot worden.

IT-worX
09/11/14, 18:53
Voor alle duidelijkheid : ik doe alleen sa-learn, geen scriptje of iets dergelijks.
Overigens : de 117 mailboxen zijn niet zo uitzonderlijk : als je een nieuw account aanmaakt op DirectAdmin, dan maakt deze al automatisch een mailbox aan.

Maar goed, het is dus blijkbaar normaal dat het zolang duurt (een 10-tal mailboxen hebben mails van 2004 tot nu in hun archieven zitten). Dan maar de pc eens nachtje laten draaien :)

Bedankt voor alle info!!!

T. Verhaeg
09/11/14, 20:47
Dan maar de pc eens nachtje laten draaien :)


Screen?