PDA

Bekijk Volledige Versie : Erotische inhoud weren / User Generated Content



Trimmer
26/12/10, 15:04
Op een blogsite van ons werd recentelijk google adsense geblokkeerd omdat er o.a. teveel blogs zouden zijn met erotische inhoud. We gebruiken nogthans al "dansguardian" om zoveel mogelijk automatisch uit te filteren, maar dat blijkt dus niet genoeg.

Na lange discussies met google hebben wij wel opnieuw toegang gekregen tot ons adsense account, maar moeten wij zorgen dat er geen advertenties meer worden weergegeven op blogs die eventueel erotische inhoud bevatten.

Weet iemand hier misschien een goede oplossing? Want 100000 blogs handmatig nakijken is enorm veel werk natuurlijk. Maar misschien heeft hier iemand weet van betere software dan dansguardian, mag al dan niet betalend zijn natuurlijk...

Alvast bedankt voor tips & hulp.

Trimmer
27/12/10, 21:26
Niemand een idee?

Triloxigen
27/12/10, 21:53
Ik heb hetzelfde probleem, zowel met blogs als met fora.
Voor mij was het een reden om Adsense hier niet meer op te tonen doordat het account den inkomsten uit andere bronnen te waardevol zijn voor dat risico.

Enige optie dat hebt is controleren, bij registratie maar ook tussendoor.

Trimmer
28/12/10, 14:06
Controleren, oké, maar 100.000 blogs (en steeds meer) handmatig controleren lijkt met toch niet haalbaar. (en handmatig controleren laat ook veel ruimte voor fouten denk ik zo)...

Triloxigen
28/12/10, 14:37
Je moet een aantal dingen doen.
Als eerste zorgen dat je zoveel mogelijk bots kunt blokkeren.
Daarnaast met categorieën werken waarbij je seks sowieso blokkeert, daarnaast op bepaalde zoekwoorden controleren en daar een formule op loslaten wanneer iets wel of niet kan.

eweps
28/12/10, 14:54
Je kunt een lijst aanmaken met woorden die met seks te maken hebben. Vervolgens elke blog bij aanmaken laten controleren of woorden die hierin voorkomen. Indien dit het geval is dan laat je de betreffende blog in een controle lijst komen.

Die controle lijst kun je dan weer handmatig gaan controleren.

Wil je het helemaal automatisch hebben dan kun je er een berekening op toepassen, op basis van:

- totaal aantal woorden
- aantal keer dat een verboden woord voorkomt
- delen door elkaar geeft een cijfer..

in combinatie met: indien aantal keer dat een verboden woord voorkomt, is groter dan: maximum, blog blokkeren..

Een extra optie is eventueel: Indien een verboden woord voorkomt, blog laten bestaan, maar geen adsense tonen.

Trimmer
28/12/10, 15:52
Dat is eigenlijk wat we doen met "Dansguardian". Dansguardian is een content filter die o.a. porno kan detecteren, maar blijkbaar is hij niet goed genoeg voor google adsense. Iedere pagina moet bij ons de tests van "dansguardian" doorstaan, zo niet dan komt er geen googla adsense op. Zo werkte het voorheen steeds...

Probleem is echter, volgens google, dat er toch af en toe pagina's doorkomen die met porno te maken hebben of linken naar een pagina waarvan de inhoud als porno aanzien kan worden. Ook links naar pagina's over drugs/illegale dingen (hacken)... enzo zijn een probleem.

Bestaat er dan ergens een lijst van woorden, beter dan wat dansguardian intern gebruikt, die we kunnen gaan gebruiken om blogs echt uit te sluiten?

Want het is wel eenvoudig zoals jullie het zeggen "controleren of woorden erin voorkomen". Maar welke woorden dan?

Ik kan "seks","sex" en "porno" ofzo als woorden opnemen en als het voorkomt gewoon geen adsense weergeven, maar dan moet ik ook "girls", "nude","nudity","lesbian","gay"... opnemen en waarschijnlijk een lijst van 100.000 woorden. Maar ik kan toch onmogelijk zelf een lijstje gaan verzinnen? Want dan mis ik nog veel te veel. Net om die reden hebben we dansguardian in gebruik, omdat het een product is dat zich daarmee bezig houdt om porno te detecteren a.d.h.v. content/tekst.

Soms zie ik ook spam over "Cialis" of "Xanax" of "Viagra" er doorkomen, maar ik kan toch onmogelijk weten wat er zo nog allemaal bestaat (om een lijst te maken)?

Iemand een idee hoe we dit dan een beetje deftig kunnen aanpakken? Want zelf een lijst maken lijkt me gewoon onmogelijk of allessinds niet voldoende.

Nog een bijkomend probleem: wat met blogs die enkel pronografische foto's hebben gepost. Dus geen uitleg. Bestaat er een iet-wat betrouwbare pornografische foto detector? Ik heb al wat zitten zoeken maar nog niets gevonden. SafeSquid blijkt er eentje te hebben maar die zit verwerkt in hun programma. Voor ons zou het handigste zijn als we hem zelf kunnen aanspreken zonder bv. squid-toestanden...

eweps
28/12/10, 17:32
Ik ken dansguardian verder niet..

Wat je wil zal inderdaad met een professionele filter moeten gebeuren. Een partij die continu alle woorden op het gebied van seks bijhoudt + een foto filter heeft.

Je zegt dat je nu 100.000 blogs hebt?

Iets dat een optie zou kunnen zijn, maar wel veel werk is:

- de 100.000 blogs moeten wel allemaal voldoen aan de eis van google.
- van alle 100.000 blogs de gebruikte woorden apart opslaan in de database. Zo krijg je 1 lange lijst met alle woorden die wel toegestaan zijn.
- maakt iemand nu een blog aan met woorden erin die niet in de lijst voorkomen, toon deze dan in een aparte lijst waarin ze gecontroleerd moeten worden.

Hetzelfde kun je ook doen met blogs waar url's in voorkomen. Deze eerst controleren voordat je ze accepteert.

Zojuist heb ik dansguardian even bekeken, kun je de lijst met woorden die zij gebruiken niet in een eigen database zetten? Samen met de URL Lijst van urlblacklist.com ?

Triloxigen
28/12/10, 18:37
Overigens is de controle van Google ook erg trek en geautomatiseerd.

Heb ooit waarschuwing gehad vanwege het woord 'seks' op een website met regels waarin stond dat 'Seks' gerelateerde content niet mocht.

Trimmer
28/12/10, 19:21
Het probleem is net dat er bij deze 100.000 blogs weldegelijk blogs zitten die volgens dansguardian dus oké waren, maar volgens google niet. En google heeft gelijk, er zijn dus blogs ivm sex e.d.m. te vinden.

Dus een whitelist-woordenlijst baseren op huidige blogs is eigenlijk niet mogelijk.

Gebruik maken van urlblacklist.com lijkt me geen goed idee aangezien mijn eerste test op hun site al laat verstaan dat zelfs "youtube.com" daarin te vinden is??

Kent iemand zo'n "professionele filter"? Want als die bestaat, en goed is, dan zullen wij deze aanschaffen...

Mark17
30/12/10, 17:01
Heb je al overwogen om naar een andere advertentie optie als adsense te kijken? Dat lost het probleem mogelijk effectief op (bij naast een filter met dingen die jezelf onacceptabel vind).

Trimmer
30/12/10, 17:11
Overwogen wel, maar welk alternatief zou je aanraden? Want ik heb enkele affiliate programma's zoals o.a. zanox geprobeerd maar de inkomsten halen nog geen 100ste van wat we met adsense verdienen...

Mark17
30/12/10, 17:59
Wij gebruiken momenteel een zelfgeschreven systeem om advertenties van meerdere partners weer te geven. Dit betekend effectief dat we kijken wie de hoogste eCPM heeft op een bepaald gebied om die de meeste views te gunnen. De meeste partners zijn adverteerders die enkel een bepaalde periode ruime afnemen en dan zijn er nog partners die de rest ruimte vullen, welke partners we precies hebben op dit gebied kan ik zo niet zeggen. Wel is het zo dat we niet met problemen zitten zoals Google soms geeft met geen communicatie mogelijk als ze op 1 pagina een woord aantreffen die ze niet prettig vinden.

PreServer
11/03/11, 10:50
je zou eventueel zelf iets kunnen maken met output buffering en auto append, maar dan moet je wel zelf de woordlijsten en urllijsten gaan bijhouden.

het is jammer dat google geen test heeft of het toegestaan is anders zou je perodiek urls daardoorheen kunnen halen en op de whitelist of blacklist zetten