Marin Heideman (DigiState B.V.)
Ik zie ondertussen wat je bedoelt; het positieve zou dus zijn dat ik (ook) alle handelsnamen terug zou krijgen, het negatieve is er dus aan dat ik 'uitgeschreven' handelsnamen er niet weg mee krijg.
Laat ik vooropstellen dat wat ik nu ook zou veranderen dat je de 'historische' namen die er ooit in stonden, gewoon op het scherm zou krijgen. (Dat er iets bij moet als 'is verhuist naar', of 'uitgeschreven', in plaats van Actief, dat lijkt me duidelijk...)
Ik heb net even in de update gekeken (die heb ik met historisch=N gedraaid), en daar staan die andere handelsnamen niet bij. Op zich zou ik dus alle nummer-naam combies die niet matchen, als 'uitgeschreven' kunnen markeren. En alles wat aan 'nummer' niet meer voorkomt als onbekend.
Dat kan op zich, zit je nog wel met de volgende situatie.. Ik schrijf een handelsnaam "abc" in. Die verwijder ik weer, en vervolgens gebruikt een ander bedrijf deze handelsnaam "abc" weer. Dan kan dat voor wat verwarring zorgen.
Mijn voorstel zou zijn, gooi ze er gewoon uit als ze er bij de kvk uit zijn.
Marin Heideman (DigiState B.V.)
Oplossing;
Ik heb alles uit de database gegooid, en alleen de laatste update geïmporteerd; dat zou dus de meest 'recente' data moeten geven. Minor detail is natuurlijk dat je nu niet meer (via de webschil) op oude meuk kunt zoeken. Voordeel is wel dat de database kleiner is geworden en sneller wordt doorzocht.
Ook zag ik dat ik 150 (actieve!) ANBI stichtingen niet meer in de KvK zag staan. Zal de belastingdienst leuk vinden.
Het inschrijf formulier is iig gewijzigd dit jaar, aan het begin van het jaar was dat kopje er namelijk nog niet. Inmiddels zie ik 'm inderdaad wel staan op het inschrijvings formulier. Geen idee over het wijzigings formulier maar mag toch hopen dat mijn non-mailining-indicator niet wijzigt als ik een wijzigings formulier instuur....
Door wie?
Heh ja omdat je hun naam misbruikt en zij daar niet blij mee waren, nietwaar?
Laat me niet lachen. Zonder bezoekers is je site niets waard en bewijst het niets. Als men je site niet serieus gebruikt zoals de site van de KVK, bewijst het niets. En de site zal nooit (volledig) serieus genomen worden totdat men de site echt vertrouwt.
Onzin. Je gaf die reactie aan mij, en ik heb geen woord gerept over of het al dan niet mag (want dat zou me echt aan m'n reet roesten). Het lijkt me eerder dat je je te snel aangevallen voelt en daardoor gelijk in de verdediging schiet. Mijn punt is dat je site geen realistisch bewijs is van "dat het kan" totdat het ook in de praktijk een aanzienlijk aantal queries te verwerken krijgt (en doel ik op duizenden queries per seconde van echte gebruikers - niet van voorspelbare testbotjes).Oorspronkelijk geplaatst door Skinkie
Zo hoog van de toren blazen zonder ook maar iets bewezen te hebben, getuigt naar mijn mening van weinig professionaliteit (en daarmee ben je moeilijk serieus te nemen). Je schijnt er overigens wel wat om te geven, want waarom zou je hier anders reageren?
Dat het geen commercieel doel heeft, begrijp ik ook wel. Maar dat betekent niet dat de site helemaal geen doel heeft. Het lijkt me erg sterk dat jij zoiets opzet zonder enige intentie. Al is het enkel maar omwille van je eigen reputatie. Geloof me, wat je project ook is, zonder vertrouwen kom je nergens.
Sphinx zelf niet, maar binnen het CWI zijn er een aantal mensen bezig met een andere vorm van string indexeren. De traagheid komt inprincipe door de ILIKE met op twee kanten een %. Die wordt intern omgezet in een reguliere expressie. De truck die ik momenteel toepas met de length functie zou theoretisch ook in de database zelf geïmplementeerd kunnen worden als alternatief voor \0 terminatie, met als bijkomend voordeel de mogelijkheid om alles wat een constante + variabele als zoek string bevat te kunnen filteren.
Persoonlijk denk ik dat een Sphinx niet overduidelijk beter gaat werken op namen. Je zou natuurlijk wel iets kunnen doen waarbij je een alfabet compressie toepast op bedrijfsvormen, maar zelfs dan moet je voor een steekwoord door alle data heen. Ik verwacht veel meer van iets meer geheugen in de betreffende VM. De data waar doorheen gegaan moet worden is totaal maar iets van 200MB. Daar doorheen zeven is peanuts. Ik denk dan ook dat momenteel eerder het materialiseren van tussenresultaten de bottleneck is dan de daadwerkelijke lookup (~1400ms).
Site gelezen?
Nee, dat konden ze per brief en telefonisch af. De keren dat ik er geweest ben ging het over de integratie van openkvk met dag gegevens van kvk.nl.Heh ja omdat je hun naam misbruikt en zij daar niet blij mee waren, nietwaar?
Ik zou niet weten waarom de site überhaupt iets waard zou hoeven te zijn. Moet dat ofzo? Het zal mij persoonlijk een worst wezen of iemand de site gebruikt. Alles wat ik met de inhoud van de database doe geeft genoeg momentum om wat andere mensen te laten helpen bij update acties.Laat me niet lachen. Zonder bezoekers is je site niets waard en bewijst het niets. Als men je site niet serieus gebruikt zoals de site van de KVK, bewijst het niets. En de site zal nooit (volledig) serieus genomen worden totdat men de site echt vertrouwt.
Maar schijnbaar vond iemand die deze thread startte het belangrijk dat je ook 's nachts even kan zoeken op KvK nummers. Dus ik kan me wel vinden in het feit dat de site wel een complementaire dienst biedt ten opzichte van de huidige website.
Veel succes met testen In de modus waarin de database nu draait is het theoretisch bewezen dat het binnen 10 queries een optimale zelf organisatie heeft bewerkstelligd.Mijn punt is dat je site geen realistisch bewijs is van "dat het kan" totdat het ook in de praktijk een aanzienlijk aantal queries te verwerken krijgt (en doel ik op duizenden queries per seconde van echte gebruikers - niet van voorspelbare testbotjes).
http://portal.acm.org/citation.cfm?id=1559878
Letterlijk niets beters te doen tussen Kerst en Oud en Nieuw. En natuurlijk, hoe meer er over wordt gepraat hoe beter het wordt geïndexeerd op GoogleZo hoog van de toren blazen zonder ook maar iets bewezen te hebben, getuigt naar mijn mening van weinig professionaliteit (en daarmee ben je moeilijk serieus te nemen). Je schijnt er overigens wel wat om te geven, want waarom zou je hier anders reageren?
Als je de site had gelezen had je het doel begrepen. De mogelijkheid om te kunnen aggregeren over data is het grootste doel. Je bent als eindgebruiker niet alleen geïnteresseerd in een enkel resultaat, je wilt ook kunnen weten hoeveel data in een database bevindt, of hoeveel bedrijven op dezelfde locatie gevestigd zijn bij een faillissement.Dat het geen commercieel doel heeft, begrijp ik ook wel. Maar dat betekent niet dat de site helemaal geen doel heeft. Het lijkt me erg sterk dat jij zoiets opzet zonder enige intentie. Al is het enkel maar omwille van je eigen reputatie. Geloof me, wat je project ook is, zonder vertrouwen kom je nergens.
Dat je data op een betere (of zoals je wilt: andere) manier inzichtelijk maakt is meestal al genoeg om mensen aan het denken te zetten. De q-koorts kaart is daar ook wel een voorbeeld van.
Laatst gewijzigd door Skinkie; 28/12/09 om 12:11.
Veel functionaliteit op de site werkt overigens (nog) niet goed. Het is bijvoorbeeld leuk dat er gebruik wordt gemaakt van ajax-functionaliteit, maar je kunt nergens terug klikken. Vervelend als je bijvoorbeeld op postcode zoekt, een lijst bedrijven retour krijgt en op 'meer' klikt.
Doorklikken naar adressen geeft een 'undefined' melding, gaat dus iets niet helemaal lekker. Waarom je kunt doorklikken op het KvK nummer is mij ook nog even onduidelijk.
...Terug zit er nu ook in Thanks.
(bedenk me alleen dat er nog een gevalletje bij >200 resultaten is...)
Die kan ik niet reproduceren in FF of Chromium...Doorklikken naar adressen geeft een 'undefined' melding, gaat dus iets niet helemaal lekker.
Voorbeelden zijn handelsnamen, of hoofdvestigingen.Waarom je kunt doorklikken op het KvK nummer is mij ook nog even onduidelijk.
Als ik op extra toegevoegde handelsnamen zoek vind hij niets. Ook niet wanneer ik op het kvk nummer klik. Net zoals in het KvK handelsregister zou je gewoon de inschrijving moeten zien waarvan het een extra handelsnaam is.
Kan best Als ze op de KvK site niet worden getoond als je op adres zoekt, dan staan ze niet in de database. Vreemd is het overigens wel, want iemand voor je zei wel dat er overige handelsnamen in stonden.
..als ik de data had zou ik het laten zienOok niet wanneer ik op het kvk nummer klik. Net zoals in het KvK handelsregister zou je gewoon de inschrijving moeten zien waarvan het een extra handelsnaam is.
Kan het nog niet terug vinden, klopt?
Ik gebruik hier default IE8. In FF werkt het wel.Die kan ik niet reproduceren in FF of Chromium...
Werkt wat verwarrend als je de hoofdvestiging te pakken hebt. Dan wordt er namelijk alleen gerefreshed. Het zoeken op handelsnaam werkt overigens niet helemaal goed, ik kan een handelsnaam van ons niet terug vinden.Voorbeelden zijn handelsnamen, of hoofdvestigingen.
Ik gebruik nogal een sterke caching Dus je cache moet leeg.
...en ik test niets met IE. Dus daar zal het vast aan liggen.Ik gebruik hier default IE8. In FF werkt het wel.
Zoals hierboven, als de handelsnaam niet wordt weergegeven als je op de adressen zoekt, staan ze er ook niet in. De methode om alle bekende KvK nummers af te lopen gaat minimaal 20x trager als op adres zoeken. Ik heb dat 1x gedaan om concernrelaties te zoeken.Werkt wat verwarrend als je de hoofdvestiging te pakken hebt. Dan wordt er namelijk alleen gerefreshed. Het zoeken op handelsnaam werkt overigens niet helemaal goed, ik kan een handelsnaam van ons niet terug vinden.