Het is te hopen dat je dat allemaal geautomatiseerd hebt want als je dat met de hand gedaan hebt

Semi-geautomatiseerd

...volautomatisch heeft nl een aantal nadelen:
- Bij automatisch verzamelen van site-gegevens die niet echt als stats worden gepubliceerd, ben je in veel landen al snel strafbaar bezig. Bovendien is het binnen de "scene"

een soort sport om uit te puzzelen hoe je met zo weinig mogelijk moeite tóch 100% legaal aan je data kunt komen en je hebt niks aan grafiekjes als je ze aan niemand kunt laten zien (behalve misschien aan de rechter

).
- Eén foutje in je script of één nivo te diep in je search-programma en de site kan overbelast raken, je wordt geblokkeerd, je PC loopt vast, of allemaal tegelijk. Volgens mij staat het wereldrecord "Pf-pagina's bekeken" nog steeds op naam van degene die in ±2004 al dan niet per ongeluk had geprobeerd een offline kopie van Pf te maken en niet besefte dat door de manier hoe alles op Pf onderling verbonden is, je bij ±4 nivo's diep al in een lus komt te zitten (zie voetnootje onderaan).
- Voor een eenmalige & relatief kleinschalige automatische datazoekaktie moeten je gegevens echt zo eenvormig mogelijk zijn. Dat is bijvoorbeeld het geval als je de woonplaats wil weten van de eerste 5000 random profielen waarin een woonplaats staat, want die staat er of die staat er niet.

De fotosectie is
niet eenvormig, omdat o.a. de eerste datum op de eerste pagina met reakties soms de datum van de eerste reaktie is en soms ook niet. Je moet in zulke gevallen vaak zó veel "als dit, dan dat"-voorwaarden inbouwen dat je bij een script-voor-eenmalig-gebruik langer met het debuggen van je script bezig kunt zijn dan wanneer je alles met de hand had overgenomen.
- Automatische dataverzamelscripts hebben geen "wacht even... klopt dit wel?"-ingevingen, waardoor je belangrijke dingen over het hoofd kunt zien en/of erg veel tijd kwijt bent aan controle-steekproeven.
Voor de "datum eerste reaktie + aantal pagina's reakties" heb ik een "list generator"-scriptje gebruikt (
bron) dat een pagina met snelkoppelingen genereert naar de eerste pagina met reakties van opeenvolgende shoots. Je zit dan inderdaad een aantal uur "klik, copy-paste, copy-paste, alt-left, tab, enter, copy-paste, copy-paste, alt-left, tab, enter, copy-paste, copy-paste, alt-left, tab, enter..." maar dat is al snel één vloeiende beweging en je hoeft achteraf geen controle-steekproeven te doen.
Het door mij gebruikte listgenerator-scriptje (feel free to try):
<html>
<body bgcolor="#FFFFCC">
<h1 align="center"><font color="#CC0000">Ka-Blam!</font></h1>
<p>
<script type="text/javascript">
<!--
var startnum = 2000;
var endnum = 2100;
var incnum = 1;
while(startnum <= endnum)
{
document.write("<a href=https://partyflock.nl/gallery/" + startnum + "/comments/PAGE/1.html>shoot " + startnum + "</a> ");
startnum = startnum + incnum;
}
//-->
</script>
</p>
</body>
</html>
Kopiëren naar Kladblok, wegschrijven met .htm extensie, openen als internet-pagina, eventueel bevestigen dat je dit script wil uitvoeren en je krijgt een browser-pagina met linkjes die rechtstreeks naar de gewenste pagina's verwijzen. In het voorbeeldscript gaan we van shoot 2000 (startnum) met steeds 1 omhoog (incnum) naar shoot 2100 (endnum), maar je kunt bij die drie waarden in feite alles invullen wat je wil.
verbaas me er eerlijk gezegd over dat dit onderwerp niet meteen doodgeluld is met onzin/troep.
Waarschijnlijk geschrokken van al dat serieuze statstiekgedoe.
Uitspraak van verwijderd op zondag 27 december 2009 om 12:43:
Excel?
Gnumeric.
Voetnootje-met-enige-uitleg: als je met een site-kopiëerprogramma een offline-kopie wil maken, moet je opgeven tot hoe ver de links op de te kopiëren pagina moeten worden gevolgd. Als ik een offline-kopie van "partyflock.nl" maak en ik ga 0 nivo's diep, krijg ik alleen de voorpagina. Bij 1 nivo diep krijg ik de voorpagina, plus alle pagina's waar op de voorpagina een link naartoe staat. Bij 2 nivo's worden ook alle pagina's gekopiëerd waar de pagina's die een link op de voorpagina hebben een link naartoe hebben, enzovoort, enzovoort. Bij een site als Pf waar alles intern aan elkaar is gekoppeld en naar elkaar terugverwijst, kom je al snel in een lus terecht of je komt met miljoenen pagina's te zitten, als bv links in het profiel van een user die op het forum heeft gepost, terugleiden naar het forum, weer naar die user, weer naar het forum, weer naar die user, weer naar het forum, weer naar die user, weer naar het forum....
(er komen nog meer antwoorden, maar ik heb ook een heeeeeeeeeeleboel andere dingen te doen vandaag (F))