So, war jetzt vermutlich doch einfacher als Gedacht, die Lösung.
Vorher etwas Allgemeines dazu.
Die komischen Links können entstehen, wenn man die Seite mit verfälschter URL aufruft. Das muss keine Absicht (Spammer) sein. Es kann auch passieren, wenn die Seite einfach nur durch eine Unachtsamkeit oder einen Fehler in einem Script falsch verlinkt wird.
So wie dieses Beispiel hier:
<a href="http://www.cloneportal.de/register-me.html'''">link</a>Wenn man diesem Link jetzt folgt, wird die Seite ganz normal angezeigt. Fährt man aber dort mit der Maus über die Links sieht man in der Statusleiste des Browsers, dass die Links verfälscht wurden. z.B.:
#
http://www.cloneportal.de/register-me.html'''#search#
http://www.cloneportal.de/register-me.html'''/Content.html#
http://www.cloneportal.de/register-me.html'''/Downloads.html#
http://www.cloneportal.de/register-me.html'''/Impressum.htmlDer verfälschte Dateiname wird als Unterordner in die URL aufgenommen.
Klickt man sich jetzt durch die Seite und folgt diesen Links, dann wird die Seite wie beschrieben ohne Styles angezeigt. Die Stylesheets werden nicht geladen, weil sie im nicht vorhandenen Unterordner gesucht werden. Der Aufruf sieht so aus:
http://www.cloneportal.de/register-me.html%27%27%27/themes/element/style/style.css und das gibts halt nicht...
Weiterer Effekt durch den "angenommenen" Unterordner ist, dass jetzt alle in der Seite enthaltenen Elemente, ebenfalls in dem Unterordner gesucht werden:
http://www.cloneportal.de/register-me.html%27%27%27/images/language/flag-german.png . Die Bilder werden z.B. nicht gefunden.
Durch mod_rewrite wird aber
http://www.cloneportal.de/register-me.html auf die modules.php umgeleitet, was wiederum dazu führt, dass diese ganzen Einträge in der Referer Liste erscheinen.
Also kein Spammer, sondern eine Verkettung ungünstiger Umstände, bzw. tatsächlich z.T. ein Fehler in unserer Standard mod_rewrite .htaccess.
Einfache Lösung:In der .htaccess, die in pragmaMx für mod_rewrite mitgeliefert wird, finden sich folgende Einträge:
# individuelle Rewrite-Regeln:
RewriteRule ^home\.htm(l?) index.php [L]
# Your_Account Modul:
RewriteRule ^register-me\.htm(l?) modules.php?name=User_Registration [L]
RewriteRule (^myaccount|^log-me-in)\.htm(l?) modules.php?name=Your_Account [L]
RewriteRule ^log-me-out\.htm(l?) modules.php?name=Your_Account&op=logout [L]
RewriteRule ^mydata\.htm(l?) modules.php?name=Your_Account&op=edituser [L]
RewriteRule ^mysettings\.htm(l?) modules.php?name=Your_Account&op=edithome [L]
Hier sehen wir u.A. den Eintrag für register-me.html, aus dem Beispiel.
^register-me\.htm(l?) bedeutet, dass alle Aufrufe, die mit
register-me.htm oder
register-me.html beginnen, auf das User_Registration Modul umgeleitet werden.
Beginnen!! also auch
register-me.html''', wo ja noch was dranhängt. Das darf nicht sein, denn eine HTML-Datei mit dem Namen
register-me.html''' gibt es nicht und als Modulaufruf soll dieser Aufruf auch nicht gelten.
Die rewrite Regel muss in so fern geändert werden, dass alles was hinter
.html kommt, entweder ignoriert wird, bzw. wenn was dran hängt, der Server einen Fehler zurückgibt (404).
Das erreicht man so:
RewriteRule ^register-me\.html$ modules.php?name=User_Registration [L]
Zauberzeichen ist dabei der Dollar $

Die Zeilen der .htaccess sollten also wie folgt geändert werden:
# individuelle Rewrite-Regeln:
RewriteRule ^home\.html$ index.php [L]
# Your_Account Modul:
RewriteRule ^register-me\.html$ modules.php?name=User_Registration [L]
RewriteRule (^myaccount|^log-me-in)\.html$ modules.php?name=Your_Account [L]
RewriteRule ^log-me-out\.html$ modules.php?name=Your_Account&op=logout [L]
RewriteRule ^mydata\.html$ modules.php?name=Your_Account&op=edituser [L]
RewriteRule ^mysettings\.html$ modules.php?name=Your_Account&op=edithome [L]
Jetzt gibt es noch solche Fehlaufrufe:
http://www.cloneportal.de/IRGEND_EIN_MIST_DEN_ES_NICHT_GIBT/register-me.html.
Folgt man dem Link, wird die Seite ebenfalls kurz ohne Styles angezeigt, bevor weitergeleitet wird. Auch von diesen Aufrufen werden sich massenweise unsinnige Einträge in den Referern finden.
Gegen den Aufruf kann man nichts machen, ist ja auch nichts schlimmes, anstellen kann man damit nichts.
Eine Lösung dafür habe ich gerade in Arbeit. In pragmaMx 0.1.11 wird das dann wahrscheinlich drin sein....
PS:
die oben genannten Links auf cloneportal.de, lassen sich genau so im Moment auch auf danielf's Seite nachvollziehen.
http://www.potsdamnews.de/register-me.html'''Nur wird er ja jetzt das Problem beheben und dann würden die Beispiele fehlen

Auf cloneportal.de lass ich das jetzt mal so, bis zum erscheinen der 0.1.11...
PS 2:
Das ist vermutlich genau das gleiche Problem was auch Grafikmurkser hatte:
http://www.pragmamx.org/Forum-topic-29080.htmlNur waren wir zu sehr auf die bösen Spammer eingeschossen. Im Prinzip hatten aber die bot-trap Leute recht, es liegt hauptsächlich am mod_rewrite des eingesetzten CMS....