MIT » Dienstleistungen » Sicherheit » Proxy-Cache-Server

Proxy-Cache-Server (Web-Proxy)

WWW-Browser können so konfiguriert werden, dass Webseiten nicht direkt vom Webserver angefordert werden können, sondern über einen sogenannten Proxy-Cache-Server. Diese Funktion wird von allen gängigen WWW-Browsern unterstützt.

  • Wozu wird ein Proxy-Cache-Server gebraucht?
  • Was ist prinzipiell zu tun?
  • Wie benutzt man den Proxy-Cache-Server?

Wozu wird ein Proxy-Cache-Server gebraucht?

Die eigentliche Idee eines Proxy-Cache-Servers (kurz: Proxy) ist, dass alle Daten zentral über den Proxy an die entsprechenden Clients (FTP, WWW, etc.) weitergegeben werden. Genau diese Situation kann man nun ausnutzen, indem man den Proxy-Server veranlaßt, die Daten in einem Puffer (= Cache) zwischenzuspeichern. Greift ein Client auf eine Seite im Internet zu prüft der Proxy, ob der Inhalt bereits angefordert wurde. Wenn ja, erhält der Client den Inhalt aus dem Cache des Proxy-Servers, wenn nein fordert der Proxy den Inhalt der Seite an und leitet ihn an den Client weiter.

Aus dem Medizinischen Versorgungs-Netz ist der Zugriff auf das Internet nur über Proxy-Server möglich.

Was ist prinzipiell zu tun?

Wie die Konfiguration eines Browsers im einzelnen zu geschehen hat, wird im folgenden Abschnitt erläutert. Die Konfiguration ist zwischen den Browsern geringfügig anders, das Prinzip ist das gleiche: In den Optionen des Browsers muss der Name des Proxy-Servers und der Port eingetragen werden, evtl. gibt man auch noch eine Liste von Servern an, für die der Proxy nicht verwendet werden soll.

Wie benutzt man den Proxy-Cache-Server?

Automatische Konfiguration

Bei Browsern, die diese Funktionalität unterstützen, wird die URL zu der vom Provider genannten Autokonfigurations-Datei in die Konfigurationsoptionen eingetragen. Der Browser übernimmt dann die Konfiguration automatisch und prüft vor jedem Starten, ob sich Änderungen ergeben haben.

Innerhalb des MedVer-Netzes muss folgende Adresse der Autokonfigurationsdatei eingetragen werden:

http://pac0.info.med.uni-muenchen.de

Hinweis: Die Autokonfigurations-Datei ist nicht im Browser anzeigbar.

Beispiele

Firefox

Extras --> Einstellungen ... --> Erweitert --> Netzwerk --> Einstellungen... --> Automatische Proxy-Konfigurations-URL

URL: http://pac0.info.med.uni-muenchen.de

Neu laden

OK

MS-Internet-Explorer 8.x

Extras --> Internetoptionen... --> Verbindungen -- > LAN-Einstellungen --> Automatisches Konfigurationsscript verwenden (aktivieren)

Adresse: http://pac0.info.med.uni-muenchen.de

OK

Manuelle Konfiguration

Für Browser, die keine automatische Konfiguration unterstützen, kann der Proxy auch manuell konfiguriert werden. In diesem Fall lautet der Name des Proxys medwww.med.uni-muenchen.de, der zu verwendende Port ist 8080. Bei der Verwendung der manuellen Konfiguration können die Zeitschriften der Universitätsbibliothek nicht genutzt werden. Hier ist zwingend die automatische Konfiguration nötig.

Warum liefert der Proxy "alte" Seiten?

  1. Man muss zunächst zwischen HTML und HTTP unterscheiden:
    • HTML ist die Sprache, in der die Informationen im Web vermittelt werden.
    • HTTP ist das Protokoll, das die Funktionsweise der Informationsübertragung regelt.
  2. Der Verfasser einer Seite kann im HTML-Header ein Verfallsdatum angeben - z.B.: <META http-equiv="expires" content="Wed, 28 Jul 1999 20:30:00 GMT">
  3. Der Web-Server kann diese Information auswerten, d.h. daraus einen entsprechenden HTTP-Eintrag erzeugen.
  4. Wenn eine Expiry-Information in HTTP übermittelt wird, fordert der Proxy zum angegebenen Zeitpunkt eine neue Version an. Liegt diese Information nicht vor wird eine neue Version der Seite einen Monat nach dem letzten Abruf angefordert.
  5. Da oft kein Verfallstermin angegeben wird hat der Proxy-Server keine Möglichkeit, das Alter der Seite zu bestimmen. Der Proxy wird dadurch gezwungen, nur zeitgesteuert neue Seiten anzufordern.
  6. Ein weiteres Problem ist, dass manche Leute weit vergangene Expiry-Daten eintragen; Beispiel:
    <META http-equiv="expires" contents="Sat 06 Jan 1990 12:00:00 GMT">
    Sinnvoller wäre es natürlich, einen realistischen Wert einzusetzen wie z.B. den voraussichtlichen Zeitpunkt der nächsten Überarbeitung.
    Folgende Einträge sind dagegen möglich:
    <META http-equiv="expires" contents="now"> bzw.
    <META http-equiv="pragma" contents="no-cache">
  7. Ein Proxyserver kann mit mit gedrückter Alt- oder Shift-Taste gezwungen werden, die neueste Version einer Seite zu laden. (sog. "PowerReload").

Fazit

Der Proxy kann eine verfallene Seite nur neu anfordern, wenn die Verfallsinformation vom Server über HTTP zur Verfügung gestellt wird.

Dem Server (bzw. seinem Betreiber) ist es freigestellt, evtl. im HTML-Header enthaltene Verfallsangaben in HTTP umzusetzen.

Diese Seite wurde zu einem Großteil kopiert von den Webseiten des LRZ.