Universität Bielefeld - Technische Fakultät
3. Uniform Resource Locators
Ein Uniform Resource Locator ist ein Typ eines URIs. Er wird dazu benutzt,
Ressourcen im Internet konkret zu adressieren. Außer dem URL sind keine
weiteren Informationen notwendig, um auf die darin kodierte Ressource
zuzugreifen.
3.1 Aufbau eines URLs
Das Schema eines URLs besteht aus dem Bezeichner URL: und dem
Übertragungsprotokoll, mit dem eine Ressource erreicht werden kann. Der
Pfad beginnt mit zwei Schrägstrichen //. Diese sollen andeuten,
daß es sich um einen Pfadnamen im Internet handelt. Danach folgen
- ein optionaler Benutzername und ein Paßwort. Diese können bei
ftp- oder telnet-Verbindungen bereits hier angegeben werden. Benutzername und
Paßwort sind durch einen Doppelpunkt zu trennen, ihnen folgt das
at-Zeichen @.
- der Domain-Name des gewünschten Rechners. Dies kann entweder der
Name im Klartext sein, oder auch die zugehörige IP-Adresse.
- eine optionale Port-Nummer. Vom Domain-Namen durch einen Doppelpunkt
getrennt kann eine Port-Nummer angegeben werden, falls ein anderer als der dem
Protokoll standardmäßig zugeordnete Port benutzt werden soll.
- der eigentliche Pfad. Dieser gibt einen "Ort" für die
Ressource an, der je nach dem verwendeten Protokoll unterschiedlich
interpretiert wird. Im Pfad vorkommende Schrägstriche /
implizieren eine hierarchische Struktur. Es können auch die Zeichen
. und .. verwendet werden, um auf bestimmte Ebenen in
dieser Struktur zuzugreifen. Die Ähnlichkeit zur Syntax von Dateinamen
unter UNIX ist eher zufällig. Auch wenn sie z.B. bei ftp-baren Objekten
eine 1:1-Umsetzung des Pfadnamens in einen URL ermöglicht, ist dies bei
anderen Schemata nicht ohne weiteres möglich.
- ein Suchbegriff. Durch ein Fragezeichen ? vom Pfad getrennt,
kann ein Begriff in einer Datenbank gesucht werden, falls der adressierte
Server einen solchen Dienst zur Verfügung stellt.
Bei allen folgenden Beispielen ist der Bezeichner URL: der Einfachheit halber
weggelassen.
3.2 Zur Zeit spezifizierte URLs
Im Augenblick sind eine Reihe von URLs spezifiziert. Mit dem Entstehen neuer
Übertragungsprotokolle werden vermutlich auch neue URL-Formen entwickelt
werden. Sie können dann entsprechend gebildet werden.
3.2.1 ftp
Mit diesem Protokoll kann eine Datei von einem anderen Rechner kopiert werden.
Es werden sowohl anonymous ftp als auch normales ftp unterstützt. Ein
gültiger URL ist z.B.
ftp://ftp.uni-bielefeld.de/pub/networking/rfc/rfc-1100-1199/rfc1149.txt
Damit wird auf die Datei rfc1149.txt.Z zugegriffen, die auf dem ftp-Server
unserer Universität liegt.
3.2.2 telnet
Per telnet kann sich der Benutzer auf einem anderen Computer einloggen und dort
so arbeiten, als würde er direkten Zugang dazu haben.
Um z.B. auf den Katalog der Universitäts-Bibliothek zuzugreifen, kann
man per telnet eine Verbindung zu
telnet://gate2.ub.uni-bielefeld.de
Weiterhin kann in dem URL ein login-Name angegeben werden. Will man z.B. mit
dem Archie-server der Universität Wien nach einem Programm suchen, kann
man sich mit dem URL
telnet://archie@archie.univie.ac.at
als Benutzer "archie" einloggen.
Schließlich kann man noch ein Paßwort mit angeben. So könnte
sich Benutzer foo mit seinem Paßwort bar direkt auf dem Rechner baz
einloggen:
telnet://foo:bar@baz.TechFak.uni-bielefeld.de
Dieses Verfahren ist aber z.B. nur für interaktive Informationsdienste
ratsam, bei denen ein Paßwort unerläßlich ist. Private
Paßwörter sollten auf diese Weise natürlich nicht weitergegeben
werden, da andere Benutzer, berechtigt oder nicht, mit solch einem URL Zugriff
auf den Rechner erhalten würden.
3.2.3 gopher
Mittels gopher können Informationen weltweit verbreitet und mit Hilfe
eines entsprechenden Programms dem Benutzer übersichtlich in Form von
Menues präsentiert werden. Um z.B. das oberste Menu des gopher-Servers
der Vereinten Nationen zu benutzen, kann man ihn über folgenden URL
ansprechen:
gopher://gopher.undp.org/1/
Dabei wird zwischen dem Server und dem eigentlichen Pfad der Typ des Objekts
angegeben. In dem Beispiel bedeutet die 1, daß es sich um ein
gopher-directory handelt. Eine Textdatei wird mit 0 gekennzeichnet.
3.2.4 http
Das World Wide Web (WWW) stellt ein Informationssystem zur Verfügung, mit
dem Hypertexte global zur Verfügung gestellt werden können. Der
Benutzer kann einen Text lesen, in dem Verbindungen zu anderen Dokumenten
vorhanden sind. Durch Anwählen dieser Verbindungen kann eine
weiterführende Hypertextseite aufgerufen werden.
Um die Daten effizient zu übertragen, wurde ein neues
Übertragungsprotokoll, das hypertext transfer protocol (http) entwickelt.
Um an die Home-Page des WWW-Servers der Technischen Fakultät zu gelangen,
muß man folgenden URL angeben:
http://www.TechFak.uni-bielefeld.de/
Der obige URL zeigt nicht auf eine Datei, sondern auf ein Verzeichnis. In
diesem Fall wird in dem Verzeichnis nach einer Default-Datei gesucht, die dann
angezeigt wird. Im Falle des obigen WWW-Servers heißt die Datei
index.html.
3.2.5 WAIS
Mit Hilfe eines WAIS-Servers ist die Volltextrecherche in einer Datenbank
möglich. Dazu muß der Server angegeben werden, auf dem sich die
Datenbank befindet, das Source-File der Datenbank, und nach einem Fragezeichen
der zu suchende Begriff. Ein möglicher URL, um in der CIA-Datenbank nach
Informationen über Deutschland zu suchen, lautet:
wais://gopher.uwo.ca/world-factbook93?Germany
(Siehe dazu auch [3].)
3.2.6 news
Auch Newsgroups können mittels URLs angesprochen werden. Dazu gibt man
als Pfad die Newsgroup an. Optional kann die Message-ID eines Postings folgen,
um dieses direkt anzusprechen. Um z.B. die hauseigene Newsgroup zu lesen,
lautet der URL:
news:unibi.general
Zu beachten ist, daß bei diesem Protokoll keine doppelten
Schrägstriche nach dem Doppelpunkt anzugeben sind, da news auf einem
völlig anderen Prinzip beruhen, als alle anderen Ressourcen.
Insgesamt ist das ganze news-Konzept (noch) nicht mit dem URL-Konzept
verträglich. News sind nicht an eine feste Stelle im Internet, an einen
bestimmten Server, gebunden. Sie werden auf viele Rechner verteilt und nach
einer definierten Zeit wieder gelöscht. Damit ein URL, und insbesondere
auch ein URI Sinn macht, müßte ein Artikel viel länger
erreichbar sein. Dazu könnten z.B. Archivierungssysteme eingerichtet
werden, die die Artikel in allen, oder zumindest in bestimmten, Newsgroups
protokollieren und sie abspeichern. Mit einem geeigneten Verfahren
müßte dann aus einer Message-ID der entsprechende Artikel
zurückgewonnen werden. Bis jetzt ist kein derartiges System in Sicht.
3.3 URLs in der Anwendung
Wie schon angedeutet wurde, ist die Entwicklung des URI-Konzepts eng mit der
Entstehung des World Wide Webs verknüpft. Im WWW werden Ressourcen durch
URLs adressiert, d.h. wenn eine WWW-Seite eine Verbindung zu einem anderen
Dokument enthält, dann wird dies durch die Angabe des URLs dieses
Dokuments realisiert.
Es gibt mehrere Clients, mit denen man sich im WWW bewegen kann. Die
komfortabelsten sind vermutlich NCSA Mosaic und Chimera, die beide eine
X-Window-Oberfläche zur Verfügung stellen. Der Benutzer kann sich
mit Hilfe der Maus durch eine Hypertextseite bewegen. Falls sich auf solch
einer Seite ein Link z.B. zu einem anderen Text, zu einem Bild oder zu einer
Tondatei befindet, kann der Benutzer durch einfaches Anklicken des Links darauf
zugreifen. Er kann sich den Text, das Bild oder die Tondatei auf seinen
Rechner holen und dort entsprechend darstellen (bzw. abspielen) lassen.
Man kann mit Mosaic oder Chimera aber auch die anderen Protokolle benutzen.
Dazu befindet sich in Mosaic unter dem Menupunkt "File" die Option
"Open URL..", bzw. in Chimera der Button "Open".
Wählt man diese Option aus, erscheint ein Requester, in dem man einen
URL eintragen kann.
Die oben angegeben ftp-, telnet-, gopher und http-URLs können direkt
verwendet werden. Mosaic kann darüber hinaus noch news-URLs verarbeiten.
Die Verwendung von WAIS-URLs ist in Mosaic ebenfalls vorgesehen, ist aber zur
Zeit noch nicht in allen Versionen implementiert.
Weiter mit Kapitel 4, zurück zu
Kapitel 2 oder ganz zurück zum
Inhaltsverzeichnis.
Jörn Clausen, 1994-10-06, 1997-08-12