zurückInhaltweiter

Startseite

Natürliche Verhaltensstrategien als Vorbild für technische Systeme

Prof. Dr.-Ing Alois Knoll


  • Zusammenfassung
  • Stand der Forschung
  • Eigene Vorarbeiten
  • Ziele und geplante Arbeiten
  • Beispiele für Promotionsthemen
  • Bezüge zu anderen Projekten
  • Literatur

    Zusammenfassung

    In diesem Teilprojekt sollen Verhaltensstrategien biologischer Systeme im Hinblick auf ihre technische Umsetzbarkeit untersucht werden. Zur Implementierung und experimentellen Validation stehen mobile sensorgeführte Kleinroboter, mehrere kooperierende Handhabungsroboter sowie ein Netzwerk von aufgabenorientiert gesteuerten aktiven Sensoren zur Verfügung.

    Verhaltensstrategien sollen die an langfristigen Zielen orientierte Kooperation mehrerer mobiler und stationärer Roboter ermöglichen, wobei das Ziel in der Montage eines einfachen Aggregats unter Einschluß des Problems des Heranschaffens und der Übergabe von Montageteilen besteht. Verhaltenssteuerungen sollen realisiert werden für diejenigen Verhaltensmuster, die bei der Verfolgung der Strategien notwendig sind. Also sind geeignete Rechen- und Regelungsmodelle mit realen Sensoren und Aktoren in geeigneten Experimentierumgebungen zu bilden und zu testen. Die vorhandenen Geräte können von den anderen Teilprojekten mitgenutzt werden.


    Stand der Forschung

    Der simulative oder reale Aufbau technischer Systeme durch Beobachtung des Verhaltens und/oder der Konstruktionsprinzipien von Lebewesen (bislang hauptsächlich Insekten) ist Ziel des Gebiets ,,Artificial Life``(Gerhardt und Schuster, 1995; Levy, 1993; Langton, 1988). Bereits existierende Systeme sind mobile Roboter, Manipulatoren, aktive Sichtsysteme, künstliche Schlangen, Hunde, und weitere ,,Spezies``, wobei einige das Verhalten echter Lebewesen imitieren.

    Eine bekannte Steuerungsstruktur ist die ,,Subsumption`` (Brooks 1986), die aus parallel arbeitenden verteilten Komponenten besteht. Ihr Hauptvorteil gegenüber ,,monolithischen`` Ansätzen besteht darin, daß ihr Verhalten modular konstruiert werden kann, die Perzeptions-Aktions-Strecke wesentlich verkürzt und dadurch die Robustheit des Systems erhöht wird. Ein Hauptproblem an dieser Architektur besteht darin, daß entsprechend aufgebauten Systemen keine sinnvollen Aufgaben zur Durchführung vorgelegt werden können, weil nur datengetriebenes, und daher im Sinne einer Aufgabenorientierung zielloses Verhalten realisierbar ist.

    Der Aufbau autonomen Verhaltens für mobile Roboter wird in (Steels und Brooks 1995) diskutiert. Wie ein Verhalten für einen mobilen Roboter entworfen und programmiert werden kann, wurde in (Arkin 1987) erläutert. Für eine Diskussion von Möglichkeiten zur Integrations von reaktivem und deliberativem Verhalten, siehe (Sahota, 1995) und (Zhang et al 1996). Eine Implementierung am Beispiel eines mobilen Roboters findet man in (Arkin, 1990). (Jones & Flynn 1993) beschreibt die Aspekte der technischen Umsetzung eines autonomen mobilen Roboters: Mechanik, Sensoren, Rechner sowie Programmierung. Als aktiver Sensor wurde in (Daily & Payton 1992) das Verhalten eines Augen-Kopf-Systems eingeführt, (Vieville & Faugeras 1991) beschreibt einen interessanten Ansatz zum Entwurf einer modularen Architektur für aktive Sichtsysteme basierend auf ,,Reflexen``.

    Ein vielversprechendes neues Gebiet zur Modellierung und Implementierung von Verhalten ist die Verbindung von Fuzzy-Theorie, Neuronalen Netze und Genetischen Strategien. Das bis jetzt erfolgreichste Einsatzgebiet der Theorie der Fuzzy-Mengen und -Logik ist die Fuzzy-Steuerung (``Fuzzy Logic Controller'', FLC). Neben vielen anderen Steuerungs- und Regelungsproblemen wurde FLC auch in Steuerungen von Robotersystemen eingesetzt. Für einen Überblick über solche Anwendungen siehe (Zhang, 1993). Sugeno und Nishida präsentierten 1985 ein mit FLC gesteuertes Modellauto, das dem Verlauf einer kurvigen Straße folgt (Sugeno & Nishida 1985). Maeda entwarf ein auf einem Sichtsystem basierendes FLC-Konzept für einen mobilen Roboter (Maeda et al, 1991).


    Eigene Vorarbeiten

    Die Arbeitsgruppe ,,Technische Informatik`` befaßt sich mit der Untersuchung von technischen Verfahren zur Bildung und Fusion von Verhalten (mobilen Wesen, handhabungsfähige Roboter, aktive, intensionsgesteuerte Perzeptoren). Es kommen diverse technische Sensoren und Aktoren sowie ihre intelligenten Verbindungen zum Einsatz, die unterschiedliche Verhaltensmuster realisieren.

    Kooperierende Arme
    Greifen, Zusammentragen, Kraftregelung, Befolgung eines Befehls, Makro-Befehle zur Montage.

    Mobile Roboter
    Zielfahrt, Kollisionsvermeidung, Konturverfolgung, Geschwindigkeitseinhaltung, Kooperation mit stationären Mechanismen und anderen Individuen.

    Künstliche Sichtsysteme:
    visuell geführte Hand-Lokalisierung, Objekt-Verfolgung, Fokussierung, Koordination von mehreren Augen, Abgleich von Umweltmodellen.

    Die technische Implementierung der Verhaltensmuster basiert zum gegenwärtigen Zeitpunkt unter anderem auf einem adaptiven B-Spline-Modell, welches Verhaltensmodelle biologischer Vorbilder (etwa des Menschen) bei der Bewegungssteuerung symbolisch und qualitativ modellieren kann. Um z.B. die Unterzielfahrt des mobilen Roboters von externen Ereignissen abhängig machen zu können, wurde ein spezieller Algorithmus entworfen, der mehrere unscharfe Regelbasen auswertet. Damit kann der Roboter unter Auswertung von on-line-Sensordaten von einem Startpunkt entlang einer vorgegebenen Unterzielfolge zu einem Zielpunkt fahren.

    Um die Bewegungssituation möglichst korrekt zu bewerten, werden sowohl die statischen als auch die dynamischen Informationen über die Umgebung ausgenutzt. In einer teilweise bekannten Umgebung stehen sowohl die on-line vom Sensorsystem gemessenen Sensorwerte als auch die erwarteten Sensordaten zur Verfügung. Solche Informationen bilden die Eingangsdaten für die Situationsbewertung. Die Ausgänge der Situationsbewertung sind die Zustandsvariablen, welche die notwendigen Informationen für die Steuerung bzw. die neue Planung mit ,,unscharfen`` Formen anbieten. Solche unscharfen Zustände lassen sich durch die Eingangsvariablen mit unscharfen Regeln in ,,Wenn-Dann``-Form realisieren, z.B.


    WENN Situation_Bewertung IST für_Verhalten_i DANN aktiviere_Verhalten_i


    Da unscharfe Signale ausgewertet werden, können gleichzeitig mehrere Verhalten aktiviert werden (Zhang et al, 1996).

    Das B-Spline-Modell wird gegenwärtig auf allgemeine Fragestellungen der Modellierung und der Regelung erweitert. Es kann als eine ideale technische Realisierung von CMAC (Cerebellar Model Articulation Controller) angesehen werden (Zhang & Knoll, 1997). Es zeigt gute Nachbildungseigenschaften für nichtlineare Systeme, glatte Ausgänge sowie schnelle Konvergenz beim Lernen. Für Anwendungen in überwachtem und unüberwachtem Lernen siehe (Zhang & Knoll, 1998) und (Zhang et al, 1997). Durch Verbindung des Verfahrens mit der Karhunen-Loève-Transformation (Principal-Components-Analysis, PCA) kann ein hochdimensionaler Systemeingangsraum in einen reduzierten Eigenraum abgebildet werden und dann direkt durch ein adaptives B-Spline-Modell zu den gewünschten Ausgängen geleitet werden (Zhang & Knoll, 1998a), um auch aus hochdimensionalen Eingangsdaten ein sinnvolles Verhalten ableiten zu können. Dieses Vorgehen scheint uns ideal dafür geeignet, beliebige Vorgaben für Abhängigkeiten zwischen Systemeingang und -ausgang zu machen und diese (ggf. nach einer kurzen Lernphase) fast beliebig genau annähern zu können. Speziell interessant scheint uns die Möglichkeit des Navigierens in komplexen realen Umgebungen, die dafür nicht mit speziellen landmarks versehen werden müssen.

    Ziele und geplante Arbeiten

    Die Entwicklung von Verhaltensstrategien aus der Beobachtung biologischer Vorbilder, ihre Projektion auf Verhaltensmuster realer oder simulierter Systeme und deren Verhaltenssteuerung stellen jeweils schon für sich genommen äußerst komplexe Problembereiche dar. In diesem Teilprojekt soll deshalb zur Konzentration auf ausgewählte Fragestellungen zunächst ein Szenario formuliert werden, welches einerseits die Entwicklung weniger, dafür aber mächtiger Strategien und ebensolcher Steuerungen erfordert und andererseits den Aufbau eines interessanten Experimentierumfelds ermöglicht.

    Generelle Aufgabe soll die Montage einfacher Aggregate durch Kooperation kleiner mobiler sowie stationärer Roboter unter Mitwirkung eines Netzwerks aktiver Sensoren sein. Diese Aggregate bestehen aus leichtgewichtigen Elementen eines einfachen Spielzeug-Holzbaukastens und sind damit sowohl für den Transport durch die mobilen als auch zur Handhabung durch die stationären Roboter geeignet. Strategisches Ziel der Kooperation ist die Bewältigung der jeweils vorgelegten Montageaufgabe. Verhaltensmuster des Sensornetzwerkes sind die Erkennung des jeweils interessanten Umweltabschnitts, ihre Bewertung und der Eingriff in die Umwelt durch rückgekoppelte Ansteuerung der aktorischen Komponente. Extern beobachtbare (aktorische) Verhaltensmuster sind etwa der Transport, das Verschieben, die Übergabe von Elemente der Aggregate sowie natürlich die eigentlichen Montageoperationen.

    Die Sensoren - und bei bestimmten Aufgabenstellungen auch die Aktoren - bilden ein Netz von interagierenden, in ihrem Verhalten weitgehend autonomen Einheiten. Sie arbeiten je nach Situation gemeinsam oder aber auch in Konkurrenz zueinander an der Lösung von Teilaufgaben, die zur Erfüllung des strategischen Ziels erforderlich sind. Das Sensornetz und die beteiligten Aktoren organisieren sich mit Hilfe von allgemeinen und aufgabenspezifischen Kriterien, beispielsweise Zeitvorgaben, Kosten- und Gütefunktionen. Diese Selbstorganisation geschieht durch Nachrichtenaustausch vor und während der Aufgabenbearbeitung. Gegenstand der Untersuchungen zur technischen Umsetzung müssen deshalb auch die Formate der Beschreibungen, ihre verbundene Semantik, die im Zusammenhang der Aufgabenstellung angepaßte Abstraktion, die Darstellung von Wissen über die räumliche Szenenkonstellation und die Fähigkeiten der anderen beteiligten Sensoren und Aktoren, die Eignung der Beschreibungen und Ergebnisse für Sensordatenfusionen und die effiziente Auswertung der Beschreibungen (nach Möglichkeit in Echtzeit) sein.

    Bislang konnte in technischen Systemen nur ein winziger Ausschnitt von biologischen Verhaltensmustern nachgebildet werden. Bereits einfache Lebewesen weisen jedoch einen wesentlich größeren Schatz auf. Um diese umsetzen zu können, müssen Forschungsergebnisse aus mehreren anderen Gebieten wie Biologische Kybernetik, Verhaltenswissenschaft, Physiologische Psychologie, Neuroinformatik und Evolutionäre Strategien studiert und auf ihre technische Umsetzbarkeit hin untersucht werden.

    Die folgenden Themen können im Rahmen des Teilprojekts bearbeitet werden:

    Nachbildung elementaren Verhalten einfacher Lebewesens
    Es ist zuerst zu prüfen, welche Verhaltensmuster aus welchen sensorischen Reizen resultieren und welchen Typs die Verbindung jeweils ist. Kann eine Verbindung am besten über eine neuronale Abbildung, eine Hierarchie, Regel-Inferenzen oder über Planung modelliert werden? Was ist die kleinste ,,ununterbrechbare`` Einheit eines Verhaltens? Wie kann man die Fusion von primitivem Verhalten, die dann eine Aktion von gewisser Komplexität aufweist, modellieren? Wenn ein Eingang-Ausgangs-System modelliert wird, wie sieht eine Struktur dafür aus? Wird jedes meßbare Signal als ein Eingang des Systems modelliert? Wieviele Dimensionen kann ein Lebenwesen behandeln und wie? Dabei ist wichtig zu untersuchen, was das Verhältnis symbolischer und kognitiver Verarbeitung zu Reflexen ist: wo ist die Grenze?

    Untersuchung der Wechselwirkung von Roboterverhalten in realen Umgebungen
    Ein generelles Verfahren zur Untersuchung des Zusammenspiels mehrerer Fuzzy-Verhalten dürfte in der Untersuchung der Frage liegen, wie mehrere Verhalten, wie z.B. Markenannäherung, Verfolgen anderer Roboter, Fahrt zur Lichtquelle usw., die separat entwickelt bzw. optimiert werden, in einer realen Umgebung mit mehreren Zielen möglichst konfliktfrei und effizient gemischt werden können. Verhalten von Lebewesen besteht offensichtlich nicht nur aus einfacher Addition von zerlegbaren primitiven Verhalten, sondern einer oder mehrerer nicht-linearer Funktionen. Prinzipien der Fusion von Verhaltensmustern sowie ihre technische Umsetzung müssen untersucht werden. Eine allgemeine Lösung dürfte nicht nur durch eine algebraische Funktion, sondern mit Hilfe eines nichtlinearen Modells erzielt werden. Die Frage ist also, wie eine solche Funktion aussehen kann. Wie ist sie parametrisiert? Wie kann sie in das Neuro-Fuzzy-Paradigma integriert werden?

    Situationserkennung und -bewertung anhand von dynamischen numerischen Sensordaten
    Welche Rolle spielt das Symbol im Verhalten eines künstlichen Systems? Wie werden Symbole erkannt, klassifiziert, dargestellt? Wie werden sie weiter in der Planausführung eingesetzt? Wie wird eine Situation, oder ein ,,Szenario`` erkannt? Wie wird eine erkannte Situation eingesetzt für die Aktivierung von entsprechenden primitiven Verhaltensmustern?

    Lokalisierung und Navigation
    Lachse können aus einer Entfernung von über tausend Kilometern wieder zu ihren Brutstellen zurückkehren. Eine Brieftaube kann ihr Ziel finden, egal ob das Wetter gut oder schlecht ist. Die jetzigen Robotersysteme können aber nur anhand von künstlichen Markierungen in sehr eingeschränkten Bereichen navigieren. Dabei ist das zentrale Problem das Modell der Repräsentation: Wie können Sensordaten aus verschiedenen Quellen robust und schnell zu einem aufgabenorientierten Resultat verarbeitet werden? Wie ist die Rolle des visuellen Systems im Verhältnis zu anderem sensorischem Input? Es ist hier vorrangig zu untersuchen, ob lokale Merkmale oder globales ,,Aussehen`` der entscheidende Faktor bei der Navigation sind. Zusätzlich ist es auch technisch von großer Bedeutung, ein robustes und schnelles Verfahren zur Erkennung von Merkmalen über Sensoren wie Kameras, Kraftsensoren, Ultraschall, Geruchssensoren, Laser und Mikrophonen zu finden.

    Evolution
    Die konventionelle technische Steuerung und Regelung wird über intensive Interaktion in Form von ,,Entwurf-Test`` Zyklen realisiert und verbessert. Demgegenüber kann ein biologisches System ohne irgendeinen ,,Designer`` sich selbst verbessern und an eine neue Umgebung anpassen. Was kann erlernt werden? Welche Modelle stehen dem Lernen von Verhalten zur Verfügung? Genetische Algorithmen, die auf dem biologischen Evolutionsprinzip basieren, dürften bei der Generierung von ausreichenden Beispieldaten zur weiteren Optimierung sehr hilfreich sein. Es ist zusätzlich zu untersuchen, was der systematische Weg für ein Lebewesen ist, aus einfachem, nicht vollständigem Verhalten über Evolution, über tägliche Interaktion mit der Umwelt seine Funktion zu lernen und verbessern. Schließlich: Wie kann eine künstliche Evolutionstrategie in einem realen Sensor-Aktor-Zyklus eingesetzt werden?


    Beispiele für Promotionsthemen

    Promotionsthemen ergeben sich direkt aus den geplanten Arbeiten. Mögliche Arbeitstitel könnten sein:
  • Nichtlineare Modellierung des Input-Output-Verhaltens einfacher Lebewesen und ihre technische Umsetzung
  • Lokalisierung und Navigation mobiler Roboter in unstrukturierten Umgebungen
  • Integration von Verhalten und Sensorinput (enge Sensor-Aktor-Kopplung) in biologischen und in technischen Systemen
  • Adaption von Verhalten in realen Umgebungen
  • Generalisierung von Sensor-Aktor-Fähigkeiten über eine symbolische Darstellung

    Bezüge zu anderen Projekten

    Außer für die praktische Umsetzung der in diesem Teilprojekt erarbeiteten Ergebnisse steht die gesamte Experimentierumgebung der Gruppe ,,Technische Informatik`` allen anderen Teilprojekten zur Verfügung.
    Umgekehrt kann in diesem Teilprojekt von den folgenden geplanten Arbeiten in anderen Teilprojekte profitiert werden:

    AG Albers:

  • Aggretation mehrdimensionaler Informationen
  • Modellierung von Entscheidungsprozessen
  • Steuerung von Anspruchsanpassung

    AG Bischof:

  • Studium visueller Kanäle und ihrer wechselseitigen Beeinflussung in bestimmten Konfliktsituationen
  • Neuronale Reaktionen von gleichzeitigen oder zeitversetzten Reizungen

    AG Cruse:

  • Auswahl zwischen verschiedenen Verhaltensweisen bzw. Verhaltensagenten
  • Speicherung von bestimmten Verhaltensweisen im prozeduralen Gedächtnis und dessen Verhältnis zum deklarativen Gedächtnis

    AG Egelhaaf: Neuronale Verarbeitung und Auswertung von Bewegungsinformationen aus dem visuellen Kanal

  • Repräsentation von Bewegungsinformationen
  • Aufmerksamkeitssteuerung und sensomotorische Steuerung
  • Nutzung von Optical Flow für die Bewegungssteuerung

    AG Ritter/Sagerer:

  • Strategien zum Wissenserwerb bei kollektiv kooperierenden und konkurrierenden Lernern
  • Konfliktresolution bei kurzfristiger und langfristiger Verhaltensoptimierung
  • Planerstellung für Aktionsfolgen
  • Sensordatenaggretation bei partieller Beobachtung

    Literatur

    R. C. Arkin. Motor schema based navigation for a mobile robot: An approach to programming by behavior. Proceedings of the IEEE International Conference on Robotics and Automation, pages 264-271, 1987.

    R. C. Arkin. Integrating behavioral, perceptual, and world knowledge in reative navigation. Journal of Robotics and Autonomous Systems, (6):105-122, 1990.

    R. A. Brooks. A robust layered control system for a mobile robot. IEEE Journal on Robotics and Automation, RA-2:14-23, April 1986.

    M. J. Daily and D. W. Payton. Behaviour-based control for an eye-head system. SPIE Vol. 1825 - Intelligent Robots and Computer Vision XI, pages 722-732, 1992.

    M. Gerhardt and H. Schuster. Das digitale Universum. Vieweg, 1995.

    J. F. Jones and A. M. Flynn. Mobile Robots: Inspiration to Implementations. A. K. Peters, Wellesley, Massachusetts, 1993.

    C. Langton.
    Artifical Life, pages 1-46. in ``Artificial Life'', SFI Studies in the Sciences of Complexity. Ed. C. Langton, Addson-Wesley Publishing Company, 1988.

    S. Levy. Künstliches Leben aus dem Computer. Knaur Nachf. München, 1993.

    M. Maeda, Y. Maeda, and S. Murakami. Fuzzy drive control of an autonomous mobile robot. Fuzzy Sets and Systems, 39:195-203, 1991.

    Michael K. Sahota. Reactive deliberation: An architecture for real-time intelligent control in dynamic envuironments. In IJCAI, pages 1303-1308, 1994. Integration of plannng and control. Definition of behaviour.

    L. Steels and R. Brooks (editors). The Artificial Life Route to Artificial Intelligence: building Embodied, Situated Agents. Lawrance Erlbaum Associates Publishers, 1995.

    M. Sugeno and M. Nishida. Fuzzy control of model car. Fuzzy Sets and Systems, 16:103-113, 1985.

    T. Vieville and O. Faugeras. Real-time gaze control: Architecture for sensing behaviors. In Proc. 5th Workshop on Computational Vision, Rosenön, Schweden, 1991.

    J. Zhang. Applications of fuzzy logic control in autonomous robot systems. International Journal of System Science, 24(10):1885-1904, 1993.

    J. Zhang and A. Knoll. Constructing fuzzy controllers with B-spline models - principles and applications. International Journal of Intelligent Systems, Vol. 13, Issue 2, 13(2), 1997.

    J. Zhang and A. Knoll. Constructing fuzzy controllers for multivariate problems using statistical indices. In Proceedings of IEEE International Conference on Fuzzy Systems, Alaska, 1998a.

    J. Zhang and A. Knoll. Designing fuzzy controllers by rapid learning. Fuzzy Sets and Systems (forthcoming), 1998.

    J. Zhang, K. V. Le, and A. Knoll. Unsupervised learning of control spaces based on B-spline models. Proceedings of IEEE International Conference on Fuzzy Systems, Barcelona, 1997.

    J. Zhang, F. Wille, and A. Knoll. Modular design of fuzzy controller integrating deliberative and reactive strategies. In Proceedings of the IEEE International Conference on Robotics and Automation, Minneapolis, 1996.


    Jutta Kretzberg
    2000-03-09

    Abbildung: Teil der vorhandenen Hardware-Aufbauten in der Arbeitsgruppe
    \begin{figure}\centering\par\par\end{figure}