Fächer

Betriebswirtschaftslehre
Biologie
Chemie
Deutsch
Englisch
Erdkunde
Erziehungswissenschaften
Ethik
Französisch
Geschichte
Informatik
- Biografien
- Facharbeiten
- Referate
Italienisch
Kunst
Latein
Mathematik
Musik
Philosophie
Physik
Politik
Psychologie
Rechtswissenschaften
Religion
Sozialwissenschaften
Spanisch
Sport

Digital Audio

Digital Audio Was ist digital Audio? HerkÃ¶mmliche analoge Audiosignale sind Spannungsschwankungen,die analog an die KopfhÃ¶rer oder Laursprecher Ã¼bertragen werden,und dann in...

3015 Worte in "deutsch" als "hilfreich" bewertet
Benutzerrechte auf Windows NT

1. Einleitung - Benutzerrechte auf Windows NT - Computern In unserer heutigen Informationsgesellschaft gewinnt der Computer immer mehr an Bedeutung. Vor allem aus der modernen Arbeitswelt...

8106 Worte in "deutsch" als "hilfreich" bewertet
Linux - Where do you want to go tomorrow?

LINUX Where do you want to go tomorrow? Es wurden Grafiken aufgrund ihrer GrÃ¶ÃŸe entfernt Ein Referat von Michael...

4146 Worte in "deutsch" als "hilfreich" bewertet

KÃ¼nstliche Intelligenz - Theorie, RealitÃ¤t und Pro

Theorie, RealitÃ¤t und Probleme

1 Summary

Artificial Inelligence tries to imitate human intelligence performance. The research includes among others sample - identification (optical and acoustic), essentials of natural communication, developement of roboters, logical prove with programes and mechanical learning. The most researched system for practical use are the so called expert systems.
An expert system is an informationsystem, that provides subject specific knowledge, that means know - how from experts within narrow bounds. Essential components are a database of expert - knowledge and problemsolvingcomponent.
Another advanced technology are neural networks.
Similar to the brain with its approximately 100 billion nervecells, such software systems are made of a network of switchelements that are multiple connected among them.
Our report tries to inform you about these two essential topics added with examples and summaries of philosophical reports.

2 Expertensysteme

2.1 Was ist ein Expertensystem?

Jemand ist ein Experte, wenn er ein groÃŸes Wissen in einem bestimmten Bereich in Form von Regeln und Fakten besitzt, und zusÃ¤tzlich Ã¼ber individuelle Erfahrung verfÃ¼gt, die nicht in der Literatur dieses Bereiches gefunden werden kann. Erfahrungen bestehen aus heuristischen (methodischen) Verfahren, Analogien, Entscheidungen auf der Basis von individuellen Entscheidungskriterien etc. Auf Grund von solchen Erfahrungen und Wissen ist es mÃ¶glich, dass der menschliche Experte eine LÃ¶sungsstrategie auswÃ¤hlt. Wenn es sich herausstellt, dass diese nicht erfolgreich war, wird zu dem Punkt, an dem die Strategie versagte, zurÃ¼ckgegangen und eine andere Alternative ausprobiert.
Expertensysteme sind Computersysteme, die das Fach - und Inferenzwissen von Experten speichern. Es werden Heuristiken und unsicheres Wissen verwendet, um SchluÃŸfolgerungen aus gegebenen Daten zu ziehen. DarÃ¼ber hinaus, kann der Benutzter an jedem Punkt informiert werden, warum eine bestimmte Strategie ausgewÃ¤hlt wurde, welche Entscheidungen getroffen wurden und warum diese getroffen wurden.

2.2 Ziel von Expertensystemen

Experten sind rar, weshalb es oft vorkommt, dass Personen Laien Probleme lÃ¶sen sollen, fÃ¼r die ein Experte nÃ¶tig wÃ¤re. Ein Beispiel: Das bakteriologische Wissen des Spezialisten fÃ¼r Tropenkrankheiten ist dem Landarzt, der Symptome eines heimgekehrten Urlaubers beurteilen soll, schwer zugÃ¤nglich.
Umgekehrt sollen Experten von Routineaufgaben entlastet werden, um sich neuen Problemen zuwenden zu kÃ¶nnen. DarÃ¼ber hinaus bleiben oft eine groÃŸe Anzahl von wichtigen Routineaufgaben ungelÃ¶st.
Durch den Einsatz geeigneter Programme kÃ¶nnten Kosten, die bei der LÃ¶sung solcher Probleme entstehen, erheblich reduziert werden.

2.3 Charakterisierung von Expertensystemen

Die erste AnnÃ¤herung ist, dass ProblemlÃ¶sungsmethoden als hochparametrisierte Algorithmen betrachtet werden. Wie bei normalen Algorithmen, stellen einige Parameter die Eingabedaten fÃ¼r verschiedene Probleme, innerhalb einer DomÃ¤ne dar. Andere Parameter ermÃ¶glichen es, dass ProblemlÃ¶sungsmethoden in verschiedenen DomÃ¤nen adaptiert werden kÃ¶nnen. Solche Parameter zweiter Klasse werden auch als "Wissen" bezeichnet, wenn diese eine Bedeutung fÃ¼r Menschen haben.
Wissen wird zum Unterschied zu normalen ProblemlÃ¶sungsmethoden in der Form "IF X THEN Y" dargestellt. Es wird nicht wie beim herkÃ¶mmlichen instruktionsbasierenden Programmierstil, eine Sequenz von Befehlen ausgefÃ¼hrt, sondern es wird festgelegt, was in bestimmten Situationen zu geschehen hat.

2.4 Expertensystem - Shells

Die Expertensysteme haben sich zu sogenannten Expertensystem - Shells entwickelt. Solche Shells enthalten kein Fachwissen, unterstÃ¼tzen aber mehrere Inferenzmechanismen, Datenbank - Zugriffsverfahren, Dialogschnittstellen, ErklÃ¤rungseinrichtungen, etc.
Eine solche Shell wird jedoch nur ein kompletes Expertensystem, wenn das gewÃ¼nschte Fachwissen hinzugefÃ¼gt wird.

2.5 Designerziele fÃ¼r Expertensysteme

FachgebietsunabhÃ¤ngigkeit Das zu entwickelnde Expertensystem soll als Expertensystem - Shell konzipiert werden, die es gestattet, Wissen aus unterschiedlichen Fachgebieten anzuwenden.

LeistungsfÃ¤higkeit Die von Shells verwendeten Formen der Wissensdarstellung und die Inferenzmechanismen sollen mÃ¤chtig genug sein, um in komplexen realen Entscheidungsproblemen kompetente LÃ¶sungen zu bieten. Das System soll insbesondere in der Lage sein, auch Wissen verarbeiten zu kÃ¶nnen, das mit Unsicherheiten behaftet ist.

Inkrementeller Aufbau von Wissensbanken Shells sollen einen inkrementellen Aufbau von Wissensbanken unterstÃ¼tzen. Die Wissensbank soll schrittweise erweiterbar und vertiefbar sein. Dies gilt aber auch fÃ¼r fachgebietspezifische Elemente der BenutzeroberflÃ¤che. Es soll zusÃ¤tzlich auch leicht mÃ¶glich sein, Wissen zu modifizieren.

ErklÃ¤rungsfÃ¤higkeit Shells sollen die Ergebnisse erklÃ¤ren und gewÃ¤hlte Vorgehensweise begrÃ¼nden kÃ¶nnen. Nur dann sind die Ergebnisse fÃ¼r den Benutzer transparent und vom Experten bewertbar.

2.6 Typen von Expertensystemen

Expertensysteme kÃ¶nnen fÃ¼r viele verschiedene Bereiche erstellt werden. Sie sind aber vorallem gute ProblemlÃ¶ser fÃ¼r wohldefinierte Aufgabengebiete. Folgende spezifische Kategorien haben sich herausgebildet:

Analyse - und Interpretationssysteme: GroÃŸe Informationsmengen werden geordnet, analysiert, reduziert und nach Bedarf aufbereitet.
Beispiel: WWW Search Engines, Recherchen in Online - Datenbanken,...

Vorhersagesysteme: Aus den erhaltenen Informationen wird unter Verwendung von Expertenwissen und statistischer Prognoserechnung das Eintreten von Ereignissen vorhergesagt.
Beispiel: Wettervorhersage, BÃ¶rsenkurse

Diagnose - und Fehlersuchsysteme: Daten Ã¼ber Zustand und Verhalten des zu diagnostizierenden Objekts werden vom System erfragt. Auf dieser Informationsbasis zieht das System SchlÃ¼sse Ã¼ber eine etwaige Fehlfunktion.
Beispiel: medizinische Diagnose, Fehlersuchen bei elektronischen Systemen

Beobachtungs - und Kontrollsysteme: Das Expertensystem dient als Feedback - Mechanismus, der die Ã¼ber Sensoren erhaltenen Informationen auswertet und danach Prozesse mit Kontrollsignalen steuert.
Beispiel: Steuerung und Ãœberwachung von chemischen Prozessen

Designsysteme: Das Expertensystem erhÃ¤lt Spezifikationen von Produkten oder Bauteilen. Es konstruiert selbstÃ¤ndig und zeichnet unter Zuhilfenahme von CAD - Software.
Beispiel: Schaltungsentwurf und - zeichnung

Planungssysteme: Das Expertensystem erstellt Arbeits - , Produktions - oder ProjektplÃ¤ne unter BerÃ¼cksichtigung von Zeit, Ressourcen und Kosten.
Beispiel: PMS, IMACS

Tutor Systeme: Das Expertensystem dient als Lehrer, der sich mit einer bestimmten WissensdomÃ¤ne vertraut macht.
Beispiel: SOPHIE lehrt Technikern die Fehlersuche in elektronischen Schaltungen

2.7 Architektur klassischer Expertensysteme

Ein Expertensystem soll in einem begrenzten Bereich eine dem menschlichen Experten Ã¤hnliche Kompetenz erreichen. Es zeichnet sich durch eine Trennung von Bereichswissen und Strategien zur ProblemlÃ¶sung aus. Das Bereichswissen ist modular in Form von Regeln und Fakten und damit flexibel reprÃ¤sentiert.
Regeln kÃ¶nnen heuristischen Charakter haben und mit einem MaÃŸ fÃ¼r ihre GewiÃŸheit versehen werden. Ein Regelinterpreter fÃ¼hrt bei gegebener Problemstellung Inferenzen mit Hilfe des Bereichswissens durch, um das Problem zu lÃ¶sen. Die ErklÃ¤rungskomponente kann Ã¼ber die Inferenzen in verstÃ¤ndlicher Form Auskunft geben. Ãœber die Wissenserwerbskomponente kann der Experte das System mit Wissen fÃ¼llen; der Endanwender kommuniziert Ã¼ber eine Dialogkomponente, mit deren Hilfe er Aufgaben formuliert und ihm LÃ¶sungen Ã¼bermittelt werden. Die Dialog - , ErklÃ¤rungs - , Wissenserwerbs - und Inferenzkomponenten sind weitgehend unabhÃ¤ngig vom Anwendungsbereich und werden daher zu sogenannten Shells zusammengefaÃŸt und angeboten.

Benutzer Experte

Wie aus obiger Abbildung zu ersehen ist, gibt es in der Regel zwei Klassen von Benutzern:

normale Benutzer: Sie stellen Fragen an das Expertensystem bzw. beschreiben ihm anhand von Fakten einen Fall und kÃ¶nnen anschlieÃŸend LÃ¶sungen erfragen bzw. Ã¼berprÃ¼fen.

Experten: Diese Benutzer sind entweder selbst Fachexperten oder Knowledge - Engeneerer, die Expertenwissen meist in Form von Wenn - Dann - Regeln in das System eingeben.

Das gesamte im Expertensystem gespeicherte Wissen wird in der sogenannten Knowledge - Base gespeichert. Dieses Wissen besteht meist aus Regeln und Fakten. Weiters kann man das Wissen noch in drei Kategorien einteilen:

Situationsspezifisches Wissen: Dieses Wissen umfaÃŸt einen oder mehrere FÃ¤lle, die dem Expertensystem prÃ¤sentiert werden bzw. wurden. Meist sind das die Fakten, die vom Benutzer eingegeben werden bzw. worden sind.

Zwischenergebnisse, ProblemlÃ¶sungen: Bei diesem Wissen handelt es sich um Wissen, das das Expertensystem selbstÃ¤ndig ermittelt hat. Im Normalfall sind das aus Regeln abgeleitete Regeln und Fakten.

Expertenwissen: Das ist jenes Wissen, das dem Expertensystem als Basis fÃ¼r ProblemlÃ¶sungen dient. Es besteht in der Regel aus Regeln und aus wenigen fixen Fakten. Dieses Wissen wird vom Experten eingegeben.

Das eigentliche Programm, das hinter dem Expertensystem steht, besteht aus mehreren Komponenten, die relativ unabhÃ¤ngig voneinander sind und deshalb auch auf unterschiedlichen Rechnern installiert sein kÃ¶nnen:

Dialogkomponente: Dies ist jener Teil des Expertensystems, mit dem der Benutzer am hÃ¤ufigsten Kontakt hat. In der Dialogkomponente kann der Benutzer die Fakten seines Falles darstellen bzw. er bekommt vom Expertensystem Fragen gestellt, die er beantworten muss. Die zweite Aufgabe der Dialogkomponente besteht darin, dass das Expertensystem die gefundene LÃ¶sung dem Benutzer darstellen und dieser Fragen zu dieser stellen bzw. die LÃ¶sung zurÃ¼ckweisen kann.

ErklÃ¤rungskomponente: Dieser Teil "erklÃ¤rt" dem Benutzer die Handlungen des Expertensytems (z.B warum eine Frage gestellt wurde). Sie ist eine Art von Online Hilfe, die dem Benutzer das Expertensystem verstÃ¤ndlicher und dessen Schritte nachvollziehbarer machen soll.

Wissenserwerbskomponente: Ãœber diese Schnittstelle kann ein Experte Wissen in das System einspielen.

Inferenzkomponente: Das ist das Herz des Expertensystems. Diese Komponente versucht selbstÃ¤ndig Probleme zu lÃ¶sen, indem sie aus Fakten und Regeln der Wissensbasis neue Fakten und Regeln ableitet. Diese Komponente sehen wir uns im nÃ¤chsten Punkt genauer an.

2.8 Die Inferenzkomponente (Inference Engine)

2.8.1 SchluÃŸregeln (Operatoren, Ableitungsformen)

Die beiden allgemeinen Ableitungsformen sind der Modus Ponens und der Modus Tollens. Beide SchluÃŸregeln sollen hier mit Hilfe eines Beispiels erklÃ¤rt werden:

Gegeben ist die Regel:
"FÃ¼r alle X gilt: Wenn X ein Mensch ist, dann ist X sterblich"

Modus Ponens: Zusammen mit dem Fakt, dass Sokrates ein Mensch ist, kÃ¶nnen wir ableiten, dass Sokrates sterblich ist.

Modus Tollens: (arbeitet umgekehrt) Zusammen mit dem Fakt, dass Zeus nicht sterblich ist, kÃ¶nnen wir ableiten, dass Zeus kein Mensch ist.

In der Praxis arbeiten mehrere dem Anwendungsgebiet angepaÃŸte Ableitungsformen besser als nur wenige allgemeine.

2.8.2 Das Inferenzverfahren

Das Ziehen von SchluÃŸfolgerungen erfolgt durch das Verketten von Regeln aus der Wissens - Basis. Diese Verkettungen lassen sich mit Hilfe von UND/ODER BÃ¤umen darstellen.

2.8.3 ProblemlÃ¶sungsstrategien

RÃ¼ckwÃ¤rtsverkettung:
Der Inferenzmechanismus beginnt am Ziel und arbeitet sich rÃ¼ckwÃ¤rts durch die von Operatoren erzeugten Subziele hindurch. Der InferenzprozeÃŸ versucht alle Regeln anzuwenden, in deren Konklusion das Ziel, also die LÃ¶sung auftritt. Die RÃ¼ckwÃ¤rtsverkettung wird dann angewendet, wenn Probleme in Form von Hypothesen vorliegen. Sie erweist sich als effizient, wenn nur wenige Daten, aber sehr viele Regeln Ã¼berprÃ¼ft werden mÃ¼ssen.

VorwÃ¤rtsverkettung:
Dieser Inferenzmechanismus geht von den anfÃ¤nglichen Daten und Axiomen (GrundsÃ¤tzen) aus und versucht alle Regeln, die von den bekannten Daten ausgehen, anzuwenden. Schritt fÃ¼r Schritt werden immer neue Ergebnisse erreicht bis man das erreicht, was man erreichen will. Die VorwÃ¤rtsverkettung wird dann eingesetzt, wenn mÃ¶glichst viele Antworten gefunden werden sollen.

Depth - first und Breadth - first Suche:
Sowohl bei der RÃ¼ckwÃ¤rtsverkettung als auch bei der VorwÃ¤rtsverkettung gibt es zwei VorgangsmÃ¶glichkeiten. Bei der Depth - first Suche unternimmt der Inferenzmechanismus jeden Versuch, ein Subziel zu ermitteln. Eine Suche nach Details hat Vorrang. Bei der Breadth - first Suche werden zuerst alle PrÃ¤missen (Voraussetzungen) angesehen, bevor die Details beachtet werden.

Backtracking:
Backtracking nennt man den Vorgang, in dem aktuelle LÃ¶sungswege verworfen und nach einer Alternative gesucht wird.

2.8.4 Heuristische Suche

Die Hauptmethode der KI ist das Suchen nach LÃ¶sungen. Die Verwendung von Heuristiken (Faustregeln) ist eine Technik, die darauf abzielt, die Effizienz eines Suchprozesses zu verbessern. Sie ist teilweise jedoch nur unter Opferung der VollstÃ¤ndigkeit der LÃ¶sungen einsetzbar. Bei diesem Verfahren kann nicht garantiert werden, dass es in allen FÃ¤llen die beste LÃ¶sung liefert. D.h. wir verzichten darauf, unter allen UmstÃ¤nden die beste LÃ¶sung zu finden und geben uns mit einer recht guten zufrieden.

2.9 Prolog - Implementierungssprache der KI

Prolog (KÃ¼rzel fÃ¼r "PROgrammierung in LOGik") ist als nicht - algorithmische Program - miersprache Vertreter einer Generation von Computersprachen, die besonders Anwendungen unterstÃ¼tzen, bei denen nicht numerische Berechnungen, sondern symbolische Manipulationen im Mittelpunkt stehen.
PROLOGÂ´s Kontrollstruktur ist gekennzeichnet durch die Mechanismen Unifizierung, Backtracking und Rekursion.

Als Unifizierung bezeichnet man einen ProzeÃŸ, der versucht, zwei PROLOG Strukturen durch geeignete Bindung der freien Variablen zu identifizieren.

Hinter dem Backtracking Mechanismus verbirgt sich die Strategie, die ProblemlÃ¶sung Ã¼ber ein "Trial und Error - Verfahren" zu erzielen. Soll Prolog z.B. prÃ¼fen, ob eine Reise von Paris nach Paderborn empfehlenswert ist, so versucht Prolog zunÃ¤chst in einer Regel1 dieses zu erreichen. Dies scheitert jedoch an der fehlenden Direktflugverbindung zwischen Paris und Paderborn. An dieser Stelle "backtrackt" Prolog und sucht einen Alternativbeweis. Die Suche gelingt, da Prolog Paderborn als interessant identifiziert.
Der Backtracking Mechanismus in Prolog unterstÃ¼tzt die Implementation von wissensbasierten Systemen und Expertensystemen, bei denen zielorientierte Such - und Auswertstrategien fÃ¼r Regeln verwendet werden.

Als wichtigster Schleifenmechanismus steht in Prolog die Rekursion zur VerfÃ¼gung. Mit ihrer Hilfe ist es mÃ¶glich, komplexe AblÃ¤ufe auf elementare AblÃ¤ufe zu reduzieren oder rekursiv definierbare Datenstrukturen elementweise abzuarbeiten.

Es ist auch mÃ¶glich, Schleifen mit Hilfe des Backtracking - Mechanismus zu realisieren. Dies ist jedoch nur dann ratsam, wenn die Informationen aus den einzelnen SchleifendurchlÃ¤ufen nicht weiterverarbeitet werden mÃ¼ssen, da Prolog bei Backtracking davor gebildete Variablenbindungen wieder auflÃ¶st.

Quellen:
KÃ¼nstliche Intelligenz und Expertensysteme von Stuart E. Savory 2. Auflage Oldenbourg Verlag: MÃ¼nchenWien 1985

3 Neuronale Netze

3.1 EinfÃ¼hrung

3.1.1 Allgemeines

Seit Anfang der 80er Jahre ist es weltweit zu einem enormen Aufschwung neuronaler Netzwerke gekommen. Eine der GrÃ¼nde fÃ¼r diesen Aufschwung ist, dass neuronale Netzwerke in ihrem Aufbau und ihrer Konzeption stÃ¤rker an der Funktionsweise des menschlichen Gehirns orientiert sind als an der Arbeitsweise konventioneller Rechner der klassischen von Neumann Architektur. Neuronale Netzwerke kÃ¶nnen deshalb leichter dazu genutzt werden, wichtige geistige FÃ¤higkeiten des Menschen wie das Lernen aus Beispielen, das Verallgemeinern von Beispielen, das Abstrahieren, das schnelle Erkennen und VervollstÃ¤ndigen komplizierter Muster, das assoziative Speichern und Abrufen von Informationen etc. nachzubilden und zu simulieren.

Jeder Rechner konventioneller Bauart wÃ¤re mit solchen Aufgaben hoffnungslos Ã¼berfordert, und das insteressanterweise, obwohl die Daten in den heutigen Computern etwa 1000mal schneller verarbeitet werden kÃ¶nnen als in unserem Gehirn. Diese erstaunliche LeistungsfÃ¤higkeit unseres Gehirns beruht nicht in der Verarbeitungsgeschwindigkeit der Informationen ider in der Genauigkeit der Operationen, die auf diesen Informationen ausgefÃ¼hrt werden, sondern in der hochgradigen parallelen Natur der Informationsverarbeitung im Gehirn, also der netzwerkartigen Struktur der NervenverbÃ¤nde.

Das Gehirn enthÃ¤lt bei einem durchschnittlichen Gewicht von 1500 Gramm zwischen 10 und 100 Milliarden Neuronen (Nervenzellen). Man geht heute davon aus, dass die VerarbeitungskapazitÃ¤t eines einzigen Neurons etwa der eines mittleren PCs entspricht. Da von den 100 Milliarden Neuronen jeweils ein groÃŸer Teil simultan aktiv ist und miteinander kommuniziert, entsteht eine gewaltige VerarbeitungskapazitÃ¤t, die grÃ¶ÃŸer ist, als die aller derzeitigen Computer zusammengenommen.

Es ist nicht erstaunlich, dass man in der Gehirnforschung und der kognitiven Psychologie der LernfÃ¤higkeit des Gehirns besondere Aufmerksamkeit schenkt, da eine der MÃ¶glichkeiten, die LernfÃ¤higkeit unseres Gehirns genauer zu studieren, darin besteht, Modelle zu konstruieren, die die physiologische Struktur des Gehirns berÃ¼cksichtigen. Eine spezielle Form dieser Modelle sind neuronale Netzwerke.

Ein kÃ¼nstliches neuronales Netzwerk als DV - technisches Modell des Gehirns besteht folglich nicht aus einer kÃ¶mplexen Zentraleinheit (CPU) und einem Arbeitsspeicher wie ein Konventioneller Computer, sondern wie das Gehirn aus sehr vielen einfachen Rechenelementen, den Neuronen (Nervenzellen). Diese Neuronen sind hochgradig miteinander verknÃ¼pft und kÃ¶nnen gleichzeitig Informationen austauschen.

Mit der Zunahme des VerstÃ¤ndnisses des Arbeitsweise des Gehirns und damit auch der neuronalen Netze nehmen die Anwendungen dieser modernen DV - Technik stÃ¤ndig zu, und zwar in Bereichen, bei denen man intuitiv nicht sofort daran denken wÃ¼rde, wie z.B. Banken und Finanzbereiche.

3.1.2 Biologische Grundlagen

3.1.2.1 Das Neuron

Das Neuron, die Nervenzelle, ist die morphologisch - anatomische und funktionelle "Grundeinheit" im Nervensystem. Es ist der erregungserzeugende und - leitende Baustein aller Teile des Nervensystems. Die Zahl der Neuronen im Gehirn (ca 1010) ist kurz nach der Geburt eines Menschen praktisch festgelegt, denn die Nervenzellen kÃ¶nnen sich dann nicht mehr durch Teilung vermehren.

Ein Neuron besteht aus dem Soma(ZellkÃ¶rper), dem Axon (Nervenfaser, Neurit) und den Dendriten. Der ZellkÃ¶rper enthÃ¤lt den Zellkern und fÃ¼r den Zellstoffwechsel lebenswichtige Strukturen und Substanzen.

Das Axon ist eine rÃ¶hrenfÃ¶rmige Leitungsbahn, die die Signale zu anderen Nervenzellen Ã¼bertrÃ¤gt. Es hat einen Durchmesser zw. 5 und 100*10E6 - und kann eine LÃ¤nge von bis zu einem Meter erreichen. An seinem Ende verzweigt es in viele kleine kolbenfÃ¶rmige Auftreibungen, die synaptischen Endkolben. Diese Endkolben stehen fÃ¼r sogenannte Synapsen mit anderen Neuronen in Kontakt. Ein Endkolben kann direkt mit dem ZellkÃ¶rper eines anderen Neurons oder aber mit dessen Dendriten in Verbindung stehen.

Die Dendriten sind dÃ¼nn verzweigte AuslÃ¤ufer des ZellkÃ¶rpers und dienen als EingÃ¤nge des Neurons. Sie stehen mit den Axonen anderer Neuronen Ã¼ber die Synapsen in Verbindung. Neuronen kÃ¶nnen bis zu 200.000 Dendriten besitzen und eine entsprechend groÃŸe Zahl von Axon - Endkolben aufweisen.

3.1.2.2 Die Natur des elektrischen Nervensignals

An der Zellwand eines ruhenden Neurons lÃ¤sst sich ein sogenanntes Ruhemembranpotentional messen, das c. - 70 mV betrÃ¤gt, wodurch das innere der Zelle eine negative Ladung besitzt. Das Nervensignal ist nun eine kurzzeitige, Ã¶rtliche Ã„nderung des Ruhemembranpotentials, die sich Ã¼ber das gesamte Axon fortpflanzt. Wenn das Ruhemembranpotentional Ã¼ber einen Schwellenwert steigt, kommt es zu einem erstaunlichen Effekt. Die DurchlÃ¤ssigkeit der Zellmembran fÃ¼r Natriumionen steigt schlagartig an und fÃ¼hrt dadurch zu einer vollstÃ¤ndigen Entladung des Membranbereichs (bis zu +30 mV), wodurch ein sogenanntes Aktionspotentional entsteht. Kurze Zeit spÃ¤ter erreicht die Membran, vermittelt durch einen Anstieg der DurchlÃ¤ssigkeit fÃ¼r Kaliumionen, ihre alte StabilitÃ¤t. Sie ist dann wieder undurchlÃ¤ssig fÃ¼r Natriumionen, und das Ruhemembranpotential stellt sich ein. Dieses Zustandekommen eines Aktionspotential lÃ¤uft nach dem "Alles - oder - nichts" Prinzip ab, was bedeutet, dass eine Zelle feuert oder nicht. Dadurch wird ein Informationsverlust auch bei relativ langen Leitungsbahnen vermieden, da keine AbschwÃ¤chung des Impulses erfolgt.

3.1.2.3 Die Synapsen

Die Synapsen sind die Verbindungsstellen zwischen den einzelnen Neuronen. Ihnen wird eine zentrale Rolle fÃ¼r das Lernen zugeschrieben. Synapsen bestehen aus einer prÃ¤synaptischen Membran, an der Impulse ankommen, einer postsynaptischen Membran, die zur Weiterleitung der Impulse dient, und aus einem mit FlÃ¼ssigkeit gefÃ¼llten Raum zwischen diesen Membran - en, dem synaptischen Spalt, der zw. 10 und 50*10E - 9 m breit ist. Es besteht also im allgemeinen keine direkte physikalische Verbindung zwischen den Nervenzellen. Das hat eine deutliche Verlangsamung des Informationsflusses zur Folge. Die elektrischen Impulse, die in Form von Aktionspotentialen zur Synapse gelangen, fÃ¼hren an der prÃ¤synaptischen Membran zur Freisetzung eines chemischen Neurotransmitters (Ãœbertragungssubstanz) in den synaptischen Spalt. Insgesamt sind mehr als 30 verschiedene erregend oder hemmend wirkende Neurotransmitter bekannt. Der Neurotransmitter bindet sich an spezifische Rezeptoren, die in der postsynaptischen Membran sitzen. Diese Bindung bewirkt eine VerÃ¤nderung der elektrischen AktivitÃ¤t der postsynaptische gelegenen Zelle,die dann z.B. zu einem Aktionspotential fÃ¼hren kann. Der Neurotransmitter wird im allgemeinen enzymatisch in unwirksame Substanzen gespalten, und diese werden durch die prÃ¤synaptische Membran wieder aufgenommen. MÃ¶glich ist auch die Wiederaufnahme des unverÃ¤nderten Neurotransmitters in den prÃ¤synaptischen Endkolben. Die AnhÃ¤ufung von Transmittersubstanz im Synaptischen Spalt wird so vermindert.

Die InformationsÃ¼bertragung an einer Synapse kann nur in eine Richtung erfolgen, nÃ¤mlich vom Axon eines Neurons zum Dendriten oder Soma eines anderen Neurons. Der umgekehrte Weg ist ausgeschlossen, denn die prÃ¤ - und die postsynaptische Membran sind, ihren unterschiedlichen Funktionen entsprechend, auch physikalisch verschieden strukturiert. Gelegentlich vermitteln Synapsen auch den Kontakt zwischen zwei Axonen oder zwischen zwei Dendriten.

Man kann funktionell zwischen zwei Arten von Synapsen unterscheiden: den erregenden und den hemmenden Synapsen. Beim erregenden Synapsentyp erhÃ¶ht der in den synaptischen Spalt ausgeschÃ¼ttete Neurotransmitter die Wahrscheinlichkeit, dass die postsynaptische Zelle aktiv ist; der Neurotransmitter fÃ¼hrt zur Destabilisierung der Zellmembran. Beim hemmenden Synapsentyp wird die Wahrscheinlichkeit, dass die postsynaptisch gelegene Zelle aktiv ist, herabgesetzt. Je grÃ¶ÃŸer die AktivitÃ¤t der prÃ¤synaptischen Zelle ist, um so stÃ¤rker wurd die postsynaptische Zelle gehemmt. Hemmende Synapsen Ã¼ben meist einen verhÃ¤ltnismÃ¤ÃŸige starken EinfluÃŸ auf die Zelle aus (d.h. stÃ¤rkeer als erregende).

3.1.2.4 Lernen durch VerÃ¤nderung an den Synapsen

Nach heutigen Erkenntnisstand wird das Lernen im wesentlichen durch die Modifikation der Verbindung zwischen den Neuronen, also durch VerÃ¤nderung ihrer Synapsen, ermÃ¶glicht. Die StÃ¤rke der Verbindung von Neuronen und NeuronenverbÃ¤nden, und damit ihr Verhalten, hÃ¤ngt von den ihnen ausgebildeten Synapsen ab. Einige EinfluÃŸfaktoren fÃ¼r die StÃ¤rke der Verbindung sind die Anzahl und die GrÃ¶ÃŸe der Synapsen sowie verschiedene Details in ihrem Aufbau wie Menge und Art der gespeicherten Transmittersubstanz, Zahl der Rezeptoren fÃ¼r den Transmitter etc. Eine VerÃ¤nderung dieser Parameter fÃ¼hrt zu VerÃ¤nderungen im SignalfluÃŸ und bewirkt letztendlich eine VerhaltensÃ¤nderung des Organismus (d.h. LernfÃ¤higkeit).

3.1.3 KÃ¼nstliche Neuronen

Ein neuronales Netzwerk lÃ¤sst sich in eine bestimmte Anzahl von Schichten aufteilen. Diese Anzahl ist grÃ¶ÃŸer oder gleich eins. Meistens werden drei oder mehr Schichten benutzt: eine Eingabeschicht, eine oder mehrere verborgene oder verdeckte Schichten und eine Ausgabeschicht. Ein - und Ausgabeschicht werden hÃ¤ufig als Puffer benÃ¶tigt, die Anzahl verborgener Schichten ist beliebig und abhÃ¤ngig vom zu lÃ¶senden Problem. Die Informationsverarbeitung bzw. der InformationsfluÃŸ in einem solchen Netzwerk erfolgt in der Regel von der Eingabeschicht Ã¼ber die verborgenen Schichten zur Ausgabeschicht, gelegentlich aber auch von der Eingabeschicht direkt zur Ausgabeschicht oder in einem Feedback zwischen den einzelnen Schichten hin und her.

Die einzelnen Schichten bestehen wiederum aus einer Anzahl von Prozessorelementen (PEs). Jede Schicht muss mindestens ein PE enthalten. Meist werden die PEs einer Schicht als gleichartig angesehen. Eine Schicht kann mit beliebig vielen PEs einer anderen Schicht verbunden sein oder mit PEs der gleichen Schicht. Eine Verbindung von PEj nach PEi nennt man Gewicht wij. Es gibt verschiedene Arten von Gewichten; neben variablen Gewichten gibt es auch feste Gewichte. Variable Gewichte werden vom System (wÃ¤hrend des Lernens) verÃ¤ndert. Gewichte werden gewÃ¶hnlich durch reelle zahlen, hÃ¤ufig im Intervall [ - 1, +1] dargestellt.

In vielen Netzwerken gibt es eine zusÃ¤tzliche Schicht mit genau einem Element, Bias genannt. Dieser Bias, der den konstanten Wert +1 hat, fungiert als eine Art Schwellenwertfunktion. Der Bias hat nur AusgÃ¤nge und keine EingÃ¤nge. Mit Hilfe des Bias - Elements kann z.B. sichergestellt werden, dass bestimmte PEs immer einen Input ungleich null erhalten.

.2 Modelle neuronaler Netzwerke

3.2.1 Perceptron

Es wurde von F. Rosenblatt vorgestellt. Perceptron bezeichnet heute im Allgemeinen ein feed forward Netzwerk ohne verdeckte Schichten. Dieser Netzwerktyp hat heute immer noch eine groÃŸe Bedeutung.

3.2.1.1 Struktur

Das Perceptron ist ein feed forward (rÃ¼ckkopplungsfreies) Netzwerk mit einfachen, binÃ¤ren Schwellenwertelementen als Prozessoren. Die PEs summieren den gewichteten Input auf und geben in AbhÃ¤ngigkeit von der GrÃ¶ÃŸe der Summe und der HÃ¶he des Schwellenwertes eine Null oder eine Eins als Output weiter. Die Elemente der ersten beiden Schichten kÃ¶nnen im positiven Bereich auch die Summe ihrer gewichteten Eingaben net linear als output weitergeben.

Das Netzwerk besteht aus drei Schichten. Die Eingabeschicht wird als Retina (Netzhaut) bezeichnet und ihre Eingabeelemente heiÃŸen S - Units (Stimulus - Units). Diese S - Units sind mit der Mittelschicht Ã¼ber zufÃ¤llige und festgewichtete Verbindungen verknÃ¼pft, dieGewichte dieser Verbindungen werden wÃ¤hrend des Lernens nicht verÃ¤ndert. Die Elemente der Mittelschicht werden als A - Units (Assoziations - Units) bezeichnet. Jede A - Unit bekommt einen fest gewichteten Input von einem Teil der S - Units. Eine S - Unit kann ihren Output auf mehrere A - Units gleichzeitig weitergeben. Die Mittelschicht ist vollstÃ¤ndig mit der Ausgabeschicht verbunden. Die Gewichte zwischen Mittelschicht und Ausgabeschicht sind variabel und somit lernfÃ¤hig. Die Elemente der Ausgabeschicht heiÃŸen R - Units (Response - Units). Diese Schicht kann man auch als Perceptron - Schicht bezeichnen, da die R - Units ihre Gewichte Ã¼ber die Perceptron - Lernregel verÃ¤ndern.

3.2.1.2 Lernregel

Das Perceptron lernt durch Ã¼berwachtes Lernen mit "Lehrer". Dazu muss zu jedem zu lernenden Muster der erwÃ¼nschte Zustand 8aktiv oder inaktiv) jeder R - Unit bekannt sein.

Die zu lernenden Muster werden dem Netzwerk angeboten und die Gewichte nach der Lernregel angepaÃŸt. Der Vorgang wird so lange wiederholt, bis alle Muster den korrekten Output erzeugen.

FÃ¼r jedes Element i der Ausgabeschicht wird der durch ein Muster erzeugte Output oi mit dem gewÃ¼nschten Muster zi (Ziel) verglichen. Wenn oi=zi ist, wird nicht gelernt, da das Muster schon korrekt klassifiziert wurde. Wenn der gewÃ¼nschte Output zi gleich eins und der tatsÃ¤chliche Output oi gleich null ist, dann werden alle Gewichte, an denen ein aktives Element hÃ¤ngt (oi>0), vergrÃ¶ÃŸert: wij(t+1) = wij(t) + σ * oj. Ist der gewÃ¼nschte Output gleich null und der tatsÃ¤chliche Output gleich eins, werden alle Gewichte, an denen ein aktives Element hÃ¤ngt, verkleinert: wij(t+1) = wij(t) - σ * oj. Die Konstante σ ist die Lernrate. Um diesen Wert wird das Gewicht beim Lernen verÃ¤ndert. Eine hohe Lernrate (z.B. eins) fÃ¼hrt zu einer schnellen Anpassung der Gewichte. In jedem Fall muss die Lernrate σ grÃ¶ÃŸer als null gewÃ¤hlt werden.

Die Anpassung des Schwellenwertes, fÃ¼r die es keine Lernregel gibt, kann durch einen "Trick" vereinfacht werden, was durch das EinfÃ¼hren eines PEs mit der konstanten AktivitÃ¤t von eins, dem Bias. Eine R - Unit, die durch ein variables (lernendes) Gewicht mit de Bias verbunden ist, kann dadurch quasi ihren Schwellenwert modifizieren. Die bei diesem Gewicht angewandte Lernregel unterscheidet sich nicht von der Lernregel fÃ¼r die "normalen" Gewichte.

3.2.1.3 Grenzen von Perceptron - Netzwerken

Mit dem Perceptron - Konvergenz - Theorem wurde gezeigt, dass jede lÃ¶sbare Aufgabe von Perceptoren - Netzwerken auch tatsÃ¤chlich gelernt werden kann. Offen bleibt aber noch die Frage, ob eine bestimmte LÃ¶sung von einem Perceptron - , Netzwerk prinzipiell gelernt werden kann. Die interessante und entscheidende Fragestellung lautet: Welche Probleme kÃ¶nnen durch ein Perceptron - Netzwerk reprÃ¤sentiert werden, und bei welchen Problemklassen ist das Perceptron nicht anwendbar?

Eines der nicht lÃ¶sbaren Probleme ist z.B. die ParitÃ¤tsbestimmung, d.h. die Bestimmung, ob eine (ganze) Zahl gerade oder ungerade ist. Ein Spezialfall der pa
Boolesche Funktionen sind binÃ¤re Funktionen mit (zwei) binÃ¤ren EingÃ¤ngen. Die XOR - Funktion ist eine der 16 existierenden Booleschen Funktionen mit zwei Variablen (EingÃ¤ngen). Sie ist die Umkehrfunktion der IdentitÃ¤tsfunktion, d.h. der PrÃ¼fung auf Gleichheit.

Wenn nun zwei EingÃ¤nge und ein Ausgang existieren, die jeweils den Wert eins ("aktiv") oder null ("inaktiv") annehmen kÃ¶nnen, und die Anzahl der aktiven EingÃ¤nge den Wert des Ausgangs bestimmt, sodass fÃ¼r eine gerade Anzahl (kein Eingagn oder beide EingÃ¤nge aktiv) der Ausgang null sein soll, und fÃ¼r eine ungerade Anzahl ( ein Eingang ist aktiv) soll der Ausgang eins sein. Die x und y bezeichneten EingÃ¤nge kÃ¶nnen wir in einem Koordinatensystem auftragen, dessen Achsen durch die EingÃ¤nge definiert sind. Die vier ecken der FlÃ¤che mit den Koordinaten 0/0, 0/1, 1/0, 1/1 sind die vier mÃ¶glichen Eingagskonstellationen. Jedem dieser Punkte kann der entsprechende ausgagswert zugeordnet werden. Die sich diagonal gegenÃ¼berliegenden Punkte sollen demnach jeweils den gleichen Ausgangswert haben.

Ein Perceptron - Element (R - Unit), d.h. ein einfaches, binÃ¤res Schwellenwertelement mit zwei EingÃ¤ngen, kann nicht lernen, die durch die EingÃ¤nge geforderten Ausgangswerte anzunehmen.

3.2.2 Adaline

3.2.2.1 Struktur

Adaline steht fÃ¼r adaptive linear neuron oder adaptive linear element und wurde zwischen 1956 und 1960 von B. Widrow und M. Hoff entwickelt. Es ist ebenfalls ein einschichtiges "feed forward" - Netz mit binÃ¤ren Schwellenwertelementen. Die Elemente haben in AbhÃ¤ngigkeit vom summierten Input den Output +1 oder - 1 (Signumfunktion). Adaline verwendet ebenfalls wie das Perceptron anstatt eines variablen Stellenwertes einen Bias. Der entscheidende Fortschritt wird aber durch die Delta - Lernregel dargestellt, welche verglichen mit dem Perceptron ein deutlich schnelleres Lernen ermÃ¶glichte.

3.2.2.2 Lernregel

Das Adaline - Netzwerk benÃ¶tigt ebenfalls die gewÃ¼nschten Zielvektoren um seine Gewichte justieren zu kÃ¶nnen. Der grundlegende Unterschied zur Perceptron - Lernregel ist die EinfÃ¼hrung eines Fehler - Signals. FÃ¼r die folgende Betrachtung wurde wegen der einfacheren Notation eine lineare Transferfunktion zugrunde gelegt. Die Outputfunktion ist die Signumfunktion.

Jedes Adaline - Element lernt so lange, bis seine AktivitÃ¤t ( und nicht sein Output) den Wert des gewÃ¼nschten outputs hat. Es lernen auch die elemente deren Output schon richtig ist, was diesen die MÃ¶glichkeit gibt ihre "Aussage" sicherer zu machen, was von besonderer Bedeutung ist, wenn ihre aktivitÃ¤t nahe am Schwellenwert liegt.

Die Delta - Lernregel der Adaline - Elemente minimiert bei linearer Transferfunktion die Summe der Fehlerquadrate.

3.2.3 Back - Propagation

FÃ¼r die Leistung und ReprÃ¤sentationsmÃ¶glichkeiten von feed forward Netzwerken ist die zahl der Schichten mit variablen, lernenden Gewichten von entscheidender Bedeutung. Das eigentliche Problem besteht darin, die Gewichte der nicht direkt von auÃŸen "zugÃ¤nglichen" verdeckten Schichten in geeigneter Weise anzupassen. Der Backpropagation - Algorithmus stellt einen geeigneten Adaptionsmechanismus fÃ¼r eine beliebige, rÃ¼ckkopplungsfreie Netzwerkstruktur zur VerfÃ¼gung.

3.2.3.1 Interne ReprÃ¤sentation

Der vielleicht interessanteste Aspekt von einlagigen feed forward Netzwerken ist ihre MÃ¶glichkeit, auf unbekannte, nicht gelernte Eingaben eine angemessene Ausgabe liefern. Diese FÃ¤higkeit kann man auch als Generalisation bezeichnen. Die fÃ¤higkeit eines einlagigen Netzwerkes zu generalisieren setzt voraus, dass Ã¤hnliche Eingabevektoren auch zu Ã¤hnlichen Ausgabevektoren fÃ¼hren sollen. Die Ã„hnlichkeit kann man auch als Ãœberlapp (Overlap) bezeichnen. Eine groÃŸe Ãœberlappung zweier eingabemuster fÃ¼hrt bei einem solchen Netzwerk auch zu einer groÃŸen Ãœberlappung der beiden korrespondierenden Ausgabemuster.

FÃ¼r die Output - Schicht eines feed forward Netzwerkes haben wir schon eine MÃ¶glichkeit der Gewichtsadaption kennengelernt: die Delta - Lernregel, welche einen Fehler fÃ¼r jedes Output - Element berechnet, und die Anpassung der Gewichte proportional zu diesem Fehler vornimmt. Aber erst die Entwicklung der generalisierten Delta - Lernregel im Backpropagation - Netzwerk ermÃ¶glicht die Berechnung eines Fehler - Signals auch fÃ¼r verdeckte Schichten.

3.2.3.2 Transferfunktion

Im Backpropagation - Netzwerk muss die Transferfunktion differenzierbar sein. Unter dieser Voraussetzung kann jede beliebige Transferfunktion Verwendung finden.

Die Verwendung einer linearen Transferfunktion ist in einem mehrschichtigen Netzwerk nicht sinnvoll, da beliebig viele Schichten mit linearer Transferfunktion durch Berechnung einer geeigneten Gewichtsmatrix durch eine einzige Schicht ersetzt werden kann. Daher bietet sich die verwendung einer nicht linearen transferfunktion an.

3.2.3.3 Struktur

Ein Backpropation - Netzwerk besteht aus einer Eingabeschicht, einer Ausgabeschicht und beliebig vielen verdeckten Schichten. Die Verbindungen laufen immer von der Eingabeschicht zur Ausgabeschicht, wobei nicht nur direkt benachbarte Schichten Verbindungen haben dÃ¼rfen: Eine Verbindung kann auch beliebig viele Zwischenschichten Ã¼berspringen. Diese Anordnung garantiert den feed forward Charakter des Netzwekes; eine RÃ¼ckkopplung ist so nicht mÃ¶glich.

Die Funktionsweise des Backpropation - Netzwerkes wÃ¤hrend des Recalls entspricht der Funktionsweise jedes anderen feed forward Netzwerkes. Der Inputvektor wird an die EingÃ¤nge angelegt, und die PEs berechnen ihren Output nach der formel:

Oi = ai = F(Σ wij * oj)

Wobei Ã¼ber j summiert wird und ai die AktivitÃ¤t des Elementes i ist.

3.2.3.4 Lernregel

Bei der Delta - Lernregel wurde die AktivitÃ¤t des Elementes mit dem gewÃ¼nschten Output verglichen. Ergab sich eine Differenz, wurden die Gewichte adaptiert, sonst wurde nicht gelernt. FÃ¼r die einfachere lineare Transfer - und Outputfunktion entspricht der Output der Summe der gewichteten Inputs. Die Sigmoid - Funktion ist dagegen eine nicht lineare Funktion. Die Gemeinsamkeit mit einer linearen Funktion ist ihr stetiges Ansteigen. Wenn net1> net2, dann gilt auch F(net1)> F(net2). Man kann sie daher auch als semilineare Funktion bezeichnen. Bei linearen und semilinearen Transferfunktionen ist die Delta - Lernregel sinnvoll anwendbar.

3.2.4 Counter - Propagation

Bei diesem Netztyp werden zwei unterschiedliche Lernverfahren kombiniert. Das Netz arbeitet wie eine Look - up - Tabelle. Das bedeutet: ein "SchlÃ¼sselwert" erzeugt eine Antwort. In der Grossberg - Schicht (Hidden - Output) vollzieht sich das Supervised Learning. Die Kohonen - Schicht (Hidden - Input) ist selbstorganisierend. In der Kohonen - Schicht findet ein Wettbewerb statt. Der Gewinner darf seine Gewichte verÃ¤ndern, der Rest nicht. Erst nachdem die Kohonen - Schicht mit seiner Arbeit fertig ist, kommt das Grossberg - Slab zum Zug. Auch hier herrscht Wettbewerb durch laterale Inhibition. Jedes Kohonen - Element bremst seine Nachbarn.

Das Hin und Her zwischen den einzelnen Schichten wÃ¤hrend des Lernvorganges bei Computerpropagation - Netzwerken wie auch anderen erklÃ¤rt, warum ein Lernzyklus bei vielen Netzen lÃ¤nger dauert als die reine Datenreproduktion. Der Name Counterpropagation beruht auf einer anderen DarstellungsmÃ¶glichkeit. Zeichnet man die Eingabevektoren x und y getrennt, jeden auf eine Seite der Kohonenschicht, so dass die Kohonenschicht zwischen diesen liegt, entsteht ein von beiden Seiten in die Mitte gerichteterDatenfluÃŸ. Dieser gegeneinander gerichteter DatenfluÃŸ hat zu dem Namen Counterpropagation gefÃ¼hrt. Die grossbergschicht wird bei dieser Darstellung jeweils zwischen Eingabe und Kohonenschicht dargestellt.

Diese netzwerke sind autoassoziativ trainiert. Es lernt die beiden zusammengehÃ¶rigen inputvektoren x und y mit sich selbst zu assoziiern, indem die gewÃ¼nschten Outputvektoren den Inputvektoren x und y entsprechen. Legt man x und y wÃ¤hrend des Recalls an, so produziert das Netzwerk x‘ und y‘ am Output. Diese Outputvektoren x‘ und y‘ stellen eine Art generalisierte Prototypen von x und y dar.

3.2.5 Hopfield - Modell

Das Hopfield - Netz besteht aus einer einzigen Schicht, in der N binÃ¤re zellen vollstÃ¤ndig und symetrisch miteinander vernetzt sind.

Der zustand oi einer binÃ¤ren Zelle i ist Ã¤quivalent zum Ising - Spin (magnetische Ausrichtung) Si im Spinglas - Modell. Wenn der Spin den wert Si = - 1 hat, ist das Neuron in Ruhe(oi = 0), hat er den Wert Si = +1), ist das Neuron aktiv (oi =1).

Die Eingabe erfolgt durch Setzen der ZustÃ¤nde der Zellen; der Eingabevektor ist demnach die GesamtaktivitÃ¤t des Netzes zum Zeitpunkt t = 0.

Der Outputvektor liegt dann vor, wenn das Netz einen stabilen zustand erreicht hat; der Ausgabevektor ist die AktivitÃ¤t des Netzes im stabilen Zustand. Jedes Bit i eines Musters, sei es ein Input - oder ein Outputmuster, wird reprÃ¤sentiert durch den Zustand oi einer Zelle im Netz.

3.2.6 BAM (Bidirectional Associative memory)

Eine moderne Variante der Lernmatrix ist das BAM (zu deutsch: Bidirektionale AssoziativgedÃ¤chtnis). Es ist als feedback Netz von seinem Aufbau her sehr anspruchslos und ordnet Vektorpaare einander zu. Die Suchzeit fÃ¼r ein spezifisches Muster hÃ¤ngt von der Anzahl der eintrainierten Netze ab. Das Netz besteht aus zwei Neuronenschichten, die untereinander verknÃ¼pft sind. Im Sinn eines korrigierten Netzes reagiert BAM tolerant auf kleine Fehler im Inputmuster. Ist die Abweichung nicht zu groÃŸ, so kann es das korrekte Outputmuster erzeugen. Der groÃŸe Nachteil ist, dass nur recht wenige Muster in dieses Netz eintrainiert werden kÃ¶nnen. Das, was BAM allerdings weiterhin interessant bleiben lÃ¤sst, ist die serielle VerknÃ¼pfung meherer dieser Netze. Mit dieser kaskadierung und einem speziellen Decodierungmechanismus wurde es mÃ¶glich, die engen Speicherbegrenzungen zu Ã¼berwinden.

KÃ¼nstliche neuronale Netze wie das BAM, die Lernmatrix (Perceptron - Netzewrk) oder das Hopfield - Netzwerk erfreuen sich einer groÃŸen Beliebtheit. Das begrÃ¼ndet sich durch ihren einheitlichen einfachen Aufbau. Netze dieser Art haben gute Chancen, zu eigenen Chips analoger oder anderer Bauart Ã¼berfÃ¼hrt zu werden. Auch optische vefahren, die sich durch ihre riesigen SpeichermÃ¶glichkeiten auszeichnen, liegen hier in Reichweite technischer Realisierung.

3.2.7 Weitere Modelle neuronaler Netzwerke

Es gibt natÃ¼rlich noch eine FÃ¼lle anderer Topologien neuronaler Netzwerke, wie z.B.:
- Simulated Annealing, - Boltzmann - Maschine, - ART (Adaptive Resonance theory),
- Neocognitoren, - SPR (Spatiotemporal Pattern Classifier);
werden hier aber nicht mehr nÃ¤her beschrieben.

3.3 Anwendungen

3.3.1 Sprachgenerierung

Terrence Sejnowski von der Johns - Hopkins - UniversitÃ¤t hat mit seinen Kollegen durch die Entwicklung eines neuronalen Netzwerkes zur maschinellen Umsetzung von Texten in Sprache nicht nur in Fachkreisen fÃ¼r Aufsehen gesorgt. Das Netz liest geschrieben englischen Text und produziert eine Lautbeschreibung, die akustisch umgesetzt werden kann - es kann also Text laut vorlesen.

Mittels eines Sprachsynthesizers werden die vom Netz in einer Lautsprachensymbolik beschriebenen Phoneme (kleinste Einheit der "Lautbeschreibungssprache") in hÃ¶rbare Laute umgesetzt. Die QualitÃ¤t der Aussprache ist vergleichbar mit der eines Kleinkindes im Alter von ca. 5 bis 6 Jahren. WÃ¤hrend der Lernphase differenziert das Netz die einzelnen Laute immer besser. Anfangs klingen alle Worte nd Satzteile monoton und undeutlich, doch mit zunehmender Lerndauer werden die Worte und Laute immer besser prononciert und betont. Das Netzwerk basiert auf dem Backpropagation - Algorithmus. Die Entwicklungszeit fÃ¼r diese Anwendung betrug laut Sejnowski lediglich ein halbes jahr.

3.4.2 Datenkompression

Versucht man, Bilder oder Sprachsignale Ã¼ber Leitungen mit geringer Bandbreite in Realzeit zu Ã¼bertragen, stÃ¶ÃŸt man auf das Problem der Datenkompression. Um die Ãœbertragung zu beschleunigen ist es meistens erforderlich, die Daten so zu komprimieren, dass einerseits die Ãœbertragung schnell genug durchgefÃ¼hrt werden kann, dass andererseits aber durch die Kompression der Daten keine relevanten Informationen verloren gehen.
Contrell und Zipser von der UniversitÃ¤t in San Diego und Munro von der UniversitÃ¤t Pittsburgh haben neuronale Netzwerke erfolgreich fÃ¼r solche Datenkompressionen eingesetzt. Die drei Forscher haben ein selbstorganisierendes dreilagiges Netzwerk entwickelt, das digitalisierte Bilder in ihren verschiedenen Gruatufen um den Faktor 8 komprimiert (d.h. es wird nur 1/8 der Daten Ã¼bertragen), aber dennoch mit hoher Detailtreue nach der Ãœbertragung wieder regeneriert. FÃ¼r solche Anwendungen eigenen sich insbesondere auch Counterpropagation - Netzwerke.

3.4.3 Handschriftenerkennung

In vielen industriellen Anwendungen wÃ¤re es hilfreich, Handschriften maschinell lesen und auswerten zu kÃ¶nnen. Dieses Problem ist aber wegen der groÃŸen Abweichungen zwischen unterschiedlichen Handschriften Ã¤uÃŸerst schwierig und mit konventionellen Methoden praktisch nicht zu lÃ¶sen.

Der NobelpreistrÃ¤ger Leon Cooper hat zu diesem Zweck ein Netzwerkmodell (RCE Restricted Coulomb Energy Network) entwickelt, mit dem es mÃ¶glich ist, beliebige geometrische Figuren, also auch handgeschriebene Texte, mit hoher Genauigkeit zu klassifizieren. Das Netzwerk Ã¼berwindet damit beispielsweise die prinzipiellen Limitierungen des Perceptron - Modells. Nestor, die Firma Coopers, hat auf dieser Basis ein Handschriftenerkennungssystem fÃ¼r die japanische Wortschrift Kanji entwickelt. Die Benutzer des Systems kÃ¶nnen mittels eines an einen Computer angeschlossenen SchreibgerÃ¤tes handschriftliche Zeichen in Kanji eingeben und benÃ¶tigen keine Tastatur, das wÃ¤re fÃ¼r die ca. 3000 Symbole dieser japanischen Schriftart auch kaum mÃ¶glich. Die von Fukuschima entwickelten Netzwerkmodelle "Cognitron" und "Neocognitron" sind darÃ¼ber hinaus sogar in der Lage, Schriftensymbole zu erkennen.

3.4.4 QualitÃ¤tskontrolle und Diagnose

In der Produktion mÃ¼ssen zur Sicherung der QualitÃ¤t hÃ¤ufig automatisierte Stichproben durchgefÃ¼hrt werden. So besteht beispielsweise in der Automobilindustrie das Problem, Motoren anhand ihrer LaufgerÃ¤usche auf Produktionsfehler zu Ã¼berwachen. Die firma Siemens hat deshalb Netzwerke entwickelt, die anhand der MotorengerÃ¤usche auf MotorprÃ¼fstÃ¤nden defekte Motoren erkennen. Zu solchen Diagnosen sind meist nur sehr erfahrene KFZ - Mechaniker in der Lage. Die Genauigkeit der neuronalen Netzwerke bei diesen Anwendungen ist heute bereits hÃ¶her als die der Fachleute.

3.4.5 MilitÃ¤rische Anwendungen

Es ist bekannt, dass gerade in den USA viele potentielle Anwendungen neuronaler Netzwerke im militÃ¤rischen Bereich untersucht werden bzw. wurden (u.a. DARPA und SDI). Bei den Anwendungen handelt es sich vorwiegend um AnsÃ¤tze zur Verbesserung der automatischen Erkennung von Objekten, wie Schiffen, U - Booten, Flugzeugen oder Raketen, wobei versucht wird., dies in Realzeit zu erreichen. Da die meisten Projekte jedoch geheim sind, lassen sich Erfolge oder MiÃŸerfolge dieser Forschung bislang kaum nachvollziehen.

Bekannt geworden ist eine Anwendung neuronaler Netzwerke der US - Marine zur Klassifizierung von Sonarsignalen fÃ¼r die Erkennung von U - Booten. Gorman und Sejnowski haben die LeistungsfÃ¤higkeit neuronaler Netzwerke fÃ¼r solche Anwendungen demonstriert. Das von ihnen konstruierte dreilagige Backpropagation - Netzwerk (mit zwÃ¶lf Prozessoren in der verdeckten Schicht) klassifzierte die Signale Ã¤hnlich gut wie ein erfahrener, fÃ¼r diese Aufgabe jahrelang ausgebildeter Offizier.

3.4.6 Weitere Anwendungsgebiete neuronaler Netzwerke

Es sind bis heute bereits mehrere Dutzend industrieller Bereiche hinsichtlich iherer Eignung fÃ¼r den Einsatz neuronaler Netzwerke untersucht worden. Zu nennen sind hier beispielsweise:

die Luft - und Raumfahrt (fehlertolerante Systeme, FlugÃ¼berwachung und Diagnostik, Autopiloten,...) die Medizin (Auswertung von Langzeit - EKGs, BlutdruckÃ¼berwachung,...) die Meteorologie (Wettervohersage, Luftbildauswertung,...) die Sicherheitstechnik (Sprengstoffdetektoren, Personenidentifikation,...) die Werbung (Adressatenauswahl fÃ¼r Serienbriefe) die Post (Handschriftenerkennung, PostleitzahlenlesegerÃ¤te) Banken und Versicherungen (Aktienkursprognosen, KreditrisikoabschÃ¤tzungen, Risikobewertung von Versicherungen, Datenanalysen, Unterschriftenerkennung, TransaktionsÃ¼berwachung,...) das MilitÃ¤r ( Objekterkennung, Auswertung von Sonarsignalen,...) die Kommunikationstechnik (RauschunterdrÃ¼ckung, EchounterdrÃ¼ckung, Signalfilter, Datenkompression zur Beschleunigung der DatenÃ¼bertragung, Spracherkennung und Sprachgenerierung,...)

4 Zusammenfassung von Berichten zum Thema KI - Philosophische Probleme

4.1 Alan M. Turing - Kann eine Maschine denken?

Turing gelangt von dieser Frage zu einem neuen Problem, das er als Spiel formuliert. Dabei handelt sich um das sogenannte Imitationsspiel. Es nehmen drei Spieler daran teil. Ein Mann (A), eine Frau (B) und ein mÃ¤nnlicher Fragesteller (C). Der Fragesteller sei allein in einem Raum. Das Ziel des Fragestellers ist es zu entscheiden, welche der beiden anderen Personen der Mann bzw. die Frau ist. Er kennt sie zunÃ¤chst als X bzw. Y, und das Spiel endet damit, dass er sagt "X ist A und Y ist B" oder "X ist B und Y ist A". Der Fragesteller darf an A und B Fragen stellen. Dies sollte am besten schriftlich durchgefÃ¼hrt werden. Das Ziel von B ist es C zu helfen. Anstelle der Frage "KÃ¶nnen Maschinen denken?" wird jetzt die Frage gestellt, was passiert wenn der Spieler B durch eine Maschine ersetzt wird. Der Vorteil dieses Spiels liegt darin das es eine klare Trennung zwischen physischen und psychischen Eigenschaften des Menschen gibt. AuÃŸerdem kann durch die Art des Frage und Antwortspiels jeder Bereich menschlichen BemÃ¼hens miteinbezogen werden. Unter den teilnahmeberechtigten Maschinen versteht Turing sog. Digitalrechner. Diese bestehen aus einem Speicher, einer ausfÃ¼hrenden Einheit und einem Kontrollwerk. ZusÃ¤tzlich handelt es sich bei "TuringÂ´s" Digitalrechnern um Rechnemaschinen mit unbegrÃ¤nzter KapzitÃ¤t, d.h. sie besitzen einen unbegrenzten Speicher. Weiter sind sie programmierbar und haben die FÃ¤higkeit eine zufÃ¤lliges Element hervorzubringen. AuÃŸerdem besteht Turing darauf, dass Digitalmaschinen auf die MÃ¶glichkeiten der ElektrizitÃ¤t verzichten kÃ¶nnten. Sie ist nur Mittel zum Zweck, aber keine Notwendigkeit, d.h. er schlieÃŸt auch keine rein mechanischen Digitalrechner aus. Weiters sind die beschriebenen Digitalrechner "Maschinen mit diskreten ZustÃ¤nden", d.h. sie kÃ¶nnen nur eine bestimmte Anzahl von ZustÃ¤nden erreichen, und wenn man diese kennt, so ist es mÃ¶glich bei Kenntnis des Anfangszustandes jeden weiteren Zustand vorherzusagen. Turing geht weiter, indem er sagt, teilt man einem Digitalrechner mit unbegrenztem Potential die Entscheidungstabellen von stetigen Maschinen mit, so ist dieser in der Lage die Maschinen nachzuahmen. Maschinen dieser Art nennt Turing "Universelle Maschinen". Eine Maschine ist in der Lage alle Maschinen nachzuahmen. Daraus ergibt sich die Gleichwertigkeit aller Digitalrechner. Aus den vorangegangen Ãœberlegungen wird das Imitationsspiel neu formuliert:
"Ist es wahr, dass ein ganz bestimmter Digitalrechner C nach geeigneter Modifizierung seines SpeichervermÃ¶gens und seiner Aktionsgeschwindigkeit, sowie nach angemessener Programmierung, in die Lage versetzt werden kann, die Rolle von A im Imitationsspiel zu spielen, wobei BÂ´s Rolle von einem Menschen Ã¼bernommen wird?" Ich mÃ¶chte nun auf beschriebene EinwÃ¤nde nicht eingehen, da die AusfÃ¼hrungen Turings zur Widerlegung der EinwÃ¤nde diesen Rahmen sprengen wÃ¼rden. Nur eines, er widerlegt die EinwÃ¤nde nicht mit Beweisen, in dessen Besitz er nicht ist, sondern zeigt lediglich Fehler in den Gegenargumenten auf. Ein Einwand war, das Maschinen nicht fÃ¤hig wÃ¤ren zu lernen, sondern nur das wiedergeben kÃ¶nnten, was man ihnen zuvor eingegeben hat. Turing stellt nun die Frage, ob es mÃ¶glich ist eine solche Maschine zu konstruieren, die die FÃ¤higkeit besitzt aus erfaÃŸten Daten neue SchlÃ¼sse zu ziehen. Er geht davon aus, dass die RechnerkapazitÃ¤t in ferner Zukunft keine groÃŸe HÃ¼rde darstellen wird, sonder das Problem in der Programmierung selbst liegt. Um einer Maschine den Verstand eines Erwachsenen einzugeben brÃ¤uchte man seiner Ansicht nach zu lange, deshalb stellt er folgende Theorie auf: Anstatt einer Maschine den Verstand eines Erwachsenen einzuprogrammieren, programmiert man sie auf mit dem Verstand eines Kindes. Erzieht man diese Maschine dann mit geeigneten Mitteln, erhÃ¤lt man den Verstand eines Erwachsenen. Als "Lernmethoden" beschreibt Turing einerseits das Belohnung - Strafe Modell, andererseits eine Sprache mit deren Hilfe der Lehrer der Maschine Befehle mitteilen kann ohne Strafe oder Belohnung verwenden zu mÃ¼ssen. Weiters ist es notwendig die Kindmaschine mit einer umfassenden Logik auszustatten. Sie muss in der Lage sein, aus eingegebenen Befehlen auf ein bestimmtes Verhalten schlieÃŸen zu kÃ¶nnen. Mit Hilfe solcher Kindmaschinen und einer sinnvollen "Erziehen" sieht Turing kein Problem, dass das Imitationsspiel von einer Maschine durchgefÃ¼hrt werden kann.

4.2 Michael Scriven - Der vollkommene Roboter: Prolegomena zu einer Androidologie

Scriven erÃ¶rtert in seinem Bericht die Frage, ob eine einzigartige Wesenheit das menschliche Gehirn auszeichnet, die einen Supercomputer daran hindern kÃ¶nnte zu sagen: "Alles, was du kannst, das kann ich besser.".
Er definiert den Begriff Maschine nicht nÃ¤her, sondern untersucht, ob etwas, das aus herkÃ¶mmlichen elektronischen und mechanischen Teilen hergestellt ist, wie wir sie in jedem Computerladen finden, mit zukÃ¼nftigen Verbesserungen und Ersetzungen, fÃ¼r alle Zeiten bestimmte FÃ¤higkeiten entbehren muss, die das menschliche Gehirn besitzt. Bei der Materialwahl lÃ¤sst er zwar die Ãœberlegung zu, ob die Stoffe, aus denen das Gehirn besteht nicht bereits die idealen Bestandteile wÃ¤ren, ist aber dennoch der Ãœberzeugung, dass mit Hilfe von technischen Bauteilen und auch mÃ¶glicherweise mit Hilfe organischer Stoffe eine intelligente Maschine herstellbar ist, die anders in der Konstruktionsweise und besser in der Funktionsweise ist, als das menschliche Gehirn. In den folgenden Kapiteln seines Berichts erÃ¶rtert Scriven Eigenschaften, die fÃ¼r die meisten den Menschen als intelligente Lebensform auszeichnen und untersucht die Eigenschaften einer Maschine in Bezug auf die "Menschlichkeit". Zum Thema Vorhersagen und WÃ¤hlen schreibt er Maschinen ebenso einen freien Willen zu, wie er auch die FÃ¤higkeiten von Maschinen nicht ausschlieÃŸt zu schaffen oder zu entdecken. Beim Thema Schaffen unterscheidet er zwei Vorgehensweisen. Die eine Vorgehensweise beschreibt die MÃ¶glichkeit durch zufÃ¤lliges Einsetzen in vorgegebene Gesetze (mathematische Gleichungen) zu einer LÃ¶sung zu gelangen. In diesem Fall liegen die Vorteile einer Maschine klar auf der Hand, einerseits dir PrÃ¤zision und andererseits die Geschwindigkeit. Die andere Vorgehensweise um etwas neues zu entdecken beschreibt Situationen, in denen man nicht durch bloÃŸes zufÃ¤lliges Einsetzen auf neue LÃ¶sungen kommt. Doch auch die MÃ¶glichkeit durch Induktionismus und logisches Kombinieren auf neue Theorien zu stoÃŸen, liegt laut Scriven fÃ¼r Maschinen im Bereich des MÃ¶glichen. Eine weitere menschliche Eigenschaft ist die des Lernens und auch in diesem Bereich sieht er keinen Anlass dazu schwarz zu sehen. Lernen durch Erfahrung ist bereits in Anwendung (Schachcomputer) und auch der Erwerb von OriginalitÃ¤t durch Maschinen ist laut Scriven im Bereich des MÃ¶glichen. Zum Thema Verstehen meint er, dass Verstehen sehr viel mit menschlichem BewuÃŸtsein zu tun hat. Der Begriff Verstehen hÃ¤ngt immer von seiner menschlichen Interpretation ab. Ob eine Maschine verstehen kann, schlieÃŸt er nicht aus. Als Beispiel, gibt er den Bereich der Mathematik an. Hier gibt es Aussagen, die auch der Mensch nicht Beweisen kann, sie aber in ihrer Richtigkeit akzeptiert und so kÃ¶nnten auch Maschinen diverse Aussagen akzeptieren, und sie somit verstehen. Ein weiterer Punkt beschreibt die FÃ¤higkeit zu Analysieren. Darunter Fallen die FÃ¤higkeiten Ãœbersetzen, Abstrahieren und Registrieren von Sprache. Beim Ãœbersetzen sieht Scriven das Problem des kontextbezogenen Inhalts einer Nachricht. Eine eins zu eins Ãœbersetzung ist kein Problem. Eine klare UnfÃ¤higkeit der Maschinen sieht Scriven beim Abstrahieren. Im Gegensatz dazu betont er die Wichtigkeit von Maschinen beim Registrieren. Gerade in einer Zeit der Informationsflut sollte auf die FÃ¤higkeiten der Maschinen zurÃ¼ckgegriffen werden. Einzige Schwierigkeit dabei ist es, die Methodik festzulegen, nach der Registriert wird, und festzustellen, von was der Text oder die Information handelt. Damit verbunden ist die FÃ¤higkeit zu Entscheiden, was wichtig und was weniger wichtig ist. Dieses Problem ist gleichzusetzen mit dem der Wahl der richtigen Hypothese. Bei der Wahrnehmung greift Scriven auf sensorischen MÃ¶glichkeiten der Technik zurÃ¼ck und sieht daher kein gravierendes Problem der Umsetzung. Auch er behandelt den Aspekt der Ã¼bersinnlichen Wahrnehmung und akzeptiert ihre RealitÃ¤t. Er geht jedoch davon aus, dass es sich dabei um Gehirnfunktionen handelt, die nur noch nicht lokalisiert wurden, Ã¤hnlich der GedÃ¤chtnisfunktion. Daher schlieÃŸt er auch in diesem Bereich eine Nachbildung nicht aus. Zum Thema fÃ¼hlen ist zu sagen, dass er Robotern keine GefÃ¼hle zuschreibt und somit auch Turing widerspricht. FÃ¼r Scriven reicht es nicht, dass einem Roboter einprogrammiert wird zu sagen, er sei verliebt. Programmiert man ihn dann aber weiter, erklÃ¤rt ihm was LÃ¼ge und Wahrheit bedeutet und verbietet ihm zu lÃ¼gen, teilt man ihm alles Wissen dieser Welt mit und stellt ihm dann die Frage ob er GefÃ¼hle hat, mÃ¼sste man ein ja dennoch akzeptieren.

4.3 Herbert A. Simon / Allen Newell - Informationsverarbeitung in Computer und Mensch

Zuallererst wird eine klare Trennung zwischen Hardware (Gehirn) und Software (Denkprozesse) vollzogen. Es kommt nicht so sehr auf die materielle Umgebung der Prozesse an, sondern vielmehr auf ihre grundlegenden AblÃ¤ufe. Daher ist der Computer ein legitimes Instrument, solche DenkvorgÃ¤nge nachzubilden oder zu testen. Man spricht jedoch nicht von DenkvorgÃ¤ngen, sondern von elementaren Informationsverarbeitungsprozessen. Die kleinsten Einheiten dieser Prozesse sind Symbole, Listen und Beschreibungen. Als kleinste Einheit kann man ein Symbolzeichen bezeichnen. Sie sind in der Lage Werte zu reprÃ¤sentieren und verglichen zu werden. Als nÃ¤chste Grundeinheit wird die Liste bezeichnet. Sie ist eine geordnete Menge, eine Sequenz, von Symbolen. Folglich ist mit jedem Zeichen, auÃŸer mit dem letzten, ein einziges nÃ¤chstfolgendes Zeichen verbunden. Mit der Liste als ganzer ist ein Symbol verbunden: der Name. Auf diese Weise kann eine Liste eine Sequenz von Symbolen sein, die ihrerseits Namen von Listen sind - eine Liste von Listen. Ein bekanntes Beispiel einer Liste von Symbolen, die wir alle in unserem GedÃ¤chtnis haben, ist das Alphabet. Assoziationen bestehen auch zwischen Symboltypen. Eine Assoziation ist eine zweistellige Ralation, die drei Symbole beinhaltet, vondenen einses dir Relation, die anderen zwei ihre Argumente bezeichnen. "Die Farbe des Apfels ist rot" spezifiziert diene Assoziation zwischen Apfel und rot mit der Bezeichnung Farbe. Die Assoziationen eines Symbols beschreiben dieses Symbol.
Nun kÃ¶nnen mit Hilfe dieser Grundelemente einige elementare Prozesse durchgefÃ¼hrt werden: Unterscheidungsprozesse, Erschaffungsprozesse, Kopierprozesse, EinfÃ¼gungsprozesse, LÃ¶schprozesse, Suchprozesse.
Neben diesen Elementarprozessen gibt es auch weitere Prozesse, die aus den vorangegangenen Prozessen bestehen: z.B. serielle Mustererkennungsprozesse
Neben den nun vorgestellten atomaren Prozessen gibt es auch noch eine hÃ¶here Klassen von ProblemlÃ¶sungsprozessen, die sog. allgemeinen ProblemlÃ¶ser. Der allgemeine ProblemlÃ¶ser ist ein Programm, das zweierlei voneinander getrennt halten soll: (1) ProblemlÃ¶serprozesse, die der Theorie zufolge die meisten Menschen mit durchschnittlicher Intelligenz besitzen und benÃ¼tzen, wenn sie mit irgendeinem relativ unbekannten Aufgabengebiet konfrontiert werden und (2) spezifische Informationen Ã¼ber jedes einzelne Aufgabenfeld. Den Kern des allgemeinen ProblemlÃ¶sers bildet die ProzeÃŸorganisation fÃ¼r die Mittel - Ziel - Analyse. Das Problem wird definiert durch die Spezifikation einer gegebenen Situation (A) und einer erwÃ¼nschten Situation (B). ein UnterscheidungsprozeÃŸ, der in das System der Mittel - Ziel - Analyse eingebaut ist, vergleicht A mit B und entdeckt eine Differenz oder mehrere (D), falls vorhanden. Mit jeder Differenz ist im GedÃ¤chtnis eine Anzahl von Operatoren (O) oder Prozessoren verbunden, die mÃ¶glicherweise fÃ¼r die Aufhebung dieser Differenzen rlevant sind. Das Mittel - Ziel - Analyseprogramm versucht dann im weiteren die Differenz dadurch zu beseitigen, dass es die relevanten Operatoren nacheinander anwendet.
Einige weitere Prozesse: Planungsprozesse, Organisation des ProblemlÃ¶sens, UnterscheidungsbÃ¤ume
Informationsverarbeitungstheorien erklÃ¤ren Verhalten auf unterschiedlich detaillierten Ebenen. In den nun bestehenden Theorien kÃ¶nnen mindestens drei Ebenen unterschieden werden. Auf der am hÃ¶chsten aggregierten Ebene finden sich Theorien von komplexem Verhalten in spezifischen Problembereichen: Beweisen von Theoremen in derLogik oder der Geometrie, Auffinden von Schachmatt - Kombinationen im Schach. Diese Theorien enthalten tendenziell sehr extensive Annahmen Ã¼ber das Wissen und die FÃ¤higkeiten der Menschen, die diese TÃ¤tigkeiten ausfÃ¼hren, sowie Ã¼ber die Art und Weise, wie diese Kenntnisse und FÃ¤higkeiten organisiert und intern reprÃ¤sentiert werden. Jede dieser Theorien schlieÃŸt deshalb eine ziemlich groÃŸe Menge von Annahmen ein und macht Voraussagen Ã¼ber das Verhalten nur in einem eng begrenzten Gebiet.
Auf einer zweiten Ebene sind Ã¤hnliche oder identische Informationsverarbeitungsmechanismen vielen aggregierten Theorien gemeinsam. Mittel - Ziel - Analyse, Planung, das Such - Abtast - Schema und UnterscheidungsbÃ¤ume sind allemein brauchbare Verarbeitungsorganisationen, die fÃ¼r ein weites Gebiet von Aufgaben anwendbar sind. Da das Wesen dieser Mechanismen besser verstanden wird, fangen sie nun damit an, ihrerseits als grundlegende Bauelemente fÃ¼r die aggregierten Theorien zu dienen, was erlaubt, die letzteren in einer knapperen Form darzustellen und den groÃŸen Anteil an Mechanismen aufzuzeigen, die allen Aufgaben gemeinsam und nicht nur den je individuellen Aufgaben eigentÃ¼mlich sind.
Auf der niedrigsten, der atomaren Ebene setzen alle Informationsverarbeitungstheorien nur eine kleine Menge von Grundformen symbolischer ReprÃ¤sentation und eine kleine Zahl von elementaren Informationsprozessen voraus. Der Aufbau und der erfolgreiche Test von Programmen in groÃŸem MaÃŸstab, die komplexe menschliche Verhaltensweisen simulieren, liefern den Beweis dafÃ¼r, dass eine kleinen Menge von Elementen, die denen Ã¤hnlich sind, die hier fÃ¼r informationsverarbeitende Sprachen postuliert werde, fÃ¼r den Aufbau einer Theorie vom menschlichen Denken ausreicht.

4.4 Hilary Putnam - Geist und Maschine

In diesem Aufsatz wird versucht eine Analogie zwischen KÃ¶rper - Geist und Logik - Struktur Problem zu finden. Das Logik - Struktur - Problem wird mit Hilfe der Turingmaschine erlÃ¤utert. Am Ende kommt man zu der Erkenntnis, das diese Art von Problemen rein sprachlicher Natur sind, und unter gegebenen Voraussetzungen keine LÃ¶sung finden werden.

4.5 John R. Searle - Geist, Gehirn, Programm

Searle beschÃ¤ftigt sich mit der Frage, ob Computer in der Lage sind zu verstehen. Er geht dabei auf das Imitationsspiel von Turing ein. Seiner Meinung nach, wird es in Zukunft sicher Maschinen geben, die in der Lage sein werden Denkaufgaben und VorgÃ¤nge in der Weise zu erledigen, wie sie heute unser Gehirn erledigt. Computer zÃ¤hlen fÃ¼r ihn aber nicht zu diesen Maschinen. Um seine These zu stÃ¼tzen bringt er das Beispiel mit dem chinesischen Zimmer. Bei dieser Situation, gibt es einen Menschen, dessen Muttersprache Englisch ist. Dieser sitzt in einem geschlossenen Raum. Vor einem Fenster auÃŸerhalb des Raums stehen Personen deren Muttersprache chinesische ist. Der Mensch in dem Raum erhÃ¤lt nun mehrere Symbole, die die auÃŸenstehenden als chinesische Schriftzeichen identifizieren wÃ¼rden. Als nÃ¤chstes erhÃ¤lt die Person im Zimmer eine Anleitung auf Englisch, seiner Muttersprache, wie er die Symbole zu kombinieren hat. AuÃŸerhalb des Raumes erkennen die Personen SÃ¤tze, bzw. Aussagen. Und als letztes erhÃ¤lt die Person im Raum noch eine Anleitung in seiner Muttersprache Englische, wann er welche Schriftzeichenkombinationen zu verwenden hat. Die Personen auÃŸerhalb spielen mit der Person im Raum nun das Imitationsspiel. Aufgrund der Anleitungen, wann welche Symbole zu verwenden sind ist die Person im Raum nun in der Lage das Imitationsspiel problemlos zu meistern. Stellt man nun jedoch die Frage, ob er etwas verstanden hat, von dem was er mit den Symbolen zum Ausdruck brachte, antwortet dieser mit nein. Er hat lediglich die Anweisungen in der Sprache verfolgt, die er seine Muttersprache nennt. FÃ¼r die AuÃŸenstehenden ist diese Tatsache nicht erkennbar. FÃ¼r sie hat er zu jeder Frage die passende Antwort gegeben. Searle vergleicht nun die Person im Raum mit einem Computer (der Hardware) und die Anweisungen mit dem Programm (der Software). Es steht fÃ¼r ihn also fest, das Computer, wie wir sie heute kennen, nicht in der Lage sind zu verstehen, also in die Rolle von Gehirnen schlÃ¼pfen. Diese Ansicht wird auch starke AI genannt. Den Aussagen der schwachen AI, Computer wÃ¤ren in der Lage gewisse Denkprozesse zu simulieren, stimmt Searle jedoch zu.

5 Anhang

5.1 Anhang A: Regelung eines Systems mit Hilfe eines Neuronalen Netzes

5.1.1 Definition der Regelung

Bei der Regelung geht es darum, in einem dynamischen System, siehe Abbildung, eine bestimmte zeitverÃ¤nderliche GrÃ¶ÃŸe, die AusgangsgrÃ¶ÃŸe, auf einen fest vorgegebenen Wert, die FÃ¼hrungsgrÃ¶ÃŸe, zu bringen. HierfÃ¼r steht die beliebig verÃ¤nderbare StellgrÃ¶ÃŸe zur VerfÃ¼gung, die die AusgangsgrÃ¶ÃŸe stark beeinfluÃŸt. Oft kommt noch eine unerwÃ¼nschte GrÃ¶ÃŸe mit unerwarteten Ã„nderungen hinzu, die die AusgangsgrÃ¶ÃŸe vom erwÃ¼nschten Verhalten abbringt, die sogenannte StÃ¶rgrÃ¶ÃŸe.

Â Â

Abbildung: Blockbild eines dynamischen Systems

Um nun die RegelgrÃ¶ÃŸe an den gewÃ¼nschten Verlauf anzupassen, ist die stÃ¤ndige Beobachtung der Strecke nÃ¶tig. Die daraus gewonnenen Informationen werden dazu benutzt, die neue StellgrÃ¶ÃŸe zu ermitteln, die die StÃ¶rgrÃ¶ÃŸe ausgleichen soll. Eine Anordnung, die das leistet, siehe Abbildung, heiÃŸt Regelung.

Abbildung: Blockbild einer Regelung

Um die StellgrÃ¶ÃŸe ermitteln zu kÃ¶nnen, wird also stÃ¤ndig die RegelgrÃ¶ÃŸe beziehungsweise die AusgangsgrÃ¶ÃŸe zurÃ¼ckgefÃ¼hrt. Im Gegensatz dazu wird bei einer Steuerung nur gemeldet, ob nach der Reaktion auf die Aktion der Steuerung bestimmte Bedingungen erfÃ¼llt sind oder nicht. An einen Regler gibt es Forderungen, die, wenn sie erfÃ¼llt sind, fÃ¼r seine Brauchbarkeit garantieren.

5.1.2 Forderungen an einen Regler

StabilitÃ¤t: Dies ist das wichtigste Kriterium, das ein Regler erfÃ¼llen muss. Die RegelgrÃ¶ÃŸe durchlÃ¤uft normalerweise einen Einschwingvorgang, das heiÃŸt sie oszilliert um den FÃ¼hrungswert. Klingen die Oszillationen mit zunehmender Zeit ab, so ist die Regelung stabil. Bei Dauerschwingung oder zunehmender Schwingung bezeichnet man die Regelung als instabil und damit funktionsunfÃ¤hig.

StationÃ¤re Genauigkeit: Eine ebenfalls unabdingbare Grundanforderung an einen Regler ist die Einhaltung einer hinreichenden stationÃ¤ren Genauigkeit. Dies bedeutet, dass die Differenz zwischen RÃ¼ckfÃ¼hr - und FÃ¼hrungsgrÃ¶ÃŸe nach Beendigung des Einschwingvorgangs unter einer vorgegebenen Schranke liegen soll.

Schnelligkeit und geringe Oszillationen: Diese beiden Forderungen stehen meist im Widerspruch, so dass man einen annehmbaren KompromiÃŸ finden muss. Da der FÃ¼hrungswert in mÃ¶glichst kurzer Zeit erreicht werden soll, muss die aufgeschaltete StellgrÃ¶ÃŸe groÃŸ werden, was mÃ¶glicherweise ein Ãœberschwingen zur Folge hat.

Abbildung: Prinzip der Regelung: Aus dem Zustand x(t) des dynamischen Systems ermittelt der Regler die StellgrÃ¶ÃŸe u(t)

Neuronale Netze sind fÃ¼r die Aufgabe der Regelung, siehe Abbildung, besonders geeignet, da sie die FÃ¤higkeit besitzen, auch Abweichungen von der gelernten Systemdynamik gut ausgleichen zu kÃ¶nnen. Dies ist bei technischen Systemen oft der Fall, da hier leicht Abweichungen gegenÃ¼ber den Bewegungsgleichungen auftreten. So kann man zum Beispiel die mechanischen Bewegungen einer lockeren Kette beim Anspannen nicht mit Formeln erfassen. Bekommt das Netz nun solche verfÃ¤lschte Eingabeparameter, kann es diese gegebenenfalls ausgleichen und das System trotzdem regeln. Ein herkÃ¶mmlicher Regler wÃ¼rde das nicht bewerkstelligen kÃ¶nnen, da er nach den Bewegungsgleichungen des Systems fÃ¼r sehr exakte Werte trainiert wurde und nur Ã¤uÃŸerst geringe Abweichungen davon kompensieren kann.

5.2 Anhang B: Identifikation eines Systems mit Hilfe eines Neuronalen Netzes

Identifikation eines technischen Systems, siehe Abbildung, bedeutet, zu versuchen dessen Verhalten nachzubilden. Meist handelt es sich bei diesen Systemen um nichtlineare Systeme, deren Dynamik nur mit einem groÃŸen Formelapparat erfaÃŸbar ist. Will man sie nachbilden, stÃ¶ÃŸt man auf das Problem, mÃ¶glichst exakte Formeln zur Beschreibung der Systemdynamik zu bekommen. Mit Hilfe Neuronaler Netze geht man einen anderen Weg: Man schaltet parallel zu dem zu identifizierenden System ein Neuronales Netz und gibt an beide sowohl den Ausgangs - Zustand x(t) des Systems als auch die auf das System angewandte Aktion u(t). Den sich daraus ergebenden Zustand des Systems x(t+1) vergleicht man mit der Ausgabe des Netzes und nimmt die Differenz als FehlermaÃŸ fÃ¼r den Lernalgorithmus des Neuronalen Netzes.

Abbildung: Identifikation eines Technischen Systems: Das Netz lernt den Folgezustand x(t+1) des Systems auf die Aktion u(t) im Zustand x(t).

Hat man das System mit einem Neuronalen Netz identifiziert, so kann man dies zum Lernen eines Reglers fÃ¼r das System verwenden. WÃ¼nschenswert ist es, den Regler direkt am technischen System wÃ¤hrend des Betriebes desselben, also ,,Online", lernen zu kÃ¶nnen. Oft ist dies aus technischen GrÃ¼nden nicht mÃ¶glich. Dies kann zum Beispiel aus GeschwindigkeitsgrÃ¼nden der Fall sein. Auch eine VerfÃ¤lschung der Systemdynamik durch den Regler wÃ¤re denkbar. Nimmt man dahingegen das Neuronale Netz, welches das System identifiziert hat, so kann man mit ihm das System emulieren und so am Neuronalen Netz den Regler lernen.

5.3 Anhang C: Expertensystem Zahlungsverkehr

5.3.1 Zusammenfassung

Das Expertensystem XPSZV dient der UnterstÃ¼tzung bei der Beratung von Firmenkunden der Deutschen Bank AG. Es erfaÃŸt die aktuellen Zahlungsverkehrsdaten von Firmenkunden, vergleicht diese mit Branchenkennzahlen, analysiert SchwÃ¤chen im Zahlungsverkehrsverhalten des Kunden mit Hilfe eines ausgeklÃ¼gelten Expertenssystems und macht konkrete VerbesserungsvorschlÃ¤ge.
Das System wurde vollstÃ¤ndig als grafische DOS - Anwendung mit Pascal, Assembler und C entwickelt.

5.3.2 Wissendatenbank

Mit Hilfe der erhobenen Kundendaten und den ermittelten Optimierungen werden Branchenkennzahlen aktualisiert und die Wissensbasis optimiert.

Das System zeigt anschaulich den aktuellen IST - Wert des Kunden, den erreichbaren IDEAL - Wert und den aktuellen Stand der Optimierung. Alle VorschlÃ¤ge des Systems werden anschaulich dargestellt und begrÃ¼ndet.

5.3.4 Kundenberatung

Die Beratung eines Kunden beginnt mit der Aufnahme des aktuellen Zahlungsverkehrsverhalten. Dem Kunden werden sofort die Durchschnittswerte vergleichbarer Betriebe (Branche/Umsatz) angezeit, um FehleinschÃ¤tzungen vorzubeugen.

BezÃ¼glich Scheckzahlungen bestehen allgemein eine Reihe von Vorurteilen. XPSZV stellt die Schecksituation eines Unternehmens in Form einer Grafik dar. Im obigen Beispiel muss festgestellt werden, dass sich ausschlieÃŸlich Schecks Ã¼ber grÃ¶ÃŸere BetrÃ¤ge lohnen. BetrÃ¤ge unter DM 8000 sollten nie mit Scheck bezahlt werden.

Nach der Erfassung der Ist - Situation kann der Berater zusammen mit dem Kunden einen Optimierungslauf durchfÃ¼hren. Das System analysiert SchwÃ¤chen im Zahlungsverkehr und macht mit Hilfe der Wissensdatenbank und dem Expertenwissen eine Reihe von VerbesserungsvorschlÃ¤gen. Am Ende der Beratung werden die erzielten Einsparungen in einer Ãœbersicht dargestellt.

Die Beratung mit allen OptimierungsvorschlÃ¤gen und dem Ergebnis kann auf einem Drucker ausgegeben werden.

6. Quellenverzeichnis

H. R. Hansen: Wirtschaftsinformatik I; 6. Auflage; UTB fÃ¼r Wissenschaften; 1992 Stuart E. Savory: KÃ¼nstliche Intelligenz und Expertensysteme; 2. Auflage; Oldenbourg Verlag; MÃ¼nchen Wien 1985 Eberhard SchÃ¶neburg, Nikolaus Hansen, Andreas Gawelczyk: Neuronale Netzwerke; EinfÃ¼hrung, Ãœberblick und AnwendungsmÃ¶glichkeiten KI - Philosphische Probleme; Reclam Verlag Internet Seiten: www.samsoft.de/xpszv.htm
www.info3.informatik.uni - wuerzberg.de

8833 Worte in "deutsch" als "hilfreich" bewertet

Digital Audio

Benutzerrechte auf Windows NT

Linux - Where do you want to go tomorrow?