Künstliche Intelligenz ist in aller Munde. Spätestens nach den riesigen medialen Erfolgen, die ChatGPT, Midjourney und Co. feiern, kommt kaum jemand um den Hype herum. Doch inwieweit sich künstliche Intelligenz bereits Jahre vorher in unser Leben geschlichen hat, scheint schnell vergessen zu sein. Bereits viele Jahre verwenden wir intelligente Suchmaschinen, E-Mail-Konten filtern gekonnt Spam und Werbung aus unserem Postfach, Banken verlassen sich hinsichtlich Sicherheit und Betrugsaufdeckung auf die Fähigkeiten der Fraud Prevention künstlicher Intelligenz. Neu und spannend sind die jüngsten Entwicklungen natürlich hinsichtlich der Fähigkeiten der Interaktion, die bisher oftmals eher passiv war und nun zunehmend aktiver wird.
Wir finden, es ist auch mal an der Zeit, um „unter die Haube“ zu sehen und zu zeigen, was eine künstliche Intelligenz zu einer solchen macht und welche technologischen Entwicklungen den Weg geebnet haben.
Künstliche Intelligenz – Definition
Künstliche Intelligenz (KI) ist ein interdisziplinäres Feld, das sich mit Methoden und Modellen befasst, um Computern bzw. Systemen zu ermöglichen, Funktionen auszuüben, die normalerweise mit der menschlichen Intelligenz in Verbindung gebracht werden.
Intelligenz besteht im Grunde genommen aus vier Grundpfeilern: Wahrnehmen, Verstehen, Handeln und Lernen. Ganz schön kompliziert und schwer für eine Software, ein System oder eine Plattform, auch nur einen der Grundpfeiler zu erlernen, geschweige denn, davon alles auf einmal zu beherrschen…
Aus diesem Grund gibt es eine klare Unterscheidung zwischen der sogenannten „schwachen KI“ – diese ist sehr aufgabenorientiert und unterstützt bei Lösungen ganz spezifischer Problemfälle – und der sogenannten „starken KI“ – diese ist (noch) ein philosophisches Konzept einer Maschine mit fortgeschrittenen kognitiven Fähigkeiten und ist meist in Sci-Fi-Filmen zu finden.
Grundlage einer jeden KI sind entwickelte neuronale Netze oder Algorithmen, die eine bestimmte fachliche Aufgabe zu erfüllen haben.
Zu den verwandten Begriffen der KI gehört außerdem das sogenannte Maschinelle Lernen oder Tiefenlernen – beides ist eine Teilmenge von KI und kann ohne sie nicht existieren.
Methoden der künstlichen Intelligenz und Abgrenzung
Die ersten Methoden und Algorithmen der künstlichen Intelligenz reichen bis in die 1940er Jahre zurück. Doch es hat noch einige Jahre und einige Entwicklungseinflüsse gebraucht, bis KI massentauglich wurde. In diesen Jahren erfuhr die Welt einige technologische Schübe, die dazu beigetragen haben: immerzu steigende Rechenleistung, Performanceverbesserung von Datenbanken, Verfügbarkeit von Daten und die Fähigkeit, auch unstrukturierte, große Datenmengen speichern und auswerten zu können (#BigData).
Aber auch die Entwicklung diverser Frameworks wie PyTorch, TensorFlow oder Scikit-learn, die den Entwicklern eine drastische Beschleunigung und Erleichterung bei der Entwicklung von KI-Anwendungen verschafft haben. Das alles sind – neben den gesellschaftlichen, wirtschaftlichen und politischen Aspekten – wichtige Einflüsse, die zum KI-Boom beigetragen haben.
Kategorien von KI – insbesondere im Kontext des Machine Learnings – wären:
- Überwachtes Lernen
- Unüberwachtes Lernen
- Teilüberwachtes Lernen
- Bestärkendes Lernen.
Der Hauptunterschied innerhalb der Kategorien ist die Art und Weise, wie die Modelle trainiert und somit weiter verbessert werden. Während die Maschine beispielsweise beim überwachten Lernen anhand von Beispielen lernt (der Algorithmus erhält sowohl Input, z.B. in Form von Bildern, als auch gewerteten Output als eine Art Antwortschlüssel), gibt es beim unüberwachten Lernen keinen Antwortschlüssel, womit hierbei primär nach Mustern in bestehenden Datensätzen gesucht wird.
Bei dem bestärkenden Lernen nutzt die Maschine Beobachtungen aus der Interaktion mit ihrer Umwelt, um Maßnahmen zu ergreifen, wobei eine Belohnungsrückmeldung wichtig ist. Die Belohnungsrückmeldung wird als Verstärkungssignal genutzt, um der Maschine beizubringen, dass sie sich auf dem richtigen Weg befindet.
Einige konkrete Methoden und Algorithmen wären:
-
Natural Language Processing (NLP):
Natürliche Sprache wird in Form von Text oder Sprachdaten maschinell verarbeitet (Einsatz: z.B. Spracherkennungssysteme wie Siri/Alexa oder Chatbots) -
Computer Vision
Bilder werden maschinell verarbeitet (Einsatz: z.B. autonomes Fahren) -
Anomaly Detection
Prozess zur Identifizierung unerwarteter Elemente oder Ereignisse (Einsatz: z.B. Betrugserkennung im Banken- oder Versicherungswesen) -
Decision Tree
Aus einer Datenmenge werden hierarchische Strukturen von möglichst wenigen Entscheidungswegen gebildet (Einsatz: z.B. Einschätzung Kreditwürdigkeit) -
k-Means
Clusteranalyse zur sinnvollen Zuordnung einer gegebenen Menge an Objekten zu einzelnen oder mehreren Clustern (Einsatz: z.B. Segmentierung von Bilddaten) - u.v.m.
KI programmieren oder kaufen
Wer nun selbst mit dem Gedanken spielt, eine KI zu programmieren bzw. programmieren zu lassen, sollte einen gründlichen Plan ausarbeiten, um den Zweck zu definieren, sich dem Umfang des Projektes bewusst zu werden und die richtigen Partner an Bord zu holen. Eine KI benötigt eine konkrete Aufgabenstellung, sie benötigt unter Umständen eine große Menge an Daten, eine gründliche Evaluierung der benötigten Module und Bibliotheken und viele unterschiedliche Fachexperten: Data-Experten, Softwareentwickler (die Erfahrung mit den klassischen KI-Programmiersprachen wie Python, LISP oder Prolog haben), Fachexperten aus dem Bereich, in dem die KI eine Aufgabe lösen soll. Vor allem braucht die Entwicklung einer KI aber Zeit und Geduld, um zu lernen.
Das aktuell gehypte ChatGPT (noch in der Prototypenphase) wurde von dem Forschungs- und Bereitstellungsunternehmen für KI OpenAI entwickelt. OpenAI-Chef Sam Altman spricht selbst über die Grenzen, an die seine Technologie, noch Jahre nach Projektstart, stößt: „ChatGPT ist unglaublich limitiert, aber in einigen Dingen gut genug, um einen irreführenden Eindruck von Größe zu vermitteln“. Er schreibt, man müsse noch viel an der Robustheit und Wahrhaftigkeit arbeiten.
Unterstützt wurde das Projekt übrigens bereits im Vorfeld von Größen wie Elon Musk (CEO von Tesla), Reid Hoffmann (Mitbegründer von LinkedIn) oder Greg Brockman (ehem. Chefentwickler von Stripe). Außerdem konnte OpenAI auch hochrangige Mitarbeiter, wie einen ehemaligen Experten von Google im Bereich des maschinellen Lernens für sich gewinnen. Mit den Investitionen von Microsoft dürfte aber auch in Zukunft kaum etwas der Weiterentwicklung des intelligenten Chat-Programms im Wege stehen.
Doch wer sich nun keine Starinvestoren und Tech-Giganten ins Team holen kann, um eine KI für das eigene Unternehmen zu entwickeln, der sollte nicht gleich die Flinte ins Korn werfen. Üblich sind ohnehin erstmal andere Wege. Denn oftmals reicht es für bestehende Problemfälle, auf eine bereits fertige Lösung zurückzugreifen. Im Gegensatz zu den relativ hohen Kosten, Risiken und Zeitaufwänden einer Eigenentwicklung kann hier sehr genau mit Lizenz- oder Produktkosten kalkuliert und die Software kann zeitnah eingebunden werden. Doch selbst bei einer Standardlösung sollte ein (Inhouse-)Experte die Integrierung begleiten und sicherstellen, dass Ergebnisse korrekt interpretiert werden und auch für das Unternehmen einen Mehrwert bieten.
Und wie sieht es aus, wenn die Standard-Lösungen nicht reichen? In diesem Fall können Entwickler intelligente Funktionen in eine Individualsoftware einbauen. Dabei erfolgt die Implementierung über APIs zu cloudbasierten KI-Diensten. Google und Microsoft bieten bereits sehr gute Angebote für APIs, die recht einfach ihren Platz in Webapplikationen und Apps für mobile Geräte finden. So bietet z.B. Google mit seiner Cloud Vision API eine Möglichkeit, die eigene Anwendung für maschinelles Sehen auszurüsten und Informationen aus Bildern und Videos zu gewinnen. Microsofts Text Analytics API stattet Anwendungen mit der Fähigkeit aus, mithilfe von NLP (Natural Language Processing) Texte zu analysieren, Schlüsselphrasen und Entitäten zu identifizieren und allgemeine Themen und Trends zu verstehen.