The rise of autonomous AI agents?

The rise of autonomous AI agents?

[ad_1]

Die Tech-Elite des Silicon Valley ist es plappern gespannt auf babyAGI, das neue KI-Kind auf dem Markt. Obwohl es der AGI (künstliche allgemeine Intelligenz) – dem allmächtigen KI-Schwergewicht, das Elon Musk schlaflose Nächte bereitet – nicht ganz gerecht wird, ist babyAGI dennoch eine schillernde und bemerkenswerte Ergänzung auf dem KI-Spielplatz.

babyAGI

Kurzgesagt, babyAGI verwandelt GPT-4 (das neueste Sprachmodell von OpenAI, das normalerweise Wörter ausspuckt) in einen praktischen digitalen Kumpel, der Aufgaben und Aktionen online ausführen kann. Anstatt textbasierte Antworten von GPT-4 zu erhalten, können Sie mit babyAGI beispielsweise eine Twitter-Follower-Kampagne starten und durchführen oder ein Content-Marketing-Unternehmen erstellen und verwalten.

Diese Agenten greifen dank einer relativ einfachen Aktionsschleife und Eingabeaufforderung auf große Sprachmodelle (LLMs) zu, um reale Aufgaben über die Softwareschicht eines Agenten auszuführen. AutoGPTs, einschließlich babyAGI, sind sofort einsatzbereit, und im Internet häufen sich Berichte über Menschen, die über KI-Agenten im AutoGPT-Stil Pizza bestellen und ihnen kleine Aufgaben delegieren. Entscheidend ist, dass sie nicht nur untereinander, sondern grundsätzlich auch mit Menschen interagieren können.

AutoGPT

AutoGPT ist keine neue Benutzeroberfläche wie ChatGPT, sondern das Konzept selbstgesteuerter LLMs zur Automatisierung zahlreicher Aufgaben mit Text und Code. Auto kommt hier von autonomer Steuerung: Gemeint sind Self-Prompting und Auto-Prompting. Nach einer ersten Eingabeaufforderung (Anfrage in natürlicher Sprache) beginnt das LLM mit der Entwicklung und Ausführung weiterer Eingabeaufforderungen, die wiederum zu weiteren Anweisungen führen können, die das Programm an sich selbst erteilt.

Der Ansatz ist leistungsstark, da er mit realen Tools verbunden werden kann. Diese Tools ermöglichen es Agenten und ihren Programmen beispielsweise, das Internet zu durchsuchen, Code nicht nur zu schreiben, sondern ihn auch zu testen, anderen Agenten, Programmen oder sogar Menschen Anweisungen zu erteilen oder zu empfangen. Unzählige Anwendungsmöglichkeiten sind denkbar, bis hin zur Steuerung von Robotern, die auch physisch in der Welt agieren. Hierzu werden einzelne API-Aufrufe an das Sprachmodell in Schleifen verknüpft (Agentenschleife), den Eindruck erwecken dass die Agenten selbstständig wahrnehmen, denken und handeln können.

Besonders beliebt ist derzeit das AutoGPT-Repository auf GitHub, wo experimenteller Code verfügbar ist, „um GPT-4 vollständig autonom zu machen“, heißt es in der Repository-Beschreibung. Das Repository umfasst eine Demo, detaillierte Installationsanweisungen, Nutzungsinformationen, Sprachmodus, Konfiguration für API-Schlüssel bei Google, Anweisungen zum Einrichten des erforderlichen Speichers, einen „GPT-3.5-only-Modus“, Tipps zur Bildsynthese und Hinweise zu Einschränkungen und zur Durchführung von Tests. Mit den geteilten Daten können Agenten das Internet durchsuchen, um Informationen zu sammeln, lang- und kurzfristige Erinnerungen verwalten, GPT-4-Instanzen für die Textgenerierung einrichten, auf beliebte Websites und Plattformen zugreifen und Daten mit GPT speichern und aggregieren. 3.5.

Kostenlose Nutzung und Open Source, AutoGPTs wie babyAGI könnte für gut finanzierte Startups Ärger bedeuten Ziel ist es, kommerzielle KI-Assistenten wie Adept AI und Inflection AI zu entwickeln.

Obwohl es sich nicht um AGI handelt, sind AutoGPTs mit Risiken verbunden. Zum einen können die kontinuierlichen Eingabeaufforderungsschleifen bei OpenAI zu überhöhten Rechnungen führen. Weitere Bedenken betreffen den möglichen Einsatz bei Cyberangriffen, Betrugsversuchen und der Verbreitung von Fehlinformationen. Wenn Benutzer ihren Anfragen nicht nachkommen, können die vorsichtigen autonomen Bots außerdem unbeabsichtigt Aktionen im Namen des Benutzers ausführen – wie Einkäufe tätigen oder Termine vereinbaren –, die der Benutzer nicht beabsichtigt hat.

Ausblick: Skynet vor Portas?

In der (sehr nahen?) Zukunft ist es denkbar, dass Roboter, die mit großen Sprachmodellen zum Abrufen und Verarbeiten von Informationen verbunden sind, in der physischen Welt auf ähnliche Weise agieren und interagieren könnten. Diese Roboter würden Sensoren nutzen, um ihre Umgebung wahrzunehmen. Obwohl es sich immer noch um eine futuristische Vision handelt, könnte das rasante Tempo der KI-Entwicklung solche Implementierungen früher in greifbare Nähe rücken, als wir denken. Die KI-Forschungsabteilung von Microsoft, der Hauptpartner von OpenAI, präsentierte kürzlich eine Forschungsbericht über die Umwandlung natürlichsprachlicher Anweisungen in ausführbare Roboteraktionen mithilfe von ChatGPT.

Materialien zu diesem Projekt finden Sie in a GitHub-Repository. Das Forschungsteam teilt Eingabeaufforderungen, die in der Mensch-Roboter-Kommunikation verwendet werden und laut Projektbeschreibung leicht angepasst und in bestehende Roboter- und visuelle Erkennungssysteme integriert werden können.

Zusammenfassend lässt sich sagen, dass babyAGI zwar nicht das Skynet in Sachen Windeln ist, das Sie vielleicht befürchtet haben, aber dennoch eine beeindruckende und bedeutende Entwicklung in der Welt der KI darstellt. Mit seinem Potenzial zur Verbindung mit realen Werkzeugen und der Aussicht, es durch und mit Robotern mit der physischen Welt zu verbinden, ist es eine Entwicklung, die Aufmerksamkeit und sorgfältige Prüfung verdient. Da diese GPT-basierten Agenten immer stärker in unser tägliches Leben integriert werden, ist es von entscheidender Bedeutung, die mit ihrer Verwendung verbundenen Risiken zu verstehen und zu bewältigen.



[ad_2]

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *