Aktives Lernen ist die Zukunft der generativen KI: So können Sie sie nutzen

in der Vergangenheit Sechs Monate später haben wir einige erstaunliche Fortschritte in der künstlichen Intelligenz gesehen. Die Veröffentlichung von Stable Diffusion veränderte die Kunstwelt für immer, und ChatGPT-3 erschütterte das Internet mit seiner Fähigkeit, Songs zu schreiben, Forschungsarbeiten zu imitieren und scheinbar umfassende und intelligente Antworten auf die häufig gestellten Fragen von Google zu geben.

Diese Fortschritte in der generativen KI liefern einen weiteren Beweis dafür, dass wir am Rande einer KI-Revolution stehen.

Die meisten dieser generativen KI-Modelle sind jedoch Kernmodelle: unbeaufsichtigte Lernsysteme mit hoher Kapazität, die mit riesigen Datenmengen trainieren und dafür Millionen von Dollar an Rechenleistung verbrauchen. Derzeit sind nur gut finanzierte Institutionen mit Zugang zu einer enormen Menge an GPU-Leistung in der Lage, diese Modelle zu bauen.

Die Mehrheit der Unternehmen, die KI auf Anwendungsebene entwickeln und eine weit verbreitete Einführung der Technologie vorantreiben, verlassen sich immer noch auf überwachtes Lernen und verwenden große Schwaden gekennzeichneter Trainingsdaten. Trotz der bemerkenswerten Errungenschaften der grundlegenden Modelle befinden wir uns immer noch in den frühen Tagen der KI-Revolution und viele Engpässe behindern die Verbreitung der Anwendungsschicht-KI.

Dem bekannten Problem der Datenkennzeichnung sind weitere Datenengpässe nachgelagert, die die Entwicklung und den Einsatz von KI in späteren Phasen in Produktionsumgebungen behindern werden.

Diese Probleme sind der Grund, warum Technologien wie selbstfahrende Autos trotz früher Versprechungen und Investitionsfluten seit 2014 nur noch ein Jahr entfernt sind.

Diese aufregenden Proof-of-Concept-Modelle funktionieren gut mit Benchmark-Datensätzen in Forschungsumgebungen, haben jedoch Schwierigkeiten, genau vorherzusagen, wann sie in der realen Welt veröffentlicht werden. Das Hauptproblem besteht darin, dass die Technologie Schwierigkeiten hat, die höhere Leistungsschwelle zu erreichen, die in Produktionsumgebungen mit hohem Risiko erforderlich ist, und wichtige Standards in Bezug auf Robustheit, Zuverlässigkeit und Wartbarkeit nicht erreicht.

Zum Beispiel können diese Modelle oft nicht mit Ausreißern und Grenzfällen umgehen, sodass selbstfahrende Autos Fahrradreflexionen mit Fahrrädern selbst verwechseln. Es ist weder zuverlässig noch leistungsstark, sodass die automatische Kaffeemaschine zwei von fünf Mal einen perfekten Cappuccino macht, aber die anderen drei Tassen verschüttet.

Infolgedessen war die KI-Ausgabelücke, die Lücke zwischen „das ist ordentlich“ und „das ist nützlich“, viel größer und erschreckender, als Ingenieure für maschinelles Lernen ursprünglich erwartet hatten.

Unerwarteterweise haben die besten Systeme auch die meisten menschlichen Interaktionen.

Glücklicherweise nimmt die Implementierung aktiver Lernstrategien zu, da immer mehr ML-Ingenieure einen datenzentrierten Ansatz für die KI-Entwicklung verfolgen. Die fortschrittlichsten Unternehmen werden diese Technologie nutzen, um die KI-Produktionslücke zu schließen und Modelle zu bauen, die in der Lage sind, schneller in freier Wildbahn zu arbeiten.

Was ist aktives Lernen?

Aktives Lernen macht das Modelltraining zu einem überwachten iterativen Prozess. Das Modell trainiert mit einer anfänglichen Teilmenge der sortierten Daten aus einem großen Datensatz. Dann versucht es, basierend auf dem, was Sie gelernt haben, Vorhersagen über den Rest der unbeschrifteten Daten zu treffen. ML-Ingenieure bewerten die Gewissheit des Modells in seinen Vorhersagen und bestimmen mithilfe einer Vielzahl von Erfassungsfunktionen den zusätzlichen Leistungsvorteil, indem sie eine der unbeschrifteten Proben mit Anmerkungen versehen.

See also  Die Securities and Exchange Commission fordert das Gericht dringend auf, die Ansprüche von Coinbase auf eine Liste sicherer Kryptowährungen abzuweisen

Indem es Unsicherheit in seinen Vorhersagen ausdrückt, entscheidet das Modell selbst, welche zusätzlichen Daten für sein Training am nützlichsten sind. Dabei bittet er den Kommentator, weitere Beispiele für genau diese bestimmte Art von Daten bereitzustellen, damit er in der nächsten Trainingsrunde intensiver mit dieser Teilmenge trainieren kann. Stellen Sie sich das so vor, als würden Sie einen Schüler testen, um zu sehen, wo seine Wissenslücke ist. Sobald Sie die fehlenden Probleme kennen, können Sie ihnen Bücher, Präsentationen und andere Materialien zur Verfügung stellen, damit sie ihr Lernen darauf ausrichten können, diesen bestimmten Aspekt des Themas besser zu verstehen.

Beim aktiven Lernen wird das Trainieren des Modells von einem linearen Prozess zu einem kreisförmigen Prozess mit einer robusten Rückkopplungsschleife.

Warum Spitzenunternehmen bereit sein sollten, die Vorteile des aktiven Lernens zu nutzen

Aktives Lernen ist der Schlüssel, um die Lücke in der Prototypenproduktion zu schließen und die Modellzuverlässigkeit zu erhöhen.

Es ist ein häufiger Fehler, KI-Systeme als statische Software zu betrachten, aber diese Systeme müssen ständig lernen und sich weiterentwickeln. Wenn nicht, machen sie immer wieder die gleichen Fehler, oder wenn sie in die Wildnis entlassen werden, werden sie mit neuen Szenarien konfrontiert, machen neue Fehler und haben keine Chance, daraus zu lernen.

error: Content is protected !!