Spannende Zeiten für private und geschäftliche Anwendungen stehen bevor. Die KI-Landschaft ist immer wieder aufs Neue faszinierend. Bei so vielen Fortschritten in den letzten Monaten stellt sich die Frage, was als Nächstes kommen könnte.
Hier sind 4 Vorhersagen für KI im Jahr 2023
1. GPT-4 kommt, schnallen Sie sich an!
Die Veröffentlichung von OpenAIs GPT-4 wird mit großer Spannung erwartet. Die nächste Generation des OpenAI-Sprachmodells soll Anfang des Jahres erscheinen und es wird erwartet, dass es eine große Verbesserung gegenüber seinen Vorgängern GPT-3 und GPT-3.5 darstellen wird, das selbst bereits mit satten 175 Milliarden Parametern trainiert wurde.
ChatGPT hatte in weniger als einer Woche mehr als eine Million Nutzer, was dazu führte, dass der Dienst täglich zusammenbrach, weil er die Last nicht bewältigen konnte, so dass die Nutzer zweifellos in Scharen zu GPT-4 strömen werden.
Was können wir also realistischerweise von GPT-4 erwarten?
Es könnte sein, dass es nicht viel größer ist als frühere Versionen. Einem Forschungspapier zufolge, das DeepMind Anfang des Jahres veröffentlicht hat, könnten große Sprachmodelle (LLMs) wie GPT-4 am Ende zu groß für eine optimale Leistung sein.
Es hat sich herausgestellt, dass weniger Parameter, aber Training auf größeren Datensätzen zu besseren Ergebnissen führen können. Mit anderen Worten, die Qualität der Trainingsdaten ist wichtiger als die Größe des Modells, die dann die Leistung der KI bestimmt.
Die derzeitigen Spitzenreiter auf diesem Gebiet, wie GPT-3, Megatron-Turing und Jurassic, wurden alle mit Datensätzen von etwa 300 Milliarden Token trainiert.
GPT-4 könnte diese Zahlen in den Schatten stellen, da es auf einem mindestens 10-mal größeren Datensatz trainiert, der vielleicht sogar 10 Billionen Token umfasst. Das ist ein echter Paukenschlag!
Der Erste, der multimodal arbeitet?
GPT-4 könnte das erste KI-Modell sein, das über die Textform hinausgeht und andere Medientypen wie Bilder, Töne und Videos in einem einzigen Schritt verarbeiten kann. Wenn dies der Fall ist, wäre dies ein großer Fortschritt für die KI.
Man könnte dem GPT-4 eine Texteingabe geben und es ein Bild generieren lassen oder ihm Fragen zu einem Video stellen, das Text als Eingabe enthält.
Es ist aber auch möglich, dass sich GPT-4 wie seine Vorgänger auf Text beschränkt. Dennoch wird GPT-4 wahrscheinlich beträchtliche Verbesserungen in den Bereichen Gedächtnis (die Fähigkeit, auf frühere Gespräche zurückzugreifen) und Zusammenfassung (das Zusammenfassen einer großen Textmenge auf ihre Kernpunkte) aufweisen.
KI-Vorhersage #
2. Vielleicht gehen uns die Daten aus…
KI-Modelle brauchen Daten, um zu lernen und sich zu verbessern. Sehr viele Daten. Es wird oft gesagt, dass Daten das neue Öl sind, und genau wie Öl sind sie eine endliche Ressource. Dies gilt insbesondere für Sprachmodelle: Um diese Modelle leistungsfähiger zu machen, haben die Forscher von DeepMind herausgefunden, dass es nicht darum geht, sie größer zu machen, sondern sie mit immer mehr und vielfältigeren Datensätzen zu trainieren.
Aber wie viele Sprachdaten gibt es überhaupt noch? Einigen Schätzungen zufolge liegt die Gesamtmenge hochwertiger Textdaten zwischen 4,6 und 17,2 Billionen Token, einschließlich aller Bücher, wissenschaftlichen Abhandlungen, Nachrichtenartikel, Wikipedia und eines Großteils des restlichen Internets. Möglicherweise nähern wir uns der Grenze der verfügbaren Sprachdaten, auf denen diese KI-Modelle trainiert werden können.
Dies könnte eine große Hürde für die Zukunft der Sprach-KI-Modelle darstellen.
Forschungsteams arbeiten bereits fleißig an Lösungen für diese Herausforderung. Eine Möglichkeit, die erforscht wird, ist die Transkription von gesprochenen Inhalten aus Meetings und anderen verbalen Eingaben, um große Mengen an Textdaten zu erfassen, die derzeit nirgendwo gespeichert sind. Mal sehen, wie OpenAI dieses Problem angeht.
3. Fahrerlose Autos werden zum Mainstream
Autonome Fahrzeuge sind seit Jahren in der Entwicklung, und in San Francisco kann man bereits über die Cruise-App (die wie Uber oder Lyft funktioniert) ein fahrerloses Auto anfordern. Im Moment sind diese Fahrten nur nachts verfügbar, aber Cruise plant, den Service in naher Zukunft rund um die Uhr anzubieten. Waymo, der Konkurrent von Cruise und ehemaliges Google-Projekt, ist dicht dahinter.
Im Jahr 2023 werden wir wahrscheinlich einen rasanten Anstieg der Zahl der automatisierten Taxis auf den Straßen und der Zahl der Fahrgäste erleben, die sie nutzen.
Die Unternehmen, die autonome Fahrzeuge anbieten, sind jetzt bereit, ihr Produkt zu kommerzialisieren und zu skalieren, wobei sie es schrittweise einsetzen. Neben San Francisco könnten im nächsten Jahr in mindestens zwei weiteren amerikanischen Städten vollständig fahrerlose Dienste für die Allgemeinheit verfügbar sein. Zu den möglichen Standorten gehören Phoenix, Miami, Austin oder Las Vegas.
Die Zukunft des Verkehrs steht vor der Tür!
4. Die Suche wird nie mehr dieselbe sein
Die Suche bestimmt, wie Menschen online auf Informationen und Daten zugreifen, und sie ist das Herzstück des heutigen Webangebots.
Auswirkungen auf die persönliche Suche
Große Sprachmodelle, die mit zunehmender Genauigkeit und Komplexität lesen und schreiben können, werden die Suche sicherlich radikal verändern.
Ein Konzept, das mit der Einführung von ChatGPT an Aufmerksamkeit gewonnen hat, ist die konversationelle Suche, die es Nutzern ermöglicht, ein interaktives Gespräch mit einem KI-Assistenten zu führen, um das zu finden, was sie suchen.
Dies ersetzt das derzeitige Verfahren, bei dem man eine Suchanfrage in das Suchfeld eines Browsers eingibt und dann eine lange Liste von Links erhält, die man durchforsten muss. Dies könnte das Spiel für so unterschiedliche Anwendungen wie akademische Forschung, das Schreiben von Aufsätzen, die Suche nach Referenzen und die Überprüfung von Fakten, kreatives Schreiben und vieles mehr verändern.
Auch wenn der konversationellen Suche eine große Zukunft bevorsteht, gibt es noch eine große Hürde zu überwinden, bevor sie für den allgemeinen Einsatz bereit ist: vollständige Genauigkeit. Diese großen Sprachmodelle sind nicht immer zuverlässig, und manchmal geben sie falsche Informationen mit scheinbar vollkommener Sicherheit weiter.
Um von den Nutzern sowohl im privaten als auch im beruflichen Bereich akzeptiert zu werden, muss die konversationelle Suche die meiste Zeit über korrekte Antworten liefern. Dies wird im Jahr 2023 eine der größten Herausforderungen für Suchinnovatoren sein.
Unternehmen wie You.com, Character.AI, Perplexity und Metaphor gehören zu den Start-ups, die Googles Position herausfordern und die Verbrauchersuche durch KI-Konversationsschnittstellen neu erfinden wollen.
SEO-Fachleute und Blog-Autoren werden sich ebenfalls anpassen müssen – da relevante Antworten auf Nutzeranfragen leicht über ChatGPT (oder eine der Apps, die auf GPT für bestimmte Zwecke entwickelt wurden, wie z. B. Perplexity für Bildung und Forschung) abrufbar sein werden, wird es nicht mehr so wichtig sein, ständig tonnenweise Inhalte zu veröffentlichen.
Was die Besucher auf Ihre Website locken wird, ist eher das, was der SEO-Experte H-Educate „magnetische Ressourcen“ nennt. Dabei kann es sich um nützliche Leitfäden, auf persönlichen Erfahrungen basierende Anleitungen, ergebnisorientierte Checklisten, datengestützte Studien und kostenlos angebotene Tools handeln, die den Nutzern einen großen Mehrwert bieten, so dass diese wiederum die Website erwähnen und verlinken werden.
Auswirkungen auf die betriebliche Suche
Sprachmodelle werden sich wahrscheinlich auch auf die Unternehmenssuche auswirken und die Art und Weise, wie Unternehmen ihre eigenen internen Daten durchsuchen und darauf zugreifen, neu definieren.
Unternehmen können nun Informationen auf der Grundlage von Konzepten und Kontexten indexieren und abrufen, nicht nur anhand von Schlüsselwörtern. Dies wird die Unternehmenssuche wesentlich leistungsfähiger und produktiver machen.
Hebbia (ein persönlicher KI-Analyst, der „in Gedankengeschwindigkeit recherchiert“ und „mit KI-gestützten Erkenntnissen 10 Mal sicherer und schneller Entscheidungen trifft“) ist ein Startup, das in diesem Bereich führend ist.
Multimodal werden
Schließlich eröffnen große KI-Modelle neue Möglichkeiten bei der multimodalen Suche, die es den Nutzern ermöglicht, Informationen über verschiedene Datentypen abzufragen und abzurufen – Text, Bilder, Videos usw.
Von allen Daten im Internet machen Videos etwa 80 % aus. Es ist also keine Überraschung, dass Unternehmen wie Twelve Labs multimodale KI-Plattformen entwickeln, um eine erweiterte Videosuche zu ermöglichen.
Es liegt auf der Hand, dass sich die Art und Weise, wie Menschen Informationen suchen und finden, verändern wird, sei es als Privatpersonen oder als Fachleute.
Abschließende Gedanken
Es gibt so viele aufregende – und vielleicht in gewissem Maße auch beunruhigende – Entwicklungen im Bereich der KI-Technologie.
Da sich die Anwendungen für KI auf immer mehr Branchen ausweiten, ist es wichtig, den neuesten KI-Trends voraus zu sein und darüber nachzudenken, wie Ihr Unternehmen davon profitieren könnte.
Angepasst an den Originalbeitrag von Forbes und veröffentlicht auf AIForBusinesses.