Die diesjährige Google I/O-Konferenz, die am 14. Mai stattfand, stand ganz im Zeichen bahnbrechender KI-Innovationen. Google präsentierte eine Vielzahl neuer Funktionen und Anwendungen, die darauf abzielen, das tägliche Leben und Arbeiten mit Google-Produkten zu vereinfachen und zu bereichern. Besonders hervorgehoben wurden Neuerungen in der Google-Suche und das neue KI-Modell Gemini 1.5 Flash.
Eine der bedeutendsten Ankündigungen war die Einführung eines neuen KI-gesteuerten Suchprozesses. Die aus der Search Generative Experience bekannten KI-Übersichten bieten nun vollständige Antworten direkt auf den Suchergebnisseiten, was das Nutzerverhalten erheblich verändern könnte. Statt auf Links zu klicken, erhalten User sofort umfassende Informationen. Diese Funktion wird zunächst in den USA eingeführt, mit Plänen für eine globale Expansion. Die Einführung der KI-Übersichten könnte sich nachteilig für Website-Betreiber auswirken, die bisher stark von Google-Weiterleitungen profitierten. Trotz der weiterhin angezeigten traditionellen Suchergebnisse unter den KI-basierten Antworten bleibt ungewiss, wie sich diese Änderung auf die Suchmaschinenoptimierung auswirken wird.
Neben der textbasierten Suche erweitert Google die visuellen Suchmöglichkeiten. Nutzer können nun Videoanfragen stellen, um Suchanfragen in einem neuen, interaktiveren Format zu erleben. Diese Funktion steht den Nutzer:innen der Search Labs in den USA auf Englisch zur Verfügung und soll später auf weitere Regionen ausgeweitet werden.
Google stellte auch neue generative KI-Optionen für die Bild- und Videoerstellung vor, darunter Imagen 3 für Bilder und Veo für Videos. Veo ermöglicht es Nutzern, aus einfachen Textbeschreibungen heraus hochwertige Videos in 1080p-Auflösung zu erstellen. Dies bietet Content-Erstellern und Marketing-Experten eine effiziente Möglichkeit, visuellen Content zu produzieren. Imagen 3 hingegen repräsentiert das fortschrittlichste Text-zu-Bild-Modell, das hochdetaillierte und fotorealistische Bilder erzeugen kann. Es ist derzeit in einer privaten Vorschau für ausgewählte Kreative zugänglich und soll bald für Vertex AI verfügbar sein.
Gemini wird umfassend in Googles Workspace-Anwendungen wie Gmail, Google Kalender und Google Docs integriert. Der verbesserte Chatbot Gemini 1.5 Pro ermöglicht das Suchen und Zusammenfassen von E-Mails und Google Meet-Aufzeichnungen direkt in der App. Nutzer können E-Mail Threads automatisch zusammenfassen lassen und erhalten mehrere vorgeschlagene Antworten zur Auswahl. Zudem agiert Gemini in Google Chat als virtuelle Assistenz, die Informationen zu Projekten zusammenfasst.
Google hat eine leistungsstarke Sprachassistenz namens „Live“ vorgestellt, die mit GPT-4o konkurrieren kann. Gemini Live nutzt ein verbessertes multimodales KI-Modell, um mobilen Nutzern ein natürlicheres Gesprächserlebnis in Echtzeit zu bieten. Zudem wurde Projekt Astra vorgestellt, das die Fähigkeiten von Gemini erweitert, um Gespräche natürlicher wirken zu lassen und schneller auf Informationen zu reagieren. Mithilfe einer Kamera auf einem Smartphone oder einer smarten Brille kann die KI die Umgebung analysieren und Fragen dazu beantworten.
Das neue KI-Modell Gemini 1.5 Flash wurde ebenfalls enthüllt. Dieses Modell ist für seine schnelle und effiziente Arbeitsweise bekannt und eignet sich besonders für die Analyse umfangreicher Dokumente und Code. Es bietet eine Leistung zwischen dem fortgeschrittenen Gemini 1.5 Pro und dem kleineren Modell, Gemini 1.5 Nano, und richtet sich vor allem an Entwickler, die auf Googles Plattformen eigene KI-Anwendungen entwickeln möchten.
Die Google I/O 2024 hat gezeigt, dass das Unternehmen mit hochfunktionalen KI-Lösungen neue Maßstäbe setzt. Mit den vorgestellten Funktionen und Tools ebnet Google den Weg für weitere Alltagsintegrationen von KI. Nur einen Tag vor der Konferenz präsentierte OpenAI das neue Modell GPT-4o, was die Innovationskraft in der KI-Branche unterstreicht.