Schurq

OpenAI streeft naar lancering van multimodaal model ‘Gobi’ vóór Google’s Gemini

|
Leestijd 2 minuten
Door Guido Sombroek

OpenAI werkt actief aan de ontwikkeling van Gobi, een geavanceerd groot taalmodel met multimodale mogelijkheden. Het doel is om Google’s Gemini voor te blijven. In ons vorige nieuwsbericht is besproken dat Gemini, het aankomende multimodale model van Google, in december 2023 verwacht wordt. OpenAI plant vergelijkbare multimodale functionaliteit aan GPT-4 toe te voegen om de concurrentie aan te gaan.

De opkomst van multimodale taalmodellen
Multi-modale taalmodellen zijn momenteel het gesprek van de dag. ChatGPT is een opvallend voorbeeld van hun prestaties in verschillende domeinen. Deze modellen gebruiken grote taalmodellen als hun ‘kern’ voor diverse multi-modale taken. Denk aan het genereren van verhalen op basis van afbeeldingen, het beantwoorden van vragen over visuele informatie, en wiskundige redeneringen zonder OCR.

OpenAI heeft deze capaciteiten al in maart gedemonstreerd met GPT-4, zij het met beperkte toegang, enkel voor één bedrijf genaamd “Be My Eyes,” dat mobiele applicaties ontwikkelt voor visueel gehandicapten. Nu bereidt OpenAI zich voor om GPT-Vision op grotere schaal uit te rollen, zes maanden na de eerste demonstratie.

De vertraging in de uitrol is voornamelijk te wijten aan zorgen over potentieel misbruik door kwaadwillende actoren, waaraan OpenAI’s ingenieurs momenteel werken.

Google staat voor soortgelijke uitdagingen en heeft in juli toezeggingen gedaan om verantwoorde ontwikkeling van al hun producten te waarborgen en misbruik van Gemini te voorkomen. Ondanks deze uitdagingen heeft Google een voordeel vanwege hun eigen gegevens over tekst, afbeeldingen, video’s, en audio, inclusief gegevens van platforms zoals zoekopdrachten en YouTube. Vroege gebruikers van Gemini hebben al minder onjuiste antwoorden gemeld in vergelijking met bestaande modellen.

Plannen voor GPT-5 en toekomstige ontwikkelingen
Sam Altman, CEO van OpenAI, heeft onlangs aangegeven dat GPT-5 nog niet is verschenen. Ze zijn echter van plan GPT-4 te verbeteren met verschillende verbeteringen, waarvan er één mogelijk het nieuwe verbeterde model wordt. Het is echter nog te vroeg om te zeggen of Gobi uiteindelijk GPT-5 zal worden, omdat het trainingsproces nog niet lijkt te zijn begonnen.

Deze concurrentie doet denken aan de rivaliteit tussen iPhone en Android in de wereld van kunstmatige intelligentie. Mensen kijken uit naar de lancering van Gemini, die de competitie tussen Google en OpenAI zal onthullen en welke impact dit kan hebben op bedrijven.

Deel dit artikel via
Guido Sombroek
Guido Sombroek

Over deze schurq

Lees ook