Alors qu’OpenAI multiplie les innovations, notamment avec le lancement ce mois-ci de son générateur de vidéos Sora, l’analyse vidéo intégrée à ChatGPT et les Projets, Google affiche sa détermination à rester dans la course. Dans un article publié ce lundi 16 décembre 2024, l’entreprise a dévoilé d’importantes nouveautés pour ses modèles d’IA : le lancement de Veo 2 pour la génération de vidéos, une version améliorée d’Imagen 3 pour la création d’images, et l’introduction de Whisk, un outil permettant de fusionner des images.
Présenté en mai dernier, le modèle Veo de Google dédié à la génération de vidéos bénéficie désormais d’une mise à jour baptisée Veo 2. Cette nouvelle version promet, selon Google, « une meilleure compréhension des lois physiques du monde réel ainsi que des subtilités des mouvements et des expressions humaines », renforçant ainsi le réalisme des vidéos produites. Fidèle à sa vision initiale, Google met également en avant les capacités de Veo à répondre à des demandes spécifiques et à intégrer le langage cinématographique dans ses créations.