Lancement de Sora 2 : le nouveau modèle de génération vidéo

Lancement de Sora 2 : le  nouveau modèle de génération vidéo

OpenAI a dévoilé Sora 2, son modèle phare de génération de vidéo et d'audio, marquant un saut technologique significatif dans la simulation du monde réel. Décrit comme le "moment GPT-3.5 pour la vidéo", ce nouveau modèle dépasse largement les capacités de son prédécesseur en matière de réalisme, de compréhension des lois physiques et de contrôlabilité.

Les Capacités Révolutionnaires de Sora 2

Sora 2 représente une avancée majeure, notamment par sa capacité à générer des vidéos avec une simulation du monde plus sophistiquée. Contrairement aux modèles antérieurs qui pouvaient déformer la réalité pour accomplir une requête textuelle, Sora 2 modélise les interactions physiques de manière beaucoup plus précise.

Réalisme et Adhérence aux Lois Physiques

  • Modélisation de la Réussite et de l'Échec : Le modèle peut simuler des scènes complexes comme des routines olympiques ou des figures de paddleboard, modélisant avec précision la flottabilité et la rigidité. Fait marquant, il est capable de modéliser l'échec; si un joueur de basket manque un tir, le ballon rebondit sur le panneau plutôt que de se téléporter dans le panier.
  • Compréhension des Lois Physiques : Les "erreurs" de Sora 2 ressemblent souvent à des erreurs d'un agent interne implicitement modélisé, indiquant une meilleure compréhension des lois de la physique.

Contrôlabilité et Styles Variés

  • Instructions Complexes : Sora 2 excelle à suivre des instructions complexes sur plusieurs plans, tout en maintenant l'état du monde avec précision.
  • Diversité des Styles : Il peut générer du contenu dans des styles réalistes, cinématographiques et anime.

Génération Audio et Intégration du Réel

  • Sonorisation Avancée : En tant que système de génération vidéo-audio polyvalent, il crée des ambiances sonores de fond sophistiquées, des dialogues et des effets sonores avec un réalisme élevé.
  • Fonctionnalité "Cameos" : Une innovation majeure est la capacité d'injecter des éléments du monde réel directement dans les créations. En observant une vidéo d'une personne, le modèle peut l'insérer dans n'importe quel environnement généré par Sora, avec une représentation précise de son apparence et de sa voix. Cette fonctionnalité est applicable aux humains, animaux ou objets.

L'Application Sociale Sora

Pour exploiter pleinement les capacités de Sora 2, OpenAI lance une nouvelle application sociale iOS, simplement appelée "Sora". Cette application est centrée sur la co-création et l'interaction.

  • Création et Remix : Les utilisateurs peuvent créer, remixer les générations des autres et découvrir de nouvelles vidéos dans un flux personnalisable.
  • Communication Évoluée : La fonction "Cameos" est présentée comme une nouvelle forme de communication, permettant aux utilisateurs de s'intégrer dans n'importe quelle scène Sora avec une fidélité remarquable après un court enregistrement vidéo et audio unique pour vérifier l'identité.
  • Approche Sociale : L'application est lancée sur invitation pour encourager les utilisateurs à se connecter avec leurs amis, et vise à renforcer la communauté à un moment où de nombreuses plateformes s'éloignent du graphique social traditionnel.

Engagement envers le Bien-être des Utilisateurs et la Sécurité

OpenAI met l'accent sur la protection des utilisateurs, en particulier face aux préoccupations concernant le "doomscrolling", la dépendance et l'isolement.

  • Contrôle du Flux : Les utilisateurs disposent d'outils pour contrôler ce qu'ils voient. De nouveaux algorithmes de recommandation, basés sur les modèles de langage d'OpenAI, peuvent être instruits en langage naturel.
  • Bien-être Actif : Des mécanismes intégrés interrogent périodiquement les utilisateurs sur leur bien-être et leur offrent la possibilité d'ajuster leur flux.
  • Maximiser la Création : Par défaut, le contenu est fortement orienté vers les personnes suivies et les vidéos inspirantes pour la création, et l'application est explicitement conçue pour maximiser la création, non la consommation.
  • Protection des Adolescents : Des limites par défaut sur le nombre de générations visibles par jour, des permissions plus strictes pour les "Cameos" et des équipes de modérateurs humains sont en place.
  • Contrôles Parentaux : Via ChatGPT, les parents peuvent outrepasser les limites de défilement, désactiver la personnalisation algorithmique et gérer les paramètres de messagerie directe.
  • Consentement et Contrôle des "Cameos" : Les utilisateurs conservent un contrôle total sur l'utilisation de leur image. Ils décident qui peut utiliser leur "Cameo", peuvent révoquer l'accès ou supprimer toute vidéo l'incluant à tout moment.

Modèle Économique et Disponibilité

OpenAI adopte une approche transparente concernant la monétisation, en privilégiant le bien-être des utilisateurs.

  • Monétisation Future : Le seul plan actuel est d'offrir éventuellement aux utilisateurs la possibilité de payer pour générer une vidéo supplémentaire si la demande dépasse la capacité de calcul disponible.
  • Disponibilité de l'Application : L'application iOS Sora est disponible en téléchargement aux États-Unis et au Canada, avec l'intention d'étendre rapidement à d'autres pays. L'accès se fait initialement sur invitation.
  • Accès Web et API : Après avoir reçu une invitation, Sora 2 sera également accessible via sora.com.
  • Offres Gratuites et Pro : Sora 2 sera initialement disponible gratuitement avec des limites généreuses. Les utilisateurs de ChatGPT Pro pourront accéder au modèle expérimental de qualité supérieure Sora 2 Pro sur sora.com (et bientôt dans l'application). Un accès via API est également prévu.
  • Sora 1 Turbo : Le modèle Sora 1 Turbo restera disponible et toutes les créations antérieures seront conservées dans la bibliothèque sora.com.

Vision à Long Terme

Sora 2 est un pas significatif vers l'objectif d'OpenAI de créer des simulateurs de monde à usage général et des agents robotiques qui pourraient fondamentalement remodeler la société. L'entreprise est optimiste que Sora apportera de la joie, de la créativité et de la connexion au monde, offrant une plateforme plus saine pour le divertissement et la créativité.

Source : Openai.com

Cet article a été rédigé avec l’assistance d’un modèle de langage (LLM).

Besoin d'un accompagnement personnalisé?

Je propose des accompagnements au forfait et en régie pour vous aider à améliorer votre visibilité en ligne.