ven. Juil 26th, 2024

OpenAI, la société à l’origine de ChatGPT, a une fois de plus étonné le monde en lançant Sora un modèle d’intelligence artificielle qui génère des vidéos à partir de textes . « Nous apprenons à l’IA à comprendre et à simuler le monde physique en mouvement, dans le but de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction avec le monde réel », explique l’entreprise sur son site web.

La technologie utilise des techniques d’apprentissage en profondeur et des réseaux neuronaux et, contrairement aux modèles précédents de génération de vidéos, « Sora » peut générer des vidéos à partir de n’importe quelle résolution et n’importe quel rapport d’aspect . « Il peut générer des vidéos d’une durée maximale d’une minute tout en préservant la qualité visuelle et le respect des instructions de l’utilisateur.

Il peut simuler des mondes numériques, restituer des environnements complets et contrôler des personnages en temps réel. « Il est capable de générer des scènes complexes avec plusieurs personnages des types de mouvements spécifiques et des détails précis du sujet et de l’arrière-plan. Le modèle comprend non seulement ce que l’utilisateur a demandé dans le message, mais aussi comment ces choses existent dans le monde physique ».

« Des personnages convaincants et des émotions vibrantes ».

Greg Brockman président et cofondateur d’OpenAI, a publié une démonstration des images que « Sora » peut créer sur les médias sociaux :

« Le modèle a une connaissance approfondie de la langue Cela lui permet d’interpréter les instructions avec précision et de créer des personnages convaincants qui expriment des émotions vibrantes. Sora’ peut également créer plusieurs plans au sein d’une même vidéo  générés qui reflètent fidèlement les personnages et le style visuel », est-il précisé.

Quand sera-t-il disponible ?

Aujourd’hui, « Sora » est disponible pour le d’évaluer les zones critiques en termes de dommages ou de risques. . Nous donnons également accès à une série d’artistes visuels, de concepteurs et de cinéastes afin d’obtenir des commentaires sur la manière de faire évoluer le modèle pour le rendre plus utile aux professionnels de la création », explique l’OpenAI.

Certaines faiblesses sont encore en cours d’élimination, mais l’entreprise affirme que « nous partageons nos progrès de recherche très tôt pour commencer à travailler avec des personnes extérieures à OpenAI et recueillir leurs commentaires, et pour donner au public une idée des capacités de l’IA à l’horizon ».

Corrections de bugs

Qu’est-ce que c’est ? faiblesses qui sont corrigées ? Comme l’explique l’entreprise, « Sora » peut actuellement « avoir des difficultés à simuler avec précision la physique d’une scène complexe et peut ne pas comprendre des cas spécifiques de cause et d’effet. Par exemple, une personne peut prendre une bouchée d’un biscuit, mais par la suite, le biscuit peut ne pas avoir de trace de bouchée.

« Le modèle peut également confondre les détails spatiaux d’un message, par exemple en confondant la gauche et la droite, et peut avoir des difficultés à décrire avec précision des événements qui se déroulent dans le temps, comme suivre une trajectoire spécifique de la caméra « , a-t-il ajouté.

Lorsque ces questions sont résolus La technologie devrait être plus proche des utilisateurs en général.

Suivez-nous sur notre canal WhatsApp et ne manquez pas les dernières nouvelles sur antena3noticias.com.

By Nermond

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *