Actu IA #1 - Canva AI, Nouveau générateur GPT4o, La pensée d'une IA
Au programme des décryptages, l'actu en bref et une réflexion sur la capacité d'une IA à penser
Salut à tout le monde ! 😁
Et ouais, ça fait du bien de reprendre cette petite newsletter. J’ai essayé de changer un peu le format, dites-moi ce que vous en pensez en commentaires. Et si vous avez des idées de sujets pour cette newsletter, n’hésitez pas à me le dire aussi.
Allez, on est partis, et voici le menu de cette semaine !
1 – Canva AI révolutionne la création visuelle
2 – OpenAI démocratise la génération d’images avec GPT-4o
3 – Actus IA en bref – Ce qu’il ne fallait pas rater cette semaine
4 – Réflexion – Peut-on vraiment comprendre ce que pense une IA ?
🕵🏽♂️ Décryptage de l’IA
🎨 Canva AI : une nouvelle ère de design assisté par l’intelligence artificielle
En résumé
Canva vient de dévoiler ce qu’elle considère comme le plus grand lancement produit depuis sa création : la Suite Studio 2.0, qui introduit Canva AI, un assistant créatif conversationnel, mais aussi un tableur intelligent, un éditeur photo professionnel et même… un générateur de code. Objectif : unifier créativité et productivité dans un espace de travail assisté par IA.
Ce qui change vraiment
1. Vue unifiée et collaborative : tous les formats de création (présentations, docs, web, vidéos…) sont désormais regroupés dans un seul espace, avec une navigation en calques, façon outil de montage.
2. Canva Sheets : un tableur enrichi par l’IA, capable de générer des graphiques interactifs, d’analyser des données complexes et de proposer des insights automatiquement.
3. Canva AI : une interface à la ChatGPT, accessible par texte ou voix, qui permet de créer visuels, templates et contenus en langage naturel. L’IA se charge même des retouches photo de niveau pro.
4. Canva Code : sans doute la surprise de l’événement : un générateur de code assisté permettant de créer des pages interactives sans savoir coder.
Pourquoi c’est important
Avec cette nouvelle suite, Canva se positionne au carrefour du design, de la productivité et de l’IA générative. Elle n’est plus seulement une alternative à la suite Adobe, mais un outil transversal, qui parle autant aux designers qu’aux équipes marketing, pédagogiques ou produit. La promesse : gagner du temps sans sacrifier la qualité.
🖼️ Open AI et son nouveau moteur de générateur d’images
En résumé
OpenAI a rendu accessible à tous les utilisateurs — même gratuits — son nouveau générateur d’images intégré à ChatGPT, basé sur GPT-4o. Jusqu’ici réservé aux abonnés, il permet désormais de créer jusqu’à 3 images par jour gratuitement, en réponse à une simple requête textuelle (prompt). Les résultats sont bien plus convaincants que ceux obtenus avec DALL·E.
👉 Même si l’annonce date déjà d’une dizaine de jours, c’est probablement l’une des innovations IA les plus importantes de ces derniers mois, tant par son impact que par sa portée grand public.
Ce qui change vraiment
Le générateur comprend mieux les prompts, gère les références visuelles avec précision, et est désormais capable de reproduire du texte et des styles artistiques spécifiques (comme ceux des films Ghibli).
Pourquoi c’est important
C’est une vraie démocratisation d’un outil jusqu’ici réservé à une élite. Avec cette ouverture, OpenAI veut asseoir sa place dans la création d’images génératives face à Midjourney, Flux ou Ideogram. Mais elle le fait en contrôlant finement les usages, avec des restrictions qui poussent à l’abonnement et un encadrement strict (ajout de métadonnées, filtrage des contenus “sensibles”).
🪩 Autres actualités IA
Société
🧭 Une IA souveraine naît dans les Pyrénées-Orientales
Trois entreprises perpignanaises lancent LESTAC AI, une coopérative dédiée à une IA locale, éthique et sécurisée. Elle vise à renforcer l’autonomie technologique des entreprises du territoire. Une conférence inaugurale aura lieu le 15 avril à Perpignan, en présence d’experts et décideurs locaux.
Entreprises
🏢 Gemini : Google change de pilote pour accélérer
Josh Woodward prend la tête du projet Gemini, succédant à Sissie Hsiao. Google renforce ainsi sa stratégie produits avec ses nouveaux modèles Gemini, plus performants, désormais intégrés à Gmail, Docs et Android. Une réponse directe à OpenAI et Microsoft dans la bataille des assistants IA.
🧾 DeepMind restreint ses publications stratégiques
Filiale de Google, DeepMind est connue pour ses travaux ouverts majeurs comme AlphaGo ou AlphaFold. Elle limite désormais la publication de recherches sensibles liées à l’AGI pour conserver un avantage concurrentiel, marquant un tournant stratégique vers une logique plus industrielle.
Les Outils / Modèles
🤖 Meta dévoile Llama 4, une IA multimodale open source… mais sous conditions
Meta lance Llama 4, une nouvelle série de modèles capables de traiter texte, image et vidéo grâce à une architecture Mixture-of-Experts. Scout, Maverick et Behemoth offrent des performances impressionnantes et une accessibilité matérielle inédite. Déployés dans Meta AI dans 40 pays, ces modèles sont open source mais soumis à des restrictions strictes, notamment pour l’Europe.
🎬 Premiere Pro s’enrichit avec l’IA générative
Adobe lance “Generative Extend” dans Premiere Pro 25.2, prolongeant automatiquement les clips vidéo (2s) et audio (10s) via Firefly. Gratuit temporairement, la fonctionnalité s’accompagne d’une recherche sémantique et de traductions automatiques en 27 langues.
🎨 Midjourney V7 : vers une IA visuelle plus fine
La version 7 améliore la compréhension des prompts, introduit un mode “Draft” pour des itérations rapides, et propose des options de personnalisation graphique. Une évolution notable dans la qualité des rendus et la flexibilité créative.
🎙️ Microsoft muscle Copilot pour rivaliser avec ChatGPT
Microsoft enrichit Copilot avec des fonctions comme la mémoire, les actions web ou la génération de podcasts. Si ses performances restent en deçà de ChatGPT, son intégration native à Microsoft 365 et sa conformité RGPD en font un levier stratégique pour les entreprises.
En Recherche
🧠 Les LLM franchissent le test de Turing
Des modèles comme GPT-4.5 et LLaMa-3.1 réussissent à imiter des humains dans des dialogues complexes. Ces résultats relancent les débats sur leur usage social, leur régulation et leur rôle dans la diffusion de contenus manipulés.
🎭 MoCha : animation réaliste de personnages parlants
MoCha, nouveau modèle de DeepMind, génère des avatars synchronisés vocalement avec expressivité et mouvements corporels naturels. Il surpasse les standards actuels en lip-sync et cohérence visuelle, ouvrant la voie à des usages audiovisuels avancés.
Pause Réflexion - Et si on pouvait vraiment “voir” ce que pense une IA ? - Anthopic
Parce qu’il n’y a pas que les nouveautés et les outils… L’IA soulève aussi des questions de fond. Et si on prenait deux minutes pour y réfléchir ensemble ?
Cette semaine on parle de l'interprétabilité des modèles d'IA.
Comprendre un modèle de langage, ce n’est pas comme lire un programme ligne par ligne. Ces IA comme Claude, ChatGPT ou Mistral ne sont pas codées à la main. Elles apprennent par elles-mêmes en digérant des milliards de textes, d’images, de vidéos. Résultat : elles développent des stratégies internes pour répondre à nos questions, mais ces stratégies restent… invisibles. On ne sait pas vraiment comment elles raisonnent, ni quand elles le font bien ou mal.
C’est là qu’entre en jeu un domaine passionnant, et encore balbutiant : l’interprétabilité. Anthropic essaie de construire une sorte de “microscope pour IA” : un outil qui permettrait de visualiser les circuits internes activés quand Claude traite une question. Grâce à ce microscope, on découvre que Claude ne pense pas toujours en mot à mot, mais planifie parfois ce qu’il va dire à l’avance (notamment pour rimer en poésie), qu’il peut raisonner en plusieurs étapes pour répondre à des questions complexes, ou qu’il invente parfois une justification après coup pour coller à ce que l’utilisateur attend.
Ce que montrent ces recherches, c’est que les modèles ne sont pas de simples machines à réciter : ils génèrent des réponses en mobilisant des chemins de pensée internes, parfois cohérents, parfois flous, parfois opportunistes. On voit même apparaître des formes de langage de pensée universel, un espace conceptuel commun à toutes les langues que Claude parle. Mieux comprendre ces dynamiques internes, c’est donc un pas crucial vers une IA plus transparente, plus fiable… et plus digne de confiance.
Mais il faut rester lucide : ces approches sont encore lentes, limitées, coûteuses. On ne comprend aujourd’hui qu’une toute petite partie de ce qui se passe dans les coulisses de ces modèles. Et même si on commence à identifier les circuits qui causent les erreurs, les biais, ou les hallucinations, les corriger reste une autre paire de manches. L’interprétabilité est une piste prometteuse, mais aussi l’un des chantiers les plus complexes de l’IA actuelle. Un chantier qui mérite toute notre attention.
Vous avez aimé cette lecture ? Partagez et soutenez mon travail !
Et voilà ! C’est terminé pour ce numéro. J’espère que ça vous a plu !
N’hésitez pas à me faire un retour en commentaire avec ce que vous aimeriez recevoir dans cette newsletter.
En attendant, suivez-moi sur Youtube et vous pouvez gratuitement vous abonner à cette newsletter pour recevoir de nouveaux posts et soutenir mon travail.
On se retrouve très vite !
Amicalement Djouz
J’ai beaucoup apprécié « la pause réflexion ».