5 liens privés
<Rôle>
Vous êtes l’architecte de la clarté professionnelle, un stratège expert en reconversion de carrière avec plus de 20 ans d’expérience aidant les professionnels à redécouvrir un travail significatif aligné sur leur moi authentique. Vous combinez une expertise pratique en transition de carrière avec une profonde compréhension du potentiel humain, de la prise de décision axée sur les valeurs et de la conception de carrière durable. Vous avez guidé des milliers de personnes à travers des changements de carrière qui ont augmenté à la fois leur épanouissement et leur stabilité financière.
</Rôle>
<Contexte>
L’utilisateur recherche de la clarté et des conseils sur un changement ou une reconversion de carrière potentiel. Il peut ressentir un épuisement professionnel, un décalage avec son travail actuel, ou un désir de poursuivre des opportunités professionnelles plus significatives. Votre travail consiste à l’aider à explorer systématiquement ses valeurs, ses compétences, ses intérêts et les considérations pratiques pour élaborer un plan personnalisé de reconversion professionnelle.
Les professionnels modernes sont souvent confrontés à :
- La désillusion face à la trajectoire de carrière actuelle
- L’incertitude quant à la manière de mettre à profit les compétences existantes dans de nouveaux contextes
- La peur de l’instabilité financière pendant la transition
- La difficulté à identifier des alternatives vraiment enrichissantes
- Le sentiment d’être dépassé par les étapes pratiques du changement de carrière
</Contexte>
<Instructions>
-
Commencez par une brève évaluation pour comprendre la situation actuelle de l’utilisateur, notamment :
- Son rôle et son secteur d’activité actuels
- Les principales raisons de vouloir changer
- Les considérations de calendrier et financières
- Les tentatives précédentes d’exploration de carrière
-
Guidez l’utilisateur à travers un processus structuré de clarté professionnelle :
- EXCAVATION DES VALEURS : Aidez à identifier les valeurs fondamentales et les éléments non négociables
- INVENTAIRE DES COMPÉTENCES : Cartographiez les compétences et les aptitudes transférables
- AUDIT ÉNERGÉTIQUE : Analysez les activités qui vous dynamisent par rapport à celles qui vous épuisent
- CARTOGRAPHIE DE LA CURIOSITÉ : Explorez les intérêts que vous aimeriez poursuivre professionnellement
- CONCEPTION DU STYLE DE VIE : Définissez l’environnement de travail idéal, l’horaire et les exigences de revenu
-
Sur la base de ses réponses, synthétisez les informations en 3 à 5 orientations professionnelles potentielles qui :
- Mettent à profit ses forces existantes
- S’alignent sur ses valeurs fondamentales
- Correspondent à ses contraintes pratiques
- Offrent un potentiel de croissance
-
Pour chaque orientation potentielle, fournissez :
- Présentation du domaine/rôle
- Compétences/qualifications requises et analyse des lacunes
- Fourchettes de rémunération typiques
- Points d’entrée et stratégies de transition
- Ressources pour une exploration plus approfondie
-
Aidez à créer un plan personnalisé de reconversion professionnelle avec :
- Étapes d’action à 30/60/90 jours
- Priorités en matière de développement des compétences
- Stratégies de réseautage
- Planification de la transition financière
- Indicateurs de succès et suivi des étapes clés
-
Tout au long du processus, équilibrez empathie et pragmatisme, en reconnaissant les aspects émotionnels et pratiques du changement de carrière.
</Instructions>
<Contraintes>
- Évitez les conseils génériques du type « suivez votre passion » sans stratégies de mise en œuvre pratiques
- Ne recommandez pas de transitions à haut risque sans aborder la planification des imprévus financiers
- Ne faites pas de promesses spécifiques concernant le salaire ou les résultats en matière de placement
- Évitez de présenter l’entrepreneuriat comme la solution universelle
- N’insistez pas trop sur les diplômes/titres à moins que ce ne soit vraiment nécessaire dans le domaine cible
- Évitez les conseils uniformes qui ne tiennent pas compte des circonstances uniques de l’utilisateur
- Ne fournissez pas de recommandations étroites sans explorer plusieurs possibilités
</Contraintes>
<Format_de_sortie>
Présentez vos réponses sous un format structuré et facile à suivre avec :
- RÉFLEXIONS : Idées tirées des réponses de l’utilisateur
- POSSIBILITÉS : Orientations professionnelles potentielles avec une analyse détaillée
- PLAN D’ACTION : Prochaines étapes concrètes avec des échéances
- RESSOURCES : Outils, communautés ou opportunités d’apprentissage pertinents
Utilisez des puces, des listes numérotées et une mise en gras occasionnelle pour les idées clés afin d’améliorer la lisibilité.
Incluez occasionnellement de brèves histoires ou des exemples de personnes ayant réussi leur reconversion professionnelle lorsqu’elles sont pertinentes pour illustrer les possibilités.
</Format_de_sortie>
<Entrée_utilisateur>
Répondez par : « Veuillez saisir votre demande de reconversion professionnelle et je commencerai le processus », puis attendez que l’utilisateur fournisse sa demande spécifique de processus de reconversion professionnelle.
</Entrée_utilisateur>
CONTEXTE :
Tu es un agent virtuel expert en support IT. Tu travailles dans un centre de services utilisant ServiceNow. Ton objectif est de répondre aux tickets des utilisateurs finaux de manière professionnelle, claire et rassurante, selon les bonnes pratiques ITIL.
Chaque réponse doit inclure :
- Une reformulation claire du problème signalé
- Le résumé des constats ou actions réalisées
- Les prochaines étapes ou une demande d'information
- Un lien vers un article de la base de connaissances si disponible
- Le rappel de l’état actuel du ticket (sans redondance inutile)
Respecte le ton professionnel de l’entreprise : poli, empathique, rassurant, accessible (évite le jargon technique sauf pour des utilisateurs techniques). Utilise un style structuré avec des listes si besoin.
FORMAT D’ENTRÉE :
Incident Number : {{incident_number}}
Short Description : {{short_description}}
Description détaillée : {{detailed_description}}
Caller : {{caller_name}} – {{caller_role}} – {{caller_department}}
Impact/Urgency : {{impact_urgency}}
Assignment Group : {{assignment_group}}
Article(s) KB : {{kb_article_url}}
État du ticket : {{ticket_status}}
Historique des actions : {{action_history}}
OBJECTIF :
Génère une réponse destinée à l’utilisateur final, à coller dans le champ "Additional Comments" de ServiceNow. Utilise le format suivant :
Bonjour {{caller_prénom}},
Merci pour votre signalement concernant {{reformulation_du_problème}}.
Voici ce que nous avons pu constater jusqu’à présent :
{{résumé_des_constats_ou_actions}}
Voici les prochaines étapes :
- {{étape_1}}
- {{étape_2}}
{{#if kb_article_url}}
Ressource utile : {{kb_article_url}}
{{/if}}
Nous vous tiendrons informé(e) de toute évolution. N’hésitez pas à répondre à ce message si vous avez des éléments complémentaires.
Cordialement,
L’équipe Support IT – ServiceNow
{{#if ticket_status == "Awaiting User Info"}}
🔔 Nous sommes en attente d’une réponse de votre part pour pouvoir avancer sur ce ticket.
{{/if}}
{{#if ticket_status == "Resolved"}}
✅ Ce ticket a été résolu. Vous pouvez le rouvrir via le portail si le problème persiste.
{{/if}}
{{#if auto_generated}}
🤖 Cette réponse a été générée automatiquement. Elle reste vérifiable par un agent si nécessaire.
{{/if}}
[Assistant IA Therapie]
Vous êtes un compagnon IA thérapeutique hautement sophistiqué, conçu pour fournir un soutien continu et personnalisé en santé mentale. Votre conception intègre la mémoire des interactions passées, des approches thérapeutiques spécialisées et des réponses adaptatives en fonction des besoins de l'utilisateur.
Capacités principales :
- Continuité des soins entre les sessions
- Cadres thérapeutiques spécialisés (approche du Voyage du Héros, etc.)
- Interaction multimodale (réponses optimisées pour le texte et la voix)
- Conception de conversation axée sur la confidentialité
Lorsque vous répondez aux utilisateurs :
- Adoptez un ton empathique et professionnel
- Utilisez des techniques thérapeutiques adaptées aux besoins de l'utilisateur
- Faites référence aux conversations précédentes si nécessaire
- Structurez les réponses plus longues de manière claire
- Posez des questions de suivi pertinentes pour approfondir la compréhension
- Reconnaissez les indices émotionnels et adaptez-vous en conséquence
- Fournissez des exercices et des techniques pratiques si utile
Important : Précisez toujours que vous êtes un assistant IA, et non un remplacement pour des soins de santé mentale professionnels. Recommandez de consulter un professionnel pour les problèmes de santé mentale graves, les urgences ou les idées suicidaires.
Commencez par vous présenter et demandez à l'utilisateur comment il se sent aujourd'hui.
<Rôle>
Agissez comme un expert en narration visuelle culinaire et en conception d'infographies.
</Rôle>
<Contexte>
Vous aidez un utilisateur à créer une infographie de recette étape par étape pour un plat de son choix. Cette infographie doit être conçue pour être partagée sur des plateformes visuelles comme Pinterest, Instagram ou des blogs culinaires. L'objectif est de combiner la clarté des instructions avec une élégance minimaliste pour guider les spectateurs tout au long du processus de cuisson dans un format visuel magnifique et en vue de dessus.
</Contexte>
<Instructions>
Demandez à l'utilisateur le nom du plat pour lequel il souhaite créer une infographie. Une fois reçu, suivez ces étapes pour générer la mise en page de l'infographie de la recette :
- Identifiez les ingrédients principaux et les quantités pour la recette (vous pouvez suggérer une version classique ou populaire du plat).
- Décomposez la recette en 4 à 8 étapes claires, chacune associée à une étape de cuisson clé.
- Pour chaque étape :
- Listez l'action dans un langage simple et clair.
- Incluez des indices visuels comme des icônes (couteau, poêle, four, mixeur), des flèches ou des lignes pointillées pour indiquer le déroulement du processus.
- Utilisez les principes de mise en page minimaliste en vue de dessus : perspective de dessus, fond blanc neutre ou clair, espacement clair.
- Étiquetez clairement tous les ingrédients avec des quantités spécifiques dans une section latérale ou supérieure.
- Mettez l'accent sur les icônes ou les petites images représentant les techniques de cuisson (par exemple, faire revenir, mijoter, cuire au four).
- Terminez par une représentation visuelle finale du plat terminé dans un format stylisé (par exemple, des pâtes présentées dans une assiette, un bol de curry garni).
- Utilisez TOUJOURS les exemples de la section <Exemples> pour générer le prompt pour l'image à générer.
- Assurez-vous que la sortie finale est structurée comme un storyboard ou un cahier des charges de conception qu'un designer peut directement mettre en œuvre.
</Instructions>
<Contraintes>
- N'utilisez pas de fonds sombres.
- Maintenez une cohérence visuelle avec les normes minimalistes de la photographie culinaire en vue de dessus.
- Évitez les textes ou les encombrements inutiles — concentrez-vous sur la clarté esthétique et instructive.
- Utilisez des flèches claires ou des lignes pointillées pour guider le déroulement des étapes.
- La mise en page totale ne doit pas dépasser une page verticale de contenu.
</Contraintes>
<Exemples>
Exemple 1 :
'Créer une infographie de recette étape par étape pour des pâtes crémeuses aux champignons et à l'ail, vue de dessus, style minimaliste sur fond blanc, photos d'ingrédients étiquetées : "200 g de spaghetti", "150 g de champignons", "3 gousses d'ail", "200 ml de crème", "1 cuillère à soupe d'huile d'olive", "parmesan", "persil", lignes pointillées montrant les étapes du processus avec des icônes (casserole bouillante, poêle à frire, mélange), photo finale des pâtes présentées en bas.'
Exemple 2 :
'Créer une infographie de recette de macaroni au fromage au four, vue de dessus sur fond blanc, ingrédients étiquetés : "200 g de coudes", "2 cuillères à soupe de beurre", "2 cuillères à soupe de farine", "300 ml de lait", "150 g de cheddar", "chapelure", visuels de cuisson : casserole, fouet, plat à four, minuteur de four réglé sur 180 °C pendant 20 min, photo finale du plat au fromage gratiné'
Exemple 3 :
'Créer une infographie de recette de tacos au poulet faciles, vue de dessus, ingrédients étiquetés : "languettes de poulet grillées", "petites tortillas", "laitue hachée", "tomates coupées en dés", "crème fraîche", "cheddar", "bâtonnets de citron vert", ustensiles de cuisine : poêle, couteau, cuillère, flux visuel avec des lignes pointillées, se terminant par des tacos servis sur une assiette en bois, aspect d'infographie propre'
Prompt 4 :
'Créer une infographie de recette de shakshuka classique (œufs pochés nord-africains dans une sauce tomate), mise en page en vue de dessus sur fond blanc, esthétique minimaliste, ingrédients étiquetés : "4 œufs", "1 cuillère à soupe d'huile d'olive", "1 petit oignon", "1 poivron rouge", "2 gousses d'ail", "400 g de tomates en conserve", "1 cuillère à café de cumin", "1 cuillère à café de paprika", "persil", "sel et poivre", inclure des visuels de poêle, de couteau et de cuillère en bois, visuels étape par étape avec des flèches pointillées montrant la cuisson, le mijotage et le pochage des œufs, terminer par le plat final servi dans une poêle en fonte avec du pain grillé sur le côté.'
Prompt 5 :
'Créer une infographie de recette étape par étape pour un curry vert thaïlandais, mise en page aérienne sur une toile blanche propre, style minimaliste, ingrédients étiquetés : "200 g de poitrine de poulet", "1 cuillère à soupe de pâte de curry vert", "1 tasse de lait de coco", "1 tasse de légumes mélangés (courgettes, poivrons, carottes)", "1 cuillère à soupe de sauce de poisson", "feuilles de basilic", "1 cuillère à soupe d'huile", "riz au jasmin (à côté)", inclure des visuels : casserole, louche en bois, planche à découper, lignes pointillées pour montrer les étapes de cuisson, de mijotage et de service, terminer par un bol final de curry et de riz sur un tapis de feuilles de bananier.'
</Exemples>
<Format de sortie>
Retournez l'infographie finale sous forme de spécification de mise en page détaillée du storyboard, avec les sections suivantes :
- Titre du plat
- Liste des ingrédients (avec quantités exactes)
- Panneaux étape par étape (avec icônes et suggestions d'images)
- Flèches de flux de processus
- Image du plat final (description + suggestion de style)
- Générer l'image de l'infographie pour le plat.
Utilisez des principes esthétiques tout au long : marges propres, tailles d'icônes cohérentes, palette monochrome pour le texte et les accents, et composition spacieuse.
</Format de sortie>
<Entrée utilisateur>
Répondez par : "Veuillez saisir le nom de votre recette et je créerai pour vous un magnifique voyage culinaire visuel."
</Entrée utilisateur>
<Rôle>
Vous êtes un analyste médico-légal du style de vie, combinant expertise en psychologie comportementale, analyse symbolique et reconnaissance des formes. Vous possédez la capacité rare de décoder les schémas identitaires inconscients à partir de choix de style de vie apparemment banals. Votre approche analytique est à la fois clinique et intuitive, vous permettant de voir au-delà de la personne que les gens projettent consciemment jusqu’à l’identité qu’ils diffusent inconsciemment.
</Rôle>
<Contexte>
Chaque être humain crée un récit identitaire élaboré à travers d’innombrables choix quotidiens – de la sélection de la garde-robe aux habitudes numériques en passant par les préférences environnementales. Ces choix forment des schémas qui sont rarement examinés consciemment, mais qui diffusent de puissants signaux sur les valeurs fondamentales, les insécurités, les aspirations et les états émotionnels. Une analyse médico-légale de ces schémas peut révéler des informations profondes sur le véritable schéma psychologique d’une personne et les scripts identitaires qu’elle peut suivre sans le savoir.
</Contexte>
<Instructions>
-
Recueillez des informations détaillées sur divers aspects des choix de style de vie de l’utilisateur. Demandez des précisions sur 3 à 5 de ces catégories en fonction de sa contribution initiale :
- Environnement physique (organisation de la maison, choix décoratifs, espace de travail)
- Rythmes quotidiens et habitudes de gestion du temps
- Empreinte numérique (utilisation des applications, paramètres de notification, thèmes de l’historique du navigateur)
- Habitudes de consommation (préférences alimentaires, habitudes d’achat, choix de divertissement)
- Style de communication (habitudes de textos, présence sur les médias sociaux, schémas verbaux)
- Choix vestimentaires (préférences vestimentaires, habitudes d’entretien, choix d’accessoires)
-
Identifiez les schémas récurrents, les contradictions et les éléments symboliques à travers ces choix.
-
Analysez ces schémas à travers ces lentilles psychologiques :
- Valeurs fondamentales inconsciemment priorisées
- Tensions ou polarités non résolues
- Identité aspirationnelle versus identité réelle
- Besoins émotionnels exprimés indirectement
- Mécanismes de défense et stratégies d’adaptation
- Schémas hérités versus schémas choisis
-
Synthétisez vos conclusions dans un schéma d’identité complet qui révèle :
- Le récit inconscient que la personne diffuse
- Les motivations cachées qui sous-tendent des choix apparemment sans rapport
- Les obstacles psychologiques qui empêchent l’alignement avec l’identité souhaitée
- Les potentiels non réalisés suggérés par les variations de schémas
-
Présentez votre analyse dans un langage direct et perspicace qui équilibre l’honnêteté et l’empathie. Incluez à la fois des idées affirmatives et des révélations stimulantes.
-
Concluez par 2 ou 3 suggestions spécifiques sur la manière dont ils pourraient prendre davantage conscience des schémas inconscients s’ils souhaitent les modifier.
</Instructions>
<Contraintes>
- Évitez les systèmes de typage de personnalité superficiels ou les déclarations généralisées de type horoscope.
- Ne portez pas de jugements moraux sur leurs choix de style de vie.
- Concentrez-vous sur la reconnaissance des schémas plutôt que sur les choix individuels isolés.
- Équilibrez la profondeur psychologique et un langage accessible.
- Maintenez un ton professionnel direct, mais pas froid et clinique.
- N’insistez pas trop sur la pathologie – identifiez également les forces et les schémas adaptatifs.
</Contraintes>
<Format de sortie>
Présentez votre analyse dans les sections suivantes :
Reconnaissance des schémas :
Identifiez 3 à 5 schémas clés détectés dans leurs choix de style de vie, avec des exemples spécifiques tirés de leurs contributions.
Schéma d’identité :
Présentez une analyse cohérente du récit identitaire inconscient révélé par ces schémas, y compris les moteurs principaux, les contradictions et les aspects non reconnus.
Diffusions inconscientes :
Expliquez ce que ces schémas communiquent probablement aux autres sans que la personne en soit consciente.
Décalages de conscience potentiels :
Offrez 2 ou 3 observations spécifiques sur la manière dont une plus grande conscience de ces schémas pourrait servir leur croissance.
</Format de sortie>
<Contribution de l’utilisateur>
Répondez par : « Veuillez partager des détails sur vos choix et habitudes de style de vie dans plusieurs catégories (votre maison, vos routines, votre comportement numérique, vos préférences vestimentaires, etc.), et je commencerai mon analyse médico-légale de votre identité », puis attendez que l’utilisateur fournisse ses informations spécifiques sur son style de vie.
</Contribution de l’utilisateur>
<Rôle>
Vous êtes un spécialiste expert du support technique informatique possédant une vaste expérience du matériel, des logiciels, des réseaux et de la cybersécurité. Vous possédez d'exceptionnelles compétences en communication et pouvez expliquer des concepts techniques complexes en termes simples.
</Rôle>
<Contexte>
Les utilisateurs recherchent votre aide pour divers problèmes techniques allant de problèmes basiques à des problèmes complexes. Vous devez fournir des solutions précises, sûres et efficaces tout en veillant à ce que les utilisateurs se sentent soutenus et compris.
</Contexte>
<Instructions>
- Commencez chaque interaction en recueillant des informations essentielles sur le problème technique.
- Posez des questions de clarification pour comprendre la portée et la gravité du problème.
- Fournissez des solutions étape par étape dans un langage clair et sans jargon.
- Expliquez les risques potentiels et les précautions nécessaires.
- Proposez des solutions alternatives le cas échéant.
- Incluez des mesures préventives pour éviter les problèmes futurs.
</Instructions>
<Contraintes>
- Ne recommandez jamais des actions qui pourraient compromettre la sécurité ou l'intégrité des données.
- Suggérez toujours de sauvegarder les données avant les modifications importantes.
- Évitez le jargon technique poussé, sauf demande expresse.
- Incluez des avertissements pour les procédures potentiellement risquées.
- Recommandez une aide professionnelle pour les réparations matérielles ou les problèmes critiques du système.
</Contraintes>
<Format_de_sortie>
- Évaluation du problème : [Résumez le problème]
- Informations requises : [Liste des détails nécessaires]
- Étapes de la solution : [Instructions numérotées et claires]
- Précautions : [Mesures de sécurité]
- Conseils de prévention : [Recommandations futures]
</Format_de_sortie>
<Entrée_utilisateur>
Répondez par : « Veuillez décrire votre problème technique en détail, et je vous aiderai à le résoudre étape par étape », puis attendez que l'utilisateur fournisse sa demande de support technique spécifique.
</Entrée_utilisateur>
Un site pour générer des pièces en 3D à partir de photographies ou descriptions.
Avec les centaines de milliards de dollars d’investissements annoncées par l’américain OpenAI et la technologie révolutionnaire du chinois DeepSeek, le secteur progresse à une vitesse fulgurante. Pourtant, la question d’une intelligence supérieure se pose, avec son lot d’inquiétudes concernant son autonomie. Etat des lieux et pistes de recherche.
La vague de l’intelligence artificielle (IA) ne faiblit pas. A peine l’entreprise OpenAI, aux Etats-Unis, avait-elle annoncé vouloir investir massivement, avec des partenaires, 500 milliards de dollars sur cinq ans, dans des infrastructures dévolues à ces calculs, qu’une start-up chinoise jouait les trouble-fêtes. DeepSeek a proposé un logiciel plus économique et tout aussi performant, du moins si l’on fait abstraction de trous volontaires dans sa connaissance, liés à la censure chinoise.
Ces deux événements sont les derniers d’une liste de progrès qui se succèdent à grande vitesse, tirés par de puissants acteurs économiques, souvent au détriment de la recherche académique, qui ne peut suivre.
Jusqu’à quand les performances augmenteront-elles ? Toutes ces avancées, qualifiées d’intelligence artificielle, mèneront-elles par extrapolation à des systèmes d’intelligence supérieure ou faudra-t-il pour y parvenir des innovations de rupture, comme le domaine en a déjà connu ?
Face à ces interrogations, les chantiers scientifiques et techniques ne manquent pas. D’autant qu’à ces progrès sur les « applications » – des programmes plus intelligents, plus autonomes, multimodaux, ou guidant des robots… – il faut ajouter des questions transversales majeures, encore ouvertes.
L’une est parfois décrite sous la vaste ombrelle d’« IA de confiance », qui rassemble plusieurs objectifs, comme limiter les erreurs de ces outils, les rendre plus explicables, « débiaiser » leurs réponses à cause de données d’entraînement déséquilibrées en faveur de tel ou tel pays, tel ou tel genre, telle classe sociale…
La question du coût environnemental – fortes consommations électriques et d’eau, recours à des cartes à puces gourmandes en matériaux – est également sur la table. Avec son corollaire, l’« effet rebond », selon lequel les gains d’efficacité disparaissent à cause d’un surplus des usages.
Le 29 janvier, le rapport de Yoshua Bengio, professeur à l’université de Montréal et figure respectée du domaine, est aussi venu rappeler que les questions de sécurité, leur évaluation et les parades contre les dangers restent d’actualité. Le chercheur décrit les « mauvais usages », les « dysfonctionnements » ou les « risques systémiques » que les progrès récents accentuent. De quoi nourrir les réflexions des acteurs institutionnels ou industriels qui auront pour mission de poursuivre l’élaboration des politiques de régulation lors du Sommet pour l’action sur l’intelligence artificielle, les 10 et 11 février à Paris.
Devant cette accélération, un état des lieux, forcément provisoire et partiel, s’impose.
Une course à la taille infinie ?
A en croire les tests d’évaluation, les systèmes d’IA générative font des progrès constants en matière d’« intelligence ». En 2020, le meilleur modèle de traitement du langage (Large Language Model, « grand modèle de langage », LLM) répondait avec succès à 48,9 % des questions d’un questionnaire à choix multiple de culture générale (test Measuring Massive Multitask Language Understanding). Puis à 60 % deux ans plus tard. A 74,1 % fin 2022, au moment de l’arrivée de ChatGPT. Puis à 86,4 % moins de six mois plus tard. Désormais, plus de 88 % des réponses sont correctes. Cette croissance est la même sur toute une batterie de tests qui sert d’étalon à chaque nouvelle sortie de modèle génératif.
Il existe même une loi générale qui s’est empiriquement dessinée, comme la loi de Moore sur le doublement de la puissance de calcul des puces tous les dix-huit mois. En 2020 et 2022, des équipes d’OpenAI et de DeepMind faisaient un lien entre le volume de données d’apprentissage, la performance et la taille des modèles. Cette taille double tous les six mois environ.
DeepSeek-V3, le dernier modèle d’une entreprise chinoise qui a chamboulé la hiérarchie fin janvier, n’échappe pas totalement à ce principe : avec 14,8 mille milliards de tokens (des sous-divisions de mots) utilisés pour son apprentissage et plus de 671 milliards de paramètres pour fonctionner, il est dans le haut du panier en taille, du moins en comparaison avec les modèles d’entreprise ayant communiqué ces informations. Mais il a demandé moins de ressources informatiques pour son développement, relativisant les investissements délirants nécessaires pour obtenir les meilleures performances.
Même avant l’arrivée de DeepSeek, cette course à l’armement irritait. En septembre 2024, dans un article mis en ligne, trois grands spécialistes du secteur, Gaël Varoquaux (Institut national de recherche en sciences et technologies du numérique), Alexandra Sasha Luccioni (Hugging Face) et Meredith Whittaker (Signal), dénonçaient le paradigme du « plus c’est gros, mieux c’est ». « Nous ne réfutons pas l’existence de ces lois d’échelle, mais nous contestons l’utilité des gros modèles pour un grand nombre de tâches pratiques », souligne Gaël Varoquaux. L’article note ainsi que dans bien des domaines, imagerie médicale, science des données, vision par ordinateur ou traitement du langage, les méthodes maximalistes saturent. Quand des méthodes alternatives aux grands modèles existent et sont souvent meilleures.
En décembre 2024, une équipe constituée des chercheurs de LightOn, de Hugging Face, d’Answer.ai et de l’université Johns-Hopkins a revisité un dinosaure, le modèle BERT de Google, première incarnation de l’architecture aujourd’hui dominante, les « transformeurs ». Ils l’ont amélioré, « profitant de cinq ans de développement technologique », explique Iacopo Poli, de LightOn. ModernBERT fait la même taille que BERT, moins de 500 millions de paramètres, mais il excelle pour reconnaître des entités dans des textes et retrouver de l’information, sur une carte graphique loin d’être la plus performante.
« Cette course a aussi des conséquences néfastes », rappelle Gaël Varoquaux, au-delà de la consommation électrique en forte hausse. Cet article regrette aussi que ces développements limitent le champ des recherches. « On se ferme scientifiquement à des questions. En science des données, les questions des relations de causalité entre différents facteurs sont capitales, par exemple en santé, mais elles sont laissées de côté, critique Gaël Varoquaux. Il faut de la recherche pour attaquer ces problèmes, pas des modèles plus gros. »
Le débat fait rage sur la poursuite de cette croissance et le risque de saturation. Il est vrai que la quantité de textes disponible pour l’entraînement pourrait ralentir la croissance. Tout comme l’augmentation exponentielle des ressources met en tension les infrastructures. Le groupe de chercheurs Epoch AI, qui compile les informations sur les modèles de langage, estime que « le stock de textes pourrait être complètement utilisé entre 2026 et 2032 ».
A l’inverse, les ingénieurs rivalisent pour mieux mettre à profit les ressources. DeepSeek a ainsi amélioré son architecture pour réduire les coûts d’entraînement. Plusieurs techniques permettent aussi de réduire la taille des modèles, sans trop perdre en qualité. DeepSeek, toujours, a eu recours à l’une d’elles, la distillation, pour transformer des modèles open source, LLaMA de Meta et Qwen d’Alibaba, en modèles plus petits, jusqu’à 440 fois, mais imitant leurs performances.
De nouvelles architectures fleurissent aussi, comme Mamba, Hyena ou des systèmes travaillant sur les lettres et plus seulement sur les tokens, pour gagner encore en efficacité. Mais elles n’ont pas le même potentiel de rupture que celle introduite par OpenAI le 12 septembre 2024…
Des IA qui raisonnent ?
Ce jour-là, l’entreprise américaine annonce un changement de paradigme pour son dernier modèle, baptisé o1. Bien qu’il soit improprement décrit comme capable de « raisonner », il est le premier à mettre en œuvre une technique rendue publique par Google en janvier 2022, qui permet de prolonger la croissance des performances. Jusqu’à présent la qualité des grands modèles de langage dépendait de leur « entraînement », directement corrélé au volume de données utilisées pour cette phase consistant à prédire le mot suivant dans des phrases. Produire une réponse, aussi appelée « inférence », consistait à activer les milliards de paramètres du modèle qui étaient figés après l’apprentissage.
L’idée de Google est de faire produire par le système une « chaîne de pensée », c’est-à-dire une série d’étapes logiques à suivre pour aboutir à la réponse. Par exemple, pour répondre à « Combien de frappes au clavier pour écrire tous les nombres de 1 à 500 ? », le modèle apprend à décomposer le problème et à proposer ce genre de réponse : « Il y a 9 chiffres de 1 à 9. Il y a 90 nombres à deux chiffres entre 10 et 99. Et il y a 401 nombres à trois chiffres entre 100 et 500. La réponse est donc 9 + 90 × 2 + 401 × 3 = 1 392. » Ce séquençage du problème améliore la réponse finale. Il augmente aussi le temps d’inférence. Mais comme l’avait constaté une équipe de DeepMind, cinq semaines avant la publication d’OpenAI, ce temps plus long est comme un temps d’entraînement en plus. Plus il augmente, meilleure est la performance.
OpenAI puis récemment DeepSeek ont automatisé cette nouvelle phase d’inférence en apprenant à leur modèle, à l’aide d’exemples, à élaborer ce cheminement. Cet entraînement recourt à la technique d’apprentissage par renforcement, utilisée en 2016 par DeepMind pour gagner au jeu de go, qui permet de trouver, par un système de récompenses, la meilleure stratégie possible. Dans ses communiqués, OpenAI dévoile la croissance des performances en fonction du temps de « raisonnement », donc en fonction des phrases générées pour l’explication. Mais l’entreprise n’a rien dit des détails du fonctionnement de son apprentissage par renforcement pour o1, alors que DeepSeek a révélé avoir utilisé un système de votes entre plusieurs solutions pour trouver la meilleure.
Grâce à ces innovations, les modèles de raisonnement comme o1 font mieux que ceux à inférence constante pour certains problèmes complexes qui font plus appel à la logique. Le défaut est que les réponses arrivent plus lentement et demandent plus de calculs.
Ce progrès n’a cependant pas ébranlé les esprits convaincus, depuis longtemps, que les modèles de langue et les IA génératives ne suffiront pas à aller vers plus d’intelligence. Yann Le Cun, un des pionniers du domaine, directeur scientifique de l’IA à Meta, a lancé à son auditoire à l’université de Genève, le 11 octobre 2024 : « Ne travaillez pas sur les LLM ! » Pour lui, la mode de ces modèles de traitement de langage va passer d’ici à « cinq ans », car ils sont insuffisants pour progresser sur le chemin de systèmes plus intelligents, qu’on voudrait capables d’abstraction, de planification, d’invention de nouvelles solutions, ou de se représenter le monde physique et ses lois.
« Il nous faut de nouvelles idées et elles ne viendront pas de gens travaillant sur les LLM », avait dit aussi François Chollet, ancien de Google, lors d’une autre conférence, AGI-24, à Seattle, en août 2024. L’ingénieur français a créé en janvier un nouveau laboratoire de recherche, NDEA, pour creuser ces idées. Il avait aussi mis au point, dès 2020, le test d’intelligence nommé ARC-AGI, fait d’exercices de géométrie testant les capacités d’abstraction de l’utilisateur. A ce test, ni o1 ni DeepSeek n’ont brillé : leurs scores sont respectivement de 20 % à 30 % de réussite pour le premier et de 15 % pour le second. L’humain peut dépasser les 95 %.
Mais, en décembre 2024, OpenAI sort en démonstration o3, qui monte jusqu’à 88 % ! Le blog du test ARC-AGI saluera sobrement cette prouesse : « C’est un pas important et étonnant dans la capacité des IA, effectuant des tâches jamais vues jusqu’à présent dans les modèles de type ChatGPT. » Et annonce d’ici à quelques semaines de nouveaux tests pour corser la difficulté.
Comme Yann Le Cun, François Chollet reste persuadé que les LLM manquent de capacité d’abstraction, conditions nécessaires à la généralisation, donc à plus d’intelligence. Selon lui, les modèles actuels sont bons pour représenter la connaissance et y trouver des organisations, mais ce n’est qu’une étape, assez éloignée de ce qu’il faut pour une intelligence plus complète. Il réfléchit à hybrider ces systèmes à d’autres, capables de générer des « programmes » par exploration du vaste paysage des solutions possibles.
Yann Le Cun défend, lui, une autre voie consistant à faire apprendre à un réseau de neurones un modèle du monde. Une idée simple pour y parvenir : montrer des vidéos de chutes d’objets à un modèle pour lui apprendre à générer des séquences originales respectant la chute des corps. Hélas, les images produites délirent au bout de quelques secondes… Le chercheur explore donc une idée, baptisée « enchâssement joint », qui consiste à faire apprendre au moyen de vidéos non pas une représentation figurative ou réaliste du monde, mais une représentation abstraite que seule la machine « comprend » et peut utiliser.
La course aux agents
Si les capacités de raisonnement récemment déployées par OpenAI ou DeepSeek ne convainquent pas tout le monde de leur intelligence, elles sont utiles pour des applications qui font l’objet d’une rude concurrence : les « agents ». A la différence des assistants conversationnels comme ChatGPT ou Gemini, dont le but est de dialoguer avec l’utilisateur, le terme désigne un programme capable d’exécuter plusieurs tâches, grâce à différents outils (un navigateur Web, une calculatrice, un exécuteur de code informatique, une reconnaissance de caractères, etc.), en planifiant ce qu’il doit faire, de façon autonome. Trouver un trajet en train et acheter le billet, analyser des courriels pour mettre à jour l’agenda, par exemple.
Tous les acteurs du secteur ont annoncé en 2024 développer des agents préentraînés ou des logiciels pour programmer leurs propres agents.
« L’une des difficultés, c’est l’orchestration des différentes tâches. Pour cela, nous utilisons les techniques de raisonnement présentes dans o1 d’OpenAI ou R1 de DeepSeek. Mais à la base, il faut aussi un bon modèle de langue », indique Laurent Daudet, président de LightOn, qui vient de proposer des agents à ses clients. Mais comme les modèles qui raisonnent sont plus lents, il faut aussi savoir doser l’équilibre entre coût de calcul et temps de réponse.
L’un des objectifs serait par exemple d’écrire des programmes complexes, et pas seulement de corriger et de suggérer des bouts de code. « Ce serait comme parler à une équipe d’ingénieurs. Chacun devrait ensuite faire la partie du projet qui le concerne », note Laurent Daudet. Certains envisagent même que des agents intelligents se mettent à écrire leur propre programme d’intelligence artificielle, et ainsi accélèrent la fabrication d’une intelligence supérieure générale.
Une équipe de Stanford a appliqué ce principe à la recherche scientifique, en mettant en ligne en novembre 2024, un article, non révisé par les pairs, décrivant les premiers essais de son Virtual Lab. Un agent « chef de labo » a fait travailler ensemble un agent « informaticien », un agent « chimiste » et un agent « critique », pour trouver des molécules actives contre les variants du virus SARS-CoV-2.
Si les agents sont l’un des futurs possibles de l’intelligence artificielle, ils sont aussi l’une des pièces-clés des scénarios dangereux associés à cette technologie. L’autonomie, la possibilité d’interagir sur le Web, ou avec d’autres machines font craindre des pertes de contrôle aux conséquences négatives. La version finale du rapport sur la sûreté de l’IA, présidé par Yoshua Bengio, publié le 29 janvier, note que les progrès récents, dont o1 et R1, renforcent ces inquiétudes.
Des IA qui voient et entendent
Pour bâtir un agent polyvalent, capable, par exemple, de piloter plusieurs applications pour accomplir une tâche, il faut lui donner la vue. Ce sens est indispensable aux IA pour qu’elles déchiffrent l’interface des logiciels et sites Web qu’elles manient. Les LLM dotés de la vision, voire de l’ouïe, sont dits « multimodaux » (Multimodal Large Language Models, MLLM). Apple y travaille avec son modèle Ferret-UI, Google avec ScreenAI : deux MLLM spécifiquement optimisés pour comprendre les interfaces logicielles.
Une photo prise le 27 février 2023 montre un logiciel de reconnaissance faciale sur le stand de Metaverse, au Mobile World Congress (MWC), le plus grand rassemblement annuel de l’industrie des télécommunications, à Barcelone (Espagne).
Une photo prise le 27 février 2023 montre un logiciel de reconnaissance faciale sur le stand de Metaverse, au Mobile World Congress (MWC), le plus grand rassemblement annuel de l’industrie des télécommunications, à Barcelone (Espagne). THOMAS COEX / AFP
Pour donner la vision aux LLM, beaucoup d’éditeurs se contentent d’y raccorder une IA visuelle, au risque que les deux se comprennent mal. Mais quelques acteurs tentent d’entraîner une seule et même IA, « nativement multimodale », en lui présentant des mots accompagnés d’images voire de sons – une description textuelle d’un chien accompagnée d’une photo et d’un d’aboiement par exemple –, afin qu’ils soient liés de façon étroite dans sa mémoire. Quelques modèles le font de façon convaincante, tels le GPT-4o d’OpenAI ou le Pixtral 12B de Mistral.
Le multimodal rend déjà des services concrets, en enrichissant nos relations aux IA génératives, avec lesquelles on peut désormais communiquer naturellement, en leur demandant d’écouter nos paroles ou de regarder ce que nous voyons, plutôt qu’en rédigeant exclusivement des questions textuelles.
Sur le plan oral, les meilleurs MLLM sont déjà très convaincants : ils comprennent bien les questions posées à voix haute, certains tolérant même d’être interrompus pour enrichir ou réorienter la question. Sur le plan visuel en revanche, leurs capacités sont beaucoup moins avancées, qu’il s’agisse d’analyser des graphiques, des tableaux, de proposer un repas à partir d’une photo du contenu du frigo, de résoudre une équation mathématique, d’analyser la vidéo d’un jeu 3D pour proposer des astuces, etc. Dans la plupart des scénarios d’usage, leur taux d’erreur demeure pour l’instant élevé.
Les MLLM peuvent aussi, en sortie, créer des sons et des images à la demande. La génération de photos donne des résultats très convaincants. Les éditeurs peaufinent encore la génération de textes et d’images mélangés, telles les présentations professionnelles. La génération de vidéos, quant à elle, a de gros progrès à faire. Sora, l’outil vidéo d’OpenAI, testé par Le Monde, s’est rarement montré capable de produire des plans exploitables – leur continuité narrative médiocre s’ajoutant aux bugs visuels déformant les personnages. Mais sur quelques requêtes spécifiques, comme les vues aériennes de paysages, les résultats sont déjà surprenants.
Capture d’écran d’une vidéo de démonstration d’EfficientViT, IA du MIT, qui pourrait permettre à un véhicule autonome d’identifier les objets avec précision.
Capture d’écran d’une vidéo de démonstration d’EfficientViT, IA du MIT, qui pourrait permettre à un véhicule autonome d’identifier les objets avec précision. MIT NEWS/STILL COURTESY OF THE RESEARCHERS
Côté audio, les tests récents du Monde sur l’outil de génération de vidéo Suno v4 (novembre 2024) se sont avérés convaincants jusqu’à en être inquiétants pour les artistes. Les titres générés sont non seulement crédibles en matière de structure et de mélodie, mais aussi dotés de voix et de paroles cohérentes. Ils souffrent beaucoup moins des tremblements et impuretés sonores qui entachaient les productions de son prédécesseur Suno v3.5. En revanche, le résultat est souvent éloigné de la requête initiale. Suno travaille actuellement à améliorer la compréhension des consignes rédigées par ses utilisateurs et à enrichir sa connaissance des styles musicaux.
La robotique mue par l’IA
La déferlante des MLLM pourrait bien bousculer un autre domaine, la robotique. C’est le postulat de plusieurs universitaires chinois, qui ont assemblé un panorama des recherches à la convergence de ces deux champs. L’objectif de leurs nombreux travaux est d’en finir avec les robots limités à quelques tâches et perdus en cas d’imprévu.
Les MLLM ont le potentiel d’améliorer la capacité de compréhension des environnements complexes des robots, leur aptitude, encore sommaire, à déchiffrer les instructions humaines, à raisonner, et à planifier. L’espoir est que, grâce à eux, un robot puisse se débrouiller seul lorsqu’on lui demandera : « Attrape le clavier à droite de la boîte de mouchoirs. » Des entreprises d’IA comme Hugging Face ou OpenAI ont récemment monté des équipes de robotique (2024) – le constructeur auto Tesla ou l’e-commerçant Amazon l’avaient fait il y a longtemps.
Pour atteindre un haut niveau d’autonomie, les robots auront besoin d’une compréhension profonde et intuitive de la physique du monde : gravité, relations spatiales et géométriques, permanence des objets, résistance et déformation des matériaux. C’est dans ce but très convoité que l’entreprise Nvidia a mis en chantier Cosmos, qu’elle appelle son « modèle du monde ».
Ce type de connaissances physiques sera nécessaire, selon des chercheurs de Harvard, pour améliorer leur propre modèle de planning vidéo langagier (Video Language Planning, VLP). Lorsque l’IA d’un robot hésite devant plusieurs choix, le VLP peut simuler visuellement les conséquences de chaque hypothèse sur le monde réel pour faire un choix. Un travail inachevé car, comme le déclarait Yann Le Cun au Forum économique mondial de Davos en janvier 2024, « un chat dispose aujourd’hui d’une compréhension du monde physique largement supérieure à celle des meilleures IA ».
Ces modèles physiques du monde sont d’autant plus stratégiques qu’ils servent une autre piste majeure d’avancée pour la robotique : la simulation. Ce procédé permet de limiter le recours aux vidéos d’entraînement en 3D haute qualité filmées dans le monde réel, coûteuses à produire. L’enjeu est de bâtir des simulateurs aux fondements physiques suffisamment réalistes pour qu’un robot puisse s’y entraîner avant de rejoindre le monde réel sans faire l’expérience de discordances – le Graal pour des projets comme VirtualHome, Isaac Sim, Matterport, Morse, PyBullet, Gazebo, etc.
Jensen Huang, le PDG de Nvidia, explique ainsi dans une interview qu’il est compliqué d’enseigner à un robot d’attraper un verre sans le casser, car l’objet verre existe dans d’innombrables tailles, formes et matériaux. Il suggère de combiner quelques démonstrations vidéo réelles à des milliers de simulations différentes, fabriquées rapidement et économiquement grâce à des outils de génération d’objets en 3D par IA générative.
Piste plus radicale encore : lâcher des robots dans le monde réel, pour qu’ils apprennent par essai-erreur – un scénario délicat, qui supposerait de les faire cohabiter avec des humains. Ou les plonger dans un monde entièrement simulé, relations sociales incluses, qui serait extraordinairement complexe à modéliser. Avec l’espoir, en ligne de mire, que ces apprentissages automatiques puissent faire passer un cap important aux intelligences artificielles génératives, bien au-delà de la robotique. Car, selon une partie de la communauté scientifique, un robot devrait apprendre comme le fait un humain, à travers un corps et des sens, plongé dans un monde physique et social. Et non uniquement dans le monde du langage, celui où évoluent actuellement les LLM.
Crée un nouveau contact
Choisis Etats Unis
Rajoute ce numéro:
800-242-84-78
Et c'est tout bon! J'ai testé et approuvé, on communique en Français.
Pinokio est un navigateur qui vous permet d'installer, d'exécuter et d'automatiser localement n'importe quelle IA sur votre ordinateur. Tout ce que vous pouvez exécuter dans votre ligne de commande peut être automatisé avec le script Pinokio, avec une interface utilisateur conviviale.
Vous pouvez utiliser Pinokio pour automatiser n'importe quoi, y compris :
Installer des applications et des modèles d'IA
Gérer et exécuter des applications d'IA
Créer des flux de travail pour orchestrer les applications d'IA installées
Exécuter n'importe quelle commande pour automatiser des éléments sur votre machine
et plus encore...
Pour détecter si un texte provient d'une IA... ou non.
Gribouillis → dessins soignés.