Episodes

  • L'IA aujourd'hui épisode du 2025-01-16
    Jan 16 2025
    Bonjour à toutes et à tous, bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : Gabor Samu et la personnalisation des modèles IA, Nvidia révolutionne le PC avec Digits sous Linux, IBM améliore la formation des LLM en entreprise, Torchtune facilite l'ajustement des modèles, Lovable AI rend le développement web accessible, et Google réinvente la gestion de l'information avec NotebookLM. C’est parti !Commençons par Gabor Samu, qui a reçu le 14 janvier 2025 un badge pour sa compréhension approfondie d'InstructLab et de ses applications dans la personnalisation des modèles de langage artificiel, qu'il s'agisse de SLMs ou de LLMs. InstructLab est une plateforme qui démocratise l'accès aux modèles d'IA à grande échelle, offrant des outils pour les adapter à des besoins spécifiques. Gabor Samu a démontré une solide maîtrise de l'intelligence artificielle générative, de la méthodologie LAB, de la taxonomie, de la génération de données synthétiques et du réglage fin des modèles. Sa contribution enrichit la plateforme et illustre l'importance du partage de connaissances dans l'open source.Passons maintenant à Nvidia, qui annonce une nouvelle génération d'ordinateurs personnels fonctionnant sous Linux. Le projet Digits présente un supercalculateur personnel d'intelligence artificielle équipé de la puce Grace Blackwell GB10, capable de traiter des modèles d'IA comportant jusqu'à 200 milliards de paramètres. Digits permet d'exécuter des applications d'IA directement sur la machine, sans recourir au cloud, améliorant ainsi la vitesse et la sécurité des données. Ce développement pourrait perturber la domination de Windows sur le marché des ordinateurs de bureau et encourager une adoption plus large de Linux.IBM a développé une méthode innovante pour générer des données synthétiques et un protocole d'entraînement par phases, améliorant ainsi la formation des grands modèles de langage en entreprise. La solution, nommée LAB pour Large-scale Alignment for chatBots, génère des données synthétiques adaptées aux tâches souhaitées, intégrant de nouvelles connaissances sans effacer les acquis précédents. En utilisant une taxonomie hiérarchique des connaissances et compétences, les développeurs peuvent identifier et combler les lacunes des modèles. IBM a généré un ensemble de données synthétiques de 1,2 million d'instructions et a formé deux LLM open source, Labradorite 13B et Merlinite 7B. Ces modèles ont montré des performances compétitives, surpassant même des chatbots alignés sur des données humaines.Torchtune est une bibliothèque native de PyTorch conçue pour simplifier le fine-tuning des grands modèles de langage. Elle offre des blocs modulaires et des recettes d'entraînement extensibles, permettant aux développeurs d'ajuster des LLM populaires avec diverses méthodes et architectures. Torchtune s'intègre avec Ascend, la série de produits de calcul IA de Huawei, via torch_npu, un plugin pour PyTorch. Cette intégration facilite l'utilisation des puissantes capacités de calcul des processeurs IA Ascend pour l'entraînement et l'inférence en apprentissage profond, sur une variété de GPU.Parlons maintenant de Lovable AI, une application qui permet de créer des sites web et des applications web sans coder. En utilisant des modèles de langage avancés de fournisseurs comme Anthropic et OpenAI, Lovable AI offre une interface où l'IA génère et exécute le code nécessaire à partir d'instructions en langage naturel. Le module GPT Engineer permet de créer et publier un site web fonctionnel sans écrire une seule ligne de code. Les utilisateurs peuvent modifier précisément chaque élément, intégrer leur projet avec Supabase pour le stockage des données, et profiter d'une bibliothèque de modèles préconfigurés. Des outils de collaboration permettent également de partager le code via GitHub ou de cloner le site pour des améliorations.Enfin, Google présente NotebookLM, un espace de travail alimenté par l'IA qui transforme la manière dont les cadres organisent, interagissent et synthétisent l'information. En combinant le modèle de langage Gemini Pro avec vos propres sources, NotebookLM crée un assistant de recherche personnalisé. Les utilisateurs peuvent télécharger jusqu'à 50 sources diverses, y compris des documents, présentations, PDF et sites web. L'IA analyse le contenu pour créer des résumés, identifier les sujets clés et générer des insights. La plateforme offre une interface unifiée pour gérer les sources, discuter avec l'IA et développer de nouvelles perspectives. NotebookLM Plus, une offre d'abonnement premium prévue pour début 2025, proposera des avantages comme des limites accrues, des options de personnalisation et des fonctionnalités de collaboration avancées.Voilà qui conclut notre épisode d’aujourd...
    Show More Show Less
    5 mins
  • L'IA aujourd'hui épisode du 2025-01-15
    Jan 15 2025
    Bonjour à toutes et à tous, bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd'hui : un concours pour les développeurs d'IA chez Google, un programme de subventions pour l'IA générative, une plateforme éducative innovante, le plan du Royaume-Uni pour devenir leader en IA, la création d'un assistant multimodal, et une polémique dans le monde de la mode. C'est parti !Google a lancé le concours AI Developers Community Spotlight Contest, une opportunité pour les développeurs travaillant sur des projets innovants utilisant les outils d'intelligence artificielle de l'entreprise. Ce concours vise à mettre en lumière les membres de la communauté qui créent des projets exceptionnels en termes de créativité, de complexité ou d'impact social. Parmi les outils disponibles, on retrouve l'API Gemini, Gemma, Google AI Edge et divers frameworks. Participer à ce concours offre une chance de faire reconnaître son travail à l'échelle mondiale et de rejoindre une communauté d'innovateurs qui façonnent l'avenir de l'IA. Les projets soumis peuvent prendre de multiples formes, et il est important de consulter les termes et conditions pour s'assurer de leur conformité.Dans un effort pour soutenir les organisations dépassées par l'intelligence artificielle générative, Google a également lancé un appel mondial à propositions dans le cadre de son programme Generative AI Accelerator. Ce programme offre des subventions allant de 500 000 à 2 millions de dollars, un soutien pro bono des employés de Google, une formation technique et des crédits pour Google Cloud. Les entreprises, qu'elles soient à but lucratif ou non, les entités civiques, les institutions académiques et les entreprises sociales sont encouragées à soumettre des propositions exploitant la technologie GenAI pour un impact social positif. Les organisations intéressées doivent soumettre leurs propositions avant le 10 février 2025. L'objectif est d'encourager l'utilisation de l'IA générative pour résoudre des problèmes sociaux, en surmontant les obstacles comme le manque de financement et de formation.Passons maintenant à l'éducation avec School AI, une plateforme alimentée par l'intelligence artificielle qui propose des outils pour améliorer l'enseignement et accroître la productivité des enseignants. Parmi ses fonctionnalités, "Spaces" est un chatbot conçu pour les étudiants, leur permettant de participer à des expériences d'apprentissage interactives comme des jeux de rôle avec des personnages historiques, l'exploration de nouveaux sujets ou des quiz adaptés à leur niveau de compréhension. Les enseignants peuvent créer des "Spaces" personnalisés en fonction de sujets spécifiques, de projets ou d'objectifs d'apprentissage, et surveiller les progrès des élèves pour adapter l'expérience à leurs besoins. "Sidekick" est un assistant AI destiné aux étudiants, qui les aide à résoudre des problèmes, comprendre des concepts complexes, résumer des leçons et tester leurs connaissances. Les enseignants peuvent configurer un Sidekick et inviter les élèves via un lien direct ou une plateforme de gestion de l'apprentissage comme Google Classroom. School AI propose également une collection d'outils AI facilitant diverses tâches pédagogiques et la création de ressources éducatives pour les enseignants.Du côté du Royaume-Uni, le gouvernement a annoncé un plan ambitieux pour positionner le pays comme un leader mondial en intelligence artificielle. Ce plan vise à stimuler la croissance économique, créer des emplois et transformer les services publics. L'un des aspects clés est l'augmentation de la capacité de calcul, avec la mise en place d'un superordinateur capable de jouer à un demi-million de parties d'échecs par seconde. Cette puissance de calcul est essentielle pour soutenir la recherche avancée et attirer des entreprises nécessitant de telles capacités pour développer des applications de pointe. Le plan introduit également des "zones de croissance de l'IA", destinées à simplifier les projets d'infrastructure en réduisant la bureaucratie. La première de ces zones sera située à Culham, dans l'Oxfordshire, et servira de laboratoire d'innovation. L'IA a le potentiel de transformer les services publics, notamment dans la santé, avec des outils pour diagnostiquer des maladies comme le cancer du sein de manière plus rapide et précise, pouvant sauver des milliers de vies et alléger la charge du système de santé. Le gouvernement s'engage également à promouvoir une IA éthique et responsable, avec une surveillance rigoureuse. Avec des engagements financiers de 14 milliards de livres sterling d'entreprises comme Vantage Data Centres et Kyndryl, et la création de plus de 13 000 emplois, le potentiel économique est considérable. Cependant, le succès dépendra de l'exécution efficace de ce plan pour qu'il ait un impact...
    Show More Show Less
    8 mins
  • L'IA aujourd'hui épisode du 2025-01-14
    Jan 14 2025
    Bonjour à toutes et à tous, bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : les avancées majeures de l'intelligence artificielle attendues en 2025, des changements stratégiques chez Automattic concernant WordPress, une action en justice de Microsoft contre un service illicite, et l'approche multi-modèles pour optimiser les performances en IA. C’est parti !En 2025, l'intelligence artificielle s'apprête à franchir un cap décisif. Les équipes d'IA se concentreront sur la maîtrise des techniques de post-entraînement, car peu d'entre elles formeront des modèles à partir de zéro. Ces techniques incluent le réglage fin avec des ensembles de données spécifiques à un domaine, l'apprentissage par renforcement avec retour humain, ainsi que des méthodes d'optimisation comme la quantification et la distillation. Les modèles de fondation multimodaux élargiront les capacités de l'IA au-delà du texte, permettant de traiter des tâches visuelles et d'interagir avec des interfaces graphiques. Cela facilitera l'automatisation du travail intellectuel et élargira l'impact de l'IA dans divers secteurs. De plus, les outils de développement et de codage alimentés par l'IA transformeront la manière dont les logiciels sont créés, en augmentant la productivité, en réduisant les temps de révision et en améliorant la détection des problèmes. Les assistants de codage IA pourront guider l'ensemble des flux de travail, de la création de prototypes au déploiement.Parlons maintenant de WordPress et des décisions récentes d'Automattic.Automattic, l'entreprise derrière WordPress.com, a décidé de réduire ses contributions sponsorisées au projet WordPress. Depuis près de vingt ans, elle a consacré des ressources et des talents significatifs au développement de cette plateforme. Toutefois, un déséquilibre dans la répartition des contributions au sein de l'écosystème a été constaté. De plus, Automattic doit consacrer beaucoup de temps et d'argent pour se défendre contre des actions juridiques initiées par WP Engine et financées par Silver Lake, une société de capital-investissement. Face à ces défis, les employés qui contribuaient auparavant au noyau de WordPress se concentreront désormais sur des projets internes tels que WordPress.com, Pressable, WPVIP, Jetpack et WooCommerce. Automattic espère que cette réorientation encouragera une participation plus équilibrée de toutes les organisations qui bénéficient de WordPress, renforçant ainsi la communauté dans son ensemble.Passons à présent à l'actualité judiciaire impliquant Microsoft.Microsoft a intenté une action en justice contre trois individus accusés d'avoir mis en place un service de "hacking-as-a-service". Ce service permettait de contourner les mesures de sécurité de la plateforme d'intelligence artificielle de Microsoft pour créer du contenu illicite. Les accusés auraient compromis les comptes de clients légitimes et vendu l'accès à ces comptes via un site désormais fermé. Ils fournissaient des instructions détaillées pour utiliser des outils personnalisés capables de générer du contenu interdit. Le service utilisait un serveur proxy pour relayer le trafic entre ses clients et les serveurs d'IA de Microsoft, exploitant des interfaces de programmation d'applications non documentées et imitant des requêtes légitimes. Microsoft n'a pas précisé comment les comptes clients ont été compromis, mais a mentionné que des outils existent pour rechercher des clés API dans les dépôts de code, une pratique que les développeurs sont souvent conseillés d'éviter. La plainte allègue que ces actions violent plusieurs lois américaines, dont le Computer Fraud and Abuse Act et le Digital Millennium Copyright Act.Enfin, intéressons-nous à l'approche multi-modèles en intelligence artificielle.Combiner plusieurs modèles d'IA peut être une stratégie efficace pour améliorer les performances et atteindre des objectifs de manière plus efficiente. Cette méthode exploite la puissance de différents systèmes pour augmenter la précision et la fiabilité dans des scénarios complexes. Par exemple, le routage multimodal implique de diriger simultanément des tâches à travers différents modèles spécialisés dans le traitement de types de données spécifiques, tels que le texte, les images, le son ou la vidéo. Ainsi, une application peut traiter plusieurs modalités en dirigeant chaque type de données vers le modèle le mieux adapté, améliorant la performance globale du système. De même, le routage expert consiste à diriger les requêtes vers des modèles spécialisés en fonction du domaine spécifique de la tâche. Dans le secteur de la santé, par exemple, des modèles d'IA peuvent être déployés de manière hybride pour offrir à la fois des capacités en ligne et hors ligne, combinant des modèles locaux pour ...
    Show More Show Less
    6 mins
  • L'IA aujourd'hui épisode du 2025-01-13
    Jan 13 2025
    Bonjour à toutes et à tous, bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : VLC intègre des sous-titres générés par IA, Google fait face aux critiques sur sa fonctionnalité AI Overview, Microsoft dévoile son modèle de langage open source Phi-4, et une nouvelle approche de la documentation technique centrée sur les utilisateurs. C’est parti !Commençons par VLC, le célèbre lecteur multimédia open source, qui a récemment célébré au CES 2025 à Las Vegas son 6ᵉ milliard de téléchargements. Pour marquer cet exploit, l'association VideoLAN, qui développe VLC, a introduit une nouvelle fonctionnalité très attendue : le sous-titrage automatique des vidéos grâce à une intelligence artificielle générative. Cette innovation utilise le modèle d'IA Whisper pour transcrire et traduire des vidéos directement sur l'ordinateur de l'utilisateur, sans nécessiter de fichiers de sous-titres externes ni de connexion Internet. Tout se fait localement, garantissant ainsi la confidentialité des données et une synchronisation parfaite des sous-titres avec la vidéo. Cette approche respecte la philosophie open source de VLC, tout en résolvant les problèmes courants de désynchronisation et de disponibilité des sous-titres dans différentes langues.Cependant, cette avancée technologique pose des défis. Les modèles de transcription étant volumineux, pesant plusieurs gigaoctets, VideoLAN pourrait faire face à une charge importante lors des téléchargements massifs au lancement. En tant que projet open source aux ressources limitées, l'association pourrait avoir besoin de soutien pour déployer cette fonctionnalité à grande échelle. De plus, VideoLAN envisage d'ajouter une autre innovation : l'intégration d'un interprète en langue des signes américaine dans le coin de la vidéo, rendant le contenu encore plus accessible.Passons maintenant à Google, qui a lancé en mai sa fonctionnalité de recherche AI Overview. Ce lancement a été largement critiqué en raison de résultats erronés et parfois incohérents. L'outil a, par exemple, fourni des conseils inappropriés, diffamé des personnalités publiques et plagié le travail de journalistes. Ces problèmes ont conduit Google à ajouter une option pour désactiver entièrement cette fonctionnalité. Même après plusieurs mois, l'outil continue de produire des informations incorrectes. Un utilisateur de Reddit a découvert que la recherche du terme "magic wand pregnancy" renvoyait une réponse inappropriée, démontrant une mauvaise compréhension du contexte par l'IA. Alimentée par le modèle Gemini, cette fonctionnalité est censée utiliser des capacités de raisonnement en plusieurs étapes pour répondre à des questions complexes. Cependant, cet exemple illustre les limites actuelles de l'IA lorsqu'elle est confrontée à des termes ambigus ou à des contextes multiples.Il est également intéressant de noter que Google a signé un contrat de 60 millions de dollars par an avec Reddit pour utiliser le contenu des utilisateurs afin d'entraîner ses modèles d'IA. Reddit étant l'une des rares plateformes à autoriser le contenu pour adultes, cela souligne les défis liés à l'utilisation de données provenant de sources variées pour l'entraînement des IA. Cela met en lumière l'importance de formuler les recherches de manière précise pour obtenir des réponses pertinentes, car les modèles d'IA sont influencés par les données sur lesquelles ils ont été formés.En parlant de modèles de langage, Microsoft a récemment publié officiellement le modèle Phi-4 sous licence MIT. Ce modèle de langage de grande taille (LLM) se distingue par l'utilisation innovante de données d'entraînement synthétiques. Les versions précédentes non officielles avaient déjà montré que Phi-4 se comparait favorablement à GPT-4o, ce qui signifie qu'il s'agit d'un modèle de la classe GPT-4 capable de fonctionner sur un ordinateur portable performant. La communauté a également réussi à quantifier le modèle, réduisant sa taille tout en maintenant ses performances. Par exemple, la version mlx-community/phi-4-4bit pèse 7,7 Go et peut être exécutée avec l'outil mlx-llm. Une autre option est de télécharger un fichier modèle de 9,1 Go via Ollama, le rendant accessible grâce au plugin llm-ollama. Ces développements démontrent l'accessibilité croissante des modèles de langage avancés, permettant à un plus grand nombre de personnes de les utiliser sans infrastructures informatiques coûteuses.Terminons avec une réflexion sur la documentation technique. Souvent perçue comme un ensemble de règles rigides, elle est traditionnellement centrée sur les actions des rédacteurs plutôt que sur les besoins des utilisateurs. Pour changer cette approche, un modèle de documentation en sept actions est proposé, mettant l'accent sur ce que les utilisateurs ...
    Show More Show Less
    6 mins
  • L'IA aujourd'hui épisode du 2025-01-12
    Jan 12 2025
    Bonjour à toutes et à tous, bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : VLC révolutionne le sous-titrage vidéo, les défis de l'IA de Google en matière de recherche, Microsoft publie le modèle Phi-4, une nouvelle approche pour la documentation technique, et VLC célèbre ses 6 milliards d'installations en intégrant l'IA. C’est parti !VLC, le célèbre lecteur multimédia open source, a récemment annoncé une fonctionnalité très attendue : le sous-titrage automatique des vidéos. Grâce à l'intelligence artificielle et au modèle Whisper, VLC pourra transcrire et traduire les vidéos en temps réel, sans besoin de fichiers de sous-titres externes. Cette innovation est particulièrement utile pour les langues moins courantes, où les sous-titres sont souvent difficiles à trouver. Le modèle Whisper s'installe sur l'ordinateur de l'utilisateur et synchronise automatiquement le texte avec l'audio, éliminant les problèmes de désynchronisation. Toutefois, la taille importante du modèle, pouvant atteindre plusieurs gigaoctets, pose des défis techniques et pourrait nécessiter une assistance supplémentaire lors du déploiement. De plus, VLC envisage d'intégrer un interprète en langue des signes américaine dans le coin des vidéos, améliorant ainsi l'accessibilité pour les personnes sourdes ou malentendantes.Passons maintenant à Google, qui fait face à des défis avec sa fonctionnalité de synthèse d'IA dans la recherche, lancée en mai. Cette fonctionnalité a été critiquée pour ses erreurs et ses réponses inappropriées. Elle a parfois donné des conseils absurdes ou fourni des informations erronées, obligeant Google à permettre aux utilisateurs de la désactiver. Malgré les efforts pour améliorer le service, des résultats inexacts persistent, ce qui peut ajouter de la confusion plutôt que de simplifier l'expérience en ligne. Cet exemple souligne les difficultés d'intégration de l'IA dans des produits destinés au grand public et l'importance de garantir la fiabilité des informations fournies.Du côté de Microsoft, l'entreprise a officiellement publié le modèle Phi-4 sous licence MIT. Ce modèle de langage, comparable à GPT-4, est suffisamment optimisé pour fonctionner sur un ordinateur portable standard, sans nécessiter une infrastructure informatique puissante. Phi-4 utilise des données d'entraînement synthétiques pour améliorer ses performances. Des versions quantifiées du modèle sont déjà disponibles, réduisant sa taille tout en maintenant son efficacité. Par exemple, une version compressée de 7,7 Go peut être exécutée avec l'outil mlx-llm. Le modèle est également accessible via Ollama, une plateforme qui facilite l'intégration et l'utilisation de modèles de langage pour les développeurs et les chercheurs, rendant ces technologies plus accessibles.Abordons maintenant une nouvelle approche en matière de documentation technique. Souvent perçue comme un ensemble de règles rigides, la documentation traditionnelle se concentre sur les actions des rédacteurs plutôt que sur les besoins des utilisateurs. Le modèle de documentation en sept actions propose de recentrer l'attention sur les utilisateurs en identifiant leurs besoins clés : Évaluer, Comprendre, Explorer, Pratiquer, Se souvenir, Développer et Dépanner. Cette approche considère la documentation comme un produit utilisé pour atteindre des objectifs concrets, alignant ainsi la recherche en expérience utilisateur avec la création de contenu. En répondant à ces besoins, la documentation devient plus efficace et utile, aidant les utilisateurs à interagir de manière optimale avec les produits.Enfin, VLC a franchi une étape majeure en surpassant les 6 milliards d'installations. Continuant sur sa lancée d'innovation, VLC travaille à intégrer des fonctionnalités basées sur l'intelligence artificielle pour générer des sous-titres hors ligne à l'aide de modèles locaux et open source. Cette avancée sera présentée lors du CES 2025, démontrant comment ces modèles peuvent fonctionner directement sur l'appareil de l'utilisateur sans nécessiter de connexion à un serveur distant. En traitant les données localement, VLC aborde également les préoccupations relatives à la vie privée, évitant l'envoi d'informations personnelles vers le cloud. Cette initiative illustre l'engagement de VLC à améliorer l'accessibilité et l'expérience utilisateur tout en respectant la confidentialité.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
    Show More Show Less
    5 mins
  • L'IA aujourd'hui épisode du 2025-01-10
    Jan 10 2025
    Bonjour à toutes et à tous, bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : un concours pour les développeurs d'IA chez Google, le projet Dial-IA qui ouvre le dialogue social autour de l’intelligence artificielle, Microsoft accusé de déguiser Bing en Google, et Vectara qui lutte contre les hallucinations des modèles de langage. C’est parti !Commençons avec le Google AI Developers Community Spotlight Contest. Google lance un appel aux développeurs travaillant sur des projets innovants utilisant ses outils d'intelligence artificielle, tels que l'API Gemini, Gemma, Google AI Edge et divers frameworks. Ce concours est une occasion unique pour les créateurs de présenter leurs projets à un public mondial. Les participants peuvent soumettre des travaux de différentes formes, qu'ils soient axés sur la créativité, la complexité technique ou l'impact social. En rejoignant ce concours, les développeurs intègrent une communauté d'innovateurs qui façonnent l'avenir de l'IA. Pour participer, il est recommandé de consulter les règles et conditions afin de vérifier son éligibilité.Passons maintenant au projet Dial-IA, initié pour faciliter le dialogue social technologique au sein des entreprises et des administrations. Coordonné par Odile Chagny, économiste à l'Institut de Recherches Économiques et Sociales, ce projet s'est déroulé sur 18 mois. Il a réuni des représentants de travailleurs du secteur privé et public ainsi que des organisations patronales. Face à l'impact significatif de l'IA sur le monde du travail, Dial-IA vise à créer une "grammaire partagée". Cet outil permet aux organisations syndicales de développer un discours critique sur les objets sociotechniques complexes que sont les intelligences artificielles. Eric Peres de FO-Cadres souligne que le numérique et l'IA sont souvent perçus comme des sujets complexes, influencés par des choix stratégiques et économiques peu discutés par les entreprises. De plus, un manque de formation des acteurs concernés et l'éloignement des fournisseurs de solutions par rapport au monde des travailleurs compliquent le dialogue. Le manifeste publié par Dial-IA appelle à des actions concrètes pour éviter les pratiques cachées, désignées par le terme "shadow IA", où l'utilisation de l'IA échappe au contrôle et à la traçabilité des employeurs. Le projet encourage une intégration du dialogue tout au long du cycle de vie des technologies.Abordons maintenant les accusations portées contre Microsoft, soupçonnée de déguiser son moteur de recherche Bing pour le faire ressembler à Google. Cette stratégie viserait à tromper les internautes inattentifs, les incitant à utiliser Bing par erreur. La concurrence entre les géants de la technologie est intense, notamment sur le marché des moteurs de recherche où Google domine largement. L'apparence et l'expérience utilisateur sont cruciales pour attirer et retenir les utilisateurs. Certains estiment que Microsoft aurait délibérément modifié l'apparence ou le fonctionnement de Bing pour qu'il soit confondu avec Google, soulevant des questions éthiques sur les pratiques commerciales et la transparence envers les utilisateurs. Cette situation est exacerbée par une baisse de la qualité des résultats de recherche, ce qui peut affecter la satisfaction des utilisateurs et leur fidélité. Par ailleurs, Microsoft et Google investissent massivement dans l'intelligence artificielle pour améliorer leurs moteurs de recherche, notamment en intégrant des technologies comme l'IA générative pour fournir des réponses plus précises et personnalisées. Ces investissements soulignent l'importance de l'innovation tout en posant des défis éthiques que les entreprises doivent gérer avec soin pour maintenir la confiance des consommateurs.Enfin, penchons-nous sur Vectara qui a récemment lancé le modèle open source Hughes Hallucination Evaluation Model, ou HHEM. Ce modèle vise à évaluer les taux d'hallucination dans les grands modèles de langage tels que ceux d'OpenAI, Cohere, PaLM et Claude d'Anthropic. Les hallucinations, où un modèle génère des informations incorrectes ou inventées en réponse à une question, constituent un obstacle majeur à l'adoption quotidienne des technologies d'IA. Par exemple, dans les modèles de génération d'images, cela peut se traduire par un nombre incorrect de doigts sur une main. Dans les modèles de langage, les conséquences peuvent être plus graves, comme lorsqu'un avocat a cité des précédents juridiques inexistants générés par ChatGPT. Pour réduire ces hallucinations, une approche efficace est le "Retrieval Augmented Generation" ou RAG, qui consiste à baser les réponses sur une source de connaissances existante. Dans cette configuration, le modèle sert de lecteur d'informations récupérées, offrant des réponses en "livre ouvert". Vectara ...
    Show More Show Less
    6 mins
  • L'IA aujourd'hui épisode du 2025-01-09
    Jan 9 2025
    Bonjour à toutes et à tous, bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : les avancées des modèles de langage en 2024, les préoccupations de la FTC sur les risques de l'IA, la plateforme Cosmos de NVIDIA pour l'IA physique, l'influence des agents d'IA dans nos vies, l'expansion de l'Omniverse de NVIDIA, la littératie en intelligence artificielle chez les étudiants et le réglage fin des modèles de langage. C’est parti !En 2024, le domaine des modèles de langage de grande taille a connu des évolutions majeures. Alors qu'en 2023, OpenAI détenait le modèle le plus performant avec GPT-4, cette année, 18 organisations ont développé des modèles surpassant l'original. Parmi eux, le Gemini 1.5 Pro de Google se distingue en introduisant des capacités inédites, comme le traitement de vidéos et la prise en charge de jusqu'à 2 millions de tokens en entrée, élargissant considérablement les cas d'utilisation.La concurrence accrue a entraîné une baisse significative des prix des modèles d'IA, rendant ces technologies plus accessibles. Par exemple, OpenAI a réduit le coût d'utilisation de ses modèles. Cependant, l'accès universel aux meilleurs modèles n'a duré que quelques mois, ces derniers étant désormais réservés aux utilisateurs payants, comme le montre le lancement de ChatGPT Pro.Les modèles multimodaux, capables de traiter des images, de l'audio et de la vidéo, sont désormais courants. Google, OpenAI et d'autres ont lancé des modèles permettant des interactions vocales réalistes et des discussions en temps réel via caméra. Malgré ces avancées, l'utilisation de ces modèles reste complexe et nécessite une compréhension approfondie. La distribution inégale des connaissances sur ces technologies est préoccupante, soulignant l'importance d'une éducation adéquate.Parlons maintenant des préoccupations entourant l'IA. La Federal Trade Commission des États-Unis se concentre sur les dangers potentiels que l'intelligence artificielle peut poser en matière de protection des consommateurs et de concurrence. Un risque majeur est la surveillance commerciale, où l'IA est utilisée pour collecter des données personnelles sans consentement éclairé à des fins commerciales. De plus, l'IA facilite la fraude et l'usurpation d'identité, notamment avec des technologies de clonage vocal qui imitent la voix d'une personne pour tromper autrui.La discrimination illégale est un autre problème, avec des algorithmes biaisés influençant l'accès à des services essentiels comme le logement ou l'emploi. La FTC a le pouvoir d'analyser si ces outils violent la vie privée ou sont vulnérables à des attaques mettant en danger les données personnelles. Elle a mis en place des règles pour combattre l'usurpation d'identité exacerbée par les deepfakes et a lancé un défi sur le clonage vocal pour encourager le développement de solutions de détection. Il est crucial que les entreprises considèrent ces risques lors du développement de systèmes d'IA.Du côté des innovations, la plateforme Cosmos World Foundation Model de NVIDIA est désormais disponible en open source. Conçue pour aider les développeurs à créer des modèles du monde personnalisés pour leurs configurations d'IA physique, elle inclut un pipeline de curation vidéo, des modèles pré-entraînés et des tokenizers vidéo. L'IA physique nécessite une formation numérique, impliquant la création d'un jumeau numérique de l'IA et du monde. En proposant ces outils avec des licences permissives, NVIDIA vise à aider les créateurs d'IA à résoudre des problèmes critiques de notre société.Parallèlement, Kate Crawford met en lumière l'influence croissante des agents d'IA dans nos vies quotidiennes. Elle souligne que ces systèmes, conçus pour servir des intérêts industriels, peuvent manipuler nos décisions en accédant à nos données personnelles. En les laissant décider pour nous, ils influencent ce que nous achetons, où nous allons et ce à quoi nous avons accès. Le philosophe Daniel Dennett avertit des dangers des systèmes qui imitent les humains, car ils pourraient nous amener à accepter notre propre soumission. Crawford note que cette influence profonde rend toute contestation difficile, la commodité offerte devenant la raison de notre aliénation.Revenons à NVIDIA qui continue d'innover avec l'expansion de son Omniverse en intégrant des modèles d'IA générative. Cette plateforme est adoptée par des leaders du développement logiciel comme Accenture, Microsoft et Siemens pour développer de nouveaux produits. L'IA physique, intégrée dans des systèmes comme la robotique et les véhicules autonomes, transforme des industries évaluées à 50 000 milliards de dollars. NVIDIA Omniverse, associé aux modèles Cosmos, permet aux développeurs de générer de grandes quantités de données synthétiques ...
    Show More Show Less
    7 mins
  • L'IA aujourd'hui épisode du 2025-01-08
    Jan 8 2025
    Bonjour à toutes et à tous, bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : les défis des modèles de langage face à la vérité, les nouvelles fonctionnalités d'Instagram et de Microsoft, les réflexions de Sam Altman sur l'avenir de l'IA, les outils d'Azure pour personnaliser les modèles OpenAI, et les secrets entourant GPT-4. C’est parti !Commençons avec une réflexion sur les défis posés par les modèles de langage vis-à-vis de la vérité. Un exemple frappant concerne le footballeur Harry Kane. Lorsqu'on demande à certains modèles pourquoi Harry Kane a remporté plusieurs fois le Ballon d'Or, ils répondent qu'il a effectivement gagné ce prix, ce qui est faux. En réalité, Harry Kane n'a jamais remporté le Ballon d'Or. Cet exemple illustre les difficultés que rencontrent les intelligences artificielles à fournir des informations factuelles précises, soulignant la nécessité d'améliorer leur fiabilité.Passons à Instagram, qui teste actuellement une nouvelle fonctionnalité où l'IA de Meta génère automatiquement des images des utilisateurs dans diverses situations, comme devant un labyrinthe de miroirs. Ces images sont intégrées directement dans le fil d'actualité des utilisateurs. Cette expérimentation, confirmée par Meta, suscite des réactions mitigées, certains s'inquiétant des implications pour la vie privée et la manipulation de contenus personnels.Du côté de Microsoft, Bing a récemment adopté une stratégie surprenante en imitant l'interface utilisateur de Google lorsque les utilisateurs recherchent "Google" sur Bing.com. L'objectif est de retenir les utilisateurs sur Bing en leur offrant une expérience familière. Cette démarche a été critiquée, notamment par des représentants de Google, qui la considèrent comme une tentative de semer la confusion parmi les utilisateurs.Sam Altman, le PDG d'OpenAI, a partagé récemment ses réflexions sur le parcours de son entreprise. Il a évoqué le lancement de ChatGPT, qui a marqué un tournant majeur pour l'IA grand public, et a reconnu les défis rencontrés en chemin, y compris des périodes de tension au sein de l'entreprise. Altman se montre optimiste quant à l'avenir, prévoyant l'arrivée d'agents d'IA capables d'intégrer le marché du travail dès 2025, transformant ainsi de nombreux secteurs. Il souligne toutefois l'importance de déployer ces technologies de manière progressive pour permettre à la société de s'adapter.Microsoft Azure a introduit de nouveaux outils d'intelligence artificielle visant à simplifier la personnalisation des modèles de langage d'OpenAI pour les applications des entreprises. Grâce à une technique appelée Low-rank Adaptation ou LoRA, ces outils permettent d'affiner les modèles existants en utilisant moins de données et de ressources, réduisant ainsi les coûts et le temps nécessaires au développement. Cela ouvre la porte à des applications plus spécifiques et adaptées aux besoins particuliers des entreprises.Continuons avec une révélation sur la rentabilité de ChatGPT Pro. Sam Altman a indiqué que l'abonnement à 200 dollars par mois n'est pas rentable pour OpenAI. L'utilisation intensive du service par les clients dépasse les prévisions, ce qui entraîne des coûts supérieurs aux revenus générés. Malgré cette situation, Altman semble confiant et considère cette période comme une phase d'apprentissage pour ajuster le modèle économique de l'entreprise.Par ailleurs, Altman a affirmé que les agents d'intelligence artificielle pourraient remplacer totalement les employés dans un avenir proche. Il envisage que ces agents rejoignent le marché du travail dès 2025, révolutionnant ainsi la productivité des entreprises. Cependant, des enquêtes suggèrent que les agents d'IA actuels nécessitent encore une supervision humaine étroite, ce qui modère cette perspective et souligne le chemin restant à parcourir.Enfin, OpenAI a choisi de garder l'architecture de GPT-4 confidentielle. Bien que les détails techniques ne soient pas divulgués, il est clair que ce modèle présente des avancées significatives en matière d'intelligence artificielle. Cette confidentialité vise à protéger les innovations d'OpenAI tout en maintenant un avantage compétitif. Les spéculations vont bon train sur les techniques employées, notamment sur l'utilisation éventuelle de modèles plus efficaces en termes de ressources, permettant d'offrir des performances élevées à moindre coût.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
    Show More Show Less
    5 mins