Par Pan Xutao et Chen Sida
Un grand modèle climatique développé par la Chine et utilisant la technologie de l’intelligence artificielle (IA) a récemment attiré l’attention lors de la 28e session de la Conférence des parties à la Convention-cadre des Nations Unies sur les changements climatiques (COP28) à Dubaï, aux Émirats arabes unis. Ce grand modèle, du nom de « FuXi-Subseasonal » et qui présente une longue plage de temps et une grande précision pour les prévisions météorologiques, est une illustration du puissant essor des grands modèles en Chine.
Alors que diverses industries en Chine intensifient leurs efforts pour libérer le potentiel des grands modèles, les grands modèles nationaux connaissent un développement rapide. Selon un rapport publié par le Centre de développement et de recherche en IA de nouvelle génération, qui dépend du ministère chinois des Sciences et Technologies, la Chine se classe d’ailleurs au deuxième rang mondial en termes de nombre de grands modèles développés dans le pays, et un bon nombre de grands modèles de pré-formation ayant une influence considérable dans l’industrie ont émergé dans le pays.
Selon Tao Qing, porte-parole du ministère chinois de l’Industrie et des Technologies de l’information (MIIT), « le développement de l’IA, avec les grands modèles comme exemple typique, a montré des caractéristiques telles qu’une innovation technologique rapide, des applications étendues et une concurrence internationale féroce, modifiant profondément les modèles de production et les formes économiques du secteur manufacturier et démontrant à quel point l’IA peut être puissante dans l’autonomisation des industries ».
Grâce à un contrôle complet des feux et à de grands modèles de circulation, de nombreux citoyens qui conduisent dans la Zone de développement économique et technologique de Beijing, la seule zone nationale de développement économique et technologique de la capitale chinoise, ont remarqué une diminution significative de la fréquence des arrêts aux feux rouges. En fait, ils ont l’impression qu’ils voient désormais souvent des feux verts jusqu’au bout. La zone, également surnommée Beijing E-Town, s’est associée au géant chinois de la recherche en ligne Baidu pour intégrer diverses sources de données spatio-temporelles, notamment des données de perception en bordure de route et des données Internet.
Sur cette base, ils ont utilisé de grands modèles de trafic pour évaluer la possibilité d’embouteillages et effectué des déductions par simulation pour générer des plans de contrôle complet des signaux et optimiser automatiquement le timing des signaux, transformant la situation traditionnelle des véhicules attendant les feux en la scène actuelle des feux de circulation changeant pour le confort des véhicules.
On estime que la mise en œuvre d’un contrôle complet des feux de signalisation dans toute la zone a réduit de 28% le temps moyen nécessaire à un véhicule pour traverser un carrefour à feux de circulation.
Les domaines verticaux, du transport à la culture et au tourisme, et de l’éducation à la santé, ont récemment été témoins de lancements intensifs de divers types de grands modèles. Par rapport aux grands modèles à usage général, les grands modèles de domaines verticaux disposent d’une expertise plus forte, ils peuvent mieux contribuer à résoudre les problèmes spécifiques au domaine et fournir des services plus ciblés.
Ctrip, la première agence de voyages en ligne de Chine, a déployé un grand modèle nommé Ctrip Wendao pour l’industrie du tourisme. Le modèle prend en charge l’interaction en langage naturel et est capable d’aider les utilisateurs dans les réservations d’hôtels et d’attractions touristiques, la planification de voyages et d’autres décisions.
iFLYTEK, leader chinois de l’IA et de la parole intelligente, a de son côté lancé une application pour les services médicaux. IFLYHEALTH APP, la nouvelle application basée sur le grand modèle médical Spark Desk de la société, possède des fonctionnalités telles que l’auto-évaluation de la santé, l’interprétation des rapports d’examen médical et la gestion des dossiers de santé, fournissant ainsi des services de conseil en santé aux utilisateurs.
A Nanjing, capitale de la province du Jiangsu (est de la Chine), une équipe de recherche de l’Université agricole a publié un grand modèle linguistique (LLM) pour les livres anciens. Capable d’effectuer une analyse lexicale, une extraction d’informations, une génération automatique de poésie et d’autres fonctions, le LLM devrait être appliqué et promu dans la collecte de livres anciens, le divertissement numérique et d’autres domaines.
Les données montrent qu’en octobre 2023, plus de 250 entreprises et établissements universitaires en Chine avaient développé de grands modèles comportant chacun plus d’un milliard de paramètres, les applications industrielles verticales devenant la voie clé pour l’utilisation de grands modèles.
Selon Liu Yuanchun, président de l’Université de finances et d’économie de Shanghai (est de la Chine), en tant que deuxième économie mondiale, la Chine bénéficie des avantages d’un marché très vaste et de ressources numériques riches, ce qui lui permet de fournir de grands modèles avec des scénarios d’application plus sophistiqués et plus riches et un environnement de formation continue.
La puissance de calcul est à la base des grands modèles, qui nécessitent une puissance de calcul massive lors de la formation et de l’inférence. A cet effet, la Chine encourage vigoureusement son projet de transfert de ressources informatiques d’est en ouest, offrant des opportunités de développement aux centres informatiques intelligents des régions occidentales du pays.
C’est dans ce cadre que, le 30 novembre 2023, le centre informatique d’intelligence artificielle Qinghai Kunlun, le premier centre informatique intelligent du plateau Qinghai-Tibet, a été officiellement inauguré dans la province du Qinghai (nord-ouest de la Chine). Le centre informatique s’appuie sur la base de données nationale de mégadonnées (Big Data) du Parc national de Sanjiangyuan, situé dans la même province, pour la gestion des ressources et des opérations informatiques.
Le 7 décembre 2023, la région autonome Hui du Ningxia, également dans le nord-ouest de la Chine, a signé son premier projet de construction d’un ensemble de centres informatiques à grande échelle. Utilisant des unités de traitement graphique (GPU) nationales complètes comme base, cet ensemble devrait fournir une puissance de calcul pour la formation et l’inférence de grands modèles, ainsi que pour le rendu graphique 3D et d’autres tâches.
Selon un plan d’action pour le développement de haute qualité de l’infrastructure de puissance de calcul publié en octobre 2023 par six autorités chinoises, dont le MIIT, la Chine vise à atteindre une puissance de calcul totale de plus de 300 EFLOPS d’ici 2025 et à augmenter la proportion de la puissance de calcul de l’IA dans sa puissance de calcul globale à 35%.
L’EFLOPS est une unité de mesure de la vitesse d’un ordinateur. 1 EFLOPS équivalant à 1 quintillion d’opérations à virgule flottante par seconde.