Et si l’IA permettait de lire des manuscrits et tablettes vieux de 3 000 ans ?

Des modèles d’IA reproduisent avec précision des caractères cunéiformes. Une avancée qui pourrait faire gagner un temps fou aux chercheurs.

Des modèles d'IA reproduisent avec précision des caractères cunéiformes.
Image IA générée avec Microsoft Bing Image Creator

L’intelligence artificielle, si la science-fiction nous en parle depuis longtemps, elle n’est facilement accessible par tous que depuis assez peu de temps en réalité. Open AI et son modèle GPT qui ont permis de créer un chatbot IA, ChatGPT, ont ouvert la voie à d’autres modèles utilisables de manière simplifiée grâce à leur compréhension du langage courant.

Si vous utilisez déjà un chatbot pour naviguer sur internet, faire vos devoir, rédiger vos emails ou résumer des vidéos, créer du code, de créer des images, ces avancées en intelligence artificielle permettent également aux scientifiques de simplifier une partie de leur travail ou de réaliser de nouvelles découvertes.

Un modèle d’IA pour déchiffrer des caractères cunéiforme

Déchiffrer l’écriture de certaines personnes peut s’avérer un véritable défi. Ce défi est encore plus grand lorsque cette écriture est constituée de caractères cunéiformes gravés sur des tablettes vieilles de 3 000 ans. Afin de les aider au déchiffrement de ces tablettes, les chercheurs du Moyen-Orient peuvent maintenant utiliser l’intelligence artificielle (IA).

Grâce à des modèles spécifiquement entraînés, l’IA peut leur servir à identifier et recopier les caractères cunéiformes à partir de photos de tablettes, ce qui leur permet de lire de manière plus aisée des écritures compliquées.

Avec les hiéroglyphes égyptiens, le cunéiforme est l’une des plus anciennes formes d’écriture connues et se compose de plus de 1 000 caractères uniques. L’apparence de ces caractères peut varier selon les époques, les cultures, la géographie et même les écrivains, ce qui les rend difficiles à interpréter.

Des chercheurs de Cornell et de l’université de Tel Aviv (TAU) ont mis au point une approche appelée ProtoSnap qui enclenche un prototype de caractère pour l’adapter aux variations individuelles imprimées sur une tablette.

Dans cette approche, pour voir si elle pouvait déchiffrer automatiquement ces scans, l’équipe a appliqué un modèle de diffusion. Il s’agit d’un type de modèle génératif d’IA souvent utilisé pour des tâches de vision par ordinateur, telles que la génération d’images. Ce modèle a servi à calculer la similitude entre chaque pixel d’une image de caractère sur une tablette par rapport à un prototype général du même caractère. Les deux versions ont ensuite été alignées et le modèle a été modifié pour correspondre aux traits du caractère réel.

Exemples de résultats (photo ci-dessous): alignement des prototypes (première ligne) sur les images cunéiformes cibles (deuxième ligne). Les résultats sont illustrés à la fois après l’alignement global (troisième ligne) et après le raffinement (dernière ligne).

Utilisation du système ProtoSnap
©ProtoSnap: Prototype Alignment for Cuneiform Signs

Les caractères saisis peuvent également être utilisés pour former des modèles d’IA en aval qui effectuent la reconnaissance optique de caractères, c’est-à-dire qui transforment les images des tablettes en texte lisible par une machine. 

Les chercheurs ont montré que, lorsqu’ils sont entraînés avec ces données, les modèles en aval reconnaissent beaucoup mieux les caractères cunéiformes, même ceux qui sont rares ou qui présentent beaucoup de variations, par rapport aux tests précédents utilisant l’IA.

Lorsque l’on remonte dans le monde antique, on constate une grande variabilité dans la forme des caractères”, explique Hadar Averbuch-Elor, professeur adjoint d’informatique à Cornell Tech et au Cornell Ann S. Bowers College of Computing and Information Science, qui a dirigé les travaux de recherche. “Même avec le même caractère, l’apparence change au fil du temps, et c’est donc un problème très difficile que de pouvoir déchiffrer automatiquement ce que le caractère signifie réellement.

On estime à 500 000 le nombre de tablettes cunéiformes conservées dans les musées, mais seule une partie d’entre elles a été traduite et publiée. Selon Hadar Averbuch-Elor “Il existe une quantité infinie de scans 2D de ces cunéiformes, mais la quantité de données étiquetées est très faible”.

Rachel Mikulinsky, étudiante en master et coauteur de TAU, présentera “ProtoSnap : Prototype Alignment for Cuneiform Signs” en avril à l’International Conference on Learning Representations (ICLR).

À la base de notre recherche se trouve l’objectif de décupler les sources anciennes à notre disposition”, a déclaré Yoram Cohen, coauteur et professeur d’archéologie à TAU. “Cela nous permettra, pour la première fois, de manipuler des données massives (big data) et d’obtenir de nouvelles informations mesurables sur les sociétés anciennes, leur religion, leur économie, leur vie sociale et juridique.

Ces avancées permettraient de faire gagner un temps précieux aux chercheurs et d’automatiser une partie de leur travail. Ils pourraient ainsi comparer des données à grande échelle et comparer les caractères de diverses époques, villes ou auteurs.

Source : PHYS ORG