
Ingénieur informatique en bases de données linguistiques
ECOLE NORMALE SUPERIEURE | Contractuel
En Bref
- Lieu de travail : Paris
- Catégorie : A
- Date de publication : 02/12/2025
- Valable jusqu'au : 31/01/2026
- Code postal : 75005
- Salaire : De 30 000€ à 40 000€
- Référence : zjpihk4kdu
Employeur
Poste
ENVIRONNEMENT DE TRAVAIL
HéLiCéO “ Héritages Linguistiques, Cultures orales, Éducation en Océanie ” est un consortium scientifique du CNRS, prévu sur plusieurs années (2025–2030), et pour l'instant financé pour les 12 premiers mois. Il vise la documentation et la description des langues d'Océanie, leur analyse dans le cadre de la linguistique générale, et leur promotion dans l'éducation. Il prévoit la création de plusieurs bases de données scientifiques et ressources en ligne, destinées à différents publics.
Dans ce cadre, HéLiCéO recrute un ingénieur d'études pour un contrat d'1 an.
Ce poste sera rattaché à deux des axes du projet HéLiCéO : axe 2 “ Linguistique historique et comparative ”, et axe 3 “ Patrimoine oral et mythologique ”.
Le projet HéLiCéO comporte trois pôles : Tahiti, Paris et Montrouge ; le présent poste sera ancré à Montrouge près de Paris. Le pôle de Montrouge comptera entre 4 et 9 personnes selon les périodes. Cette équipe fait partie du lattice ( Langues, Textes, Traitements informatiques, Cognition ), un laboratoire Cnrs–ENS dynamique, consacré aux recherches en linguistique (lexique, grammaire, discours), modélisation du langage, TAL et intelligence artificielle.
Le pôle HéLiCéO de Montrouge est coordonné par Alexandre François, linguiste, spécialiste de la typologie du changement linguistique, et de l'analyse des langues du Pacifique. Outre la supervision de ce dernier, l'ingénieur d'études travaillera également en collaboration avec Konstantin Henke (l'ingénieur informaticien du projet HéLiCéO) et avec Mathieu Dehouck (linguiste spécialisé en TAL) – ainsi qu'avec les autres partenaires du projet HéLiCéO.
MISSION PRINCIPALE
La mission consistera à développer et maintenir des ressources numériques dédiées à la comparaison des langues et cultures, dans le cadre du projet HéLiCéO, en collaboration avec l'ingénieur du projet. Ces ressources incluent des bases de données existantes (EvoSem et EvoLex, sur le changement sémantique), des bases qui restent à créer (ex. sur le changement phonétique, les structures grammaticales, la mythologie comparée), ainsi que des sites de consultation destinés au public.
Par ailleurs, l'ingénieur assistera les chercheurs, postdoctorants et doctorants du projet HéLiCéO dans la gestion de leurs données numériques : corpus de textes, données lexicographiques, données grammaticales.
Enfin, la personne recrutée sera chargée d'élaborer le Plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, consistant à en sécuriser les données numériques sur le long terme.
ACTIVITES PRINCIPALES
• Aide à la conception, à la création et à la maintenance de bases de données, sur des thèmes linguistiques (phonétique, grammaire, sémantique) et culturels (mythologies du Pacifique), en collaboration avec les responsables scientifiques
• Maintenance et expansion de bases de données existantes (ex. EvoSem, EvoLex)
• Aide à la préparation des données pour intégration aux bases et outils numériques
• Création et maintenance de scripts de conversion ( pipelines ) entre datasets, tableaux, et graphes
• Création et maintenance d'interfaces utilisateur ergonomiques : aide à l'entrée de données, moteurs de recherche, sites de consultation, sites de diffusion grand public
• Intégration continue, gestion de versions ; veille sur la pérennisation des contenus et des formats
• Accompagnement des membres d'HéLiCéO dans la gestion, l'archivage, et la valorisation de leurs données numériques.
• Élaboration (en coopération avec les responsables scientifiques) et suivi technique du plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, visant à sécuriser et pérenniser les données de la recherche.
HéLiCéO “ Héritages Linguistiques, Cultures orales, Éducation en Océanie ” est un consortium scientifique du CNRS, prévu sur plusieurs années (2025–2030), et pour l'instant financé pour les 12 premiers mois. Il vise la documentation et la description des langues d'Océanie, leur analyse dans le cadre de la linguistique générale, et leur promotion dans l'éducation. Il prévoit la création de plusieurs bases de données scientifiques et ressources en ligne, destinées à différents publics.
Dans ce cadre, HéLiCéO recrute un ingénieur d'études pour un contrat d'1 an.
Ce poste sera rattaché à deux des axes du projet HéLiCéO : axe 2 “ Linguistique historique et comparative ”, et axe 3 “ Patrimoine oral et mythologique ”.
Le projet HéLiCéO comporte trois pôles : Tahiti, Paris et Montrouge ; le présent poste sera ancré à Montrouge près de Paris. Le pôle de Montrouge comptera entre 4 et 9 personnes selon les périodes. Cette équipe fait partie du lattice ( Langues, Textes, Traitements informatiques, Cognition ), un laboratoire Cnrs–ENS dynamique, consacré aux recherches en linguistique (lexique, grammaire, discours), modélisation du langage, TAL et intelligence artificielle.
Le pôle HéLiCéO de Montrouge est coordonné par Alexandre François, linguiste, spécialiste de la typologie du changement linguistique, et de l'analyse des langues du Pacifique. Outre la supervision de ce dernier, l'ingénieur d'études travaillera également en collaboration avec Konstantin Henke (l'ingénieur informaticien du projet HéLiCéO) et avec Mathieu Dehouck (linguiste spécialisé en TAL) – ainsi qu'avec les autres partenaires du projet HéLiCéO.
MISSION PRINCIPALE
La mission consistera à développer et maintenir des ressources numériques dédiées à la comparaison des langues et cultures, dans le cadre du projet HéLiCéO, en collaboration avec l'ingénieur du projet. Ces ressources incluent des bases de données existantes (EvoSem et EvoLex, sur le changement sémantique), des bases qui restent à créer (ex. sur le changement phonétique, les structures grammaticales, la mythologie comparée), ainsi que des sites de consultation destinés au public.
Par ailleurs, l'ingénieur assistera les chercheurs, postdoctorants et doctorants du projet HéLiCéO dans la gestion de leurs données numériques : corpus de textes, données lexicographiques, données grammaticales.
Enfin, la personne recrutée sera chargée d'élaborer le Plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, consistant à en sécuriser les données numériques sur le long terme.
ACTIVITES PRINCIPALES
• Aide à la conception, à la création et à la maintenance de bases de données, sur des thèmes linguistiques (phonétique, grammaire, sémantique) et culturels (mythologies du Pacifique), en collaboration avec les responsables scientifiques
• Maintenance et expansion de bases de données existantes (ex. EvoSem, EvoLex)
• Aide à la préparation des données pour intégration aux bases et outils numériques
• Création et maintenance de scripts de conversion ( pipelines ) entre datasets, tableaux, et graphes
• Création et maintenance d'interfaces utilisateur ergonomiques : aide à l'entrée de données, moteurs de recherche, sites de consultation, sites de diffusion grand public
• Intégration continue, gestion de versions ; veille sur la pérennisation des contenus et des formats
• Accompagnement des membres d'HéLiCéO dans la gestion, l'archivage, et la valorisation de leurs données numériques.
• Élaboration (en coopération avec les responsables scientifiques) et suivi technique du plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, visant à sécuriser et pérenniser les données de la recherche.
Profil
CHAMPS DES RELATIONS :
Internes : collègues du projet HéLiCéO ; collègues du laboratoire Lattice ; services de l'ENS (Pôle Ressources Lettres)
Externes : partenaires externes du projet HéLiCéO : pôles de Paris (ENS, Paris Cité) et de Tahiti (Univ. Polynésie française, MSH Pacifique)
COMPETENCES ATTENDUES
Diplôme : Bac+3 en informatique, ou en Traitement automatisé du langage ;
Connaissances :
• Connaissance des bases de données (notamment BD relationnelles), moteurs de recherches
• Connaissance des bases de la linguistique
• Familiarité avec la gestion de données multilingues (problématiques de traduction, d'encodage, etc.)
• Anglais : lu, écrit, parlé (au moins C1) ; connaissance du français (au moins B1) ;
• Savoirs souhaitables mais optionnels : Connaissance d'une langue autre que le français et l'anglais.
Compétences techniques :
• Programmation en Python ; Git ; Javascript ; Html/Css
• Technologies full stack web
• Requêtes http et API “REST” ; Outils XML : XSLT, XQuery, Xpath
• Théorie des graphes & détection de communautés.
Compétences comportementales :
• Capacité à travailler en équipe
• Capacité à travailler en autonomie, prise d'initiative
• Capacité à respecter les délais
• Curiosité scientifique, notamment dans le domaine de la diversité des langues et des cultures.
AUTRES INFORMATIONS :
Seules seront retenues les candidatures incluant un CV et une lettre de motivation argumentée.
Poste à pourvoir le : 1 février 2026
Durée du contrat : 1 2 mois
Lieu de travail : Lattice – ENS Montrouge – 1 rue Maurice Arnoux, 92120 Montrouge
Quotité de travail : 100% = 37h30 / semaine
Poste ouvert uniquement aux contractuels
Rémunération : selon grille et expérience (Salaire brut minimum : 2400 €/mois)
L'ENS-PSL est un établissement handi-accueillant et attaché à la mixité et à la diversité.
Internes : collègues du projet HéLiCéO ; collègues du laboratoire Lattice ; services de l'ENS (Pôle Ressources Lettres)
Externes : partenaires externes du projet HéLiCéO : pôles de Paris (ENS, Paris Cité) et de Tahiti (Univ. Polynésie française, MSH Pacifique)
COMPETENCES ATTENDUES
Diplôme : Bac+3 en informatique, ou en Traitement automatisé du langage ;
Connaissances :
• Connaissance des bases de données (notamment BD relationnelles), moteurs de recherches
• Connaissance des bases de la linguistique
• Familiarité avec la gestion de données multilingues (problématiques de traduction, d'encodage, etc.)
• Anglais : lu, écrit, parlé (au moins C1) ; connaissance du français (au moins B1) ;
• Savoirs souhaitables mais optionnels : Connaissance d'une langue autre que le français et l'anglais.
Compétences techniques :
• Programmation en Python ; Git ; Javascript ; Html/Css
• Technologies full stack web
• Requêtes http et API “REST” ; Outils XML : XSLT, XQuery, Xpath
• Théorie des graphes & détection de communautés.
Compétences comportementales :
• Capacité à travailler en équipe
• Capacité à travailler en autonomie, prise d'initiative
• Capacité à respecter les délais
• Curiosité scientifique, notamment dans le domaine de la diversité des langues et des cultures.
AUTRES INFORMATIONS :
Seules seront retenues les candidatures incluant un CV et une lettre de motivation argumentée.
Poste à pourvoir le : 1 février 2026
Durée du contrat : 1 2 mois
Lieu de travail : Lattice – ENS Montrouge – 1 rue Maurice Arnoux, 92120 Montrouge
Quotité de travail : 100% = 37h30 / semaine
Poste ouvert uniquement aux contractuels
Rémunération : selon grille et expérience (Salaire brut minimum : 2400 €/mois)
L'ENS-PSL est un établissement handi-accueillant et attaché à la mixité et à la diversité.
Ces offres pourraient vous intéresser
-

Technicien régulateur plateforme technique F/H
2025-11-28 12:18:56 - Paris
-

Ingénieur déploiement et administration d'applications
2025-09-25 10:30:26 - Paris
-

Ingénieur pour l'enseignement numérique F/H
2025-11-14 12:30:11 - Paris
Recevoir des offres d'emploi similaires par email
Domaine/Métier :
Intégrateur d’applications
Localité :
Paris