Data scientist spécialisé en développement logiciel et NLP F/H

Détail de l'offre

Informations générales

Entité de rattachement du publieur

L'Assistance publique-Hôpitaux de Paris (AP-HP) est un centre hospitalier universitaire à dimension européenne mondialement reconnu.
Ses 38 hôpitaux accueillent chaque année 10 millions de personnes malades : en consultation, en urgence, lors d'hospitalisations programmées ou en hospitalisation à domicile.
Elle assure un service public de santé pour tous, 24h/24, et c'est pour elle à la fois un devoir et une fierté.
L'AP-HP est le premier employeur d'Ile-de-France : 100 000 personnes – médecins, chercheurs, paramédicaux, personnels administratifs et ouvriers – y travaillent.

Au cœur de l'Institution, le Siège de l'AP-HP rassemble sous un même périmètre les directions fonctionnelles et les établissements qui lui sont rattachés :
CFDC (Centres de Formation et de Développement des Compétences), ACHAT (Achat Centraux Hôteliers Alimentaires et Techniques),
DRCI (Département de la Recherche Clinique et de l'Innovation) et DSN (Direction des Services numériques).
Avec ses 4000 collaborateurs, le Siège assure un rôle d'expert, de pilote et de coordinateur pour l'ensemble des hôpitaux.

Engagée dans des projets novateurs et stratégiques au service des patients, l'AP-HP recherche aujourd'hui de nouveaux talents pour mener à bien sa mission.
Vous êtes l'un d'eux ? Venez nous rejoindre !
  

Date de parution

18/04/2025

Description du poste

Métier

Coordination et administration paramédicale - Gestion médico-administrative, traitement - analyse de l'information médicale

Intitulé du poste

Data scientist spécialisé en développement logiciel et NLP F/H

Type de contrat

Titulaire ou CDD

Rémunération

46 000 - 72 000, selon profil

Télétravail

Oui

Présentation du service

L’AP-HP est un centre hospitalier universitaire CHU, qui s’organise en 6 GHU et 38 hôpitaux, traitant 8 millions de patients annuellement dans divers domaines médicaux. En tant que premier employeur d’Île-de-France, elle compte près de 100 000 professionnels. Elle assure un service de santé public 24/24. Pour en savoir plus : http://www.aphp.fr


 


La Direction des Services Numériques (DSN) de l’AP-HP fournit des services numériques sécurisés aux professionnels et patients. Elle développe et gère plusieurs centaines de solutions, dont le dossier patient, la biologie, l’imagerie, l’espace patient et la gestion hospitalière, sur 70 000 postes. Elle administre ses infrastructures (réseau, data centers, téléphonie, wifi) et favorise la réutilisation des données de santé. Avec plus de 500 professionnels et un budget annuel de 204 M€, elle pilote 300 projets et recrute 100 professionnels par an.


 


L’équipe science des données a pour objectif de faciliter l’analyse de l’EDS, qui contient les données médicales de plus de 11 millions de patients (40 millions de dossiers médicaux, plus de 30 millions de diagnostics, 300 millions de résultats de laboratoires). L’équipe développe des bibliothèques scientifiques et des algorithmes afin de faciliter l’exploitation des données à des fins de recherche, de constituer l’EDS (pseudonymisation, pipeline d’extraction), d’améliorer les données (enrichissement) ou pour répondre à des problématiques spécifiques. 

Vos missions

Nous cherchons un.e Data Scientist pour rejoindre l’équipe Sciences des Données. Vous développerez, validerez et maintiendrez des algorithmes et bibliothèques logicielles facilitant l’usage de données du système clinique pour la recherche et le pilotage. Vous vous concentrerez sur le traitement automatique du langage pour transformer les données textuelles de l’EDS en données structurées. Vous participerez au projet national « PARTAGES » pour développer un LLM médical français et le valider sur des cas d’usages spécifiques. Vos développements seront diffusés au sein de la communauté de recherche de l’AP-HP. Vous contribuerez à des articles scientifiques valorisant ces travaux. Vous serez aussi impliqué.e dans des recherches et analyses de données, en collaboration avec des experts métier de divers domaines (oncologie, diabète, psychiatrie,..).


 


Des objectifs annuels seront définis avec le responsable hiérarchique.


 


Missions principales :


- Développement et maintien de l’expertise en traitement des données de l’EDS


- Consolidation de l’expression de besoin « traitement automatique du langage » avec les équipes de recherche et de pilotage de l’EDS


- Implication dans le projet PARTAGES


- Développement de bibliothèques Python pour l’analyse des données de l’EDS


- Développement de modèles de machine learning pour pré-traiter les données


- Rédaction de documentation technique et utilisateur


- Développement de partenariats académiques


- Contribution à l’écriture d’articles scientifiques


 


Missions ponctuelles :


- Support utilisateur


- Formation au traitement automatique du langage


- Conseil interne

Profil recherché

Diplôme : Diplômé(e) d'ingénieur avec spécialisation en traitement de données massives
Expérience : 3 à 5 ans, idéalement dans le secteur de la santé

Compétences Clés :
- Expertise en analyse de bases de données (SQL) ;
- Expertise en développement de modèles de machine learning (Tensorflow, Pytorch etc.) ;
- Expertise en calcul distribué et en data management (Spark, etc.) ;
- Expertise en traitement automatiques des langues (NLP) ;
- Expertise en développement Python/R ;
- Expertise en déploiement de modèles statistiques/de machine learning ;

Prérequis :
- Connaissance des problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé (dont la recherche sur données et la recherche clinique) ;
- Capacité à lire la littérature scientifique et à contribuer à des articles scientifiques ;
- Connaissance des méthodes épidémiologiques ;
- Connaissance des standards d'interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, Snomed, LOINC…)
- Connaissance du RGPD et de la réglementation liée à la recherche sur données et la recherche clinique

Savoir-faire et savoir être :
- Esprit d'équipe et fort sens du relationnel
- Autonomie, rigueur, méthode
- Excellentes aptitudes relationnelles et à la communication, capacité d'écoute et de vulgarisation, capacité de formation (Aisance à l'oral, diplomatie)
- Capacité de travail importante, associée à un fort dynamisme.
- Curiosité et capacité d'adaptation et d'anticipation
- Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé

Horaires de travail

Forfait jours 25 jours de congés et 19 jours de RTT

Les avantages de l'AP-HP

Vos avantages à l'AP-HP

Possibilité de télétravail ;


Remboursement partiel des transports en commun (75%) et/ou forfait mobilité ; 


Accès au restaurant du personnel à tarifs avantageux ; 


Un centre formation et de développement des compétences interne pour les formations management, les renforcement Métiers… ;


19 jours de RTT, en plus des 25 jours de congés ; 


Une offre de sorties culturelles, de voyages, de centres de vacances pour les titulaires et CDD sur poste permanent (AGOSPAP), des réductions et des bons plans (HOPTISOINS) ; 


Pour les enfants, crèches internes, voyages culturels, séjours linguistiques et possibilité de bénéficier du supplément familial de traitement.

Localisation du poste

Localisation du poste

France, Ile-de-France, Paris (75)

Ville

Paris 12

Hôpital et/ou site

Direction des Services Numériques