Résumé du poste :
L'ingénieur senior en apprentissage automatique construit des modèles d'apprentissage automatique, en particulier NLP et LLM, et exécute de grands modèles NLP/LLM sur un environnement en nuage à l'échelle. Ce rôle est essentiel dans l'apprentissage expérimenté, l'avancement des compétences en apprentissage automatique et le partage des connaissances avec les autres. En tant que membre senior de l'équipe, l'ingénieur ML senior travaille bien individuellement et en équipe. Vous êtes passionné par l'apprentissage automatique et aimez rechercher des techniques de pointe en NLP et LLM et les appliquer au domaine de l'éducation. Vous avez l'esprit d'initiative et suivez vos tâches tout en communiquant avec vos pairs sur l'état d'avancement. Le Senior Machine Learning Engineer applique directement ses connaissances et compétences en ML pour avoir un impact direct sur l'amélioration des expériences d'apprentissage des étudiants. Vous avez le courage de remettre en question l'état actuel et de proposer des idées novatrices. Excellent communicateur, l'ingénieur senior en apprentissage automatique travaille avec des équipes interfonctionnelles.
Détails de l'emploi :
- Travail à domicile
- Du lundi au vendredi, de 9 heures à 18 heures (MST)
- De 12 heures à 9 heures (heure des Philippines)
Responsabilités :
- Travailler en étroite collaboration avec le responsable de l'EML pour définir les initiatives, les feuilles de route et les stratégies en matière de NLP.
- Collaborer avec l'équipe produit et les parties prenantes du projet afin de convertir les exigences commerciales en capacités NLP requises.
- Développer, déployer et optimiser des modèles LLM de pointe pour diverses applications NLP.
- Utilise des techniques NLP/LLM pour découvrir des informations précieuses à partir de sources de données non structurées telles que des transcriptions d'appels, des courriels, des notes de mentor, etc.
- Utilise l'IA générative pour créer une expérience d'apprentissage de nouvelle génération.
- Exécuter l'ensemble du cycle de développement du ML, y compris la recherche de modèles, le traitement des données, l'entraînement et l'affinement des modèles, l'expérimentation et l'évaluation des modèles, l'amélioration des modèles, ainsi que le déploiement des modèles.
- Collaborer avec l'équipe d'ingénieurs de données pour développer et mettre en œuvre le pipeline de traitement des données afin d'assurer une entrée de haute qualité pour l'entraînement et l'inférence des modèles.
- Collaborer avec l'équipe MLOps pour déployer des modèles de ML dans l'environnement de production, en assurant l'évolutivité, la fiabilité et la performance.
- Collabore avec les équipes chargées des logiciels, de l'infrastructure et de la sécurité pour intégrer les solutions de ML de manière transparente dans l'écosystème.
- Se tenir au courant des technologies de pointe en matière de LLM, de NLP et de Deep Learning, et les appliquer de manière proactive à des cas d'utilisation pour stimuler l'innovation.
- Collabore avec d'autres membres de l'équipe pour créer des normes et des lignes directrices pour le ML.
- Respecter la méthode Agile, les meilleures pratiques de ML et les processus de l'entreprise.
- Communiquer l'état d'avancement et les mises à jour à la direction, aux membres de l'équipe et aux autres équipes.
- Encadrer et guider les membres juniors de l'équipe.
- Étudie les tendances et les besoins en matière de modèles de ML.
- Effectue d'autres tâches connexes qui lui sont confiées.
Connaissances, compétences et aptitudes :
- Expérience de l'exploitation de logiciels/infrastructures distribués à haute disponibilité, tolérants aux pannes, évolutifs et en production, en utilisant les pratiques GitOps (Terraform de préférence).
- Expérience des cadres MLOps existants (Databricks, Seldon, Sagemaker, DVC, etc.).
- Solide expérience en programmation Scala (Java), Go ou Python.
- Expérience substantielle de l'exploitation d'une infrastructure big data dans un écosystème basé sur le cloud (AWS de préférence).
- Solide compréhension de la gestion du trafic et des concepts de réseau.
- Expérience des systèmes de traitement de flux (ksqlDB, Spark Streaming, Apache Beam/Flink, etc.).
- Expérience des méthodologies standard d'ingénierie logicielle (tests unitaires, revues de code, documents de conception, livraison continue).
- Développer et déployer des services, des SDK et une infrastructure de données de niveau production en mettant l'accent sur la performance, l'évolutivité et le libre-service.
- Capacité à conceptualiser et à formuler des idées de manière claire et concise.
- Expérience entrepreneuriale ou intrapreneuriale de la création d'un nouveau produit et d'une nouvelle organisation.
Qualifications professionnelles :
Qualifications minimales :
- Diplôme de maîtrise ou plus en informatique, génie logiciel, science des données, apprentissage automatique/apprentissage profond, mathématiques, physique ou tout autre domaine connexe.
- Plus de 5 ans d'expérience dans le développement de logiciels dans un environnement en nuage.
- Vous avez plus de 3 ans d'expérience dans la construction de modèles d'apprentissage automatique ou d'apprentissage profond à grande échelle, en réalisant l'ensemble du cycle de vie du développement de l'apprentissage automatique, du POC à la mise en production.
- Compréhension approfondie des concepts NLP et LLM, y compris la modélisation du langage, la classification des textes, l'analyse des sentiments, les token embeddings, etc.
- Compétences en programmation telles que Python, R, SQL, etc.
- Expérience pratique avec un ou plusieurs frameworks d'apprentissage profond comme PyTorch, TensorFlow, Hugging Face, etc.
- Expérience des principales plateformes de cloud et de données telles que AWS, Azure, Sagemaker, Databricks, etc.
- Expérience de l'ETL des données, de l'ingénierie des fonctionnalités et des techniques de visualisation.
- Expérience des outils de ML open-source et des API telles que MLFlow, Streamlit, etc.
- Excellentes capacités de résolution de problèmes pour analyser des données et des exigences complexes en vue de trouver des solutions pratiques.
- Excellentes capacités de réflexion créative pour trouver de nouvelles solutions et approches.
- Solides capacités de communication et de collaboration, aptitude à travailler en toute transparence avec les parties prenantes de l'entreprise et les équipes interfonctionnelles.
- Être à l'aise dans un environnement de travail rapide, hautement collaboratif et dynamique.
Qualifications préférées :
- Doctorat de préférence.
- Expérience avec Databricks de préférence.
- Expérience de la plateforme AWS de préférence.