Bonjour

Je suis Kenan GONNOT.

Data scientist junior MLOps engineer junior

À propos de moi Mes projets Ma Génération de texte Modélisation de sujet Résumé de texte

Dernière mise à jour : 14-10-2024

À propos de moi

Je me présente

Profile Picture

Jeune diplômé en ingénierie de l'IA avec une forte passion pour l'apprentissage automatique, la vision par ordinateur et la science des données. Motivé pour travailler sur des projets innovants et résoudre des problèmes complexes en utilisant des techniques d'IA avancées.

Profil

Jeune diplômé.

  • Mon nom: Kenan Akira GONNOT
  • Date de naissance: 28 avril 1999
  • Travail: Data scientist junior,
    MLOps engineer junior
  • Langages: • Français (Principal) • Japonais (Natif/Débutant) • Anglais (TOEIC - 840pts)
  • Localisation: 75018 - PARIS FRANCE
  • Site web: kenan.gonnot.net
  • Email: kenan@gonnot.net
  • Me at work ;)

Compétences

Je suis un jeune data scientist avec une expérience dans la formation et l'optimisation des modèles NLP, LLM et des modèles CNN. Mon expertise réside dans le réglage fin des hyperparamètres afin d'obtenir une meilleure performance du modèle. Avec une perspective nouvelle et un engagement pour l'innovation, je suis prêt à avoir un impact significatif dans le domaine de la science des données.

    python
  • 60%
    Python
  • js
  • 30%
    Javascript
  • docker
  • 60%
    Docker
  • js
  • 35%
    Kubernetes
  • tensorflow
  • 25%
    Tensorflow
  • pytorch
  • 20%
    PyTorch
  • pandas
  • 25%
    Keras
  • kubeflow
  • 20%
    Kubeflow
Mon parcours

Plus d'informations sur mes références.

En tant que jeune diplômé en science des données, j'ai acquis une expérience pratique en appliquant des techniques d'analyse de données et de modélisation statistique pour résoudre des problèmes réels. d'analyse de données et de modélisation statistique pour résoudre des problèmes réels dans un contexte professionnel.

Expériences

Transformer - Encoder Decoder

Projet

2023 - présent

Résumés de textes abstraits

Modèles:

Transformateur - Modèle encodeur-décodeur entraînement jusqu'à 200 époques sur le jeu de données "XSum". à partir de zéro. Notebook

Fine-Tuning du modèle Facebook/Llama-2-7b avec la librairie Ludwig (Échec du déploiement en raison d'erreurs multiples dans les paquets entre Transformers et Ludwig). Notebook

Fine-Tuning du modèle Google/mT5 model avec la librarie HuggingFace Notebook | HuggingFace

Training information:
Transformer-Encoder-Decoder:
• 61 671 569 paramètres
• Dataset: "Xsum" Anglais
• 200 epochs
• ~16 heures

Facebook/Llama-2-7b:
• 7 Milliards de paramètres
• Dataset: "Xsum" Anglais
• 5 epochs
• ~20 heures

Google/mT5-small:
• ~300 Million paramètres
• Dataset: "Xsum" Anglais & "MLsum" Français
• 10 epochs
• ~22 heures

• Utilisation d'un service cloud: https://vast.ai (NVIDIA GPU - 4090 RTX)


Summary: " machine learning is a branch of artificial intelligence that focuses on the development of computer programs that can access data and use it to learn for themselves. ... "

js js js js js

Transformer GPT

projet

2023

Génération de texte

• Entraînement du modèle transformateur-décodeur jusqu'à 255k époques sur un corpus français (10 GB)

• Optimisation des hyper-parameters, nettoyage du corpus...

• Utilisation d'un service cloud: https://vast.ai (NVIDIA GPU)

• Mise en œuvre de plusieurs modèles : tokenizer par caractère (10M paramètres) et tiktoken (50M et 119M paramètres)

Text généré: " Sous un soleil, les magasins de fer français débordent d'une multitude de fleurs mais sans encombre, "la France nourrit une résistance passive à plusieurs tirs d'explosifs". ... "

js js js

Stage Data scientist junior - ML engineer

Stage de fin d'études

Juillet 2022 - Décembre 2022

6 mois

inagua.ch

Application web de chatbot éducatif

• Développement d'une application web de chatbot éducatif (Angular Ng).

• Génération de QCM à partir de n'importe quel sujet sur Wikipedia (Wikidata).

• "La modélisation thématique permet de mettre en évidence les sujets les plus pertinents d'un texte.

• Résumés extractifs et abstraits de textes.

• Utilisation de spaCy, Transformer-HuggingFace et Bert modèle.

• Déploiement sur Heroku, puis GCP. Utilisation de Kubernetes, Docker.

• Prototypage de pipeline ML avec Kubeflow.

js js js js js js js js

Étudiant

Projet de fin d'études

2021 - 2022

CNN - reconnaissance des veines palmaires

• Développement d'un réseau de neurones CNN (ResNet, Xception...) pour reconnaître l'identité de l'utilisateur à travers les veines de la paume de la main.

• Déploiement du modèle avec Flask, Docker et Keras.

js js js js js

Certificats

MLOps engineer

coursera.org | DeepLearning.ai

Juillet 2023 - Présent

4 mois

Specialization Machine Learning Engineering for Production (MLOps)

Ce que j'ai appris:

• Concevoir un système de production de ML de bout en bout : cadrage du projet, besoins en données, stratégies de modélisation et exigences de déploiement. stratégies de modélisation et exigences de déploiement
• Établir un modèle de base, traiter les dérives conceptuelles et prototyper comment développer, déployer et améliorer en permanence une application ML mise en production, et améliorer continuellement une application ML en production
• Construire des pipelines de données en rassemblant, en nettoyant et en validant les ensembles de données.
• Mettre en œuvre l'ingénierie, la transformation et la sélection des caractéristiques avec TensorFlow Extended
• Établir le cycle de vie des données en exploitant les outils de métadonnées de lignage et de provenance des données et suivre l'évolution des données avec les schémas de données de l'entreprise
• Appliquer des techniques pour gérer les ressources de modélisation et répondre au mieux aux demandes d'inférence hors ligne/en ligne.
• Utiliser l'analyse pour résoudre les problèmes d'équité et d'explicabilité des modèles et atténuer les goulets d'étranglement.
• Fournir des pipelines de déploiement pour la mise à disposition de modèles nécessitant des infrastructures différentes
• Appliquer les meilleures pratiques et les techniques de livraison progressive pour maintenir un système de production fonctionnant en continu.

Deep Learning

coursera.org | DeepLearning.AI & Stanford online

2021 | 6 mois

Specialization deep learning (5 modules) And Machine Learning Introduction

Ce que j'ai appris:
• Construire et entraîner des réseaux neuronaux profonds, identifier les paramètres clés de l'architecture, mettre en œuvre des réseaux neuronaux vectorisés et l'apprentissage profond dans les applications.
• Former des ensembles de tests, analyser la variance pour les applications DL, utiliser des techniques standard et des algorithmes d'optimisation, et construire des réseaux neuronaux dans TensorFlow.
• Construire un CNN et l'appliquer à des tâches de détection et de reconnaissance, utiliser le transfert de style neuronal pour générer de l'art, et appliquer des algorithmes à des données d'images et de vidéos.
• Construire et entraîner des RNN, travailler avec le NLP et les Word Embeddings, et utiliser les tokenizers et les modèles de transformation de HuggingFace pour effectuer du NER et de la réponse aux questions.

Formation

Master 2 | BAC +5

Majeure Intelligence Artificielle

Diplômé en 2023

Engineering school - ESME - esme.fr

J'ai suivi un parcours éducatif de cinq ans, comprenant trois années d'ingénierie générale pour acquérir une base solide, suivies de deux années de spécialisation en intelligence artificielle où j'ai approfondi mes connaissances dans ce domaine en constante évolution. Mon parcours m'a permis de développer une expertise technique solide ainsi qu'une compréhension approfondie des concepts clés de l'intelligence artificielle.

Étude à l'étranger

Septembre 2020 - Avril 2021

Institute of technology Sligo (IRELAND)

Programmation Control and Instrumentation.

Lycée Jacques Decour

2017

Lycée - BAC S - Maths specifications

Mes Projets/Portfolio

Découvrez quelques-uns de mes travaux.

J'ai travaillé sur des projets passionnants en intelligence artificielle, allant de la génération avancée de texte à la reconnaissance d'identité basée sur la vision, en utilisant des techniques telles que le traitement du langage naturel et la vision par ordinateur pour résoudre des problèmes complexes et proposer des solutions innovantes.

Services

Que puis-je faire pour vous?

En tant que jeune diplômé en tant que data scientist junior spécialisé en deep learning et MLOps, je peux contribuer en développant des modèles de deep learning haute performance et en mettant en place des pipelines MLOps pour garantir la production efficace et la maintenance de ces modèles dans un environnement opérationnel.

330

Millions param - Le plus grand modèle entraîné

4

Jours - L'entraînement la plus longue

10

Go - Les plus grandes données entraînées

4

Projets AI

10

Nombres de certificats

255000

Plus longues epochs
Contact

J'aimerais avoir de vos nouvelles.

J'aimerais beaucoup que vous me contactiez pour discuter de la manière dont mes compétences et mon expertise en science des données peuvent contribuer à vos projets et générer des idées et des solutions significatives.

Où me trouver

Paris
île-de-france
75018 - FR

Contactez-moi à

kenan@gonnot.net

Appelez-moi au

Phone: (+33) 6 ** ** ** **