こんにちは。

私はケナン・ゴンノです。

機械学習ジュニア MLOpsエンジニアジュニア

私についてもっと 私のポートフォリオ 私のテキスト生成 トピックモデリング テキスト要約

最終更新日:2024年10月14日

このページは翻訳中です。翻訳が正確でない可能性があります。
「GPT-4o」を使用して翻訳しました。

紹介

自己紹介します。

プロフィール写真

機械学習、コンピュータービジョン、データサイエンスに強い情熱を持つ若いAI工学の卒業生です。 先進的なAI技術を使用して革新的なプロジェクトに取り組み、複雑な問題を解決することに意欲的です。

プロフィール

若い卒業生。

  • 氏名: ケナン・アキラ・ゴンノ
  • 生年月日: 1999年4月28日
  • 職業: ジュニアデータサイエンティスト、
    MLOpsエンジニアジュニア
  • 言語: • フランス語(メイン) • 日本語(ネイティブ/初級) • 英語(TOEIC - 840点)
  • 国籍: • フランス • 日本
  • 所在地: 75018 - パリ フランス
  • ウェブサイト: kenan.gonnot.net
  • メール: kenan@gonnot.net
  • Me at work ;)

スキル

私は若くて熟練したデータサイエンティストであり、NLP、LLM、CNNモデルのトレーニングと最適化のバックグラウンドを持っています。 私の専門知識は、ハイパーパラメータの微調整を行い、モデルの性能を向上させることにあります。新しい視点と革新へのコミットメントを持ち、 データサイエンスの分野で大きな影響を与えることができる準備ができています。

    python
  • 60%
    Python
  • js
  • 30%
    Javascript
  • docker
  • 60%
    Docker
  • js
  • 35%
    Kubernetes
  • tensorflow
  • 25%
    Tensorflow
  • pytorch
  • 20%
    PyTorch
  • pandas
  • 25%
    Keras
  • kubeflow
  • 20%
    Kubeflow
履歴書

私の資格についてもっと詳しく。

データサイエンスの新卒として、実際の問題を解決するためにデータ分析と統計モデリング技術を専門的な文脈で適用する実践的な経験を積みました。

Experiences

MLエンジニア

フリーランス

2024年3月 - 現在

RAG - GPT-4とMistralを使用した検索強化生成

コンテキスト: 建設資材業界の小規模企業向けのソフトウェア開発プロジェクトを主導し、サプライヤーのPDFから製品データを抽出して包括的なExcelデータセットを生成する任務を遂行しました。

技術的専門知識: 検索強化生成(RAG)の使用により、ChatGPTやMistralなどの高度なLLMモデルを使用して、さまざまなPDF形式から複雑なデータを抽出し、正確に構造化されたExcelシートに変換しました。

使用したモデル:

GPT-4 | 3.5-turbo - 料金 - OpenAI

Mistral - 料金

ソフトウェアソリューション: "PDFToExcel"の開発、データの変換とデータセットの作成プロセスを合理化するためのオーダーメイドアプリケーションを設計し、企業のウェブサイトの改善に貢献しました。

アジャイル手法: アジャイルプラクティスを使用してManuquipチームと緊密に協力し、迅速な開発サイクル、継続的なフィードバック、進化するプロジェクト要件に効果的に対応するための反復的改善を促進しました。

結果: データ抽出と処理の効率を大幅に向上させ、企業の業務効率と顧客サービスを強化する高品質でユーザーフレンドリーなソフトウェアソリューションを成功裏に提供しました。

js js js js

LLM - 大規模言語モデル

プロジェクト

2023年 - 現在

抽象的テキスト要約

使用したモデル:

Transformer - Encoder-Decoderモデルを"XSum"データセットでスクラッチから最大200エポックまでトレーニング。ノートブック

Facebook/Llama-2-7bモデルのファインチューニングLudwigパッケージで実施(TransformersとLudwigの間の複数のエラーによりデプロイ失敗)ノートブック

Google/mT5モデルのファインチューニングをHuggingFaceパッケージで実施ノートブック | HuggingFace

トレーニング情報:
Transformer-Encoder-Decoder:
• 61,671,569 パラメータ
• データセット: "Xsum" 英語
• 200エポック
• 約16時間

Facebook/Llama-2-7b:
• 70億パラメータ
• データセット: "Xsum" 英語
• 5エポック
• 約20時間

Google/mT5-small:
• 約3億パラメータ
• データセット: "Xsum" 英語 & "MLsum" フランス語
• 10エポック
• 約22時間

• クラウドサービスの使用: https://vast.ai (NVIDIA GPU - 4090 RTX)


要約: "機械学習は、データにアクセスしてそれを使用して自ら学習することができるコンピュータプログラムの開発に焦点を当てた人工知能の一分野です。 ..."

js js js js js

Transformer GPT

project

2023

テキスト生成

• フランス語コーパス(10 GB)で最大255kエポックまでトレーニングしたTransformer-デコーダーモデル。Notebook

• ハイパーパラメータの最適化、コーパスのクリーニング...

• クラウドサービスの使用: https://vast.ai (NVIDIA GPU)

• いくつかのモデルの実装: 文字単位のトークナイザー(10Mパラメータ)およびtiktoken(50Mおよび119Mパラメータ)

Text generated: " Sous un soleil, les magasins de fer français débordent d'une multitude de fleurs mais sans encombre, "la France nourrit une résistance passive à plusieurs tirs d'explosifs". ... "

js js js

インターン データサイエンティスト ジュニア - MLエンジニア

卒業研究インターンシップ

2022年7月 - 2022年12月

6ヶ月

inagua.ch

教育用チャットボットWebアプリケーション

• 教育用チャットボットWebアプリケーションの開発(Angular Ng)。

• Wikipedia(Wikidata)の任意のトピックからのMCQの生成。

• トピックモデリングを使用して、テキスト内で最も関連性の高いトピックを強調。

• 抽出的および抽象的なテキスト要約。

• spaCy、Transformer-HuggingFace、Bertモデルライブラリの使用。

• Heroku、次にGCPへのデプロイ。Kubernetes、Dockerの使用。

• Kubeflowを使用したMLパイプラインのプロトタイピング。

js js js js js js js js

学生

卒業プロジェクト

2021年 - 2022年

CNN - 掌静脈認証

• 掌静脈を通じてユーザーの身元を認識するためのCNNニューラルネットワーク(ResNet、Xceptionなど)の開発。

• Flask、Docker、Kerasを使用したモデルのデプロイ。

js js js js js

認定証

MLOpsエンジニア

coursera.org | DeepLearning.ai

2023年7月 - 現在

4ヶ月

Specialization Machine Learning Engineering for Production (MLOps)

学んだこと:

• プロジェクトのスコーピング、データのニーズ、モデリング戦略、デプロイメント要件など、エンドツーエンドのMLプロダクションシステムの設計
• モデルのベースラインを確立し、コンセプトドリフトに対処し、プロダクション化されたMLアプリケーションを開発、デプロイ、および継続的に改善する方法をプロトタイプ化
• データセットの収集、クリーニング、および検証によるデータパイプラインの構築
• TensorFlow Extendedを使用した特徴エンジニアリング、変換、および選択の実装
• データ系譜および出所メタデータツールを活用してデータライフサイクルを確立し、エンタープライズデータスキーマを使用してデータの進化を追跡
• モデリングリソースを管理し、オフライン/オンライン推論リクエストに最適に対応するための技術の適用
• モデルの公平性、説明可能性の問題に対処し、ボトルネックを緩和するための分析の使用
• 異なるインフラストラクチャを必要とするモデルサービングのためのデプロイメントパイプラインの提供
• 継続的に稼働するプロダクションシステムを維持するためのベストプラクティスおよびプログレッシブデリバリーテクニックの適用

ディープラーニング

coursera.org | DeepLearning.AI & スタンフォードオンライン

2021年 | 6ヶ月

Specialization deep learning (5 modules) And Machine Learning Introduction

学んだこと:
• ディープニューラルネットワークの構築とトレーニング、主要なアーキテクチャパラメータの特定、ベクトル化ニューラルネットワークの実装およびアプリケーションへのディープラーニングの適用
• トレインテストセットの作成、DLアプリケーションの分散分析、標準的な手法と最適化アルゴリズムの使用、およびTensorFlowでのニューラルネットワークの構築
• CNNの構築と検出および認識タスクへの適用、ニューラルスタイル転送を使用したアートの生成、および画像およびビデオデータへのアルゴリズムの適用
• RNNの構築とトレーニング、NLPおよび単語埋め込みの使用、HuggingFaceトークナイザーとトランスフォーマーモデルを使用してNERおよび質問応答を実行

Education

修士号

人工知能専攻

2023年卒業

Engineering school - ESME - esme.fr

私は、3年間の一般工学教育でしっかりとした基礎を身につけ、その後、人工知能の専門分野で2年間の専門教育を受けました。この進化し続ける分野での知識を深めました。私のバックグラウンドは、堅実な技術専門知識と人工知能の主要概念の深い理解を発展させることを可能にしました。

留学

2020年9月 - 2021年4月

Institute of technology Sligo (IRELAND)

Programmation Control and Instrumentation.

Highschool Jacques Decour

2017

Highschool - BAC S - Maths specifications

ポートフォリオ

私の作品をご覧ください。

私は、先進的なテキスト生成から視覚ベースの身元認識に至るまで、エキサイティングな人工知能プロジェクトに取り組んできました。自然言語処理やコンピュータビジョンなどの技術を使用して、複雑な問題を解決し、革新的なソリューションを提供しています。

サービス

私に何ができますか?

ディープラーニングとMLOpsを専門とする新卒のジュニアデータサイエンティストとして、高性能なディープラーニングモデルの開発や、これらのモデルが運用環境で効率的に生産および維持されるようにするためのMLOpsパイプラインの設定に貢献できます。

7

数十億パラメータ - 最大のトレーニングモデル

4

日数 - 最長のトレーニング

10

GB - 最大のトレーニングデータ

4

AIプロジェクト

10

認定証の数

255000

最長エポック
お問い合わせ

あなたからの連絡をお待ちしています。

あなたからの連絡を楽しみにしており、データサイエンスのスキルと専門知識があなたのプロジェクトにどのように貢献し、意味のある洞察と解決策を生み出すかを議論したいと思います。

私を見つける場所

Paris
île-de-france
75018 - FR

私にメールしてください

kenan@gonnot.net

Call Me At

Phone: (+33) 6 ** ** ** **