機械学習、コンピュータービジョン、データサイエンスに強い情熱を持つ若いAI工学の卒業生です。 先進的なAI技術を使用して革新的なプロジェクトに取り組み、複雑な問題を解決することに意欲的です。
若い卒業生。
私は若くて熟練したデータサイエンティストであり、NLP、LLM、CNNモデルのトレーニングと最適化のバックグラウンドを持っています。 私の専門知識は、ハイパーパラメータの微調整を行い、モデルの性能を向上させることにあります。新しい視点と革新へのコミットメントを持ち、 データサイエンスの分野で大きな影響を与えることができる準備ができています。
データサイエンスの新卒として、実際の問題を解決するためにデータ分析と統計モデリング技術を専門的な文脈で適用する実践的な経験を積みました。
フリーランス
2024年3月 - 現在
• コンテキスト: 建設資材業界の小規模企業向けのソフトウェア開発プロジェクトを主導し、サプライヤーのPDFから製品データを抽出して包括的なExcelデータセットを生成する任務を遂行しました。
• 技術的専門知識: 検索強化生成(RAG)の使用により、ChatGPTやMistralなどの高度なLLMモデルを使用して、さまざまなPDF形式から複雑なデータを抽出し、正確に構造化されたExcelシートに変換しました。
• GPT-4 | 3.5-turbo - 料金 - OpenAI
• Mistral - 料金
• ソフトウェアソリューション: "PDFToExcel"の開発、データの変換とデータセットの作成プロセスを合理化するためのオーダーメイドアプリケーションを設計し、企業のウェブサイトの改善に貢献しました。
• アジャイル手法: アジャイルプラクティスを使用してManuquipチームと緊密に協力し、迅速な開発サイクル、継続的なフィードバック、進化するプロジェクト要件に効果的に対応するための反復的改善を促進しました。
• 結果: データ抽出と処理の効率を大幅に向上させ、企業の業務効率と顧客サービスを強化する高品質でユーザーフレンドリーなソフトウェアソリューションを成功裏に提供しました。
プロジェクト
2023年 - 現在
• Transformer - Encoder-Decoderモデルを"XSum"データセットでスクラッチから最大200エポックまでトレーニング。ノートブック
• Facebook/Llama-2-7bモデルのファインチューニングをLudwigパッケージで実施(TransformersとLudwigの間の複数のエラーによりデプロイ失敗)。ノートブック
• Google/mT5モデルのファインチューニングをHuggingFaceパッケージで実施ノートブック | HuggingFace
• クラウドサービスの使用: https://vast.ai (NVIDIA GPU - 4090 RTX)
要約: "機械学習は、データにアクセスしてそれを使用して自ら学習することができるコンピュータプログラムの開発に焦点を当てた人工知能の一分野です。 ..."
project
2023
• フランス語コーパス(10 GB)で最大255kエポックまでトレーニングしたTransformer-デコーダーモデル。Notebook
• ハイパーパラメータの最適化、コーパスのクリーニング...
• クラウドサービスの使用: https://vast.ai (NVIDIA GPU)
• いくつかのモデルの実装: 文字単位のトークナイザー(10Mパラメータ)およびtiktoken(50Mおよび119Mパラメータ)
Text generated: " Sous un soleil, les magasins de fer français débordent d'une multitude de fleurs mais sans encombre, "la France nourrit une résistance passive à plusieurs tirs d'explosifs". ... "
卒業研究インターンシップ
2022年7月 - 2022年12月
6ヶ月
inagua.ch
• 教育用チャットボットWebアプリケーションの開発(Angular Ng)。
• Wikipedia(Wikidata)の任意のトピックからのMCQの生成。
• トピックモデリングを使用して、テキスト内で最も関連性の高いトピックを強調。
• 抽出的および抽象的なテキスト要約。
• spaCy、Transformer-HuggingFace、Bertモデルライブラリの使用。
• Heroku、次にGCPへのデプロイ。Kubernetes、Dockerの使用。
• Kubeflowを使用したMLパイプラインのプロトタイピング。
卒業プロジェクト
2021年 - 2022年
• 掌静脈を通じてユーザーの身元を認識するためのCNNニューラルネットワーク(ResNet、Xceptionなど)の開発。
• Flask、Docker、Kerasを使用したモデルのデプロイ。
学んだこと:
• プロジェクトのスコーピング、データのニーズ、モデリング戦略、デプロイメント要件など、エンドツーエンドのMLプロダクションシステムの設計
• モデルのベースラインを確立し、コンセプトドリフトに対処し、プロダクション化されたMLアプリケーションを開発、デプロイ、および継続的に改善する方法をプロトタイプ化
• データセットの収集、クリーニング、および検証によるデータパイプラインの構築
• TensorFlow Extendedを使用した特徴エンジニアリング、変換、および選択の実装
• データ系譜および出所メタデータツールを活用してデータライフサイクルを確立し、エンタープライズデータスキーマを使用してデータの進化を追跡
• モデリングリソースを管理し、オフライン/オンライン推論リクエストに最適に対応するための技術の適用
• モデルの公平性、説明可能性の問題に対処し、ボトルネックを緩和するための分析の使用
• 異なるインフラストラクチャを必要とするモデルサービングのためのデプロイメントパイプラインの提供
• 継続的に稼働するプロダクションシステムを維持するためのベストプラクティスおよびプログレッシブデリバリーテクニックの適用
学んだこと:
• ディープニューラルネットワークの構築とトレーニング、主要なアーキテクチャパラメータの特定、ベクトル化ニューラルネットワークの実装およびアプリケーションへのディープラーニングの適用
• トレインテストセットの作成、DLアプリケーションの分散分析、標準的な手法と最適化アルゴリズムの使用、およびTensorFlowでのニューラルネットワークの構築
• CNNの構築と検出および認識タスクへの適用、ニューラルスタイル転送を使用したアートの生成、および画像およびビデオデータへのアルゴリズムの適用
• RNNの構築とトレーニング、NLPおよび単語埋め込みの使用、HuggingFaceトークナイザーとトランスフォーマーモデルを使用してNERおよび質問応答を実行
人工知能専攻
2023年卒業
私は、3年間の一般工学教育でしっかりとした基礎を身につけ、その後、人工知能の専門分野で2年間の専門教育を受けました。この進化し続ける分野での知識を深めました。私のバックグラウンドは、堅実な技術専門知識と人工知能の主要概念の深い理解を発展させることを可能にしました。
2020年9月 - 2021年4月
Programmation Control and Instrumentation.
2017
私は、先進的なテキスト生成から視覚ベースの身元認識に至るまで、エキサイティングな人工知能プロジェクトに取り組んできました。自然言語処理やコンピュータビジョンなどの技術を使用して、複雑な問題を解決し、革新的なソリューションを提供しています。
ディープラーニングとMLOpsを専門とする新卒のジュニアデータサイエンティストとして、高性能なディープラーニングモデルの開発や、これらのモデルが運用環境で効率的に生産および維持されるようにするためのMLOpsパイプラインの設定に貢献できます。
機械学習を専門とする新卒として、機械学習技術を使用して複雑な問題を解決するケーススタディに積極的に参加し、特定のビジネスニーズに合わせたモデルとソリューションを提案することができます。 私のスキルを実践に生かし、機械学習を使用した実際のプロジェクトに貢献したいと考えています。
NLPスキルのおかげで、テキスト分類、特徴抽出、テキスト生成などの高度な自然言語処理モデルを開発し、テキストデータから貴重な情報を抽出してさまざまな分野で効果的なソリューションを提供することができます。 私は、NLPの力を活用して現実世界の問題を解決し、人間とコンピュータの相互作用を改善することに情熱を注いでいます。
畳み込みニューラルネットワーク(CNN)のスキルのおかげで、物体検出、画像分類、セマンティックセグメンテーションなどのタスクを実行し、有意義な視覚情報を抽出して、画像解析および視覚認識の分野で正確なソリューションを提供するための高性能モデルアーキテクチャを開発する能力があります。 私は、複雑な問題を解決し、コンピュータビジョンの境界を押し広げるためにCNNを使用することに情熱を注いでいます。
MLOpsの(少しの)スキルのおかげで、機械学習パイプラインを設定し、モデルのデプロイを自動化し、パフォーマンスを監視し、プロダクションシステムの安定性を保証することで、機械学習を運用ワークフローにスムーズに統合することができます。 私は、モデルデプロイプロセスを継続的に改善し、機械学習プロジェクトのライフサイクルをサポートするためのスケーラブルで信頼性のある環境を作成することに情熱を注いでいます。
Pythonの深いスキルのおかげで、最も人気のあるライブラリやフレームワークを使用して、データ分析、機械学習、アプリケーション開発に関連する複雑な問題を解決し、タスクを自動化するための堅牢で効率的なソリューションを開発することができます。 私は、Pythonのシンプルさ、読みやすさ、そしてパワーに情熱を注いでおり、幅広い分野で高品質なソリューションを提供することができます。
あなたからの連絡を楽しみにしており、データサイエンスのスキルと専門知識があなたのプロジェクトにどのように貢献し、意味のある洞察と解決策を生み出すかを議論したいと思います。
Paris
île-de-france
75018 - FR
kenan@gonnot.net
Phone: (+33) 6 ** ** ** **