kittchy blog
ML エンジニアのkittchyが、日々の学びを共有します

最新の記事
技術、読書、日々の学びを共有しています
主な公開記事
Domain adaptation using non-parallel target domain corpus for self-supervised learning-based automatic speech recognition
2025SPEECH COMMUNICATION, Vol. 174, 103303
MIXI AI 新卒研修2025
2025MIXI Engineers
多言語SSLモデルに基づく音声認識の大規模音声データのみを用いたドメイン適応
2024日本音響学会春季研究発表会, 1-2-2
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応
2024SPEASIPワークショップ2024
個人開発プロダクト
Japanese QuartzNet
ReazonSpeechデータセットで学習した日本語音声認識モデル。QuartzNetアーキテクチャをベースにしています。
ASR
PyTorch
NeMo
Hugging Faceで見る