kittchy blog
ML エンジニアのkittchyが、日々の学びを共有します

最新の記事
技術、読書、日々の学びを共有しています
主な公開記事
みてねの大規模なメディアを自然言語検索できるようにしました
2026Zenn
億超えの写真・動画データを支える自然言語検索基盤とS3 Vectors導入の道のり
2026AWS connected comunity
Domain adaptation using non-parallel target domain corpus for self-supervised learning-based automatic speech recognition
2025SPEECH COMMUNICATION, Vol. 174, 103303
MIXI AI 新卒研修2025
2025MIXI Engineers
個人開発プロダクト
Japanese QuartzNet
ReazonSpeechデータセットで学習した日本語音声認識モデル。QuartzNetアーキテクチャをベースにしています。
ASR
PyTorch
NeMo
Hugging Faceで見る