音声合成エンジンでONNX バックエンドで軽量化を図っているPiperとBalacoonを比較調査すると、Piper は “fast, local neural TTS” として設計されており、小型デバイス (ラズパイ) 向けに最適化されていること、コミュニティでも “オフライン TTS で Piper が最良” という声が複数あること、Balacoon も ONNX バックエンドで軽量化を図っているが処理速度と音質においてトレードオフが指摘されていること、Balacoonでの日本語 ONNX モデルが見つからないこと、以上より軽量さとレスポンスから Piperへのアプローチをする。
piper-tts-plusのinstallをトライしたが、error: externally-managed-environment のエラーが発生し Python 環境へのグローバルなパッケージインストールが制限されたこと、依存関係の競合エラーが発生したこと、より多くの容量が必要になる傾向を示したこと、以上よONNXモデルへのトライは次の機会とする。
※ONNX(Open Neural Network Exchange)とは、機械学習/ディープラーニングモデルを共通の形式(ファイルフォーマット)で表現するためのオープンスタンダードで、学習済みモデルで推論する用途に使われる。
