自動生成字幕
YouTube が音声認識で自動生成する字幕。多くの動画でデフォルトで利用可能だが精度は手動字幕より劣る。
自動生成字幕は YouTube の ASR (automatic speech recognition) によって作成されます。2023 年以降、日本語の精度も大幅に向上しましたが、専門用語・固有名詞・早口での認識精度は手動字幕より劣ります。SumTube のプロンプトは自動字幕の誤認識を想定したロバスト設計で、文脈から補正するよう調整しています。
YouTube が音声認識で自動生成する字幕。多くの動画でデフォルトで利用可能だが精度は手動字幕より劣る。
自動生成字幕は YouTube の ASR (automatic speech recognition) によって作成されます。2023 年以降、日本語の精度も大幅に向上しましたが、専門用語・固有名詞・早口での認識精度は手動字幕より劣ります。SumTube のプロンプトは自動字幕の誤認識を想定したロバスト設計で、文脈から補正するよう調整しています。