KJ 東アジア+

「匿名コメント募集中」

Metaが公開した「SeamlessM4T」が音声の文字起こしや翻訳、吹き替えを一括で行うマルチモーダルAIモデル

  • MetaがAI「SeamlessM4T」を公開
  • SeamlessM4Tは音声入力で「文字起こし」「別言語への翻訳」「別言語への吹き替え」を実行
  • 日本語音声にも対応し、35言語への出力をサポート
  • デモも公開されており、実際に使用して精度を試せる
  • SeamlessM4TはマルチモーダルなAIで、複数の操作を実行できる
  • デモでは文字起こし、翻訳、吹き替えの結果が出力される
  • SeamlessM4Tはローカルにインストールして使用することも可能

Metaが日本語音声を入力するだけで「文字起こし」「翻訳」「吹き替え」を実行できるAI「SeamlessM4T」を公開、英語や中国に翻訳可能で無料で使えるデモも公開されたので使ってみた

Image1Image2Image3Image4Image5Image6Image7Image8Image9Image10Image11Image12Image13Image14Image15
Metaが音声を入力するだけで「文字起こし」「別言語への翻訳」「別言語への吹き替え」を実行できるAI「SeamlessM4T」を2023年8月22日(火)に公開しました。SeamlessM4Tは日本語音声の入力にも対応しており、日本語・英語・中国語・フランス語などを含む35言語への出力をサポートしているとのこと。誰でも使えるデモも公開されていたので、実際にデモを使ってどれだけの精度で文字起こしや吹き替えを実行できるのか試してみました。続きを読む…
ソース:https://gigazine.net/news/20230823-meta-speech-translation-transcription-seamlessm4t/
  1. このSeamlessM4TというAIの機能は本当に素晴らしいと思います。今までのAIとは異なり、文字起こしや翻訳、吹き替えといった複数の操作を一つのモデルで実行できるのは驚きです。特に日本語音声の処理性能が高いことに感動しました。デモを試してみたところ、文字起こし結果も翻訳結果も非常に正確で、吹き替え音声もクリアに出力されていました。これは言語の壁を超えたコミュニケーションに大いに役立つでしょう。また、ローカルにインストールして使用することもできるとのことで、さらに便利さが増しています。Metaの取り組みにはいつも感心させられます。今後もこのような革新的な技術が進化し続けることを期待しています。

コメント