多言語世界に向けたリアルタイム音声 AI の開発

@stevejang
英語2 日前 · 2026年6月30日
1.3M
108
24
5
39

TL;DR

日本語、韓国語、中国語市場向けに特化したリアルタイム音声 AI および翻訳モデルを開発する研究ラボである Kotoba が、Kindred Ventures 主導のもと 1,000 万ドルのシード資金を調達しました。

シリコンバレーや類似のグローバルハブにいる私たちの多くは、Voice AI が人々の働き方、コミュニケーションの取り方、エージェントや他者との関わり方における新たな中核的モダリティになりつつあることをよく認識しています。この変化は、エージェントシステムがコーディングを超えて、Perplexity Computer や Claude Cowork のような知識労働の新セクター、Wispr Flow、Sierra、Granola のような消費者向けアプリケーション、そして数多くの車、ロボット、ウェアラブルにおけるエージェントの具現化へと拡大するにつれて、顕著になっています。しかし、私たちの地域の枠を超えると、世界の最も重要な言語の多くが後回しにされており、これらの言語とその話者間の相互接続についてはほとんど進展がありません。

現在の集計によると、アジアには約 50 億人が住んでいます。東アジアだけでも 16 億人 — 世界人口の 20% を占めます。世界の知識労働者の約半数はアジア言語を話します。アジア言語向けに特別に訓練された新しい音声 AI モデルは、この世界的多数派がマルチモーダルインテリジェンスを真に利用できるようにするでしょう。

数百もの異なる言語があり、それぞれが独自の言語的ニュアンスとデータ特性を持っています。東アジア向けに構築するには、英語優先モデルをベースにするだけでは不十分です。グローバルファーストの知識労働の未来を築くには、モデルトレーニングと市場の専門知識に対するゼロからのアプローチが求められます。

少し視野を広げると、アジアのフロンティア研究の多くは中国を中心に行われており、特にオープンウェイトの大規模言語モデルや生成メディアで顕著です。日本と韓国では、ここ数年で新たな研究ラボの波が現れています。これらの研究チームは、Upstage や Sakana のような自国産の大規模言語モデルのバリエーションだけでなく、音声モデルや動画理解によるマルチモダリティ、そしてロボット知能や世界モデルによる物理 AI を開発する新しいラボにも注力しています。

本日、私たちは @KindredVenturesKotoba (@kotoba_tech) への 1000 万ドルのシードラウンドをリードし、Salesforce @SalesforceVC および Sony Ventures (@Sony_Innov_Fund) がそれに加わったことを発表できることを嬉しく思います。創業者たちとのトレーニングデータやモデルアーキテクチャに関する最初の会話で、私たちは彼らの最高品質の ASR および TTS モデル(様々なエージェントパイプラインに最適)だけでなく、オンデバイス推論向けの小型エッジモデルに関する研究の進捗、そして Google、Microsoft、OpenAI の翻訳モデルを上回る最先端の音声間リアルタイム翻訳モデルにも非常に感銘を受けました。

@noriyuki_kojima(博士、@Cornell)と @jungokasai(博士、@UW)によって設立された @kotoba_tech は、東アジア言語向けの音声 AI を構築しています。彼らは以前、日本の初期の政府・大学共同研究プロジェクトである LLM-Fugaku プロジェクト(Fugaku CPU 専用スーパーコンピュータ上に構築された日本の大規模言語モデルイニシアチブ)の共同創業者でした。彼らは GPU を使わず、CPU のみでトランスフォーマーアーキテクチャを用いて日本語 LLM の学習に成功しました。現在 Kotoba では、Koto 独自モデルファミリーが日本語、韓国語、中国語で業界をリードする性能を発揮し、AI 音声エージェント、デバイス、ウェアラブル、ロボティクス、そしてこれらの市場が求める精度とレイテンシを備えたリアルタイム音声翻訳と推論を支えています。

このチームが際立っている理由は、世界クラスの研究、東アジア全体への深い文化的理解、そしてすでに有意義な勢いを示している製品という稀有な組み合わせにあります。Kotoba のモデルは英語優先システムの単なる適応ではなく、サービスを提供する市場の言語的現実に合わせて特別に構築された独自の学習アプローチを採用しています。最初のモデルリリースからわずか 6 ヶ月で、彼らのモデルは韻律において西側企業の他のモデルよりも一貫して低レイテンシで高品質な性能を発揮しています。最初の 6 ヶ月間で、彼らはモデルを非公開で顧客にリリースし、Kotoba は現在、複数の Fortune 100 企業、グローバルハードウェア企業、急成長中の AI ネイティブスタートアップを初期顧客として数えています。

私たちは @noriyuki_kojima@jungokasai、そして @kotoba_tech チームの全員と提携できることを誇りに思います。彼らは日本の新しいフロンティア研究ラボ、そしてアジア全域およびその他の地域向けの Voice AI プラットフォームを構築しています。

以下のリンクから、私たちの投資について詳しくお読みいただけます:

https://kindredventures.com/announcement/kotoba-developing-voice-ai-for-a-multilingual-world/

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind

解読すべきパターンをもっと

最近のバイラル記事

バイラル記事をもっと見る