DeepVoice is an ultra-realistic Text To Voice AI solution. This tool can create voices from text, trim, combine and equalize audio files. Choose from 95+ voices.No sign-up, No API Keys, no recurring payments, no subscription fees, no additional costs, just one-click easy to use inferences on our voice model.ABOUTDeepVoice is an LAM (Large Audio Model) of networks and libraries that are capable of life-like voice generation through text using AI and deep learning made for Unity.QUOTA (INCREASED)60,000 characters per month of voice over and narration takes with DeepVoice. 60,000 characters translates to 18 pages of 12-point text in Calibri. This quota is issued on the 1st of every month. Process up to 2.5x characters at a time nowLINKSWorks in realtime, both in, Edit Mode or Play Mode inside of the Unity Editor. This asset has a one-click, beginner friendly GUI and does not require any coding to use.Please note: The voices you hear in this description and the videos (Trailer and Getting Started) are AI generated.Please check out the forum page for the latest developments and discussion related to this asset. We are researching and adding more functionality continuously. Your support is appreciated.Website and Support | Documentation | Forum PagePipelines Supported: Standard, HDRP, URP and SRP. (All)FEATURES🗣 Text to Voice Converter: The main function of the asset is to provide you with ready for production voices. Simply enter the text to be voiced out and click on generate.Examples for prompting:Narration / Dialogues / Voice over / Dubbing"In the end, it's not the powers that define us, but the choices we make"▶︎ Play"Sometimes, the greatest adventures are found in the most unexpected places."▶︎ Play"In the darkest of nights, hope shines like a single star, reminding us that heroes are born from adversity."▶︎ Play"Had to be me. Someone else might have gotten it wrong."▶︎ Play"I think it was called Ueno Station, but I'm not sure. I've never been to Tokyo before, so everything is unfamiliar to me."▶︎ PlayPauses"So I think - I should take this route if I want to reach on time"▶︎ PlayOr"But well... I'm not entirely convinced"▶︎ PlayEmotionsNote: The dialogue tag ("he said confused", "he shouted angrily") has been cut out using the audio trimmer within the asset."I have had enough!" he shouted angrily.▶︎ Play"I wish you were right, I truly do, but you're not" he said, assertively.▶︎ Play Multi - Language ( [In Order] Japanese, Spanish, German, Korean, French, Hindi, Italian, Portuguese, Polish, Arabic, Indonesian, Dutch, Turkish, Filipino, Polish, Swedish, Bulgarian, Romanian, Czech, Greek, Finnish, Croatian, Malay, Slovak, Danish, Tamil, Ukrainian)"ひとのために することは けっきょく めぐりめぐって じぶんのためにも なっているものだし" (Japanese)▶️ Play"El Hombre Que Se Levanta Es Aún Más Grande Que El Que No Ha Caído." (Spanish)▶︎ Play"Wenn man dem Teufel den kleinen Finger gibt, so nimmt er die ganze Hand" (German)▶︎ Play"세상에서 보고싶은 변화가 있다면 당신 스스로 그 변화가 되어라." (Korean)▶️ Play"L’amour est comme le vent, nous ne savons pas d’où il vient." (French)▶︎ Play"जल्दी सोना और जल्दी उठना इंसान को स्वस्थ ,समृद्ध और बुद्धिमान बनाता है." (Hindi)▶︎ Play"Penso che se io morissi e che con i miei mali finisse il desiderio, un amore così grande si spegnerebbe e il mondo intero rimarrebbe senza amore" (Italian)▶︎ Play"Os limites da minha linguagem são os limites do meu mundo." (Portuguese)▶︎ Play"Proście, a będzie wam dane, szukajcie, a znajdziecie." (Polish)▶︎ Play"الخطر الأعظم على معظمنا" (Arabic)▶️ Play"Persiapkan hari ini sebaik-baiknya untuk menghadapi hari ésok yang baru." (Indonesian)▶️ Play"Wees de verandering die je in de wereld wil zien gebeuren." (Dutch)▶️ Play"Kadınlar beğenince değil, güvenince âşık olur." (Turkish)▶️ Play"Ang pagiging dukha ay hindi hadlang sa tagumpay." (Filipino)▶️ Play"För att lyckas i livet behöver du två saker: okunnighet och självförtroende." (Swedish)▶️ Play"Никога не изневерявайте на специфичния си талант." (Bulgarian)▶️ Play"Mai bine să ierți pe cel vinovat, decât să pedepsești pe cel nevinovat" (Romainian)▶️ Play"Mluviti stříbro, mlčeti zlato." (Czech)▶️ Play"ήρθα, είδα, νίκησα" (Greek)▶️ Play"Yleensä elämässä on viisasta luottaa siihen, että kaikki menee hyvin." (Finnish)▶️ Play"Tko svoj može biti, tuđ neka ne bude" (Croatian)▶️ Play"Menderita sekarang, kesoronokan kemudian." (Malay)▶️ Play"Horšia dlžoba ako chudoba." (Slovak)▶️ Play"Af to onde Kaar skal man vaelge det bedste." (Danish)▶️ Play"ஆனால் வெற்றி நம்பிக்கை உள்ளோரிடம் மட்டுமே வரும்." (Tamil)▶️ Play"Ложка дьогтю у бочці меду" (Ukrainian)▶️ PlayA few more examples are given in the documentation👅 Language and Accent Support: The DeepVoice_Multi model supports different languages such as English, Japanese, German, Hindi, French, Korean, Portuguese, Italian, Spanish, Indonesian, Dutch, Turkish, Filipino, Polish, Swedish, Bulgarian, Romanian, Arabic, Czech, Greek, Finnish, Croatian, Malay, Slovak, Danish, Tamil, Ukrainian.🔊 Voice Modulation controls: These controls allow users to adjust parameters such as speech clarity and variability in voices, as well as add emotions through text prompting. By manipulating these parameters, users can customize the generated speech to better suit their needs and preferences.〰️ Preview waveform: Play sound clips right inside the editor without going into the play mode. Scrub the play head to play any part of the clip. Timestamps and simple graphic of the waveform is shown for better clarity inside the editor.✂️ Trim audio: A user friendly GUI in the Editor to trim the ends of an audio clip if in case a part of the clip is not required or is empty.➕ Combine clips: Multiple audio clips can be combined into one using an intuitive user friendly feature in the editor. Simply select clips, rearrange their order with ease and merge them into one.⚙️ Equalize tracks: Mastering audio clips involves equalization of clips which can easily be done within the editor itself. Simply select the clip, adjust gain, pitch and frequency band sliders. A 6 band equalization is offered in the editor.📄 Editor Script: The Editor Script displays all the options neatly in one panel. The editor has an in-built preview audio player. Simple design for trimming, combining and equalizing or mastering audio tracks.EDITORKeeping it all in the editor: Keeping all assets in one workspace inside the Editor and having to switch to fewer services can have several benefits, such as:- Improved Efficiency: When all assets are located in one workspace, it becomes easier to access and manage them. Users do not have to spend time switching between different services or applications, which can be time-consuming and lead to a loss of productivity.- Streamlined Workflow: Having all assets in one workspace can help create a more streamlined workflow. This is because users can easily move between different assets, such as code files, images, and documents, without having to navigate between different services. This can help to speed up the development process and make it more efficient.- Reduced Complexity: Using fewer services can help to reduce the complexity of the development process.In the pack, you will find a demo scene and an editor window which help you to access the TTS models. There are other useful audio settings like trimming, combining and mastering the audio track that can be accessed through the DeepVoice Editor Window.DEPENDENCIESThis tool requires the Editor Coroutines package from the package manager and an active internet connection.LIMITATIONSSince this tool is still under development, there are a few limitations:- Process up to 500 character at a single time. This limit will increase as we scale up.- There are around 95 voices to choose from, out of which Mono/Multi have 25. We are working on adding more.- Audio generation time is ~8-15 seconds per clip. This may increase with an increased number of tokens and user base.- Character count per month is limited to 60000.Goes best with:Now We're Talking! by Chatterwave - A real-time auto multilingual mouth animation asset used in the section 01:47 - 02:00 of the DeepVoice showcase video in collaboration with Chatterwave. Additional details about the assets and effects used for the clip are mentioned in the description of the YouTube video.The asset POLYGON Dungeons - Low Poly 3D Art by Synty Studios is also used in this section of the video. NWT! and Synty Studios assets are NOT included in DeepVoice AI. You can find them separately on the store.Through the use of (Large Audio Model) LAMs, a TTS service is made available to users via this asset. The asset also provides other audio services apart from TTS such as audio trimming, combining and equalization.
DeepVoice は、超現実的な Text To Voice AI ソリューションです。 このツールは、テキストから音声を作成し、オーディオ ファイルをトリミング、結合、イコライズすることができます。 95 以上の音声から選択できます。
詳細
サインアップ、API キー、定期的な支払い、サブスクリプション料金、追加費用は一切なく、ワンクリックで簡単に音声モデルを推論できます。
について
DeepVoice は、Unity 用に作成された AI とディープラーニングを使用して、テキストを通じて本物のような音声を生成できるネットワークとライブラリの LAM (Large Audio Model) です。
クォータ (増加)
DeepVoice を使用すると、1 か月あたり 60,000 文字のナレーションとナレーションが可能です。 Calibri では、60,000 文字は 12 ポイントのテキストで 18 ページに相当します。 この割り当ては毎月 1 日に発行されます。 一度に最大 2.5 倍の文字を処理できるようになりました
リンク
Unity エディター内の編集モードまたは再生モードの両方でリアルタイムで動作します。 このアセットはワンクリックで初心者に優しい GUI を備えており、使用するためにコーディングは必要ありません。
注意してください: この説明とビデオ (トレーラーと入門) で聞こえる音声は AI によって生成されたものです。
このアセットに関連する最新の開発とディスカッションについては、フォーラム ページをチェックしてください。 私たちは継続的に研究を進め、さらに多くの機能を追加しています。 ご支援をよろしくお願いいたします。
ウェブサイトとサポート | ドキュメント | フォーラムページ
サポートされるパイプライン: 標準、HDRP、URP、および SRP。 (全て)
特徴
🗣 テキスト音声コンバーター: このアセットの主な機能は、すぐに本番環境に使える音声を提供することです。 音声出力するテキストを入力し、「生成」をクリックするだけです。
プロンプトの例:
ナレーション / ダイアログ / ナレーション / 吹き替え
「結局のところ、私たちを定義するのは権力ではなく、私たちが行う選択です。」
▶︎ 遊ぶ
「時々、最大の冒険は最も予期せぬ場所で見つかることがあります。」
▶︎ 遊ぶ
「最も暗い夜でも、希望は一つの星のように輝き、英雄は逆境から生まれることを思い出させます。」
▶︎ 遊ぶ
「私でなければいけませんでした。他の誰かが誤解したかもしれません。」
▶︎ 遊ぶ
「上野駅と言っていたと思うんですが、よくわかりません。東京に行ったことがないので、何もかもが未知です。」
▶︎ 遊ぶ
一時停止
「だから、時間通りに到着したいなら、このルートを通るべきだと思います」
▶︎ 遊ぶ
または
「でもまあ……全然納得はしてないんですけど」
▶︎ 遊ぶ
感情
注: ダイアログ タグ (「彼は混乱したと言った」、「彼は怒って叫んだ」) は、アセット内のオーディオ トリマーを使用して切り取られています。
"もう十分です!" 彼は怒って叫びました。
▶︎ 遊ぶ
「あなたが正しければいいのですが、本当にそう思いますが、あなたはそうではありません」と彼はきっぱりと言いました。
▶︎ 遊ぶ
多言語([順] 日本語、スペイン語、ドイツ語、韓国語、フランス語、ヒンディー語、イタリア語、ポルトガル語、ポーランド語、アラビア語、インドネシア語、オランダ語、トルコ語、フィリピン語、ポーランド語、スウェーデン語、ブルガリア語、ルーマニア語、チェコ語、ギリシャ語、フィンランド語、 クロアチア語、マレー語、スロバキア語、デンマーク語、タミル語、ウクライナ語)
"ひとのために することは けっきょく めぐりめぐって じぶんのためにも なっているものだし" (Japanese)
▶️ Play
"El Hombre Que Se Levanta Es Aún Más Grande Que El Que No Ha Caído." (Spanish)
▶︎ Play
"Wenn man dem Teufel den kleinen Finger gibt, so nimmt er die ganze Hand" (German)
▶︎ Play
"세상에서 보고싶은 변화가 있다면 당신 스스로 그 변화가 되어라." (Korean)
▶️ Play
"L’amour est comme le vent, nous ne savons pas d’où il vient." (French)
▶︎ Play
"जल्दी सोना और जल्दी उठना इंसान को स्वस्थ ,समृद्ध और बुद्धिमान बनाता है." (Hindi)
▶︎ Play
"Penso che se io morissi e che con i miei mali finisse il desiderio, un amore così grande si spegnerebbe e il mondo intero rimarrebbe senza amore" (Italian)
▶︎ Play
"Os limites da minha linguagem são os limites do meu mundo." (Portuguese)
▶︎ Play
"Proście, a będzie wam dane, szukajcie, a znajdziecie." (Polish)
▶︎ Play
"الخطر الأعظم على معظمنا" (Arabic)
▶️ Play
"Persiapkan hari ini sebaik-baiknya untuk menghadapi hari ésok yang baru." (Indonesian)
▶️ Play
"Wees de verandering die je in de wereld wil zien gebeuren." (Dutch)
▶️ Play
"Kadınlar beğenince değil, güvenince âşık olur." (Turkish)
▶️ Play
"Ang pagiging dukha ay hindi hadlang sa tagumpay." (Filipino)
▶️ Play
"För att lyckas i livet behöver du två saker: okunnighet och självförtroende." (Swedish)
▶️ Play
"Никога не изневерявайте на специфичния си талант." (Bulgarian)
▶️ Play
"Mai bine să ierți pe cel vinovat, decât să pedepsești pe cel nevinovat" (Romainian)
▶️ Play
"Mluviti stříbro, mlčeti zlato." (Czech)
▶️ Play
"ήρθα, είδα, νίκησα" (Greek)
▶️ Play
"Yleensä elämässä on viisasta luottaa siihen, että kaikki menee hyvin." (Finnish)
▶️ Play
"Tko svoj može biti, tuđ neka ne bude" (Croatian)
▶️ Play
"Menderita sekarang, kesoronokan kemudian." (Malay)
▶️ Play
"Horšia dlžoba ako chudoba." (Slovak)
▶️ Play
"Af to onde Kaar skal man vaelge det bedste." (Danish)
▶️ Play
"ஆனால் வெற்றி நம்பிக்கை உள்ளோரிடம் மட்டுமே வரும்." (Tamil)
▶️ Play
"Ложка дьогтю у бочці меду" (Ukrainian)
▶️ Play
さらにいくつかの例がドキュメントに記載されています
👅 言語とアクセントのサポート: DeepVoice_Multi モデルは、英語、日本語、ドイツ語、ヒンディー語、フランス語、韓国語、ポルトガル語、イタリア語、スペイン語、インドネシア語、オランダ語、トルコ語、フィリピン語、ポーランド語、スウェーデン語、ブルガリア語、ルーマニア語、アラビア語などのさまざまな言語をサポートしています。 チェコ語、ギリシャ語、フィンランド語、クロアチア語、マレー語、スロバキア語、デンマーク語、タミル語、ウクライナ語。
🔊 音声変調コントロール: これらのコントロールを使用すると、ユーザーは音声の明瞭さや多様性などのパラメータを調整したり、テキスト プロンプトを通じて感情を追加したりできます。 これらのパラメータを操作することで、ユーザーは生成された音声を自分のニーズや好みに合わせてカスタマイズできます。
〰️ 波形のプレビュー: 再生モードに移行せずに、エディター内でサウンド クリップを直接再生します。 再生ヘッドをスクラブして、クリップの任意の部分を再生します。 タイムスタンプと波形の簡単なグラフィックがエディタ内でわかりやすく表示されます。
✂️ オーディオのトリミング: クリップの一部が不要な場合や空の場合に備えて、オーディオ クリップの端をトリミングするためのエディターのユーザー フレンドリーな GUI。
➕ クリップの結合: エディターの直感的なユーザーフレンドリーな機能を使用して、複数のオーディオクリップを 1 つに結合できます。 クリップを選択するだけで、簡単に順序を並べ替えて 1 つに結合できます。
⚙️ トラックのイコライズ: オーディオ クリップのマスタリングには、エディタ自体で簡単に実行できるクリップのイコライゼーションが含まれます。 クリップを選択し、ゲイン、ピッチ、周波数帯域のスライダーを調整するだけです。 エディターでは 6 バンドのイコライゼーションが提供されます。
📄 エディター スクリプト: エディター スクリプトは、すべてのオプションを 1 つのパネルにきちんと表示します。 エディターにはプレビュー オーディオ プレーヤーが組み込まれています。 オーディオトラックのトリミング、結合、イコライジング、マスタリングを行うためのシンプルなデザイン。
編集者
すべてをエディター内に保持する: すべてのアセットをエディター内の 1 つのワークスペースに保持し、切り替えるサービスを少なくすることで、次のようないくつかの利点が得られます。
- 効率の向上: すべてのアセットが 1 つのワークスペースに配置されると、アセットへのアクセスと管理が容易になります。 ユーザーは、時間がかかり、生産性の低下につながる可能性がある、異なるサービスやアプリケーション間の切り替えに時間を費やす必要がありません。
- 合理化されたワークフロー: すべてのアセットを 1 つのワークスペースに配置すると、より合理化されたワークフローを作成できます。 これは、ユーザーが異なるサービス間を移動することなく、コード ファイル、画像、ドキュメントなどの異なるアセット間を簡単に移動できるためです。 これは、開発プロセスをスピードアップし、より効率的にするのに役立ちます。
- 複雑さの軽減: 使用するサービスの数を減らすと、開発プロセスの複雑さを軽減できます。
パックには、TTS モデルへのアクセスに役立つデモ シーンとエディタ ウィンドウが含まれています。 DeepVoice エディタ ウィンドウからアクセスできるオーディオ トラックのトリミング、結合、マスタリングなど、その他の便利なオーディオ設定もあります。
依存関係
このツールには、パッケージ マネージャーからの Editor Coroutines パッケージとアクティブなインターネット接続が必要です。
制限事項
このツールはまだ開発中であるため、いくつかの制限があります。
- 一度に最大 500 文字を処理します。 この制限は規模が拡大するにつれて増加します。
- 選択できるボイスは約 95 個あり、そのうちモノ/マルチは 25 個あります。今後さらに追加する予定です。
- オーディオの生成時間はクリップごとに約 8 ~ 15 秒です。 これは、トークンの数とユーザーベースの増加に伴って増加する可能性があります。
・月間文字数は60000文字までとなります。
以下と最適です:
今、話しています! Chatterwave による - Chatterwave と協力して、DeepVoice ショーケース ビデオのセクション 01:47 ~ 02:00 で使用されるリアルタイムの自動多言語口アニメーション アセット。 クリップに使用されているアセットとエフェクトの詳細については、YouTube ビデオの説明に記載されています。
Synty Studios のアセット POLYGON Dungeons - Low Poly 3D Art もビデオのこのセクションで使用されています。 いやー! Synty Studios アセットは DeepVoice AI には含まれていません。 ストアで個別に見つけることができます。
AIを使って作る
(ラージ オーディオ モデル) LAM の使用により、ユーザーはこのアセットを介して TTS サービスを利用できるようになります。 このアセットは、オーディオのトリミング、結合、イコライゼーションなど、TTS 以外の他のオーディオ サービスも提供します。