Eleven v3 : Il ne fait pas que parler, il joue.

Le modèle de parole IA le plus expressif et réaliste jamais créé. Eleven v3 comprend l'émotion, l'interruption et la nuance, offrant des performances humaines dans plus de 70 langues.

Explorer les fonctionnalités

Introduction officielle

Capacités vocales IA révolutionnaires

70+ langues

De l'anglais et du chinois au cinghalais et au kirghize, touchez un public mondial avec des voix au son natif.

Dialogues dynamiques

Créez des conversations naturelles à plusieurs interlocuteurs avec des interruptions et des chevauchements de parole.

Contrôle expressif

Utilisez des balises audio comme [rires] ou [chuchotements] pour diriger la performance de l'IA avec précision.

Texte à Dialogue

Générez automatiquement des dialogues cohérents et multi-rôles à partir d'un seul bloc de texte brut.

Points forts de la mise à niveau V3

1. Un réalisme émotionnel inégalé

Injectez des émotions, un ton et des effets sonores réalistes. Avec de simples balises audio, vous pouvez faire passer la voix d'un [chuchotement] à un [cri], ajouter un [rire], ou même un [soupir] pensif. Créez des expériences audio vraiment immersives.

Voir toutes les balises prises en charge →

"Elle est entrée dans la pièce et [chuchote] 'J'ai un secret.' Puis, incapable de contenir son excitation, elle [rit] et dit, 'Nous avons gagné !'"

Locuteur A : « Avez-vous entendu parler du lancement ? »
Locuteur B : « Le lancement de la v3 ? Bien sûr ! J'allais justement-- »
Locuteur A : « Ils ont dit que c'est le modèle le plus réaliste à ce jour ! »

2. Des conversations plus vraies que nature

Oubliez la parole IA guindée et au tour par tour. V3 produit des dialogues fluides où les locuteurs peuvent s'interrompre, parler en même temps et réagir en temps réel, imitant parfaitement le flux naturel de l'interaction humaine.

3. La révolution du « Texte à Dialogue »

Ce nouveau mode puissant détecte automatiquement différents rôles et tons dans un seul bloc de texte, les tissant en un dialogue homogène. Pas besoin de balises ou de scripts complexes. Parfait pour les drames audio, les personnages de jeux et les publicités dynamiques.

Collez simplement votre script, et laissez l'IA choisir les personnages, diriger la scène et produire un dialogue entièrement doublé.

v3 vs v2 : Un bond en avant

Fonctionnalité	Eleven v3 (Alpha)	Eleven Multilingual v2
Objectif principal	Rendu et performance dramatiques, gamme émotionnelle	Qualité réaliste, stable et constante
Langues	70+	29
Contrôle expressif	Gamme complète d'émotions via les balises audio (par ex., [rires])	Contrôle de base (par ex., pauses)
Génération de dialogue	API native multi-locuteurs et Texte à Dialogue	Possible, mais moins naturel et sans mode dédié
Idéal pour	Livres audio, voix de personnages et contenu très créatif	Narration longue, vidéos d'entreprise et projets multilingues

Bientôt disponible pour les créateurs et les développeurs

Une API pour Eleven v3 est en préparation, déverrouillant l'accès programmatique au modèle de parole le plus avancé au monde pour vos applications, outils et projets créatifs.

Lire la documentation de l'API