150 styles de sous-titres : ce que nous avons appris en construisant la plus grande bibliothèque de styles
Nous venons de dépasser les 150 styles. Voici ce que 18 mois de création obsessionnelle de styles de sous-titres nous ont appris sur ce qui fonctionne vraiment dans le fil d'actualité.

Kevin Li

Nous avons atteint 150 styles de sous-titres cette semaine. Quand nous avons lancé la bêta en juillet 2024, nous en avions 10.
Je ne veux pas en faire un article « regardez le chemin parcouru » (même si c'est un peu dingue). Je veux plutôt partager ce que 18 mois à construire obsessionnellement des styles de sous-titres nous ont appris sur ce qui fonctionne.
La plupart des styles ne sont pas utilisés
C'est la vérité inconfortable. Sur nos 150 styles, environ 20 d'entre eux représentent 80% de l'utilisation. La distribution suit une loi de puissance — quelques styles sont extrêmement populaires, une longue traîne est utilisée occasionnellement, et certains styles sont à peine sélectionnés.
Vous pensez peut-être : « Alors pourquoi construire 150 ? Concentrez-vous juste sur les 20 qui marchent. »
Deux raisons. D'abord, les 20 populaires ne sont pas les mêmes 20 pour tout le monde. Un créateur de chaîne méditation gravite vers notre collection Minimal. Un influenceur fitness veut Social Hype. Une équipe de formation corporate choisit Professional. Les « 20 populaires » dépendent entièrement de la niche du créateur.
Ensuite, avoir une grande bibliothèque, c'est comme ça que les utilisateurs trouvent leur style. L'utilisateur moyen prévisualise 3-4 styles avant d'en choisir un. Si nous n'avions que 20 styles, certains utilisateurs les prévisualiseraient tous et aurait l'impression qu'aucun ne convient. Avec 150, tout le monde trouve quelque chose qui clique.
Ce que chaque catégorie nous a appris
Social Hype (30+ styles)
C'est notre catégorie la plus populaire de loin. L'enseignement : le timing est tout. Un sous-titre en majuscules gras qui apparaît 50ms trop tôt semble amateur. Le même sous-titre avec un timing précis au niveau des mots semble professionnel. Nous avons passé plus de temps sur le timing des animations que sur le design visuel.
Storytelling (20+ styles)
Populaire auprès des vloggers, créateurs de voyage et clippeurs de podcasts. L'enseignement : la retenue vend. Nos meilleurs styles de storytelling en termes de performance sont les plus sobres. Fondu d'entrée doux, texte en minuscules, positionnement subtil. Les créateurs utilisant ces styles ne veulent pas que les sous-titres soient la star — ils veulent qu'ils soient invisibles mais lisibles.
Music (15+ styles)
Mise en évidence des couleurs mot par mot synchronisée avec le rythme de la parole. L'enseignement : la tolérance de synchronisation est zéro. Pour Social Hype, être décalé de 50ms est perceptible. Pour les styles Music, être décalé de 20ms est inacceptable. Quand un mot s'allume légèrement avant ou après qu'il soit prononcé, l'illusion du karaoké se brise instantanément. Cette catégorie a motivé la plupart de nos travaux sur la précision des timestamps.
Professional (20+ styles)
Formation corporate, style journalistique, présentations académiques. L'enseignement : l'ennuyeux c'est bien. Les meilleurs styles professionnels sont délibérément peu sexy. Polices propres, positionnement cohérent, pas d'animation au-delà d'un simple fondu. Le style doit communiquer « c'est du contenu sérieux » puis s'effacer.
Artistic (15+ styles)
Lueur néon, texte glitch, bande dessinée, dégradés arc-en-ciel. L'enseignement : ceux-ci sont partagés, pas utilisés. Les styles artistiques ont le taux de « prévisualisation » le plus élevé mais le taux d'« export » le plus bas. Les gens adorent les regarder, mais pour du vrai contenu, ils passent souvent à quelque chose de plus pratique. Nous continuons à les construire parce qu'ils sont fun et montrent ce qui est possible — mais ils ne sont pas le cheval de bataille du workflow de contenu de quelqu'un.
Minimal (20+ styles)
Propre, sans animation, typographie discrète. L'enseignement : le minimal est le plus difficile à réussir. Quand il n'y a pas d'animation ou de couleur pour distraire, chaque détail compte. Choix de police, taille, graisse, espacement des lettres, position, rembourrage — ratez l'un de ces éléments et le style semble « off » d'une façon difficile à formuler mais facile à ressentir.
Le problème des polices
Nous proposons actuellement 14 familles de polices. Les choisir a été une vraie souffrance.
Les polices ont des licences. La plupart des bonnes polices coûtent de l'argent par utilisateur ou par projet. Nous avions besoin de polices qui :
- Couvrent les caractères Latin + Latin Étendu (pour les langues européennes)
- S'affichent bien à la taille des sous-titres (toutes les polices d'affichage ne se réduisent pas bien)
- Ont plusieurs graisses (nous avons besoin de Regular, Bold, et souvent Black)
- Ont des licences permissives pour une utilisation SaaS
Ce dernier point a éliminé environ 90% de nos candidats. Nous avons finalement opté pour un mélange de polices open-source et de polices sous licence commerciale pour lesquelles nous avons négocié des droits de distribution SaaS.
Si vous vous demandez pourquoi nous ne supportons pas les uploads de polices personnalisées — c'est pourquoi. Le rendu des polices dans notre pipeline vidéo nécessite que la police soit enregistrée au moment de la compilation. Nous travaillons sur une solution, mais ce n'est pas trivial.
Ce qui vient ensuite
Nous ajoutons de nouveaux styles chaque mois en fonction des tendances. Si vous voyez un style de sous-titres dans la nature que vous voulez nous voir construire, dites-le nous. Nous prenons les demandes au sérieux — plusieurs de nos styles les plus populaires ont commencé comme des suggestions d'utilisateurs.
150, c'est un chiffre rond sympa, mais nous n'avons pas terminé. L'objectif n'est pas d'avoir le plus de styles — c'est de s'assurer que chaque créateur utilisant CaptionBolt peut trouver un style qui donne l'impression d'avoir été fait pour son contenu.


