🎧 Dieser Artikel basiert auf Episode #126 unseres Podcasts. Diese kannst du hier hören.
Max Engler ist der Mitgründer von Dubly.AI, einem noch jungen Startup aus Hessen. Dubly AI ist ein AI-Dubbing-Tool, das Videos in 28 Sprachen übersetzen kann – inklusive lippensynchroner Vertonung. Das spannendste an der ganzen Sache ist, dass Dubly mit Low- und No-Code gebaut wurde. Wie sie das gemacht haben und worauf sie für die Skalierung der App achten mussten, erzählt uns Max.
Die Anfänge von Dubly AI
Max und sein Mitgründer Simon starteten Dubly AI mit der Vision, Videos lippensynchron und mit der Originalstimme der Sprecher zu übersetzen. Die Idee entstand aus der Notwendigkeit, YouTube-Inhalte in verschiedene Sprachen zu übersetzen, ohne dabei auf die Authentizität der Stimme zu verzichten. Mit einem klaren Fokus auf den Einsatz von AI und einem tiefen Verständnis für die Bedürfnisse der Zielgruppe, schufen sie eine Plattform, die es ermöglicht, Videos einfach und effizient zu übersetzen.
No-Code als Schlüssel zum Erfolg
Ein zentraler Aspekt der Entwicklung von Dubly AI war der Einsatz von No-Code- und Low-Code-Technologien. Max betont, dass die Kombination aus No-Code-Tools und klassischem Code die Grundlage für die Skalierbarkeit und Flexibilität ihrer Plattform bildet. Das Frontend und Backend wurden initial mit Bubble entwickelt, während für die Datenbank Xano genutzt wird. Diese Wahl ermöglicht es, schnell auf Marktveränderungen zu reagieren und die Plattform kontinuierlich zu verbessern.
Technologie im Einsatz
Dubly AI nutzt eine Reihe von Technologien, um die bestmöglichen Übersetzungsergebnisse zu erzielen. Für das Voice-Cloning und Text-to-Speech setzt Dubly AI auf Eleven Labs, während für die Audio-Enhancement Auphonic aus Graz verwendet wird. Diese sorgfältig ausgewählten Tools ermöglichen es, die Qualität und Authentizität der Übersetzungen zu maximieren.
Außerdem nutzen sie eine Microservice-Architektur, um Aufgaben wie das Zusammenführen von MP3-Dateien aus einem S3 Bucket oder das Herunterladen von YouTube-Videos zu lösen. , die in Bubble nicht direkt umsetzbar sind. Diese Prozesse werden über AWS Lambda realisiert, ein skalierbares Tool, das auf API-Anfragen automatisch neue Container startet, den Code ausführt und wieder stoppt. So kann Dubly tausende Anfragen gleichzeitig verarbeiten, was eine effiziente und flexible Lösung ermöglicht. Den für diese Microservices notwendigen Code haben sie wiederum mit dem KI Assistenten “Claude” erstellen lassen.
Die Zukunft von Dubly AI
Trotz der Herausforderungen, die mit der Entwicklung eines solchen Produkts verbunden sind, hat Dubly AI gezeigt, dass es möglich ist, mit einem kleinen Team und begrenzten Ressourcen Großes zu erreichen. Max betont die Bedeutung von Fokus und der Nutzung bestehender Technologien, um schnell und effizient zu arbeiten. Die Plattform ist vollständig gebootstrapped und hat es geschafft, sich gegen größere Konkurrenten mit deutlich mehr Ressourcen zu behaupten.
Fazit
Dubly AI ist ein beeindruckendes Beispiel dafür, wie No-Code und Low-Code-Technologien gemeinsam mit KI noch schneller zu innovativen und skalierbaren Lösungen führen können. Die Plattform bietet nicht nur eine effiziente Möglichkeit zur Videoübersetzung, sondern zeigt auch, wie wichtig es ist, flexibel und anpassungsfähig zu bleiben, um in einem schnelllebigen Markt erfolgreich zu sein.