Notebookcheck Logo

Nieuwe open-source AI-tool maakt veel langere, consistentere videoproductie mogelijk

Een AI-gegenereerde afbeelding van een giraffe
ⓘ Gemini
Een AI-gegenereerde afbeelding van een giraffe
Onderzoekers van het Zwitserse Federale Instituut voor Technologie Lausanne (École polytechnique fédérale de Lausanne) hebben een nieuw systeem ontwikkeld, genaamd Stable Video Infinity (SVI), om de drifting in modellen voor het genereren van video's aan te pakken.

Als u modellen voor het genereren van video's hebt gebruikt, zult u één ding over de hele linie consistent vinden - ze zijn beperkt tot korte clips, meestal tussen 5 en 20 seconden. De reden voor deze beperking is iets dat "drift" wordt genoemd Drift zorgt ervoor dat scènes en personages frame voor frame steeds meer uit beeld raken, wat na verloop van tijd resulteert in een onsamenhangende uitvoer.

Om dit probleem aan te pakken, hebben onderzoekers van het Visual Intelligence for Transportation (VITA) laboratorium van de EPFL een nieuwe trainingsmethode ontwikkeld, genaamd "hertraining door foutenrecycling" In plaats van de fouten en vervormingen die van nature optreden tijdens het genereren te verwijderen, voert deze aanpak ze opzettelijk terug in het model.

Prof. Alexandre Alahi vergelijkt het proces met "het trainen van een piloot in turbulent weer in plaats van in een strakblauwe lucht" Door van zijn eigen fouten te leren, wordt de AI robuust genoeg om zichzelf te stabiliseren wanneer er onvermijdelijk fouten optreden, in plaats van in willekeur te vervallen.

Deze methode voorziet het nieuwe Stable Video Infinity (SVI) systeem van energie. In tegenstelling tot huidige modellen die vaak na 30 seconden afbrokkelen, kan SVI coherente video's van hoge kwaliteit genereren die meerdere minuten of langer duren. Het systeem maakt al furore in de technische gemeenschap; de open-source code op GitHub heeft meer dan 2.000 sterren gekregen, en het onderzoek is geaccepteerd voor presentatie op de 2026 International Conference on Learning Representations (ICLR).

Het team presenteert ook LayerSync, een begeleidende methode waarmee de AI zijn interne logica voor het genereren van video, beeld en geluid kan corrigeren. Samen beloven deze hulpmiddelen betere autonome systemen te ontwikkelen en het potentieel te ontsluiten voor echte generatieve media met een lange levensduur.

Bron(nen)

Please share our article, every link counts!
Mail Logo
> Overzichten en testrapporten over laptops en mobieltjes > Nieuws > Nieuws Archief > Nieuws archieven 2026 02 > Nieuwe open-source AI-tool maakt veel langere, consistentere videoproductie mogelijk
Chibuike Okpara, 2026-02-10 (Update: 2026-02-10)