Notebookcheck Logo

Yandex geeft Yambda vrij als open-source dataset voor muziekaanbevelingen

Met de gratis Yahdex Yambda dataset kan iedereen zijn eigen muziekaanbevelingsdienst maken. (Afbeeldingsbron: Yandex)
Met de gratis Yahdex Yambda dataset kan iedereen zijn eigen muziekaanbevelingsdienst maken. (Afbeeldingsbron: Yandex)
Yandex heeft Yambda vrijgegeven, 's werelds grootste open dataset voor muziekaanbevelingssystemen, met 4,79 miljard geanonimiseerde gebruikersinteracties om ontwikkelaars te helpen slimme muziekdiensten te creëren die alleen de nummers afspelen die luisteraars willen horen.

Yandex heeft zijn open-source Yambda dataset met informatie over de voorkeuren van muziekluisteraars vrijgegeven voor gebruik bij het creëren van een streaming audiodienst vergelijkbaar met Spotify met AI-gestuurde afspeellijstpersonalisatie.

Streamingdiensten zoals Spotify, Tidal en Qobuz gebruiken softwarealgoritmen of AI-modellen om afspeellijsten te maken op basis van individuele voorkeuren. Deze diensten geven hun code of modellen meestal niet vrij omdat hun unieke vermogen om automatisch liedjes af te spelen die luisteraars leuk vinden, beschouwd wordt als een bedrijfsgeheim voor hun succes.

Yandex heeft gedurende tien maanden gegevens verzameld in de vorm van 4,79 miljard gebruikersinteracties met 9,39 miljoen muzieknummers van zijn pool van 28 miljoen maandelijkse Yandex Music gebruikers. Dit omvat belangrijke feedback van Yandex Music-luisteraars - waar ze naar willen luisteren en wat ze leuk en niet leuk vinden. Alle interacties zijn voorzien van een tijdstempel voor meer precisie.

De dataset kan gedownload worden in vijf miljard (1 miljoen gebruikers), vijfhonderd miljoen (100.000 gebruikers) en vijftig miljoen (10.000 gebruikers) gebeurtenismodellen, waarbij het maximum minstens 85 GB opslagruimte vereist. De dataset is opgeslagen in het Apache Parquet formaat, een kolom-georiënteerd gegevensbestandsformaat voor gemakkelijke analyse en onderzoek.

Lezers kunnen muziekstreaming cadeau doen met een Spotify-cadeaubon.

Please share our article, every link counts!
Mail Logo
> Overzichten en testrapporten over laptops en mobieltjes > Nieuws > Nieuws Archief > Nieuws archieven 2025 05 > Yandex geeft Yambda vrij als open-source dataset voor muziekaanbevelingen
David Chien, 2025-05-30 (Update: 2025-05-30)