Ipinapaliwanag ng Science kung bakit matagumpay ang isang kanta

Maaaring sinabi mo na "ang lahat ng mga awiting ito ay mukhang pareho." Ang isang bagong kanta ay matagumpay at pindutin ang tuktok ng mga tsart na awtomatikong lalabas na nagsasabing mukhang isa na, ironically, ay naging isang tagumpay din. Upang malaman kung ang isang kanta ay talagang "pareho" sa isa pa, dalawang mananaliksik ng mag-aaral sa University of San Francisco, California, ang nagpasya na gumamit ng data ng Spotify para sa misyon na ito.

Ginamit ng mga siyentipiko ang pampublikong interface ng programming application ng Spotify upang lumikha ng apat na mga modelo ng pagkatuto ng makina na maaaring mahulaan kung maaaring maging isang hit ang isang kanta. "Ang aming layunin ay upang makita kung ang mga hit na kanta ay may magkatulad na katangian at kung gayon, kung ang mga katangiang iyon ay maaaring magamit upang mahulaan kung aling mga kanta ang magiging matagumpay sa hinaharap, " paliwanag ni Kai Middlebrook, isa sa mga mananaliksik.

Siya at ang kasamahan na si Kian Sheik ay nakatuon sa ilang mga aspeto ng mga kanta, tulad ng ritmo, valence, enerhiya acoustics, tunog at sayaw, at ang resulta ay apat na modelo.

Larawan: Pixabay

Logistic regression: Sa modyul na ito, ang isang kanta ay may label na 1, na nagpapahiwatig na ang kanta ay magiging hit, at 0, na nagpapahiwatig na ang kanta ay mag-flop. Ang bawat tampok ng kanta ay may bigat na tumutulong na mahulaan ang tagumpay nito. Ang mga tampok na ito ay itinuturing na mabilis at madaling i-interpret at mas madaling maunawaan ang umaasa sa mga variable (tampok sa musika) ng mga dependents (hit o miss).

Random na Arkitektura ng Kagubatan: Sa modelong ito, ginagamit ng mga siyentipiko ang mga puno ng desisyon upang masira ang data na may layunin oo at walang mga katanungan. Gayunpaman, posible na kabisaduhin ang data ng pagsasanay na may napakalapit na pag-tune, na nangangahulugan na ang modelo ay maaaring hindi nakakakita ng isang tunay na ugnayan sa pagitan ng mga tampok at katanyagan ng kanta, sapagkat ang data ay karaniwang may kasamang impormasyon hindi nauugnay. Samakatuwid, itinayo ng Middlebrook at Sheik ang modelong ito upang pagsamahin ang daan-daang libong mga puno ng desisyon sa pamamagitan ng pagsusuri ng iba't ibang mga subset, paggawa ng isang hula sa pamamagitan ng pag-average ng bawat puno, at pagsasama ng mga resulta. Ang mga modelong ito ay mas nababaluktot kaysa sa mga linear na modelo, na ayon sa Middlebrook ay isang mahalagang kalamangan.

Suporta sa Machine ng Vector: Ang modelong ito ay naghahanap para sa "hyperplane" na pinakamahusay na naghihiwalay ng data sa dalawang kategorya.

Neural Network: Sa modelong ito, ang isang nakatagong layer na may 10 mga filter ay ginagamit upang malaman mula sa data ng musika.

Plano ng mga siyentipiko na palawakin ang pananaliksik

Sinubukan ng dalawang siyentipiko ang mga resulta na nakuha gamit ang makasaysayang data mula sa Billboard gamit ang isang network ng computer ng University of San Francisco upang pag-aralan ang mga numero. Ang buong proseso ay tumagal ng linggo.

Larawan: Pixabay

Natagpuan nila na ang "suporta vector machine" ay may pinakamataas na rate ng katumpakan ng hit, na umaabot sa isang kahanga-hangang 99.53%. Ang pinakamababang rate ay kasama ang modelong "random na kagubatan", na may 88%. Para sa Middlebrook, kung ginamit ng mga label label ang pamamaraang ito ng pagsusuri upang palabasin ang isang kanta, magkakaroon sila ng mas malakas na desisyon sa negosyo.

Matapos tapusin na posible na hulaan kung ang isang kanta ay magiging matagumpay batay sa pagsusuri ng kanilang audio, nilalayon ng pares na suriin ang iba pang mga kadahilanan na maaaring mag-ambag sa tagumpay ng isang kanta, tulad ng karanasan sa artista, pagkakaroon ng social media, at impluwensya sa label.