KotiUutisetItsevalvottu oppiminen kontekstilla

Itsevalvottu oppiminen kontekstilla

Hyödyntämällä maailmanmalleja ja muuntajia se siltaa kuilun ihmisen kaltaisen sopeutumisen ja tekoälyn välillä, tasoittaen tietä oikeudenmukaisemmille, tehokkaammille algoritmeille.

Koneoppimisen kasvava paradigma itsevalvottu oppiminen (SSL) muuttaa kuinka mallit oppivat ilman merkittyä tietoa.SSL-menetelmät luottavat perinteisesti ennalta määriteltyihin tietojen lisäyksiin, invarianssin tai ekvivalenssin täytäntöönpanoon tiettyihin muunnoksiin.Nämä induktiiviset priorit rajoittavat kuitenkin usein joustavuutta erilaisissa tehtävissä.

MIT: n CSailin tutkijoiden ja Münchenin teknisen yliopiston tutkijoiden kehittämä lähestymistapa Contexttuaalinen itsevalvottu oppiminen (konteksti) käsittelee näitä rajoituksia.ContextsSL esittelee mekanismin, jossa esitykset mukautuvat dynaamisesti tehtäväkohtaisten tilanteiden perusteella, poistaen toistuvan uudelleenkoulutuksen tarpeen.Ytimessä kontekstit sisältävät maailmanmallit-agentin ympäristön abstraktiset esitykset-ja käyttää muuntajamoduulia koodaamaan nämä tilaa-action-NEXT-State-kolmiosekvensseinä.Kontekstin suhteen malli määrittelee, milloin invarianssia tai ekvivalenttia voidaan panna täytäntöön tehtävävaatimuksista riippuen.

Vertailuarvojen, kuten 3Diebenchin ja Cifar-10: n, laajan testauksen avulla kontekstit osoittivat huomattavaa monipuolisuutta.Esimerkiksi lääketieteellisellä alueella käyttämällä MIMIC-III-tietojoukkoa konteksdsl mukautti esityksen sukupuolikohtaisiin lääketieteellisiin diagnoositehtäviin, joissa ekvivalenttisuus oli kriittistä.Samanaikaisesti se varmisti oikeudenmukaisuuden ennustamalla tuloksia, kuten sairaalan oleskelun pituutta, korostaen invarianssia.

Tämä sopeutumiskyky varmistaa paremman suorituskyvyn mittareissa, kuten tasoittuneiden kertoimien (EO) ja mahdollisuuksien tasa -arvon (EOPP) välillä, mikä parantaa myös ennustetarkkuutta herkille ominaisuuksille, kuten sukupuoli.Hyödyntämällä muuntajamalleja kontekstin oppimiseen, kontekstit tasapainottavat invarianssin ja ekvivalenssin tehokkaasti tehtäväkohtaisella tavalla.Tämä on merkittävä askel kohti joustavampien, yleiskäyttöisten SSL-kehysten luomista.Kontekstiyhteydet koneoppimisen tulevaisuus lupaa tehokkaampia ja mukautuvia algoritmeja, siltojen aukkoja ihmisen kaltaisen päättelyn ja tekoälyn välillä.

"Sen sijaan, että hienosäätäisimme mallit jokaiselle tehtävälle, pyrimme luomaan yleiskäyttöjärjestelmän, joka pystyy sopeutumaan erilaisiin ympäristöihin, samanlaisia ​​kuin ihmisen oppiminen", sanoo Csail Ph.D. Sharut Gupta.Opiskelija ja johtava tutkimuksen kirjoittaja.