Învățare Zero-Shot
Învățarea Zero-Shot este o metodă în inteligența artificială prin care un model recunoaște obiecte sau categorii de date fără să fi fost antrenat explicit pe ac...
Învățarea Few-Shot permite modelelor de învățare automată să generalizeze și să facă predicții din doar câteva exemple etichetate, folosind strategii precum meta-învățarea, transferul de învățare și augmentarea datelor.
Învățarea Few-Shot este o abordare de învățare automată care permite modelelor să facă predicții precise folosind doar un număr mic de exemple etichetate. Spre deosebire de metodele tradiționale de învățare supervizată care necesită cantități mari de date etichetate pentru antrenare, Învățarea Few-Shot se concentrează pe antrenarea modelelor să generalizeze dintr-un set de date limitat. Scopul este de a dezvolta algoritmi de învățare care pot învăța eficient concepte sau sarcini noi din doar câteva instanțe, similar cu capacitățile de învățare umane.
În contextul învățării automate, termenul „few-shot” se referă la numărul de exemple de antrenament per clasă. De exemplu:
Învățarea Few-Shot face parte din categoria mai largă de învățare n-shot, unde n reprezintă numărul de exemple de antrenament per clasă. Este strâns legată de meta-învățare, cunoscută și ca „învățarea de a învăța”, unde modelul este antrenat pe o varietate de sarcini și învață să se adapteze rapid la sarcini noi cu date limitate.
Învățarea Few-Shot este folosită în principal în situații în care obținerea unui set mare de date etichetate este nepractică sau imposibilă. Acest lucru poate apărea din cauza:
Pentru a aborda aceste provocări, Învățarea Few-Shot valorifică cunoștințele anterioare și strategiile de învățare care permit modelelor să facă predicții fiabile din date minime.
Au fost dezvoltate mai multe metodologii pentru a implementa eficient Învățarea Few-Shot:
Meta-învățarea presupune antrenarea modelelor pe o varietate de sarcini astfel încât acestea să poată învăța rapid sarcini noi dintr-o cantitate mică de date. Modelul dobândește o înțelegere la nivel meta a modului de a învăța, permițându-i să se adapteze rapid cu exemple limitate.
Concepte cheie:
Algoritmi populari de meta-învățare:
Exemplu de utilizare:
În procesarea limbajului natural (NLP), un chatbot poate avea nevoie să înțeleagă noi intenții ale utilizatorilor care nu au fost prezente în timpul antrenamentului inițial. Prin utilizarea meta-învățării, chatbotul se poate adapta rapid pentru a recunoaște și răspunde la aceste noi intenții după ce primește doar câteva exemple.
Transferul de învățare valorifică cunoștințele dobândite dintr-o sarcină pentru a îmbunătăți învățarea într-o sarcină diferită, dar înrudită. Un model este mai întâi pre-antrenat pe un set de date mare, apoi ajustat (fine-tuned) pe sarcina Few-Shot țintă.
Proces:
Avantaje:
Exemplu de utilizare:
În viziunea computerizată, un model pre-antrenat pe ImageNet poate fi ajustat pentru a clasifica imagini medicale pentru o boală rară folosind doar câteva exemple etichetate disponibile.
Augmentarea datelor presupune generarea de date suplimentare de antrenament din setul de date limitat existent. Acest lucru poate ajuta la prevenirea supraînvățării și la îmbunătățirea capacității modelului de a generaliza.
Tehnici:
Exemplu de utilizare:
În recunoașterea vocală, augmentarea câtorva mostre audio cu zgomot de fundal, modificări de ton sau variații de viteză poate crea un set de antrenament mai robust.
Învățarea metrică se concentrează pe învățarea unei funcții de distanță care măsoară cât de similare sau diferite sunt două puncte de date. Modelul învață să mapeze datele într-un spațiu de embedding în care elementele similare sunt apropiate.
Abordare:
Exemplu de utilizare:
În recunoașterea facială, învățarea metrică permite modelului să verifice dacă două imagini sunt ale aceleiași persoane pe baza embeddingurilor învățate.
Învățarea few-shot este un domeniu în rapidă evoluție în învățarea automată care abordează provocarea antrenării modelelor cu o cantitate limitată de date etichetate. Această secțiune explorează câteva articole științifice cheie care contribuie la înțelegerea și dezvoltarea metodologiilor de few-shot learning.
Deep Optimal Transport: Un algoritm practic pentru restaurarea foto-realistă a imaginilor
Strategii Minimax de deviație pentru învățarea automată și recunoaștere cu mostre de învățare scurte
Câteva perspective asupra sistemelor de învățare prin întărire pe tot parcursul vieții
Dex: Învățare incrementală pentru medii complexe în învățarea profundă prin întărire
Învățare prin imitație Q augmentată (AQIL)
Învățarea Few-Shot este o abordare de învățare automată care permite modelelor să facă predicții precise dintr-un număr foarte mic de exemple etichetate. Se concentrează pe a permite modelelor să generalizeze din date limitate, simulând învățarea asemănătoare celei umane.
Învățarea Few-Shot este utilizată atunci când obținerea unor seturi mari de date etichetate nu este practică, cum ar fi în cazul evenimentelor rare, cazurilor unice, costurilor mari de adnotare sau preocupărilor privind confidențialitatea.
Abordările cheie includ Meta-Învățarea (învățarea de a învăța), Transferul de Învățare, Augmentarea Datelor și Învățarea Metrică.
Meta-Învățarea antrenează modele pe multe sarcini astfel încât acestea să se poată adapta rapid la sarcini noi cu date limitate, folosind episoade care imită scenarii Few-Shot.
În procesarea limbajului natural (NLP), un chatbot poate învăța să recunoască noi intenții ale utilizatorului după ce vede doar câteva exemple, datorită tehnicilor de meta-învățare.
Învățarea Few-Shot reduce nevoia de seturi mari de date etichetate, scade costurile de adnotare, susține confidențialitatea și permite adaptarea rapidă la sarcini noi.
Începe să construiești propriile tale soluții AI cu chatboți inteligenți și automatizare. Experimentează puterea Învățării Few-Shot și alte tehnici AI avansate.
Învățarea Zero-Shot este o metodă în inteligența artificială prin care un model recunoaște obiecte sau categorii de date fără să fi fost antrenat explicit pe ac...
Învățarea prin transfer este o tehnică sofisticată de învățare automată care permite reutilizarea modelelor antrenate pe o sarcină pentru o altă sarcină similar...
Eroarea de antrenare în AI și învățarea automată reprezintă discrepanța dintre predicțiile unui model și valorile reale în timpul antrenării. Este o metrică che...