Kā atšķirība attiecībā uz ekstrahēšanu (NLP) tiek pārraudzīta, daļēji uzraudzīta un nepārraudzīta?


Atbilde 1:

Pārraudzītā mācībā ir liela datu kopa, kurā ir viss, kas izglītojamajam varētu būt vajadzīgs. Tam ir dokumenti kopā ar visām attiecībām starp vārdiem un vēlamo tekstu. Izglītojamajam jāiemācās veikt šo uzdevumu ar neredzētiem dokumentiem.

Daļēji uzraugot mācības, jums ir liels dokumentu komplekts, un, ja tie ir mazāki, jums ir visi dati.

Neuzraudzītas mācīšanās laikā izglītojamajam ir tikai dokumenti. Tas var meklēt interesantus modeļus, uz kuriem balstās dati. Šiem modeļiem varētu būt nozīme, bet tie var būt arī nejauši artefakti. Kad būs pietiekami daudz datu, būs vieglāk identificēt nozīmīgus modeļus. Tomēr bez uzrauga, kurš apskatīs modeļus, algoritms nespēs tam piešķirt nekādu nozīmi. Piemēram, tas varētu atklāt, ka vārdi “prezidents”, “Obama” un “Barack” bieži notiek vienlaikus vai viens rodas situācijās, kad parasti tiek atrasts arī cits (indikators, ka tie varētu būt sinonīmi). Kopumā nevar secināt, ka tas raksturo cilvēku.