Keeruline lihtsaks: matemaatika, millega tehisintellekt õpib

5 juuni, 2024

Kristjan Eljand

ärianalüütik-koolitaja

5 juuni, 2024

Lihtne ülevaade matemaatilisest loogikas, mille abil tehisintellekt õpib

Alati on kasulik teada, kuidas asjad toimivad. Käesolevas artiklis annan maksimaalselt lihtsalt ülevaate põhilisest matemaatiliselt loogikast, mida kasutatakse tehisintellekti mudelite treenimisel. Luban, et kui sul on põhiharidus, on järgnevad näited arusaadavad ning mõistad tehisintellekti valdkonda natukene paremini.

Loome tehisintellekti müügitulu prognoosimiseks

Oletame, et me soovime luua uut tehisintellekti mudelit, mis prognoosiks meie ettevõtte müügitulu. Andmetena on meil kasutada eelneva kahe kuu müügitulu, reklaamikulu ja toote hinnad.

Teisisõnu soovime me luua mudeli, mis ütleks, kuidas sõltub meie müügitulu meie toote hinnast ja reklaamile tehtud kuludest. Sellise tööriista abil saaks turundusspetsialist näiteks arvutada, et kui ta teeks 50 € eest reklaami ja paneks toote hinnaks 6 €, siis milline oleks tema müügitulu.

Tehisintellekt on matemaatiline valem

Tehisintellekt ei ole oma baasolemuselt midagi muud kui matemaatiline valem (või valemite kogum). Meie müügiprognoosi näite võiks matemaatilise valemina esitada nii:

Valem on küll olemas, kuid me ei tea, millised väärtused peaks andma mudeli parameetritele m ja n. Teisisõnu, me ei tea, kui palju mõjutab reklaamikulude suurendamine ja toote hinnaga mängimine meie müügitulu.

Hakkame õppima

Kui me hakkame tehisintellekti treenima, võime anda mudeli parameetritele suvalised väärtused. Näiteks paneme esmalt reklaamikulu parameetri väärtuseks 2 ja hinna parameetri väärtuseks -2.

Ja nüüd ei ole midagi muud, kui et proovime läbi. Kui korrutame reklaamikulu ja toote hinna parameetrite väärtusega, siis näeme, et meie algne mudel on liiga optimistlik. Esimesel kuul oli tegelik müügitulu 5 €, kuid meie mudel prognoosis 30 €. Teisel kuul oli tegelik müügitulu 18 € ja meie mudel prognoosis 52 €.

Hakkame õppima

Tehisintellekti õppimise reegel on järgmine:

Kui viga on 0, siis on mudel täiuslik;
Kui viga on >0, siis mudel andis liiga optimistlik tulemuse ning me peaksime vähendama positiivse väärtusega muutujate parameetreid ja suurendama negatiivse väärtusega muutujate parameetreid;
Kui viga on <0, siis mudel oli liiga pessimistlik ning me peaksime suurendama positiivse väärtusega muutujate parameetreid ja vähendama negatiivse väärtusega muutujate parameetreid.

Järgides õppimise reeglit, peame me vähendama mõlemat parameetrit, sest nii reklaamikulu kui ka toote hind on meil positiivse väärtusega muutujad. Näiteks vähendame reklaamikulu parameetri väärtuse 2 pealt 1 peale ja hinna parameetri väärtuse -2 pealt -3 peale.

Kui proovime uuesti arvutada, siis näeme, et meie mudel prognoosib täpselt (isegi väga täpselt, sest viga on 0). Tore, meie esimene manuaalselt treenitud tehisintellekti mudel on valmis.

Testime mudelit andmete peal, mida treenimiseks ei kasutatud

Kui teile tundub, et ülaltoodud mudel on liiga hea, et olla tõsi, siis teil on õigus. Meie mudel töötas suurepäraselt treeningandmete peal. Selleks, et anda hinnang mudeli täpsusele, tuleb seda testida andmete peal, mida treeningprotsessis ei kasutatud.

Me treenisime oma mudeli jaanuari ja veebruari andmete peal. Kontrollime nüüd, kui hästi suudab mudel ennustada märtsi ja aprilli müügitulu.

Ülaltoodud tabelist näeme, et mudel prognoosib märtsi müügituluks 28 € (tegelik 24 €) ning aprilli müügituluks 21 € (tegelik 18 €). Keskmiselt eksib meie mudel uute andmete peal seega 3.5 euroga ning seda võime nimetada ka oma mudeli täpsuseks.

Kokkuvõte

Kokkuvõttes on tehisintellekt oma baasolemuselt matemaatiline valem. Meie näites oli valemil 2 parameetrit, GPT-4 mudelil on rohkem kui triljon (1 triljon = 1 000 000 000 000) parameetrit. Mõlemad on aga treenitud samal põhimõttel: muutes mudeli parameetreid järk-järgult selles suunas, et mudeli viga vähendada.

Oluline on ka meelde jätta, et tehisintellekt õpib treeningandmete peal, aga tema täpsusele saab hinnangu anda vaid andmete peal, mida treenimisel kasutatud ei ole (testandmed).