Revolution i AI: Ny metod gör det möjligt att styra ChatGPT:s tankar

Forskare vid UC San Diego har utvecklat ett sätt att styra stora språkmodeller som ChatGPT – med kirurgisk precision. Genombrottet kan förändra hur vi bygger och litar på AI.

Tänk dig att kunna vrida på en ratt och bestämma exakt hur en AI-modell ska bete sig. Inte bara vad den ska säga – utan hur den tänker.

Det är precis vad ett forskarteam lett av Mikhail Belkin vid UC San Diego har lyckats med. Genom en metod som låter dem identifiera och justera interna funktioner i språkmodeller som ChatGPT och Gemini, har de hittat ett sätt att ”styra” AI:n på djupet – och minska risken för farliga, felaktiga eller fördomsfulla svar.

– Det är som att vi förstår ingredienserna i AI:s tårta, inte bara ser det färdiga bakverket, säger Belkin.

Forskarnas teknik bygger på något de kallar icke-linjär funktionsinlärning. Genom att studera AI-modellernas interna aktivitet – lager för lager – kunde teamet kartlägga vilka mönster som hänger ihop med till exempel toxicitet, hallucinationer eller språklig noggrannhet.

När de väl visste var problemet satt kunde de styra modellen att bete sig annorlunda. Resultatet? AI:n blev mindre skadlig, mer faktabaserad – och kunde till och med justeras för att förstå Shakespeare eller skriva poesi.

– Vi får en inblick i AI:ns ”tankemönster”, säger Belkin. Och vi kan börja påverka dem.

Förutom att göra AI säkrare öppnar tekniken för effektivare modellutveckling. Genom att fokusera på rätt delar av modellen tror forskarna att man kan minska behovet av enorma datamängder och dyra resurser – något som idag ofta bara är tillgängligt för techjättar.

Det kan bana väg för specialanpassade AI-system: en medicinsk assistent som alltid ger saklig vårdinformation, eller en skrivpartner som aldrig återanvänder klyschor eller stereotypa uttryck.

Koden är dessutom öppen – fri för andra forskare att bygga vidare på.

– När AI blir en del av vår vardag måste vi förstå och kunna vägleda dess beteende, säger Rajesh Gupta, professor vid UC San Diego.

– Det här är ett viktigt steg mot en mer pålitlig, rättvis och mänsklig AI.

Källa:

How do neural networks learn? A mathematical formula explains how they detect relevant patterns

Bild av: phys.org

Populärt just nu!

Revolution i AI: Ny metod gör det möjligt att styra ChatGPT:s tankar

En AI med moralisk kompass?

Billigare och bättre AI – för alla

By Linus

Lämna ett svar Avbryt svar

Du missade väl inte?

AI:s presenttips till 5-årsjubileet: knivar, knivar och… fler knivar?

De tänker inte – de gissar”: Apple slår tillbaka mot AI-hajpen

Som internet 1995, som Bitcoin 2013 – därför kan AI-bolagen bli årtiondets bästa investering

Svenska fondens AI-strategi: Därför tror de på techjättarna

Om AINytt.com

Kontakta oss

Friskrivning

Populärt just nu!

Revolution i AI: Ny metod gör det möjligt att styra ChatGPT:s tankar

En AI med moralisk kompass?

Billigare och bättre AI – för alla

By Linus

Relaterade inlägg

AI:s presenttips till 5-årsjubileet: knivar, knivar och… fler knivar?

De tänker inte – de gissar”: Apple slår tillbaka mot AI-hajpen

AI-verktyget som avslöjar din partners Tinder-konto – nu sprider sig Cheaterbuster till Sverige

Lämna ett svar Avbryt svar

Du missade väl inte?

AI:s presenttips till 5-årsjubileet: knivar, knivar och… fler knivar?

De tänker inte – de gissar”: Apple slår tillbaka mot AI-hajpen

Som internet 1995, som Bitcoin 2013 – därför kan AI-bolagen bli årtiondets bästa investering

Svenska fondens AI-strategi: Därför tror de på techjättarna

Om AINytt.com

Kontakta oss

Friskrivning