
Istraživačica stoji pred pločom koja je prekrivena simbolima. Pokušava izraziti misao kao jednadžbe i logička pravila. Sada zamislite studenta danas. Utipkava pitanje u sučelje za chat i veliki jezični model piše potpun odgovor u sekundama. Oba prizora dijele jedan cilj. Pokušavaju pretvoriti um u matematiku. Ako radite s umjetnom inteligencijom ili planirate karijeru oko nje, razumijevanje kako smo došli do ove točke nije opcija, to je konkurentska prednost. Ovaj članak objašnjava kako je ta ideja oblikovala umjetnu inteligenciju, zašto je važna za vaš sadašnji rad i kamo se polje usmjerava dalje.
Ključne točke
- Umjetna inteligencija je nastala iz napora da se opisuje razmišljanje koristeći preciznu matematiku i računanje. Poznavanje ovog luka pomaže vam prepoznati što današnji sustavi mogu, a što ne mogu učiniti.
- Simbolička AI tretirala je um kao manipulaciju simbola temeljenu na pravilima, dok su se neuronske mreže fokusirale na naučene obrasce koji nastaju iz podataka.
- Moderno duboko učenje i veliki jezični modeli proširuju ove ideje s ogromnim podacima, računanjem i optimizacijom, što stvara novu snagu i nove rizike.
- Izvorno pitanje o potpunom matematičkom modelu uma ostaje otvoreno i oblikuje današnje debate o etici i dizajnu proizvoda.
Od uboćavanja misli do ChatGPT-a: Zašto ova priča ima značaj
AI se nije pojavila iznenada kada su GPU-ovi postali jeftini. Nastala je iz dugog napora da se razmišljanje tretira kao vrsta računanja. Matematičari, logičari i informatičari pokušavali su uhvatiti zaključivanje, učenje i percepciju jednadžbama i algoritmima. Taj napor stvorio je i simboličku AI i moderno strojno učenje. Razumijevanje ovog puta pomaže studentima, inženjerima i istraživačima vidjeti što trenutni sustavi mogu, a što ne mogu učiniti. Povezuje dokaze na ploči s ponašanjem velikih jezičnih modela i s širom povijesnom evolucijom AI. Također pojašnjava zašto se debate o svijesti, pristranosti i usklađivanju stalno vraćaju na ista duboka pitanja o umu.
Što je matematička teorija uma u AI?
Matematička teorija uma u AI je pogled da se razmišljanje može izraziti kao formalno računanje na strukturiranim reprezentacijama. Rani istraživači pokušavali su modelirati zaključivanje, učenje i percepciju koristeći logiku, vjerojatnost, teoriju informacija i optimizaciju tako da strojevi mogu reproducirati ključne aspekte ljudske inteligencije.
Ova ideja ne odnosi se na jednu jedinu teoriju. Opisuje obitelj pristupa koji tretiraju mentalne procese kao algoritme. U ovim pogledima, uvjerenja, ciljevi i percepcije postaju varijable, funkcije i strukture podataka. Misao postaje manipulacija simbola, probabilističko zaključivanje ili numerička optimizacija nad modelima svijeta.
Jedna grana koristila je formalnu logiku za izražavanje valjanog zaključivanja. Oslanjala se na rad Fregea, Russella i Gödela, koji su koristili simbole i pravila za hvatanje same matematike. Druga grana koristila je teoriju vjerojatnosti i statistiku za rukovanje neizvjesnošću i bučnim podacima. Claude Shannon stvorio je teoriju informacija 1948., što je pomoglo istraživačima kvantificirati signale i šum u komunikaciji. Kasnije su Judea Pearl i drugi koristili Bayesove mreže za izražavanje racionalnog zaključivanja pod neizvjesnošću.
Treća grana modelirala je um koristeći mreže jednostavnih jedinica inspirirane neuronima. Warren McCulloch i Walter Pitts opisali su takve jedinice 1943. kao čvorove koji zbrajaju ulaze i primjenjuju prag. To je dalo matematički model neuronskog računanja. Ove neuronske ideje kasnije su se spojile s optimizacijom i linearnom algebrom, što sada podržava duboko učenje.
Ovi pristupi povezuju se s računalnom teorijom uma u filozofiji. Funkcionalistički mislioci poput Hilaryja Putnama i Jerryja Fodora tvrdili su da su mentalna stanja definirana svojim uzročnim ulogama, a ne svojim fizičkim detaljima. U tom pogledu, um se može realizirati u neuronima, krugovima ili kodu, dokgod se odvijaju prava računanja.
Ključne prekretnice u evoluciji AI
- 1943. McCulloch i Pitts objavljuju matematički model umjetnih neurona kao jednostavnih logičkih jedinica.
- 1950. Alan Turing definira test za strojnu inteligenciju u “Computing Machinery and Intelligence.”
- 1956. Dartmouth konferencija, organizirana od strane Johna McCarthyja i drugih, uspostavlja umjetnu inteligenciju kao polje.
- 1957. Frank Rosenblatt uvodi perceptron, rani model neuronske mreže koji se može trenirati.
- 1960-e do 1970-ih Simbolička AI i ekspertni sustavi dominiraju istraživanjem zaključivanja i rješavanja problema.
- 1969. Minsky i Papert objavljuju kritiku perceptrona, što usporava istraživanje neuronskih mreža.
- 1980-e Rumelhart, Hinton i Williams populariziraju backpropagation za treniranje višeslojnih neuronskih mreža.
- 1997. IBM-ov Deep Blue šahovski sustav pobjeđuje svjetskog prvaka Garryja Kasparova koristeći simboličku pretragu i evaluaciju.
- 2012. Duboka neuronska mreža koristeći GPU-ove pobjeđuje ImageNet vizijski izazov s velikom razlikom.
- 2017. Transformer arhitektura, uvedena od strane Vasvanija i suradnika, mijenja obradu prirodnog jezika.
- 2020. GPT-3 pokazuje snažno few-shot učenje koristeći vrlo veliki transformer jezični model.
- 2023. GPT-4 i slični modeli donose konverzacijski generativni AI u svakodnevnu javnu upotrebu i približavaju se Turingovoj originalnoj viziji strojne inteligencije.
Zašto su se rani AI istraživači fokusirali na logiku?
Rana AI nastala je u svijetu gdje je formalna logika upravo transformirala matematiku. Gottlob Frege i Bertrand Russell pokazali su da se veliki dijelovi matematike mogu izraziti simbolima i pravilima. Rad Kurta Gödela otkrio je granice takvih sustava, ali je i dalje koristio striktno formalno zaključivanje. Mnogi znanstvenici vjerovali su da inteligencija, barem djelomično, znači slijediti ispravna pravila zaključivanja.
Elektronska digitalna računala također su sugerirala vezu između logike i strojeva. Krugovi su mogli implementirati logičke operacije poput AND i OR. Claude Shannon je 1938. pokazao da možete dizajnirati krugove koristeći Booleovu algebru. To je podržalo ideju da logički obrasci mogu postojati u hardveru.
Tijekom 1940-ih i 1950-ih, logika i teorija izračunljivosti su sazrijeli. Pružali su jasan način govora o mogućim procedurama i njihovim ograničenjima. Za ljude koji su razmišljali o strojnoj inteligenciji, logika je bila najprecizniji dostupni jezik. Mogla je izraziti izjave, argumente i dokaze, sve u obliku koji su računala mogla manipulirati.
Alan Turing i ideja izračunljive misli
Alan Turing stoji u središtu ove priče. 1936. definirao je apstraktni stroj koji je mogao čitati i pisati simbole na traci. Pokazao je da ovaj jednostavan uređaj može izvršiti bilo koje računanje koje slijedi određenu proceduru. Ovaj rezultat, zajedno s Church-ovim radom, formirao je Church-Turingovu tezu. Tvrdila je da se svaka efikasna metoda može uhvatiti kao računanje.
Turing je primijenio ove ideje na umove. U svom radu iz 1950. “Computing Machinery and Intelligence,” pitao je mogu li strojevi misliti. Izbjegao je nejasne definicije i predložio operacijski test, kasnije nazvan Turingov test. Ako ljudski sudac ne bi mogao pouzdano razlikovati stroj od osobe kroz tekstualni dijalog, stroj bi se po tom standardu smatrao inteligentnim.
Turing je vidio razmišljanje kao proces koji bi mogli provoditi strojevi koji slijede pravila. Također je razumio da bi takvi strojevi trebali učiti i rukovaliti neizvjesnošću. Napisao je da stroj može biti “obrazovan,” a ne samo programiran. Njegov rad uokvirio je inteligenciju kao računanje nad simbolima, što je vodilo kasnije istraživanje u simboličkoj AI i još uvijek utječe na moderne matematičke pristupe AI donošenju odluka.
Simbolička AI: Prvi veliki matematički model uma
Simbolička AI, često nazivana “dobra stara AI,” tretirala je um kao sustav koji manipulira diskretnim simbolima. U ovom pogledu, misli nalikuju rečenicama u formalnom jeziku. Zaključivanje postaje manipulacija ovih rečenica temeljena na pravilima. Hipoteza fizičkog simboličkog sustava, povezana s Allen Newellom i Herbertom Simonom, tvrdila je da fizički simbolički sustav može proizvesti opću inteligentnu akciju.
Rani programi pokušavali su dokazati teoreme i rješavati zagonetke koristeći logiku i pretragu. Logic Theorist, koji su stvorili Newell i Simon 1950-ih, dokazao je mnoge rezultate iz poznatog matematičkog udžbenika. General Problem Solver pokušavao je pronaći nizove koraka koji transformiraju jedan simbolički opis u drugi.
Ovi sustavi oslanjali su se na jasne strukture problema i ručno kodirane pravila. Koristili su pretragu kroz velike prostore mogućih akcija, vođenu heuristikama. Ovaj pristup odgovarao je ljudskom stilu zaključivanja na nekim zadacima, barem u uskim domenama.
John McCarthy i “Artificial Intelligence” agenda
John McCarthy skovao je termin “artificial intelligence” za Dartmouth konferenciju 1956. Vjerovao je da se aspekti učenja i inteligencije mogu opisati tako precizno da ih stroj može simulirati. Stvorio je programski jezik Lisp za podršku simboličke obrade i rekurzivnih struktura.
McCarthy je promovirao AI temeljenu na logici. U njegovoj viziji, inteligentni stroj držao bi tijelo formalnog znanja o svijetu. Izvlačio bi zaključke koristeći logičko zaključivanje i ažurirao bi uvjerenja kada dobije nove informacije. Njegov rad “Programs with Common Sense” predložio je formalni jezik za svakodnevno zaključivanje.
McCarthy i mnogi vršnjaci bili su vrlo optimistični. Neki su predviđali da bi se AI na ljudskoj razini mogla pojaviti u nekoliko desetljeća. Herbert Simon rekao je 1957. da već postoje strojevi koji misle i uče, te da će njihove moći rasti dok ne budu odgovarale punom rasponu ljudskog uma. Ta vremenska crta pokazala se preambicioznom, ali matematička ambicija oblikovala je polje i direktno se ulijeva u ideje o samo-dizajnirajućem stroju.
Ekspertni sustavi i ograničenja ručno izrađenih pravila
Tijekom 1970-ih i 1980-ih, simbolička AI fokusirala se na ekspertne sustave. Ovi sustavi hvatali su znanje ljudskih stručnjaka kao pravila. Tipično pravilo imalo je ako-dio i onda-dio, poput “ako simptom A i rezultat testa B, onda bolest C.” Sustav je primjenjivao ova pravila na nove slučajeve koristeći inferent
