Geneettiset algoritmit ja evoluutio

Geneettiset algoritmit ovat tietokoneohjelmia, joita käytetään mm. evoluutiotutkimuksen yhdessä osa-alueessa, populaatiogenetiikassa, tutkimaan sitä, mitkä geenit säilyvät populaatiossa ja missä olosuhteissa. Ne ovat osoittautuneet käyttökelpoisiksi myös monissa muissa sovelluksissa, ja nykyään niitä käytetäänkin pääasiassa muuhun kuin evoluutiotutkimukseen. Ne kykenevät ratkaisemaan ongelmia, joissa tavanomaiset matemaattiset algoritmit eivät ole riittävän tehokkaita, kuten hakuohjelmissa, muuntautumiskykyisten mikrosirujen suunnittelussa tai vaikkapa antennien parhaan muodon etsimisessä.

 

Koska nämä keinotekoiset 'geneettiset' algoritmit näyttävät toimivan evoluution (ts. mikroevoluution) periaatteilla, jotkut evoluution puolesta puhujat väittävät niiden osoittavan, että myös biologinen evoluutio kokonaisuudessaan on voinut saada aikaan kaiken sen informaatiolisäyksen, mitä uusien ja yhä monimutkaisempien organismien rakentumiseen on tarvittu. Geneettiset algoritmit eivät kuitenkaan pysty jäljittelemään tai simuloimaan luonnossa tapahtuvaa biologista evoluutiota useistakin syistä johtuen:

  • Niissä muodostuvat 'ominaisuudet' ovat ainoastaan määrällisiä, ja kaikki kohteen suuntaiset siirtymiset voidaan haluttaessa valita. Tämä riippuu tietenkin siitä, mitä ominaisuutta kulloinkin halutaan tutkia. Useimmat biologiset ominaisuudet ovat kuitenkin laadullisia, eikä niihin sisälly ohjelmaa, mikä ohjaisi niitä askel askeleelta kohti tavoitetta.
  •  
     
  • Geneettisissä algoritmeissa valinnan kohteena on tavallisesti vain vähän ominaisuuksia, koska ne eivät toimi enää kovin, jos kohteita on runsaasti. Elolliset olennot ovat kuitenkin hyvin monimutkaisia. Yksinkertaisimmilla bakteereillakin on jo satoja mahdollisen valinnan kohteeksi joutuvia ominaisuuksia. Jotta GA:t (geneettiset algoritmit) voisivat aidosti testata luonnossa tapahtuvaa selviytymistä, niiden tulisi huomioida kaikki lajin selviytymiseen vaikuttavat ja valinnan kohteeksi joutuvat ominaisuudet.
  •  
     
  • Geneettisiin algoritmeihin perustuvissa simulaatio-ohjelmissa jotain aina säilyy jatkamaan prosessia. Luonnossa ei kuitenkaan ole sääntöä joka sanoisi, että kehittyvä populaatio säilyy huolimatta siitä, miten haitallisia mutaatioita siinä esiintyy. Simulaatioissa pyritään usein keinotekoisesti säilyttämään edellisen sukupolven parhaat 'yksilöt' tai ominaisuudet ja suojelemaan niitä mutaatioilta ja heikentäviltä rekombinaatioilta ellei seuraava iteraatio eli 'sukupolvi' tuota mitään parempaa. Tällainen ohjelma on kuin vääntöräikkä, jossa jokaisen liikahduksen oikea suunta on varmistettu.
  •  
     
  • GA:ssa oikea valintakerroin valitaan usein siten, että jokaisessa sukupolvessa ainoastaan parhaiten selviytyvät tuottavat seuraavan sukupolven 'jälkeläiset'. Valintakerroin on tällöin 1, kun sen todellisessa luonnossa voidaan realistisesti ajatella olevan 0.01 tai vieläkin pienempi. Luonnossa jonkin informaatiota lisäävän mutaation olisi siten käytävä läpi monta sukupolvea, voidakseen levitä koko populaatioon. Nämä muutosten aiheuttamat 'kustannukset' sivuutetaan GA:ssa.
  •  
     
  • Liian korkeista kertoimista seuraa liian suuri 'jälkeläistuotanto'. Esim. bakteerien lukumäärä voi ainoastaan tuplaantua uuden sukupolven myötä. Monet korkeammat eliöt pystyvät vähän parempaan, mutta GA:t tuottavat tavallisesti sadoittain tai tuhansittain 'jälkeläisiä' sukupolvea kohti. Jos reaalimaailmassa esim. tuhannen bakteerin populaatiosta vain yksi selviäisi, kestäisi 10 sukupolvea päästä takaisin tuhanteen.
  •  
     
  • Simulaatioissa yleensä sivuutetaan myös sukupolven luonnollinen ikä. Tietokone voi tuottaa uuden sukupolven sekunnin murto-osassa, kun siihen bakteereillakin menee parhaimmillaan n. 20 minuuttia. Monisoluisilla eliöillä uuden sukupolven syntymiseen menee päiviä, vuosia ja vuosikymmeniä.
  •  
     
  • GA:n mutaatioaste on keinotekoisen korkea. Se on sitä myös pysyvästi, koska 'perimä' on pieni ja keinotekoisesti ohjattu suojelemaan parhaat 'yksilöt' esim. uusilta mutaatioilta. Luonnossa tällainen mutaatiomäärä voisi tehdä kaikista jälkeläisistä elinkelvottomia. Elävien olentojen perimä on kuitenkin varustettu älykkäillä korjausjärjestelmillä kopiointivirheiden minimoimiseksi, mikä vähentää mutaatioiden lopullisen määrän noin yhteen miljardisosaan (ihmisillä).
  •  
     
  • 'Genomi' puolestaan on GA:ssa keinotekoisen pieni ja tekee ainoastaan yhtä asiaa. Todellisuudessa pieninkin genomi sisältää yli puoli miljoonaa emäsparia, jotka koodaavat satoja proteiineja. Tätä voisi verrata yli miljoonan bitin informaatioon tietokoneessa. Vaikka GA voisi käsitellä 1800 bitin todellistakin informaatiota, kuten jotkut ovat väittäneet, sitä voisi verrata vain vähäiseen entsyymiin - ja se olisi kaiken lisäksi saatu aikaan täysin keinotekoisilla mutaatiotiheyksillä, sukupolviajoilla, valintakertoimilla jne.
  •  
     
  • Todellisissa organismeissa mutaatioita tapahtuu kaikkialla genomissa, ei vain yhdessä geenissä tai yhtä ominaisuutta säätelevällä alueella. Tämä merkitsee sitä, että valinnan täytyisi karsia pois kaikki muissa ominaisuuksissa tapahtuvat vahingolliset muutokset, jotta jotkin harvinaiset, toivottavat muutokset tulisivat valituiksi. Geneettisissä algoritmeissa tämä sallitaan. Ohjelma suojaa mutaatioilta muut kuin kohdealueilla olevat. Itse asiassa, ellei näin olisi, koko ohjelma kaatuisi. Elävät organismit eivät ole tällä tavoin mutaatioilta suojassa.
  •  
     
  • Geneettisissä algoritmeissa monimutkaisten muotojen palautumattomuutta ei nähdä ongelmana. Monet biologiset ominaisuudet edellyttävät kuitenkin useiden erilaisten komponenttien läsnäoloa ja niiden toiminnallista yhteensopivuutta sellaistenkin ominaisuuksien kanssa, joita GA:t eivät lainkaan huomioi (kuten proteiinisynteesi, DNA:n kahdentuminen, solujen monistaminen ja uusiutuminen, veren hyytyminen, aineenvaihdunta ym.) Ne eivät myöskään voi huomioida sellaisia tekijöitä, joiden perimmäistä vaikutustapaa ei tunneta, kuten solujen ja geenien välinen viestintä.
  •  
     
  • Myöskin sellaiset tekijät kuin polygenia (johonkin ominaisuuteen vaikuttaa useampi kuin yksi geeni) ja pleiotropia (yksi geeni vaikuttaa useampaan ominaisuuteen) sivuutetaan geneettisissä algoritmeissa. Sen sijaan niissä hyväksytään resessiiviset (peittyvät) geenit, joiden ansiosta todellisuudessa moninkertaistuu se sukupolvien määrä, mikä tarvitaan, jotta ominaisuus tulisi populaatiossa vallitsevaksi. Näin siksi, että peittyvät geenit tarvitsevat luonnossa aina parin tullakseen valituiksi. Tämä peittyvien geenien ongelma johtaa ns. Haldanen dilemmaan. Tunnettu evolutionisti J.B.S. Haldane osoitti geneettiseen teoreemansa perustuen, ettei ole ollut riittävästi aikaa, jotta suvullisesti lisääntyvät organismit olisivat voineet kehittyä alhaisella jälkeläistuotannolla ja suhteellisen pitkillä sukupolvijaksoilla. Päinvastaisessa tapauksessa taas evoluutio pitäisi olla selvästi havaittavissa nykyäänkin.
  •  
     
  • Ihmisen genomiprojektissa on ilmennyt, että yleensä ottaen jokainen geeni koodaa vähintään kolmea erilaista proteiinia. Mikrobeissa geenien on havaittu koodaavan yhtä proteiinia yhteen lukusuuntaan ja eri proteiinia takaperin 'luettuna' tai jos 'lukeminen' alkaa eri kohdasta. Tämä moninkertainen ja varioiva koodaus sivuutetaan GA:ssa. Keinotekoisen geneettisen järjestelmän ohjelmoiminen tällaiseen informaatiiviseen herkkyyteen on tuskin mahdollistakaan.
  •  
     
  • Tietokonesimulaatioissa tulokset ovat aina jossain määrin 'ennaltamäärättyjä' , koska ne toimivat simulaatio-ohjelman asettamissa rajoissa. Ellei toiminnoille olisi asetettu minkäänlaisia raja-arvoja, tuloksena olisi pelkkää kohinaa. Luonnossa ei ole ennalta asetettuja rajoja; luonnonvalinnan mekanismit toimivat monitahoisesti ja suurelta osin täysin sattumanvaraisesti. Lienee mahdotonta laatia ohjelmaa, joka huomioisi kaikki siinä vaikuttavat tekijät. Mikään ohjaavien algoritmien mukaisesti toimiva tietokoneohjelma ei näin ollen voi uskottavasti simuloida todellisuutta.
  •  
     
  • Joidenkin simulaatioiden kohdalla on aiheellista kysyä, paljonko niiden tuottamasta 'informaatiosta' on itse asiassa määritetty jo ohjelmassa, sen sijaan että niissä olisi todella saatu aikaan uutta informaatiota. Ohjelmissa on aina joukko moduuleja ja alirutiineja joiden vuorovaikutustavat on etukäteen määritelty. Geneettinen algoritmi -ohjelma löytää niiden parhaat yhdistelmät ja parhaat vuorovaikutustavat. Valtaosa aikaan saadusta uudesta informaatiosta on jokseenkin merkityksetöntä, huolimatta keinotekoisesti kehitellyistä rajoituksista, joiden avulla nämä ohjelmat saadaan toimiviksi.
 

Ylläolevista ja monista muista syistä johtuen GA:t eivät kelpaa todistamaan evoluutiota. Taskulaskimellakin voi todeta, että reaalimailmassa jo minimaalisen pieniin organismeihin ja niiden muutamaan sataan proteiiniin liittyvä informaatio on niin valtaisa, ettei sitä voida selvittää joidenkin kertautuvien prosessien perusteella. Tuskin edes yhden uudella ominaisuudella varustetun proteiinin kehittymistä.

On olemassa toisen tyyppisiäkin simulaatioita. T.D. Schneider esim. väittää ohjelmansa simuloivan DNA:n luonnollista muodostumista. Hänen kokeilunsa ovat saaneet jotkut uskomaan, että ne todistavat (makro)evoluution todeksi. Schneiderin ohjelma sisältää kuitenkin useita samoja ongelmia, mitä edellä on kuvattu. Siinä esimerkiksi valintakerroin on erittäin suuri, genomi erittäin pieni, mutaatiotiheys suuri, sukupuuton mahdollisuutta ei ole huomioitu jne.

Mutaatiot ja luonnonvalinta voivat toki saada aikaan muutoksia geneettisessä informaatiossa, periaatteessa jopa uuttakin informaatiota. Mikään ei kuitenkaan osoita, että informaatio voisi syntyä itsestään kuolleesta aineesta ja lisääntyä askel askeleelta kohti nykyään tuntemaamme biologista monimuotoisuutta, vaikka aikaa olisi käytettävissä rajattomastikin. Todellisessa maailmassa jo sukupolvien välisen ajan pituus, geenien valtaisa määrä ja organismien selviytymisen ja sopeutumisen kannalta välttämättömien monipuolisten ominaisuuksien syntyminen vaatisivat liian paljon aikaa kehittääkseen olemassa olevan valtavan informaation. Jos mutaatiot ja luonnonvalinta olisivat kyenneet sen tuottamaan, luonnossa pitäisi näkyä siitä esimerkkejä, eli lisääntyvän informaation synnyttämiä uusia, entistä monipuolisempia ominaisuuksia. Niitä ei kuitenkaan ole havaittu. Geneettiset algoritmit voivat olla hyödyllisiä moneenkin tarkoitukseen, mutta nimestään huolimatta ne eivät kykene simuloimaan biologista evoluutiota.

Tietokoneohjelmien käyttämien geneettisten algoritmien avulla voidaan saada aikaan hyvinkin monimutkaisia matemaattisia/graafisia rakenteita ja yhdistelmiä. Niitä synnyttävä 'informaatio' on kuitenkin lähtöisin noista ohjelmista. Periaatteessa esim. parista kymmenestä aakkosesta voisi lopulta syntyä vaikka Kalevala, jos käytettäisiin tietokoneohjelmaa, johon syötettäisiin kaikki Kalevalan sisältämät sanat ja niiden lukumäärä sekä annettaisiin sen tehtäväksi etsiä kaikki mahdolliset sanayhdistelmät. Kalevala sisältää ehkä 20-40 tuhatta sanaa, joten niiden yhdistelmiä on lähes käsittämätön määrä, Windowsin Laskin antaa luvun 25 000 kertomaksi n. 5,5 x 1099093. Nopeat tietokoneet suorittavat miljoonia laskutoimituksia sekunnissa, mutta luonnossa asia on ihan toinen. Lisäksi tällaisella tietokoneohjelmalla olisi selvä ennalta asetettu päämäärä. Jos se poimisi sanoja täysin satunnaisesti ja päämäärättömästi, syntyisi vain tavaton määrä yhdistelmiä, mutta ei Kalevalaa.

Ja vaikka se vastoin todennäköisyyttä syntyisikin, sen sisällöllä olisi informatiivista merkitystä vain sillä edellytyksellä, että lukija ymmärtää kyseistä kieltä. Informaation lähettäjällä ja vastaanottajalla täytyy olla yhteinen kieli, jotta informaatio menisi perille ja vaikuttaisi. Sama koskee geenien sisältämää informaatiota; se olisi merkityksetöntä, ellei vastaanottaja (elimistö, solut, proteiinit) ymmärtäisi sitä. Tämä yhteinen kieli täytyy olla olemassa alusta asti. Lisäksi joka kerta kun sattuma saisi geeneissä aikaan hieman lisäinformaatiota, samanlainen sattuma täytyisi tapahtua myös vastaanottavalla puolella. Jos yksikin vaihe jäisi pois, koko tapahtumaketju katkeaisi. Todennäköisyys, että geenien nykyisin sisältämä informaatio olisi syntynyt sattumien ketjuna on siten lähes nolla.

Lähde: www.answersingenesis.org

Schneiderin ohjelmaa käsitellään laajasti (engl.) sivulla:
www.trueorigin.org/schneider.asp  
 

Päivitetty 18.09.05