Marko Polojärvi
18Tou/0927

Semanttinen hakukoneoptimointi

Lueskelin tuossa juuri Tuloksen blogista juttua siitä miten Google on nyt oppinut hahmottamaan semanttisia yhtäläisyyksiä. Tuloksen jätkät ovat kuitenkin nykyään jo "kavereita" joten en nyt ala postausta enempää ruotimaan, mutta pakko sanoa että jos asiaa tarkastellaan hakukoneoptimoinnin silmin niin "skaba alkakoon".

Skaballa tarkoitan sitä, että nyt mitataan oikeasti sitä kuka tajuaa ja mitä tajuaa. Katsokaas kun lähitulevaisuudessa, varsinkin kun Wolfram|Alpha tuli, alkaa "hakukoneoptimoijilla" oikeasti tukalat paikat. Ne ketkä ovat opetelleet ulkoa Googlen ranking factorit ei ole mitään saumaa koska nyt pelataan kielellä niin sanotusti ja kärkisijat menevät niille kenellä on kontentti & tietokannat kunnossa. Eli toisin sanoen nyt aletaan vihdoin olla teknisesti siinä pisteessä mitä Google on tavoitellut alusta alkaen eli sisältö olisi oikeasti merkitsevä asia. Kaikki alan jannut tietävät että sivuston koodin muokkauksella ei ole paljoa väliä enää nykyään suuren manipulaatiouhan takia ja rankingit haetaan pääosin ulkopuolisilla linkeillä. Uskoisin, että tähän tulee "hiljainen muutos" kun Googlen algoritmiä päivitellään. Tämä ei tule tapahtumaan yhdessä yössä eikä varmaan edes vuoden kuluessa vaan muutos on kerralla pieni, mutta sitäkin tuhoisampi niille jotka eivät "ymmärrä". Sijoitukset tippuvat sija kerrallaan ja toinen sivu Googlessa lähestyy niin kuin 100 kilon vyötärörengas, kilo/sija kerrallaan.

Mitä tämä maaginen "ymmärrys" sitten on? Se ei ole mitään kovin ihmeellistä vaan tiivistettynä oikeastaan ongelmanratkaisua & hahmottamiskysyä.

Jos ajatellaan ihan sitä perinteisesti optimoitua kotisivua, sehän ei ole sisällöllisesti kovinkaan kummoinen. Siellä on "hakukoneoptimoija" korostanut muutamia sanoja ja sitten tykittänyt jotain tosi laatulinkkejä saman hakusanan variaatioilla jonkun raukkaparan blogiin. Tämä kaikki tulee häviämään kun ruetaan oikeasti mittaamaan mikä on kyseisen hakusanan etsijälle se oikea sisältö. Esimerkiksi "Tampere hieroja" hakusanalla etsivät eivät välttämättä haluakkaan löytää juuri Sepin hierontasalonkia vaan suurin osa saakin suurimman hyödyn Suomen hierojaliiton yleisestä osoitelistasta joka löytyykin eri hakusanalla kuin "Tampere hieroja". Tämä kaikki selviää laskemalla Google Analyticsillä kerättyä dataa. Google voi myös laskea tulossivuilla vietettyä aikaa tallentamalla timestampin jolloin linkkiä klikattiin ja timestampin jolloin seuraavaa linkkiä tuloksissa klikattiin. Googlen hakutuloksiin palaamista ei voi tarkasti mitata koska monesti sivu kaivetaan selaimen cachesta eikä Googlelle lähde välttämättä yhtään pyyntöä selaimesta ellei sitten javaskripti tee jotain. Eihän tuo maailman tarkin tapa ole, mutta onpahan edes jotain dataa siitä mikä tulos toimii parhaiten jos tulossivuilla ei ole Analyticsiä asennettuna. Enkä yhtään epäile etteikö Google vertailisi käyttäjien tekemiä hakuja siihen mihin sivulle käyttäjä loppujen lopuksi päätyi. Otetaan esimerkki. Simo hakee "Tampere hieroja". Ensimmäisenä listassa on www.sepinhieronta.fi jossa Simo vierailee eikä pidä näkemästään ja seuraavaa tulosta klikkaamaan. Pirjonhieronta.fi sivukaan ei tuonut helpotusta koska Pirjo hieroo jossain Hervannassa eikä Treen keskustassa missä Simo asuu ja nyt Simoa alkaa vituttaa. Simo kirjoittaa seuraavaksi "Tampere hieroja keskusta" joilloin tulee täysin optimoimaton Suomen hierojaliiton sivu mikä näyttää Simon mielestä luotettavalta ja hän nappaa sieltä hierojan. Joten Googlen silmissä Simon tie alkoi "Tampere hieroja" hausta ja päättyi Suomen hierojaliiton sivuille, laske 1+1.

Tämä ketju kun toistuu tarpeeksi monta kertaa ei ole vaikea hahmottaa, että ehkäpä Suomen hierojaliiton sivut pitäisi näkyä korkealla "Tampere hieroja" hakusanalla.

Mitenkäs tuota varten sitten voi optimoida? Siinä onkin teille pähkinä purtavaksi. Minulla on jo omat ratkaisuni, mutta kuten sanottu, ne ovat minun ratkaisuni.

Mitenkäs käy sitten hakukoneoptimointialalle? Sen on vain pakko kehittyä ja viisastua. Harrastelijat ja ulkoaopettelijat tippuvat pois mikä on sinänsä ihan hyvä. Yrityksille tämä on toki huono asia, koska kun tälläiseen malliin mennään tarvitaan sisällöntuottajia ja kalliita konsultteja. Konsultointi tulee olemaan tulevaisuudessa yhä suurempi ala hakukoneoptimoinnin puolella. Harva tämän hetken hakukoneoptimoija on kuitenkaan oivallinen sisällöntuottaja ja vielä harvempi osaa tehdä hyvää konsultaatiota.

Mitkä ovat sitten Googlen haasteet ja missä on ne madonreiät mihin ne optimoijat voivat mennä ketkä eivät pärjää "isojen poikien" vauhdissa?

Yksi haasteista tulee olemaan nykyinen sivujen tekotapa ja varsinkin sisällön. Esimerkiksi "betoni Oulu" tuottaa tulokseksi tällä hetkellä pelkkää skeidaa. Skeidalla tarkoitan sisällöllisesti heikkoa tavaraa. Toki siinä on osoitteita, puhelinnumeroita jne. mitkä on varmasti hyödyllisiä "betoni Oulu" termillä hakeville, mutta tässä se haaste onkin. Milloin kyseessä on kaupallinen osoitetietoja halava haku ja milloin info haku? Tämä erottelu onnistuu jo nyt varsin hyvin, mutta tuossa tulee olemaan paljon ongelmia SEO spämmin kanssa kun muualla rankkaaminen vaikeutuu. Mistä tiedetään mikä sisältö on luotettavaa osoitehauissa? Mitä luultavammin domainien trust ränkin merkitys tulee korostumaan entisestään.

Kaiken kaikkiaan tulevaisuus näyttää ruusuiselta niille jotka ymmärtävät mitä Google hakee ja miten aseet käännetään kantajaansa vastaan.

Hyödylliset pikalinkit:
  • Print
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks
  • email
  • LinkedIn
  • Netvibes
  • PDF
  • Ping.fm
  • StumbleUpon
  • Technorati
  • Twitter
Kommentit (27) Paluuviitteet (0)
  1. Itsellä kun ei juuri ole taskussa paikkoja, jonne voi laatulinkkejä syöttää niin on tullut jo google.fi:ä ja yahoo.fi:ä vertailmalla todettua, että vaikka yahoossa olis ollut jo ykkösenä iät ja ajat niin googleen ei ykkössijalle pääse ainakaan millään blogi- ja foorumilinkeillä jos vastassa on joku valtionhallinnon sivu. Mutta jos toi sun ennustus pitää kutinsa niin uudistus saattaa joissain tapauksissa olla jopa etu kun laatulinkkien merkitys siltä osin vähenee. Ainakin meille optimoinnin perusteissa kahlaajille…

  2. Janne, nimenomaan. Jos ja kun luonnollisen kielen ymmärrys teknisesti helpottuu ja paranee niin bloggaajille koittaa entistä paremmat ajat. Mutta itseäni “huolestuttaa” se miten hakukoneet pysyvät sitten puhekielessä mukana mitä bloggaajat usein kirjoittavat. Tai ehkä tästä tulee nyt äidin Kielen opetuksen korvaaja kun on pakko opetella kielioppi että rankkaa jutuillaan ;)

  3. Niin.. Mä sitä vastoin arvelen että blogien rankkauksen laskemiseksi tullaan tekemään paljon töitä, ei siksi etteikö blogeissa olisi hyvää sisältöä, vaan siksi että blogeja ylipäätään on niin paljon että googlesta on pian vaikea muuta löytääkään.

    Googlen käyttäytymisen arvioimisessa olisi tärkeä tietää että mitä Google todellisuudessa on ihmisille tarjoamassa. Meinaan että jos käyttäjä on etsimässä parasta mahdollista hierojaa lähiseudultaan, niin pyrkiikö Google sittenkin tarjoamaan etsijälle ensisijaisesti tietoa hieromisesta?

    Näin voisi kuvitella yksinkertaisesti siitä syystä, että yritysten on erikseen mahdollista ostaa näkyvyyttä AdWordsilla, jolloin palvelua tarjoavat yritykset tulevat löydetyksi sitä kautta.

    Mitä tulee luonnollisen kielen ymmärtämiseen, niin luulen että suomen kieli kaikkine taivutusmuotoineen on Googlelle yksi haastavimmista. Siinä missä monissa muissa kielissa “yhdyssanat” kirjoitetaan erikseen ja monimutkaisten päätteiden sijaan käytetäänkin etuliitteitä, niin suomenkieli nimenomaan karsastaa sanojen viljelemistä perusmuodoissaan.

    Itse todella toivon että Google oppii rinnastamaan sanojen eri taivutusmuodot toisiinsa mahdollisimman äkkiä, mutta arvelen että saamme vielä odottaa vielä pitkään toimivaa ratkaisua. Muistaakseni jokaiselle sanalle noin 15 eri taivutusmuotoa ja lisäksi osaa niistä on mahdollista käyttää samanaikaisesti, eli muuttujia riittää. Asiaa ei auta suomenkielelle tyypillinen ja voimakas astevaihtelu, jonka vuoksi sanojen vartalot muistuttavat eri taivutusmuodoissa yllättävän vähän toisiaan.

  4. Googlehan on itse sanonut mm. Adwords Quality Scoresta, että hyvin suuri osa algosta nojaa käyttäjien reaktioon mainosta kohtaan. Joten uskoisin, että monimutkainen profilointi ja sen yhdistäminen hakutuloksiin tulee kasvamaan. Manipulointikin vaikeutuu, koska Google pystyy loppujen lopuksi aika helposti havaitsemaan profiilit joita ei kannata ottaa huomioon. Esimerkiksi jos miettii Googlen dataa niin heillä on hyvin pitkälti tiedossa kaikki mitä sinä tai minä tehdään linjoilla puhtaasti Analyticsin ansiosta. Se, että Google ei jaa tietojasi eteenpäin ei tarkoita sitä etteikö niitä voitaisi käyttää nyt tai tulevaisuudessa Googlessa sisäisesti.

    Joten ellet sitten pysty luomaan täydellistä kopiota ihmissurffaajasta joka käy surffaa tietyn tyyppisiä juttuja, viihtyy tietyn tyyppisillä sivustoilla tietyn aikaa, lataa kuvat, css:t, ajaa javaskriptit sun muut niin olet aika heikoilla manipulaation kanssa.

  5. Tuosta google-apinan kommentista 15 taivutusmuodon suhteen. Ihan vaan mutulla heittäisin, että noin 5 yleisintä taivutusmuotoa varmaan kattaa 90%. Sama taktiikka toimii vähittäistavarakaupassa, 10% tuotteista tuo 90% liikevaihdosta. Sama toimii maailmantaloudessa. 15% maailman rahasta on kiinni kiintessä omaisuudessa ja lopuilla pelataan päivät bingoa pörssissä.

    Muutenkin luku 15 on vasta alkusoittoa kun siirrytään verbeihin. Ks: http://koti.mbnet.fi/henrihe/tiede/verbikaava.html

  6. Voi hyvä kiesus noita verbien taivutusten määrää! Monikohan suomalainen oikeasti edes tietää, että niitä on noin monta. Minä en ainakaan ollut koskaan törmännyt aiemmin. Tosin tuo 15 muotoa nyt on tuttu ihan content generaattorien koodauksen puolelta.

  7. Aiheeseen liittyvä artikkeli: http://www.tietoviikko.fi/kehittaja/article286629.ece

    Johtuu ehkä laiskuudesta, mutta en ole käyttänyt sivurakenteessa ikinä esimerkiksi address-tagia. Nyt kun katotaan Googlen kaulaa hakukoneena kilpailijoihin verrattuna Suomessa niin on kait vähän pakko nähdä se vaiva, että pistää edes noita ns. semanttisia merkintöjä koodiin.

    Mitenköhän on, kun Googlen hakutulokset jälleen kerran rupeavat eroamaan enemmän muiden tuloksista niin lisääköhän se jossain vaiheessa hakukoneiden sekakäyttöä. Yrittäjät mitkä tippuu Googlen tuloksista, rupeavatkin kertomaan asiakkailleen, löydät meidät myös Yahoosta. Tuskinpa kait.

    Mut toi verbitaulukko on hauska, vaikka se meneekin yli hilseen. Jos joku valittaa, että on verbi kirjoitettu väärin niin voi tuolta heittä jotain tyyliin: eikun se on aktiivin optatiivin perfektin monikon 3. persoona. Täh :-)

  8. Haha, kovin repesin tuolle Tietoviikolle. Nuo semanttisien yhtäläisyyksien tietokannat ovat olleet julkisesti saatavilla jo melkein kymmenen vuotta. Hyvin taas on “asiantuntijatoimittajat” kärryillä asioista. Jopa minä voisin helposti tehdä skriptin joka boldaisi sivulla semanttiset yhtäläisyydet sivuilla.

    Tuohon merkintäpelleilyyn ei kannata mennä mukaan. Se tarjoaa Googlelle ja muille helpon tien eikä pakota kehittymään. Muuten mieti miten epärealistinen tavoite nuo RDF sun muut standardit ovat. Ajatus on hyvä ei siinä mitään, mutta jotta tuo toimisi jokainen sivu webissä pitäisi tehdä uudelleen. Todennäköisyys sille, että tuo tapahtuu on niin pieni ettei sille ole varmaan edes mittayksikköä. Pitäisiköhän jaksaa kysyä Tietoviikon toimittajalta, että kuka tuo taho on joka uskoo noiden tagien lisääntyvän “nopeasti”. Lisää tageihin perustavasta semanttisesta webistä voi lukea täältä: http://www.semiologic.com/2005/02/04/why-rdf-and-the-semantic-web-are-ludicrous-ideas/

    Minusta tuntuu vahvasti, että se täydellinen merkitysten ymmärtäminen on se graalin malja tällä hetkellä. “Google tietää, että autossa on moottori” on ihan samanlainen temppu kuin se, että mun skripti hakee tietokannasta merkityksen “tervehdys” kun mä kirjoitan sille “moi”. Toisin sanoen siis Google ei “tiedä” mitään.

  9. Hyvä perustelu ja ton linkin luettuani jätän tuon kyllä sitten sikseen ja ennemmin vaikka kehittää kirjoittamista.

    Oletko muuten testannut kummalle Google antaa enemmän painoarvoa, kuvan nimeämiselle vai alt-attribuutille? Ihmettelen vain tuota, että Googlen Bloggerissa ei ole työkalua alttien käsittelyyn. Systeemi kyllä lisää tyhjän alt-määritteen, jonka voi käydä html-muokkaustilassa käsin täydentämässä. Mulle ainakin tulee sellainen käsitys, että google ei pidä sitä niin oleellisena… tai sitten se vaan koittaa pitää käyttöliittymän tarpeeks simppelinä.

  10. Tiedoston nimi kuvissa tuntuu vaikuttavan eniten. Alt-tagien käyttö on kuitenkin suositeltavaa, koska ne ovat sokeille tärkeitä. Google on virallisesti sanonut arvostavansa sivuston tekijöitä jotka tekevät sivustoistaan sellasia että kaikki ihmisryhmät voivat niitä käyttää. Tämä tarkoittaa käytännössä validia koodia. Ei sillä mikään järjetön painoarvo ole, mutta todella tiukassa kilpailutilanteessa on pyrittävä tekemään jokainen asia täydellisesti. Tai no ainakin sen kerran kun sitä generaattorin käyttämää templatea tekee ;)

    Mä uskon, että tuo sun käyttöliittymä veikkaus on se kaikista oikein.

    Ajattelin muuten tehdä pitkästä aikaa testin Google image searchin algolle. Joku puolisen vuotta sitten frendi testaili, että siellä oli jonkin sortin OCR käytössä joten ajattelin nyt testata onko OPR:n & OCR:n käyttö kasvanut Googlella. Tuo tuo meinaa ihan uusia ulottuvuuksia image searchilla ratsastamiseen ;)

  11. Noniin, loistava kirjoitus! :)

    Hakukoneoptimoijan työhän on kokoajan muuttuviin olosuhteisiin sopeutumista. Jos katsoo vaikka vuoden takaista hakukoneoptimointia, niin siitäkin lähtien on tullut jo varsin isoja muutoksia siihen miten mikäkin asia vaikuttaa.

    Laadukkaiden ja sisältörikkaiden sivustojen tekeminen on kuitenkin varmasti aina varma tapa päästä hyville sijoituksille hakutuloksissa.

    En kyllä henkilökohtaisesti usko siihen, että Google tiputtaa kovinkaan paljoa linkityksen merkitystä. Enemmänkin ehkä korostaa yhä enemmän laadukkaiden linkkilähteiden arvoa.

    Kannattaa myös muistaa se, että Googlen tavoite ei ole tuoda hyvää mieltä ja parhaita hakutuloksia käyttäjille, vaan saada aikaiseksi mahdollisimman paljon klikkejä asiakkaiden mainoksille.

    En tiedä, tuliko tästä nyt mitään järkevää kommenttia aikaiseksi, mutta pistetään se huomisen vapaapäivän piikkiin :D .

  12. “Kannattaa myös muistaa se, että Googlen tavoite ei ole tuoda hyvää mieltä ja parhaita hakutuloksia käyttäjille, vaan saada aikaiseksi mahdollisimman paljon klikkejä asiakkaiden mainoksille.”

    Jos näin olisi, niin maksulliset tulokset olisivat varmaan naamioitu maksuttomiksi =)

  13. Ei maksullisia voi naamioida maksuttomiksi – osa käyttäjistä klikkaa tarkoituksella maksullisia kun tietää niiden olevan aiheeseen liittyviä yrittäjiä, eikä kotirouvia tai luettelomedioita (IMO).

    Eihän se toimis yöelämässäkään, että maksulliset naamioituis maksuttomiks… toisinpäin ehkä.

    Marko on näköjään säätäny weepeetä sitten viime käynnin, ei toi kommenttihälytys mun mielestä ennen ollut täällä, eikä rss-muistutus.

  14. No ihan sua varten laitoin ;)

    “Eihän se toimis yöelämässäkään, että maksulliset naamioituis maksuttomiks… toisinpäin ehkä.”
    Juu, käy notkumassa vähän paremmissa baareissa niin johan tulee vastaan maksullisia jotka on naamioituneita maksuttomiksi ;)

  15. “Juu, käy notkumassa vähän paremmissa baareissa niin johan tulee vastaan maksullisia jotka on naamioituneita maksuttomiksi ;)

    Näistä ylläripylläreistä tuli mieleen hauska sattuma. Jouduin yllättäen joskus -99 jäämään Hampuriin vuorokaudeks johonkin pikku majataloon lentokentän läheisyyteen. Maanantai-ilta ja kypsä olo ja vitutti. Menin läheiseen pubiin ja kyselin baarimikolta että onko missään mitään menoa maanantaisin. Se käski meneen taksilla keskustaan. Sanoin että perse ei kestä ajella taksilla ni se kirjotti ohjeet miten pääsen metrolla perille. Menin sitten sen paperilapun kans metroon, pummilla kun en osannu käyttää lippuautomaattia. Lapussa oli pysäkkien nimiä, 3. pysäkin jälkeen hyppy vastapäiseen metukkaan ja sitten pari pysäkkiä vielä. Metrossa pari tyyppiä näki kun vilkuilin pysäkkien nimiä ja kysy mihin olen menossa. Näytin lappua ja ne kysy, että etkö sä tiedä mihin sä oot menossa, ravistin päätä niin jätkät repes nauraan ja ojensi lapun takas puhumatta mitään. Lapussa luki St. Pauli – mä olin luullut, että se on Hollannissa :-) Irinalle ostin tuoremehun, en enempää, sitten jouduinkin johonkin prätkäpoikien hevimestaan ja lopusta ei voikaan kirjoittaa omalla nimellä :-D

    Kiitos ruksista, mr refresh poistuu nyt statistiikasta.

  16. Suurin osa peruskäyttäjistä ei osaa erottaa Googlen mainoksia orgaanisista hakutuloksista.

    Viimeksi toissapäivänä jouduin näyttämään kaverille Googlen hakutuloksista, että mitkä on mainoksia, kun se ei uskonut, että Googlella mitään mainoksia olisikaan.

    Eihän osa mainostajistakaan tiedä mikä on maksullisten tulosten ja hakutulosten ero. :D

    Ja eihän siinä nyt hirveästi ole vaivaa käytetty mainosten erottelemiseen. Sama fontti ja samat värit molemmissa. Keltainen tausta tulosten päällä näyttää vain siltä, että nämä tulokset olisivat muita parempia.

  17. Useampi yrittäjä on kysynyt, että millä siihen Googleen ykköspaikalle pääsee. Ens alkuun menin vähän lukkoon tosta ja selittelin jotain niiden maksullisten ja orgaanisten eroista, mutta kyllä se tosiaan taitaa olla noin kuinka Olli meinaa. Monet pitää niitä keltapohjaisia “ykkössijana” kun ei tunnista niitä mainoksiks. Niissä voi olla aika hyväkin klikkiprosentti jos jengi luulee, että ne on ne parhaat tulokset. Kuinka moni sitten noin luulee, ei mitään käsitystä.

  18. Voisiko olettaa, että tulevaisuudessa vahvoilla on ne sivustot, joille tuotetaan säännöllisesti ja runsaasti hyvää sisältöä ko. yrityksen aihepiiristä?

    Ja sori, jos tästä nyt tulee yks linkki, vaikkakin nofollow, mun sivulle… :-)

  19. Ei mulla mitään linkkejä vastaan ole jos kommentoija tarjoaa hyvän kommentin eikä mitään “joo, tosi hyvä kirjoitus” scheisseä. Mielelläni annan linkin – se on vastavuoroisuutta se. Itse asiassa mulla oli dofollow päällä, mutta mihinkähän se on nyt hävinnyt. Pitää joskus tutkia ja toivoa ettei ole templateen hardkoodattu “ominaisuus”.

    Ja vastauksen kysymykseesi saat kun luet tuon postauksen uudestaan ajatuksella ;)

  20. Loippari: Hieno tarinan alku tuo sun seikkailu, mutta jos joskus tuut Turkuun tai mä Forssaan, niin juotan sut kyllä niin känniin että kuulen mitä sitten tapahtui… prkl.. ei tarinasta voi jättää loppuhuipennusta kertomatta!

  21. Ei nyt vesitetä Markon blogia liioilla kännijutuilla – tai ainakin se pitää kompensoida sisällössä. Voit itekin ottaa selvää kun menet St. Pauli:lle tai vastaavalle. Sitten vain hakukoneoptimoit katuja edestakaisin tai käytät hyviä hakusanoja johonkin ihmiseen. Kun löytyy sellainen paikka, missä ikkunateippaukset on hoidettu mattamustalla spraylla, eikä missään oo edes lafkan nimee ja raskas rock tunkeutuu jalkakäytävälle – siellä on menossa internet-markkinointi -seminaari. Sieltä kun haet hyviä vinkkejä hakukoneoptimointiin ja internet-markkinointiin niin tulet painaneeksi hae-napin sijaan kokeilen onneani -nappia ja voit herätä eri paikasta mihin menit nukkumaan, mutta konversioprosentti on hyvä. Sitä voi sitten kotona harrasta analytiikkaa parhailla metodeilla niiden vähien statistiikkojen kanssa, joita on kassalla työntänyt taskuun kun on tilannut taas vähän kotisivuja, konsultointia ja internet-markkinointia. Eli oikeassa elämässä pitää tehdä aina välillä päinvastoin mitä Marko tekee netissä, elikkäs välillä pitää optimoida itelleen, että go with the flow niin tulee kunnon SERP.

  22. Paras kommentti mitä tähän blogiin on tullut. Kyllä tuolla blogrolliin pääsee. Pistetäänkö linkki loippari.comiin ja millä hakusanalla saisi olla? :)

  23. Heh, kiitoksia suuresti :-D Jos mahtuu niin internet-markkinointi Loippari, mut jos on ahtaampi rako niin ihan vaikka Janne Kauppi.

    Öh… onko sun blogrollis jäänyt muuten vanhaan leiskaan vai eikö se vaan jostain syystä lataudu mulle näkyviin…

  24. Pahus, olin jo kommentoimassa tuota linkitettyä verbilistaa, mutta keskustelu olikin edennyt Jannen loistavaan tilitykseen tosielämän hakukoneoptimoinnista. :D Siihen ei enää voi lisätä mitään.

    Tässä kuitenkin se pointtini verbeistä: tuosta upeasta verbilistasta puuttuivat nimittäin frekventatiivijohdokset (käveleskellä, käveleksiä)… Eli pahemmaksi vain menee, jos asiaa ajattelee Googlen kannalta.

    Semanttinen hakukoneoptimointi on onneksi sitä, mitä me humanistit pystymme kenties hieman helpommin tuottamaan. Kun ei ole syntynyt html-lusikka suussa, voi olla tyytyväinen, jos pelkällä sisällöntuotannolla pystyy tekemään edes jotakin.

  25. Katleena:
    Tavutusmuotoja kyllä riittää, kun vielä lisätään käskymuotojen kieltomuodot ja myöntömuodotkin. Suomen kielen ongelma Googlen kannalta onkin nimenomaan se että muutokset tehdään suoraan sanan vartaloon, jolloin tunnistettavuus kärsii.

    Jos katsotaan vaikka tätä listaa: http://koti.mbnet.fi/henrihe/tiede/verbikaava.html niin herää kysymys että kuinka Google pystyy rinnastamaan nuo ja silti tajuamaan että sanat: “kusi” ja “kuusi” tarkoittavat täysin eri asiaa?

    -Ajatusleikki muuttuu vieläkin monimutkaisemmaksi kun otetaan vielä huomioon että esim. ilmaus “ainakin” tarkoittaa kieliopillisesti samaa kuin “myös aina”, mutta on vakiintunut tarkoittamaan samaa kuin “vähintäänkin”. Tämä on toki jo poikkeus, mutta tarkempi tutkiskelu osoittaa että järkyttävän suuri osa taivutusmuodoista on ymmärrettävissä väärin sillä perusteella että luulee alkuperäisen sana-vartalon olevan joku muu kuin mikä se on! …ja mutta mähän jo tuolla ylempänä taisin paasatakin näistä astevaihteluista ja muuttujista joten jätetään se tähän :)

    Se mitä mä epäilen on se, että Googlella olisi mielenkiintoa kehittää suomenkielen ymmärtämiseksi erikseen kauhean monimutkaista algoa, kun kielialuekin on näin pieni. Ensimmäinen kehityskohde lienee kuitenkin englannin kieli, jossa astevaihtelua ei juurikaan esiinny. Sama ratkaisu pelittääkin sitten useimpien maailman kielien kanssa ja me sitten tullaan eskimoiden kanssa viimeisten joukossa. Eskimoiden kieli on kuulemma maailman vaikein:

    Pieni lainaus ( http://www.lausti.com/articles/languages/eskimo.html )
    “Kielen rakennetta kutsutaan polysynteettiseksi. Tällaisissa kielissä lauseen pääsanana olevaan verbiin voi liittyä päätteinä tai etuliitteinä todella suuri määrä erilaisia aikaa, tapaa, todenperäisyyttä, todennäköisyyttä tai muita loogisia suhteita kuvaavia merkitsijöitä sekä elementtejä, jotka osoittavat subjektin, objektin ja lauseen muitten pääjäsenten luvun ja persoonan. Seurauksena on se, että kokonainen täydellinen virke voi muodostua yhdestä valtavan pitkästä sanasta, jonka kirjoittamiseen tarvitaan useita kymmeniä kirjainesiintymiä vaikkapa latinalaisista aakkosista.”

  26. Loistavaa kamaa :)

    Olen täysin samaa mieltä tuosta todennäköisestä kiinnostuksen puutteesta, mutta kuten aiemmin puhuttiin niin googlelle varmasti riittäisi 80% ymmärryskin. Google ymmärtää englantia jo melkoisen hyvin. Tein testejä tuossa vähän aikaa sitten ja jos kiinnostaa niin voisin ne täällä julkaistakkin.

  27. Julkaise ihmeessä. Mua ainakin kiinnostaa.

    Tuo Google-kääntäjä kyllä on aikamoinen. Uskon että siinä on kyllä ratkaisun avaimet tähän vaikeakielisyysongelmaankin pitkällä tähtäimellä.


Jätä kommentti


Ei paluuviitteitä vielä.