Sampo-järjestelmien verkosto avaa kulttuuridataa tutkijoille ja kansalaisille

Öljyvärimaalaus, jossa kaksi miestä on kumartuneena työn ääreen tulenhehkuisessa tilassa.

Sampo-järjestelmien verkosto avaa kulttuuridataa tutkijoille ja kansalaisille

Suomessa on kehitetty semanttiseen webiin perustuvia Sampo-järjestelmiä yli 20 vuoden ajan. Niiden avulla kuka tahansa voi selvittää helposti vaikkapa sen, missä esiintyy minkäkinlaisia paikannimiä tai kuka keskeyttää kenenkin puheita Suomen eduskunnassa. Sampo-sarjassa on julkaistu yli 20 järjestelmää ja niillä on ollut miljoonia käyttäjiä.
Eero Hyvönen

Älykkäiden verkkopalveluiden edellytyksenä on, että tietokoneet ”ymmärtävät” verkon sisältöjä. Konetta voidaan opettaa ymmärtämään internetin tekstimuotoisia sisältöjä neuroverkkoja ja syväoppimista käyttämällä. Tästä esimerkkejä ovat tunnetut tekoälysovellukset OpenAI:n ChatGPT ja Google Gemini

Neuroverkkoja käyttävät tekoälysovellukset saattavat toisinaan hallusinoida, eli täydentää tekstiä tekaistulla tiedolla. Niin kutsutun semanttisen webin teknologioissa hallusinoinnin vaaraa ei sen sijaan ole. Semanttinen web tarkoittaa tietoverkkoa, jonka data on luotu siten, että se on ihmiselle ja koneelle ymmärrettävää ja mahdollistaa muun muassa tekoälyn päätelmien perustelemista ihmiskäyttäjälle. Sisältö on siis ihmisvoimin tuotettua luotettavaa dataa.

Semanttinen web laajentaa WWW:n ideaa (Berners-Lee & Fischetti, 1999) esittämällä verkon sisällöt tietämysverkkoina (knowledge graph), linkitettynä datana, jonka merkitys on määritelty logiikan avulla. Logiikan käyttöä ei ole sidottu mihinkään sovellusalaan tai luonnolliseen kieleen ja se soveltuu siksi monialaisen ja monikielisen webin semanttiseksi perustaksi.

Semanttisen webin teknologioiden (Heath & Bizer, 2011; Hyvönen, 2018) avulla voidaan julkaista ja hyödyntää jo olemassa olevia laajoja tietokantoja ja sanastoja, kuten museoiden, kirjastojen ja arkistojen kokoelmatietoja, sosiaalisen median verkostoja tai yritysten tuotekuvauksia. Internetissä on tuhansittain toisiinsa yhdistettyjä tietämysverkkoja, kuten Wikipedioiden sisältöä datana julkaiseva Wikidata. Siitä löytyy esimerkiksi se tieto, että Väinö Linna oli Urjalassa vuonna 1920 syntynyt ja Kangasalalla 1992 kuollut suomalainen kirjailija, ja että Mars on aurinkokuntamme neljäs planeetta, jonka säde on 3390 kilometriä. Jokaisen Facebookin käyttäjän data on osa jättiläismäistä semanttista verkkoa nimeltä Open Graph

Semanttisen webin sovellukset kehittyivät 2000-luvulla

2000-luvun alussa semanttisen webin keskeiseksi tutkimusteemaksi muodostuivat ontologiat (Staab & Studer, 2021), eli mallit, joiden avulla kuvataan reaalimaailman käsitteet ja tieto koneluettavassa muodossa. Sitten huomio kiinnittyi linkitettyyn dataan ja tietämysverkkoihin sekä niiden julkaisuperiaatteisiin datapalveluina ja WWW-sivuille upotettuna merkkauksina. 

Aiheesta kiinnostuivat Googlen ja Yahoon kaltaiset verkkojätit, jotka sopivat vuonna 2015 datan verkkosivuille upottamisessa tarvittavasta Schema.org-ontologiasta. Ne alkoivat kehittää hakukoneiden perustaksi jättiläismäisiä tietämysverkkoja kuten Google Knowledge Graph ja Microsoft Satori. Maailmanlaajuisen tiedon verkon (Web of Data) syntyminen on mahdollista kieli- ja kulttuurirajat ylittävän infrastruktuurin ja standardien avulla tietovarantoja linkittämällä ja dataa rikastamalla. Infrastruktuurityötä koordinoi World Wide Web Consortium (W3C).  (Hitzler, 2022.)

Suomessa semanttisen webin teknologiaa ja infrastruktuuria on sovellettu erityisesti ”Sampo-järjestelmissä”.

Ensimmäisiä kotimaisia alan sovelluksia oli kansainvälisesti palkittu Museosuomi – Suomen museot semanttisessa webissä (julkaistu 2004). Se oli varhainen esikuva nykyisille museokokoelmia aggregoiville verkkopalveluille kuten Finna.fi ja Europeana.eu. Työn kuluessa syntyi visio yhteisen kansallisen semanttisen webin avoimen ”sisältöinfrastruktuurin” luomisesta, joka täydentäisi W3C:n standardien loogista viitekehystä joukolla toisiinsa yhdistyviä alakohtaisia suomalaisia ontologioita. Vision toteuttamiseksi käynnistyi FinnONTO-hankkeiden sarja 2003–2012, jota rahoitti Tekes ja puolensataa suomalaista organisaatiota. 

Työn tuloksena syntyi kansallisten ontologioiden pilvi KOKO ja ONKI.fi-ontogiapalvelu, jotka tuotteistettiin Kansalliskirjastossa vuonna 2014 nykyiseksi Finto.fi-palveluksi − nimi on muistuma FinnONTO-projektista. Viisi vuotta myöhemmin Fintolla oli 280 000 käyttäjää ja sen rajapintoihin tehtiin 32 miljoonaa kutsua vuodessa. ONKI-konseptia laajennettiin linkitetyn datan julkaisemiseen Linked Data Finland -hankkeessa. Siinä toteutettiin LDF.fi-julkaisualusta, jossa on julkaistu kymmenittäin suomalaisia ja kansainvälisiä datapalveluita. Työ jatkuu 2020-luvulla osana Suoman Akatemian rahoittamaa kansallista digitaalisten ihmistieteiden infrastruktuuriohjelmaa FIN-CLARIAHia. (Hyvönen, 2024.)

Sampo-järjestelmät

Suomessa semanttisen webin teknologiaa ja infrastruktuuria on sovellettu erityisesti ”Sampo-järjestelmissä”. Niiden perustana olevan ”Sampo-mallin” ideana on yhteisöllinen julkaiseminen, jossa tiedon julkaisijat voivat rikastaa sisältöjään toisten julkaisijoiden dataa linkittämällä ja uutta tietoa päättelemällä. Näin loppukäyttäjille voidaan tarjota runsaampia tietosisältöjä älykkäämpien käyttöliittyminen ja työkalujen avulla. Avointa tietoinfrastruktuuria ja työkaluja yhä uudelleen hyödyntämällä ja asteittain kehittämällä uusien sampojen kehittäminen on saatu kustannustehokkaaksi, kun pyörää ei tarvitse keksiä joka kerta uudestaan. (Hyvönen, 2023.)

Sammoissa on kaksi erillistä osaa: linkitetyn avoimen datan verkkopalvelu ja sitä hyödyntävä semanttinen Sampo-portaali. Datapalvelua voidaan käyttää digitaalisten ihmistieteiden tutkimuksissa data-analyyseihin SPARQL-rajapintojen kautta. Sampo-portaalin käyttö ei edellytä ohjelmointitaitoa. Sampojen käyttöliittymien keskeinen idea on fasettihaun yhdistäminen data-analyyttisiin työkaluihin, mihin voidaan käyttää Sampo-UI-kehystä (Ikkala ym. 2022). Siinä hakukohteista suodatetaan ensin esiin joukko hakukohteita tekemällä valintoja hierarkkisista, ontologisista faseteista, eli luokitelluista ja toisensa pois sulkevista käsite-kokonaisuuksista. Tämän jälkeen kohteita voidaan tutkia tarkemmin muun muassa tilastollisesti, aikajanoilla, kartoilla ja verkostoanalyyseillä. 

Seuraavassa esitellään eri kulttuurialojen verkossa olevia sampoja esimerkkinä Sampo-mallin mahdollisuuksista, monialaisuudesta ja joustavuudesta. Yhteisen tietoinfrastruktuurin ja keskinäisten linkitysten kautta näistä on kasvamassa orgaanisesti sampojen verkosto, eräänlainen Samposampo.

Kirjasampo.fi (2011) oli alun perin osa Kulttuurisampo.fi-järjestelmää (2008), mutta alkoi pian elämään omaa elämäänsä yleisten kirjastojen ylläpitämänä palveluna, jolla on nykyään vuosittain lähes kaksi miljoonaa käyttäjää, jotka etsivät muun muassa itseään kiinnostavaa kirjallisuutta. Järjestelmän ytimessä on laaja tietämysverkko suomalaisesta kaunokirjallisuudesta. Kirjasammon alkuperäistä käyttöliittymä täydentämään julkaistiin vuonna 2023 uusi Sampo-UI-perustainen data-analyyttinen käyttöliittymä Kirjasampo 2.0. Sillä voi esimerkiksi selvittää, millainen romaani kannattaisi kirjoittaa, jos haluaa saada siitä palkinnon.

Sotasampo.fi:n (2015–2019) semanttiseen verkkoon kuuluu 14,3 miljoonaa käsitteiden välistä yhteyttä. Järjestelmän ytimenä on Kansallisarkiston Menehtyneet-tietokannan tiedot kaikista toisessa maailmansodassa menehtyneestä noin 95 000 sotilaastamme. Sotasammon innovaationa on rekonstruoida automaattisesti jokaisen kaatuneen yksilöllinen sotahistoria dataa eri lähteistä linkittämällä.

Mukana on myös tuhansia sodasta selvinneitä tunnettuja henkilöitä, kuten Mannerheim-ristin ritarit. Puolustusvoimien SA-Kuva-arkistosta on käytössä noin 160 000 autenttisen sota-ajan valokuvan kokoelma. Sotasammossa on tietoa tuhansista sodanajan tapahtumista ja kymmenistä tuhansista luovutetun alueen paikoista historiallisilla kartoilla. Aineistoja on linkitetty automaattisesti toisiinsa ja ulkoisiin aineistoihin, kuten Kansallisarkiston sotapäiväkirjoihin, Suomen Sotahistoriallisen Seuran verkossa julkaisemien Kansa taisteli -lehtien (1957–1986) tuhansiin muisteluartikkeleihin, Wikipediaan, tietoihin maamme sadoista sankarihautausmaista ja Neuvostoliittoon joutuneista tuhansista sotavangeista. 

Sotasampo oli yksi Suomen itsenäisyyden satavuotisjuhlan hankkeita ja se voitti vuonna 2017 LODLAM Open Data Prize ‑palkinnon Venetsiassa. Sotasampoa on käyttänyt yli 1,2 miljoona käyttäjää.

Sotasammon tietoinfrastruktuurin varaan on myöhemmin kehitetty Sotamuistosampo (2021), joka julkaisee Tammenlehvän Perinneliiton ja Kansallisarkiston toimittamia toisen maailmansodan veteraanien haastatteluvideoita semanttisen käyttöliittymän avulla. Sotasurmasampo taas on Kansallisarkiston sisällis- ja heimosotien 1914–1922 uhrien ja taisteluiden tietokannoista kehitetty sovellus.

Biografiasampo.fi:n (2018) ydinaineistona ovat Suomalaisen Kirjallisuuden Seuran (SKS) Kansallisbiografia ja muut pienoiselämäkerrat, yhteensä yli 14000 elämäntarinaa. Niitä on kirjoittanut 980 suomalaista tutkijaa maamme suurimmaksi sanotussa historiantutkimuksen hankkeessa. 

Biografiasammossa elämäkerroista louhittua dataa on rikastettu linkittämällä sitä kuuteentoista muuhun tietolähteeseen sekä automaattisen loogisen päättelyn avulla. Järjestelmän innovaationa oli luoda kieliteknologian, tekoälyn ja semanttisen webin teknologioiden avulla elämäkertojen teksteistä ja niihin eri lähteissä liittyvistä tiedoista semanttinen verkko, linkitetyn avoimen datan palvelu ja portaali. Biografiasammolla on ollut lähemmäs 400 000 käyttäjää.

 

Image
Kaksi kuvakaappausta tietokoneen ruudulta. Erilaisia hakuehtoja ja hakutulokset näyttävä kartta. Vasemmassa kartassa on paljon erilaisia ympyröitä ja nuolia Etelä-Suomen ja muun Euroopan välillä. Oikeassa kartassa on paljon erilaisia ympyröitä ja nuolia lähes koko Suomen alueella ja muutama jatkuu Ruotsiin, Pietariin tai kauemmas meren taa.
Kuva 1. Suomen suuriruhtinaskunnassa Venäjän sotavoimissa palvelleiden kenraalien ja amiraalin (vasemmalla) ja papiston (oikealla) elämänkaarien vertailu Biografiasammossa.

Esimerkiksi kuvassa 1 käyttäjä vertaa toisiinsa kahden ihmisryhmän elämänlankoja, Venäjän sotavoimissa 1809–1917 palvelleita suomalaisia amiraaleja ja kenraaleja (vasemmalla) ja papistoa vuosina 1800−1920 (oikealla). Ryhmät on muodostettu kahdella rinnakkaisella fasettihaulla Biografiasammon elämäkarttojen vertailunäkymässä, jossa elämä kuvataan sinipunaisena nuolena syntymäpaikasta (sininen pää) kuolinpaikkaan (punainen pää). Yhdellä vilkaisulla selviää, että sotilaat liikkuivat pappeja kansainvälisemmin ja elämänsä loppuvaiheessa kohti etelää kuten eläkeläiset nykyään. Kaarta kartalla klikkaamalla pääsee käsiksi kaareen liittyviin elämäkertoihin tarkempaa tutkimusta varten. Esimerkiksi vasemmalla näkyvä kaari Oulusta Länsi-Siperiaan osoittautuu Siperiaan maanmittaustöiden johtajaksi nimitetyn kenraali Gustav Adolf Silverhjelmin kaareksi.

Biografiasammon yhteyshaku-sovelluksissa on otettu ensimmäisiä askeleita kohti selittävää tekoälyä. Siinä käyttäjä voi muotoilla hakufasettien avulla esimerkiksi hakukysymyksen ”Miten suomalaiset taidemaalarit liittyvät Italiaan”. Vastauksena on joukko semanttisen verkon kautta muodostettuja yhteyksiä selityksillä varustettuna, kuten että ”Elin Danielsson-Gambogi vastaanotti Firenzen kaupungin palkinnon vuonna 1899” tai ”Robert Wilhelm Ekman on luonut vuonna 1844 taideteoksen 'Maisema Subiacosta', joka kuvaa paikkaa Italia”.

Nimisampo.fi (2018) julkaisee tietoa Suomen paikannimistä, aineistoina Kotimaisten kielten keskuksen Nimiarkiston kahden miljoonan nimikortin tietokanta, Maanmittauslaitoksen 800 000 paikan Paikannimirekisteri, Sotasammon luovutetun Karjalan paikat ja yhdysvaltaisen Getty-säätiön laaja historiallisten paikkojen TGN-tietämysverkko. Nimisammolla voidaan hakea ja tutkia eri lähteistä paikannimiä ja visualisoida niitä nykyisillä ja historiallisilla kartoilla. Kuvassa 2 Nimisammon käyttäjä vertailee Äijä- ja Ukko-/Ukon-alkuisten paikannimien esiintymistä Suomessa lämpökarttojen avulla ja huomaa merkittävän maantieteellisen eron.

Image
Kaksi kuvakaappausta tietokoneen ruudulta. Molemmissa näkyy erilaisia hakuehtoja sekä Suomen kartta, jossa näkyy hakutulokset. Vasemmanpuoleisessa kartassa on paljon punaisia ja vihreitä merkkejä maan länsiosassa. Oikeanpuoleisessa kartassa on paljon punaisia ja vihreitä merkkejä koko Suomen alueella, mutta kaikkein eniten Itä-Suomessa.
Kuva 2. Nimisampo visualisoi lämpökartoilla Äijä- ja Ukko-/Ukon-alkuisten paikannimien jakautumia Suomessa.

Järjestelmän datapalvelua kyselemällä voi myös helposti selvittää esimerkiksi sen, mikä on Suomen yleisin paikannimi.  Mitalistit ovat: Riihipelto (3699 kpl) kultaa, Mäkelä (3629 kpl) hopeaa ja Rantala (2872 kpl) pronssia. Tulos varmentaa aiemmin saatua tulosta, jonka aikaansaamiseksi tutkijaparka joutui käymään läpi käsityönä pari miljoonaa paikannimikorttia. 

Akatemiasampo.fi (2021) perustuu Turun akatemian ja Helsingin yliopiston ylioppilasmatrikkeleihin, joista on louhittu ja semanttisesti rikastettu avoin datapalvelu ja portaali, hieman vastaavanlainen kuin Biografiasampo.fi. Akatemiasammon aineistot sisältävät yksityiskohtaista tietoa kaikista tiedossa olevista noin 28 000 akateemisen koulutuksen Suomessa saaneista henkilöistä vuosina 1640–1899. Akatemiasammon tietämysgraafissa on noin 6,5 miljoonaa tietojen välistä yhteyttä, esimerkiksi tieto siitä, että tutkimusmatkailija James Cookin miehistöön kuuluneen Turun akatemian ylioppilaan Herman Spöring nuoremman (1733–1771) kuolinpaikka on Intian valtamerellä. Akateemiseen maailman liittyy myös Akatemiasammon tietämysverkkoa hyödyntävä Promootiosampo (2023), johon kerättiin tietoa Helsingin yliopiston filosofisen tiedekunnan 100. promootiosta juhlavuoden kunniaksi.

Löytösampo.fi (2022) on arkeologiaan, kansalaistieteeseen ja Museoviraston löytöaineistoihin perustuva datapalvelu ja portaali. Sen linkitetty data on liitetty yleiseurooppalaisen ARIADNEPlus-palvelun arkeologiseen tietämysverkkoon. Työ jatkuu numismatiikkaan keskittyen Rahasammossa yhteistyössä Kansallismuseon ja British Museumin kanssa. Oopperasampo.fi (2023) taas julkaisee Sibelius-Akatemiassa kerättyä tietoa maamme tuhansista musiikkiteatteri- ja oopperaesityksistä vuosina 1830–1960.

Yhteiskunnallisesti ehkä merkittävin sampo on vuonna 2023 avattu Parlamenttisampo.fi. Eduskunnan päätöksenteon ja lainsäädäntötyön avoimuus ja aineistojen saatavuus on suomalaisen demokratian yksi perusta.  Parlamenttisampo sisältää kaikki eduskunnan täysistuntojen noin miljoona puhetta vuodesta 1907 alkaen linkitettynä datana yhdistettynä biografisiin tietoihin kaikista kansanedustajista sekä ontologiaan eduskunnan toiminnasta. Aineistojen avulla voidaan tutkia poliittista kulttuuria, kieltä ja poliitikkojen verkostoja.

Sampo-järjestelmät eivät korvaa perinteistä primaarilähteiden lähilukua ja tutkimusta, mutta tarjoavat tutkijan työkalupakkiin uudenlaisia välineitä.

Järjestelmällä voi esimerkiksi selvittää, kuka puhui ensimmäisenä NATO:sta (Yrjö Enne, SKDL, 27.5.1959), kuka on pitänyt eniten puheita (Veikko Vennamo, SMP, yli 12600 puhetta 1945–1987) tai kuka viittaa puheissaan keneen ja keskeyttää kenenkin puheita. Eduskunnan toiminnan tuloksena syntyvää lainsäädäntöä ja oikeustapauksia avoimena datana puolestaan julkaistaan oikeusministeriön kanssa taotussa Lakisampo.fi:ssä (2023), joka perustuu Finlex-palvelun aineistoihin. Lakisammon dataa on linkitetty Viron lainsäädäntöön sekä EU-tason sanastoihin ja direktiiveihin, joiden julkaisemisessa käytetään myös linkitettyä dataa.

Sampoja on taottu myös kansainvälisistä aineistoista. Nimisammosta on luotu vastaavanlainen palvelu Norske Stadnamn norjalaisten tutkijoiden toimesta. Mapping Manuscript Migrations (2021) on datapalvelu ja sampo-portaali, joka sisältää linkitettyä metatietoa yli 220 000:sta keski- ja renessanssin ajan käsikirjoituksesta Oxfordin yliopiston Bodleian kirjastosta, USA:n Schoenberg-instituutista ja Ranskan IRHT-tutkimuslaitoksesta. Tällä sammolla voi selvittää ja visualisoida kartalla esimerkiksi sen, missä englantilaisen keräilijän Thomas Phillipsin (1792–1872) kokoelmassa olleet 8575 käsikirjoitusta on tehty, ja missä päin maailmaa niiden viimeiset tunnetut sijainpaikat ovat.

LetterSampo (2022) puolestaan sisältää valistuksen ajan ja myöhempiä kirjeaineistoja perustuen Oxfordin yliopiston yleiseurooppalaiseen EMLO-tietokantaan, Alankomaiden Huygens-instituutin aineistoihin, sekä saksalaisen correspsearch-palvelun dataan, jota on kerännyt Berlin-Brandenburg Academy of Sciences. Sovelluksella voi tutkia ja visualisoida vaikkapa Galileo Galilein (1564–1642) tai Isaac Newtonin (1642–1726) kirjeenvaihtoverkostoja. Samaa Sampo-mallia hyödyntäen on kehitteillä Kirjesampo suomalaisista autonomian ajan 1809–1917 noin miljoonasta kirjeestä Suomen Akatemian rahoittamassa CoCo-tutkimushankkeessa.

Välineitä tutkijan työkalupakkiin

Sampojen kaltaisia, puoliautomaattisesti datasta muodostettuja järjestelmiä käytettäessä tarvitaan aiempaa enemmän lähdekritiikkiä ja ymmärrystä taustalla olevan datan luonteesta, kattavuudesta ja laadusta. Koska aineistot ovat laajoja, ei kokonaisuuden virheettömyyttä voida tarkistaa käsin kuin testimielessä sieltä täältä. Tämä on tyypillistä digitaalisissa ihmistieteissä, joissa käsitellään usein niin laajoja aineistoja, ettei systemaattinen ihmistyö ole mahdollista aineistoja muodostettaessa. 

Laskennallisten tekniikoiden lisäarvo on kuitenkin erityisen suuri juuri tällaista suurdataa (big data) käsiteltäessä ja puutteellinenkin tulos monasti parempi kuin ei mitään tulosta. Sampo-järjestelmät eivät korvaa perinteistä primaarilähteiden lähilukua ja tutkimusta, mutta tarjoavat tutkijan työkalupakkiin uudenlaisia välineitä, jotka helpottavat laajojen aineistojen hakua, selailua ja analyysiä ja auttavat löytämään niistä kiinnostavia ilmiöitä tarkempaa tutkimista varten.

Sampo-sarja on esimerkki paradigman muutoksesta, jossa kulttuurialalla on siirrytty ensin painettujen tekstien julkaisemista verkossa oleviin tietokantoihin hakukoneineen. Seuraavana kehitysaskeleena ovat dataperustaiset järjestelmät, joissa verkkojulkaisuun on integroitu saumattomasti data-analyyttisiä työkaluja digitaalisten ihmistieteiden tutkijoille.  Nyt ollaan ottamassa uutta askelta kohti tekoälyperustaisia järjestelmiä (knowledge discovery), joissa tietokone ei ole vain passiivinen työkalu, vaan voi osallistua aktiivisesti tutkimusongelmien etsimiseen, ratkaisemiseen ja jopa ratkaisujen selittämiseen. 

Douglas Adamsin klassikkoromaanissa Hitchhiker’s Guide to the Galaxy tietokoneelta kysyttiin elämän ja maailmankaikkeuden tarkoituksesta. Koneen antama vastaus ”42” voi olla oikea, mutta olisi mukava tietää myös vastauksen perustelut. (Hyvönen, 2020.)

Artikkelin pääkuva: Akseli Gallen-Kallelan teos Sammon taonta (yksityiskohta). Kuvan lähde: Ateneumin taidemuseo.

Lue myös:

Parlamenttisampo avaa eduskunnan miljoona puhetta ja kansanedustajien verkostot kaikkien tutkittaviksi

Eero Hyvönen on tietotekniikan professori Aalto-yliopistossa ja Helsingin yliopiston Digitaalisten ihmistieteiden keskuksen HELDIG johtaja. Hän on johtanut artikkelissa kuvattuja tutkimushankkeita Aalto-yliopistossa ja Helsingin yliopistossa.

Kirjallisuus

Tim Berners-Lee & Mark Fischetti. 1991. Weaving the Web. The original design and ultimate destiny of the World Wide Web, by its inventor. Barnes & Noble, New York.
Tom Heath & Christian Bizer. 2011. Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on Information Concepts, Retrieval, and Services. Morgan-Claypool, Palo Alto.
Pascal Hitzler. 2021. A Review of the Semantic Web Field. Communications of the ACM, 64(2), 76–83. https://doi.org/10.1145/3397512
Eero Hyvönen. 2018. Semanttinen web. Linkitetyn avoimen datan käsikirja. Gaudeamus, Helsinki.
Eero Hyvönen. 2020. Using the semantic web in Digital Humanities: Shift from data publishing to data-analysis and serendipitous knowledge discovery. Semantic Web 11(1), 187–193. https://doi.org/10.3233/sw-190386
Eero Hyvönen. 2023. Digital Humanities on the Semantic Web: Sampo Model and Portal Series. Semantic Web (14) 4, 729–744. https://doi.org/10.3233/SW-223034
Eero Hyvönen. 2024. How to Create a National Cross-domain Ontology and Linked Data Infrastructure and Use It on the Semantic Web. Semantic Web, 2024. https://doi.org/10.3233/SW-243468
Esko Ikkala, Eero Hyvönen, Heikki Rantala & Mikko Koho. 2022. Sampo-UI: A Full Stack JavaScript Framework for Developing Semantic Portal User Interfaces. Semantic Web (13) 1, 69–84. https://doi.org/10.3233/SW-210428
Steffen Staab & Rudi Studer. 2010. Handbook on Ontologies (2. edition). Springer-Verlag, Berliini.