Yhteiskunta Työ

Tekoälykehys auttaa lukemaan espanjankielisiä notaarin asiakirjoja automaattisesti

Kuuntele uutinen

Uusi tekoälyyn perustuva menetelmä pyrkii tekemään espanjankielisistä notaarin asiakirjoista paremmin koneille luettavia. Pedro A. Villa-Garcían, Raúl Alonso-Calvon ja Miguel García-Remesalin työssä on kehitetty kehys, jonka avulla voidaan automatisoidusti poimia olennaista tietoa näistä oikeudellisesti sitovista teksteistä. Notaarin vahvistamat asiakirjat ovat keskeinen osa Espanjan sopimus- ja varallisuusoikeutta. Niissä vahvistetaan esimerkiksi kiinteistökauppoja ja muita sopimuksia tavalla, jota on vaikea kiistää oikeudessa. Niitä käyttävät pankit, vakuutusyhtiöt ja viranomaiset, ja asiakirjoja syntyy vuosittain miljoonia. Niiden käsittely on kuitenkin pitkälti manuaalista, koska tekstit ovat vapaamuotoisia ja täynnä juridista erityiskieltä. Tutkijoiden kehittämä tietopoiminnan kehys keskittyy nimenomaan espanjankielisiin notaarin asiakirjoihin, joiden rakenne ja kieli poikkeavat tavanomaisesta. Haastetta lisää se, että espanjaksi on tarjolla huomattavasti vähemmän valmiita aineistoja ja kielimalleja kuin esimerkiksi englanniksi. Ehdotettu ratkaisu perustuu niin sanottuun päästä päähän -lähestymistapaan, jossa malli oppii suoraan alkuperäisistä asiakirjoista ja niihin liittyvistä merkityksistä ilman erillisiä, käsin rakennettuja sääntökokoelmia. Tavoitteena on, että järjestelmä pystyy tunnistamaan ja irrottamaan sopimuksista esimerkiksi osapuolet, päivämäärät ja keskeiset ehdot sellaisinaan kuin ne asiakirjoissa esiintyvät. Tutkimus avaa tietä liiketoimintaprosessien automatisoinnille aloilla, jotka nojaavat vahvasti notaarin vahvistamiin asiakirjoihin. Onnistunut tietopoiminta voisi vähentää paperityötä ja virheitä sekä nopeuttaa päätöksentekoa esimerkiksi pankeissa ja viranomaisissa. Lähde: Information extraction framework for spanish notarized documents using end-to-end data, Artificial Intelligence and Law.

Teksti on tuotettu tekoälyn avulla ja siinä saattaa olla virheitä. Tarkasta tarkat tiedot alkuperäislähteestä.

Alkuperäinen tutkimus: Information extraction framework for spanish notarized documents using end-to-end data

Julkaisija: Artificial Intelligence and Law

Tekijät: Pedro A. Villa-García, Raúl Alonso-Calvo, Miguel García-Remesal

24. joulukuuta 2025

Lue alkuperäinen →