Takaisin uutisiin
Yhteiskunta Työ

Tekoälykehys auttaa lukemaan espanjankielisiä notaarin asiakirjoja automaattisesti

Kuuntele uutinen
0:00 / 0:00
Uusi tekoälyyn perustuva menetelmä pyrkii tekemään espanjankielisistä notaarin asiakirjoista paremmin koneille luettavia. Pedro A. Villa-Garcían, Raúl Alonso-Calvon ja Miguel García-Remesalin työssä on kehitetty kehys, jonka avulla voidaan automatisoidusti poimia olennaista tietoa näistä oikeudellisesti sitovista teksteistä. Notaarin vahvistamat asiakirjat ovat keskeinen osa Espanjan sopimus- ja varallisuusoikeutta. Niissä vahvistetaan esimerkiksi kiinteistökauppoja ja muita sopimuksia tavalla, jota on vaikea kiistää oikeudessa. Niitä käyttävät pankit, vakuutusyhtiöt ja viranomaiset, ja asiakirjoja syntyy vuosittain miljoonia. Niiden käsittely on kuitenkin pitkälti manuaalista, koska tekstit ovat vapaamuotoisia ja täynnä juridista erityiskieltä. Tutkijoiden kehittämä tieto­poiminnan kehys keskittyy nimenomaan espanjankielisiin notaarin asiakirjoihin, joiden rakenne ja kieli poikkeavat tavanomaisesta. Haastetta lisää se, että espanjaksi on tarjolla huomattavasti vähemmän valmiita aineistoja ja kielimalleja kuin esimerkiksi englanniksi. Ehdotettu ratkaisu perustuu niin sanottuun päästä päähän -lähestymistapaan, jossa malli oppii suoraan alkuperäisistä asiakirjoista ja niihin liittyvistä merkityksistä ilman erillisiä, käsin rakennettuja sääntökokoelmia. Tavoitteena on, että järjestelmä pystyy tunnistamaan ja irrottamaan sopimuksista esimerkiksi osapuolet, päivämäärät ja keskeiset ehdot sellaisinaan kuin ne asiakirjoissa esiintyvät. Tutkimus avaa tietä liiketoimintaprosessien automatisoinnille aloilla, jotka nojaavat vahvasti notaarin vahvistamiin asiakirjoihin. Onnistunut tieto­poiminta voisi vähentää paperityötä ja virheitä sekä nopeuttaa päätöksentekoa esimerkiksi pankeissa ja viranomaisissa. Lähde: Information extraction framework for spanish notarized documents using end-to-end data, Artificial Intelligence and Law.

Teksti on tuotettu tekoälyn avulla ja siinä saattaa olla virheitä. Tarkasta tarkat tiedot alkuperäislähteestä.

Alkuperäinen tutkimus: Information extraction framework for spanish notarized documents using end-to-end data
Julkaisija: Artificial Intelligence and Law
Tekijät: Pedro A. Villa-García, Raúl Alonso-Calvo, Miguel García-Remesal
24. joulukuuta 2025
Lue alkuperäinen →