Testissä Nuancen suomenkielinen puheentunnistus – saatavilla ensi viikolla Applen laitteille

Applen iPhone 4S:n merkittävin uusi ominaisuus oli sen älykäs, puhumalla käytettävä Siri-ääniassistenttitoiminto. Sirin myötä erilaiset äänikomennot sekä puheentunnistustoiminnot ovat viime aikoina olleet vahvasti esillä.

Suomalaisesta näkökulmasta erilaiset puhetoiminnot ovat olleet toistaiseksi varsin epäolennaisia, sillä tukea suomen kielelle ei ole löytynyt. Nyt Nuance Communications on kuitenkin tuomassa markkinoille omat suomalaista puheentunnistusta tukevat sovelluksensa – tekstinsyöttöön tarkoitetun Dragon Dictationin sekä hakusovellus Dragon Searchin.

Uudet suomen kieltä tukevat ilmaiset sovellukset tulevat saataville ensi viikon keskiviikkona, 23. marraskuuta, Applen App Storen kautta iPhone-, iPad– ja iPod touch -laitteille. MobiiliBlogi on nyt kuitenkin jo luonut ensisilmäyksensä tuleviin sovelluksiin.

Dragon Dictation on uudesta sovelluskaksikosta merkittävämpi ja monipuolisempi. Se mahdollistaa tekstinsyötön puhumalla. Sovelluksen toimintaperiaate on tuttu: paina nappia, puhu ja lopeta, minkä jälkeen sovellus esittää tulkintansa puheesta tekstinä näytöllä. Tämän jälkeen käyttäjä voi joko siirtää puhumansa tekstin yhdellä painalluksella tekstiviestin tai sähköpostin kirjoitusnäkymään, kopioida sen ja liittää haluamaansa sovellukseen tai jakaa Facebookissa tai Twitterissä.

Mutta kuinka hyvin suomenkielinen puheentunnistus toimii?

Suomihan on yleisesti ottaen varsin hankala kieli koneelliselle puheentunnistukselle rakenteensa vuoksi. Verrattuna esimerkiksi englannin kieleen, jossa taivutus tapahtuu erillisillä sanoilla tapahtuu suomen kielessä taivutus sanojen ”sisällä”.

Nuancen suomenkielinen puheentunnistus toimii jo nyt kohtalaisesti. Mikäli ympärillä on hiljaista ja puhuu selkeästi, pääsee tunnistus usein varsin hyvään lopputulokseen. Ongelmia aiheuttavat kuitenkin esimerkiksi jotkin erisnimet sekä varsin usein väärin menevät sanojen taivutukset ja loppuosat. Sovellus kysyy ensimmäisellä käyttökerralla lupaa liittää käyttäjän yhteystietojen nimet tietokantaansa, mutta tästä ei ole apua muiden erisnimien kuten yritysten, palvelujen tai muiden nimien suhteen.

Lisäksi luonnollisesti tunnistuksen toiminta käytännössä vaatii kirjakielen käyttöä ja on melko herkkä taustahälylle. Tunnistusherkkyys laskee nopeasti taustamelun kasvaessa. Sovelluksen tunnistamaa tekstiä voi korjailla käsin näppäimistöllä, mutta se on varsin rasittavaa puuhaa.

Itse olin myös havaitsevani toistaiseksi alle vuorokauden käytön aikana, että lyhyet ja lauserakenteiltaan yksinkertaiset tunnistukset sujuivat paljon, paljon paremmin kuin pidemmät ja rakenteeltaan monimutkaisemmat lausahdukset. Tähän tosin syynä saattaa olla järjestelmän toiminnan sijaan myös ihmisen toiminta: kun teksti käy pidemmäksi, pienenee keskittyminen, ääntämisen selkeys heikkenee ja näin tunnistuksen työ käy vaikeammaksi.

On myös syytä huomauttaa, että suomalaisen puheentunnistuksen laadun pitäisi parantua koko ajan. Kun Nuancen sovelluksia nyt aletaan käyttää suomen kielellä, tulee se jatkuvasti keräämään paljon tietoa uusista sanoista, jotka jatkuvasti vahvistavat sen sanavarastoa.

Itse kaipasin Nuancen sovelluksiin myös jonkinmoista tukea muistiinpanotyyppiselle toiminnolle. Toistaiseksi muistiinpanojen osalta Dragon Dictation on hieman rampa, vaikka toki tekstin manuaalisesti kopioiminen eri muistiinpanosovelluksiin onnistuukin. Muistiinpanot vain olisivat yksi hyvä käyttötarkoitus puheentunnistukselle, jossa myös ainakaan pienimmillä virheillä tunnistuksessa ei olisi niin suurta merkitystä kuin teksti- ja sähköpostiviesteissä tai Facebook- ja Twitter-päivityksissä. Tämä ongelma tosin tullee korjaantumaan, kun kolmansien osapuolten muistiinpanosovellukset saavat myös Nuancen suomen kielen tunnistuksen tuen. Nuancen teknologiahan toimii useiden muiden sovellusten taustalla ja itse asiassa myös Applen Sirin puheentunnistuksen toimintaa pyörittää (epävirallisten tietojen mukaan) Nuance.

Toinen uusista sovelluksista, Dragon Search, toimii puheentunnistuksen osalta samoin kuin Dictation-sisarsovelluksensa, mutta on tarkoitettu hakujen tekemiseen. Tuettuja haettavia palveluja ovat Google, Wikipedia, Twitter, YouTube sekä iTunes. Hakusovellus on itsessään varsin yksinkertainen eikä sen toiminnasta ole juuri lisää kerrottavaa.

Onko puheentunnistuksesta sitten jokapäiväiseen käyttöön? Luonnollisimmat tarpeethan puheentunnistukselle on tilanteissa, joissa puhelimen näpyttely on hankalaa – esimerkiksi autoa ajettaessa tai liikkuessa kävellen tai muulla tavoin. Puheentunnistus voi myös olla hyvin toimiessaan ainakin joillekin käyttäjille näpyttelyä nopeampi tapa syöttää tekstiä.

Se, kuinka hyödylliseksi itse kukin uudet Nuancen Dragon-sovellukset tulee mieltämään, riippunee paljolti omista laitteen käyttötarkoituksista. Esimerkiksi itselleni loppupeleissä sovellukset eivät tule luultavasti tarjoamaan kovinkaan paljon hyötyä, koska en puhelimella muutenkaan kirjoita paljoa tekstiä.

Paras juttu Nuancen uusissa sovelluksissa eivät olekaan ne itse, vaan se mitä ne lupaavat tulevaisuudesta. Jatkossa Nuancen suomen kielen puheentunnistus laajentuu osaksi monia muita sovelluksia, jolloin esimerkiksi muistiinpanojen tallentaminen saattaa onnistua nykyistä kivuttomammin. Lisäksi suomenkielinen puheentunnistus periaatteessa luo perusedellytykset sille, että Applen Siri-ääniassistentti voisi muutaman vuoden sisällä kenties puhua myös Suomea.

Ja vaikka Nuancen uudet sovellukset ja puheentunnistus eivät missään nimessä täydellisiä olekaan, ovat ne aika vakuuttavia. Puheentunnistuksen toimiessa ei voi kuin vain ihmetellä, kuinka paljon tekniikka onkaan kehittynyt viime vuosien aikana.

Nuancen uusia sovelluksia kannattaa ainakin kokeilla ensi viikolla niiden tullessa saataville Applen laitteille. Hyödyllisyys omalla kohdalla riippuu paljolti omista tarpeista, omasta puhetavasta ja omasta käyttöympäristöstäkin. Kokeilemisen arvoisia uudet sovellukset joka tapauksessa ovat ehdottomasti – varsinkin uutuuksien ollessa ilmaisia.

7 kommenttia

  1. Alta löytyy huvin vuoksi artikkeli oman, kenties liian nopean ja kiivaan lukemistahdin ja Dragon Dictationin tunnistuksen muokkaamana. Kuten alta voi huomata, ei täydellisyyteen päästä. Nimet ovat hankalia, kuten ovat myös monimutkaisemmat rakenteet. Tätä ei kuitenkaan pidä ottaa aivan täytenä esimerkkinä sovelluksen toiminnasta, sillä nopeasti luettu teksti on eri asia kuin rauhallisemmin ilmaistu parin rivin muistiinpano.

    Apple iPhone 4 sen merkittäviin uusi ominaisuus oli sen älykäs puhumalla käytettävä silittänyt assistenttitoiminta. Siirin myötä erilaiset äänikomennot siitä puheentunnistustaimet ovat viime aikoina olleet vahvasti esillä

    suomalaisten näkökulmasta erilaiset puhettaan nyt ovat ole toistaiseksi varsin epäolennaisia sillä tukea suomenkielellä ei ole löytynyt. Nyt minulla on se communications on kuitenkin tuomassa markkinoille omat suomalaiset puheentunnistusta tukevat sovelluksensa-tekstinsyötön tarkoitetun Dragondikteissä niin sitä haku sovellus Dragonin Tshekin

    uudet suomenkieltä tukevat ilmaiset sovellus tulevat saataville ensi viikon keskiviikkona, kahdes myös 3.. Marraskuuta, Applen app Storen kautta iPhone iPad ja iPod touch laitteiden mobiiliblogi on nyt kuitenkin ja luonut ensi silmäyksellä se tuleviin sovelluksiin

    Dragondikteissä on uudesta sovellus kaksikosta merkittävämpiä monipuolisempi se mahdollistaa tekstinsä tän puhumalla. Sovelluksen toimintaperiaate on tuttu: Painappia, puhu ja lopeta minkä jälkeen sovellus esittää tulkintansa puheista tekstinä näytöllä. Tämän jälkeen käyttäjä voi joko siirtää puhumassa tekstin 1 painalluksella tekstiviesti tai sähköpostinkirjatys näkymään, kopioida sen ja liittää haluamasi sovelluksen tai jakaa Facebookissa tai Twitteristä.

    mutta kuinka hyvin suomenkielinen puheentunnistusta

    Suomihan on yleisesti ottaen varsin hankala kielikonelliselle puheentunnistuksen rakenteensa vuoksi. Verrattuna esimerkiksi englanninkielen, jossa taivutus tapahtuu erillisellä sanoilla tapahtuu suomen kielessä taivutus sanojen sisällä

    moisen suomenkielen puheen toiminnassa tunnistus toimia nyt kohtalaisesti mikäli ympärillä on hiljaista ja puhun selkeästi, pääset omistus usein varsin hyvään lopputulokseen. Ongelmia aiheuttavat kuitenkin esimerkiksi jotkin erisnimet sitä varsin usein väärin menevät sanojen taivutukset ja loppuosa. Sovellus kysyi 1. käytti kerralla lupaan niitä käytetään yhteystietojen niin ettei tietokantaansa, että tästä ei ole apua muiden erisnimien kuten yritysten, palvelujen tai muiden nimien suhteen

    lisäksi luonnollisesti tunnistuksen toiminta käytännössä vaatii kirjakielen käyttöä ja on melko herkkä täys pahalle. Todistus herkkyys laskee nopeasti Taustana on kasvussa. Sovellus on tunnistamaan tekstiä voi korjailla käsin näppäimistöllä, mutta se on varsin rasittavaa puuhaa

    itse olen myös havaitsemaan niin toistaseksi alle vuorokauden käytön aikana, että lyhyet ja lauserakenteen tänne yksinkertaistui nyt sängyssä hyvät paljon, paljon paremmin kuin pidemmät rakenteeltaan monimutkaisemmat lausahdukset. Tähän tosin siinä saattaa olla järjestelmän toiminnan sijaan myös ihmisen toiminta: kun teksti käy pidemmäksi pienenee heti keskittyminen ääntämisen selkeys heikkenee heitunnistuksen työ käy vaikeammaksi.

    On myös syytä huomauttaa, että suomalainen puheentunnistuksen laadun pitäisi parantua koko ajan. Kun naisen sovelluksen etu aletaan käyttää suomenkielellä, tulee se jatkuvasti keräämään paljon tietoa uusista sanoista, jotka jatkuvasti vahvistavat sen sanavarastoa.

    itse kaipaisin vain sen sovelluksia myös jonkinmoista tukea muistiinpanotyyppiselle toiminnalle. Tästä Sex muistiinpanojen osalta rakon edistämiseen on hieman rampa, joka toki teksti manuaalisesti kopioiminen eri muistiinpanosovelluksen onnistui. Muistiinpanot vain olisivat 1 hyvä käyttötarkoitus puheentunnistusta, jossa myös ainakaan pienemmillä virhetodistuksessa ei olisi niin suurta merkitystä kuin teksti ja sähköpostiviestissä tai Facebook Twitter päivityksessä. Tämä ongelma tosin tulee korjauttamaan, kun 3. osapuolten muistiinpano sovellukset saavat myös millaisen suomen kielen tunnistuksen tuen. Naisen teknologian toimivuuden muiden sovellusten taustalla itseasiassa myös Applen Siivin puheentunnistusta toimintaa pyörittää (epävirallisten tietojen mukaan) Nuance.

    2. uusista sovelluksista, yläkantissa yks, toimii puheen tunnistuksen osalta samoin kuin diktaattori sisar sovelluksensa, mutta on tarkoitettu hakujen tekemiseen. Tunnettuja haettavia palveluja ovat Google, Wikipedia, Twitter, jutut sekä aitiossa. Hakusanan sen itsessään varsin yksinkerta mikä sen toiminnassa ole juuri muuta lisää kerrottavaa.

    Onko puheentunnistuksensta sitten jokapäiväiseen käyttöön? Vaarallisimmat tarpeet on puheentunnistuksella on tilanteissa, joissa puhelimen näpy tulla hankala-esimerkiksi autoa ajettaessa tai liikkuessa kävellen tai muulla tavoin puhetta. Puheentunnistus voi myös olla hyvin toimia sen ainakin joillekin käyttäjille näpytellä nopeampi tapa syöttää tekstiä

    Se, kuinka hyödylliseksi itsekukin uudenlaisen vieraiden sovellus tulee mieltämään, rikkoneen paljolti omista laitteen käyttötarkoituksesta. Esimerkiksi itselleni loppupeleissä sovellusta eivät tule luota sitä viemään kovinkaan paljon hyötyä, koska puhelimeen muutenkaan kieltä paljon tekstiä.

    paras juttu ruotsin uusissa sovelluksissa eivät olekaan erikseen, vaan ne mitä ne lupaavat tulevaisuudesta. Jatkossa naisen suomenkielen puheentunnistus laajentuu osaksi monia muita sovelluksia, joten esimerkiksi muistiinpanoja tallentaminen saattaa onnistua nykyistä kivuttomammin.. Suomen kielen puheentunnistus periaatteessa nuo perus edellytykset sille, että Applen siivitti ääni assistentti voisi muutaman vuoden sisällä kenties puhua myös suomea.

    ja vaikka olen sen uudet sovellukset ja puheen tunnistus eivät missään nimessä täydellistä olekaan, olen aika vakuuttavia. Tulen todistuksen toimesta ei voi kuin vain ihmetellä, kuinka paljon tekniikka onkaan kehittänyt viime vuosien aikana.

    nuorten uusia sovelluksia kannattaa ainakin kokeilla ensi viikolla niiden tullessa saataville Apple vaihtelee. Hyödyllisyys omalla kohdalla riippuu paljolti omista tarpeista, omasta puhetavasta ja omasta käyttöympäristöstakin. Kokemisen arvoisia uuden sovelluksen joka tapauksessa ovat ehdottomasti-varsinkin kutosen ollessa ilmaisia

  2. Hyvä, että joku jaksaa vääntää punteentunnistusta suomelle! Vaikuttaa jutun perusteella jo ihan pätevältä. Toivottavasti paranee jatkossa.

    Onkohan tämä tulossa myöhemmin myös muille alustoille?

  3. Tuleeko tämä vain applen ”koneille”, vai voiko odottaa esim. Androidille tai Sympparille, onko tietoa?

  4. Esimerkin perusteella puheentunnistus vaikuttaa olevan betan tasolla. Ehdottomasti tulen kokeilemaan sovellusta kun se saapuu saataville, mutta esimerkin perusteella on turha odottaa liikoja.

  5. Näkörajoitteiselle mahtava toiminto, nyt käytän Applen laitteissa VoiceOver toimintoa , ipad2 , iPhone 4s ja iBook pro. VoiceOver puhuu kaiken mihin koskee

  6. SDK on saatavilla sekä iOS, Android että Windows Phone alustoihin, näin minä ymmärsin kun Nuancen edustajien kanssa keskustelin.

  7. Kokeilin sovellusta iPadilla. Käytännössä sovellus on lähes käyttökelvoton. Vaikka käyttäisin kuinka yksinkertaisia lauseita tai sanoja, niin virheitä tulee väkisinkin lähes jokaiseen lauseeseen. Pahimmillaan yksittäisessä lauseessa on 3-4 virhettä. Itse en moista sovellusta käyttäisi vaikka aseella uhattaisiin.

    Pitää vielä illalla kokeilla myös englanniksi ihan vain uteliaisuudesta.

Kommentointi on suljettu!