Jag testade den nya funktionen i YouTube att texta videoklippen baserat på röstigenkänning, och att sen få dem översatta. Jag slogs av denna skildring av ett Stanford-projekt:
Men det är ju inte översättningen som är fel, utan transkriptionen:
Men visst, så länge det inte finns nån förståelse för det som sägs kan ju "collaborative environment" förstås uppfattas ljudmässigt som "crime and violence" som kanske i frekvensdatabasen har ett mycket högre värde.
Men naturligt språk är ju en förhandling mellan två parter, och förhandlingen gäller främst förståelse och mening och i andra hand vilka ord som används. Skriftspråk och inspelade föredrag har ju den egenheten att en text inte låter läsaren säga "ursäkta jag förstår inte", så på ett sätt borde man ställa mycket högre krav på en automatisk textning vad gäller att faktiskt skapa en mening som grund för sin textning, eftersom den resulterande textningen snabbt kan komma väldigt långt ifrån den avsedda meningen.
Den som ändå vill testa automatisk textning, som i sig är en fascinerande funktion, kan klicka på CC-symbolen nedanför filmen.
Tack till Lennart för tipset om CC-funktionen. /Simon
Comments
You can follow this conversation by subscribing to the comment feed for this post.