Botar som ringer frisörer blir en kort parentes

På Google I/O 2018 kunde man höra hur långt Google kommit med att artificiellt skapa något som beter sig som en människa och som du kan föra en intellektuell(?) konversation med. För många av oss innebär tekniken att vi kan spara tid och möda i vår vardag, samtidigt som affärsprocesser kan effektiviseras. Det är ena sidan av myntet.

Samtidigt finns det många som reagerar starkt, tycker att det hela är obehagligt och poängterar att man måste vara tydlig med att det inte finns en människa bakom.

Vem ringer och vem svarar?

Förra veckan visade Googles vd, Sundar Pichai, hur Google Assistant kan ringa och boka en klipptid åt dig – inte bara kolla lediga tider i din kalender. Besökarna på Google I/O 2018, som är företagets årliga utvecklarkonferens, fick höra en förinspelad demonstration.

https://www.youtube.com/watch?v=bd1mEm2Fy08

Googles vd Sundar Pichai på I/O 2018 

En intet ont anande frisör svarar och vi får följa hur assistenten härmar mänsklig interaktion, komplett med ”mm-hmm”-anden när det passar att föra konversationspartnern vidare. Google kallar den AI som hjälper assistenten för ’Duplex’.

Det här med att röststyrda assistenter, som sparar tid åt oss genom att ringa våra samtal, tror jag ändå blir en kort parentes i internets historia. Om smarta botar slår igenom stort är det troligtvis inte för att ringa tjänsteleverantörer av kött och blod åt oss. Och framförallt inte utan att låta dem veta att de själva inte är mänskliga. Så fort det blir tydligt för till exempel frisersalongen minskar motivationen att själv svara i telefonen, då detta tar tid från klippningarna. Bättre då att låta den egna assistenten svara i telefonen, särskilt när andra assistenter ringer.

Hur kommunicerar assistenter med varandra?

Konversationen som spelades upp på Google I/O var underhållande (och oroande!), och jag ser fram emot hur det kommer låta när assistenter pratar med varann. Om oss. När min Apples Siri ringer till din Amazons Alexa, kommer då samtalet gå i normal och mänsklig hastighet eller finns det tidsvinster att göra genom att till exempel prata i mycket högre hastighet? Kan de båda assistenterna komma överens om förkortningar som sparar tid? Och om de direkt märker att den andra också är en assistent, skippar de då artighetsfraserna? Eller går de direkt över till ett annat medium, där data förs över lättare? Frågorna som väcks är många.

Spioner under kalla kriget skickade inspelade meddelanden och morsesignaler i hög hastighet, främst för att korta tiden en sändare var aktiv och därmed undgå upptäckt och försvåra pejling. De använde så kallade ’Burst encoders’

Mark Sachs berättar ingående om en tysk ’Burst encoder’. Om kalla krigets kommunikationsmetoder inte intresserar dig behöver du faktiskt inte se klippet för att följa med i den här krönikan.

Det är fult att luras

Jakob Nilsson på 99.se menar att Google Duplex visar företaget från sin sämsta sida, den sidan som glömmer människorna i ekvationen. Jag kan bara hålla med. Att vara artig och prata med någon som senare visar sig vara en ”robot” gör att man känner sig lurad. Människor som du och jag gillar inte att bli lurade. Om det är din assistent som ringer upp frisören, så ska du dessutom träffa hen på den bokade tiden. Det kan bli ett stelt möte och saxar är vassa verktyg.

”Robotic voices should always sound ”synthetic” rather than human” och ”successful spoofing of any kind destroys trust” kan man också till exempel läsa i en artikel i Bloomberg.

Jakob Nilsson har också en viktig poäng i vems tid som är viktigast (min kursivering):

Även en Google Home som sköter sig godkänt på telefon bör rimligtvis ta längre tid på sig än om jag själv skulle ringa. Vad Google gör här är att spara på användarens tid, på bekostnad av personalen som blir uppringd.

Själv kan jag bara se ett användningsområde i dagsläget för telefonassistenter: att låta mig slippa telefonköer. Särskilt sådana som förhoppningsvis leder till Bruce Springsteenbiljetter.

Behöver vi anpassa oss?

En första seriös justering behöver vi alla som producerar innehåll göra när assistenterna blir smartare och fler lockas att använda dem. Vi behöver ta i beaktande att människors (och assistenters?) sätt att söka förändras när rösten blir ett lika viktigt verktyg som tangentbordet.

När vi textsöker håller vi oss ofta till korta sökord (keywords), men när vi frågar en röststyrd assistent använder vi i högre grad en naturlig fråga, sökordsfraser (key phrases). Låt mig ge ett exempel. Säg att jag gått och nynnat på en låt jag inte kan placera riktigt. Jag tror mig minnas att texten går ”…why you always run around in crowds, because we want to”. Min textsökning skulle kunna bli:

always run around crowds because we want to + artist (eller + lyrics)

Men att säga det högt skulle låta lite knepigt, så min röstsökning skulle snarare bli:

Who sang always run around in crowds because we want to?

Svaret på textsökningen är givet, det är ju Billie Pipers ’Because we want to’ från 1998. Men min mer naturliga fråga ger inte samma rätta svar förrän jag frågar igen, och korrigerar till ’which artist sang always run around in crowds because we want to?’.

Nu kanske det inte finns så stor business i att leverera svar på just den här frågan – men det här exemplet visar att det som rankar bra på text inte nödvändigtvis gör det för röst.