Sidhuvud

Strukturbloggen


Föregående artikel

Nästa artikel

08 juni

Gör en textnotering med din röst och AI


Datum: 2023-06-08 11:48
En man i brun kavaj, vit v-ringad tröja och mörkblå slips småspringer längs en innerstadsgata och talar in en röstnotering i mobilen samtidigt som en bil kör förbi i hög hastighet.

Siri förstår mig inte!

Hur mån­ga gånger har du försökt dik­tera en snabb röst­no­ter­ing i tele­fo­nen för att fån­ga essensen av ett möte bara för att sedan få till­ba­ka en tex­tut­skrift av det du sade som inte stäm­mer med vad du sade? 

Jag tyck­er att jag är hyf­sat välar­tikuler­ad, men ändå har åtmin­stone jag fått läg­ga onödig tid på att ren­skri­va noterin­gen jag gjorde efteråt. Eller, har jag senare fun­der­at länge på vad jag menade med grill­ning” och lång­tradare”. Jag kan inte min­nas att jag och min kund pratade om det.


För dig som lyssnar hellre än läs­er, finns det här blog­gin­lägget ock­så som ett avs­nitt av struk­tur­pod­den Klart!:


Snabbt fån­gat på språng!

Idén att man snabbt ska kun­na pra­ta in ett med­de­lande och få det i textform är strå­lande. Funger­ar det, kan du fån­ga en idé blixtsnabbt. Du doku­menter­ar fort vad ni kom överens om. Utan bekym­mer läg­ger du till det du lovade till din att göra-lista — även om du är på språng.

En lös­ning där du blir förstådd

Men, åtmin­stone jag har inte fått det att fun­ka — för­rän nu. För några veck­or sedan hit­tade jag dock en lös­ning som har funger­at bät­tre än något annat jag tes­tat i den här rik­t­nin­gen. Jag kan inte låta bli att berät­ta om den för dig. (Efter­som utveck­lin­gen på här området går rasande fort nu finns det säk­ert andra lös­ningar — och vilken dag som helst kom­mer OpenAI:s mobi­lapp till Sverige, dessu­tom — så betrak­ta där­för den­na lös­ning som en bland mån­ga som fungerar.)

Det hela innebär att jag pratar in en röst­no­ter­ing i tele­fo­nen och en kort stund senare får jag ett mejl där det jag sagt står skriv­et — med häp­nadsväckande pre­ci­sion. Särskilt fascinerande är att tex­ten återg­er innebör­den av det jag sade — inte prompt var­je hm”, fel­sägn­ing och upprep­n­ing jag råkat göra i röstinspelningen. 

De inblandade

Kom­po­nen­ter­na i lös­nin­gen är:

Så här går det till

Skiss visande hur RecUp skickar en mp3-fil till Dropbox, varifrån Zapier hämtar den, skickar till OpenAI, som transkriberar och skickar tillbaka till Zapier, varpå Gmail sänder transkriptionen som ett mejl.

När jag pratar in röst­no­terin­gen i RecUp (1), sparas den som en mp3-fil i Drop­box (2). När Zapi­er ser att det kom­mit en ny mp3-fil i map­pen för röst­no­teringar, häm­tar den filen (3) och skickar den via OpenAI-plugin:en till Whis­per (4), som svarar till­ba­ka med tex­ten den upp­fat­tat, varpå Zapi­er skriv­er ett mejl i Gmail som den skickar till mig (5).

Gör så här

  1. Först, skaf­fa RecUp (iOS) eller en annan röst­no­ter­ingsapp där du kan spara inspel­ningar­na i Drop­box (det finns mängder med Android-appar att väl­ja bland).
  2. I RecUp, ställ in vilken Drop­box-mapp du vill att filen ska sparas i.
  3. I Zapi­er, ska­pa en zap” som:
    1. plockar mp3-filen från Drop­box-map­pen när den sparas där,
    2. ska­par en tran­skriber­ing (”cre­ate tran­scrip­tion”) med hjälp av OpenAI-plugin:en (du behöver ha en prenu­mer­a­tion på OpenAI:s API först)
    3. skickar dig ett mejl från ditt eget Gmail-kon­to (eller annan mejlplat­tform, till exem­pel Out­look) med den tran­skrib­er­ade tex­ten i
  4. Tes­ta — och häp­nas över hur rätt Whis­per förstod dig. Det är något helt annat än Siri, det!

Mer tid till det väsentliga

Om du använ­der den här lös­nin­gen eller en lik­nande för att snabbt göra en röst­no­ter­ing, behöver du läg­ga min­dre tid på att anteck­na efter möten och sam­tal. Du fån­gar värde­ful­la idéer i fly­k­ten som annars skulle ha försvun­nit ut i etern. De mån­ga bäckar små av minut­er du sparar blir till en stor å av tim­mar du kan ägna dig åt det som egentli­gen är vik­ti­gast för dig och ditt arbete.

Hur gör du?

Har du hit­tat en annan, lik­nande lös­ning på behovet av snab­ba röst­no­teringar till text? Berät­ta för mig! Jag sam­lar på lös­ningar som den­na, så jag är ivrig att höra vad du funnit. 

(Har du hört om det andra som jag får hjälp av AI med hit­tills?)

En man i brun kavaj, vit v-ringad tröja och mörkblå slips småspringer längs en innerstadsgata och talar in en röstnotering i mobilen.

Få hjälp med det här

Det kan vara lite knepigt att skapa lösningen jag beskrivit här. 

Men, jag har gjort en quick-fix-kurs där jag leder dig steg för steg igenom processen, så att du får fånga fort, också du.

Visa mig quick-fix-kursen

Rund bild i vilken en man i brun kavaj, blå-röd-randig slips och blå byxor sträcker ut båda armarna när han föreläser framför en svart ridå.

Boka en strukturföreläsning till kickoffen

Förenklande tips och knep som detta är just vad jag delar med mig av i mina föreläsningar.

Vill du att jag kommer till er nästa kickoff - hör av dig till mig!

Skicka mig en offert