Sidhuvud

Strukturbloggen


Föregående artikel

Nästa artikel

08 juni

Gör en textnotering med din röst och AI


Datum: 2023-06-08 11:48
En man i brun kavaj, vit v-ringad tröja och mörkblå slips småspringer längs en innerstadsgata och talar in en röstnotering i mobilen samtidigt som en bil kör förbi i hög hastighet.

Siri förstår mig inte!

Hur mån­ga gånger har du försökt dik­tera en snabb röst­no­ter­ing i tele­fo­nen för att fån­ga essensen av ett möte bara för att sedan få till­ba­ka en tex­tut­skrift av det du sade som inte stäm­mer med vad du sade? 

Jag tyck­er att jag är hyf­sat välar­tikuler­ad, men ändå har åtmin­stone jag fått läg­ga onödig tid på att ren­skri­va noterin­gen jag gjorde efteråt. Eller, har jag senare fun­der­at länge på vad jag menade med grill­ning” och lång­tradare”. Jag kan inte min­nas att jag och min kund pratade om det.


För dig som lyssnar hellre än läs­er, finns det här blog­gin­lägget ock­så som ett avs­nitt av struk­tur­pod­den Klart!:


Snabbt fån­gat på språng!

Idén att man snabbt ska kun­na pra­ta in ett med­de­lande och få det i textform är strå­lande. Funger­ar det, kan du fån­ga en idé blixtsnabbt. Du doku­menter­ar fort vad ni kom överens om. Utan bekym­mer läg­ger du till det du lovade till din att göra-lista — även om du är på språng.

En lös­ning där du blir förstådd

Men, åtmin­stone jag har inte fått det att fun­ka — för­rän nu. För några veck­or sedan hit­tade jag dock en lös­ning som har funger­at bät­tre än något annat jag tes­tat i den här rik­t­nin­gen. Jag kan inte låta bli att berät­ta om den för dig. (Efter­som utveck­lin­gen på här området går rasande fort nu finns det säk­ert andra lös­ningar — och vilken dag som helst kom­mer OpenAI:s mobi­lapp till Sverige, dessu­tom — så betrak­ta där­för den­na lös­ning som en bland mån­ga som fungerar.)

Det hela innebär att jag pratar in en röst­no­ter­ing i tele­fo­nen och en kort stund senare får jag ett mejl där det jag sagt står skriv­et — med häp­nadsväckande pre­ci­sion. Särskilt fascinerande är att tex­ten återg­er innebör­den av det jag sade — inte prompt var­je hm”, fel­sägn­ing och upprep­n­ing jag råkat göra i röstinspelningen. 

De inblandade

Kom­po­nen­ter­na i lös­nin­gen är:

Så här går det till

Skiss visande hur RecUp skickar en mp3-fil till Dropbox, varifrån Zapier hämtar den, skickar till OpenAI, som transkriberar och skickar tillbaka till Zapier, varpå Gmail sänder transkriptionen som ett mejl.

När jag pratar in röst­no­terin­gen i RecUp (1), sparas den som en mp3-fil i Drop­box (2). När Zapi­er ser att det kom­mit en ny mp3-fil i map­pen för röst­no­teringar, häm­tar den filen (3) och skickar den via OpenAI-plugin:en till Whis­per (4), som svarar till­ba­ka med tex­ten den upp­fat­tat, varpå Zapi­er skriv­er ett mejl i Gmail som den skickar till mig (5).

Gör så här

  1. Först, skaf­fa RecUp (iOS) eller en annan röst­no­ter­ingsapp där du kan spara inspel­ningar­na i Drop­box (det finns mängder med Android-appar att väl­ja bland).
  2. I RecUp, ställ in vilken Drop­box-mapp du vill att filen ska sparas i.
  3. I Zapi­er, ska­pa en zap” som:
    1. plockar mp3-filen från Drop­box-map­pen när den sparas där,
    2. ska­par en tran­skriber­ing (”cre­ate tran­scrip­tion”) med hjälp av OpenAI-plugin:en (du behöver ha en prenu­mer­a­tion på OpenAI:s API först)
    3. skickar dig ett mejl från ditt eget Gmail-kon­to (eller annan mejlplat­tform, till exem­pel Out­look) med den tran­skrib­er­ade tex­ten i
  4. Tes­ta — och häp­nas över hur rätt Whis­per förstod dig. Det är något helt annat än Siri, det!

Mer tid till det väsentliga

Om du använ­der den här lös­nin­gen eller en lik­nande för att snabbt göra en röst­no­ter­ing, behöver du läg­ga min­dre tid på att anteck­na efter möten och sam­tal. Du fån­gar värde­ful­la idéer i fly­k­ten som annars skulle ha försvun­nit ut i etern. De mån­ga bäckar små av minut­er du sparar blir till en stor å av tim­mar du kan ägna dig åt det som egentli­gen är vik­ti­gast för dig och ditt arbete.

Hur gör du?

Har du hit­tat en annan, lik­nande lös­ning på behovet av snab­ba röst­no­teringar till text? Berät­ta för mig! Jag sam­lar på lös­ningar som den­na, så jag är ivrig att höra vad du funnit. 

(Har du hört om det andra som jag får hjälp av AI med hit­tills?)

Få hjälp med det här

En man i brun kavaj, vit v-ringad tröja och mörkblå slips småspringer längs en innerstadsgata och talar in en röstnotering i mobilen.

Det kan vara lite knepigt att skapa lösningen jag beskrivit här. 

Men, jag har gjort en quick-fix-kurs där jag leder dig steg för steg igenom processen, så att du får fånga fort, också du.

Visa mig quick-fix-kursen

Boka en strukturföreläsning till kickoffen

Rund bild i vilken en man i brun kavaj, blå-röd-randig slips och blå byxor sträcker ut båda armarna när han föreläser framför en svart ridå.

Förenklande tips och knep som detta är just vad jag delar med mig av i mina föreläsningar.

Vill du att jag kommer till er nästa kickoff - hör av dig till mig!

Skicka mig en offert