[筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 7

筆記下 AI 時代的 PM 新技能:語音化工作流程設計實戰 課程相關內容。

[筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 1


課程相關資訊

[連結]:https://learn.duotify.com/courses/zerotype

請注意:本系列文章為個人對應課程的消化吸收後,所整理出來的內容。換言之,並不一定會包含全部的課程內容,也有可能會添加其他資源來說明。


內容

語音轉錄模型

使用 groq 可搭配 API 語音模型,能有效的降低使用成本。TPM ( Token per minute ) 盡可能超過 8K 為佳,因為包含前置的提示詞,就有可能佔掉約 2.5K。

若有準確計算使用量,可透過 OpenAI 所提供的 Tokenizer 工具。

建議綁定信用卡,這樣就可將 Limit 提高。舉例若用 whisper-large-v3-turbo,US$ 0.04/hour 而已。

MediaTek Research Breeze 3 – 基於 Whipser 模型訓練而成

介紹:https://www.mediatek.com/zh-tw/tek-talk-blogs/mediatek-research-breeze-3

你可以在本地端將這個模型跑起來,然後將 appsettings.local.json 的 Transcription.ApiBase, Transcription.Model 值改成對應的名稱即可。此時 Transcription.ApiKey 輸入 local 即可


系列文章

  • [筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 6
  • [筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 5
  • [筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 4
  • [筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 3
  • [筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 2
  • [筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 1
  • 按讚加入粉絲團