筆記下 AI 時代的 PM 新技能:語音化工作流程設計實戰 課程相關內容。
課程相關資訊
[連結]:https://learn.duotify.com/courses/zerotype
請注意:本系列文章為個人對應課程的消化吸收後,所整理出來的內容。換言之,並不一定會包含全部的課程內容,也有可能會添加其他資源來說明。
內容
語音轉錄模型
使用 groq 可搭配 API 語音模型,能有效的降低使用成本。TPM ( Token per minute ) 盡可能超過 8K 為佳,因為包含前置的提示詞,就有可能佔掉約 2.5K。
若有準確計算使用量,可透過 OpenAI 所提供的 Tokenizer 工具。
建議綁定信用卡,這樣就可將 Limit 提高。舉例若用 whisper-large-v3-turbo,US$ 0.04/hour 而已。
MediaTek Research Breeze 3 – 基於 Whipser 模型訓練而成
介紹:https://www.mediatek.com/zh-tw/tek-talk-blogs/mediatek-research-breeze-3
你可以在本地端將這個模型跑起來,然後將 appsettings.local.json 的 Transcription.ApiBase, Transcription.Model 值改成對應的名稱即可。此時 Transcription.ApiKey 輸入 local 即可

![[筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 1 [筆記] AI 時代的 PM 新技能:語音化工作流程設計實戰 – 1](https://smlpoints.com/wp-content/uploads/notes-ai-zero-type-1.jpg)