我的MEMO AI使用體驗:一個零門檻的語音轉文字神器

科技先锋队 於 7 小時前發表 收藏文章
因為某些個人的原因,我長時間需要將大量的語音轉寫成文字。一開始我是使用Office裡面的Voice Typing功能來轉寫的。準確度還蠻不錯,但是有一個問題,那就是電腦必須長亮屏,不能做其他任何的事情,而且音頻當中有一段空白的時候,Voice Typing功能就會默認音頻結束,自動關閉。

我花了很長一段時間上網搜尋其他更簡單的方式,但不是要付費,就是音訊時長限製過短。直到大概1年前我無意間發現到了MEMO AI這個工具, 才稍微輕鬆一點。


簡單到不可思議

簡單,這就是我使用了1年Memo AI的感覺,只要下載安裝就可以使用,Memo AI本身就內建語音辨別功能。下載包只有80MB左右,而且安裝好之後從點擊到啟動使用也非常快,大概只有1秒鐘的時間。

整個介面也非常乾淨簡潔,屬於看一眼就可能上手的程度,沒有各種花里胡哨的頁面或推廣,這完全戳中了極簡主義者的我的心。


語音/視訊轉換文字功能

這是Memo AI的主要功能,它支援連結和本機檔案。
  • 連結:支援 Youtube、Apple Podcast、Google Podcast和小宇宙,只需要把連結複製貼上到最上方的空白欄即可。
  • 本地文件:支援對 MP4,MP3,AAC,M4A 等音訊和視訊格式,不過需要注意的是,轉譯的檔案名稱中不應包含特殊字符,否則 Memo 將無法識別。

從截圖中可以看到,我轉寫了不少音頻, 而且每個音頻時長不定,從最短的20多分鐘,到最長2個小時多。值得一提的是,即使是免費版,轉寫的長度和數量都沒有限制

只是要注意的是,在轉寫時需要進行一些簡單的設置,主要還是原始文件的語言,以及轉寫效果。 Memo AI支援所有常用的語言,包括中文、英文、馬來語、德語、西班牙語等,甚至連粵語都有。

而轉寫模式分為極速、均衡和高品質,而每個模式還有不同的模型,這就需要你們自己去一一體驗了。
  • 極速:支援多種語言,轉寫速度快,但品質一般。我的體驗是,只有標準的發音,使用極速準確度才會高,否則稍微不標準一點,準確度都會有所下滑。
  • 均衡:轉寫速度適中,品質較好。這也是我常用的轉寫模式,只要不要太不標準,基本上準確度都在70%左右。
  • 高品質:轉寫速度慢,品質組好。


AI 翻譯

Memo AI也支援對轉寫的文字進行翻譯,不過在使用 AI 翻譯功能之前,需要先進行一些基本配置。 Memo AI支援包括Google,Microsoft,OpenAI,火山引擎,智速AI等多家翻譯服務供應商,需要前往它們的官方網站申請API金鑰,並將其貼到 Memo使用。

要注意的是,正在進行AI翻譯,盡量維持Memo AI頁面,避免翻譯中斷。如果無法翻譯,除了要檢查網路狀況,還要看看內容是否過長,以及API密鑰是否過期等等。雖然聽起來有點麻煩,但對許多用戶來說,這個功能卻幫了大忙。

值得一體的是,如果對某個段落的翻譯結果不滿意,還可以點擊該段落"行翻譯"選項,對該段落進行重新翻譯。

匯出文本

轉寫好的文字,可以匯出成不同格式的文本,包括TXT、SRC、LRC、DOCX、Markdown,也可以整合去第三方,包括Notion和Obsidian。


其他功能

Memo AI還有其他的功能,包括語音合成、視訊管理、視訊心智圖、筆記和總結等等,不過著一些功能我還沒機會用到,所以也不寫了。儘管MEMO AI不是最準的,不是最快的,也不是功能最全的。但它解決了我的核心需求:把錄音變成文字,而且不要我註冊帳號,不要我綁定手機,不要我付費。

如果你也很我一樣有視訊/語音轉換成文字的需求,不妨試試Memo AI。
標籤: 人工智能  AI  Memo AI  語音轉文字  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←