Quantcast
像真人到發毛!最新版 ChatGPT 變成超強「語音助理」還能聽、說、唱歌?Siri、谷歌最強對手來了! - 洛杉磯週報 - 亞洲版

Siri、谷歌以及 Alexa 的強敵即將要出現了嗎?因為就連 OpenAI 也加入了把自家「聊天機器人」變成了智慧語音助理的行列!

週一時,舊金山這間 AI 新創公司隆重推出了最版本的 ChatGPT 聊天機器人!這次這個聰明的傢伙除了能接收文字指令之外,還能同時接收音檔和圖像,讓整個 ChatGPT 又離「真人」更進一步。

該公司表示,這款新應用程式是基於 GPT-4o 的人工智能系統開發的( GPT-4o 裡面的字母 “o” 所代表的意思為 “Omni” ,意指速度和易用性都跨越了一大步)。

跟先前的版本比較起來,這款應用程式完全可以以更快的速度處理音頻、圖像和影片等,並從週一開始「免費」提供,用戶們也可以在自己的手機、桌面電腦上使用。

以前的語音助理真的要被「屌打」了嗎?

能夠準確的判斷使用者身處的環境,並推敲出該做出什麼回應

從 OpenAI 所發佈的影片來看,我們完全可以感受到,最新版本的 ChatGPT 在回應用戶的時間相當的快速,基本上跟我們在和朋友聊天的速度差不多。

與現有語音助理做比較,最新版 ChatGPT 有夠像真人

我本人在家裡平常都是使用 Amazon 的 Alexa 來處理生活事務,包括制定鬧鐘、詢問天氣相關、下訂單、收包裹等,他們的音調較無起伏,回答的也很制式與一般,給人清楚的認知就是在與「機器人」對話。

而在上面的影片演示中,最新版本的 ChatGPT 與其 OpenAI 員工行進的對話不僅快速流暢,而且還能聽得出「情緒」,以及真實人類在回答問題時的「思考停頓」,他甚至還能在對話被打斷時,靈活地跟上先前對話,最可怕的是感覺 ChatGPT 似乎還有「共情」能力。

例如影片內,OpenAI 的員工拿著手機拍攝環景,並且讓 ChatGPT 猜猜自己在幹嘛時,ChatGPT 竟然回答:「嗯~~~~從現場的光線、設置等等,感覺你好像正在錄影或是準備要直播!」

且在員工說自己準備要「公開」最新版本的 ChatGPT 語音助理時,對方還發出咯咯笑聲說道:「什麼,你準備要公開我了嗎?」

能夠高歌一曲,唱得有模有樣的 ChatGPT

在另外一隻的影片演示中,我們還可以聽到 ChatGPT 「高歌一曲」,甚至兩個 AI 還能跟彼此對話,聊得有聲有色。

OpenAI 表示 ChatGPT 桌面版本目前僅只有 Mac 用戶可以使用,如果你是付費用戶的話今天開始就有權限使用了,另外,Windows 版本正在開發當中,畢竟使用 Mac 的人數還是最為廣泛的。