Allion Labs/Henry Hung

聲音與影像的同步,即為AV-Sync,是影響多媒體體驗的重要的因素。隨著人們生活及工作型態改變,我們不再需要面對面才能對話,也不必聚集於實體現場才能進行演講,拜網路的普及和移動通訊的便利,在任何地方都能以各種形式來進行不同目的的聲音或影像傳遞。

除了硬體及網路設備外,因應各種用途及活動,已開發出許多應用軟體以滿足不同族群的需求,下面列舉們最常被使用的視訊軟體:

即時通訊(Instant Messaging, IM)
– Skype, Line, Facebook Messenger, WhatsApp, WeChat, Telegram…
線上會議 (Meeting & Conference)
– Google Meet, Microsoft Teams, Zoom…
遊戲聊天(Gaming Chat)
– Discord, EPIC Game store, Mumble, Guilded, Steam Chat…
線上直播(Live Streaming)
– YouTube Live, Facebook Live, Instagram Live, Twitch…

根據百佳泰豐富經驗及相關收集結果,使用者在影音設備與視訊軟體的不同應用中,可能會遇到使用困難或影響體驗的狀況,可見以下幾點:

1. 即時通訊過程中影音不同步
2. 通訊過程很順利,但播放錄影檔時會有影像或聲音延遲
3. 直播中有影沒聲或是有聲無影
4. 通訊中影像破圖
5. 開會中出現斷斷續續的爆音

這些問題會因為音頻、視頻和螢幕是否共享,以及網路、軟硬體及連接的方式,而產生差異。以聲音與影像的同步為例,不同的視訊軟體會根據音頻及視頻接收時間,而做出影音不處理、聲音延遲處理、影片丟幀處理等等的影音處理方式,下面我們會以實際案例來說明。

用一個內建麥克風的USB webcam以不同的視訊軟體及不同的電腦來實驗,在視訊的過程中音頻及視頻的同步狀態如何。透過LatencyKit來量測音頻及視頻的延遲時間。

Video and audio latency measurement system

Host的音頻及視頻經過網路傳遞到Client端,再分析Client端的音頻及影頻延遲,就可以計算出AV-Sync了。

我們可以看到測試的AV-Sync結果如下,數據為正值代表聲音先出來,反之負值為影像先出來。量測的AV-Sync值介於73ms ~ -100ms,表現普通。

光的速度比聲音還快,日常生活中人們已經習慣先看到影像再聽到聲音,加上每種產品的定位不同,能夠接受的標準便因人而異。我們可從各協會與不同應用所定訂的標準,來思考產品的定位。

因此,我們可利用上述的標準制作出影音同步感知表,透過結果的分佈分析,能更快速的瞭解產品的取向及定位,例如若落點全數在好或非常好的範圍,則測試結果Pass,並能定義表現為優秀。

透過上圖感知表,我們可以輕鬆的將感受及體驗視覺化,從中發現已有不少數據落於-60ms至-100ms屬表現普通的區間,雖不是大問題,但長久使用下對於使用者體驗來說便有可能造成減分。

外接一個USB麥克風、多接幾個USB Hub、使用不同的軟體及作業系統,上述情況都可能是造成影音不同步的要素。百佳泰透過多年來的測試認證經驗,不僅可以為客戶設計完善的測試環境,更提供了完整的測試服務和數據分析,讓合作客戶得到更有效並滿意的測試結果,幫助產品開發和提升性能。

若您有相關測試需求或內容疑問,歡迎諮詢百佳泰

立即加入百佳泰 LINE官方帳號,隨時掌握技術新訊