Speex
Van Wikipedia
Speex is een spraakcodec speciaal ontworpen voor Voice Over IP (spraak over het internet). Waar andere spraakcodecs zich specialiseren in GSM technologie, richt Speex zich op de IP wereld. Deze spraakcodec is niet alleen open source maar ook gratis en vrij van patenten. Speex maakt deel uit van GNU project.
Inhoud |
[bewerk] Eigenschappen
[bewerk] Bemonsteringssnelheid
Gebruikers kunnen kiezen tussen een goede kwaliteit van spraak (hoge bitnelheid of bitrate) of een lage kwaliteit (lage bitrate). De bitrates variëren van 2 kbit/s tot 44 kbit/s. Bij een hoge bitrate is er een voorziening voor 16 kHz bemonsteringssnelheid wat overeenkomt met wideband en bij lage bitrates kan men kiezen voor een 8 kHz bemonsteringssnelheid, wat overeenkomt met een gewone telefoonlijn. Speex ondersteunt ook Ultra-Wideband dat overeenkomt met 32 kbit/s.
[bewerk] Encodering
Speex is gebaseerd op CELP, Code Excited Linear Prediction.
[bewerk] OGG Formaat
De bitstreams van Speex kunnen in OGG bestanden worden opgeslagen. OGG bestanden zijn een soort container die de multimedia data bijhouden. Het is vergelijkbaar met MP3 maar dan wel van een betere kwaliteit .
[bewerk] Variabele Bit Rate (VBR)
Door deze eigenschap kan Speex zijn bitrate laten variëren. Zo kan het zich aanpassen aan de moeilijkheid van het geluidsfragment, bv. Klinkers hebben een hogere bitrate nodig dan de f klank. Hierdoor kan dezelfde kwaliteit behouden worden met verschillende bitrates. Eén van de nadelen van deze eigenschap is dat door een kwaliteit vast te leggen het moeilijk zal worden om de gemiddelde bitrate op voorhand vast te leggen. Een andere nadeel is dat VoIP geen al te hoge bitrate mag hebben voor het kanaal voor real-time gesprekken.
[bewerk] Gemiddelde Bit Rate (ABR)
ABR lost een van de nadelen van VBR op. Het past de VBR kwaliteit aan om aan de vastgelegde gemiddelde kwaliteit te voldoen. De kwaliteit zal lager liggen, doordat dit in real-time gebeurt.
[bewerk] Stem Activiteit Detectie (VAD)
VAD (Engels: Voice Activity Detection) detecteert wanneer men spreekt, en zal dan encoderen met de juiste kwaliteit. Als er niet gesproken wordt, zal het achtergrondgeluid met een lagere kwaliteit worden geëncodeerd. Dit noemt met comfort geluid generatie. VAD wordt automatisch gebruikt bij VBR.
[bewerk] Discontinue Transmissie (DTX)
DTX gaat een stap verder dan VAD bij VBR. In plaats van de kwaliteit te verlagen bij achtergrondgeluid wordt bij DTX niets verzonden van het achtergrondgeluid.
[bewerk] Vertraging
Speex gebruikt een delay met de grootte van de frame. Bij een 8 kHz bemonsteringssnelheid is de vertraging 30 ms, bij 16 kHz is het 34 ms. Hier komen nog bij de vertragingen veroorzaakt door CPU snelheden.
[bewerk] Formaat en Standaards
Om de term ‘Speex compatible’ te mogen gebruiken moet men bepaalde formaten en standaarden gebruiken. Dit houdt in dat de decoder alle narrowband modes moet kunnen ondersteunen. Als er een Wideband decoder aanwezig is, moet deze Narrowband streams kunnen decoden. Voor encodering moet er ten minste een narrowband of wideband encoder beschikbaar zijn.
RTF pakket formaat en OGG formaat worden gebruikt door speex.
[bewerk] Applicaties
Speex is terug te vinden in een groot aantal toepassing zoals: XBox Live, Winamp, KSP Sound Player, Foobar2000. Speex wordt vooral gebruikt in teleconference software, Streaming, P2P en audio applicaties.
[bewerk] Externe Links
Speex Officiele Speex website