Wiki Informatique - Voix sur IP

Voix sur IP

On this page… (hide)

  1.   1.  Transport de la voix
    1.   1.1  Codage de la voix
    2.   1.2  Real-time Transport Protocol
    3.   1.3  Modes de diffusion
  2.   2.  Contraintes

La voix sur IP, ou « VoIP » pour « Voice over Internet Protocol », est une technique informatique qui permet de transmettre la voix sur des réseaux compatibles IP, via Internet ou des réseaux privés (intranets) ou publics, qu’ils soient filaires (câble/ADSL/fibre optique) ou non (satellite, Wi-Fi et réseaux mobiles).

Des logiciels de VoIP tels que Skype, Signal, Discord et WhatsApp, gèrent aujourd’hui tous les flux multimédia (téléphonie, appels vidéo, messagerie instantanée et transferts de fichiers).

En ce qui concerne la téléphonie uniquement, cette technologie est complémentaire de la téléphonie sur IP (« ToIP » pour Telephony over Internet Protocol), qui concerne les fonctions réalisées par un autocommutateur téléphonique IPBX.

1.  Transport de la voix

Le transport de la voix sur IP est relativement complexe. La première étape est la numérisation du signal analogique capté par le microphone. Selon le protocole utilisé pour transporter le signal numérique, une étape complémentaire d’encodage peut être nécessaire (par exemple en utilisant un encodeur « A-law » ou « µ-law »), notamment pour compresser les signaux. Ensuite, les informations sont découpées en trames pouvant circuler sur un réseau informatique. Divers protocoles peuvent alors être utilisés pour acheminer les informations au(x) destinataire(s). Ainsi le protocole RTCP est utilisé pour contrôler le transport des paquets RTP.

1.1  Codage de la voix

1.2  Real-time Transport Protocol

1.3  Modes de diffusion

Le terme « VoIP » est en général utilisé pour décrire des communications « point à point ». Pour la diffusion de son ou de vidéos sur IP en multipoints, on parlera plutôt de streaming pour une simple diffusion, comme les radios Web par exemple. Le terme multipoints sera réservé à des visioconférences dont le nombre de participants est plus grand que deux.

La voix ou le son sur IP peut se faire en mode Unicast, broadcast ou Multicast sur les réseaux, c’est-à-dire en mode « point à point », en mode « une émission et plusieurs réceptions » (comme un émetteur TV, par exemple) et en mode « une émission pour plusieurs réceptions » (mais le signal n’est routé que s’il y a des récepteurs) comme les radios Web. Le protocole H.323 ne fonctionne qu’en mode Unicast.

Le transport de communication sur IP est très dépendant du délai de latence d’un réseau. Ce délai influe beaucoup sur la qualité psycho-acoustique d’une conversation. Avec l’avènement des réseaux 100 Mbit/s, ADSL ou par fibres optiques, les temps de latence deviennent tout à fait acceptables pour une utilisation quotidienne de la voix sur IP. À l’inverse, les connexions par liaison satellite souffrent d’un temps de latence souvent trop important pour prendre en charge les applications de voix sur IP. En moyenne, le temps de latence sur ce type de liaison est estimé entre 400 et 800 millisecondes. Une connexion filaire (fibre optique ou cuivre) bénéficie d’un temps de latence de 60 à 200 millisecondes. Plus que la latence, c’est la gigue ((en)jitter) qui pénalise la voix sur IP. En effet, s’il y a des fluctuations du signal en amplitude et fréquence, il faudra un mécanisme de remise en ordre des paquets afin de restituer le message vocal, processus qui se traduira par des blancs et des attentes.

2.  Contraintes