Page principale - S'identifier - S'inscrire - Contact

Venez découvrir mon dernier livre

Téléchargez le guide de l'animateur
Si vous souhaitez l'avoir au format papier, l'offrir ou simplement me soutenir,
vous pourrez l'acheter ici prochainement

Présentation du livre


FAQ sur le format MPEG-4

Version imprimable

Sommaire

  • -1- Objectif de ce document
  • -2- Qu'est-ce que le MPEG-4
  • -3- La famille MPEG
  • -4- L'intégration des éléments : description de scènes
  • -5- L'encodage Vidéo
  • -6- L'encodage Audio
  • -7- Les fonctions 3D
  • -8- Le streaming en MPEG-4
  • -9- Les CODECs existants
  • -10- Le matériel à mettre en oeuvre
  • -11- Quelques reflexions sur l'impact du MPEG-4
  • -12- A propos de cette FAQ

-1- Objectif de ce document

Un nouveau format a été normalisé à l'ISO pour le multimédia. Il offre des possibilités nombreuses et pourrait remplacer à terme les formats propriétaires aussi bien dans la Vidéo à la demande, la diffusion en temps réel que dans les autres projets multimédias. Le MPEG-4 pourrait représenter le format de la fusion entre l'Internet, les jeux vidéos et la télévision.

Ce document présente quelques réponses aux questions les plus courantes..

-2- Qu'est-ce que le MPEG-4

Le MPEG-4 est un format informatique normalisé permettant de stocker, d'intégrer et de diffuser des objets audiovisuels naturels et synthétiques (créés sur un ordinateur). Cela inclus : la vidéo, l'audio, les graphismes en 2 dimensions, et les mondes virtuels en 3 dimensions.

le MPEG-4 est adapté pour diffuser des contenus à la fois sur des réseaux bas débits (par exemple dans le cadre des accès Internet par la ligne téléphonique) et sur des réseaux haut débits. Il permet les deux modes d'accès :

  • Par téléchargement : Le fichier MPEG-4 est récupéré entièrement sur le serveur distant et est ensuite utilisé
  • Par "streaming" : Le fichier est envoyé progressivement et affiché au fur et à mesure.

-3- La famille MPEG

Il existe plusieurs formats développés par le comité MPEG (Motion Picture Experts Group). Ils ont ensuite pour vocation d'être normalisés par L'organisation Internationale de Normalisation (ISO) :

  • Le MPEG-1 est adapté à la vidéo conservée sur les CD Vidéos (1 CD ROM de 600 Mo ou CD Vidéo contient en général 1 heure de vidéo de faible qualité)
  • Le MPEG-2 est adapté à la vidéo conservée sur les DVD (1 Digital Versatil Disk de 4,7 Go contient en général 2 heures et demi de très bonne qualité) et à la diffusion de télévisions numérique

Le format musical MP3 n'est en fait que la partie audio de ces deux standards. Le MPEG-4 par ses possibilités de compresser très efficacement la vidéo est parfois vu comme le "MP3 de la Vidéo". Cela explique la confusion de ceux qui utilisent parfois le terme impropre MP4 au lieu de MPEG-4.

Le MPEG-3 dédié à la télévision haute définition a finalement été arrêté car le MPEG-2 faisait plutôt bien l'affaire, si bien que le standard suivant est le MPEG-4. Il existe d'autres projets qui viennent compléter le MPEG-4. Les experts du groupe MPEG se sont amusés à les numéroter suivant une suite qui permet "d'expliquer" le trou entre 2 et 4 : Pour obtenir le numéro du standard suivant on ajoute un nombre qui augmente de 1 à chaque fois :

  • MPEG-1 - La vidéo et l'audio adaptés au CDV (1.15 MBits/s)
  • MPEG-2 : MPEG-1 + 1 - La vidéo et l'audio adaptés au DVD (entre 4 a 6 Mbits/s)
  • MPEG-4 : MPEG-2 + 2 - L'intégration des formats Audiovisuels (Vidéo, audio, 2D, 3D) pour le bas et le haut débit
  • MPEG-7 : MPEG-4 + 3 - Description des informations audiovisuelles pour faciliter la recherche et le filtrage. Il devient possible de retrouver une prise d'un film à partir d'un croquis ou d'une description verbale, ou une musique simplement en la fredonnant.

Il existe une autre explication : Les experts auraient trouvé que le MPEG-7 était si différent des standards précédant, qu'ils auraient préféré le 7 porte bonheur au 5. Il est donc inutile de rechercher un MPEG-5 ou un MPEG-6. Cependant le numéro du standard suivant le MPEG-7 est le ... MPEG-21 (comme 21ème siècle) ! Le MPEG-21 qui devrait rassembler tous types de contenus (texte, données, vidéo, son...) sur tous types de médias (télévision numérique, Internet, téléphones mobiles...)

-4- L'intégration des éléments : description de scènes

Le MPEG-4 contrairement aux standards précédants est orienté objet. Cela signifie qu'il devient possible d'intégrer des objets très divers pour constituer la scène que l'on souhaite transmettre : Un personnage filmé en vidéo et un objet 3D sont sur un fond en 2D. Chaque objet dispose de ses propres paramètres (taille, position).

Il est possible de constituer ainsi des scènes complexes : Une photo de visage est "mappée" sur la tête d'un avatar en 3D et animée en fonction d'un texte (fonctions "talking head" et "text to speech"). Si le tout est superposé à une vidéo de Venise par exemple, il devient possible de faire se rencontrer des personnes physiquement distantes pour une émission commune...

Pour décrire et changer dynamiquement les scènes, le MPEG-4 utilise un format appelé BIFS (BInary Format for Scenes). Ce format permet également de définir le comportement des objets en fonction des commandes de l'utilisateur, pour permettre une interactivité.

Le BIFS est basé sur le standard actuel de description de mondes 3D : le VRML. Mais contrairement au VRML, il décrit les objets et les actions en format binaire, non directement lisible par l'homme, afin d'économiser de la place.

Il permet également de prendre en compte la dimension de temps et la synchronisation entre les différentes actions (un texte peut apparaitre à tel moment précis de la vidéo...). Si le VRML ne le permet pas, le BIFS se rapproche dans ce cas du SMIL (Synchronized Multimedia Integration Language basé sur le XML) mais dispose de la 3D et de fonctions évoluées.

-5- L'encodage Vidéo

Le MPEG-4 accepte plusieurs formats Vidéo. Il intègre cependant un format performant qui permet de faire tenir plus de deux heures de vidéo dans un CD (650 Mo) avec une qualité acceptable de type VHS.

Il devient possible de transférer de la vidéo plein écran à travers le réseau. Un débit effectif de 400 KBits/s est nécessaire pour une qualité "plein écran". Il est possible avec une ligne ADSL moyenne ou à un accès par le Cable.

Le MPEG-4 introduit des notions d'objets Vidéo (VO), par exemple un personnage ou une voiture qui passe. Le MPEG-4 introduit également le plan d'objet vidéo (VOP) qui représente un objet Vidéo à un moment donné et la couche d'objet vidéo (VOL). cette décomposition en objet facilite grandement l'interactivité, et il devient plus facile d'obtenir des informations sur un objet (un joueur ou sur la voiture qui passe). Le principe de base de la compression MPEG-4 repose sur le contenu. Il faut alors séparer le fond des objets animés. Cela permet lors d'un panoramique par exemple de ne transmettre qu'une seule fois le fond complet et d'envoyer séparément les objets animé.

-6- L'encodage Audio

Le MPEG-4 dispose de plusieurs algorythmes de codage pour les sons naturels mais aussi pour les sons de synthèse. Il permet des codages de 2 à 64 KBits/s et permet le son dans toutes les qualités, depuis la voix synthétique jusqu'au son multicanal de haute qualité.

Le MPEG-4 intègre également des fonctionalités intéressantes pour le contrôle de la vitesse, le changement de tonalité (intéressant en particulier pour le Karaoké), la résistance aux erreurs et l'adaptation au débit

-7- Les fonctions 3D

Les fonctions 3D sont basées sur le standard VRML. Mais le MPEG-4 ajoute des fonctionalités suplémentaires en plus des aspects de synchonisation entre les objets apporté par le BIFS (BInary Format for Scenes) qui permet la description de scène intégrant tous les types d'objets.

Le VRML est très adapté aux modèles inanimés, mais il est impossible de créer un bon modèle de visage ou de corps humain par exemple. Le nouveau format SNHC (Synthetic-Natural Hybrid Coding) intégré dans le MPEG-4 permet de définir des paramètres normalisés pour la modélisation faciale et la synchronisation des expressions faciales, du mouvement des lèvres et du son. Ce mécanisme est appelé "talking head" (tête parlante) et permet de faire parler une tête modélisée sur laquelle on a "mappé" une photo de visage.

-8- Le streaming en MPEG-4

Le streaming permet de diffuser un programme audiovisuel directement en permettant de le regarder au fur et à mesure qu'il arrive, plutôt que de devoir attendre qu'il soit entièrement téléchargé.

Le MPEG-4 permet de s'affrachir de l'obligation de coder plusieurs fois ses propres fichiers vidéo pour s'adapter aux différents débits disponibles sur le réseau. Il permet des débits allant de 5KBits/s jusqu'à 4MBits/s. Dans ce cas, plusieurs flux de données sont transmis, chacun ajoutant des informations supplémentaires aux précédants. Suivant le débit disponible, l'utilisateur pourra récupérer le flux de base ou obtenir un résultat meilleur au fur et à mesure qu'il pourra accepter plus de débit d'information.

Le logiciel de Streaming de Microsoft (Windows Media Player), s'il dispose de la vidéo encodée en MPEG-4, oblige à utiliser des formats et des protocoles propriétaires à Microsoft, par exemple pour le son ou pour la diffusion en temps réel sur le réseau.

Un nouveau consortium s'est mis en place pour permettre un standard unique de streaming : l'Internet Streaming Media Alliance (ISMA) qui regroupe des industriels tels qu'Apple, Cisco, Sun, Philips et Kasenna. L'ISMA travaille pour proposer des protocoles permettant de "streamer" des contenus MPEG-4 tout en intégrant des informations sur les droits d'auteur.

-9- Les CODECs existants

Un Codec (Codeur-décodeur) est un programme qui permet de transformer un flux d'audio ou de vidéo numérique dans un standard plus compressé et de réaliser ensuite l'opération inverse pour relire ensuite les sons et les images.

Le premier codec permettant de lire du MPEG-4 est celui de Windows Media Player de Microsoft. Mais si le codage Vidéo est bien du MPEG-4, le codage audio est lui propriétaire et l'ensemble est au format ASF de Microsoft qui permet de "streamer" des programmes vidéo mais avec des protocoles réseaux propriétaires.

Un français a développé sur cette base un codec "débridé" qui permet de faire du vrai MPEG-4 sur des fichiers qui ne sont pas forcément des fichiers Microsoft ASF. Il s'agit du Codec DivX;) (le smiley à la fin fait parti du nom...). Le MPEG-4 a eu tout de suite un très grand succès car allié à un programme de "craquage" des sécurités du DVD (rippers), il permet d'obtenir une copie d'un film DVD sur un simple CD avec peu de pertes et un coût dérisoire. Mais le codec DivX permet également d'encoder vos propres films et peut être utilisé avec des logiciels de montage type Première de Adobe.

Le Codec DivX;) vient de s'ouvrir et a été placé sous licence libre avec OpenDivX

-10- Le matériel à mettre en oeuvre

Le matériel pour mettre en oeuvre l'intégralité des fonctionnalités du MPEG-4 est encore imposant et nécessite souvent des machines bi-processeur.

Si certaines cartes permettent d'accélerer la lecture vidéo en MPEG-4, de nouvelles cartes doivent sortir qui permettront d'accélerer l'encodage. En attendant, les encodeurs logiciels tels que DivX;-) ou celui de Philips permettent d'encoder au format MPEG-4, bien qu'ils ne le fassent pas en temps réel.

Des camescopes permettent également de stocker directement les images en MPEG-4. Le tout premier sortit, le VN-EZ1de Sharp se cantone cependant aux faibles débits et donc à une image maximale de 320X240 pixels, la mémoire interne limitant également la durée du programme enregistrable.

-11- Quelques reflexions sur l'impact du MPEG-4

Grâce à ses descriptions de scènes composées d'objets que l'on peut remodeler, les contenus se rapprochent de la programmation. Cette dernière, lorsque l'on dispose des codes sources, permet d'ajouter, de modifier ou de supprimer des éléments d'un programme. De même, il deviendra possible de modifier une "scène" transmise ou d'utiliser facilement des élements réalisés par d'autres personnes.

Ces nouvelles possibilités permettent de se rapprocher de l'univers du jeu vidéo où l'interactivité est très grande ou même, grâce à la mise en réseau, de l'univers du jeu de rôle où un meneur de jeu affine l'histoire au fur et à mesure à partir de règles préétablies. Une émission de télévision MPEG-4 ressemblera sûrement plus à une visite guidée ou à un jeu de rôle, qu'aux exemples actuels de télévision interactive.

L'intégration de nombreux objets pouvant provenir de sources diverses devrait imposer une réflexion sur les notions de propriété. Celle-ci est abordée de façon très différente entre le monde de l'audiovisuel et celui de l'informatique.

Dans le cas particulier de l'approche libre, la banque de programmes multimédias libres de droits sur Internet réalisée par Vidéon devrait évoluer pour intégrer plus d'éléments, alors qu'elle contient actuellement principalement des programmes complets. La partie de la licence publique multimédias dédiée aux éléments de programmes pourrait alors disparaitre pour faire référence directement à la Licence Publique Générale (GPL) de la Free Software Foundation.

-12- A propos de cette FAQ

Cette "Foire Aux Questions" a été rédigée par Jean-Michel Cornu dans le cadre

Historique

  • Version 0.1 du 29 janvier 2001 - premier document
  • Version 0.2 du 31 janvier 2001 - corrections éditoriales par Emmanuel Josse
  • Version 1.0 du 28 février 2001 - intégration des commentaires du groupe vidéo de la FING

Source : http://www.fing.org/index.php?num=1901,4

Copyright © AFING, association loi 1901 - Fondation Internet Nouvelle Génération - Reproduction encouragée sous réserve de citer la source


Jean-Michel Cornu - 28 février 2001