Manipuler des documents Open XML avec .NET (1/5) |
L'Open Packaging Convention avec .NET 3 |
|
 |
Après une certaine déception devant le format XML de Office 2003, Microsoft se devait de rectifier le tir. C’est chose faite avec la nouvelle mouture de son format de fichier : OpenXML ! Ce nouveau format, taillé sur mesure pour Office 2007, se veut un digne concurrent de OpenDocument : les spécifications sont ouvertes, seuls des standards ouverts sont employés et son utilisation est libre de droits.
|
Un format nouvelle génération
Le format de Open Office 1.x supportait déjà le modèle de séparation des données et de la présentation, ainsi on trouvait les données du contenu séparées des données de présentation, et toutes ces ressources étaient compressées dans un fichier ZIP. OpenXML reprend ce concept qui apporte beaucoup de flexibilité à la structure des documents et qui facilite beaucoup la manipulation des fichiers.
La venue de ce nouveau format de fichier correspond d’une part à la sortie de Office 2007, et d’une autre part à l’arrivée de Vista et du framework .NET 3. C’est d’ailleurs ce dernier qui va nous fournir un certain nombre d’APIs, via le namespace System.IO.Packaging, nous permettant de manipuler ce format avec .NET.
Mise en place de l’environnement de développement
Afin de pouvoir développer dans de bonnes conditions, nous allons devoir installer plusieurs outils qui sont au nombre de trois : le framework .NET 3, le SDK Windows Vista et enfin les extensions pour Visual Studio 2005 qui vous permettrons de développer avec cet IDE. Lors de la rédaction de cet article, la version du framework .NET 3 était la RC1, tous les téléchargements et tous les exemples se basent sur cette version. Vous trouverez les liens vers les téléchargements à la fin de cet article.
Une fois l’ensemble de ces outils installés, configurer un projet permettant d’utiliser le namespace System.IO.Packaging est une tâche rapide : ajoutez une référence à votre projet, avec un clic droit sur ‘References’, vers l’assembly WindowsBase.
|
Une fois le namespace System.IO.Packaging spécifié dans votre code, vous allez disposer de toutes les classes nécessaires pour manipuler des fichiers OpenXML ou XPS ; c’est d’ailleurs ce que nous allons voir dans les parties suivantes.
|
La structure d’un document OpenXML
Les documents OpenXML sont empaquetés dans un fichier compressé au format ZIP - le paquet ou package en anglais - contenant un ensemble de parties et d’éléments. Les parties sont des morceaux du contenu du document (texte, image, style, …) qui une fois assemblés constitueront le document. Les éléments sont des métadonnées qui décrivent comment les parties sont assemblées et rendues. Parmi les éléments, on distingue les éléments de relations, qui définissent comment sont reliées les parties entre elles, et les éléments de type de contenu, qui définissent le type de contenu de chaque partie. Les éléments de relations sont également divisés en deux sous-catégories : les relations de paquet, qui lient une partie au paquet, et les relations de parties, qui lient les parties entre elles.
Voici un résumé des différents constituants d’un document OpenXML :
|
|