RMLL, jour 3

Aujourd'hui a été entièrement consacré au thème « Documentation » de Muriel Shan Sei Fan et de Sébastien Blondeel.

La première conférence est celle de Céline Benoit, de l'École des Mines de Nantes, « Retour d'expérience sur la mise en place d'une bibliothèque numérique ». Castore a pour but de diffuser la littérature de l'école (les professeurs avec support de cours comme les étudiants avec les rapports de stage). Cet outil est opensource pour qu'elle soit utilisée par d'autres écoles. Il a été créé avec Eclipse, quelques plugins (dont CVS et Junit) et Maven. Commencé en 2001, opensource en 2004 (année où ils se sont posés des questions sur les droits d'auteur pour les documents), supporte OAI. Intéressant mais dommage que ce soit si académique et surtout théorique.

La conférence suivante était « Cyberthèses et cyberdocs : thèses et mémoires électroniques, accès ouvert et opensource ». Le conférencier a commencé par une bonne diatribe contre les guerres de clochers (et étant donné les questions vachardes posées sur le précédent sujet, ça me paraît bien rafraichissant). Il a aussi fait une autre diatribe excellente contre l'article de Libération :) Il a beaucoup insisté sur l'accès libre et ouvert des documents scientifiques (appel de Budapest pour l'accès ouvert). CyberDocs est un système de publication XML libre. Cela commence en 98 avec Cyberthèses qui repose sur SGML et la DTD TEILite donnant comme résultat un document HTML statique. En 2003-2004, Cyberthèses est devenu opensource et repose sur du XML. Avec ces changements, il devient du coup CyberDocs. D'après le conférencier, le passage à l'opensource garantit la cohérence et la pérennité du projet... objectifs donc politiques mais aussi économiques (dissémination à moindre coût) et technologiques (XML, Unicode, MathML, SVG, OAI). Trois phases : développement initial (peu de développements et de soutiens financiers), croissance des utilisateurs de base, développement raisonnable (de plus en plus d'utilisateurs, mais aussi de développeurs et de soutiens). En entrée, un fichier .doc ou .sxw qu'openoffice transforme dans sa DTD XML qui sera reconstruit avec XSLT pour créer un document XML de travail. Ce document sera validé avec XSLT puis archivé. Il sera exporté avec XSLT/XSL-FO pour produire du OpenOffice.org, du PDF, du HTML, etc. Il supporte aussi OAI. Résultats : dissémination dans des communautés linguistiques différentes, coopération entre différents pays de l'Amérique du Sud (Chili, Argentine, Pérou, Colombie, Vénézuela), pareil pour la communauté d'Afrique (conditions réunies pour la réalisation d'un réseau thématique en partenariat avec l'OMS), installation de la plateforme en Algérie (pôle arabophone). Une carte affichée montre l'appropriation de l'outil par les pays du sud. Une démo très impressionnante, un discours très intéressant, un conférencier sûr de lui (mais pas arrogant)... excellente conférence.

La pause a été l'objet d'un gros fight sur LateX sans intérêt.

Dans « Du texte au document mis en page imprimable : docbook, Inkscape et Scribus », Cédric Gémy a commencé sur les systèmes non sémantiques (comme groff pour les pages man et latex pour les publications scientifiques). Puis, DocBook complètement sémantique mais qui demande malheureusement un réel investissement. La personnalisation du résultat obtenu est nécessaire pour que les documents ne se ressemblent pas et parce que la présentation a un impact sur la compréhension. Scribus, seul vrai logiciel de PAO sous Linux, utilise XML comme format internet et exporte en PDF. Il propose un processus : écrire le doc en OOo, transformer en docbook avec ooo2sdbk, routines auto sur les fichiers docbook, importer le script OOo dans scribus pour une mise en page finalisée. Par manque de temps, la conférence s'est arrêtée là... il faudrait que j'aille le voir pour qu'il puisse répondre à quelques questions encore sans réponse.

Thomas Heuriaux a présenté le processus de traduction pour Debian. Il a commencé par la différence entre i18n, l10n et et g11n (globalisation). Debian traduit ce qui est spécifique à Debian et ce qui n'est pas fait ailleurs. Par exemple, le site web qui comporte 3300 pages, 5 langues au-dessus de 50% de traduction, et le français près du 100%. Il ont un bon nombre d'outils intéressants : mails avec tags, robots. Le reporting se fait par par BTS ou par mail. Il a précisé les deux problèmes importants qu'ils rencontrent : absence de lexique de qualité et de mémoires de traduction. La démonstration po4a est beaucoup plus intéressante que je ne le croyais. Bref, malgré un début un peu difficile, la présentation est vraiment intéressante. Il faudrait créer un pont plus important avec eux. Et tester po4a pour la gazette, les guide pratiques et kernelfr.

(partie en pas bon français, pas trop édité...)

L'après-midi a commencé avec une table ronde des éditeurs : de droite à gauche Xavier Cazin, éditeur O'Reilly, Alexis Kauffmann, pour le framabook, Nat Makarévitch, éditeur, Muriel, éditrice Eyrolles depuis 2000. Quel objectif pour toute doc/livre ? le processus de création d'un livre ne change pas : éditeur, imprimeur, diffuseur. Alexis indique clairement le but de Framasoft : diffuser le libre. Pour lui, les typos, les petites erreurs sont regrettable mais pas bien graves. C'est libre, tout le monde peut améliorer le livre. D'après Xavier, il est difficile de diffuser des livres informatiques auprès des libraires. Ça et "Documentation libre et framabook" obligent les éditeurs "commerciaux" à regarder une diffusion par internet. Du coup, système sans libraire, du coup mort probable des libraires. Dommage car la diffusion du savoir passe par eux. Constat assez pessimiste de Xavier (blog, doc libres, désintérêt des libraires pour l'informatique). C'est quoi être éditeur pour chaque participant ? Pour Alexis, la réactivité (pertinent avec la question des nouvelles versions des logiciels). Il sent leur manque d'expérience, il comprend qu'ils acquièrent des connaissances et ils se posent déjà la question de comment transmettre ce nouveau savoir. Pour Nat, un éditeur doit savoir ce qu'un lecteur cherche, ce qui sera bon pour le lecteur (même ce lecteur ne s'en rend pas compte) et enfin la forme pour le rendre le plus compréhensible. Enfin, un éditeur doit savoir gérer son projet. Il trouve que ces deux points correspondent parfaitement au métier du prof (voir Alexis). D'après Muriel, faire gagner des sous à la maison d'édition, chercher des auteurs, faire un pont entre les connaissances du lecteur et là où on veut l'emmener, la mise en forme, la relecture, l'AQ, la coordination et le marketing. Elle parle aussi des libraires réticents. D'après Xavier, il n'est pas nécessaire d'avoir un gros volume de vente pour être rentable. D'après Alexis, pas besoin d'une grosse quantité pour avoir des petits prix. Il souhaite créer un effet boule de neige. Comité de lecture de profs. Leur réactivité rend le processus troublant (couverture différente, contenu différent mais même livre). Cependant, la réactivité est le bonus du système libre... la boucle est bouclée. Une personne parle de lulu.com. Le feedback de l'éditeur n'existe pas en passant par lulu.com. C'est de l'édition à compte d'auteur. Dans le cas du framabook, l'auteur et l'imprimeur gèrent ensemble le budget, la quantité imprimée. Le plaisir d'avoir un élément de sa conception dans sa bibliothèque pour l'auteur.Bon pour le CV (histoire d'un gars qui a utilisé six mois de son chomage pour écrire un livre qu'il a utilisé lors de son premier entretien : pas de question sur ces compétences, salaire bien supérieur à ce qu'il espérait). Part du libraire sur le livre : 30 à 40%. Pour un livre technique, la rentabilité demande de vendre 1500 exemplaires (donc pour commencer à gagner de l'argent, un peu plus). Beaucoup de livres se vendent difficilement à 1500 exemplaires. Pour les livres très pointus, 800 à 1000 ; à 2000 ils soufflent un peu (la plupart des livres, pas seulement techniques, arrivent à seulement 1500). 200 exemplaires du framabook vendus en un mois et demi. Les livres libres éditées par O'Reilly ne se sont pas si bien vendus que ça. Mais sans la partie libre, il n'est pas sûr que cela aurait mieux fonctionner. En fait, plutôt le contraire. Dans le long terme, la version payante peut tenir grâce à la version libre. Temps entre l'écriture et la sortie : entre six mois et un an.

(fin de la partie en pas bon français, pas trop édité... prévu pour demain)

Enfin, la dernière conférence de la journée présentée par Florence Nibart (plus connu sous son pseudo, anthere) pour wikinews. Après wikimedia, wiktionnari, wikibook... voici wikinews. Commencé en 2004, 21 langues, 5800 articles, 822 en français, sous licence libre. Ce n'est pas un site commercial. Quel est donc son intérêt étant donné que les autres sites sont déjà gratuits ? la licence libre et le problème de la diversité des sources. Pour google news et les journalistes « assis », l'important, c'est ce qui est très couvert, d'où l'apparition du journalisme militant (ce n'est pas le cas de wikinews). Son constat est que le métier de journaliste est en pleine mutation. Wikinews dispose d'un processus éditorial : création/développement d'un article, peaufinage (antichambre), publication (en première page !), archivage (un grenier accessible). Après archive, l'article devient non modifiable. Les articles sont publiés sous license Creative Commons Attribution 2.5 (donc pas GFDL)... pour ne pas avoir à citer les cinq premiers auteurs et pas d'intégration de la licence. Comme l'indique Dan Gillmore, le journalisme citoyen n'est pas une critique des médias mais une expansion des médias.

Ajouter un commentaire

Les commentaires peuvent être formatés en utilisant une syntaxe wiki simplifiée.

Fil des commentaires de ce billet