Les blocs
Dans Léopard des neiges, Apple a introduit une extension de langage C appelée les "blocs". Les blocs ajoutent des fermetures (closures) et des fonctions anonymes (anonymous functions) au C et à ses langages dérivés (C++, Objective C et Objective C++).
Ces caractéristiques sont disponibles dans les langages de programmation dynamique comme Lisp, Smalltalk, Perl, Python, Ruby, et même dans le modeste Javascript depuis longtemps (des décades, dans le cas de Lisp- un fait volontairement mis en avant par ses adeptes). Alors que les programmeurs de langages dynamiques considèrent des fermetures et les fonctions anonymes comme normales, ceux qui travaillent dans des langages compilés statiques comme C et ses dérivés les trouvent plutôt exotiques. Quant aux non programmeurs, il est vraisemblable qu'ils n'éprouvent aucun intérêt pour le sujet. Mais je vais quand même tenter de m'expliquer, car les blocs forment le fondement de quelques technologies intéressantes qui vont être abordées plus tard.
Peut-être que la façon la plus simple d'expliquer les blocs, c'est de dire qu'ils font des fonctions une autre forme de données. Les langages hérités de C ont déjà des pointeurs sur les fonctions, qui peuvent être passés comme des données, mais ceux-ci ne peuvent pointer que sur des fonctions qui ont été créées au moment de la compilation. La seule façon d'influencer le comportement d'une telle fonction, c'est de passer des arguments différents à la fonction, ou de définir des variables globales auxquelles on accède à partir de la fonction. Ces deux approches ont de gros désavantages.
Le passage d'arguments devient compliqué quand leur nombre et leur complexité s'accroît. Et puis, il se peut que vous ayez un contrôle limité sur les arguments qui vont être passés à votre fonction, comme dans le cas des fonctions de rappel (callbacks). Pour compenser, vous pouvez avoir à empaqueter tout ce dont vous avez besoin dans un objet contexte d'une forme ou d'une autre. Mais quand, comment, par qui les données du contexte vont-elle être utilisées peut être difficile à définir précisément. Souvent, une seconde fonction de rappel est nécessaire pour cela. C'est très pénible.
Quant à l'utilisation des variables globales, en plus du fait bien connu qu'elles sont anti-pattern, elles sont aussi non sécurisées vis à vis des threads. Les sécuriser exige des verrous ou une autre forme d'exclusion mutuelle pour empêcher de multiples invocations de la même fonction de se marcher sur les pieds. Et s'il y a quelque chose de pire que de naviguer dans la mer des APIs basées sur des fonctions de rappel, c'est de se colleter manuellement à des problèmes de sécurité des processus légers (threads).
Les blocs évitent tous ces problèmes en permettant à des amas de code fonctionnel -les blocs- d'être définis à l'exécution. C'est plus facile à comprendre avec un exemple. Je vais commencer en utilisant du Javascript, qui a une syntaxe un peu plus familière, mais les concepts sont les mêmes.
J'ai créé une fonction appelée multiplier qui prend un seul argument, a, et le multiplie par une seconde valeur, b, qui est founie par l'utilisateur à l'exécution. Si l'utilisateur fournit le nombre 2, alors, un appel à multiplier(5) renvoie la valeur 10.
Voici l'exemple ci-dessus réalisé avec des blocs en C :
Par comparaison avec le code Javascript, j'espère que vous pouvez vous rendre compte comment la version C fonctionne. Dans l'exemple en C, l'accent circonflexe est la clé de la syntaxe des blocs. C'est un peu vilain, mais c'est très proche du C, dans la mesure où on adopte la syntaxe C existante pour les pointeurs sur une fonction, avec un ^ qui remplace *, comme le montre l'exemple.
Vous pouvez me croire, quand je vous dis que cette syntaxe est tout à fait cohérente pour des programmeurs C aguerris.
Et maintenant, est-ce que ça veut dire que C est soudain devenu dynamique, un langage de haut niveau comme JavaScript ou Lisp ? Pas vraiment. La distinction entre la pile et le tas, les règles qui régissent les variables automatiques et statiques, et autres choses sont encore là, avec leurs pleins effets. Et en plus, il y a maintenant un nouvel ensemble de règles pour définir comment les blocs interagissent avec. Il y a même un attribut new_block de type storage pour contrôler la visibilité et la durée de vie des valeurs utilisées dans les blocs.
Tout cela dit, les blocs représentent encore un gain énorme dans C. Grâce aux blocs, les APIs sympathiques dont on a depuis longtemps profité dans les langages dynamiques sont maintenant disponibles pour les langages dérivés du C. Par exemple, supposons que vous vouliez appliquer une certaine opération à chaque ligne d'un fichier. Pour le faire, un langage de bas niveau comme le C a besoin du code classique pour ouvrir et lire le fichier, gérer les erreurs, lire chaque ligne dans une mémoire tampon, et tout nettoyer à la fin.
La partie en rouge est une représentation simplifiée de ce que vous voulez faire pour chaque ligne. Le reste est le code standard nécessaire. Si vous avez à faire des opérations variées sur les lignes de nombreux fichiers, ce code standard devient lassant.
Ce que vous aimeriez faire, c'est l'incorporer dans une fonction que vous pourriez appeler. Mais alors, vous êtes confronté(e) à la difficulté d'exprimer les opérations que vous voudriez faire sur chaque ligne des fichiers. Au milieu de chaque bloc standard, beaucoup de lignes de code, peut-être pour exprimer les opérations à faire. Ce code peut être amené à utiliser ou modifier des variables locales qui sont modifiées par programme, si bien que des pointeurs à des fonctions ne marchent pas. Que faire ?
Grâce aux blocs, vous pouvez définir une fonction qui prend un nom de fichier et un bloc comme arguments. Cela vous cache tout le code sans intérêt.
Ce qui reste est une expression beaucoup plus claire de ce que vous voulez faire, avec moins de bruit autour. L'argument après le nom de fichier est un bloc littéral, qui prend comme argument une ligne de texte.
Même quand le volume du code standard est faible, le gain en simplicité et en clarté sont encore appréciables. Voyez cette boucle, la plus simple possible, qui s'exécute un nombre de fois déterminé. En C, même cette construction de base offre un grand nombre de risques de bogues. Faisons dix fois do_something() :
Mince, j'ai fait une petite faute, là non ? Ça arrive aux meilleurs d'entre nous. Mais pourquoi ce code serait-il plus compliqué que la phrase qui sert à le décrire ? Répéter quelque chose 10 fois ! Je n'ai pas voulu le faire 11 fois ! Les blocs peuvent aider, si on fait un peu l'effort de définir une fonction plus claire :
On peut alors supprimer la bogue pour de bon :
Et souvenez-vous, l'argument du bloc pour repeat() peut contenir exactement le même type de code, copié et collé, littéralement, que celui qui serait apparu dans une boucle for...
Toutes ces possibilités, et plus, ont été utilisées par les langages dynamiques : map, reduce collect, etc... Bienvenue, programmeurs en C, dans un ordre plus haut.
Apple a appris la leçon par cœur, en rajoutant plus de 100 nouvelles APIs qui utilisent les blocs dans Léopard des neiges. Beaucoup de ces APIs ne seraient pas possibles sans les blocs, et toutes sont plus élégantes et plus concises qu'elles ne l'auraient été autrement.
Apple a l'intention de proposer les blocs comme extension à un ou plusieurs des langages basés sur le C, bien qu'il ne soit pas bien facile de savoir, quel organisme de standard peut être réceptif à ce genre de proposition. Pour le moment, les blocs sont supportés par les quatre compilateurs d'Apple dans Mac OS X.