Toutes les organisations sont convaincues que l’amélioration de leur performance passe par des phénomènes d’apprentissage, d’analyse, de renouvellement ou de changement technologique. Chacun de ces éléments implique pour l’organisation de s’adapter et d’effectuer des compromis entre les activités d’exploitation de ce qui est déjà connu, et d’exploration de nouvelles idées. Cette tension entre exploitation et exploration est fondamentale pour les entreprises.
Dans un article fondateur de 1991, James G. March analyse les effets de l’apprentissage dans deux cadres spécifiques : le premier, celui de l’apprentissage réciproque entre une organisation et les membres qui la composent, et le deuxième, celui de l’apprentissage dans l’optique de construire un avantage concurrentiel pour l’entreprise.
L’auteur explique que le compromis exploration/exploitation est difficile à établir dans la mesure ou les bénéfices respectifs de ces activités ne sont pas comparables, notamment en termes de ROI attendu, de variance des résultats (la performance finale de l’exploration a beaucoup plus de chance d’être éloignée de la moyenne prévue que la performance finale de l’exploitation), de timing, et parce que ces résultats n’affectent pas l’ensemble de l’organisation de la même manière.
Le compromis exploration / exploitation
J.G. March discute de ce compromis dans les différentes théories de l’action dans les organisations :
- Dans les modèles de choix rationnels ou l’entreprise sélectionne des opportunités ayant un certain niveau de ROI (Retour sur Investissement), cette dernière peut soit allouer des ressources à la recherche de nouvelles opportunités (ou à l’amélioration de certaines existantes), soit saisir les opportunités qu’elle connait déjà.
- Dans les théories de la rationalité limitée, l’entreprise cherche des opportunités si celles dont elle dispose ne répondent pas à son niveau d’aspiration, et saisit celles qu’elle connaît si elles sont au dessus de son niveau d’aspiration.
- Dans les théories de l’apprentissage organisationnel (qu’il détaillera par la suite, voir Levinthal D.A. & J.G. March, (1993), ‘The myopia of Learning’.), l’exploration de nouvelles alternatives ralentit l’apprentissage et la maîtrise de compétences existantes, alors que l’exploitation des connaissances existantes rend de plus en plus difficile l’expérimentation.
- Dans les théories évolutionnistes, le compromis exploration / exploitation se transforme en problème d’équilibre entre la modification et la sélection de routines organisationnelles. Il est vital pour l’entreprise de sélectionner les routines de fonctionnement efficaces, mais également d’en générer de nouvelles dans la mesure ou celles existantes pourront devenir obsolètes.
Du fait des caractéristiques intrinsèques de l’exploration et de l’exploitation (en termes de ROI, timing, risques), les activités d’exploration sont systématiquement plus vulnérables que les activités d’exploitation. En conséquence, la tendance naturelle de l’entreprise est de favoriser l’exploitation des connaissances qu’elle maîtrise au détriment de l’innovation, donc fait des processus d’adaptation des processus potentiellement auto-destructeurs (“these tendancies to increase exploitation and reduce exploration make adaptive processes potentially self-destructive“).
L’apprentissage mutuel dans le développement du savoir
L’auteur propose un modèle pour évaluer l’ajustement réciproque entre la réalité (représentée par un m-uplet de valeurs -1 ou 1, de type (-1,1,1,-1,…,1)), le code de valeur de l’entreprise (représenté par un m-uplet prennant des valeurs -1,0 ou 1) et n individus de cette organisation (ayant chacun leur m-uplet propre). A chaque période, un individu peut voir son m-uplet modifié si celui ci diffère du code de l’entreprise, modification survenant avec une probabilité p1 dépendant du niveau de socialisation de l’individu). En parallèle, le code apprend des individus dans la mesure ou une majorité de ceux-ci sont en phase avec la réalité sur une des dimensions et que le code ne l’est pas, le changement intervenant avec une probabilité p2 dépendant du nombre de personnes constituant la majorité. A la première période, le code de l’entreprise est (0,0,0, …, 0), la réalité et les croyances des individus sont aléatoires.
L’expérience est répétée avec m=30, n=50 et le nombre de répétition P=80. Les résultats sont les suivants :
- La différence entre le code est les individus diminue avec le temps, jusqu’à l’atteinte d’un équilibre.
- Un apprentissage rapide (une forte sociabilisation) n’est pas toujours désirable, notament du fait que le code ne peut apprendre que des individus qui dévient de lui. Un apprentissage plus lent de la part de certains individus maintient une capacité d’exploration qui permet au code de continuer à apprendre.
- Les organisations hétérogènes (i.e.) disposant de certains individus apprenant vite et d’autres lentement atteignent un équilibre de connaissance supérieur.
- Un taux de turnover compris entre 0,2 et 0,3 accroit la capacité d’apprentissage des organisations ou le taux de socialisation est élevé. Les nouveaux membres d’une organisation ont une connaissance certes moins importante que les anciens, mais celle ci est moins redondante avec le code existant (“Contributions to improving the code, and subsequently individual knowledge, come from the occasional newcomers who deviate from the code in a favorable way“).
- Dans un environnement turbulent (i.e. ou chacune des m dimensions de la réalité varie à chaque période avec une probabilité p4), la connaissance qu’ont les individus et le code de la réalité progresse pendant un certain temps pour ensuite se dégrader jusqu’à 0. Un turnover de 10% permet d’éviter cet effet.
La conclusion de cette expérience est qu’en environnement turbulent, l’organisation qui maintiendra le meilleur niveau de connaissance de son environnement favorisera une forte sociabilisation et assurera un certain niveau de rotation des effectifs.
Connaissance et concurrence
J.G. March avance ici l’idée que le résultat de l’apprentissage d’une organisation en termes de performance est directement lié à l’apprentissage des autres organisations. Le modèle construit repose sur l’évaluation de la probabilité P* qu’une organisation avec une distribution de probabilité (moyenne x’ et variance v’) similaire à la moyenne du secteur (x,v) ait une performance supérieure aux N (x,v) organisations. Le résultat est que si N est supérieur à 1 (mais fini), une augmentation de la performance moyenne ou de sa variance a un effet positif sur l’avantage concurrentiel. Par ailleurs, le compromis entre l’augmentation de la moyenne et l’augmentation de la variance dépend de N : plus le nombre de concurrents augmente, plus la moyenne de performance devient insignifiante dans sa contribution à l’avantage concurrentiel, au contraire de la variance.
Si l’on considère que l’activité d’exploitation tend à réduire la variance de la distribution statistique de performance, en même temps qu’elle augmente légèrement la moyenne, alors que l’exploration augmente potentiellement très fortement à la fois la variance et la moyenne, on comprend pourquoi seule l’exploration (donc l’innovation) conduit au leadership sur un marché. L’auteur invite donc à évaluer les changements (technologiques, apprentissage, autres) en fonction de leur contribution à la moyenne et à la variance de performance. L’introduction d’une nouvelle technologie très supérieure à l’existant pourra par exemple offrir un ROI bien supérieur à la conservation de l’ancienne (augmentation de la moyenne compensant l’augmentation de la variance), et conduire à la conquête d’un marché. Inversement, la standardisation (légère augmentation de la moyenne et baisse de la variance) réduit la probabilité de finir dernier sur son marché, sans augmenter celle de finir premier (“The price of reliability, however, is a smaller chance of primacy among competitors“).
Du fait de la préférence pour l’exploitation, les entreprises ont tendance à relacher leur leadership sur le marché, donc se condamnent pour l’avenir.
Conclusion
La complexité de détermination de l’équilibre entre l’innovation et la conduite des affaires courantes ne doit pas être une excuse pour “laisser-faire”. Quelques pistes de maintien de l’exploration existent, et doivent être déployées pour garantir la pérénnité des organisations actuelles. En leur absence, l’adaptation classique de l’entreprise conduira paradoxalement à son inadéquation et donc, dans le cadre d’une économie de marché concurrentielle, à sa disparition.
Contribution