D’après le modèle proposé par Hugdahl et ses collègues (2009), le processus de traitement de l’information mis en œuvre au sein d’une situation d’écoute dichotique semble bien correspondre à une situation de conflit cognitif tel que l’entendent Botvinick et al. (2001). Deux stimuli sont présentés en même temps, un différent dans chaque oreille, et chaque stimulus peut à priori être un stimulus cible. Cet état d’incertitude de la localisation du stimulus cible constitue déjà en soi un facteur de conflit cognitif. Afin de résoudre ce conflit, le participant doit faire un choix entre les deux stimuli perçus. Ce choix se situe soit à un niveau perceptif pur, favorisant la détection du stimulus le plus saillant (cette détection étant généralement liée aux facteurs structuraux), soit à un niveau attentionnel où le choix du participant est guidé par l’orientation de son attention. Dans le paradigme d’attention forcée, le conflit cognitif est imposé par les consignes attentionnelles: le participant doit volontairement faire un choix entre les deux stimuli et, de plus, il doit également, dans certaines conditions, ignorer l’identification du stimulus le plus saillant, basée sur le système perceptif. En situation d’identification de stimuli verbaux, identifier le stimulus parvenant à l’oreille gauche est plus difficile qu’identifier le stimulus parvenant à l’oreille droite.

Nous avons vu que les consignes attentionnelles orientent volontairement l’attention des individus sur une seule de leurs deux oreilles et permettent alors de moduler l’avantage structural de l’oreille impliquée en sollicitant des processus top-down générateurs de conflits cognitifs. La suite de cette présentation vise à montrer que d’autres facteurs sont également en mesure de créer un conflit cognitif au sein de la situation d’écoute dichotique, de par la manipulation des processus bottom-up par exemple. La manipulation des processus bottom-up au travers de la variation du mode de présentation des stimuli ainsi que la manipulation de leurs caractéristiques phonologiques seront décrites dans cette partie. La présentation non exhaustive de ces différentes études dans la suite de cette présentation vise à montrer que, à l’aide du paradigme d’écoute dichotique, il est possible de faire varier l’intensité du conflit cognitif en modulant soit l’influence des processus top-down, soit l’influence des processus bottom-up. Il a également été constaté précédemment que le contrôle cognitif était fortement corrélé avec les fonctions exécutives et, par conséquent, avec la capacité de traitement en mémoire de travail. L’ensemble des études ayant mis en évidence le rôle de la mémoire de travail en situation d’écoute dichotique est ainsi abordé dans un premier temps.

3.1. Le rôle de la mémoire de travail

Avec l’avancée des recherches et l’apport de nouveaux modèles, la manière de concevoir la mémoire de travail a beaucoup évolué depuis l’une des premières théories développées par Baddeley (1986). Si la mémoire de travail était, à l’origine, perçue comme un système à capacité limitée permettant de maintenir et stocker des informations temporairement, Engle (2002, p. 20) a étendu ce concept en définissant plus largement la mémoire de travail comme une fonction cognitive à part entière chargée de « maintenir des informations de manière active et facilement accessible ». Pour Engle (2001, 2002), la capacité en mémoire de travail (MdT) ne se résume pas simplement à ses possibilités de maintien de multiples informations. En stockant chaque information temporairement, la mémoire de travail jouerait également un rôle important dans la représentation des buts et l’évaluation de la situation en fonction du contexte. En d’autres termes, pour Engle (2001, 2002), la mémoire de travail se résumerait en la capacité pour chaque individu à contrôler son attention et mettre en place des processus cognitifs de haut niveau.

Des vérifications expérimentales confirment ces propos. Dans le champ de la perception visuelle, Kane, Bleckley, Conway, et Engle (2001), ont observé au moyen de tâches d’interférence (tâches d’empan) que les compétences de contrôle cognitif des individus différaient selon qu’ils présentaient une faible ou une forte capacité en MdT. Les participants possédant une forte capacité en MdT parvenaient plus facilement à réaliser la tâche initiale et à inhiber les informations non pertinentes. L’étude complémentaire de Sobel, Gerrie, Poole, et Kane (2007) analyse ces différences entre individus à faible ou forte capacité en MdT au niveau des compétences d’activation des processus bottom-up et top-down. En effet, alors que l’ensemble de ces participants serait en mesure de solliciter des processus bottom-up lors d’une tâche de recherche visuelle, seuls les individus présentant une forte capacité en MdT activeraient efficacement les processus top-down.

Des résultats similaires ont été obtenus dans le champ de la perception auditive (Colflesh & Conway, 2007 ; Moncrieff, 2001 ; Penner, Schläfli, Opwis, & Hugdahl, 2009 ; Techentin & Voyer, 2011). Sur le primat des études réalisées par Kimura (1961), Penner et al. (2009) ont suggéré qu’une augmentation de la charge de traitement en MdT, au sein d’une tâche d’écoute dichotique à identification de stimuli verbaux, constituait un facteur d’amplification de l’avantage de l’oreille droite. L’amplification de l’avantage de l’oreille droite signifie que, face à une charge de traitement en MdT trop lourde pour lui, l’individu ne possède plus assez de ressources cognitives pour outrepasser la tendance naturelle à identifier les stimuli verbaux perçus dans l’oreille droite, et donc de résoudre le conflit cognitif sous- tendu par l’identification des stimuli parvenant à l’oreille gauche. Pour ce faire, ces auteurs ont présenté trois conditions expérimentales différentes à une population d’individus sains, chaque condition étant constituée de plusieurs essais de 3, 4 ou 5 paires dichotiques de lettres. Les résultats ont bien montré que plus la liste de paires dichotiques s’allongeait, plus l’avantage de l’oreille droite était confirmé. Pour leur part, Techentin et Voyer (2011) ont démontré que le caractère familier et la fréquence des mots utilisés dans une tâche d’écoute dichotique influençaient également l’avantage de l’oreille droite. L’identification de mots peu familiers ou peu fréquents conduit à un accroissement des performances d’identification dans l’oreille droite. Ces résultats peuvent être mis en parallèle avec ceux de Moncrieff (2011) ou de Findlen et Roup (2011). Ainsi, Moncrieff (2011) a montré, auprès d’une population d’enfants, que l’identification de mots produisait un avantage plus grand de l’oreille droite que l’identification de nombres. En se basant sur l’effet de la charge de traitement en MdT, nous pouvons conclure que les nombres constituent une moindre charge de traitement que les mots pour des enfants de 5 à 12 ans. Par ailleurs, Findlen et Roup (2011) ont observé dans une population adulte, un avantage supérieur de l’oreille droite pour des pseudo-mots consonne- voyelle-consonne (CVC) que pour des mots CVC ; les pseudo-mots CVC sembleraient donc demander une plus grande charge de traitement en MdT que des mots CVC.

Comme nous l’avons constaté, la charge de traitement des stimuli en mémoire de travail est un facteur déterminant des compétences d’identification des participants en situation d’écoute dichotique. Toutefois, au-delà du rôle de la charge de traitement des stimuli, d’autres facteurs semblent influencer les compétences des participants: la manipulation des processus top-down et bottom-up au sein de ces situations crée des conflits cognitifs plus ou moins intenses, que les participants doivent parvenir à résoudre.

3.2. Manipulation des processus top-down

3.2.1. Orientation endogène de l’attention à l’aide des indices verbaux

Comme nous l’avons vu dans le chapitre 2, beaucoup d’auteurs se sont attachés à expliquer le rôle de la focalisation attentionnelle sur l’avantage de l’oreille droite, observée en situation d’identification de stimuli verbaux. Dans sa théorie « attentionnelle », Kinsbourne (1970) associe cet avantage de l’oreille droite à la présence spontanée et automatique (processus bottom-up) d’un biais attentionnel du côté droit de l’espace. En se basant sur les travaux de Hiscok et al. (1999), Hugdahl et al. (2009) suggèrent, eux, que l’orientation volontaire de l’attention grâce à l’activation de processus top-down influence tout autant l’avantage de l’oreille droite.

Le paradigme d’attention forcée (Hugdahl & Andersson, 1986) illustre l’effet de ces processus top-down. En demandant explicitement aux participants de ne porter exclusivement leur attention que sur une seule de leurs deux oreilles pendant plusieurs essais consécutifs, l’attention manipulée dans le paradigme d’« attention forcée » est dite endogène, et réfère entièrement à des processus top-down descendants. Cette situation amène typiquement à l’obtention d’un avantage de l’oreille droite en condition d’orientation NF et FR ainsi que d’un avantage de l’oreille gauche en condition d’attention FL (Hugdahl 1995, 2003). En condition FR, il est demandé à l’individu de rapporter le stimulus qu’il perçoit le plus facilement, car directement traité par l’hémisphère cérébral spécialisé. Ainsi, en regroupant l’effet des biais attentionnels et de la spécialisation hémisphérique, la condition FR provoque un accroissement de l’avantage de l’oreille droite. En condition FL, forcer son attention sur l’oreille gauche demande à l’individu de mettre en place des processus attentionnels top-down assez efficaces pour contrebalancer le traitement automatique, bottom-up, des stimuli verbaux perçus dans l’oreille droite (lié à la spécialisation hémisphérique). L’absence d’un avantage de l’oreille gauche en condition FL est alors perçue comme un indicateur de faible contrôle cognitif. Alors que les individus doivent uniquement identifier le stimulus qui est déjà le plus saillant en condition FR, la condition FL leur demande réellement de résoudre un conflit cognitif se situant entre la tendance naturelle et structurale de traiter le stimulus de l’oreille droite et celle de suivre les consignes attentionnelles.

D’un point de vue neurologique, la recherche en neuro-imagerie fonctionnelle (IRMf) de Thomsen, Rimol, Ersland et Hugdahl (2004) a montré que les conditions FR et FL conduisaient à un plus fort taux d’oxygénation du sang des cortex pré-frontal et cingulaire antérieur que la condition NF chez des adultes. De plus, en comparant les deux conditions d’attention forcée FR et FL, il a été observé une plus forte activation du cortex cingulaire antérieur lors des conditions FL. Ces résultats supposent que la résolution du conflit cognitif induit par la condition FL nécessite une activation encore plus intense des cortex cingulaire antérieur et pré-frontal.

3.2.2. Orientation exogène de l’attention à l’aide des indices sonores

Outre les consignes orales données aux participants dans le paradigme d’« attention forcée » et renvoyant à une orientation de l’attention de type endogène (Posner & Petersen, 1990), Bryden (1978) et ses successeurs (Mondor & Bryden, 1991, 1992 ; Donnot, Phélip, Blättler, & Vauclair, sous presse) ont montré que des signaux sonores, orientant l’attention de manière exogène, modulaient de la même manière l’effet bottom-up de l’avantage de l’oreille droite lors de l’identification de syllabes CV. En utilisant ces indices sonores et en modulant le temps de latence entre le début d’apparition des indices et le début d’apparition des stimuli, Mondor et Bryden (1991, 1992) ont montré que la force de l’avantage de l’oreille droite pouvait également être manipulée par une orientation exogène de l’attention sollicitant, elle, des processus ascendants. En détection de syllabes CV, ces derniers auteurs ont observé un déclin progressif de l’avantage de l’oreille droite en condition FL pour des SOAs (Stimulus Onsets Asynchrony) allant de 150 ms à 450 ms, ce déclin restant constant pour des SOAs de 750 ms. Ainsi, en introduisant des indices sonores, Mondor et Bryden (1991, 1992) ont démontré que la résolution de conflits cognitifs pouvait également s’opérer lors de la sollicitation de processus attentionnels bottom-up. Ces résultats ont été confirmés par de nombreuses recherches ultérieures (e.g., Obrzut, Hogersheimer, & Boliek, 1999; Obrzut, Mondor, & Uecker, 1993; Voyer & Flight, 2001).

3.3. Manipulation des processus bottom-up

3.3.1. La présentation des stimuli

La manipulation des processus bottom-up ou top-down influence les performances d’identification en situation d’écoute dichotique. Cette influence s’observe typiquement par une variation de la force de l’avantage de l’oreille droite en situation de détection de stimuli verbaux. Manipuler l’intensité des processus bottom-up revient alors à faire varier les caractéristiques de présentation des stimuli ; plus précisément, cela se traduit soit par une modulation de l’intensité sonore des stimuli perçus dans chaque oreille, soit par l’introduction d’un temps de latence, plus ou moins long, entre la présentation d’un indice d’orientation de l’attention et la présentation d’une paire dichotique.

3.3.1.1. Le « lag-effect »

L’existence d’un effet de retard, le « lag-effect », au sein d’une situation d’écoute dichotique a été décrite pour la première fois par Studdert-Kennedy, Shankweiler, et Shulman (1970). Le « lag-effect » caractérise le fait d’introduire un temps de latence entre l’apparition du stimulus présenté dans une oreille et le stimulus présenté dans l’oreille opposée. Ainsi, à partir de la situation d’écoute dichotique initiale, les auteurs proposèrent d’introduire un SOA de l’ordre de quelques millisecondes entre la présentation des deux stimuli verbaux d’une même paire dichotique; ce qui revient à dire que les stimuli n’étaient donc pas présentés exactement au même moment. D’après les résultats obtenus, les stimuli entendus en dernier étaient alors rapportés le plus souvent, contrairement aux stimuli entendus en premier, et ce pour de nombreuses valeurs de SOAs. Selon les auteurs, dans ces conditions, la perception du second stimulus interromprait le traitement du stimulus perçu initialement, engendrant alors l’unique identification du second stimulus. Pour de courts SOAs (10 à 20 ms) toutefois, ce pattern de réponse n’a pas été observé ; dans un laps de temps si court, l’avantage structural de l’oreille droite a été privilégié. À l’inverse, pour de longs SOAs (plus de 90 ms), les participants parvenaient à identifier correctement les deux stimuli. Dès lors, cette étude princeps a permis de comprendre qu’il existait un délai de traitement critique permettant d’interrompre le traitement en cours au profit d’un second traitement ; au-delà de ce temps, les deux stimuli semblent être traités de manière séquentielle.

Comme nous l’avons vu précédemment, les travaux de Mondor et Bryden (1991) ont également montré que la force de l’avantage de l’oreille droite variait selon la manipulation de temps de latence entre la présentation d’indices d’orientation de l’attention et la présentation des paires dichotiques. Avec l’utilisation d’indices sonores (et non des avertisseurs verbaux comme dans le paradigme d’attention forcée ; Hugdahl & Andersson, 1986) et de syllabes CV comme stimuli, Mondor et Bryden (1991) ont rapporté un déclin progressif de l’avantage de l’oreille droite pour des SOAs allant de 150 ms à 450 ms, ce déclin restant constant pour des SOAs de 750 ms. Non seulement les auteurs ont interprété ces résultats comme attestant de l’efficacité des indices sonores pour traiter l’information perçue, mais ils ont également montré que l’allongement du temps de latence amenuisait l’influence des processus bottom-up sur les performances d’identification. Ainsi, Mondor et Bryden (1991, 1992) ont démontré que la force du conflit cognitif peut non seulement dépendre des contraintes attentionnelles, mais aussi du temps de latence introduit après ces biais. Grâce à l’augmentation des temps de latence, la force des processus top-down semble croître pour permettre une meilleure modulation des processus bottom-up.

3.3.1.2. L’intensité de présentation des stimuli

Il est également possible de provoquer une modulation des processus bottom-up en faisant varier l’intensité sonore des stimuli perçus entre les deux oreilles. De nombreuses études ont montré que le fait d’introduire une différence d’intensité sonore entre le stimulus entendu à l’oreille gauche et celui entendu à l’oreille droite avait des répercussions notables sur les performances d’identification des stimuli (Hugdahl, Westerhausen, Alho, Medvedev, & Hämäläinen, 2008 ; Westerhausen et al., 2009). En introduisant une augmentation de l’intensité sonore de l’ordre 3 dB d’un stimulus verbal entendu à l’oreille droite, Hugdahl et al. (2008) ont montré que la force de l’avantage de l’oreille droite s’accentuait. À l’inverse, lorsqu’ils ont augmenté de 3 dB l’intensité sonore du stimulus perçu dans l’oreille gauche, une chute de la force de l’avantage de l’oreille droite a été observée, pouvant même conduire à un avantage de l’oreille gauche. À partir du modèle structural de Kimura, ces auteurs ont expliqué l’effet de l’intensité sonore comme étant la conséquence d’une plus forte activation de l’hémisphère cérébral correspondant, à savoir qu’un stimulus présentant une forte intensité sonore dans une oreille activerait davantage l’hémisphère controlatéral correspondant. Dès lors, un stimulus verbal présentant une plus forte intensité dans l’oreille gauche modulera fortement l’effet bottom-up de l’oreille droite et créera un fort conflit cognitif.

3.3.2. Les caractéristiques des stimuli : aspects phonologiques

Outre l’influence du « lag-effect » et de la variation de l’intensité sonore des stimuli évoqués précédemment, il s’avère que les aspects phonologiques des stimuli peuvent eux- mêmes moduler la force de l’avantage d’une oreille sur l’autre. La manipulation des caractéristiques sonores des stimuli verbaux est aussi un moyen de modulation des effets bottom-up. Selon leurs caractéristiques phonologiques, certains stimuli verbaux tendent à être plus facilement identifiés que d’autres (Speaks, Carney, Niccum, & Johnson, 1981). L’effet du voisage des consonnes, observé initialement à partir de l’emploi de syllabes CV (ba, ta, da, ga, pa, ka), exemplifie ces effets. Le voisage correspond à la présence ou l’absence de vibration des cordes vocales pendant l’articulation des consonnes. Une consonne voisée provoque la vibration des cordes vocales (il s’agit des consonnes b, d, et g), alors qu’une consonne non voisée ne provoque pas cette vibration, soit les consonnes p, t, k. Alors que l’association de deux syllabes voisées ou bien de deux syllabes non voisées dans une paire dichotique provoque un net avantage de l’oreille droite, Rimol, Eichele et Hugdahl (2006) ont constaté que cet avantage s’intensifiait lorsqu’une syllabe non voisée était présentée à l’oreille droite et qu’une syllabe voisée était présentée à l’oreille gauche. À l’inverse, cet avantage s’affaiblissait jusqu’à conduire à un avantage de l’oreille gauche lorsqu’une syllabe non voisée était présentée à l’oreille gauche et qu’une syllabe voisée était présentée à l’oreille droite. De par ses caractéristiques phonologiques, la syllabe non voisée constitue bien un moyen de modulation de l’avantage de l’oreille droite lors de l’identification de ce type de stimuli.

Par conséquent, lors de l’identification des stimuli, l’orientation de l’attention, provoquée par des signaux sonores ou des consignes verbales et sollicitant des processus attentionnels plus ou moins contrôlés, permettrait de moduler l’influence des processus bottom-up initiés par les aspects structuraux de la spécialisation hémisphérique du langage.

Ces études, jusqu’alors réalisées auprès de populations adultes, ont très justement permis de repérer les facteurs à l’origine de la modulation des processus bottom-up et induisant des situations de conflit cognitif. Ces manipulations permettent, comme nous l’avons vu, de créer un fort conflit cognitif soit en renforçant des processus bottom-up, soit en faisant intervenir des processus top-down. Toutefois, si les recherches disponibles ont permis d’identifier certains facteurs déterminants dans la mise en œuvre du contrôle cognitif, elles n’ont pas permis d’appréhender la manière dont ces facteurs agissaient sur les processus intrinsèques au contrôle cognitif. Dès lors, et dans la continuité des travaux avec des adultes, nous nous sommes proposés d’ouvrir ce champ de recherche auprès de populations d’enfants.

3.4. Données développementales

Les études menées auprès de populations d’enfants ne se sont réellement développées qu’à partir des années 1980 (Obrzut, Hynd, Obrzut, & Pirozzolo, 1981 ; Andersson, llera, Rimol, & Hugdahl, 2008), avec le regain d’intérêt porté aux facteurs attentionnels et grâce au paradigme d’« attention forcée » (Hugdahl & Andersson, 1986). Il va sans dire que ces études développementales et comparatives enfants-adultes apportent des données fondamentales dans la compréhension du fonctionnement des mécanismes cognitifs et dans celle de leur

développement. De fait, les recherches entreprises auprès d’enfants sains ont montré que les modalités de présentation des stimuli ou les modalités d’orientation de l’attention (Hugdahl et al., 1999 ; Andersson et al., 2008) affectaient, comme chez les adultes, l’asymétrie des réponses observées. Dès l’âge de 6 ans, l’orientation préalable de l’attention, à l’aide des indices sonores ou verbaux, permet effectivement aux enfants d’améliorer leurs performances d’identification des stimuli dans leurs deux oreilles (Donnot et al., sous presse). De même, les enfants identifient plus aisément une syllabe non voisée qu’une syllabe voisée au sein d’une même paire dichotique, quelle que soit l’oreille dans laquelle elle est présentée (Arcuili, Rankine, & Monaghan, 2010).

Cependant, parallèlement à ces similitudes, une différence majeure est rapportée entre enfants et adultes (Andersson et al., 2008), à savoir que, quantitativement, les performances d’identification des enfants sont moins bonnes que celles des adultes. Plus spécifiquement, non seulement les enfants identifient significativement moins bien les stimuli entendus dans leurs deux oreilles, mais surtout ils ne parviennent que dans une moindre mesure à moduler l’effet des processus structurels bottom-up dans des situations impliquant un fort conflit cognitif. Seuls les enfants âgés de plus de 9 ans semblent être capables d’orienter efficacement leur attention, tant de manière exogène qu’endogène, vers l’oreille indicée pour identifier le stimulus perçu.

Plusieurs études ont effectivement montré que lors de l’identification de stimuli verbaux, seuls des enfants de plus de 9 ans parvenaient à orienter leur attention vers leur oreille gauche au moyen d’indices verbaux pour identifier correctement les stimuli (Andersson et al., 2008). En deçà de cet âge, les enfants ne pourraient orienter efficacement leur attention vers l’oreille indicée que grâce à des indices d’orientation exogène. En effet, en comparaison avec l’asymétrie des réponses observée en condition d’attention non forcée, seuls des indices exogènes permettent à des enfants de moins de 9 ans d’améliorer leurs

performances d’identification (Obrzut et al., 1999). Par conséquent, seuls des enfants âgés de plus de 9 ans semblent être capables d’orienter et de contrôler leur attention aussi efficacement que des adultes. L’étude complémentaire d’Obrzut et ses collègues (Obrzut et al., 1999) a par ailleurs mis en évidence le fait que l’allongement du temps de latence introduit entre l’apparition des indices exogènes d’orientation et l’apparition des stimuli n’influençait pas les capacités de contrôle attentionnel d’enfants âgés de moins de 9 ans. Les jeunes enfants ne sont pas parvenus à maintenir efficacement leur attention sur leur oreille gauche tant avec des délais de latence courts (des SOAs de 150 ms à 450 ms) qu’avec des délais de latence longs (des SOAs de 750 ms à 2000 ms). De la même manière, en intensifiant la force du conflit cognitif avec la double manipulation de la demande attentionnelle et des caractéristiques phonologiques des stimuli, l’étude d’Arcuili et al. (2010) a montré que des enfants de 9,5 ans ne parvenaient pas à mettre en œuvre un contrôle cognitif efficace : face à une paire dichotique syllabe voisée/non voisée, alors que les enfants parvenaient volontairement à identifier des syllabes non voisées perçues dans leur oreille gauche, leurs performances se sont significativement effondrées dès lors qu’une syllabe voisée a été proposée dans cette oreille.

Au vu de ces études, il semblerait que les enfants n’arrivent pas à déployer suffisamment de compétences cognitives pour atténuer la prégnance des processus bottom-up (Andersson et al., 2008). Aussi, ces faibles performances de jeunes enfants âgés de moins de 9/10 ans s’expliqueraient par un déficit des capacités de contrôle cognitif. En reliant ces observations expérimentales aux données neuroanatomiques, le recrutement des processus top-down, activés par des aires du cortex pré-frontal (Falkenberg et al., 2011), semble être au cœur des difficultés rencontrées par les enfants en situation de conflit cognitif.