L’évolution des technologies de communication de remplacement pour les personnes sourdes, les personnes malentendantes et les personnes souffrant d’un trouble de la parole


Avertissement:

Le rapport, commandé par le Conseil de la radiodiffusion et des télécommunications canadiennes (« le Conseil » ou « le CRTC ») en novembre 2012, a été préparé par CONNECTUS Consulting Inc. Il présente un examen des technologies de communication de remplacement à l’intention des personnes ayant une déficience auditive ou un trouble de la parole déjà disponibles sur le marché ou en cours de développement (sauf les technologies de compression vidéo, par exemple, celles utilisés par des services vidéo comme Skype ou des services de relais vidéo [SRV]), ainsi que des passerelles.

Bien que l’auteur du rapport s’est efforcé de s’assurer que l’information soit exacte et à jour au moment de la rédaction, il est possible que d’importants changements soient survenus dans certains domaines avant la publication. Ce rapport reflète les recherches et les opinions de l’auteur, et ne devrait pas être interprété comme représentant les opinions du Conseil.


Rapport final

Version PDF

Auteur du rapport: Richard Cavanagh PhD, M.A.

CONNECTUS Consulting Inc. a le plaisir de présenter au Conseil de la radiodiffusion et des télécommunications canadiennes (CRTC) son rapport final sur L’évolution des technologies de communication de remplacement pour les personnes sourdes, les personnes malentendantes et les personnes souffrant d’un trouble de la parole (le rapport).

Le rapport a été préparé à la suite de la vérification et de l’examen des technologies de communication de remplacement existantes (qu’on pourrait aussi appeler « dispositifs d’assistance aux communications ») conçues pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. Des discussions avec six spécialistes en technologies accessibles de l’étranger sont venues compléter la vérification.

Globalement, le rapport est axé sur les façons, actuelles et en préparation, autres que les techniques de compression vidéo et les passerelles, d’améliorer l’accessibilité aux télécommunications pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. Le rapport porte également sur les nouvelles façons d’améliorer les communications pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, principalement grâce à la mise au point de nouvelles applications logicielles.1

Le rapport est structuré comme suit :

La Partie I propose une définition et une description brèves de l’expression « dispositifs d’assistance » du point de vue de la technologie des communications.

La Partie II constitue le corps du rapport où est présenté un examen des technologies de communication de remplacement disponibles ou en cours de développement (en Amérique du Nord et ailleurs dans le monde). Pour chacune des technologies, nous fournissons :

De plus, pour chaque technologie, nous présentons :

S’il est possible de le faire, parce qu’ils font partie du domaine public ou parce que les détenteurs des droits d’auteur le permettent, nous présentons les schémas, les graphiques et les autres éléments de la technologie à des fins d’illustration.

La Partie III du rapport présente un tableau sommaire de l’examen et de la vérification décrits ci-dessus, accompagné des recommandations relatives aux technologies de communication de remplacement dont il serait utile d’assurer le suivi.

Le rapport comprend également deux annexes.

L’Annexe A présente une liste des sources consultées pour la rédaction du rapport.

L’Annexe B présente une courte biographie de l’auteur du rapport.

Sommaire

Ce rapport a été préparé à la suite de la vérification et de l’examen des technologies de communication de remplacement existantes (qu’on pourrait aussi appeler « dispositifs d’assistance aux communications », définis dans la première partie du rapport) conçues pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole.

Globalement, le rapport est axé sur les façons, autres que les techniques de compression vidéo et les passerelles, d’améliorer l’accessibilité aux télécommunications pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. Le rapport porte également sur les nouvelles approches afin d’améliorer les communications pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, principalement grâce à la mise au point de nouvelles applications logicielles, mais à l’extérieur du système de télécommunication comme tel.

Un examen et une vérification des technologies de remplacement pour l’assistance aux communications, déjà existantes ou en cours de développement, font ressortir les six catégories ci-dessous, bien qu’il y ait chevauchement entre elles.

De nouvelles technologies de sous-titrage dans les télécommunications portent sur les progrès réalisés dans les appareils de télécommunication pour sourds (ATS), utilisés traditionnellement pour les communications au moyen des lignes téléphoniques, axés essentiellement sur les appareils à sous-titrage.

La technologie ATS classique a été abandonnée en raison (i) des progrès réalisés dans la technologie ATS qui a recours à des téléphonistes, à des logiciels ou aux deux pour créer efficacement une « téléphonie à sous-titrage » et (ii) de l’utilisation répandue de réseaux numériques (ou protocole Internet), plutôt que de réseaux analogiques, pour permettre aux personnes ayant une déficience auditive ou souffrant d’un trouble de la parole de communiquer.

Les téléphones à sous-titrage s’utilisent à peu près comme les ATS, mais ils fonctionnent comme un téléphone ordinaire qui transmet la voix et affiche le sous-titrage simultanément.

Bien que les obstacles techniques à l’adoption des téléphones à sous-titrage semblent limités au Canada, la faisabilité de l’intégration de cette technologie qui est accessible au réseau canadien est remise en question pour des raisons de politique publique et à cause de l’évolution rapide d’autres technologies utiles.

Les progrès en matière de relais textuels portent essentiellement sur les relais par protocole Internet (IP) qui permettent aux personnes ayant une déficience auditive ou souffrant d’un trouble de la parole de communiquer dans Internet au moyen d’un ordinateur, ce dernier faisant office de téléscripteur.

Il n’y a aucun coût supplémentaire pour les utilisateurs de relais par IP, si ce n’est ceux de l’ordinateur ou d’un autre appareil permettant de se brancher à Internet, et de la connexion Internet elle-même. Les services de relais par IP ont été lancés au Canada au début de 2011.

Plusieurs types de programmes informatiques peuvent être utilisés avec le relais par IP, y compris les programmes personnalisés qui fonctionnent dans le navigateur d’un ordinateur, ainsi que les services de messagerie instantanée. Le relais par IP fonctionne sur des appareils et des plateformes multiples, qu’il s’agisse de tablettes, de téléphones intelligents ou d’ordinateurs.

Bien que le relais par IP soit un service en mode texte entièrement accessible pour les Canadiens ayant une déficience auditive ou souffrant d’un trouble de la parole, le logiciel de conversion parole-texte, utilisé pour améliorer l’efficacité des téléphonistes, peut être limité quant à (i) sa précision pour transmettre le texte approprié ou (ii) à sa « capacité d’apprentissage ».

Les technologies de conversion parole-texte utilisent un logiciel pour convertir les sons de la voix en mots écrits (p. ex. la reconnaissance de la parole ou des technologies de reconnaissance vocale plus évoluées). Elles sont utilisées aussi bien pour les téléphones à sous-titrage que pour les relais par IP, où un assistant de communication, p. ex. un téléphoniste, répète les paroles de la personne qui parle dans le microphone d’un ordinateur. Le logiciel parole-texte de l’ordinateur transforme les mots parlés en mots écrits.

En règle générale, la conversion parole-texte présente un attrait limité pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, qui doutent de son exactitude. De plus, elle est considérée comme secondaire par rapport à la vidéo et à la conversion langage gestuel-parole/texte, et elle a été déclassée par la technologie grand public de service d’envoi de messages courts (SEMC) et de messagerie instantanée.

Cependant, la technologie de conversion parole-texte offre un certain nombre d’applications, comme le relais par IP, le sous-titrage pour les émissions de télévision et les plateformes mobiles.

La conversion langage gestuel-parole/texte transforme le langage gestuel en texte, ou en mots parlés générés par ordinateur, en temps quasi réel.

Une discussion sur la conversion langage gestuel-parole/texte modifie l’intérêt technologique, qui devient alors centré sur les applications de communication plutôt que sur les télécommunications. Il s’agit d’une distinction importante, car avec cette technologie, il n s’agit pas d’améliorer ou de modifier de quelque autre façon le système de télécommunication afin d’offrir une meilleure accessibilité. Il s’agit plutôt d’ajouter une application logicielle pour permettre un nouveau type de communication entre les utilisateurs.

La technologie de conversion langage gestuel-parole ou texte est un système logiciel qui transforme le langage gestuel (p. ex. la langue des signes américaine [ASL], la langue des signes québécoise [LSQ], la langue des signes britannique [BSL] ou la langue des signes d’autres pays) en mots parlés ou écrits, générés par ordinateur, ou qui transforme le texte ou les mots parlés en langue des signes, en temps quasi réel.

Bien qu’il semble y avoir un intérêt croissant dans le monde pour cette technologie qui évolue, la conversion langage gestuel-parole ou texte est à un stade relativement précoce.

La vitesse avec laquelle progresse la conversion langage gestuel-parole/texte semble accélérée (comparativement, par exemple, à la technologie de conversion parole-texte) parce qu’à l’heure actuelle, il existe un engouement considérable à l’échelle mondiale pour cette technologie. De nombreux projets, semblables sur le plan de la conception et de la démarche et offrant des occasions d’échange d’information, sont en cours dans de nombreux pays.

Mais si tout semble indiquer que cette technologie proposera un ajout utile aux applications fonctionnelles, certaines prétentions actuelles, comme celle de la conversion langue de signe-texte en temps réel, doivent être accueillies avec prudence, compte tenu des résultats initialement prometteurs des logiciels de reconnaissance vocale qui ont fait face à des obstacles et à des limites qui se sont révélés difficiles à surmonter.

Les technologies grand public, comme le SEMC et la messagerie instantanée, ont été adaptées et sont utilisées à grande échelle par les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. À présent, il fait peu de doute que les technologies de communication grand public, comme le SEMC, ont tout simplement et très rapidement surclassé d’autres technologies fonctionnelles, et ce, pour différentes raisons : mode texte, facilité d’emploi, fonction par vibration des combinés, rapidité et coût estimatif peu élevé.

En un mot, les avantages pour les utilisateurs sont énormes – et ils améliorent grandement la vie de millions de personnes.

On prétend même que les services grand public d’envoi de messages textes, le SEMC ou d’autres services de messagerie instantanée sont de loin les technologies les plus disponibles et les mieux adaptées pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. Ce sont des technologies qui, de façon non intentionnelle, sont devenues des « rampes d’accès électroniques » aux proportions phénoménales.2 Puisque ces technologies sont mises au point par les plus importants fabricants de logiciels du monde et par les développeurs d’applications les plus créatifs, elles continueront d’évoluer en raison de la concurrence sur le marché et de leur très grande popularité auprès des consommateurs.

Les développements et les applications à venir en matière de technologies de remplacement comprennent : un appareil portable sur lequel deux ou plusieurs utilisateurs saisissent des messages qui s’affichent simultanément en temps réel; un système personnalisé de synthèse texte-parole qui synthétise la parole de façon plus intelligible et plus naturelle en vue d’une intégration dans des appareils générateurs de parole; et la personnalisation automatique des préférences pour les communications, grâce à un profil sauvegardé en ligne et qui permet de désencombrer les trop nombreux choix offerts aux utilisateurs.

En guise de conclusion sur l’état actuel et le développement des technologies de communication de remplacement, les spécialistes de ce domaine consultés pour la vérification estiment qu’il y a deux enjeux émergents.

D’abord, « l’écosystème pour ces technologies foisonne d’options ». Il existe en effet plus de choix que jamais auparavant qui permettent d’améliorer les communications pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole – au point où cela devient étourdissant et crée un fossé numérique entre les utilisateurs technophiles et ceux qui ne le sont pas.

Ensuite, les « fonctions et les services d’accessibilité sont fortement sous-utilisés, même lorsqu’ils sont gratuits. Les utilisateurs ne sont pas assez informés et manquent de confiance – ils ne savent pas ce qui fonctionnera et ils ignorent par où commencer ». En d’autres termes, la mise en pratique de l’information peut constituer un obstacle à l’utilisation des technologies maintenant offertes, et il est essentiel de régler ce problème.

Il est recommandé d’assurer le suivi de trois éléments pour la suite des choses :

Si une vérification et un examen des technologies de compression vidéo permettant de porter son attention sur des applications comme Skype, Google Hangout ou VRS vont au-delà de la portée du présent rapport, les technologies de compression vidéo devraient aussi faire l’objet d’un suivi, compte tenu de leur importance pour les utilisateurs et de l’utilisation plus efficace de la largeur de bande que les développements futurs pourraient apporter.

Partie I – Définition des dispositifs d’assistance aux communications

Il faut noter dès le départ que, bien que certaines technologies de communication de remplacement définissent spécifiquement leur utilité pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, différentes technologies grand public ont été adaptées pour une utilisation à grande échelle par cette communauté de personnes handicapées. Ces technologies comprennent le SEMC et la messagerie instantanée/les textos – très répandus et actuellement disponibles sur divers appareils mobiles, comme les téléphones intelligents.

Du point de vue de l’accessibilité, il s’agit d’une considération importante en ce qui a trait à la définition d’un appareil d’assistance. Comme l’indique l’organisme américain, le National Institute on Deafness and Other Communication Disorders (NIDCD) :

« Les mots dispositif d’assistance ou technologie d’assistance peuvent désigner tout appareil qui aide une personne souffrant de déficience auditive ou d’un trouble de la voix, de la parole ou d’élocution à communiquer. Ces mots désignent souvent des appareils qui aident une personne à entendre et à comprendre plus clairement ce qui est dit ou à exprimer ses pensées plus facilement. »3

En ce qui a trait aux technologies grand public, largement utilisées par la population non handicapée, le NIDCD poursuit ainsi :

« Avec le développement de technologies numériques et sans fil, un nombre croissant de dispositifs sont offerts pour aider les personnes ayant une déficience auditive et souffrant de troubles de la voix, de la parole et d’élocution à communiquer de façon plus valable et à profiter encore plus de leur quotidien. »4

L’envoi de messages textes et l’utilisation de technologies vidéo comme Skype se retrouvent partout dans la communauté des personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, en grande partie parce qu’il est facile de les adapter pour les personnes habituées à utiliser des dispositifs d’assistance pour communiquer. Les téléphones intelligents et les autres appareils mobiles n’ont pas été fabriqués spécialement à cette fin – mais leur fonctionnalité est néanmoins accessible à la communauté des personnes handicapées en raison de la nature même de la méthode de communication qu’ils utilisent : le texte.

Malgré l’utilité des technologies de communication grand public pour les utilisateurs ayant une déficience auditive ou souffrant d’un trouble de la parole – qu’on décrit plus loin – il subsiste une sélection importante et croissante de technologies de remplacement pour l’assistance aux communications, comme nous le démontrons dans la prochaine section de notre rapport.

Partie II – Vérification et examen des technologies de remplacement pour l’assistance aux communications

Un examen et une vérification des technologies de remplacement pour l’assistance aux communications, déjà existantes ou en cours de développement, révèlent la présence des six catégories ci-dessous, bien qu’il y ait chevauchement.

1) Nouvelles technologies de sous-titrage en télécommunication

Pour bien comprendre le rôle et l’importance des nouvelles technologies de sous-titrage dans les télécommunications, il est d’abord important de comprendre les notions fondamentales du fonctionnement des appareils de télécommunication pour sourds, ou ATS.

Mis au point dans les années 1960, les ATS sont des appareils électroniques qui permettent la communication de textes au moyen de lignes téléphoniques, pour que les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole puissent communiquer directement entre elles, ainsi qu’avec des personnes qui entendent. Un ATS – aussi appelé téléscripteur, textphone (en Europe) et minicom (au Royaume-Uni) – a environ la taille d’un petit ordinateur portable, et il est muni d’un clavier QWERTY standard et d’un petit écran à DEL ou ACL pour l’affichage électronique du texte saisi.

Photo d’un ancien modèle d’ATS

Photo d’un ancien modèle d’ATS

Au Canada et dans d’autres pays, il existe différentes façons de communiquer à l’aide d’un ATS. Entre personnes sourdes, chacune possédant un ATS compatible, le texte est transmis directement entre les ATS, par l’intermédiaire d’une ligne téléphonique.5

Cependant, les ATS peuvent aussi être utilisés pour les communications entre une personne sourde et une personne qui entend, grâce au recours à un téléphoniste. Ces fonctions supplémentaires des ATS s’appellent des services « sans intervention », qui permettent aux personnes qui entendent, mais qui ne parlent pas (service « Entendre sans intervention » ou ESI) ou aux personnes qui peuvent parler, mais malentendantes (service « Parler sans intervention » ou PSI) d’utiliser le téléphone. Les téléphonistes transmettent le message entre les personnes, assurant la conversion parole-texte et texte-parole.6

Cette forme traditionnelle de télécommunication est en train d’être abandonnée pour deux principales raisons : (i) les progrès de la technologie des ATS utilisant des téléphonistes, un logiciel ou les deux pour créer, dans les faits, une « téléphonie à sous-titrage » et (ii) l’utilisation à grande échelle de réseaux numériques (ou protocole Internet), plutôt que de réseaux analogiques, pour assurer les communications entre personnes ayant une déficience auditive ou souffrant de trouble de la parole (dont nous parlerons plus loin dans notre rapport).

Téléphones à sous-titrage – Description sommaire

Les téléphones à sous-titrage s’utilisent à peu près comme les ATS, mais ils fonctionnent comme un téléphone ordinaire qui transmet la voix et affiche le sous-titrage simultanément. Une illustration de CapTel, principal fournisseur de téléphones à sous-titrage aux États-Unis, résume le fonctionnement du service.

« Vous composez le numéro de quelqu’un, de la même façon qu’avec tout autre téléphone. Le téléphone CapTel se connecte automatiquement au service de sous-titrage. Quand l’interlocuteur répond, vous entendez tout ce qu’il dit, comme pour un appel ordinaire. Simultanément, le service de sous-titrage (TRS) transcrit tout ce qui est dit en sous-titres qui apparaissent sur l’afficheur de l’appareil CapTel. Vous entendez ce que vous pouvez et vous lisez le reste. »7

Illustration du foctionnement de CapTel

Illustration du fonctionnement de CapTel

 

Il faut signaler quelques contraintes de la téléphonie à sous-titrage.

D’abord, tandis que les sous-titres apparaissent automatiquement sur l’afficheur de l’appareil, comme celui qui est illustré ci-dessous, la méthode de connexion au service de sous-titrage repose sur le type de téléphone utilisé. Par exemple, un appareil à une ligne signifie que la personne qui appelle doit d’abord appeler le service de sous-titrage, et acheminer l’appel à partir de là. Un appareil à deux lignes permet d’acheminer les appels directement, tout comme pour un téléphone ordinaire.

Ensuite, il faut savoir comment les appels sont transcrits et convertis en sous-titres par le service de sous-titrage. En règle générale, un logiciel de reconnaissance vocale est utilisé; cela signifie que les mots prononcés par la personne qui appelle sont répétés dans un ordinateur par un téléphoniste, puis ils sont convertis en sous-titres à l’autre bout du fil. Par contre, cela peut provoquer des problèmes d’ordre pratique relatifs à la précision des sous-titres, comme nous le mentionnons plus loin, sous la rubrique « Obstacles ».

Troisièmement, il est important de noter que les téléphones à sous-titrage utilisés aux États-Unis sont financés dans le cadre du programme U.S. Telecommunications Relay Service prévu à l’article IV de l’Americans with Disabilities Act. Par conséquent, ils sont financés par les consommateurs qui paient une petite redevance sur leur facture de téléphone. D’autres mécanismes de financement ont été mis au point en Australie et au Royaume-Uni, en grande partie fondés sur des subventions gouvernementales.8 (Ce service n’est pas offert au Canada.)

Téléphones à sous-titrage – But visé

La fonction de la téléphonie à sous-titrage est de fournir aux utilisateurs – particulièrement ceux qui ont une audition résiduelle et qui peuvent avoir de la difficulté avec la téléphonie ordinaire – des sous-titres en temps quasi réel à l’intention des personnes qui ont une déficience auditive ou qui souffrent de troubles de la parole lors de communications entre deux personnes.

Photo d'un téléphone à sous-titrage

Photo d’un téléphone à sous-titrage

Téléphones à sous-titrage – Cycle de développement du produit – Délai pour son introduction sur le marché

Une vaste gamme de téléphones à sous-titrage sont fabriqués aux États-Unis, et ils pourraient être disponibles rapidement sur le marché canadien (p. ex. en moins de trois mois) dans l’hypothèse (i) de l’approbation des appareils téléphoniques à sous-titrage par Industrie Canada et (ii) de la conclusion d’ententes contractuelles entre les fournisseurs de services de télécommunication (comme Bell Canada ou TELUS) et les détaillants des produits (comme Future Shop) avec les fournisseurs de matériel.

Cependant, l’intégration de téléphones à sous-titrage au marché canadien nécessiterait le développement et la mise en œuvre d’une politique publique pour créer un système semblable au système américain CapTel, décrit précédemment, et, conformément à cette politique, un mécanisme pour financer le système des opérations de sous-titrage. (Ce sujet est abordé plus en détail sous la rubrique « Obstacles » ci-dessous.)9

Téléphones à sous-titrage – Avantages pour les utilisateurs

Il est important de noter que l’utilisateur cible de la téléphonie à sous-titrage est une personne qui a subi une faible perte auditive et qui, par conséquent, peut avoir de la difficulté à communiquer à l’aide d’un téléphone fonctionnant par la voix seulement.

En règle générale, la capacité des utilisateurs finaux de communiquer en temps quasi réel est considérée comme un avantage important que procure la téléphonie à sous-titrage. Il en va de même pour la transparence du système (le rôle de la transcription) et la facilité d’interface entre les utilisateurs finaux. La principale limite quant à l’accessibilité correspond aux limites existantes du logiciel de reconnaissance vocale utilisé par le service de sous-titrage (qu’on aborde aussi sous la rubrique « Obstacles »).

De plus, il existe un avantage possible relativement au coût d’utilisation d’un appareil CapTel comparativement à d’autres plateformes ou technologies – en grande partie parce que sa disponibilité aux États-Unis fait l’objet d’importantes subventions, entre autres pour les combinés (qui peuvent coûter jusqu’à 400 $US ou plus) ainsi que pour l’utilisation du service de sous-titrage, qui est gratuit. Il pourrait être utile de comparer le coût de différentes technologies de remplacement afin de déterminer les avantages financiers de la téléphonie à sous-titrage pour les utilisateurs.

Téléphones à sous-titrage – Obstacles à leur adoption

Si l’on présume une intégration sans anicroche du système au système de télécommunication actuel au Canada, et si l’on ignore pour le moment les enjeux relatifs à la faisabilité (qu’on aborde plus loin), un obstacle important à son adoption est lié au mécanisme permettant d’offrir le sous-titrage en temps quasi réel aux utilisateurs finaux : l’exactitude et la fiabilité du logiciel de reconnaissance vocale.

Contrairement au service de relais, une partie importante de la chaîne de communication pour la téléphonie à sous-titrage repose sur des assistants de communication (ou AC travaillant pour des sociétés de sous-titrage) qui dictent les mots de la personne appelante à un ordinateur. (Le logiciel est plus efficace lorsqu’un nombre limité de voix est utilisé; c’est pourquoi il utilise la voix de l’AC plutôt que celle de la personne appelante pour créer les sous-titres.) Le logiciel de reconnaissance vocale de l’ordinateur assure la conversion en sous-titres des mots dictés par l’AC, qui sont ensuite transmis à l’utilisateur final et affichés sur l’appareil téléphonique à sous-titrage de cet utilisateur.

Cependant, le logiciel de reconnaissance vocale n’est pas encore entièrement au point, et la traduction des paroles en sous-titres peut être inintelligible (le sous-titre pourrait se lire « Commentaires les vous? » plutôt que de reproduire les mots dictés « Comment allez-vous? », ou un appelant avec un accent pourrait rendre difficile l’interprétation par l’AC). L’orthographe de certains mots peut ralentir la transcription des sous-titres pour l’utilisateur final, et l’interférence sur la ligne peut parfois perturber le flux de communication dans la chaîne.10

Comme nous le mentionnions précédemment, le logiciel fonctionne plus efficacement lorsqu’un nombre limité de voix est utilisé pour son « entraînement »; le système fonctionne encore mal quand de nombreuses voix sont utilisées, ainsi que dans les situations où parlent plusieurs personnes. Par conséquent, une conférence téléphonique serait vraisemblablement trop complexe pour être gérée par le logiciel (s’il n’y a pas d’AC pour répéter les paroles de tous les appelants).

En général, on reconnaît toutefois que le logiciel de reconnaissance de la voix continuera de s’améliorer à mesure que son utilisation se répandra (dans le sous-titrage pour la télévision, par exemple). À cette fin, les principaux obstacles à l’adoption de la téléphonie à sous-titrage au Canada concernent davantage la faisabilité que des limites techniques.

Un obstacle plus secondaire à l’adoption de CapTel peut être la nature trop compliquée du service 911 quand on utilise un téléphone à sous-titrage. Dans le cas des États-Unis, les utilisateurs de téléphones à sous-titrage appellent directement les téléphonistes du service 911 (les appels ne sont pas acheminés par un centre de sous-titrage), mais les centres d’appel 911 n’offrent pas le sous-titrage. À la place, le téléphone à sous-titrage communique par défaut avec un téléphone à service Parler sans intervention; les téléphonistes du service 911 doivent alors utiliser un téléscripteur pour communiquer avec le téléphone à sous-titrage.

Toutefois, puisque les téléphones à sous-titrage ne sont pas munis d’un clavier, « les utilisateurs d’un appareil CapTel doivent toujours se servir de leur voix pour parler au service 911 ».11

Bien entendu, cela pourrait présenter des problèmes si un appelant s’avérait incapable de parler, ou de parler assez clairement pour communiquer avec le téléphoniste du service 911; aucun scénario de secours n’est prévu dans ces cas.

Téléphone à sous-titrage – Stade de développement

Bien que les améliorations se poursuivent relativement aux combinés et au logiciel, la technologie est déjà entièrement au point aux États-Unis. Elle fait actuellement l’objet d’une mise à l’essai en Australie.

Téléphone à sous-titrage – Faisabilité

Bien que les obstacles techniques à l’adoption au Canada des téléphones à sous-titrage semblent limités, la faisabilité de l’intégration de cette technologie accessible au système canadien est sérieusement remise en question pour des raisons de politique publique et à cause de l’évolution de la technologie en général.

D’abord, au Canada, il n’y a aucune loi fédérale semblable à celle des États-Unis (Americans with Disabilities Act), qui prévoit le financement de la téléphonie à sous-titrage. Sans une loi de cette nature, propre à cette technologie, la fourniture de la téléphonie à sous-titrage nécessiterait l’élaboration de nouvelles politiques publiques ou d’une réglementation exigeant le financement d’un système de téléphone à sous-titrage au Canada.

Un tel financement serait essentiel pour la mise sur pied de ce système. Bien que les combinés, même à l’époque de l’utilisation des téléscripteurs, n’aient pas été traditionnellement subventionnés à l’échelle nationale au Canada (uniquement dans le cadre de certains programmes provinciaux), le système de sous-titrage aurait besoin d’un financement pour la création et le maintien des activités d’un centre de sous-titrage pour le service de relais des télécommunications (équipement, dotation, intégration possible aux centres d’appel de relais par IP abordés plus loin). Pour les utilisateurs eux-mêmes – qui se comptent probablement par milliers, soit un nombre relativement petit –, les frais seraient probablement prohibitifs s’ils devaient financer le système (même à 400 $ pour un combiné et peut-être 50 $ par mois pour financer le service), car nombre d’entre eux seraient des Canadiens à faible revenu.12

Deuxièmement, il n’est pas certain qu’à l’heure actuelle le besoin soit suffisant sur le marché pour le système de téléphone à sous-titrage, car, au cours des sept années qui se sont écoulées depuis le lancement de CapTel aux États-Unis, les systèmes de messagerie instantanée ont évolué considérablement, créant des « rampes d’accès électroniques » non prévues pour les personnes ayant une déficience auditive et souffrant d’un trouble de la parole.

Compte tenu de l’absence d’un cadre stratégique visant à appuyer la téléphonie à sous-titrage, et du développement rapide des communications instantanées sur des plateformes numériques, il faudrait réaliser une étude de marché pour déterminer le besoin réel d’un système canadien de téléphone à sous-titrage au stade actuel de l’évolution de la technologie.

Téléphone à sous-titrage – Amélioration ou intégration possible avec d’autres applications, plateformes ou technologies existantes

Comme nous le signalions précédemment, les combinés des téléphones à sous-titrage s’intégreraient facilement aux réseaux téléphoniques commutés publics (RTCP), après approbation par Industrie Canada pour le marché canadien. Toutefois, les téléphones à sous-titrage peuvent également être intégrés à des plateformes numériques dans le cadre de ce qu’on appelle aux États-Unis WebCapTel (téléphone à sous-titrage sur le Web).13

Dans ce cas, un téléphone ordinaire est raccordé à un ordinateur ou à un téléphone intelligent; les appels sont faits à l’aide d’un combiné ordinaire, mais les sous-titres de l’appel sont affichés en ligne sur l’écran du navigateur Internet de l’ordinateur ou du téléphone intelligent.

Le service WebCapTel peut être utilisé avec n’importe quel téléphone, il ne nécessite aucun équipement particulier et il est gratuit. Toutefois, il ne permet pas de faire des appels internationaux, et certains fournisseurs de services (comme CapTel) imposent des restrictions quant au nombre d’usagers qui peuvent être inscrits simultanément au service. D’autres fournisseurs de services comme Sprint CapTel n’imposent aucune restriction de ce genre. La raison de cette différence est inconnue, mais elle peut être liée à la capacité du réseau qui est disponible, ou encore à des contraintes relatives aux ressources humaines disponibles dans les centres de sous-titrage.

Téléphones à sous-titrage – Incidence possible sur les utilisateurs

Selon le modèle américain de téléphonie à sous-titrage, on évalue globalement de façon assez positive l’incidence sur les utilisateurs – mais en grande partie grâce au cadre législatif et politique qui restreint ou élimine complètement le fardeau du coût pour les utilisateurs finaux.

Cela signifie, comme nous le mentionnions précédemment, qu’une version canadienne non subventionnée de téléphonie par sous-titrage, qui exigerait des utilisateurs qu’ils assument le coût du combiné et les coûts d’exploitation inhérents, pourrait ne pas comporter suffisamment d’avantages comparativement au coût d’un dispositif et d’une plateforme de communication de remplacement comme le SEMC et la messagerie instantanée.

Notre examen et notre vérification de la téléphonie par sous-titrage n’ont pas révélé le nombre exact d’utilisateurs aux États-Unis; de manière générale, ils ont été évalués à « des milliers » il y a quatre ans. Pour déterminer l’incidence de la téléphonie par sous-titrage sur les utilisateurs par rapport à d’autres dispositifs et d’autres plateformes, il serait utile de connaître le nombre d’usagers du service WebCapTel comparativement au nombre d’usagers du service CapTel traditionnel, par rapport au nombre d’usagers qui ont abandonné le service CapTel pour utiliser plutôt le SEMC, la messagerie instantanée ou d’autres services multiplateformes.14

Ces données peuvent fournir certains renseignements sur l’importance relative ou l’utilité de la téléphonie par sous-titrage par rapport à des développements plus récents dans le domaine des communications individuelles par messagerie instantanée. Comme le faisait remarquer un spécialiste consulté dans le cadre de la vérification, « les SEMC ont dépassé CapTel… les téléscripteurs sont finis et sont désuets depuis les années 1980 ».

2) Progrès dans les relais textuels – Services de relais par IP ou services de relais sur le Web

Les relais par protocole Internet, ou relais par IP, comme on les désigne au Canada, aux États-Unis, au Royaume-Uni et dans un certain nombre d’autres pays, représentent un progrès important en matière de services de relais textuel, offerts de façon relativement simple et peu coûteuse à un grand nombre de personnes ayant une déficience auditive ou souffrant de troubles de la parole.

Relais par IP – Description sommaire

Le relais par IP permet aux personnes ayant une déficience auditive ou souffrant de troubles de la parole de communiquer avec des personnes qui entendent en utilisant le système téléphonique. Plutôt que d’utiliser un téléscripteur traditionnel et un téléphone, avec un téléphoniste qui achemine le texte et la voix, au besoin, on accède au relais par IP au moyen d’un ordinateur et du réseau Internet, l’ordinateur faisant office de téléscripteur.

Dans un service de relais des télécommunications (TRS) traditionnel, l’utilisateur d’un téléscripteur communique avec un centre TRS, et l’assistant de communication du centre appelle la personne au moyen du service de téléphonie vocale. Dans un relais par IP, la première partie de l’appel passe de l’ordinateur de la personne appelante (ou d’un autre dispositif fonctionnant sur le Web, comme une tablette ou un téléphone intelligent) au centre de relais par IP grâce au réseau Internet; il est généralement possible d’accéder au centre par la page Web d’un fournisseur de services.

La partie suivante de l’appel – qui constitue un élément plus classique du service TRS – est faite par l’AC à la personne qui reçoit l’appel par le service de téléphonie RTCP.

La personne appelante entre le texte, qui est relayé par service vocal à la personne qui reçoit l’appel; cette dernière répond par service vocal, et son message est entré et relayé à la personne appelante par l’AC. C’est comme un appel avec un téléscripteur, mais c’est un ordinateur ou un autre appareil qui fait office de téléscripteur.

Il n’y a aucun coût supplémentaire pour les utilisateurs de relais par IP, si ce n’est celui de l’ordinateur ou d’un autre appareil permettant de se brancher à Internet, et de la connexion Internet elle-même. Au Canada :

« Le CRTC a déjà conclu qu’il incombait aux fournisseurs de services filaires (traditionnels), sans fil et de voix sur IP (VoIP) de fournir l’accès aux services de relais téléphonique par téléscripteur à leurs clients. La politique réglementaire de radiodiffusion et de télécom 2009-430 (Accessibilité des services de télécommunication et de radiodiffusion, 21 juillet 2009) accroît les exigences relatives aux services de relais téléphonique. Un an après sa publication, toutes les compagnies de téléphone qui doivent fournir le service de relais téléphonique par téléscripteur (les compagnies de téléphonie locale, les fournisseurs de services sans fil, les fournisseurs de services VOIP) devront fournir aux clients un accès au service de relais téléphonique par protocole Internet. »15

Puisque plusieurs fournisseurs canadiens de service avaient besoin de plus de temps pour mettre au point et lancer leurs services respectifs de relais par IP, le CRTC a consenti des prolongations. Les services de relais par IP ont été lancés au Canada au début de 2011.

Relais par IP – But visé

Le relais par IP vise à permettre les communications textuelles sur des plateformes numériques pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, et où dans les faits les ordinateurs et autres dispositifs fonctionnant sur le Web remplacent les téléscripteurs, dont l’utilisation est plus contraignante et dont l’usage diminue rapidement compte tenu des progrès réalisés avec les autres technologies, notamment la messagerie instantanée.

Relais par IP – Cycle de développement du produit et délai pour son introduction sur le marché

Le relais par IP est maintenant utilisé dans divers pays, dont le Canada, les États-Unis, l’Australie, le Royaume-Uni et d’autres pays européens (où l’on parle plus fréquemment de service de relais textuel sur le Web). Bien que le délai de mise en marché des services de relais par IP puisse varier, au Canada, on parle d’environ 18 mois entre l’annonce de l’obligation réglementaire de fournir le relais par IP et sa mise en marché, mais certaines failles du système doivent encore être réglées.

Relais par IP – Avantages pour les utilisateurs/Contraintes pour la promotion de l’accessibilité

À titre de service textuel pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, le relais par IP présente certains avantages pour les utilisateurs.

Premièrement, le relais par IP peut être utilisé par « de nombreuses personnes sourdes et malentendantes qui n’utilisent pas l’ASL » et par les personnes « qui n’ont pas accès à Internet haute vitesse (qui) sont par conséquent dans l’impossibilité d’utiliser le service de relais vidéo (SRV)».16

Deuxièmement, plusieurs types de programmes informatiques peuvent être utilisés avec le relais par IP, y compris les programmes personnalisés qui fonctionnent dans le navigateur d’un ordinateur, ainsi que les services de messagerie instantanée.

Troisièmement, le relais par IP peut être utilisé sur de multiples appareils et plateformes : il peut fonctionner sur des tablettes, des téléphones intelligents et des ordinateurs (dans la mesure où le fournisseur de services de relais par IP offre la connectivité). Il est aussi possible que dans un proche avenir, une interface télévisuelle se matérialise.17

Quatrièmement, le service de relais par IP permet aux utilisateurs d’exécuter d’autres tâches lorsqu’ils sont en conversation (par exemple naviguer sur Internet) et permet aussi de prendre part à des conversations avec plusieurs personnes (comme dans une conférence téléphonique).

Relais par IP – Obstacles à l’adoption

Il y a très peu d’obstacles à l’adoption du service de relais par IP comme service de relais textuel pour les personnes ayant une déficience auditive et souffrant d’un trouble de la parole, et il n’y en a certainement aucun qui suffise à décourager son lancement sur le marché. Cependant, les difficultés relatives au relais par IP sont de deux ordres : l’accès aux services 911 et l’utilisation malveillante du service pour l’exercice d’activités criminelles, comme la fraude.

Bien que le service 911 soit accessible au moyen du relais par IP (un téléphoniste passe l’appel), il n’est pas possible de connaître l’emplacement exact des personnes qui appellent. Cela signifie que les personnes appelantes doivent pouvoir fournir leur adresse exacte et d’autres renseignements sur l’endroit où elles se trouvent, sinon le téléphoniste est dans l’impossibilité de localiser l’appel. Cependant, puisque le service de relais par IP fonctionne bien avec les téléphones mobiles qui ne répondent peut-être pas aux exigences quant à la largeur de bande nécessaire pour le SRV, il peut donner aux utilisateurs l’accès au service 911 lorsqu’aucune autre option n’est disponible (comme dans le cas d’un accident de voiture, par exemple).

En ce qui a trait à l’usage malveillant du service, des cas d’utilisation frauduleuse du service de relais par IP ont été signalés, principalement aux États-Unis. L’utilisation frauduleuse du service de relais par IP porte sur les éléments suivants : (i) une inscription au service de relais par IP faite par des personnes qui entendent, souvent à partir de l’étranger (des inscriptions temporaires étaient souvent consenties en attendant les résultats de la vérification de la légitimité de l’utilisateur), (ii) l’utilisation du service de relais par IP pour communiquer avec des entreprises (qui sont obligées d’accepter les appels par relais selon l’Americans with Disabilities Act) et (iii) l’utilisation de cartes de crédit contrefaites ou volées pour faire des achats frauduleux de ces entreprises.18

Autrement dit, une personne obtient frauduleusement une inscription pour utiliser le service de relais par IP; elle obtient des cartes de crédit contrefaites ou volées; elle communique avec une entreprise établie aux États-Unis, sachant que cette entreprise est obligée par la réglementation d’accepter les appels par relais; et elle fait des achats dans le cadre d’une « double fraude » en utilisant une inscription contrefaite et des modes de paiement illicites.

Pour lutter contre ces activités, la Federal Communications Commission (FCC) a proposé de rendre plus rigoureux le système d’inscription pour les usagers du service de relais par IP, ou d’accroître les pouvoirs discrétionnaires de l’AC pour qu’il puisse mettre fin aux appels suspects. Pour sa part, l’U.S. National Association of the Deaf a rejeté toute mesure susceptible de nuire au respect de la vie privée des utilisateurs et s’est montrée réticente à l’augmentation de la latitude accordée à l’AC lui permettant de décider si un appel est frauduleux.19

Afin de lutter contre l’utilisation frauduleuse du service de relais par IP, la FCC a choisi de mettre en œuvre un système d’inscription nécessitant une autorisation préalable de l’utilisateur avant l’émission d’un code d’accès de 10 chiffres, et d’éliminer la pratique consistant à autoriser temporairement les utilisateurs.20

Des consultations auprès de spécialistes des télécommunications accessibles révèlent qu’un autre obstacle au service de relais par IP réside dans le fait qu’il s’appuie sur un logiciel de reconnaissance vocale, c’est-à-dire qu’il est nécessaire d’obtenir les niveaux les plus élevés possible de précision pour la conversion parole-texte (précision > 95 %). Or, les fournisseurs au Canada sont réputés offrir une plage d’exactitude assez variable, ce qui laisse prévoir des niveaux variables de réussite pour le logiciel ou le téléphoniste.21

Il est à noter que la vitesse de conversion est également un facteur d’exactitude. De plus, les services de relais textuels sont généralement limités par d’autres facteurs, notamment la vitesse de saisie des utilisateurs, la vitesse de saisie des téléphonistes, les limites auditives des utilisateurs et le logiciel de conversion voix-texte. (Les normes de service de la FCC exigent que les téléphonistes transmettent la conversation à une vitesse minimale de 60 mots/minute.)

Relais par IP – Stade de développement

Le service de relais par IP a atteint le stade d’achèvement et de lancement sur le marché canadien. Toutefois, puisqu’il s’appuie sur un système incluant des téléphonistes et un logiciel de reconnaissance vocale/de conversion parole-texte, les fournisseurs cherchent constamment à améliorer le service, en comptant surtout sur les améliorations apportées au logiciel (et sur l’entraînement du logiciel pour la reconnaissance de la parole).

Relais par IP – Faisabilité

Le service de relais par IP est un service textuel tout à fait réalisable pour les Canadiens ayant une déficience auditive ou souffrant d’un trouble de la parole. Cependant, le logiciel de conversion parole-texte, qui constitue un élément central du service, peut présenter des contraintes sur le plan (i) de l’exactitude pour la transmission du texte approprié ou (ii) de la capacité d’apprentissage du logiciel lui-même (voir la présentation ci-dessous sur le cycle de développement du logiciel de conversion parole-texte).

Autrement dit, la faisabilité du service de relais par IP est fortement tributaire de l’atteinte de niveaux élevés d’exactitude pour la conversion parole-texte, qui doit être d’au moins 95 %, niveau de précision que prétendent offrir certains fournisseurs de logiciels. Nous ne disposons pas de données sur la précision du service de relais par IP, mais, comme nous l’indiquions précédemment, les spécialistes de la technologie des communications accessibles indiquent que le degré de précision varie selon les fournisseurs de services.

Relais par IP − Amélioration ou intégration possible avec d’autres applications, plateformes ou technologies existantes

Comme nous l’indiquions précédemment, le service de relais par IP fonctionne bien avec différents types de dispositifs, de plateformes et de programmes, puisqu’il s’agit d’un relais textuel utilisant une faible largeur de bande.

Relais par IP – Incidence possible sur les utilisateurs

On a constaté que le service de relais par IP constituait un ajout important aux communications textuelles pour les personnes ayant une déficience auditive et souffrant d’un trouble de la parole. Il convient parfaitement aux plateformes mobiles, car il utilise une faible largeur de bande. Aux États-Unis, le service de relais par IP peut être utilisé sans connexion Internet haute vitesse, ce qui peut le rendre encore plus économique pour les consommateurs. Au Canada, une connexion haute vitesse est nécessaire pour obtenir les services de relais par IP offerts par les fournisseurs canadiens de télécommunications.22

3) Technologie de conversion parole-texte

Comme l’a signalé un spécialiste consulté pour cette étude, la conversion parole-texte (et l’inverse, texte-parole) a connu de nets progrès, mais elle connaît également des contraintes inhérentes aux applications du logiciel de conversion. Toutefois, en raison de sa disponibilité sur le marché et de la poursuite de son développement, il est utile d’inclure la technologie de conversion parole-texte dans le présent exercice de vérification et d’examen.

Technologie de conversion parole-texte – Description sommaire

En termes simples, la technologie de conversion parole-texte utilise un logiciel spécial pour transformer les sons de la voix en texte écrit. On parle également de « reconnaissance de la parole » ou, dans le cas de certains logiciels plus évolués, de technologie de conversion par « reconnaissance vocale » ou par « reconnaissance du locuteur ». Dans ce dernier cas – qui n’est pas près d’être disponible sur le marché –, le logiciel reconnaît la façon de parler, le vocabulaire et la syntaxe correspondant à une personne (une voix unique) et transforme les sons en texte.

Toutefois, aux fins du présent rapport, nous mettons l’accent sur une conversion parole-texte plus générique, en partie parce que son développement est plus avancé, et en partie parce que la conversion voix-texte ne connaîtra peut-être jamais un développement plein et entier.

Nous avons déjà abordé précédemment un bon exemple de la conversion parole-texte lorsque nous avons abordé les services CapTel et de relais par IP : dans les deux cas, un AC répète les mots de la personne qui parle dans le microphone d’un ordinateur. Le logiciel parole-texte de l’ordinateur transforme les mots parlés en mots écrits.

Il est important de noter que l’AC doit répéter les mots prononcés, car le logiciel ne peut reconnaître qu’un nombre très limité de voix. Il ne pourrait jamais reconnaître et faire la conversion en texte des voix de chaque personne appelante. C’est pourquoi l’élément « relais » de la chaîne de communication doit demeurer.

De manière générale, les systèmes de reconnaissance de la parole disponibles sur le marché fonctionnent selon deux modèles : un modèle acoustique – l’encodage en paroles de renseignements linguistiques – et un modèle de langage – l’estimation de la probabilité des séquences de mots. Pour les vocabulaires étendus dont certains mots se prononcent de différentes façons, le système comprend également un modèle de prononciation.

Mais puisque les façons de parler varient considérablement, selon les personnes et selon les langues parlées, il n’existe pas de décodeur ou de dispositif universel de reconnaissance de la parole.23

Technologie de conversion parole-texte – But visé

Essentiellement, la conversion parole-texte vise à fournir aux personnes ayant une déficience auditive ou souffrant d’un trouble de la parole un autre système de remplacement pour la traduction textuelle. Or, en raison des limites de la technologie, la parole doit faire l’objet d’une conversion à la source plutôt que n’importe où, n’importe quand. Ainsi, un AC doit répéter les mots de la personne appelante dans le cas du service CapTel ou de relais par IP, car le logiciel serait incapable de convertir en texte les paroles de chaque personne appelante.

Comme nous l’avons indiqué, les applications de conversion parole-texte comprennent : les services CapTel et de relais par IP; le logiciel de conversion messagerie vocale-texte pour les systèmes téléphoniques (produit par Dragon, un des principaux fournisseurs de logiciels de conversion parole-texte et d’autres applications logicielles d’assistance); et le sous-titrage codé pour les émissions de télévision (où un sous-titreur répète les mots, par exemple, d’un présentateur de nouvelles et dont les paroles sont converties en sous-titres pour la diffusion).

Technologie de conversion parole-texte – Cycle de développement du produit

De manière générale, le cycle de développement de tout logiciel est lié à sa complexité, au nombre de lignes de code et au nombre de concepteurs participant à la création – tous ces éléments étant convertis en une évaluation des années-personnes requises. Bien que le cycle de développement de chaque logiciel varie, deux modèles plus fréquents ressemblent au schéma suivant :

Une représentation graphiques du cycle de développement de produits en cascade Une représentation graphiques du cycle de développement de produits en circulaire

Deux représentations graphiques du cycle de développement de produits − en cascade et circulaire

 

Les activités, les méthodes, les disciplines de soutien (comme l’assurance de la qualité) et les outils peuvent varier selon les projets de développement de logiciels. Mais peu importe qu’il s’agisse d’une méthode de développement en cascade (à gauche dans le schéma ci-dessus), circulaire (à droite ci-dessus) ou d’une autre méthode, les éléments essentiels du processus sont essentiellement toujours les mêmes :

Le développement d’un logiciel de conversion parole-texte est très complexe, et son cycle de développement est directement lié au type et à la quantité de paroles que le logiciel peut être programmé à reconnaître. Il est difficile de déterminer le temps exact nécessaire au développement de logiciels de conversion parole-texte, car il s’agit d’un cycle de développement et d’amélioration qui dure depuis des décennies. De plus, le marché étant concurrentiel, on y trouve beaucoup de contenus exclusifs et de secrets commerciaux.

Mais on peut dire sans risque de se tromper que l’amélioration d’un produit peut exiger de 20 à 30 années-personnes avant qu’il perce sur le marché, c’est-à-dire que de 20 à 30 concepteurs doivent travailler pendant une année au développement du logiciel avant de passer au niveau suivant.

Il y a un autre point sur lequel il faut insister dans le cas du développement d’un logiciel de conversion parole-texte : la précision est primordiale. Comme nous l’indiquons plus loin, le manque de précision est un enjeu majeur et incessant pour ce type de technologie de remplacement. Ceci résulte du fait que l’exploitation du système est une activité complexe qui dépasse le simple téléchargement du logiciel pour l’utiliser, car chaque élément du logiciel de conversion parole-texte doit faire l’objet d’un apprentissage qui lui permet de reconnaître le locuteur et sa prononciation. Pour cette raison, des mois supplémentaires peuvent être nécessaires pour que le logiciel atteigne le stade opérationnel.

« En règle générale, si l’on parle l’anglais américain standard et qu’on articule clairement, en utilisant un microphone de qualité, il est possible, sur une période de trois mois d’utilisation répétée, d’atteindre des taux d’exactitude pour un logiciel de reconnaissance de la parole qui se situeront dans le 90e percentile. La notion d’usage répété signifie pratiquement tous les jours et en corrigeant toujours les erreurs au moyen de la méthode conseillée par le logiciel. Si vous avez un accent, quel qu’il soit, l’apprentissage nécessaire pour obtenir des taux élevés de précision avec votre logiciel de reconnaissance de la parole pourrait exiger de 6 à 12 mois. »24

Technologie de conversion parole-texte – Avantages pour les utilisateurs

Si l’on présume que le logiciel de conversion parole-texte a été programmé et entraîné pour un niveau élevé d’exactitude (> 95 %), il est alors indéniable qu’il est utile aux personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, particulièrement s’il est utilisé pour des services comme le relais par IP.

L’intérêt de la conversion parole-texte pour les personnes ayant une déficience auditive et souffrant d’un trouble de la parole est fonction des éléments suivants :

Le SEMC et autres communications textuelles disponibles sur des dispositifs et des plateformes multiples atténuent l’importance de la technologie de conversion parole-texte.

Technologie de conversion parole-texte – Obstacles à l’adoption

Comme nous l’avons mentionné précédemment, les difficultés à obtenir des niveaux de précision acceptables (très élevés) constituent un obstacle majeur à l’adoption d’un logiciel de conversion parole-texte. De même, les cinq considérations mentionnées ci-dessus par les spécialistes consultés pour la vérification jouent un rôle. Mais les obstacles à l’adoption de cette technologie de remplacement sont assez bien résumés par les questions (rédigées par l’Inclusive Design Centre du Ontario College of Art and Design)25 que l’on doit se poser au moment de faire le choix d’un logiciel de conversion :

Cet ensemble de considérations peut constituer un obstacle en soi pour les personnes moins à l’aise avec la technologie (moins « technophiles »), qui envisagent l’utilisation d’un logiciel de conversion parole-texte.

Technologie de conversion parole-texte – Stade de développement

On peut dire sans risque de se tromper que la conversion parole-texte connaît un développement continu et que des améliorations sont constamment apportées à la capacité d’apprentissage et au niveau d’exactitude. De manière générale, à l’heure actuelle, on estime que la précision peut atteindre 90 % après une période de formation normale, soit environ trois mois, avec recherche constante d’amélioration. Il est aussi généralement reconnu que le but à atteindre est un seuil de précision de 95 %, mais que ce seuil est difficile à dépasser. Par conséquent, il y aura toujours une certaine inexactitude dans la conversion parole-texte (ce qui est également le cas avec le sous-titrage codé pour les émissions de télévision, puisqu’un certain nombre d’erreurs surviennent inévitablement dans la chaîne des événements qui permettent l’affichage des sous-titres à l’écran).

Technologie de conversion parole-texte – Faisabilité

Encore une fois, la faisabilité de la conversion parole-texte est remise en question en raison de deux facteurs : (i) le degré d’exactitude qu’on peut obtenir et (ii) le nombre même de solutions très variables offertes aux utilisateurs, chacune ayant des « exigences particulières quant au temps d’attente, aux contraintes de mémoire, à la taille du vocabulaire et aux fonctions d’adaptation ». Simultanément, chaque solution doit être classée par les utilisateurs en fonction d’un usage particulier, comme « commandes et contrôle, système de dialogue, texte dicté, transcription de documents audio ».26

De plus, les caractéristiques distinctives des utilisateurs seront un autre facteur déterminant pour la faisabilité relative de la technologie de conversion parole-texte. Par exemple, une solution qui en soit purement une de conversion parole-texte est moins importante pour une personne sourde qui utilise la langue des signes qu’une solution de conversion parole-langue des signes/langue des signes-parole. Bien qu’il y ait des cas où la conversion parole-texte est « nécessaire », la technologie est considérée par certaines personnes de la communauté des personnes sourdes comme étant moins utiles que le SEMC ou qu’une solution de conversion « très précise » de la langue des signes. Pour bien des usagers de la langue des signes, la langue écrite, comme l’anglais ou le français, n’est pas leur langue première. Parce que ce groupe précis manque d’aisance avec la langue écrite, une solution de conversion de la langue des signes revêt plus d’importance, car elle permet de combler un plus grand écart dans les communications que ne le ferait une solution de conversion parole-texte.

Technologie de conversion parole-texte – Amélioration ou intégration possible avec d’autres applications, plateformes ou technologies existantes

Comme nous l’avons mentionné précédemment, la technologie de conversion parole-texte offre un certain nombre d’applications, comme le relais par IP, le sous-titrage codé pour la télédiffusion (actuellement la technologie dominante pour la programmation en langue française) et les plateformes mobiles. Une application dictaphone est aussi offerte sur iTunes au prix de 1,99 $ : elle offre la conversion parole-texte pour les SEMC, les courriels et une vaste gamme de médias sociaux.27

La conversion parole-texte figure donc parmi les technologies de remplacement les plus omniprésentes pour les utilisateurs ayant une déficience auditive ou souffrant d’un trouble de la parole. La question est davantage de savoir si elle demeure utile compte tenudes technologies en développement pour la conversion langue de signes-texte en fonction des différents publics cibles (ayant divers degrés de handicap).

Photo d’un appareil iPhone illustrant l’application dictaphone d’Apple pour les SEMC. Le photo montre un microphone affiché sur l’écran d’un iPhone. Photo d’un appareil iPhone illustrant l’application dictaphone d’Apple pour les SEMC. Le photo montre un microphone affiché sur l’écran d’un iPhone.

Photos d’un appareil iPhone illustrant l’application dictaphone d’Apple pour les SEMC. Les deux photos montrent un microphone affiché sur l’écran d’un iPhone.

Technologie de conversion parole-texte – Incidence possible sur les utilisateurs

Un des enjeux en matière de technologies de communication accessibles définis pendant la vérification a été décrit de la façon suivante :

Il existe maintenant des dizaines de possibilités pour les messages textes, les messages vocaux et les vidéos, et la plupart d’entre elles sont gratuites (dans la mesure où l’on a accès à une certaine forme de connectivité), et elles sont préinstallées dans tous les dispositifs et les blocs de services offerts un peu partout. Le défi réside dans la compatibilité – est-il possible de communiquer avec les chaînes de valeur concurrentes? Ce n’est pas toujours facile ni intuitif.

Il faut chercher sans fin sur Google. Auparavant, nous avions une solution unique, non optimale (comme les téléscripteurs) utilisée par toutes les personnes sourdes; maintenant, nous avons des centaines de solutions grand public concurrentes offrant des fonctions légèrement différentes, qui changent toutes chaque trimestre et qui permettent aux utilisateurs sourds technophiles d’obtenir un meilleur service que celui qu’obtiennent les personnes sourdes moins averties. La question de la compatibilité est aussi un peu comme l’interaction médicamenteuse – si je prends tellement de médicaments dans le cadre de traitements prescrits par de nombreux médecins, je serai éventuellement victime d’un conflit pharmaceutique. Dans les deux cas, l’information est l’élément qui fait défaut – non pas l’information brute, mais une information contextuelle que je peux comprendre, dans ce que je fais, dans mon établissement d’enseignement ou dans mon travail.

Mais les avantages sont tellement intéressants. Nous avons vraiment atteint un point où un consommateur bien informé et averti peut trouver ce qu’il recherche et réunir son propre ensemble de dispositifs et de services, habituellement à un coût raisonnable – le tout étant très personnalisé et n’offrant que les fonctions nécessaires.

Nous avons aussi noté que la multitude de technologies offertes est en voie de créer un « nouveau fossé numérique » : le fossé entre les personnes sourdes averties et moins averties, comme nous l’avons vu dans l’extrait qui précède. Il se peut que la conversion parole-texte – selon diverses variations sur différentes plateformes – offre une solution de remplacement partielle, un élément d’une solution aux communications constituée de plusieurs éléments qui ne cessent d’évoluer.

Conversion parole-texte – Retombées et marketing de masse

Il faut aussi noter que la technologie de conversion de la parole a eu, et a toujours, d’importantes retombées dans des secteurs comme celui des jeux vidéo. Tandis que le logiciel dans un système de jeu comme Xbox 360 Kinect ne fait pas la conversion de la parole en texte, il agit comme une commande système : si l’on dit « Xbox go Home », l’écran d’accueil s’affiche, « Xbox play disc », la mise en fonction du disque dans le lecteur s’amorce. D’autres commandes vocales permettent de revenir en arrière, d’avancer rapidement ou d’éjecter le disque, entre autres options. (Le système Xbox 360 Kinect fonctionne également avec un type de technologie de contrôle ou de saisie des mouvements conçue pour permettre le jeu interactif, qui n’est qu’une version plus simplifiée de la technologie de conversion langue des signes-parole/texte dont nous parlons plus loin.)28

Un tel système de reconnaissance de la parole peut avoir un effet positif pour les personnes à mobilité réduite, c’est-à-dire les personnes capables de parler, mais qui ne peuvent utiliser une télécommande ni d’autres dispositifs du genre.

Autre exemple – à l’essai au Japon – de l’utilisation de la reconnaissance de la parole pour les jeux vidéo et de son incidence sur l’éducation : Nintendo met au point un système pour ses appareils de jeu DS qui est conçu pour être utilisé en classe. Les élèves ayant une déficience auditive pourront utiliser l’appareil pour enregistrer ce que le professeur dit dans un format de texte converti. De plus, il n’est pas nécessaire de se fier à la capacité de mémoire de l’appareil DS puisque l’information est sauvegardée dans le système d’informatique en nuage de NTT (entreprise nationale de télécommunication du Japon) – elle est téléchargée par le réseau mobile de NTT et disponible pour être consultée ultérieurement par les utilisateurs. Bien que ce système soit encore à l’essai, il pourrait éventuellement permettre le partage de texte et l’interactivité entre les utilisateurs, augmentant ainsi l’utilisation de l’appareil DS, qui deviendrait un dispositif de communication de personne à personne.29

4) Technologie de conversion langue des signes-parole/texte

Comme nous l’avons indiqué précédemment, la conversion langue des signes-parole/texte – comme la désignent les membres de la communauté des personnes sourdes et malentendantes – est une technologie qui présente un vif intérêt pour les personnes qui ont une déficience auditive ou qui souffrent d’un trouble de la parole, et qui utilisent la langue des signes pour communiquer.

Il existe actuellement une importante lacune au Canada au chapitre des communications entre les personnes qui utilisent la langue des signes et les autres personnes. Des services d’interprète en direct sont offerts par divers organismes d’interprétation en ASL et LSQ, mais il n’existe actuellement pas de service de relais vidéo au Canada. C’est pourquoi une application qui pourrait réduire l’écart, comme la technologie de conversion langue des signes-parole/texte, présente un très grand intérêt.

Toutefois, il est important de noter que certaines applications permettent de convertir la parole ou le texte en langue des signes. Mais ces applications établissent la correspondance entre des mots et des signes obtenus dans un dictionnaire de langue des signes. La vitesse réelle et l’exactitude de la traduction de ces applications en font des outils de communication, mais elles ne remplacent pas un interprète.

De plus, la langue des signes est un type de communication qui utilise des gestes, des expressions faciales et le langage corporel pour communiquer un message. La technologie actuelle de conversion langue des signes-parole/texte ne peut saisir toutes les nuances, parfois subtiles. La syntaxe est également très importante – c’est-à-dire que la langue des signes ne peut être traduite directement, mot à mot, dans une langue parlée, et il faut généralement un certain degré d’interprétation pour bien comprendre le contexte et le sens. Bien que des applications comme le Portable Sign Language Translator (PSLT) tiennent compte de ces éléments, il faudra vraisemblablement un certain temps avant que l’intégralité de la langue des signes puisse être interprétée par une application logicielle.

Ainsi, une technologie qui remplacerait les interprètes humains en langue des signes représente un progrès important pour les utilisateurs, et c’est ce qui constitue l’objet de la présente partie de notre vérification.

Il est à noter qu’une discussion sur la conversion langue des signes-parole/texte modifie l’intérêt technologique, qui devient alors axé sur les applications de communication plutôt que sur les télécommunications. Il s’agit d’une distinction importante, parce que cette technologie particulière n’entraîne pas la nécessité d’améliorer ou de modifier de quelque autre façon le système de télécommunication afin d’offrir une meilleure accessibilité. Il s’agit plutôt d’ajouter une application logicielle pour assurer un nouveau type de communication entre les utilisateurs.

Technologie de conversion langue des signes-parole/texte – Description sommaire

La technologie de conversion langue des signes-parole ou texte est un système logiciel qui transforme la langue des signes en mots parlés ou écrits, générés par ordinateur (p. ex. l’ASL, la LSQ, la BSL ou la langue des signes d’autres pays), ou transforme le texte ou les mots parlés en langue des signes, en temps quasi réel – c’est-à-dire que la traduction est effectuée quelques secondes, ou plus, après que les signes aient été exécutés, selon la complexité des signes.

La conversion de la langue des signes à la parole ou au texte est à un stade de développement relativement précoce. À l’heure actuelle, un programme informatique convertit une forme de communication (comme la langue des signes) dans une autre (comme du texte ou une voix générée par ordinateur). Par exemple, une caméra vidéo reliée à un ordinateur enregistre une personne qui communique par langue des signes. Les signes exécutés par les mains sont importés dans le programme de conversion, puis ils sont convertis dans une autre forme de communication, soit en texte, soit en voix générée par ordinateur.

Autrement dit :

« Le flux vidéo (d’une personne qui exécute les signes) est saisi par la caméra, puis il est traité par un logiciel qui reconnaît les séquences des gestes de l’utilisateur grâce à une "bibliothèque" de notions ou de mots essentiels mémorisés localement. Ces notions ou ces mots sont ensuite assemblés en phrases, qui sont reproduites sous forme de texte, en temps réel. »30

Évidemment, le principal avantage de cette technologie réside dans le fait qu’elle permet à une personne qui s’exprime en langue des signes (la langue première de cette personne, peut-être) de communiquer avec une personne qui est incapable de lire les signes. L’affirmation que le texte puisse être reproduit « en temps réel » doit cependant être accueillie avec prudence, compte tenu du degré de complexité inhérent à la syntaxe de la langue des signes, à l’expression faciale et au langage corporel.

Le programme de conversion langue des signes-parole ou texte est encore au stade de développement chez la société Technabling, une société issue de l’Université d’Aberdeen, en Écosse. Le programme de conversion s’appelle Portable Sign Language Translator (PSLT) et il a déjà suscité beaucoup d’intérêt pour les progrès inédits réalisés dans le domaine de la conversion langue des signes-parole ou texte.

De fait, il semble y avoir un engouement international pour cette technologie en évolution, car divers autres programmes sont également en développement, dont le programme Atlas en Italie, le projet DePaul ASL Synthesizer aux États‑Unis, le projet SASL-MT en Afrique du Sud et le projet « SiSi » (Say It, Sign It) au Royaume-Uni.

Dans ce dernier cas, IBM a réuni différentes technologies informatiques, dont la reconnaissance de la parole, qui convertissent des mots parlés en langue des signes britannique – qui est ensuite reproduite par un personnage animé numériquement, ou avatar, qui apparaît dans un coin de l’écran (ordinateur de bureau ou portatif, ou téléviseur). La base de données Open Sign – une compilation internationale de projets et de travaux de recherche sur les langues des signes – indique que neuf initiatives combinant signes et avatar sont en cours en Europe et en Afrique du Sud.31

SiSi - Photo d’un avatar généré par ordinateur qui utilise la langue des signes

Photo d’un avatar généré par ordinateur qui utilise la langue des signes32

La syntaxe de la langue des signes est très complexe; elle comprend des associations de symboles, d’expressions faciales, de langage corporel et d’émotions qui servent à communiquer. La technologie qui sous-tend des projets comme SiSi est tout aussi complexe, utilisant des combinaisons de logiciels pour produire un avatar qui s’exprime par signes. En général, ces projets sont utilisés pour le traitement linguistique – comportant l’analyse de télétextes et un logiciel de reconnaissance de la parole – pour créer des séquences de signes obtenues par capture de mouvement.

Plus récemment, des améliorations ont été apportées à cette démarche grâce à l’animation synthétisée de HamNoSys (système international de transcription phonétique pour les langues des signes), qui est intégré à une plateforme d’animation avec avatar. Cette procédure est nécessaire parce que HamNoSys ne transcrit pas les expressions faciales. La plateforme avec avatar combine une animation paramétrable avec expression faciale précise, et elle évolue de plus en plus dans sa capacité d’enregistrer et d’animer des gestes, un langage corporel et des expressions faciales plus complexes.33

Il existe une variante aux programmes de conversion langue des signes-parole/texte et parole/texte-langue des signes décrits ci-dessus : le programme Dicta-Sign, un projet en cours de développement à l’Athena Institute of Language and Speech Processing, en Grèce. Le projet permet l’interaction de la langue des signes avec le Web 2.0, pour qu’une personne qui « dicte » des changements avec la langue des signes puisse effectuer des mises à jour et apporter des éléments de contribution; ces changements sont convertis en un avatar qui les retransmet par signes aux utilisateurs.34

Si les caméras font partie intégrante du projet SiSi et d’autres projets fonctionnant par capture de mouvement, ce ne sont pas les seuls dispositifs compatibles avec la conversion langue des signes-texte. Un groupe d’étudiants ukrainiens réunis dans un projet nommé Enable Talk a créé des gants qui, lorsqu’ils sont reliés à un téléphone intelligent par Bluetooth, traduisent automatiquement la langue des signes en texte, puis en parole. Les gants utilisent des « capteurs flexibles, des capteurs tactiles, des gyroscopes et des accéléromètres (ainsi que des cellules solaires pour accroître la durée de la pile) » afin de produire un système relativement peu coûteux (75 $US la paire), s’adaptant à toute une gamme de langues de signes internationales.35

EnableTalk_gloves - Photo d’une paire de gants Enable Talk pour la conversion langue des signes-texte/parole

Photo d’une paire de gants Enable Talk pour la conversion langue des signes-texte/parole36

Technologie de conversion langue des signes-parole/texte − But visé

Le but visé par la technologie de conversion langue des signes-parole/texte, et inversement, est de fournir de nouvelles possibilités de communication entre les personnes utilisant la langue des signes et celles qui ne connaissent pas cette langue, et d’étendre l’utilisation de l’interprétation de la langue des signes lorsqu’on n’a pas accès à des interprètes. Sur ce dernier point, la conversion parole-langue des signes –par exemple dans une salle de cours – permettrait d’utiliser la langue des signes au moyen d’un avatar à l’écran lorsqu’on n’a pas accès à un interprète en langue des signes pour la présentation d’un cours.

Pour ce qui est de l’objectif du projet PSLT en particulier, son principal concepteur a indiqué que « cette technologie avait pour but de donner aux utilisateurs de la langue des signes les moyens de relever les défis qui les attendent en matière de communication grâce à une technologie portable ».37

Technologie de conversion langue des signes-parole/texte – Cycle de développement du produit

Le cycle de développement du produit pour la technologie de conversion langue des signes-parole/texte respecte en grande partie le modèle en cascade ou cyclique mentionné précédemment dans notre présentation sur le développement du produit pour la conversion parole-texte.

La vitesse à laquelle progresse la conversion langue des signes-parole/texte semble plus rapide (comparativement, par exemple, à la technologie de conversion parole-texte qui est en développement depuis les années 1960) parce que, à l’heure actuelle, il existe un engouement considérable à l’échelle mondiale pour cette technologie. De nombreux projets, semblables sur le plan de la conception et de la démarche et offrant des occasions d’échange d’information, sont en cours dans de nombreux pays.

Cet engouement favorise un financement très important de la part du secteur privé et des universités et permet à de nouvelles technologies de conversion de devenir des applications à grand déploiement, comme le projet PSLT dont la réalisation devrait être achevée à la fin de 2013, soit dans un peu plus de 12 mois.

Mais tandis que tout laisse croire que cette technologie constituera un ajout utile et potentiellement valable aux applications d’assistance, nous notons encore une fois que certaines affirmations actuelles, comme celle d’une conversion en temps réel de symboles en texte, doivent faire l’objet d’une certaine réserve. La fonctionnalité de la première application reste encore à démontrer. Dans ce cas, il est raisonnable de faire preuve de prudence, notamment si l’on songe à l’avenir initialement prometteur de la technologie de reconnaissance de la parole, qui est devenu considérablement moins prometteur lorsqu’on a constaté des contraintes importantes qui se sont révélées difficiles à surmonter.

Technologie de conversion langue des signes-parole/texte – Avantages pour les utilisateurs

Le développement des systèmes de conversion langue des signes-parole/texte suscite à l’heure actuelle un intérêt considérable, et les avantages éventuels pour les utilisateurs semblent importants.

Comme nous l’indiquons plus loin, le système est conçu pour être portable et compatible avec de multiples dispositifs et plateformes. Dans le cas du système PSLT, il peut être personnalisé pour une utilisation individuelle:

« Cela signifie que tout utilisateur de la langue des signes peut créer son propre ensemble de signes et de gestes (ou les adapter à partir d’un ensemble de signes d’usage général, comme la British Sign Language) et les associer à ses propres mots et notions. De cette façon, les utilisateurs de la langue des signes peuvent combler le fossé qui existe actuellement sur le plan de la communication avec le monde qui les entoure, étant en mesure d’utiliser n’importe quel jargon correspondant à n’importe quelle situation où ils peuvent se trouver (p. ex. aux études, en formation, au travail, à domicile ou lors de déplacements). »38

De cette façon, les jeunes apprenants qui souffrent d’un trouble de la parole peuvent utiliser le système pour créer des bibliothèques de gestes et de signes personnalisés qui expriment les notions propres à un domaine nécessaires pour aborder des sujets d’étude avec leurs professeurs et autres.

La fonction personnalisable permet également aux personnes à mobilité plus limitée ou souffrant d’autres handicaps de créer des gestes ayant une signification précise (comme un mouvement du poignet pour signifier « je dois aller à la salle de bains ») et correspondant à leur capacité physique.

Des variantes régionales liées à la culture et aux coutumes peuvent également être intégrées au vocabulaire de base du système, permettant la personnalisation du langage d’une personne en fonction des situations qu’elle vit au quotidien. Autrement dit, la souplesse du système permet le développement et l’intégration d’une langue des signes personnalisable.39

Comme l’a indiqué le fondateur de Technabling, qui développe le système PSLT :

« Un des aspects les plus novateurs et les plus emballants de la technologie est qu’elle permet aux utilisateurs de la langue des signes de créer leurs propres signes correspondant aux notions et aux mots qu’ils doivent posséder dans leur vocabulaire, mais qu’ils ne pouvaient peut-être pas exprimer facilement en utilisant la BSL. »40

Technologie de conversion langue des signes-parole/texte – Obstacles à l’adoption

À l’heure actuelle, les principaux obstacles à l’adoption sont (i) la mesure dans laquelle le logiciel peut lire et convertir des signes spécifiques, (ii) la précision du logiciel de reconnaissance de la voix qui peut être utilisé dans la conversion entre la parole et la langue des signes et (iii) la vitesse à laquelle le logiciel et la caméra peuvent capturer les signes.

Les limites du logiciel de reconnaissance vocale mentionnées ci-dessus valent également pour la conversion langue des signes-parole.

Toutefois, le prototype du système PSLT mis au point par Technabling est axé davantage, pour l’instant, sur la conversion langue des signes-texte que sur la conversion langue des signes-parole, rendant inutile le recours à un logiciel de reconnaissance de la parole potentiellement limité.

Technologie de conversion langue des signes-parole/texte – Stade de développement

Le projet PSLT est actuellement à mi-chemin de son développement : le système de base est en place, mais des détails s’ajoutent encore, y compris le niveau de vocabulaire et la complexité des signes que le système peut interpréter. Ceci dit, les concepteurs du projet PSLT se penchent sur le développement d’une application commerciale qui permettra aux logiciels de conversion de fonctionner sur des ordinateurs, des ordinateurs portatifs, des miniportatifs et des téléphones intelligents. L’achèvement de cette application est prévu pour la fin de 2013.41

Mais si tout semble indiquer que cette technologie proposera un ajout utile aux applications d’assistance, certaines affirmations actuelles – comme celle de la conversion symbole-texte en temps réel – doivent être accueillies avec prudence.

Les stades de développement des systèmes de langue des signes avec avatar diffèrent. Par exemple, le projet SiSi du Royaume-Uni est assez avancé, tandis que le projet sud-africain de langue des signes (qui est pratiquement identique à d’autres projets de conversion avec avatar) est encore à mi-chemin de son développement. Pour d’autres projets plus évolués, il faut prévoir un délai de 24 à 36 mois avant que le logiciel de conversion soit offert sur le marché de masse.

Technologie de conversion langue des signes-parole/texte – Faisabilité

Parce que les technologies de conversion langue des signes-parole/texte sont essentiellement axées sur le développement d’applications, par opposition à l’amélioration des systèmes de télécommunication, leur faisabilité est très probable, et ce, pour différentes raisons.

Premièrement, on prévoit que la version définitive du logiciel offrira un degré élevé de précision et de souplesse : on prévoit que l’application PSLT pourra interpréter avec précision les signes de façon uniforme, et qu’elle offrira un niveau élevé d’adaptabilité pour l’apprentissage de langues et de symboles particuliers (comme ceux qui s’échangent dans les sous-cultures ou entre les jeunes).

Par exemple, il est important de noter que le logiciel de conversion PSLT permet une interprétation « complète » des signes. Autrement dit, si les signes correspondant à « je », « conduis » et « voiture » sont fournis, le texte généré indique « je conduis la voiture ». Si le signe correspondant à « hier » est fourni, le système convertit alors automatiquement le temps du verbe : « hier, j’ai conduit la voiture ».

Deuxièmement, la nature du PSLT, fondée sur une application, et des projets reposant sur la langue combinant signes et avatar se prêtent bien à la production à grande échelle et à l’établissement d’un prix abordable (une considération importante compte tenu de la situation socio-économique difficile de nombreuses personnes handicapées).

Troisièmement, la conversion langue des signes-parole met l’accent sur le caractère portatif, puisque les applications sont conçues pour fonctionner sur de multiples appareils, notamment sur les appareils mobiles, rendant ainsi l’application plus facilement accessible, et portative, pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. Toutefois, à ce jour, les technologies mises au point sont des applications hors ligne et elles ciblent les communications en personne.

Cependant, il faut signaler que la vitesse de la capture d’images et de la conversion des signes doit encore faire l’objet d’essais, compte tenu de la grande complexité et du caractère variable des éléments de la langue des signes.

Comme pour les autres technologies examinées dans le cadre de la présente vérification, la valeur de cette technologie est fonction des caractéristiques des utilisateurs. La valeur de la technologie de conversion langue des signes-parole/texte est limitée aux personnes qui utilisent la langue des signes comme principal moyen de communication et aux personnes qui souhaitent communiquer dans cette langue. Pour une personne sourde, malentendante ou souffrant d’un trouble de la parole qui n’utilise pas la langue des signes, la valeur de cette technologie est fortement réduite.

Technologie de conversion langue des signes-texte – Amélioration ou intégration possible avec d’autres applications, plateformes ou technologies existantes

Les concepteurs du PSLT notent que le logiciel du système sera développé en une application portative hors ligne qui sera utilisée sur « des téléphones intelligents Android et des tablettes, ainsi que sur les miniportatifs, les blocs-notes, les portatifs et les ordinateurs de bureau fonctionnant sous Linux ou Windows, munis d’une caméra Web standard ».42 Cela illustre comment les progrès techniques des appareils mobiles (téléphone et tablettes), c’est-à-dire leur capacité de fonctionner comme mini-ordinateurs mobiles, ont permis aux technologies d’assistance de devenir plus répandues et plus portables. (Autrement dit, leur caractère portable est un avantage – pas nécessairement leur fonctionnalité pour les télécommunications. L’importance de la nature hors ligne de l’application PSLT indique qu’elle vise à faciliter la communication en personne.)

Les concepteurs n’intégreront pas les outils de communication voix ou vidéo comme FaceTime ou Skype lors de son lancement initial; l’application PSLT peut être ajoutée aux appareils iPhone et iPad, mais uniquement si la demande le justifie.

Les concepteurs notent également la chose suivante : bien que la séquence des signes à partir d’une caméra puisse être affichée comme du texte sur l’appareil à partir duquel elle a été détectée, cette séquence peut également être transmise et affichée à distance. Autrement dit, la séquence peut être transmise « comme un message SEMC ou comme une commande Bluetooth permettant de contrôler un appareil ».43

Technologie de conversion langue des signes-parole/texte – Incidence possible sur les utilisateurs

Le caractère portable et la souplesse du système PSLT, ainsi que sa fonctionnalité multiplateforme et son logiciel personnalisable, présentent une incidence qui pourrait être positive pour les utilisateurs dans un certain nombre de situations interpersonnelles, comme dans les établissements d’enseignement et au travail.

Les concepteurs du PSLT se sont concentrés en grande partie, bien que ce soit en théorie, sur l’incidence positive pour les utilisateurs en ce qui a trait à la recherche d’emploi puis à des communications efficaces au travail. Autrement dit, le fait d’utiliser un dispositif qui traduit avec précision et rapidité des signes en texte permettrait à un utilisateur ayant une déficience auditive ou souffrant d’un trouble de la parole d’accroître le nombre d’emplois qu’il pourrait postuler, parce que les obstacles à la communication entre les personnes utilisant la langue des signes et celles qui ne l’utilisent pas seraient réduits.

De façon générale, l’aspect le plus positif pour les utilisateurs semblerait être les changements que le système peut apporter dans les communications courantes de personne à personne.

Technologie de conversion langue des signes-parole/texte – Retombées et marketing de masse

Comme nous l’avons mentionné précédemment, certaines applications de conversion langue des signes-parole/texte utilisent une technologie existante de capture du mouvement comme un élément pour créer un avatar qui exécute les signes. La capture de mouvement est également utilisée dans les systèmes de jeux vidéo comme Wii et Xbox 360 Kinect, de sorte que, encore une fois, des progrès peuvent être réalisés dans les systèmes de jeu par suite de la recherche sur la conversion langue des signes-parole/texte.

Bien qu’il soit moins marqué, l’intérêt pour d’autres produits dérivés – certains déjà utilisés et d’autres en développement – est là.

L’avènement du collier ou pendentif convertisseur pour la langue des signes a été annoncé il y a plus de trois ans, mais force est de constater qu’il n’a pas été adopté à grande échelle. Le dispositif – essentiellement un convertisseur langue des signes-parole – peut être porté autour du cou pour percevoir la langue des signes et convertir les symboles en parole.44

 

Illustration d’un pendentif convertisseur de langue des signes, petit dispositif de forme tubulaire qu’on porte sur une chaîne autour du cou. Cette image montre trois versions du pendentif : image de gauche, « Cliquer sur le bas pour ouvrir le haut-parleur »; image du centre, « Régler le volume »; image de droite, « Fermer ».

Illustration d’un pendentif convertisseur de langue des signes, petit dispositif de forme tubulaire qu’on porte sur une chaîne autour du cou. Cette image montre trois versions du pendentif : image de gauche, « Cliquer sur le bas pour ouvrir le haut-parleur »; image du centre, « Régler le volume »; image de droite, « Fermer ».

 

Le pendentif original ne semblait pas être muni d’un transmetteur bidirectionnel, par exemple un logiciel qui convertirait la parole en texte. Un progrès en ce sens a été réalisé par le Sign Voice Language Translator. Cet appareil, également porté comme un pendentif autour du cou, utilise une caméra pour capturer et traduire la langue des signes en parole, puis convertit la parole en texte qui s’affiche sur un petit écran ACL, à côté de la caméra. Ceci permettrait à une personne aveugle et sourde de communiquer avec une autre personne. (L’état actuel de ce dispositif, son prix ou les plans pour le marché de masse ne sont pas connus.)45

La recherche et développement dans le domaine des technologies d’assistance, comme la conversion parole-texte et langue des signes-texte/parole, a donné lieu à une autre retombée, potentiellement importante : un convertisseur plus universel qui convertit automatiquement le texte d’une langue à une autre, ou qui convertit les paroles d’une langue en une autre langue.

Par exemple, Google Play a mis au point Google Traduction pour la plateforme Android, une application qui traduit la parole dans une autre langue ou en texte, compatible avec 50 langues différentes. Deux types d’applications pour la reconnaissance de la parole ont également été mises au point par Apple pour l’iPhone et par Microsoft pour les ordinateurs portatifs et les appareils mobiles. De manière générale, on reconnaît que les progrès réalisés dans le développement du logiciel de traduction automatique faciliteront les communications lors des déplacements des personnes travaillant dans le secteur du tourisme d’accueil ainsi que pour d’autres circonstances, mais la recherche reconnaît également les limites de la technologie en ce qui a trait à l’exactitude.46

5) Technologies grand public adaptées, comme le SEMC

Nous avons décidé d’aborder cette partie du rapport sous forme narrative, car la présentation, qui portait sur l’examen des technologies de remplacement, porte désormais sur la façon dont les technologies grand public ont été adaptées par les personnes ayant une déficience auditive et souffrant d’un trouble de la parole.

Bien qu’on soit tenté de désigner le SEMC, la messagerie instantanée et les autres systèmes de messages textes instantanés les « technologies d’assistance par excellence » pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole, il n’existe pas de données concluantes à l’appui d’une telle déclaration.

Mais il fait peu de doute que les technologies de communication grand public, comme le SEMC, ont simplement et très rapidement surclassé les autres technologies d’assistance, pour un ensemble de raisons très évidentes qui se résument bien de la façon suivante :

« Il est logique qu’un si grand nombre de personnes sourdes aient adopté le SEMC comme voie de communication privilégiée partout dans le monde. Il s’agit d’une technologie textuelle, facile à utiliser, abordable et mobile. La fonction de vibration du combiné avertit l’utilisateur de la réception d’un message. Contrairement aux autres technologies conçues spécifiquement pour les personnes sourdes, comme les téléscripteurs, elle ne nécessite pas que chaque personne possède un équipement sur mesure ou utilise un intermédiaire coûteux, intrusif et qui demande beaucoup de temps pour traduire les messages transmis. »47

Le SEMC est l’application de données la plus populaire du monde : plus des trois quarts des utilisateurs de téléphones mobiles au monde envoient des messages textes. Son utilisation très répandue chez les personnes sourdes et chez celles qui ont d’autres déficiences auditives ou qui souffrent d’un trouble de la parole a d’ailleurs été prévue dès 2004, dans un rapport de recherche présenté à l’occasion d’une conférence universitaire en Australie.48 Depuis ce temps, les applications pour le SEMC et la messagerie instantanée se sont multipliées, les rendant facilement disponibles et relativement abordables pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole.

Bien que les chiffres ne soient pas disponibles pour le Canada et les États-Unis, 98 % des personnes sourdes et malentendantes du Royaume-Uni utilisent les messages textes SEMC, une pénétration du marché tellement complète que les services de police utilisent la messagerie texte comme méthode de signalement des crimes pour la communauté des personnes sourdes. (À ne pas confondre avec les rapports textuels d’urgence transmis au service 911, qui n’existent pas dans plusieurs pays.)49

Tandis que les SEMC sont limités à des messages de 160 caractères et, par conséquent, nécessitent l’utilisation importante d’abréviations, les applications de messages instantanés peuvent être des solutions de remplacement pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. Les avantages pour les utilisateurs sont, en un mot, énormes : « ils changent radicalement la vie de millions de personnes qui ne communiquent pas verbalement ».50

La nature omniprésente des dispositifs mobiles a également permis des prix concurrentiels, une facilité d’utilisation et la portabilité, et a facilité les communications internationales. En ce qui a trait aux prix, la communauté des personnes sourdes s’est longtemps opposée à la nécessité de payer pour des forfaits de téléphonie vocale alors qu’elle n’a jamais besoin de communications vocales. Aux États-Unis, différents fournisseurs ont consenti des forfaits de messagerie textuelle uniquement aux clients du service mobile ayant une déficience auditive.51

Au Canada, de manière générale, les fournisseurs de services sans fil n’offrent pas de forfaits de données seulement pour les téléphones intelligents; à la place, les services de données utilisés pour les messages textes sont offerts comme services complémentaires, ou pour des dispositifs comme les modems USB ou les tablettes. Les services voix sur IP comme Google Voice éliminent encore davantage la nécessité de forfaits voix grâce à des services comme la transcription de la messagerie vocale, sans frais pour les utilisateurs.52

De plus, la science de la messagerie instantanée continue de se développer grâce à de nouvelles applications présentant un avantage direct pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. Une des applications les plus percutantes – qui démontre la polyvalence de la technologie – est l’application « Pocket SMS » mise au point par un étudiant en génie pour la plateforme Android à l’intention expresse des personnes sourdes et aveugles. L’application convertit un texte SEMC en alphabet morse, que le téléphone affiche une lettre à la fois au moyen de la fonction de vibration.53

Des preuves anecdotiques révèlent que, de toutes les technologies examinées dans le présent rapport, les messages textes grand public, les SEMC et les autres messageries instantanées sont, et de loin, les plus disponibles et les plus adaptés pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole. Il s’agit de technologies ayant créé, de façon complètement non intentionnelle, des rampes d’accès électronique aux proportions phénoménales. Puisque ces technologies sont mises au point par les plus importants fabricants de logiciels du monde et par les développeurs d’applications les plus créatifs, cela signifie aussi qu’elles continueront d’évoluer en raison de la concurrence sur le marché et de leur très grande popularité auprès des consommateurs.

6) Développements et applications à venir

Il fait peu de doute que la technologie de conversion entre la langue des signes et le texte ou la parole présentée précédemment se développera rapidement au cours des 12 à 36 prochains mois. La société Technabling prévoit d’ailleurs lancer une application plus tard en 2013. Comme nous l’indiquons dans la conclusion de notre rapport, il s’agit d’une technologie à suivre et pour laquelle il faut évaluer la réaction des utilisateurs quant à son utilité et quant au rôle qu’elle jouerait dans l’ensemble des technologies mises à la disposition des personnes ayant une déficience auditive ou souffrant d’un trouble de la parole.

Différentes autres technologies et applications font l’objet de discussions en vue de leur développement, sont aux premiers stades de développement ou sont reportées en raison d’un manque de financement, de l’absence de la technologie nécessaire ou du manque d’intérêt quant à leur éventuelle popularité auprès des consommateurs.

En guise de conclusion sur l’état actuel et le développement des technologies de communication de remplacement, les spécialistes de ce domaine que nous avons consultés pour la vérification font deux observations très importantes.

D’abord, « l’écosystème pour ces technologies foisonne d’options ». Il existe plus de choix que jamais auparavant pour améliorer les communications des personnes ayant une déficience auditive ou souffrant d’un trouble de la parole – au point où cela peut devenir étourdissant pour certains utilisateurs. Il vaut la peine de rappeler que ce foisonnement d’options a créé une sorte de fossé numérique entre les utilisateurs technophiles et ceux qui ne le sont pas.

Deuxième observation, tout aussi importante : « les fonctions et les services d’accessibilité sont fortement sous-utilisés, même lorsqu’ils sont gratuits. Les utilisateurs ne sont pas assez informés et manquent de confiance – ils ne savent pas ce qui fonctionnera ni par où commencer ». En d’autres termes, le fait de mettre l’information en pratique peut constituer un obstacle à l’utilisation des technologies maintenant disponibles, et il est essentiel de régler ce problème.

Une partie de la solution consiste à trouver une source servant de « guichet unique » – pas tellement pour l’achat de produits, mais pour trouver « ce qui existe et comment cela peut être utile pour moi ». Il peut s’agir de bases de données, comme la Global Accessibility Reporting Initiative, la FCC Accessibility Clearinghouse ou un consortium européen de fournisseurs d’information à la recherche de solutions coordonnées. La Global Accessibility Reporting Initiative, un projet conçu pour aider les consommateurs à se renseigner sur les fonctions d’accessibilité des appareils mobiles et à trouver les fonctions qui leur sont les plus utiles, compte sur la participation de l’Association canadienne des télécommunications sans fil.59

Partie III – Recommandations pour assurer le suivi des technologies de communication de remplacement et grille sommaire de la vérification des technologies d’assistance

Nous formulons trois recommandations pour assurer le suivi continu des technologies de communication de remplacement :

Bien qu’une vérification et un examen des technologies de compression vidéo permettant de porter son attention sur des applications comme Skype, Google Hangout ou VRS dépassent la portée du présent rapport, les technologies de compression vidéo doivent aussi faire l’objet d’un suivi, compte tenu de leur importance pour les utilisateurs et de l’utilisation plus efficace de la largeur de bande que les développements futurs pourraient entraîner.

Une grille sommaire de notre rapport est présentée dans les pages qui suivent.

 

Grille sommaire – Technologies de communication de remplacement pour les personnes sourdeset les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole

Technologie, description, objet Cycle du produit
et stade de développement
Avantages pour les utilisateurs Obstacles à l’adoption Faisabilité Intégration aux autres applications et plateformes Incidence sur les utilisateurs
CapTel Entièrement conçu aux États-Unis; pas encore arrivé au Canada. Le système subventionné aux É.-U. est très abordable. Plus rapide que les téléscripteurs, mais essentiellement le même système. Aucun mandat législatif pour obtenir du financement; le logiciel de reconnaissance vocale a des limites. Moins pertinent en raison de la présence des SEMC, de la messagerie instantanée et d’autres applications grand public. Offert aux États-Unis par l’intermédiaire de WebCapTel. Positive compte tenu du coût restreint pour les utilisateurs, mais surclassé par d’autres options au Canada.
Relais par IP Lancé au Canada en 2011. Service de relais par Internet, aucuns frais supplémentaires, mais connexion haute vitesse nécessaire. Lorsqu’elle est utilisée, la technologie de reconnaissance vocale a des limites; l’accès au service 911 peut être complexe; la fraude a présenté un problème (États-Unis). Tout à fait réalisable, quoique la fiabilité de la précision de la reconnaissance de la voix procure des niveaux de service variables. Fonctionne bien avec des appareils, des plateformes et des programmes multiples; la nature textuelle du service utilise une faible largeur de bande. Ajout important aux communications textuelles qui convient tout à fait à la plateforme mobile, car il utilise une faible largeur de bande.
Conversion parole-texte Largement utilisé pour les services CapTel et de relais par IP et pour d’autres applications, mais le logiciel est constamment mis à niveau avec de nouvelles versions. Avec un fort degré de précision, les avantages sont indéniables, mais la précision demeure un problème. Exactitude douteuse; la conversion texte est secondaire par rapport à la vidéo et à la conversion langue des signes-texte. Plus le taux de précision est bon et élevé, meilleure est la faisabilité de l’application. Utilisations multiples pour toutes les plateformes; permet les services de transcription, donne accès à davantage d’applications grand public. Un déclencheur pour un nombre imposant d’applications et d’utilisations, qui peuvent décourager les utilisateurs et créer un fossé numérique.
Conversion langue des signes-parole/texte Aux premiers stades; signes de développement rapide (mais promotion excessive possible, faire preuve de prudence); la première application devrait être offerte au public d’ici la fin de 2013; étendue de la fonctionnalité à déterminer, mais assez prometteuse. Importants; permet la communication par langue des signes avec des personnes qui ne l’utilisent pas; répercussions dans les domaines de l’éducation et du travail; personnalisable. Certains prototypes s’intéressent à la conversion langue des signes-parole qui est perçue comme étant plus complexe que les applications de conversion langue des signes-texte. Présentée comme une application à faible coût offrant un degré élevé de précision et d’uniformité. Une fonction personnalisée est essentielle.

Sera disponible pour la plupart des plateformes, bien qu’on ne prévoit pas qu’elle le soit dans l’immédiat pour les iPhone ou les iPad.

Intégration possible avec d’autres applications (Skype, Google Hangout). Cependant, la technologie nécessiterait des améliorations importantes avant d’atteindre ce niveau de fonctionnalité.

Intérêt marqué des utilisateurs pour cette technologie en raison de son incidence possible sur leur vie quotidienne.
Technologie grand public adaptée, p. ex. SEMC Très grande popularité auprès des personnes ayant une déficience auditive et souffrant de troubles de la parole; rapide, abordable, omniprésente. Le coût et l’absence d’un forfait pour les données seulement lorsque les forfaits pour la téléphonie vocale ne sont pas nécessaires peuvent constituer des obstacles; mais pleinement réalisable. Choix énorme, même ahurissant; mais son effet a changé des vies.

 

Annexe A

Ressources

Accessibilitesansfil.ca, http://wirelessaccessibility.ca/francais/.

Age and Disability Resource Center, AbleData, « Sign Voice Language Translator », http://bexar.tx.networkofcare.org/aging/assistive/assistive_devices.aspx?pageid=19327&top=15112&ksectionid=0&productid=199323&trail=22,13436&discontinued=0.

Article Myriad, « How long does it take to train speech recognition programs like Dragon or Vista? », affiché le 16 janvier 2012, www.articlemyriad.com/long-train-speech-recognition-programs-dragon-vista/.

BGR.com, 12 mars 2012, www.bgr.com/2012/03/12/new-microsoft-software-can-translate-voices-into-foreign-languages/, et Google.com, https://play.google.com/store/apps/details?id=com.smartmobilesoftware.voicetranslatorfree&hl=en.

Bulk SMS.com, www.bulksms.com/int/w/BulkSMS_SMS-improves-communications-for-the-Deaf.htm.

CapTel Captioned Telephone, « How CapTel Works », www.captel.com/how-it-works.php.

CapTel, « How voice recognition errors affect captions », www.captel.com/customer_service/kb/index.php/article/voice-recognition-errors.

CapTel, « Responding to Captioned Telephone Calls, 911, PSAP », www.captel.com/911psaps.php.

CRTC, « Services de relais téléphonique pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole », www.crtc.gc.ca/fra/info_sht/t1038.htm.

Disabled World (2009), « Text Phones for the Deaf », www.disabled-world.com/assistivedevices/hearing/text-phones.php.

European Assistive Technology Information Network, www.eastin.eu/en-GB/searches/products/index.

FCC Clearinghouse, http://apps.fcc.gov/accessibilityclearinghouse/, et FCC Consumer Advisory, « Doing Business Using IP Relay », http://transition.fcc.gov/cgb/consumerfacts/iprelayfraud.pdf.

Federal Communications Commission, Internet Protocol Relay Service, www.fcc.gov/guides/internet-protocol-ip-relay-service.

Geek.com, « Nintendo DS gets voice recognition and cloud storage for education », 12 janvier 2012, www.geek.com/articles/games/nintendo-ds-gets-voice-recognition-and-cloud-storage-for-teaching-20120131/.

Geek.com, 25 mars 2009, « Necklace turns sign language into speech », www.geek.com/articles/gadgets/necklace-turns-sign-language-into-speech-20090325/.

Global Accessibility Reporting Initiative, www.mobileaccessibility.info/.

Gouvernement du Canada (2010), Ressources humaines et Développement des compétences Canada, Rapport fédéral de 2010 sur les personnes handicapées, http://www.rhdcc.gc.ca/fra/condition_personnes_handicapees/rapports/rhf/2010/page07.shtml.

Hearing Loss Association of America, « FCC issues report and order to curb IP Relay fraud », 3 juillet 2012, www.hearingloss.org/content/fcc-issues-report-and-order-curb-ip-relay-fraud.

High Speed Experts, 20 juillet 2012, « AT&T to end analog landline phone services? », www.highspeedexperts.com/att-ending-pots/.

IBM, Extreme Blue and the SiSi Team, www-03.ibm.com/press/us/en/pressrelease/22316.wss.

Innovate U.K. SBRI Programme, « Spotlight on a project », www.innovateuk.org/_assets/pdf/case%20studies/technabling.pdf.

iTunes, « Voice Dictation to SMS », http://itunes.apple.com/us/app/voice-dictation-voice-to-sms/id492594590?mt=8.

Microsoft Support, « Xbox 360 + Kinect Voice Commands », pour consulter un menu d’options de reconnaissance de la parole, http://support.xbox.com/en-US/kinect/voice/control-your-xbox-360-with-your-voice.

Mobile Syrup: mobile news and reviews for Canadians, 30 août 2011, « Why no data-only plans for smartphones? », http://mobilesyrup.com/forum/showthread.php?t=17454.

National Association of the Deaf (2012), « NAD Comments on the Importance of IP Relay », www.nad.org/news/2012/3/nad-comments-importance-ip-relay. Le SRV nécessite une connexion haute vitesse au réseau Internet compte tenu de la technologie de compression vidéo utilisée.

National Association of the Deaf, www.nad.org/news/2012/3/nad-comments-importance-ip-relay.

National Institute on Deafness and Other Communication Disorders, www.nidcd.nih.gov/health/hearing/Pages/Assistive-Devices.aspx.

Open Sign, www.opensign.org/index.php?option=com_zoo&view=category&Itemid=21.

Power, D., M.R. Power, and L. Horstmanshof (2005), « Deaf people’s use of SMS and other text-based communication: a brave new world », rapport présenté à la conférence Communication at work: showcasing communication scholarship: Annual Meeting of the Australia New Zealand Communication Association, Christchurch, Nouvelle-Zélande, du 4 au 7 juillet 2005.

Schindler, Christine (2011), « Text Messaging: more than just an add-on to cell phone plans », Adaptive Technology Center for New Jersey Colleges, www.tcnj.edu/~technj/2003/testmessaging.htm.

SNOW (2012), Inclusive Design Centre, Ontario College of Art and Design, « Questions to consider when choosing Voice Recognition Software », www.snow.idrc.ocad.ca/content/voice-recognition-speech-text-software.

Squidoo.com (2012), « Text-only Plans », www.squidoo.com/text-only-plans.

Technabling, site Web de Portable Sign Language Translator, www.pslt.org/info.

Text Crunch, 9 juillet 2012, « Ukrainian students develop gloves that translate sign language to speech », http://techcrunch.com/2012/07/09/enable-talk-imagine-cup/.

The Daily Telegraph, 12 mars 2012, citant M. Ernesto Compatangelo, www.telegraph.co.uk/science/science-news/9134827/Sign-language-program-converts-hand-movements-into-text.html.

The Daily Times, 24 mars 2012, « Text messages provide deaf with new means of communication », www.daily-times.com/ci_20245436/text-messages-provide-deaf-new-means-communication.

U.K. Council on Deafness, 11 mai 2012, « A call to industry to engage on the next generation of relay services », http://deafcouncil.org.uk/news/2012/05/11/393/.

Université de Hambourg (Allemagne), HamNoSys, www.sign-lang.uni-hamburg.de/dgs-korpus/index.php/hamnosys-97.html.

Vocapia, www.vocapia.com/glossary.html#lm.

Vocapia Solutions, « How it Works », www.vocapia.com/.

YouTube, « SMS for those both Deaf and Blind », www.youtube.com/watch?v=_jisK0N7JF4.

Annexe B

Auteur du rapport

Le présent rapport a été préparé et rédigé par Richard Cavanagh, associé chez CONNECTUS Consulting Inc. M. Cavanagh possède plus de 20 ans d’expérience en recherche et en analyse dans les secteurs des communications au Canada, et il s’intéresse particulièrement aux questions de politique sociale et d’accessibilité. Il a récemment mené une étude sur l’évolution de la technologie dans les secteurs de la radiodiffusion et des télécommunications.

M. Cavanagh est titulaire d’un doctorat en sciences sociales de l’Université Carleton et d’une maîtrise en sociologie de l’Université Queen’s.

CONNECTUS Consulting Inc.

251, avenue Loretta Sud

Ottawa (Ontario) K1S 4P6

613-729-8892

Richard@connectusinc.ca


[1] Les techniques de compression vidéo comprennent le service de relais vidéo et Skype. Aux fins du rapport, le mot « technologie » est un mot passe-partout désignant les appareils, les applications, les logiciels et autres éléments dans une chaîne de production qui procurent l’accessibilité aux utilisateurs.

[2] Les rampes d’accès – abaissement des bordures de trottoirs vers la chaussée – ont été aménagées à l’origine pour les fauteuils roulants, mais elles présentent un grand nombre d’avantages non prévus initialement, p. ex. pour les poussettes, les jeunes enfants, les autres appareils sur roues, les personnes avec des déambulateurs, etc. « Rampe d’accès électronique » est l’expression utilisée pour désigner les retombées non prévues, mais avantageuses, de services comme l’envoi de messages textes. Ainsi, bien que le service d’envoi de messages textes n’ait pas été conçu spécifiquement pour les personnes handicapées, il est largement utilisé par les personnes sourdes, malentendantes ou ayant un trouble de la parole.

[3] Traduit du site Web du National Institute on Deafness and Other Communication Disorders, 2011, « What are assistive devices? », www.nidcd.nih.gov/health/hearing/Pages/Assistive-Devices.aspx.

[4] Ibidem.

[5] Voir dans Disabled World (2009), « Text Phones for the Deaf » (www.disabled-world.com/assistivedevices/hearing/text-phones.php) où l’on peut lire une discussion approfondie sur les fonctions des ATS.

[6] Autre façon d’expliquer les services PSI et ESI : si une personne peut parler clairement, mais doit utiliser un ATS pour lire ce que dit son interlocuteur, elle doit demander le service PSI au fournisseur de services. Une personne peut ainsi lui parler, tandis qu’un téléphoniste tape ce qu’elle lui dit.

Si une personne peut entendre, mais doit utiliser un ATS pour taper ce qu’elle veut dire, elle doit demander le service Entendre sans intervention (ESI) au fournisseur de services. Une personne peut ainsi entendre ce que lui dit son interlocuteur, tandis qu’un téléphoniste lui lit à haute voix le texte entré.

[7] CapTel Captioned Telephone, « How CapTel Works », www.captel.com/how-it-works.php.

[8] CapTel a été abandonné au Royaume-Uni en 2008 en raison du manque de popularité auprès des consommateurs. Le Council on Deafness de ce pays a demandé récemment que ce service soit restauré. Voir http://deafcouncil.org.uk/news/2012/05/11/393/.

[9] Discussions avec un ancien gestionnaire pour le développement des produits chez TELUS et avec un spécialiste américain de l’accessibilité.

[10] Voir CapTel, « How voice recognition errors affect captions », www.captel.com/customer_service/kb/index.php/article/voice-recognition-errors.

[11] CapTel, « Responding to Captioned Telephone Calls, 911, PSAP », www.captel.com/911psaps.php.

[12] Voir Gouvernement du Canada (2010), Ressources humaines et Développement des compétences Canada : Rapport fédéral de 2010 sur les personnes handicapées, www.rhdcc.gc.ca/fra/condition_personnes_handicapees/rapports/rhf/2010/page07.shtml. À titre d’exemple, ce rapport révèle que les personnes handicapées de 25 à 54 ans courent deux fois plus de risque, et même plus, de vivre sous le seuil de faible revenu après impôt.

[13] Les discussions se poursuivent aux États-Unis relativement à l’élimination graduelle des RTCP, ou services de téléphonie classiques, qui seraient remplacés par des services entièrement numériques/sur IP. AT&T a présenté une demande officielle à la FCC pour mettre fin à tous les services téléphoniques filaires analogiques. Voir High Speed Experts, 20 juillet 2012, www.highspeedexperts.com/att-ending-pots/.

[14] La seule approximation du nombre de téléphones à sous-titrage utilisés en 2008 est fournie par CapTel; voir CapTel, « Responding to Captioned Telephone Calls, 911, PSAP », www.captel.com/911psaps.php.

[15] CRTC, « Services de relais téléphonique pour les personnes ayant une déficience auditive ou souffrant d’un trouble de la parole », www.crtc.gc.ca/fra/info_sht/t1038.htm. Pour une description plus détaillée du service de relais par IP, voir le document de la Federal Communications Commission intitulé « Internet Protocol Relay Service », www.fcc.gov/guides/internet-protocol-ip-relay-service.

[16] National Association of the Deaf (2012), « NAD Comments on the Importance of IP Relay », www.nad.org/news/2012/3/nad-comments-importance-ip-relay. Le SRV nécessite une connexion haute vitesse au réseau Internet compte tenu de la technologie de compression vidéo utilisée.

[17] Discussion avec un grand spécialiste américain sur les dispositifs de communication accessibles.

[18] FCC Consumer Advisory "Doing Business Using IP Relay", http://transition.fcc.gov/cgb/consumerfacts/iprelayfraud.pdf.

[19] La FCC estime que les cas d’utilisation du service de relais par IP pour faire des appels à partir de pays étrangers vers les États-Unis afin de frauder des entreprises et des particuliers constituent un problème grave. Ce problème a été exacerbé en raison des inscriptions temporaires accordées aux utilisateurs avant qu’il soit possible de vérifier s’ils avaient le droit d’utiliser le système. Voir National Association of the Deaf, www.nad.org/news/2012/3/nad-comments-importance-ip-relay.

[20] Voir Hearing Loss Association of America, « FCC issues report and order to curb IP Relay fraud », 3 juillet 2012, www.hearingloss.org/content/fcc-issues-report-and-order-curb-ip-relay-fraud.

[21] Les fournisseurs de services de relais par IP au Canada utilisent un logiciel de reconnaissance vocale pour assurer la conversion parole-texte.

[22] Examen des pages Web sur les relais par IP des fournisseurs canadiens de services (Bell, TELUS, MTS, Norouestel, Rogers, Cogeco, Shaw, Bell Aliant et Vidéotron).

[23] Vocapia, un concepteur de logiciels de reconnaissance de la parole, a mis au point un glossaire de la terminologie utile pour les logiciels de conversion parole-texte. Voir www.vocapia.com/glossary.html#lm (en anglais).

[24] Article Myriad, « How long does it take to train speech recognition programs like Dragon or Vista? », affiché le 16 janvier 2012, www.articlemyriad.com/long-train-speech-recognition-programs-dragon-vista/.

[25] SNOW (2012), Inclusive Design Centre, Ontario College of Art and Design, « Questions to consider when choosing Voice Recognition Software », www.snow.idrc.ocad.ca/content/voice-recognition-speech-text-software.

[26] Vocapia Solutions, « How it Works », www.vocapia.com/.

[27] iTunes, « Voice Dictation to SMS », http://itunes.apple.com/us/app/voice-dictation-voice-to-sms/id492594590?mt=8.

[28] Voir par exemple « Xbox 360 + Utiliser les commandes vocales Kinect » pour consulter un menu d’options de reconnaissance de la parole, http://support.xbox.com/en-US/kinect/voice/control-your-xbox-360-with-your-voice.

[29] Geek.com, « Nintendo DS gets voice recognition and cloud storage for education », 12 janvier 2012, www.geek.com/articles/games/nintendo-ds-gets-voice-recognition-and-cloud-storage-for-teaching-20120131/.

[30] Innovate U.K. SBRI Programme, « Spotlight on a project », www.innovateuk.org/_assets/pdf/case%20studies/technabling.pdf.

[31] Les résumés des projets sont disponibles sur le site Open Sign, www.opensign.org/index.php?option=com_zoo&view=category&Itemid=21.

[32] Ibidem.

[33] IBM, Extreme Blue and the SiSi Team, www-03.ibm.com/press/us/en/pressrelease/22316.wss; Université de Hambourg (Allemagne), HamNoSys, /www.sign-lang.uni-hamburg.de/dgs-korpus/index.php/hamnosys-97.html.

[34] Open Sign, op. cit.

[35] Text Crunch, 9 juillet 2012, « Ukrainian students develop gloves that translate sign language to speech », http://techcrunch.com/2012/07/09/enable-talk-imagine-cup/.

[36] Ibidem.

[37] The Daily Telegraph, 12 mars 2012, citant M. Ernesto Compatangelo,www.telegraph.co.uk/science/science-news/9134827/Sign-language-program-converts-hand-movements-into-text.html.

[38] Technabling, site Web de Portable Sign Language Translator, www.pslt.org/info.

[39] Ibidem.

[40] The Daily Telegraph, 12 mars 2012.

[41] Technabling, site Web de Portable Sign Language Translator, www.pslt.org/info.

[42] Ibidem.

[43] Technabling, site Web de Portable Sign Language Translator, www.pslt.org/info.

[44] Geek.com, 25 mars 2009, « Necklace turns sign language into speech », www.geek.com/articles/gadgets/necklace-turns-sign-language-into-speech-20090325/.

[45] Age and Disability Resource Center, AbleData, « Sign Voice Language Translator », http://bexar.tx.networkofcare.org/aging/assistive/assistive_devices.aspx?pageid=19327&top=15112&ksectionid=0&productid=199323&trail=22,13436&discontinued=0.

[46] BGR.com, 12 mars 2012, www.bgr.com/2012/03/12/new-microsoft-software-can-translate-voices-into-foreign-languages/, et Google.com, https://play.google.com/store/apps/details?id=com.smartmobilesoftware.voicetranslatorfree&hl=en.

[47] Bulk SMS.com, www.bulksms.com/int/w/BulkSMS_SMS-improves-communications-for-the-Deaf.htm.

[48] Power, D., M.R. Power et L. Horstmanshof (2005), « Deaf people’s use of SMS and other text-based communication: a brave new world »; rapport présenté à la conférence Communication at work: showcasing communication scholarship: Annual Meeting of the Australia New Zealand Communication Association, Christchurch, Nouvelle-Zélande, du 4 au 7 juillet 2005.

[49] Schindler, Christine (2011), « Text Messaging: more than just an add-on to cell phone plans », Adaptive Technology Center for New Jersey Colleges, www.tcnj.edu/~technj/2003/testmessaging.htm.

[50] The Daily Times, 24 mars 2012, « Text messages provide deaf with new means of communication », www.daily-times.com/ci_20245436/text-messages-provide-deaf-new-means-communication.

[51] Squidoo.com (2012), « Text-only Plans », www.squidoo.com/text-only-plans.

[52] Mobile Syrup: mobile news and reviews for Canadians, 30 août 2011, « Why no data-only plans for smartphones? », http://mobilesyrup.com/forum/showthread.php?t=17454.

[53] Voir sur YouTube, « SMS for those both Deaf and Blind », www.youtube.com/watch?v=_jisK0N7JF4.

[54] National Institute on Deafness and Other Communication Disorders, www.nidcd.nih.gov/health/hearing/Pages/Assistive-Devices.aspx.

[55] Ibidem.

[56] Discussion avec un spécialiste américain en infrastructure d’accessibilité. Voir aussi le site Web de la Global Public Inclusive Infrastructure, http://gpii.net.

[57] Discussion avec un spécialiste américain en développement des dispositifs d’assistance. La référence à l’externalisation ouverte par Amara peut être consultée à l’adresse www.universalsubtitles.org/en/, et l’information sur AssistMeLive à l’adresse http://beta.assistmelive.com/login.

[58] National Institute on Deafness and Other Communication Disorders, www.nidcd.nih.gov/health/hearing/Pages/Assistive-Devices.aspx.

[59] Voir Global Accessibility Reporting Initiative (www.mobileaccessibility.info/), FCC Clearinghouse (http://apps.fcc.gov/accessibilityclearinghouse/) et European Assistive Technology Information Network (www.eastin.eu/en-GB/searches/products/index). Voir aussi accessibilitésansfil.ca à http://wirelessaccessibility.ca/francais/.

Date de modification :