From ff6f36dcb14cf43f5c9b93ce8e3871db8dafef25 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Georges=20Dup=C3=A9ron?= Date: Fri, 16 Dec 2011 13:21:36 +0100 Subject: [PATCH 1/4] Langue des signe. --- rapport/rapport.tex | 55 ++++++++++++++++++++++++++++++++++++++++----- 1 file changed, 50 insertions(+), 5 deletions(-) diff --git a/rapport/rapport.tex b/rapport/rapport.tex index 04717a8..d920764 100644 --- a/rapport/rapport.tex +++ b/rapport/rapport.tex @@ -259,15 +259,60 @@ donc les symboles sans qu'il y ait besoin d'analyser tout le flux précédent. C pour le Morse, très faible. \subsubsection{La langue des signes} -Très court hitorique et but. +Les différentes langues des signes ont été créées pour permettre la +communication entre personnes muettes et malentendantes. Elle permet +aussi à ces personnes de dialoguer avec les entendants qui ont appris +leur langue des signes. -LSF : encodage des lettres, mais aussi sens. Aussi difficile à apprendre qu'une nouvelle langue. +La Langue des Signes Française (LSF) permet entre autres l'encodage +des lettres (on peut épeller un mot français en LSF), mais comme ce ne +serait vraiment pas pratique d'épeller une conversation entière, la +LSF possède un grand nombre de signes permettant d'exprimer la plupart +des concepts que la langue française sait exprimer, et les relations +entre ces concepts. La Langue des Signes Française est donc aussi +expressive que les langues parlées. -Beaucoup d'ambigüité sur les signes, dans la direction, la vitesse… +Elle se présente comme un «système d'écriture» basé sur des +pictogrammes et idéogrammes, car beaucoup de signes sont une sorte de +mime du concept concret qu'ils expriment, et les autres signes +suffisent à eux seuls à représenter un mot entier. -Ordis peuvent le parler (Projet IBM), mais difficile à comprendre. +La LSF est aussi difficile à apprendre qu'une langue parlée, mais elle +est déjà parlée par un grand nombre de muets, sourds et malentendants. -Aussi expressif que langue naturelle. +Elle présente beaucoup d'ambigüité sur la sémantique des signes (son +vocabulaire), qui peut varier en fonction de la direction ou la +vitesse. + +La grammaire et la syntaxe de la LSF sont différentes de celle du +français (lorsqu'on utilise les signes mais en utilisant l'ordre des +mots du français, on parle de «français signé»). On peut parfois +composer plusieurs signes simultanément pour exprimer directement une +relation entre ces deux signes, par exemple les expressions du visage +sont souvent utilisées pour exprimer une émotion en même temps qu'un +autre signe. + +Un projet, nommé SiSi (Say It Sign It\footnote{Dites-le, signez-le}), +a été lancé par IBM visant à offrir une traduction voix vers langue +des signes. Les machines peuvent donc signer, mais cette langue semble +difficile à interpréter pour une machine, principalement à cause de la +difficulté à comprendre quel signe est effectué à partir d'un flux +d'images. + +Les langues des signes sont donc des protocoles de communication +adaptés à un groupe d'individus, les sourds, malentendants et muets, +mais peu utilisés par les autres personnes. Leur apprentissage +nécessite un assez grand effort, bien que le résultat soit très +intéressant (il permet de communiquer avec une partie de la population +qui est par ailleurs plutôt exclue de la communication entre +humains). Les langues des signes disposent d'une grande expressivité, +mais sont au moins aussi ambigus que les langues parlées, voire +plus. Leur compréhension par la machine est assez difficile, mais leur +expression est possible (et déjà réalisée dans le cadre du projet +SiSi). Leur utilisation en tant que protocole de communication entre +l'homme et la machine n'a pas grand intérêt, par contre, leur +compréhension par la machine à des fins éducatives ou de traduction +est très prometteuse. \section{Langages spécifiques à un domaine} \subsection{Documents techniques et formules mathémathiques} From 8e1c718465a14295be5b57947c8abf18f81a7b6e Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Georges=20Dup=C3=A9ron?= Date: Fri, 16 Dec 2011 13:47:54 +0100 Subject: [PATCH 2/4] Corrections sur le morse. --- rapport/rapport.tex | 86 +++++++++++++++++++++++++-------------------- 1 file changed, 48 insertions(+), 38 deletions(-) diff --git a/rapport/rapport.tex b/rapport/rapport.tex index d920764..93f9c82 100644 --- a/rapport/rapport.tex +++ b/rapport/rapport.tex @@ -205,58 +205,68 @@ perdre beaucoup en expressivité. \section{Alphabets et logogrammes} -% Différences entre alphabets et les idéogrammes & co. Expliquer brièvement leurs propriétés. -\subsection{L'alphabet} +% Différences entre alphabets, idéogrammes…. Expliquer brièvement leurs propriétés. -% \subsubsection{Ses origines} -% \subsubsection{Dans quel but} -% \subsubsection{Des exemples} - -\subsection{idéogrammes} -\subsection{etc.} - -% TODO : titre pourri ! -\subsection{Représentations} +\subsection{Alphabets, phonogrammes et syllabaires} +\subsection{Idéogrammes et pictogrammes} +\subsection{Codages et systèmes d'écriture} \subsubsection{Le morse} Le code Morse est généralement attribué à Samuel Morse. Ce code à été inventé pour la télégraphie en 1835. Il consiste en une série d'impulsions. Les lettres, chiffres et signes de ponctuation sont représenté par des séries d'impulsions. Seulement deux types d'impulsions son nécessaires pour tout coder, une impulsion courrte que l'on appelle généralement "Point" et une impulsion longue appellée "Trait". -Ce protocole est facile à apprendre pour les humains (une liste de quelques séries d'impulsions à associer à chaque lettre), mais il est -difficile à utiliser pour l'écriture, et encore plus désagréable pour la lecture (si on rate une impulsion, les impulsions suivantes -risquent de former des symboles valides, mais différents de ceux du message d'origine). Bien qu'il ait été utilisé pour la communication -entre humains, il s'agit réellement d'une forme de communication primitive avec une machine qui transmettait l'information à une autre via -une ligne télégraphique ou par ondes radio. +Ce protocole est facile à apprendre pour les humains (une liste de +quelques séries d'impulsions à associer à chaque lettre), mais il est +difficile à utiliser. Bien qu'il ait été utilisé pour la communication +entre humains par l'intermédiaire d'une machine, il s'agit réellement +d'une forme de communication primitive avec cette machine, qui +transmettait l'information à une autre via une ligne télégraphique ou +par ondes radio. -Ce protocole de communication possède un vocabulaire très restreint (le point et le trait, soit un bit, qui assemblés forment les lettres de -l'alphabet, chiffres et ponctuation). Il n'y a pas à proprement parler de grammaire ni de syntaxe, mis à part que l'assemblage des points et -des traits fait émerger des symboles plus «gros» (lettres, chiffres et ponctuation). Il est donc très facile à comprendre pour une machine, -car il suffit de transcrire les points et traits en bits 0 et 1, et un simple automate à états finis permettra de décoder ces séquences de -bits en une suite de lettres. +Ce protocole de communication possède un vocabulaire très restreint +(le point et le trait, soit un bit, qui assemblés forment les lettres +de l'alphabet, chiffres et ponctuation). Il n'y a pas à proprement +parler de grammaire ni de syntaxe, mis à part que l'assemblage des +points et des traits fait émerger des symboles plus «gros» (lettres, +chiffres et ponctuation, puis des mots), que l'on sépare par des +espaces (ou silences). Il est donc très facile à comprendre pour une +machine, car il suffit de transcrire les points et traits en bits 0 et +1, et un simple automate à états finis permettra de décoder ces +séquences de bits en une suite de lettres. -Cependant, cette compréhensions s'arrêtrera à une suite de symboles sans sémantique, car le morse possède une très faible expressivité~: Il -s'agit simplement d'un encodage de l'alphabet, qui lui-même, comme vu précédemment, nécessite un protocole de plus haut niveau (une langue, -un langage de programmation…) pour transmettre un message sémantique. Son expressivité est donc comparable à celle du braille (voir -ci-dessous), voire inférieure car le braille délimite naturellement les symboles, alors que le morse n'apporte pas cette information (il -faut donc avoir la série d'impulsions depuis le début, ou bien détecter des séquences invalides ou improbables pour trouver le début d'un -des symboles). +Cependant, cette compréhensions s'arrêtrera à une suite de symboles +sans sémantique, car le morse possède une très faible expressivité~: +Il s'agit simplement d'un encodage de l'alphabet, qui lui-même, comme +vu précédemment, nécessite un protocole de plus haut niveau (une +langue, un langage de programmation…) pour transmettre un message +sémantique. Son expressivité est donc comparable à celle du braille +(voir ci-dessous). -Les militaires ont utilisé ce code pour effectuer des transmission codées, et même si un spectre de fréquence radio et toujours réservé pour -les sueles émission en morse, il s'agit réellement de la couche physique de la communication selon le modèle OSI, soit la couche la plus -basse. Ce code n'apporte pas de grand intérêt en terme de communication homme-machine~: difficile à manipuler pour les humains, un -vocabulaire très restreint et par conséquent une expressivité faible. +Les militaires ont utilisé ce code pour effectuer des transmission +codées, et même si un spectre de fréquence radio et toujours réservé +pour les seules émission en morse, il s'agit réellement de la couche +physique de la communication selon le modèle OSI, soit la couche la +plus basse. Ce code n'apporte pas de grand intérêt en terme de +communication homme-machine~: difficile à manipuler pour les humains, +un vocabulaire très restreint (juste des symboles) et par conséquent +une expressivité faible. \subsubsection{Le braille} -Le braille est une manière de représenter l'alphabet. il consiste en une représentation en relief de l'ensemble des lettres, chiffres, -ponctuation, et autres symboles en relief. Il a été étudié pour permettre la lecture simplement avec les doigts. Le braille a été mis au -point par Louis Braille en 1824 et reste aujourd'hui après une série de réformes et normalisations toujourstrès utilisé. +Le braille est une manière de représenter l'alphabet. il consiste en +une représentation en relief de l'ensemble des lettres, chiffres, +ponctuation, et autres symboles en relief. Il a été étudié pour +permettre la lecture simplement avec les doigts. Le braille a été mis +au point par Louis Braille en 1824 et reste aujourd'hui après une +série de réformes et normalisations toujourstrès utilisé. -Ce protocole est assez facile à apprendre, bien qu'il faille une certaine habitude pour lire le braille avec les doigts. Ce code est un peu -plus expressif que le code Morse vu précédement puisqu'il permet de représenter la majorité est symboles par une seule cellule, et délimite -donc les symboles sans qu'il y ait besoin d'analyser tout le flux précédent. Cependant l'utilité dans l'échange homme-machine reste, comme -pour le Morse, très faible. +Ce protocole est assez facile à apprendre, bien qu'il faille une +certaine habitude pour lire le braille avec les doigts. Son utilité +dans l'échange homme-machine reste, comme pour le Morse, très faible, +et seuls les malvoyants et aveugles ont un intérêt à l'utilisera pour +saisir ou lire du texte sur une plage braille, comme on utiliserait un +clavier et un écran. \subsubsection{La langue des signes} Les différentes langues des signes ont été créées pour permettre la From a28d62d3668a597df86633d8552fe4d41c6fb98e Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Georges=20Dup=C3=A9ron?= Date: Fri, 16 Dec 2011 15:17:00 +0100 Subject: [PATCH 3/4] =?UTF-8?q?Ajout=20d'un=20sch=C3=A9ma=20pas=20complet?= =?UTF-8?q?=20et=20quelques=20modifications.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- rapport/rapport.tex | 59 +++++++++++++++++++++++++++++++++++++++------ 1 file changed, 51 insertions(+), 8 deletions(-) diff --git a/rapport/rapport.tex b/rapport/rapport.tex index 93f9c82..83ca069 100644 --- a/rapport/rapport.tex +++ b/rapport/rapport.tex @@ -2,6 +2,8 @@ \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} \usepackage[frenchb]{babel} +\usepackage{tikz} +\usetikzlibrary{shapes,positioning,snakes,calc,chains} \usepackage{hyperref} \hypersetup{% colorlinks,% @@ -203,19 +205,22 @@ contraintes sur la syntaxe (et le vocabulaire, en fixant une sémantique précises pour les racines) pour le rendre moins ambigu sans perdre beaucoup en expressivité. -\section{Alphabets et logogrammes} +\section{Logogrammes} -% Différences entre alphabets, idéogrammes…. Expliquer brièvement leurs propriétés. +% Différences entre idéogrammes…. Expliquer brièvement leurs propriétés. -\subsection{Alphabets, phonogrammes et syllabaires} +\subsection{Phonogrammes et syllabaires} \subsection{Idéogrammes et pictogrammes} \subsection{Codages et systèmes d'écriture} \subsubsection{Le morse} -Le code Morse est généralement attribué à Samuel Morse. Ce code à été inventé pour la télégraphie en 1835. -Il consiste en une série d'impulsions. Les lettres, chiffres et signes de ponctuation sont représenté par des séries d'impulsions. -Seulement deux types d'impulsions son nécessaires pour tout coder, une impulsion courrte que l'on appelle généralement -"Point" et une impulsion longue appellée "Trait". +Le code Morse est généralement attribué à Samuel Morse. Ce code à été +inventé pour la télégraphie en 1835. Il consiste en une série +d'impulsions. Les lettres, chiffres et signes de ponctuation sont +représenté par des séries d'impulsions. Seulement deux types +d'impulsions son nécessaires pour tout coder, une impulsion courrte +que l'on appelle généralement "Point" et une impulsion longue appellée +"Trait". Ce protocole est facile à apprendre pour les humains (une liste de quelques séries d'impulsions à associer à chaque lettre), mais il est @@ -358,7 +363,45 @@ Expressivité forte, mais seulement dans le domaine. Exemples : BCL, … \section{Conclusion} -Graphique de comparaison des différents supports en terme d'expressivité et de formalisme. +\begin{figure}[h] + \centering + \begin{tikzpicture}[scale=0.5,node distance=0.5cm,font=\footnotesize] + \node at (12,10) {}; + \draw[->] (0,0) -- (11cm,0); + \draw[->] (0,0) -- (0,11cm); + \node[anchor=north] at (10cm,0) {Expressivité}; + \node[anchor=south,xshift=0.5cm] at (0,11cm) {Formalisme}; + + \node[fill=red, fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (mb) at (1cm,10cm) {}; + \node[right=of mb,text width=2cm] (mbtext) {Morse\\Braille}; + \draw[draw=red,draw opacity=0.5,thick] (mbtext.170) -- (mb); + + \node[fill=orange, fill opacity=0.5,ellipse,minimum width=1cm,minimum height=0.5cm,inner sep=1mm,rotate=-90] (sph) at (1cm,9.4cm) {}; + \node[anchor=west,at=(sph.30),xshift=1.5cm,yshift=-0.8cm,text width=2cm] (s) {Syllabaires\\Phonogrammes}; + \draw[draw=orange,draw opacity=0.5,thick] (s.170) -- (sph); + + \node[fill=yellow!80!black, fill opacity=0.5,ellipse,minimum width=3cm,minimum height=0.7cm,inner sep=1mm,rotate=-65] (ipi) at (2cm,8cm) {}; + \node[anchor=north,at=(ipi.south),yshift=-1.5cm,xshift=5mm,text width=2cm,text centered] (i) {Idéogrammes\\Pictogramme\\LSF}; + \draw[draw=yellow!80!black,draw opacity=0.5,thick] (i) -- (ipi.-15); + + \node[fill=green,fill opacity=0.5,ellipse,minimum width=2.8cm,minimum height=0.8cm,inner sep=1mm,rotate=-45] at (8.5cm,2.5cm) {Espéranto}; + \node[fill=blue, fill opacity=0.5,ellipse,minimum width=2.3cm,minimum height=0.7cm,inner sep=1mm,rotate=-20] at (8.5cm,1.5cm) {Français}; + + \node[fill=brown, fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (no) at (6cm,10cm) {}; + \node[right=of no,text width=2cm] (notext) {Notations}; + \draw[draw=brown,draw opacity=0.5,thick] (notext) -- (no); + + \node[fill=brown, fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (bcl) at (6cm,9cm) {}; + \node[right=of bcl,text width=2cm] (bcltext) {BCL}; + \draw[draw=brown,draw opacity=0.5,thick] (bcltext) -- (bcl); + + \draw[draw=black,line width=1mm,draw opacity=0.5] (0.2,10.8) -- (10.8,0.2); + \end{tikzpicture} + \caption{Comparaison de l'expressivité et du formalisme des différents protocoles.} +\end{figure} + +% TODO : même graphique pour expressivité vs. facilité +% d'apprentissage, et facilité d'apprentissage vs formalisme. Ouverture : une collection de langages spécifiques à un domaine : Un pour le déroulement global de la conversation, un ou plusieurs permettant de faire la liaison entre les concepts et relations exprimés dans différents protocoles, puis un pour chaque domaine pour lequel From eb1379f70a29d7e9957f11d095e516709f06d18f Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Georges=20Dup=C3=A9ron?= Date: Fri, 16 Dec 2011 23:20:42 +0100 Subject: [PATCH 4/4] Rapport de cognition, version finale. --- rapport/rapport.tex | 223 +++++++++++++++++++++++++++++++------------- 1 file changed, 160 insertions(+), 63 deletions(-) diff --git a/rapport/rapport.tex b/rapport/rapport.tex index 83ca069..b38a909 100644 --- a/rapport/rapport.tex +++ b/rapport/rapport.tex @@ -36,17 +36,17 @@ \section{Introduction} \subsection{Approche générale} Tout individu quel qu'il soit, privé de toutes formes de communication, -d'émotions et de sensations, ne peuvent en aucune manière évoluer et +d'émotions et de sensations, ne peut en aucune manière évoluer et former de groupes cohérents. L'intégrité et la cohérence d'un groupe -passe majoritairement par un échange d'informations entre les individus. +passent majoritairement par un échange d'informations entre les individus. Celles-ci ne peuvent pas être transmises n'importe comment, les individus constituant le groupe doivent être en mesure de les comprendre. -Le formatage de l'information devient essentiel tout comme le +Le formatage de l'information devient essentiel, tout comme le support qui va être utilisé pour la transmettre. -Au fil du temps les individus ont apris à échanger des idées et des +Au fil du temps les individus ont appris à échanger des idées et des concepts de diverses manières. Que ce soit par le biais de gestes, de -dessin, de rictus ou bien d'autre, les hommes ont petit à petit mis en +dessin, de rictus ou bien d'autres, les hommes ont petit à petit mis en place un moyen de communication efficace. Toutes ces façons de transmettre l'information ont sans cesse évolué pour répondre en permanance aux besoins. @@ -61,7 +61,7 @@ Le but de cette étude est de trouver un ou des protocoles de communication entre agents qui seraient facilement appris par des agents naturels (les humains), qui pourraient de préférence être utilisés dans la communication de tous les jours (cela assurerait que -les humains maîtriserait bien le protocole), et qui seraient +les humains maîtriseraient bien le protocole), et qui seraient facilement «compris» par une machine. Comme un tel protocole n'existe probablement pas, nous étudierons la @@ -80,19 +80,19 @@ ordres pour les mots d'une phrase, mais souvent avec une différence dans la sémantique. Nous chercherons aussi à ce que les protocoles étudiés soient -formels. En d'autre termes ceux qui ont normes, des règles bien +formels. En d'autre termes ceux qui ont des normes, des règles bien définies, qui permettent de définir le protocole de manière unique et -sans ambiguïtées, ce qui facilite leur interprétation par la +sans ambigüités, ce qui facilite leur interprétation par la machine. La plupart des protocoles artificiels ont une syntaxe et une grammaire plutôt rigoureuse. -Nous considèrerons les protocoles parlés couremment par un gand nombre +Nous considérerons les protocoles parlés couramment par un gand nombre d'agents naturels (des humains). Nous n'explorerons pas la possibilité d'utiliser ces mêmes protocoles entre des agents artificiels comme des robots ou des ordinateurs, ni des protocoles prévus dans ce but (car ils sont en général inadaptés à l'apprentissage par les humains). -\subsection{Criètres} +\subsection{Critères} Pour chaque protocole de communication, nous étudierons plusieurs critères~: \begin{itemize} \item La facilité d'apprentissage par un individu. @@ -157,7 +157,7 @@ Bien que peu de gens parlent l'espéranto, c'est une langue qui est facile à apprendre. On estime qu'il faut compter 150 heures d'étude pour pouvoir suivre une conversation courante enespéranto. L'espéranto est donc relativement facile à apprendre, même pour les gens ne le -parnant pas encore. +parlant pas encore. Le vocabulaire de l'espéranto, comme celui de la plupart des langues naturelles, contient des ambigüités, certains mots sont polysémiques, @@ -187,19 +187,19 @@ avantage, car cela permet de ne pas trop se soucier de l'ordre des mots sans parler «petit nègre». Pour qu'une machine comprenne les humains, cela signifie que l'on peut imposer à l'utilisateur d'écrire ses phrases sous une certaine forme, pour faciliter l'analyse, sans -que cela réduisse grandement l'expressivité. +que cela réduise grandement l'expressivité. En ce qui concerne l'expressivité justement, bien que l'espéranto ait fait l'objet de plusieurs critiques considérant que puisque l'espéranto était une langue construite il ne pouvait pas avoir la -richesse d'une langue naturele, il est communément admis par les +richesse d'une langue naturelle, il est communément admis par les espérantistes que l'expressivité de l'espéranto est aussi grande que celle des langues naturelles. On trouve en espéranto de la poésie, des discours politiques, des contes pour enfants et même des articles encyclopédiques (il existe une version de wikipedia en espéranto). L'espéranto est donc un protocole de communication relativement facile -à apprendre, disposant d'une grande expressivié, assez ambigu mais +à apprendre, disposant d'une grande expressivité, assez ambigu mais moins que la plupart des langues naturelles. On peut imposer des contraintes sur la syntaxe (et le vocabulaire, en fixant une sémantique précises pour les racines) pour le rendre moins ambigu sans @@ -207,20 +207,65 @@ perdre beaucoup en expressivité. \section{Logogrammes} -% Différences entre idéogrammes…. Expliquer brièvement leurs propriétés. - \subsection{Phonogrammes et syllabaires} +Les phonogrammes sont des caractères utilisés pour représenter un +phonème dans l'écriture d'une langue. Les syllabaires représentent, eux, +une syllabe entière. Ces caractères peuvent être utilisés pour +transcrire la pensée de l'utilisateur. + +Les alphabets utilisant des phonogrammes comportent en général un +faible nombre de caractères et sont donc faciles à apprendre. Les +alphabets syllabaires comportent souvent un nombre de caractères +beaucoup plus grand, car en combinant plusieurs phonèmes, l'espace des +possibilités devient vite vaste. + +Ces notations peuvent être utilisées pour communiquer avec la machine, +soit avec un clavier, soit par reconnaissance de caractères. Excepté +une certaine ambigüité lors de la reconnaissance d'une écriture mal +formée dans le second cas, il n'y a pas beaucoup de place à +l'interprétation. + +Cependant, cette facilité de compréhension par une machine vient au +dépens de l'expressivité, puisque ces protocole ne permet d'encoder +que des phonèmes ou syllabes, et ne dit rien de leur signification. + +Les phonogrammes et syllabaires sont donc faciles à apprendre, avec +une très faible expressivité et peu d'ambigüité. + \subsection{Idéogrammes et pictogrammes} +Les pictogrammes sont des caractères représentant des concepts +concrets, en les dessinant, ou avec une forte analogie. Les +idéogrammes sont la combinaison de plusieurs pictogrammes pour +représenter quelque chose d'abstrait. + +Ces notations sont relativement difficiles à apprendre, puisqu'il faut +environ un symbole par concept, et le nombre de caractères est donc +très grand. Par ailleurs, l'expressivité des idéogrammes et +pictogrammes est supérieure à celle des phonogrammes et syllabaires. + +Les idéogrammes et pictogrammes peuvent être assez ambigus, puisqu'un +caractère représentera un concept général, mais sa sémantique précise +viendra du contexte, tout comme le vocabulaire d'une langue. + +Ces écritures peuvent toutefois être utilisées dans la communication +homme-machine, comme le jeu Captain Blood l'a montré, dans lequel le +joueur communique avec différentes races d'extraterrestres au moyen +d'une vingtaine de pictogrammes. + +Les idéogrammes et pictogrammes sont donc plus difficiles à apprendre +que phonogrammes et syllabaires, avec une expressivité plus forte et +une plus grande ambigüité. + \subsection{Codages et systèmes d'écriture} \subsubsection{Le morse} Le code Morse est généralement attribué à Samuel Morse. Ce code à été inventé pour la télégraphie en 1835. Il consiste en une série d'impulsions. Les lettres, chiffres et signes de ponctuation sont -représenté par des séries d'impulsions. Seulement deux types -d'impulsions son nécessaires pour tout coder, une impulsion courrte -que l'on appelle généralement "Point" et une impulsion longue appellée -"Trait". +représentés par des séries d'impulsions. Seulement deux types +d'impulsions sont nécessaires pour tout coder, une impulsion courte +que l'on appelle généralement «Point» et une impulsion longue appellée +«Trait». Ce protocole est facile à apprendre pour les humains (une liste de quelques séries d'impulsions à associer à chaque lettre), mais il est @@ -241,7 +286,7 @@ machine, car il suffit de transcrire les points et traits en bits 0 et 1, et un simple automate à états finis permettra de décoder ces séquences de bits en une suite de lettres. -Cependant, cette compréhensions s'arrêtrera à une suite de symboles +Cependant, cette compréhension s'arrêtera à une suite de symboles sans sémantique, car le morse possède une très faible expressivité~: Il s'agit simplement d'un encodage de l'alphabet, qui lui-même, comme vu précédemment, nécessite un protocole de plus haut niveau (une @@ -249,9 +294,9 @@ langue, un langage de programmation…) pour transmettre un message sémantique. Son expressivité est donc comparable à celle du braille (voir ci-dessous). -Les militaires ont utilisé ce code pour effectuer des transmission -codées, et même si un spectre de fréquence radio et toujours réservé -pour les seules émission en morse, il s'agit réellement de la couche +Les militaires ont utilisé ce code pour effectuer des transmissions +codées, et même si un spectre de fréquence radio est toujours réservé +pour les seules émissions en morse, il s'agit réellement de la couche physique de la communication selon le modèle OSI, soit la couche la plus basse. Ce code n'apporte pas de grand intérêt en terme de communication homme-machine~: difficile à manipuler pour les humains, @@ -264,12 +309,12 @@ une représentation en relief de l'ensemble des lettres, chiffres, ponctuation, et autres symboles en relief. Il a été étudié pour permettre la lecture simplement avec les doigts. Le braille a été mis au point par Louis Braille en 1824 et reste aujourd'hui après une -série de réformes et normalisations toujourstrès utilisé. +série de réformes et normalisations toujours très utilisé. Ce protocole est assez facile à apprendre, bien qu'il faille une certaine habitude pour lire le braille avec les doigts. Son utilité dans l'échange homme-machine reste, comme pour le Morse, très faible, -et seuls les malvoyants et aveugles ont un intérêt à l'utilisera pour +et seuls les malvoyants et aveugles ont un intérêt à l'utiliser pour saisir ou lire du texte sur une plage braille, comme on utiliserait un clavier et un écran. @@ -280,8 +325,8 @@ aussi à ces personnes de dialoguer avec les entendants qui ont appris leur langue des signes. La Langue des Signes Française (LSF) permet entre autres l'encodage -des lettres (on peut épeller un mot français en LSF), mais comme ce ne -serait vraiment pas pratique d'épeller une conversation entière, la +des lettres (on peut épeler un mot français en LSF), mais comme ce ne +serait vraiment pas pratique d'épeler une conversation entière, la LSF possède un grand nombre de signes permettant d'exprimer la plupart des concepts que la langue française sait exprimer, et les relations entre ces concepts. La Langue des Signes Française est donc aussi @@ -321,7 +366,7 @@ nécessite un assez grand effort, bien que le résultat soit très intéressant (il permet de communiquer avec une partie de la population qui est par ailleurs plutôt exclue de la communication entre humains). Les langues des signes disposent d'une grande expressivité, -mais sont au moins aussi ambigus que les langues parlées, voire +mais sont au moins aussi ambigües que les langues parlées, voire plus. Leur compréhension par la machine est assez difficile, mais leur expression est possible (et déjà réalisée dans le cadre du projet SiSi). Leur utilisation en tant que protocole de communication entre @@ -329,38 +374,64 @@ l'homme et la machine n'a pas grand intérêt, par contre, leur compréhension par la machine à des fins éducatives ou de traduction est très prometteuse. -\section{Langages spécifiques à un domaine} +\section{Notations spécifiques à un domaine} \subsection{Documents techniques et formules mathémathiques} % TODO -Les documents techniques, parmi lesquels ont peut trouver différentes vues d'objets (vue en perspective, d'ensemble, de coupe, éclatée…), -sont des représentation très formelle d'objets ou de concepts. Leur forme est en général assez facile à apprendre pour les humains, car il -s'agit simplement d'un certain nombre de règles à respecter. Ces documents techniques sont normalisées et laissent place à très peu, voire -aucune ambigüité dans les représentations. +Les documents techniques, parmi lesquels on peut trouver différentes +vues d'objets (vue en perspective, d'ensemble, de coupe, éclatée…), +sont des représentation très formelle d'objets ou de concepts. Leur +forme est en général assez facile à apprendre pour les humains, car il +s'agit simplement d'un certain nombre de règles à respecter. Ces +documents techniques sont normalisés et laissent place à très peu, +voire aucune ambigüité dans les représentations. -Les formules mathémathiques forment un autre protocole similaire aux documents techniques, très formel, bien que beaucoup de personnes aient -tendance à être laxistes sur la syntaxe. +Les formules mathémathiques forment un autre protocole similaire aux +documents techniques, très formel, bien que beaucoup de personnes +aient tendance à être laxistes sur la syntaxe. -L'expressivité de ces protocoles est toutefois relative : Tant que l'on considère uniquement leur domaine d'application, ils restent très -expressifs (quoi de mieux qu'une formule mathémathique pour parler d'algèbre ?), cependant ces protocoles ne formalisent pas la relation -entre les choses exprimées et leur contexte. En effet il est très difficile de retrouver la sémantique d'une formule lorsque celle-ci est -déjà écrite et isolée, et si nous comprenons à quoi se réfèrent les formes dessinées dans une vue éclatée, c'est uniquement par analogie -avec les objets physiques que nous connaissons déjà. De plus, ces protocoles ne sont expressifs que dans une discipline particulière. +L'expressivité de ces protocoles est toutefois relative : Tant que +l'on considère uniquement leur domaine d'application, ils restent très +expressifs (quoi de mieux qu'une formule mathémathique pour parler +d'algèbre ?), cependant ces protocoles ne formalisent pas la relation +entre les choses exprimées et leur contexte. En effet il est très +difficile de retrouver la sémantique d'une formule lorsque celle-ci +est déjà écrite et isolée, et si nous comprenons à quoi se réfèrent +les formes dessinées dans une vue éclatée, c'est uniquement par +analogie avec les objets physiques que nous connaissons déjà. De plus, +ces protocoles ne sont expressifs que dans une discipline +particulière. -Il est assez simple de stocker sur une machine des documents techniques ou des formules mathémathiques et même de les restituer, par exemple -sous forme visuelle (sur un écran). Ces protocoles sont relativement faciles à apprendre, et compréhensibles pour une machine, sont très -expressifs mais seulement dans leur domaine. Ils peuvent donc être adaptés à la communication homme-machine dans un domaine particulier, -mais pour une communication généralisée, il faudra les utiliser conjointement avec d'autres protocoles. +Il est assez simple de stocker sur une machine des documents +techniques ou des formules mathémathiques et même de les restituer, +par exemple sous forme visuelle (sur un écran). Ces protocoles sont +relativement faciles à apprendre, et compréhensibles pour une machine, +sont très expressifs mais seulement dans leur domaine. Ils peuvent +donc être adaptés à la communication homme-machine dans un domaine +particulier, mais pour une communication généralisée, il faudra les +utiliser conjointement avec d'autres protocoles. \subsection{Langages de programmation spécifiques à un domaine} -Difficiles à apprendre, mais pas trop, et être un expert du domaine aide beaucoup. +Les langages de programmation spécifiques à un domaine (DSL) sont des +langages artificiels utilisés en informatique pour exprimer des +concepts et relations dans une discipline particulière. De tels +langages ont aussi été utilisés pour une communication entre humains, +par exemple le langage BCL (Buisness Contract Language) permet de +formaliser des contrats, et permet de s'assurer via un programme +informatique que tous les cas possibles ont été réglementés par le +contrat, et que les clauses du contrat ne sont pas incompatibles. -Ambigüité faible. +Ces langages sont assez difficiles à apprendre, mais pas trop, et être +un expert du domaine aide beaucoup. -Expressivité forte, mais seulement dans le domaine. +Ils présentent une faible ambigüité, puisqu'ils ont été spécialement +conçus pour représenter de manière claire et concise les concepts et +relations propres à leur domaine. -Exemples : BCL, … +Ils présentent une forte expressivité, mais seulement dans la +discipline qui les concerne, et souvent présentent de graves lacunes +dans tout ce qui ne touche pas directement à leur domaine. \section{Conclusion} \begin{figure}[h] @@ -391,28 +462,54 @@ Exemples : BCL, … \node[right=of no,text width=2cm] (notext) {Notations}; \draw[draw=brown,draw opacity=0.5,thick] (notext) -- (no); - \node[fill=brown, fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (bcl) at (6cm,9cm) {}; - \node[right=of bcl,text width=2cm] (bcltext) {BCL}; - \draw[draw=brown,draw opacity=0.5,thick] (bcltext) -- (bcl); + \node[fill=none,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (bcl) at (6cm,9cm) {}; + \node[right=of bcl,text width=2cm] (bcltext) {DSL}; + \draw[draw=brown,draw opacity=0.5,thick] (bcltext.west) -- (no); \draw[draw=black,line width=1mm,draw opacity=0.5] (0.2,10.8) -- (10.8,0.2); \end{tikzpicture} \caption{Comparaison de l'expressivité et du formalisme des différents protocoles.} \end{figure} -% TODO : même graphique pour expressivité vs. facilité -% d'apprentissage, et facilité d'apprentissage vs formalisme. +Dans le graphique ci-dessus, le protocole de communication +homme-machine idéal serait situé dans le coin supérieur droit, avec +une forte expressivité et un formalisme élevé. L'étude des protocoles +existant montre qu'en général, le niveau de formalisme est inversément +proportionnel à l'expressivité. Le graphique représentant le +formalisme en fonction de la facilité d'apprentissage est sensiblement +le même, et n'a donc pas été représenté ici. -Ouverture : une collection de langages spécifiques à un domaine : Un pour le déroulement global de la conversation, un ou plusieurs -permettant de faire la liaison entre les concepts et relations exprimés dans différents protocoles, puis un pour chaque domaine pour lequel -on veut converser avec la machine. Cela exige un effort d'apprentissage plus élevé pour l'agent naturel, car il faut qu'il apprenne un -nouveau protocole pour chaque dicipline. Cependant, cet effort d'apprentissage est morcelé : l'utilisateur peut commencer par apprendre -seulement quelques protocoles, converser avec la machine, puis au fil des besoins apprendre de nouveaux protocoles au fur et à mesure. +Bien que l'espéranto présente des avantages par rapport à la plupart +des langues naturelles, il présente beaucoup d'ambigüité. Les +protocoles qui semblent réellement faire exception sont les notations +spécifiques à un domaine (DSL, notations mathémathiques, vues +normalisées…). Cette apparente supériorité résulte du fait que ces +protocoles sont très expressifs dans leur spécialité, et uniquement +celle-là, ce qui leur permet d'atteindre un haut niveau de formalisme +en sacrifiant leur expressivité dans d'autres domaines. -Pour résumer, l'utilisateur dialoguerait avec la machine en utilisant une multitude de «jargons» adaptés à une communication efficace et -sans ambigüités dans leur domaine, et quelques protocoles transversaux pour articuler la discussion et relier entre eux les fragments de +Il serait donc envisageable d'utiliser pour la communication +homme-machine une collection de langages spécifiques à un domaine : Un +protocole pour le déroulement global de la conversation, un ou +plusieurs permettant de faire la liaison entre les concepts et +relations exprimés dans différents protocoles, puis un pour chaque +domaine pour lequel on veut converser avec la machine. Cela exigerait +un effort d'apprentissage plus élevé pour l'agent naturel, car il +faudrait qu'il apprenne un nouveau protocole pour chaque +dicipline. Cependant, cet effort d'apprentissage serait morcelé : +l'utilisateur pourrait commencer par apprendre seulement quelques +protocoles, converser avec la machine, puis au fil des besoins +apprendre de nouveaux protocoles au fur et à mesure. + +Cette technique serait la contraposée de l'hypothèse de Sapir-Whorf~: +Plutôt que de supposer que la langue utilisée conditionne la pensée du +locuteur, le locuteur utiliserait la «langue» adaptée aux pensées +qu'il veut véhiculer. + +Pour résumer, l'utilisateur dialoguerait avec la machine en utilisant +une multitude de «jargons» adaptés à une communication efficace et +sans ambigüités dans leur domaine, et quelques protocoles transversaux +pour articuler la discussion et relier entre eux les fragments de conversation rédigés dans des langages différents. -%schéma montrant cette architecture. - \end{document}