Merge branch 'master' of github:jsmaniac/2011-m2s3-cognition
This commit is contained in:
commit
29c7788fc0
|
@ -2,6 +2,8 @@
|
|||
\usepackage[utf8]{inputenc}
|
||||
\usepackage[T1]{fontenc}
|
||||
\usepackage[frenchb]{babel}
|
||||
\usepackage{tikz}
|
||||
\usetikzlibrary{shapes,positioning,snakes,calc,chains}
|
||||
\usepackage{hyperref}
|
||||
\hypersetup{%
|
||||
colorlinks,%
|
||||
|
@ -34,17 +36,17 @@
|
|||
\section{Introduction}
|
||||
\subsection{Approche générale}
|
||||
Tout individu quel qu'il soit, privé de toutes formes de communication,
|
||||
d'émotions et de sensations, ne peuvent en aucune manière évoluer et
|
||||
d'émotions et de sensations, ne peut en aucune manière évoluer et
|
||||
former de groupes cohérents. L'intégrité et la cohérence d'un groupe
|
||||
passe majoritairement par un échange d'informations entre les individus.
|
||||
passent majoritairement par un échange d'informations entre les individus.
|
||||
Celles-ci ne peuvent pas être transmises n'importe comment, les individus
|
||||
constituant le groupe doivent être en mesure de les comprendre.
|
||||
|
||||
Le formatage de l'information devient essentiel tout comme le
|
||||
Le formatage de l'information devient essentiel, tout comme le
|
||||
support qui va être utilisé pour la transmettre.
|
||||
Au fil du temps les individus ont apris à échanger des idées et des
|
||||
Au fil du temps les individus ont appris à échanger des idées et des
|
||||
concepts de diverses manières. Que ce soit par le biais de gestes, de
|
||||
dessin, de rictus ou bien d'autre, les hommes ont petit à petit mis en
|
||||
dessin, de rictus ou bien d'autres, les hommes ont petit à petit mis en
|
||||
place un moyen de communication efficace. Toutes ces façons de
|
||||
transmettre l'information ont sans cesse évolué pour répondre en
|
||||
permanance aux besoins.
|
||||
|
@ -59,7 +61,7 @@ Le but de cette étude est de trouver un ou des protocoles de
|
|||
communication entre agents qui seraient facilement appris par des
|
||||
agents naturels (les humains), qui pourraient de préférence être
|
||||
utilisés dans la communication de tous les jours (cela assurerait que
|
||||
les humains maîtriserait bien le protocole), et qui seraient
|
||||
les humains maîtriseraient bien le protocole), et qui seraient
|
||||
facilement «compris» par une machine.
|
||||
|
||||
Comme un tel protocole n'existe probablement pas, nous étudierons la
|
||||
|
@ -78,19 +80,19 @@ ordres pour les mots d'une phrase, mais souvent avec une différence
|
|||
dans la sémantique.
|
||||
|
||||
Nous chercherons aussi à ce que les protocoles étudiés soient
|
||||
formels. En d'autre termes ceux qui ont normes, des règles bien
|
||||
formels. En d'autre termes ceux qui ont des normes, des règles bien
|
||||
définies, qui permettent de définir le protocole de manière unique et
|
||||
sans ambiguïtées, ce qui facilite leur interprétation par la
|
||||
sans ambigüités, ce qui facilite leur interprétation par la
|
||||
machine. La plupart des protocoles artificiels ont une syntaxe et une
|
||||
grammaire plutôt rigoureuse.
|
||||
|
||||
Nous considèrerons les protocoles parlés couremment par un gand nombre
|
||||
Nous considérerons les protocoles parlés couramment par un gand nombre
|
||||
d'agents naturels (des humains). Nous n'explorerons pas la possibilité
|
||||
d'utiliser ces mêmes protocoles entre des agents artificiels comme des
|
||||
robots ou des ordinateurs, ni des protocoles prévus dans ce but (car
|
||||
ils sont en général inadaptés à l'apprentissage par les humains).
|
||||
|
||||
\subsection{Criètres}
|
||||
\subsection{Critères}
|
||||
Pour chaque protocole de communication, nous étudierons plusieurs critères~:
|
||||
\begin{itemize}
|
||||
\item La facilité d'apprentissage par un individu.
|
||||
|
@ -155,7 +157,7 @@ Bien que peu de gens parlent l'espéranto, c'est une langue qui est
|
|||
facile à apprendre. On estime qu'il faut compter 150 heures d'étude
|
||||
pour pouvoir suivre une conversation courante enespéranto. L'espéranto
|
||||
est donc relativement facile à apprendre, même pour les gens ne le
|
||||
parnant pas encore.
|
||||
parlant pas encore.
|
||||
|
||||
Le vocabulaire de l'espéranto, comme celui de la plupart des langues
|
||||
naturelles, contient des ambigüités, certains mots sont polysémiques,
|
||||
|
@ -185,136 +187,329 @@ avantage, car cela permet de ne pas trop se soucier de l'ordre des
|
|||
mots sans parler «petit nègre». Pour qu'une machine comprenne les
|
||||
humains, cela signifie que l'on peut imposer à l'utilisateur d'écrire
|
||||
ses phrases sous une certaine forme, pour faciliter l'analyse, sans
|
||||
que cela réduisse grandement l'expressivité.
|
||||
que cela réduise grandement l'expressivité.
|
||||
|
||||
En ce qui concerne l'expressivité justement, bien que l'espéranto ait
|
||||
fait l'objet de plusieurs critiques considérant que puisque
|
||||
l'espéranto était une langue construite il ne pouvait pas avoir la
|
||||
richesse d'une langue naturele, il est communément admis par les
|
||||
richesse d'une langue naturelle, il est communément admis par les
|
||||
espérantistes que l'expressivité de l'espéranto est aussi grande que
|
||||
celle des langues naturelles. On trouve en espéranto de la poésie, des
|
||||
discours politiques, des contes pour enfants et même des articles
|
||||
encyclopédiques (il existe une version de wikipedia en espéranto).
|
||||
|
||||
L'espéranto est donc un protocole de communication relativement facile
|
||||
à apprendre, disposant d'une grande expressivié, assez ambigu mais
|
||||
à apprendre, disposant d'une grande expressivité, assez ambigu mais
|
||||
moins que la plupart des langues naturelles. On peut imposer des
|
||||
contraintes sur la syntaxe (et le vocabulaire, en fixant une
|
||||
sémantique précises pour les racines) pour le rendre moins ambigu sans
|
||||
perdre beaucoup en expressivité.
|
||||
|
||||
\section{Alphabets et logogrammes}
|
||||
\section{Logogrammes}
|
||||
|
||||
% Différences entre alphabets et les idéogrammes & co. Expliquer brièvement leurs propriétés.
|
||||
\subsection{L'alphabet}
|
||||
\subsection{Phonogrammes et syllabaires}
|
||||
Les phonogrammes sont des caractères utilisés pour représenter un
|
||||
phonème dans l'écriture d'une langue. Les syllabaires représentent, eux,
|
||||
une syllabe entière. Ces caractères peuvent être utilisés pour
|
||||
transcrire la pensée de l'utilisateur.
|
||||
|
||||
% \subsubsection{Ses origines}
|
||||
% \subsubsection{Dans quel but}
|
||||
% \subsubsection{Des exemples}
|
||||
Les alphabets utilisant des phonogrammes comportent en général un
|
||||
faible nombre de caractères et sont donc faciles à apprendre. Les
|
||||
alphabets syllabaires comportent souvent un nombre de caractères
|
||||
beaucoup plus grand, car en combinant plusieurs phonèmes, l'espace des
|
||||
possibilités devient vite vaste.
|
||||
|
||||
\subsection{idéogrammes}
|
||||
\subsection{etc.}
|
||||
Ces notations peuvent être utilisées pour communiquer avec la machine,
|
||||
soit avec un clavier, soit par reconnaissance de caractères. Excepté
|
||||
une certaine ambigüité lors de la reconnaissance d'une écriture mal
|
||||
formée dans le second cas, il n'y a pas beaucoup de place à
|
||||
l'interprétation.
|
||||
|
||||
% TODO : titre pourri !
|
||||
\subsection{Représentations}
|
||||
Cependant, cette facilité de compréhension par une machine vient au
|
||||
dépens de l'expressivité, puisque ces protocole ne permet d'encoder
|
||||
que des phonèmes ou syllabes, et ne dit rien de leur signification.
|
||||
|
||||
Les phonogrammes et syllabaires sont donc faciles à apprendre, avec
|
||||
une très faible expressivité et peu d'ambigüité.
|
||||
|
||||
\subsection{Idéogrammes et pictogrammes}
|
||||
|
||||
Les pictogrammes sont des caractères représentant des concepts
|
||||
concrets, en les dessinant, ou avec une forte analogie. Les
|
||||
idéogrammes sont la combinaison de plusieurs pictogrammes pour
|
||||
représenter quelque chose d'abstrait.
|
||||
|
||||
Ces notations sont relativement difficiles à apprendre, puisqu'il faut
|
||||
environ un symbole par concept, et le nombre de caractères est donc
|
||||
très grand. Par ailleurs, l'expressivité des idéogrammes et
|
||||
pictogrammes est supérieure à celle des phonogrammes et syllabaires.
|
||||
|
||||
Les idéogrammes et pictogrammes peuvent être assez ambigus, puisqu'un
|
||||
caractère représentera un concept général, mais sa sémantique précise
|
||||
viendra du contexte, tout comme le vocabulaire d'une langue.
|
||||
|
||||
Ces écritures peuvent toutefois être utilisées dans la communication
|
||||
homme-machine, comme le jeu Captain Blood l'a montré, dans lequel le
|
||||
joueur communique avec différentes races d'extraterrestres au moyen
|
||||
d'une vingtaine de pictogrammes.
|
||||
|
||||
Les idéogrammes et pictogrammes sont donc plus difficiles à apprendre
|
||||
que phonogrammes et syllabaires, avec une expressivité plus forte et
|
||||
une plus grande ambigüité.
|
||||
|
||||
\subsection{Codages et systèmes d'écriture}
|
||||
\subsubsection{Le morse}
|
||||
Le code Morse est généralement attribué à Samuel Morse. Ce code à été inventé pour la télégraphie en 1835.
|
||||
Il consiste en une série d'impulsions. Les lettres, chiffres et signes de ponctuation sont représenté par des séries d'impulsions.
|
||||
Seulement deux types d'impulsions son nécessaires pour tout coder, une impulsion courrte que l'on appelle généralement
|
||||
"Point" et une impulsion longue appellée "Trait".
|
||||
Le code Morse est généralement attribué à Samuel Morse. Ce code à été
|
||||
inventé pour la télégraphie en 1835. Il consiste en une série
|
||||
d'impulsions. Les lettres, chiffres et signes de ponctuation sont
|
||||
représentés par des séries d'impulsions. Seulement deux types
|
||||
d'impulsions sont nécessaires pour tout coder, une impulsion courte
|
||||
que l'on appelle généralement «Point» et une impulsion longue appellée
|
||||
«Trait».
|
||||
|
||||
Ce protocole est facile à apprendre pour les humains (une liste de quelques séries d'impulsions à associer à chaque lettre), mais il est
|
||||
difficile à utiliser pour l'écriture, et encore plus désagréable pour la lecture (si on rate une impulsion, les impulsions suivantes
|
||||
risquent de former des symboles valides, mais différents de ceux du message d'origine). Bien qu'il ait été utilisé pour la communication
|
||||
entre humains, il s'agit réellement d'une forme de communication primitive avec une machine qui transmettait l'information à une autre via
|
||||
une ligne télégraphique ou par ondes radio.
|
||||
Ce protocole est facile à apprendre pour les humains (une liste de
|
||||
quelques séries d'impulsions à associer à chaque lettre), mais il est
|
||||
difficile à utiliser. Bien qu'il ait été utilisé pour la communication
|
||||
entre humains par l'intermédiaire d'une machine, il s'agit réellement
|
||||
d'une forme de communication primitive avec cette machine, qui
|
||||
transmettait l'information à une autre via une ligne télégraphique ou
|
||||
par ondes radio.
|
||||
|
||||
Ce protocole de communication possède un vocabulaire très restreint (le point et le trait, soit un bit, qui assemblés forment les lettres de
|
||||
l'alphabet, chiffres et ponctuation). Il n'y a pas à proprement parler de grammaire ni de syntaxe, mis à part que l'assemblage des points et
|
||||
des traits fait émerger des symboles plus «gros» (lettres, chiffres et ponctuation). Il est donc très facile à comprendre pour une machine,
|
||||
car il suffit de transcrire les points et traits en bits 0 et 1, et un simple automate à états finis permettra de décoder ces séquences de
|
||||
bits en une suite de lettres.
|
||||
Ce protocole de communication possède un vocabulaire très restreint
|
||||
(le point et le trait, soit un bit, qui assemblés forment les lettres
|
||||
de l'alphabet, chiffres et ponctuation). Il n'y a pas à proprement
|
||||
parler de grammaire ni de syntaxe, mis à part que l'assemblage des
|
||||
points et des traits fait émerger des symboles plus «gros» (lettres,
|
||||
chiffres et ponctuation, puis des mots), que l'on sépare par des
|
||||
espaces (ou silences). Il est donc très facile à comprendre pour une
|
||||
machine, car il suffit de transcrire les points et traits en bits 0 et
|
||||
1, et un simple automate à états finis permettra de décoder ces
|
||||
séquences de bits en une suite de lettres.
|
||||
|
||||
Cependant, cette compréhensions s'arrêtrera à une suite de symboles sans sémantique, car le morse possède une très faible expressivité~: Il
|
||||
s'agit simplement d'un encodage de l'alphabet, qui lui-même, comme vu précédemment, nécessite un protocole de plus haut niveau (une langue,
|
||||
un langage de programmation…) pour transmettre un message sémantique. Son expressivité est donc comparable à celle du braille (voir
|
||||
ci-dessous), voire inférieure car le braille délimite naturellement les symboles, alors que le morse n'apporte pas cette information (il
|
||||
faut donc avoir la série d'impulsions depuis le début, ou bien détecter des séquences invalides ou improbables pour trouver le début d'un
|
||||
des symboles).
|
||||
Cependant, cette compréhension s'arrêtera à une suite de symboles
|
||||
sans sémantique, car le morse possède une très faible expressivité~:
|
||||
Il s'agit simplement d'un encodage de l'alphabet, qui lui-même, comme
|
||||
vu précédemment, nécessite un protocole de plus haut niveau (une
|
||||
langue, un langage de programmation…) pour transmettre un message
|
||||
sémantique. Son expressivité est donc comparable à celle du braille
|
||||
(voir ci-dessous).
|
||||
|
||||
Les militaires ont utilisé ce code pour effectuer des transmission codées, et même si un spectre de fréquence radio et toujours réservé pour
|
||||
les sueles émission en morse, il s'agit réellement de la couche physique de la communication selon le modèle OSI, soit la couche la plus
|
||||
basse. Ce code n'apporte pas de grand intérêt en terme de communication homme-machine~: difficile à manipuler pour les humains, un
|
||||
vocabulaire très restreint et par conséquent une expressivité faible.
|
||||
Les militaires ont utilisé ce code pour effectuer des transmissions
|
||||
codées, et même si un spectre de fréquence radio est toujours réservé
|
||||
pour les seules émissions en morse, il s'agit réellement de la couche
|
||||
physique de la communication selon le modèle OSI, soit la couche la
|
||||
plus basse. Ce code n'apporte pas de grand intérêt en terme de
|
||||
communication homme-machine~: difficile à manipuler pour les humains,
|
||||
un vocabulaire très restreint (juste des symboles) et par conséquent
|
||||
une expressivité faible.
|
||||
|
||||
\subsubsection{Le braille}
|
||||
Le braille est une manière de représenter l'alphabet. il consiste en une représentation en relief de l'ensemble des lettres, chiffres,
|
||||
ponctuation, et autres symboles en relief. Il a été étudié pour permettre la lecture simplement avec les doigts. Le braille a été mis au
|
||||
point par Louis Braille en 1824 et reste aujourd'hui après une série de réformes et normalisations toujourstrès utilisé.
|
||||
Le braille est une manière de représenter l'alphabet. il consiste en
|
||||
une représentation en relief de l'ensemble des lettres, chiffres,
|
||||
ponctuation, et autres symboles en relief. Il a été étudié pour
|
||||
permettre la lecture simplement avec les doigts. Le braille a été mis
|
||||
au point par Louis Braille en 1824 et reste aujourd'hui après une
|
||||
série de réformes et normalisations toujours très utilisé.
|
||||
|
||||
Ce protocole est assez facile à apprendre, bien qu'il faille une certaine habitude pour lire le braille avec les doigts. Ce code est un peu
|
||||
plus expressif que le code Morse vu précédement puisqu'il permet de représenter la majorité est symboles par une seule cellule, et délimite
|
||||
donc les symboles sans qu'il y ait besoin d'analyser tout le flux précédent. Cependant l'utilité dans l'échange homme-machine reste, comme
|
||||
pour le Morse, très faible.
|
||||
Ce protocole est assez facile à apprendre, bien qu'il faille une
|
||||
certaine habitude pour lire le braille avec les doigts. Son utilité
|
||||
dans l'échange homme-machine reste, comme pour le Morse, très faible,
|
||||
et seuls les malvoyants et aveugles ont un intérêt à l'utiliser pour
|
||||
saisir ou lire du texte sur une plage braille, comme on utiliserait un
|
||||
clavier et un écran.
|
||||
|
||||
\subsubsection{La langue des signes}
|
||||
Très court hitorique et but.
|
||||
Les différentes langues des signes ont été créées pour permettre la
|
||||
communication entre personnes muettes et malentendantes. Elle permet
|
||||
aussi à ces personnes de dialoguer avec les entendants qui ont appris
|
||||
leur langue des signes.
|
||||
|
||||
LSF : encodage des lettres, mais aussi sens. Aussi difficile à apprendre qu'une nouvelle langue.
|
||||
La Langue des Signes Française (LSF) permet entre autres l'encodage
|
||||
des lettres (on peut épeler un mot français en LSF), mais comme ce ne
|
||||
serait vraiment pas pratique d'épeler une conversation entière, la
|
||||
LSF possède un grand nombre de signes permettant d'exprimer la plupart
|
||||
des concepts que la langue française sait exprimer, et les relations
|
||||
entre ces concepts. La Langue des Signes Française est donc aussi
|
||||
expressive que les langues parlées.
|
||||
|
||||
Beaucoup d'ambigüité sur les signes, dans la direction, la vitesse…
|
||||
Elle se présente comme un «système d'écriture» basé sur des
|
||||
pictogrammes et idéogrammes, car beaucoup de signes sont une sorte de
|
||||
mime du concept concret qu'ils expriment, et les autres signes
|
||||
suffisent à eux seuls à représenter un mot entier.
|
||||
|
||||
Ordis peuvent le parler (Projet IBM), mais difficile à comprendre.
|
||||
La LSF est aussi difficile à apprendre qu'une langue parlée, mais elle
|
||||
est déjà parlée par un grand nombre de muets, sourds et malentendants.
|
||||
|
||||
Aussi expressif que langue naturelle.
|
||||
Elle présente beaucoup d'ambigüité sur la sémantique des signes (son
|
||||
vocabulaire), qui peut varier en fonction de la direction ou la
|
||||
vitesse.
|
||||
|
||||
\section{Langages spécifiques à un domaine}
|
||||
La grammaire et la syntaxe de la LSF sont différentes de celle du
|
||||
français (lorsqu'on utilise les signes mais en utilisant l'ordre des
|
||||
mots du français, on parle de «français signé»). On peut parfois
|
||||
composer plusieurs signes simultanément pour exprimer directement une
|
||||
relation entre ces deux signes, par exemple les expressions du visage
|
||||
sont souvent utilisées pour exprimer une émotion en même temps qu'un
|
||||
autre signe.
|
||||
|
||||
Un projet, nommé SiSi (Say It Sign It\footnote{Dites-le, signez-le}),
|
||||
a été lancé par IBM visant à offrir une traduction voix vers langue
|
||||
des signes. Les machines peuvent donc signer, mais cette langue semble
|
||||
difficile à interpréter pour une machine, principalement à cause de la
|
||||
difficulté à comprendre quel signe est effectué à partir d'un flux
|
||||
d'images.
|
||||
|
||||
Les langues des signes sont donc des protocoles de communication
|
||||
adaptés à un groupe d'individus, les sourds, malentendants et muets,
|
||||
mais peu utilisés par les autres personnes. Leur apprentissage
|
||||
nécessite un assez grand effort, bien que le résultat soit très
|
||||
intéressant (il permet de communiquer avec une partie de la population
|
||||
qui est par ailleurs plutôt exclue de la communication entre
|
||||
humains). Les langues des signes disposent d'une grande expressivité,
|
||||
mais sont au moins aussi ambigües que les langues parlées, voire
|
||||
plus. Leur compréhension par la machine est assez difficile, mais leur
|
||||
expression est possible (et déjà réalisée dans le cadre du projet
|
||||
SiSi). Leur utilisation en tant que protocole de communication entre
|
||||
l'homme et la machine n'a pas grand intérêt, par contre, leur
|
||||
compréhension par la machine à des fins éducatives ou de traduction
|
||||
est très prometteuse.
|
||||
|
||||
\section{Notations spécifiques à un domaine}
|
||||
\subsection{Documents techniques et formules mathémathiques}
|
||||
% TODO
|
||||
|
||||
Les documents techniques, parmi lesquels ont peut trouver différentes vues d'objets (vue en perspective, d'ensemble, de coupe, éclatée…),
|
||||
sont des représentation très formelle d'objets ou de concepts. Leur forme est en général assez facile à apprendre pour les humains, car il
|
||||
s'agit simplement d'un certain nombre de règles à respecter. Ces documents techniques sont normalisées et laissent place à très peu, voire
|
||||
aucune ambigüité dans les représentations.
|
||||
Les documents techniques, parmi lesquels on peut trouver différentes
|
||||
vues d'objets (vue en perspective, d'ensemble, de coupe, éclatée…),
|
||||
sont des représentation très formelle d'objets ou de concepts. Leur
|
||||
forme est en général assez facile à apprendre pour les humains, car il
|
||||
s'agit simplement d'un certain nombre de règles à respecter. Ces
|
||||
documents techniques sont normalisés et laissent place à très peu,
|
||||
voire aucune ambigüité dans les représentations.
|
||||
|
||||
Les formules mathémathiques forment un autre protocole similaire aux documents techniques, très formel, bien que beaucoup de personnes aient
|
||||
tendance à être laxistes sur la syntaxe.
|
||||
Les formules mathémathiques forment un autre protocole similaire aux
|
||||
documents techniques, très formel, bien que beaucoup de personnes
|
||||
aient tendance à être laxistes sur la syntaxe.
|
||||
|
||||
L'expressivité de ces protocoles est toutefois relative : Tant que l'on considère uniquement leur domaine d'application, ils restent très
|
||||
expressifs (quoi de mieux qu'une formule mathémathique pour parler d'algèbre ?), cependant ces protocoles ne formalisent pas la relation
|
||||
entre les choses exprimées et leur contexte. En effet il est très difficile de retrouver la sémantique d'une formule lorsque celle-ci est
|
||||
déjà écrite et isolée, et si nous comprenons à quoi se réfèrent les formes dessinées dans une vue éclatée, c'est uniquement par analogie
|
||||
avec les objets physiques que nous connaissons déjà. De plus, ces protocoles ne sont expressifs que dans une discipline particulière.
|
||||
L'expressivité de ces protocoles est toutefois relative : Tant que
|
||||
l'on considère uniquement leur domaine d'application, ils restent très
|
||||
expressifs (quoi de mieux qu'une formule mathémathique pour parler
|
||||
d'algèbre ?), cependant ces protocoles ne formalisent pas la relation
|
||||
entre les choses exprimées et leur contexte. En effet il est très
|
||||
difficile de retrouver la sémantique d'une formule lorsque celle-ci
|
||||
est déjà écrite et isolée, et si nous comprenons à quoi se réfèrent
|
||||
les formes dessinées dans une vue éclatée, c'est uniquement par
|
||||
analogie avec les objets physiques que nous connaissons déjà. De plus,
|
||||
ces protocoles ne sont expressifs que dans une discipline
|
||||
particulière.
|
||||
|
||||
Il est assez simple de stocker sur une machine des documents techniques ou des formules mathémathiques et même de les restituer, par exemple
|
||||
sous forme visuelle (sur un écran). Ces protocoles sont relativement faciles à apprendre, et compréhensibles pour une machine, sont très
|
||||
expressifs mais seulement dans leur domaine. Ils peuvent donc être adaptés à la communication homme-machine dans un domaine particulier,
|
||||
mais pour une communication généralisée, il faudra les utiliser conjointement avec d'autres protocoles.
|
||||
Il est assez simple de stocker sur une machine des documents
|
||||
techniques ou des formules mathémathiques et même de les restituer,
|
||||
par exemple sous forme visuelle (sur un écran). Ces protocoles sont
|
||||
relativement faciles à apprendre, et compréhensibles pour une machine,
|
||||
sont très expressifs mais seulement dans leur domaine. Ils peuvent
|
||||
donc être adaptés à la communication homme-machine dans un domaine
|
||||
particulier, mais pour une communication généralisée, il faudra les
|
||||
utiliser conjointement avec d'autres protocoles.
|
||||
|
||||
\subsection{Langages de programmation spécifiques à un domaine}
|
||||
|
||||
Difficiles à apprendre, mais pas trop, et être un expert du domaine aide beaucoup.
|
||||
Les langages de programmation spécifiques à un domaine (DSL) sont des
|
||||
langages artificiels utilisés en informatique pour exprimer des
|
||||
concepts et relations dans une discipline particulière. De tels
|
||||
langages ont aussi été utilisés pour une communication entre humains,
|
||||
par exemple le langage BCL (Buisness Contract Language) permet de
|
||||
formaliser des contrats, et permet de s'assurer via un programme
|
||||
informatique que tous les cas possibles ont été réglementés par le
|
||||
contrat, et que les clauses du contrat ne sont pas incompatibles.
|
||||
|
||||
Ambigüité faible.
|
||||
Ces langages sont assez difficiles à apprendre, mais pas trop, et être
|
||||
un expert du domaine aide beaucoup.
|
||||
|
||||
Expressivité forte, mais seulement dans le domaine.
|
||||
Ils présentent une faible ambigüité, puisqu'ils ont été spécialement
|
||||
conçus pour représenter de manière claire et concise les concepts et
|
||||
relations propres à leur domaine.
|
||||
|
||||
Exemples : BCL, …
|
||||
Ils présentent une forte expressivité, mais seulement dans la
|
||||
discipline qui les concerne, et souvent présentent de graves lacunes
|
||||
dans tout ce qui ne touche pas directement à leur domaine.
|
||||
|
||||
\section{Conclusion}
|
||||
Graphique de comparaison des différents supports en terme d'expressivité et de formalisme.
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\begin{tikzpicture}[scale=0.5,node distance=0.5cm,font=\footnotesize]
|
||||
\node at (12,10) {};
|
||||
\draw[->] (0,0) -- (11cm,0);
|
||||
\draw[->] (0,0) -- (0,11cm);
|
||||
\node[anchor=north] at (10cm,0) {Expressivité};
|
||||
\node[anchor=south,xshift=0.5cm] at (0,11cm) {Formalisme};
|
||||
|
||||
\node[fill=red, fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (mb) at (1cm,10cm) {};
|
||||
\node[right=of mb,text width=2cm] (mbtext) {Morse\\Braille};
|
||||
\draw[draw=red,draw opacity=0.5,thick] (mbtext.170) -- (mb);
|
||||
|
||||
\node[fill=orange, fill opacity=0.5,ellipse,minimum width=1cm,minimum height=0.5cm,inner sep=1mm,rotate=-90] (sph) at (1cm,9.4cm) {};
|
||||
\node[anchor=west,at=(sph.30),xshift=1.5cm,yshift=-0.8cm,text width=2cm] (s) {Syllabaires\\Phonogrammes};
|
||||
\draw[draw=orange,draw opacity=0.5,thick] (s.170) -- (sph);
|
||||
|
||||
\node[fill=yellow!80!black, fill opacity=0.5,ellipse,minimum width=3cm,minimum height=0.7cm,inner sep=1mm,rotate=-65] (ipi) at (2cm,8cm) {};
|
||||
\node[anchor=north,at=(ipi.south),yshift=-1.5cm,xshift=5mm,text width=2cm,text centered] (i) {Idéogrammes\\Pictogramme\\LSF};
|
||||
\draw[draw=yellow!80!black,draw opacity=0.5,thick] (i) -- (ipi.-15);
|
||||
|
||||
\node[fill=green,fill opacity=0.5,ellipse,minimum width=2.8cm,minimum height=0.8cm,inner sep=1mm,rotate=-45] at (8.5cm,2.5cm) {Espéranto};
|
||||
\node[fill=blue, fill opacity=0.5,ellipse,minimum width=2.3cm,minimum height=0.7cm,inner sep=1mm,rotate=-20] at (8.5cm,1.5cm) {Français};
|
||||
|
||||
\node[fill=brown, fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (no) at (6cm,10cm) {};
|
||||
\node[right=of no,text width=2cm] (notext) {Notations};
|
||||
\draw[draw=brown,draw opacity=0.5,thick] (notext) -- (no);
|
||||
|
||||
\node[fill=none,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (bcl) at (6cm,9cm) {};
|
||||
\node[right=of bcl,text width=2cm] (bcltext) {DSL};
|
||||
\draw[draw=brown,draw opacity=0.5,thick] (bcltext.west) -- (no);
|
||||
|
||||
\draw[draw=black,line width=1mm,draw opacity=0.5] (0.2,10.8) -- (10.8,0.2);
|
||||
\end{tikzpicture}
|
||||
\caption{Comparaison de l'expressivité et du formalisme des différents protocoles.}
|
||||
\end{figure}
|
||||
|
||||
Ouverture : une collection de langages spécifiques à un domaine : Un pour le déroulement global de la conversation, un ou plusieurs
|
||||
permettant de faire la liaison entre les concepts et relations exprimés dans différents protocoles, puis un pour chaque domaine pour lequel
|
||||
on veut converser avec la machine. Cela exige un effort d'apprentissage plus élevé pour l'agent naturel, car il faut qu'il apprenne un
|
||||
nouveau protocole pour chaque dicipline. Cependant, cet effort d'apprentissage est morcelé : l'utilisateur peut commencer par apprendre
|
||||
seulement quelques protocoles, converser avec la machine, puis au fil des besoins apprendre de nouveaux protocoles au fur et à mesure.
|
||||
Dans le graphique ci-dessus, le protocole de communication
|
||||
homme-machine idéal serait situé dans le coin supérieur droit, avec
|
||||
une forte expressivité et un formalisme élevé. L'étude des protocoles
|
||||
existant montre qu'en général, le niveau de formalisme est inversément
|
||||
proportionnel à l'expressivité. Le graphique représentant le
|
||||
formalisme en fonction de la facilité d'apprentissage est sensiblement
|
||||
le même, et n'a donc pas été représenté ici.
|
||||
|
||||
Pour résumer, l'utilisateur dialoguerait avec la machine en utilisant une multitude de «jargons» adaptés à une communication efficace et
|
||||
sans ambigüités dans leur domaine, et quelques protocoles transversaux pour articuler la discussion et relier entre eux les fragments de
|
||||
Bien que l'espéranto présente des avantages par rapport à la plupart
|
||||
des langues naturelles, il présente beaucoup d'ambigüité. Les
|
||||
protocoles qui semblent réellement faire exception sont les notations
|
||||
spécifiques à un domaine (DSL, notations mathémathiques, vues
|
||||
normalisées…). Cette apparente supériorité résulte du fait que ces
|
||||
protocoles sont très expressifs dans leur spécialité, et uniquement
|
||||
celle-là, ce qui leur permet d'atteindre un haut niveau de formalisme
|
||||
en sacrifiant leur expressivité dans d'autres domaines.
|
||||
|
||||
Il serait donc envisageable d'utiliser pour la communication
|
||||
homme-machine une collection de langages spécifiques à un domaine : Un
|
||||
protocole pour le déroulement global de la conversation, un ou
|
||||
plusieurs permettant de faire la liaison entre les concepts et
|
||||
relations exprimés dans différents protocoles, puis un pour chaque
|
||||
domaine pour lequel on veut converser avec la machine. Cela exigerait
|
||||
un effort d'apprentissage plus élevé pour l'agent naturel, car il
|
||||
faudrait qu'il apprenne un nouveau protocole pour chaque
|
||||
dicipline. Cependant, cet effort d'apprentissage serait morcelé :
|
||||
l'utilisateur pourrait commencer par apprendre seulement quelques
|
||||
protocoles, converser avec la machine, puis au fil des besoins
|
||||
apprendre de nouveaux protocoles au fur et à mesure.
|
||||
|
||||
Cette technique serait la contraposée de l'hypothèse de Sapir-Whorf~:
|
||||
Plutôt que de supposer que la langue utilisée conditionne la pensée du
|
||||
locuteur, le locuteur utiliserait la «langue» adaptée aux pensées
|
||||
qu'il veut véhiculer.
|
||||
|
||||
Pour résumer, l'utilisateur dialoguerait avec la machine en utilisant
|
||||
une multitude de «jargons» adaptés à une communication efficace et
|
||||
sans ambigüités dans leur domaine, et quelques protocoles transversaux
|
||||
pour articuler la discussion et relier entre eux les fragments de
|
||||
conversation rédigés dans des langages différents.
|
||||
|
||||
%schéma montrant cette architecture.
|
||||
|
||||
\end{document}
|
||||
|
|
Loading…
Reference in New Issue
Block a user