196 lines
9.4 KiB
TeX
196 lines
9.4 KiB
TeX
\documentclass[french,a4paper]{article}
|
|
\usepackage[utf8]{inputenc}
|
|
\usepackage[T1]{fontenc}
|
|
\usepackage[frenchb]{babel}
|
|
\usepackage{hyperref}
|
|
\hypersetup{%
|
|
colorlinks,%
|
|
citecolor=black,%
|
|
filecolor=black,%
|
|
linkcolor=black,%
|
|
urlcolor=black%
|
|
}
|
|
|
|
\title{FMIN327 Cognition individuelle et collective\\Protocoles artificiels entre agents naturels}
|
|
\author{BONAVERO Yoann \and DUPÉRON Georges}
|
|
|
|
\begin{document}
|
|
|
|
\maketitle
|
|
\begin{abstract}
|
|
Dans cet article, nous effecteuons une étude comparative de
|
|
différents protocoles de communication utilisés par les humains
|
|
susceptibles d'être utilisés dans la communication homme-machine,
|
|
sans grand apprentissage de la part des humains. Nous montrons qu'en
|
|
général, le niveau d'expressivité d'une langue est inversément
|
|
proportionnel à son niveau de formalisme. Nous montrons aussi que
|
|
les langages centrés sur un domaine d'application peuvent être à la
|
|
fois expressifs dans ce domaine et avoir un haut niveau de
|
|
formalisme.
|
|
\end{abstract}
|
|
\tableofcontents
|
|
\newpage
|
|
|
|
\section{Introduction}
|
|
\subsection{Approche générale}
|
|
Tout individu quel qu'il soit, privé de toutes formes de communication,
|
|
d'émotions et de sensations, ne peuvent en aucune manière évoluer et
|
|
former de groupes cohérents. L'intégrité et la cohérence d'un groupe
|
|
passe majoritairement par un échange d'informations entre les individus.
|
|
Celles-ci ne peuvent pas être transmises n'importe comment, les individus
|
|
constituant le groupe doivent être en mesure de les comprendre.
|
|
|
|
Le formatage de l'information devient essentiel tout comme le
|
|
support qui va être utilisé pour la transmettre.
|
|
Au fil du temps les individus ont apris à échanger des idées et des
|
|
concepts de diverses manières. Que ce soit par le biais de gestes, de
|
|
dessin, de rictus ou bien d'autre, les hommes ont petit à petit mis en
|
|
place un moyen de communication efficace. Toutes ces façons de
|
|
transmettre l'information ont sans cesse évolué pour répondre en
|
|
permanance aux besoins.
|
|
|
|
Dans la communication il est possible de regrouper en deux grandes
|
|
catégorie les protocoles de communication. Il y a ceux qui sont
|
|
"naturels", qui ont évolués de manière organique au fil des années, et
|
|
ceux qui sont inventés par un «individu» dit artificiels.
|
|
|
|
\subsection{But de l'étude}
|
|
Le but de cette étude est de trouver un ou des protocoles de
|
|
communication entre agents qui seraient facilement appris par des
|
|
agents naturels (les humains), qui pourraient de préférence être
|
|
utilisés dans la communication de tous les jours (cela assurerait que
|
|
les humains maîtriserait bien le protocole), et qui seraient
|
|
facilement «compris» par une machine.
|
|
|
|
Comme un tel protocole n'existe probablement pas, nous étudierons la
|
|
facilité d'apprentissage par les humains, l'expressivité et la
|
|
facilité de compréhension par une machine de plusieurs protocoles,
|
|
afin de trouver les caractéristiques du protocole qui semblent lui
|
|
permettre de satisfaire ces trois critères.
|
|
|
|
% TODO : nettoyer un peu ça vis-à-vis du paragraphe ci-dessus.
|
|
Nous nous intéresserons donc principalement aux protocoles
|
|
artificiels. En effet, les protocoles naturels, de part leur évolution
|
|
non contrôlée au fil du temps ont tendance à être très ambigus, et
|
|
avoir une grammaire comportant beaucoup d'exceptions (donc difficile à
|
|
interpréter), et une syntaxe approximative, qui accepte différents
|
|
ordres pour les mots d'une phrase, mais souvent avec une différence
|
|
dans la sémantique.
|
|
|
|
Nous chercherons aussi à ce que les protocoles étudiés soient
|
|
formels. En d'autre termes ceux qui ont normes, des règles bien
|
|
définies, qui permettent de définir le protocole de manière unique et
|
|
sans ambiguïtées, ce qui facilite leur interprétation par la
|
|
machine. La plupart des protocoles artificiels ont une syntaxe et une
|
|
grammaire plutôt rigoureuse.
|
|
|
|
Nous considèrerons les protocoles parlés couremment par un gand nombre
|
|
d'agents naturels (des humains). Nous n'explorerons pas la possibilité
|
|
d'utiliser ces mêmes protocoles entre des agents artificiels comme des
|
|
robots ou des ordinateurs, ni des protocoles prévus dans ce but (car
|
|
ils sont en général inadaptés à l'apprentissage par les humains).
|
|
|
|
\subsection{Criètres}
|
|
Pour chaque protocole de communication, nous étudierons plusieurs critères~:
|
|
\begin{itemize}
|
|
\item La facilité d'apprentissage par un individu.
|
|
\item L'ambigüité de son vocabulaire, sa grammaire et sa syntaxe,
|
|
autrement dit la difficulté qu'une machine aura à comprendre le
|
|
protocole.
|
|
\item L'expressivité du protocole, autrement dit la facilité avec
|
|
laquelle un humain pourra exprimer des concepts et relations
|
|
complexes.
|
|
\end{itemize}
|
|
|
|
\section{Les langues naturelles}
|
|
|
|
Les langues naturelles sont les protocoles de communication les mieux
|
|
maîtrisés par les humains.
|
|
|
|
Cependant, le vocabulaire est source d'ambigüité, d'une part à cause
|
|
des multiples définitions d'un mot, et des connotations qu'il peut
|
|
acquérir selon son contexte, et d'autre part à cause des néologismes
|
|
qui ne seraient pas encore répertoriés dans un dictionnaire, dont le
|
|
sens est difficile à déterminer de manière certaine en utilisant
|
|
seulement leur étymologie.
|
|
|
|
De même, comme expliqué précédemment, leur grammaire est irrégulière
|
|
et bien qu'elle permette souvent de faciliter la compréhension de la
|
|
phrase (on pourra rattacher un adjectif au féminin seulement aux
|
|
substantifs féminins de la phrase, ce qui élimine des combinaisons
|
|
possibles), les mots invariables et autres exceptions apparaissent
|
|
trop souvent pour que l'on puisse compter dessus.
|
|
|
|
La syntaxe de ces langues est elle aussi une grande source d'ambigüité
|
|
puisque changer l'ordre des mots d'une phrase peut résulter en une
|
|
autre phrase correcte, mais avec un sens plus ou moins différent de la
|
|
première, sans qu'il y ait vraiment de règles formelles décrivant
|
|
cela.
|
|
|
|
L'expressivité des langues naturelles est très grande, bien que pas
|
|
illimitée, car il est parfois difficile de décrire des formes et
|
|
images, ou encore des sons, des odeurs ou d'autres sensations.
|
|
|
|
Les langues naturelles sont donc faciles à apprendre, disposent d'une
|
|
grande expressivité, mais sont très ambigues. Il est possible de
|
|
réduire un peu l'ambiguité en s'imposant des contraines (uniquement
|
|
des phrases «sujet verbe objet» par exemple), auquel cas on perd en
|
|
expressivité.
|
|
|
|
% TODO : pilud-ml "english (even controlled) for programming".
|
|
|
|
\section{Une langue artificielle : L'Espéranto}
|
|
% \subsection{Présentation}
|
|
% \subsection{Origine et objectif}
|
|
% \subsection{Principe de fonctionnement}
|
|
|
|
\section{Alphabets et supports}
|
|
\subsection{L'alphabet}
|
|
\subsubsection{Ses origines}
|
|
\subsubsection{Dans quel but}
|
|
\subsubsection{Des exemples}
|
|
|
|
\subsection{Les supports}
|
|
\subsubsection{Le morse}
|
|
Le code Morse est généralement attribué à Samuel Morse. Ce code à été inventé pour la télégraphie en 1835.
|
|
Il consiste en une série d'impulsions. Les lettres, chiffres, signes de ponctuation sont représenté par des séries d'impulsions.
|
|
Seulement deux types d'impulsions son nécessaires pour tout coder, une impulsion courrte que l'on appelle généralement
|
|
"Point" et une impulsion longue appellée "Trait".
|
|
|
|
Co code possède un très faible expréssivité du fait d'un nombre important d'impulsions utilisées pour un seul caractère.
|
|
Ce code est considéré comme le précurseur des communications numériques que l'on connait.
|
|
|
|
Les militaire ont utilisé ce code pour effectuer des transmission codées, et même si un spectre de fréquence radio et toujours
|
|
réservé pour les sueles émission en morse, ce code n'apporte pas de grand intérêt en terme de communication homme-machine.
|
|
|
|
\subsubsection{Le braille}
|
|
Le braille est une manière de représenter l'alphabet. il consiste en une représentation en relief de l'ensemble des lettres, chiffres, ponctuation, sumboles etc
|
|
en relief. Il a été étudie pour permettre un lecture simplement avec les doigts. Le braille a été mis au point par Louis Braille en 1824 et
|
|
reste aujourd'hui après une série de réformes et normalisation toujourstrès utilisé.
|
|
|
|
Ce code est un peu plus expressif que le code Morse vu précédement puisqu'il permet de représenter la majorité est symboles par
|
|
une seule cellule. Cependant l'utilité dans l'échange homme-machine reste, comme pour le Morse, très peu utile.
|
|
|
|
\subsubsection{La langue des signes}
|
|
|
|
\subsubsection{Les vues}
|
|
Les vues regroupes un grand nombre de représentation très formelle d'objets ou éléments sur un support. Qu'elle soit
|
|
en perspective, d'ensemble, de coupe, éclatée etc, les vues sont normalisées et laissent place à très peu, voire aucune ambigüité dans les
|
|
représentations.
|
|
|
|
De ce fait il est assez simple de stocker sur un machine ce genre d'informations et même de les restituer, par exemple sous
|
|
forme visuelle (sur un écran).
|
|
|
|
\subsubsection{Les formules mathématiques}
|
|
Les formules mathématiques représente une des représentation les plus normalisées, même si les personnes ont tendance à
|
|
adapter les représentation, symboles mathématiques à leurs besoins.
|
|
Les formules mathématiques ont une "expressivité" relativement importante. Leur inconvénient majoritaire se trouve au niveau
|
|
du lien entre une formule et son contexte.
|
|
En effet il est très difficile de retrouver le contexte d'une formule lorsque celle-ci est déjà écrite et isolée.
|
|
|
|
|
|
\section{Conclusion}
|
|
Graphique de comparaison des différents supports en terme d'expressivité et de formalismem.
|
|
|
|
\end{document}
|