2011-m2s3-cognition/rapport/rapport.tex
2011-12-12 01:09:50 +01:00

196 lines
9.4 KiB
TeX

\documentclass[french,a4paper]{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage[frenchb]{babel}
\usepackage{hyperref}
\hypersetup{%
colorlinks,%
citecolor=black,%
filecolor=black,%
linkcolor=black,%
urlcolor=black%
}
\title{FMIN327 Cognition individuelle et collective\\Protocoles artificiels entre agents naturels}
\author{BONAVERO Yoann \and DUPÉRON Georges}
\begin{document}
\maketitle
\begin{abstract}
Dans cet article, nous effecteuons une étude comparative de
différents protocoles de communication utilisés par les humains
susceptibles d'être utilisés dans la communication homme-machine,
sans grand apprentissage de la part des humains. Nous montrons qu'en
général, le niveau d'expressivité d'une langue est inversément
proportionnel à son niveau de formalisme. Nous montrons aussi que
les langages centrés sur un domaine d'application peuvent être à la
fois expressifs dans ce domaine et avoir un haut niveau de
formalisme.
\end{abstract}
\tableofcontents
\newpage
\section{Introduction}
\subsection{Approche générale}
Tout individu quel qu'il soit, privé de toutes formes de communication,
d'émotions et de sensations, ne peuvent en aucune manière évoluer et
former de groupes cohérents. L'intégrité et la cohérence d'un groupe
passe majoritairement par un échange d'informations entre les individus.
Celles-ci ne peuvent pas être transmises n'importe comment, les individus
constituant le groupe doivent être en mesure de les comprendre.
Le formatage de l'information devient essentiel tout comme le
support qui va être utilisé pour la transmettre.
Au fil du temps les individus ont apris à échanger des idées et des
concepts de diverses manières. Que ce soit par le biais de gestes, de
dessin, de rictus ou bien d'autre, les hommes ont petit à petit mis en
place un moyen de communication efficace. Toutes ces façons de
transmettre l'information ont sans cesse évolué pour répondre en
permanance aux besoins.
Dans la communication il est possible de regrouper en deux grandes
catégorie les protocoles de communication. Il y a ceux qui sont
"naturels", qui ont évolués de manière organique au fil des années, et
ceux qui sont inventés par un «individu» dit artificiels.
\subsection{But de l'étude}
Le but de cette étude est de trouver un ou des protocoles de
communication entre agents qui seraient facilement appris par des
agents naturels (les humains), qui pourraient de préférence être
utilisés dans la communication de tous les jours (cela assurerait que
les humains maîtriserait bien le protocole), et qui seraient
facilement «compris» par une machine.
Comme un tel protocole n'existe probablement pas, nous étudierons la
facilité d'apprentissage par les humains, l'expressivité et la
facilité de compréhension par une machine de plusieurs protocoles,
afin de trouver les caractéristiques du protocole qui semblent lui
permettre de satisfaire ces trois critères.
% TODO : nettoyer un peu ça vis-à-vis du paragraphe ci-dessus.
Nous nous intéresserons donc principalement aux protocoles
artificiels. En effet, les protocoles naturels, de part leur évolution
non contrôlée au fil du temps ont tendance à être très ambigus, et
avoir une grammaire comportant beaucoup d'exceptions (donc difficile à
interpréter), et une syntaxe approximative, qui accepte différents
ordres pour les mots d'une phrase, mais souvent avec une différence
dans la sémantique.
Nous chercherons aussi à ce que les protocoles étudiés soient
formels. En d'autre termes ceux qui ont normes, des règles bien
définies, qui permettent de définir le protocole de manière unique et
sans ambiguïtées, ce qui facilite leur interprétation par la
machine. La plupart des protocoles artificiels ont une syntaxe et une
grammaire plutôt rigoureuse.
Nous considèrerons les protocoles parlés couremment par un gand nombre
d'agents naturels (des humains). Nous n'explorerons pas la possibilité
d'utiliser ces mêmes protocoles entre des agents artificiels comme des
robots ou des ordinateurs, ni des protocoles prévus dans ce but (car
ils sont en général inadaptés à l'apprentissage par les humains).
\subsection{Criètres}
Pour chaque protocole de communication, nous étudierons plusieurs critères~:
\begin{itemize}
\item La facilité d'apprentissage par un individu.
\item L'ambigüité de son vocabulaire, sa grammaire et sa syntaxe,
autrement dit la difficulté qu'une machine aura à comprendre le
protocole.
\item L'expressivité du protocole, autrement dit la facilité avec
laquelle un humain pourra exprimer des concepts et relations
complexes.
\end{itemize}
\section{Les langues naturelles}
Les langues naturelles sont les protocoles de communication les mieux
maîtrisés par les humains.
Cependant, le vocabulaire est source d'ambigüité, d'une part à cause
des multiples définitions d'un mot, et des connotations qu'il peut
acquérir selon son contexte, et d'autre part à cause des néologismes
qui ne seraient pas encore répertoriés dans un dictionnaire, dont le
sens est difficile à déterminer de manière certaine en utilisant
seulement leur étymologie.
De même, comme expliqué précédemment, leur grammaire est irrégulière
et bien qu'elle permette souvent de faciliter la compréhension de la
phrase (on pourra rattacher un adjectif au féminin seulement aux
substantifs féminins de la phrase, ce qui élimine des combinaisons
possibles), les mots invariables et autres exceptions apparaissent
trop souvent pour que l'on puisse compter dessus.
La syntaxe de ces langues est elle aussi une grande source d'ambigüité
puisque changer l'ordre des mots d'une phrase peut résulter en une
autre phrase correcte, mais avec un sens plus ou moins différent de la
première, sans qu'il y ait vraiment de règles formelles décrivant
cela.
L'expressivité des langues naturelles est très grande, bien que pas
illimitée, car il est parfois difficile de décrire des formes et
images, ou encore des sons, des odeurs ou d'autres sensations.
Les langues naturelles sont donc faciles à apprendre, disposent d'une
grande expressivité, mais sont très ambigues. Il est possible de
réduire un peu l'ambiguité en s'imposant des contraines (uniquement
des phrases «sujet verbe objet» par exemple), auquel cas on perd en
expressivité.
% TODO : pilud-ml "english (even controlled) for programming".
\section{Une langue artificielle : L'Espéranto}
% \subsection{Présentation}
% \subsection{Origine et objectif}
% \subsection{Principe de fonctionnement}
\section{Alphabets et supports}
\subsection{L'alphabet}
\subsubsection{Ses origines}
\subsubsection{Dans quel but}
\subsubsection{Des exemples}
\subsection{Les supports}
\subsubsection{Le morse}
Le code Morse est généralement attribué à Samuel Morse. Ce code à été inventé pour la télégraphie en 1835.
Il consiste en une série d'impulsions. Les lettres, chiffres, signes de ponctuation sont représenté par des séries d'impulsions.
Seulement deux types d'impulsions son nécessaires pour tout coder, une impulsion courrte que l'on appelle généralement
"Point" et une impulsion longue appellée "Trait".
Co code possède un très faible expréssivité du fait d'un nombre important d'impulsions utilisées pour un seul caractère.
Ce code est considéré comme le précurseur des communications numériques que l'on connait.
Les militaire ont utilisé ce code pour effectuer des transmission codées, et même si un spectre de fréquence radio et toujours
réservé pour les sueles émission en morse, ce code n'apporte pas de grand intérêt en terme de communication homme-machine.
\subsubsection{Le braille}
Le braille est une manière de représenter l'alphabet. il consiste en une représentation en relief de l'ensemble des lettres, chiffres, ponctuation, sumboles etc
en relief. Il a été étudie pour permettre un lecture simplement avec les doigts. Le braille a été mis au point par Louis Braille en 1824 et
reste aujourd'hui après une série de réformes et normalisation toujourstrès utilisé.
Ce code est un peu plus expressif que le code Morse vu précédement puisqu'il permet de représenter la majorité est symboles par
une seule cellule. Cependant l'utilité dans l'échange homme-machine reste, comme pour le Morse, très peu utile.
\subsubsection{La langue des signes}
\subsubsection{Les vues}
Les vues regroupes un grand nombre de représentation très formelle d'objets ou éléments sur un support. Qu'elle soit
en perspective, d'ensemble, de coupe, éclatée etc, les vues sont normalisées et laissent place à très peu, voire aucune ambigüité dans les
représentations.
De ce fait il est assez simple de stocker sur un machine ce genre d'informations et même de les restituer, par exemple sous
forme visuelle (sur un écran).
\subsubsection{Les formules mathématiques}
Les formules mathématiques représente une des représentation les plus normalisées, même si les personnes ont tendance à
adapter les représentation, symboles mathématiques à leurs besoins.
Les formules mathématiques ont une "expressivité" relativement importante. Leur inconvénient majoritaire se trouve au niveau
du lien entre une formule et son contexte.
En effet il est très difficile de retrouver le contexte d'une formule lorsque celle-ci est déjà écrite et isolée.
\section{Conclusion}
Graphique de comparaison des différents supports en terme d'expressivité et de formalismem.
\end{document}